A Microsoft abre acesso limitado à sua inteligência artificial text-to-speech

3 de fevereiro de 2021 0 34

A AT&T e a Warner Bros. usaram a tecnologia para criar uma versão interativa do Bugs Bunny.

A Microsoft está abrindo acesso limitado a uma IA de conversão de texto em fala chamada Voz Neural Personalizada, que permite aos desenvolvedores criar vozes sintéticas personalizadas. A tecnologia faz parte de um serviço de IA do Azure denominado Speech . As empresas podem usar a tecnologia para coisas como assistentes e dispositivos inteligentes acionados por voz, chatbots, aprendizado online e leitura de audiolivros ou notícias. Eles terão que se inscrever para obter acesso e obter a aprovação da Microsoft antes de poderem aproveitar o Custom Neural Voice.

A tecnologia pode oferecer vozes mais naturais do que muitos outros serviços de conversão de texto em voz, de acordo com a Microsoft . Vozes personalizadas usam um banco de sons, ou fonemas, para criar fontes de voz. A Voz Neural Personalizada usa várias redes neurais na tentativa de garantir que a prosódia (o tom e a duração de cada fonema) e a pronúncia sejam precisos. Isso ajuda a IA a imitar a voz de um ator corretamente ou usar uma voz sintética que soe realista.

Várias empresas já estão usando a tecnologia, incluindo AT&T e Warner Bros. Recentemente, instalaram um sistema na AT&T Experience Store em Dallas, onde as pessoas podem interagir com o Bugs Bunny. Usando uma combinação de Voz Neural Personalizada, realidade aumentada e 5G, os Bugs podem conversar com os clientes em tempo real e se mover pela loja para ajudá-los a encontrar uma cenoura dourada escondida.

Eric Bauza, o ator que atualmente dá voz a Bugs, gravou mais de 2.000 linhas e frases com a ajuda da Microsoft para criar uma fonte de voz. A Warner Bros. e a Microsoft trabalharam juntas para criar uma voz personalizada que explora a personalidade e as inflexões do personagem. Duolingo também usou Voz Neural Personalizada para criar personagens peculiares para ajudar as pessoas a aprender novos idiomas, enquanto a Progressive criou a tecnologia para seu chatbot Flo.

Notícia