18 de janeiro de 2023
Google Speech to Text: O que significa para as empresas?
Tanto as tecnologias de reconhecimento quanto de síntese de voz, os processos por trás de sistemas inteligentes como os assistentes virtuais, têm experimentado um enorme desenvolvimento durante os últimos anos. Uma evolução que torna possível que essas ferramentas tenham a capacidade de compreender seus interlocutores e de responder de forma semelhante às pessoas.
O que é o Speech Services by Google?
Google Text-to-Speech é um aplicativo que permite que outros aplicativos em dispositivos Android "falem", ditando todo o texto que aparece na tela.
O Google está disposto a compartilhar sua tecnologia. Se no mês passado abriu as portas para os desenvolvedores de seu motor de síntese de voz text-to-speech, que utilizam tanto o Assistant quanto o aplicativo de Maps, começou abril anunciando uma importante melhoria nos serviços de reconhecimento de linguagem speech-to-text que oferece através da nuvem.
A renovada API apresenta um maior desempenho e uma redução dos erros em torno de 54%, embora em alguns casos a porcentagem possa ser ainda maior. Grande parte da atualização se materializa em uma nova funcionalidade que permite aos desenvolvedores escolher entre 4 diferentes modelos de machine learning conforme o âmbito de aplicação. Assim, podem selecionar um ou outro dependendo se a ferramenta é destinada ao reconhecimento de comandos de voz curtos, conversas telefônicas e o áudio de um vídeo, embora também haja um modelo padrão que abrange todos esses campos.
Por outro lado, o Google atualizou o serviço com um novo sistema de pontuação que reduz as falhas frequentes que cometia nas transcrições e do qual poderá se beneficiar todo software que transforma comandos em texto, como as ferramentas que permitem ao usuário redigir um e-mail por viva voz.
Com o processamento na nuvem e a inteligência artificial, os de Mountain View contribuem com essas atualizações para o desenvolvimento de aplicações de reconhecimento de voz e assistentes virtuais mais eficientes e com menos erros. Sua evolução, sem dúvida, será refletida na penetração desse tipo de tecnologias no ambiente corporativo, onde sua presença começa a se consolidar.
Os assistentes virtuais chegam às empresas
Não é por acaso que a Amazon anunciou seus planos para integrar seu assistente virtual Alexa no software destinado à empresa, Axios. Trata-se de uma estratégia para acelerar a introdução desses mordomos virtuais em um campo onde já deram os primeiros passos há algum tempo. Como apontam desde Axios, empresas pioneiras como Concur, Salesforce, WeWork e CapitalOne já incorporaram o assistente de Jeff Bezos em suas plataformas de gestão corporativa.
A melhoria das tecnologias de speech-to-text permitirá que esses sistemas inteligentes se adaptem a expressões muito diferentes das usadas em casa ou na vida pessoal dos usuários. “O tipo de linguagem que usamos nos escritórios é muitas vezes radicalmente diferente das conversas que temos em casa”, explicou o CTO da Amazon Werner Vogels.
De qualquer forma, a Amazon já oferece uma API aberta para que os desenvolvedores possam integrar uma Alexa for business em diferentes dispositivos e projetar suas próprias funcionalidades relacionadas à gestão de clientes, comunicação com os funcionários ou realização de conferências. Uma caixa de ferramentas personalizada que, além disso, pode ser adaptada ao idioma de Cortana, o assistente virtual da Microsoft.
Mas os da Amazon não são os únicos a colocar os olhos no terreno corporativo. Outros assistentes virtuais como Spark Assistant (da Cisco), a própria Cortana, Eva (da Voicera), Dragon Assistant (da Nuance) e o IBM Watson Assistant também têm sua própria versão adaptada para empresas. Todos eles estão focados, principalmente, na organização de reuniões e na gestão dos fluxos de trabalho, tudo com o objetivo de aumentar a produtividade e dinamizar os processos organizacionais.
No entanto, graças às APIs que abrem as portas desses sistemas de reconhecimento de voz speech-to-text, as possibilidades para os desenvolvedores vão ainda mais além. Desde criar aplicativos para redigir e-mails até bots capazes de enviar mensagens ou preparar reuniões via plataformas como Slack.
Algumas empresas já utilizam esse tipo de ferramentas de reconhecimento e síntese de voz para executar tarefas relacionadas à análise de sistemas ou ao atendimento ao cliente. Mas as APIs como a do Google permitiriam adicionar à lista tarefas como a gestão das soluções CRM por parte dos usuários. Um assistente virtual poderia, graças a essas soluções, atualizar a plataforma se recebesse a ordem ou porque captasse essa necessidade a partir de uma conversa telefônica.
De alto-falantes a wearables
Embora os canais mais utilizados para interagir com esses mordomos virtuais sejam os alto-falantes clássicos, como o Google Home ou o Amazon Echo, ou o software que os trabalhadores têm instalado em seus próprios dispositivos, o leque de opções também se amplia nesse sentido. A próxima parada, para muitos, serão os wearables. Com um microfone incorporado, esses dispositivos permitem utilizar comandos de voz para realizar chamadas ou ditar mensagens, como se o usuário carregasse um assistente virtual em alguma parte do corpo.
Segundo estimativas da empresa de pesquisas de mercado Counterpoint, quase um terço dos wearables que chegaram ao mercado no ano passado baseavam seu funcionamento na inteligência artificial e quase metade deles eram hearables ou alto-falantes inteligentes, muitos deles com assistente incorporado. É o caso dos populares AirPods da Apple, os Dash da alemã Bragi e os Onvocal OV (ambos com Alexa), os Pixel Buds do gigante das buscas (Google Assistant) e o Xperia Ear da Sony.
Conclusão
As empresas que desejam aproveitar os serviços de reconhecimento e síntese de voz disponíveis na nuvem devem, no entanto, levar em consideração fatores como o problema que pretendem resolver e o que isso trará para o ecossistema digital da empresa.
Uma das decisões mais importantes será escolher o fornecedor que mais lhes convém, pois desde a plataforma do Google até a Amazon, cada um tem suas fortalezas e fraquezas. Os de Mountain View, no entanto, parecem dispostos a liderar a implantação dessa tecnologia em todos os âmbitos da vida.
Share
Talvez você possa se interessar
O que é Salesforce Commerce Cloud?
Salesforce Commerce Cloud B2B é uma plataforma de comércio eletrônico na nuvem que oferece experiências de compra inteligente através de diferentes canais.
Trata-se da experiência de ecommerce ideal baseada no autosserviço online com todas as funcionalidades B2B necessárias.
O que é Pardot? É a melhor solução para a Automação de Marketing B2B?
Pardot é a solução da Salesforce para a gestão de leads e automação de marketing B2B. Oferece grandes vantagens, pois permite que as equipes de marketing e vendas configurem, implementem e gerenciem campanhas de marketing online para aumentar o ROI das campanhas e melhorar sua eficiência.
Formação Salesforce? Crie seu próprio curso
Uma poderosa ferramenta para gerenciar o relacionamento com os clientes, transformar oportunidades em vendas e melhorar a produtividade. Salesforce é um CRM na nuvem que muitas empresas já utilizam para impulsionar seus negócios. No entanto, a ampla gama de funcionalidades que a plataforma oferece faz com que cada vez mais profissionais que a conheçam profundamente sejam demandados para tirar o máximo proveito dela.