Seidor
tres personas mirando un ordenador

18 janvier 2023

Google Speech to Text : Qu'est-ce que cela signifie pour les entreprises ?

Tant les technologies de reconnaissance que de synthèse vocale, les processus derrière les systèmes intelligents comme les assistants virtuels, ont connu un énorme développement au cours des dernières années. Une évolution qui permet à ces outils d'avoir la capacité de comprendre leurs interlocuteurs et de répondre de manière similaire aux personnes.

Qu'est-ce que Speech Services by Google ?

Google Text-to-Speech est une application qui permet à d'autres applications sur les terminaux Android de « parler », en dictant tout le texte qui apparaît à l'écran.

Google est prêt à partager sa technologie. Si le mois dernier, il ouvrait les portes aux développeurs de son moteur de synthèse vocale text-to-speech, utilisé à la fois par Assistant et l'application Maps, il a commencé avril en annonçant une amélioration importante des services de reconnaissance de la langue speech-to-text qu'il offre via le cloud.

icono documento google.

La nouvelle API offre des performances accrues et une réduction des erreurs d'environ 54 %, bien que dans certains cas, le pourcentage puisse être encore plus élevé. Une grande partie de la mise à jour se concrétise par une nouvelle fonctionnalité qui permet aux développeurs de choisir entre 4 modèles différents de machine learning selon le domaine d'application. Ainsi, ils peuvent en sélectionner un en fonction de si l'outil est destiné à la reconnaissance de commandes vocales courtes, aux conversations téléphoniques et à l'audio d'une vidéo, bien qu'il existe également un modèle standard qui couvre tous ces domaines.

D'autre part, Google a mis à jour le service avec un nouveau système de notation qui réduit les erreurs fréquentes qu'il commettait dans les transcriptions et dont tout logiciel transformant les commandes en texte pourra bénéficier, comme les outils permettant à l'utilisateur de rédiger un e-mail à voix haute.

Grâce au traitement dans le cloud et à l'intelligence artificielle, les équipes de Mountain View contribuent avec ces mises à jour au développement d'applications de reconnaissance vocale et d'assistants virtuels plus efficaces et avec moins d'erreurs. Leur évolution se reflétera sans aucun doute dans la pénétration de ce type de technologies dans l'environnement d'entreprise, où leur présence commence à se consolider.

personas hablando, una de ellas aguanta una tablet con la mano

Les assistants virtuels débarquent dans les entreprises

Ce n'est pas du tout une coïncidence si Amazon a annoncé ses plans pour intégrer son assistant virtuel Alexa dans le logiciel destiné aux entreprises, Axios. Il s'agit d'une stratégie pour accélérer l'introduction de ces majordomes virtuels dans un terrain de jeu où ils ont déjà fait leurs premiers pas depuis un certain temps. Comme le souligne Axios, des entreprises pionnières comme Concur, Salesforce, WeWork et CapitalOne ont déjà intégré l'assistant de Jeff Bezos dans leurs plateformes de gestion d'entreprise.

L'amélioration des technologies de reconnaissance vocale permettra à ces systèmes intelligents de s'adapter à des expressions très différentes de celles utilisées à la maison ou dans la vie personnelle des utilisateurs. "Le type de langage que nous utilisons dans les bureaux est souvent radicalement différent des conversations que nous avons à la maison", a expliqué le CTO d'Amazon Werner Vogels.

De toute façon, les équipes de Bezos offrent déjà une API ouverte pour que les développeurs puissent intégrer une Alexa for business dans différents dispositifs et concevoir leurs propres fonctionnalités liées à la gestion des clients, à la communication avec les employés ou à la tenue de conférences. Une boîte à outils personnalisée qui, en plus, peut s'adapter à la langue de Cortana, l'assistant virtuel de Microsoft.

Mais ceux d'Amazon ne sont pas les seuls à jeter un œil sur le terrain corporatif. D'autres assistants virtuels comme Spark Assistant (de Cisco), la propre Cortana, Eva (de Voicera), Dragon Assistant (de Nuance) et l'IBM Watson Assistant ont également leur propre version adaptée à l'entreprise. Tous sont principalement axés sur l'organisation de réunions et la gestion des flux de travail, le tout dans le but d'augmenter la productivité et de dynamiser les processus organisationnels.

Cependant, grâce aux API qui ouvrent les portes de ces systèmes de reconnaissance vocale speech-to-text, les possibilités pour les développeurs vont encore plus loin. De la création d'applications pour rédiger des courriels à des bots capables d'envoyer des messages ou de préparer des réunions via des plateformes comme Slack.

Certaines entreprises utilisent déjà ce type d'outils de reconnaissance et de synthèse vocale pour effectuer des tâches liées à l'analyse des systèmes ou au service client. Mais les API comme celle de Google permettraient d'ajouter à la liste des tâches telles que la gestion des solutions CRM par les utilisateurs. Un assistant virtuel pourrait, grâce à ces solutions, mettre à jour la plateforme s'il recevait l'ordre ou bien parce qu'il détecterait ce besoin à partir d'une conversation téléphonique.

Des haut-parleurs aux wearables

Bien que les canaux les plus utilisés pour interagir avec ces majordomes virtuels soient les enceintes classiques, comme le Google Home ou l'Amazon Echo, ou le logiciel que les travailleurs ont installé sur leurs propres appareils, la gamme d'options s'élargit également dans ce sens. La prochaine étape, pour beaucoup, sera les wearables. Avec un microphone intégré, ces dispositifs permettent d'utiliser des commandes vocales pour passer des appels ou dicter des messages, comme si l'utilisateur portait un assistant virtuel quelque part sur son corps.

Selon les estimations de la société d'études de marché Counterpoint, près d'un tiers des wearables lancés sur le marché l'année dernière étaient basés sur l'intelligence artificielle et près de la moitié d'entre eux étaient des hearables ou enceintes intelligentes, dont beaucoup avec un assistant intégré. C'est le cas des populaires AirPods d'Apple, des Dash de l'allemand Bragi et des Onvocal OV (tous deux avec Alexa), des Pixel Buds du géant de la recherche (Google Assistant) et du Xperia Ear de Sony.

Conclusion

Les entreprises qui souhaitent profiter des services de reconnaissance et de synthèse vocale déjà disponibles dans le cloud devront néanmoins prendre en compte des facteurs tels que le problème qu'elles cherchent à résoudre et ce que cela apportera à l'écosystème numérique de l'entreprise.

Une des décisions les plus importantes sera de choisir le fournisseur qui leur convient le mieux, car de la plateforme de Google à Amazon, chacun a ses forces et ses faiblesses. Ceux de Mountain View, cependant, semblent prêts à diriger l'implantation de cette technologie dans tous les domaines de la vie.

Peut-être que cela pourrait vous intéresser

26 janvier 2023

Qu'est-ce que Salesforce Commerce Cloud ?

Salesforce Commerce Cloud B2B est une plateforme de commerce électronique en cloud qui offre des expériences d'achat intelligentes à travers différents canaux.

Il s'agit de l'expérience ecommerce idéale basée sur l'auto-service en ligne avec toutes les fonctionnalités B2B nécessaires.

SEIDOR
21 janvier 2023

Qu'est-ce que Pardot ? Est-ce la meilleure solution pour l'automatisation du marketing B2B ?

Pardot est la solution de Salesforce pour la gestion des leads et l'automatisation du marketing B2B. Elle offre de grands avantages, car elle permet aux équipes de marketing et de vente de configurer, de mettre en œuvre et de gérer des campagnes de marketing en ligne pour augmenter le ROI des campagnes et améliorer leur efficacité.

SEIDOR
16 février 2023

Formation Salesforce ? Concevez votre propre cours

Un outil puissant pour gérer la relation avec les clients, transformer les opportunités en ventes et améliorer la productivité. Salesforce est un CRM dans le cloud que de nombreuses entreprises utilisent déjà pour dynamiser leur activité. Cependant, la large gamme de fonctionnalités offertes par la plateforme fait que de plus en plus de professionnels sont demandés pour la connaître en profondeur et en tirer le meilleur parti.

SEIDOR