27 juin 2024
Comment créer un assistant vocal pour Google Home ?
Chez SEIDOR, nous ne nous contentons pas d'écrire du code ou de concevoir pour les utilisateurs. Nous sommes également prêts à parler avec eux. À cet égard, les interfaces utilisateur vocales (VUI) ont révolutionné les interactions du public avec les dispositifs. Mais, comment construit-on un assistant vocal ?
Nous avons créé un concept pour Google Home qui réserve des salles de réunion de manière simple. Ci-dessous, nous vous montrons un flux de travail réel pour conceptualiser et construire une interface utilisateur vocale à travers la technologie.
Chez SEIDOR, nous avons créé un concept avec l'application Google Assistant pour réserver une salle de réunion.
Processus
Avant de créer une application Google Assistant, il est indispensable de remplir certaines conditions techniques :
- Un compte Google pour accéder à tous les services et outils.
- Un Google Home ou un téléphone avec l'assistant / émulateur Google pour tester l'application (Vous vous amuserez beaucoup plus avec un Google Home lors des tests).
- Un serveur avec NodeJS où nous aurons la logique métier.
Avec ces éléments, nous commençons à construire l'assistant vocal avec Google Home. Les étapes que nous avons suivies chez SEIDOR Opentrends étaient les suivantes :
- Conceptualisation de l'Assistant
- Conception du ton de voix
- Conception de l'arbre conversationnel
- Configuration de l'environnement
- Construction avec Dialogflow
- Construction du serveur pour gérer la logique métier (NodeJs)
- Tests
- Implémentation
Conception
- Co-création pour choisir l'objectif de l'assistant vocal
Avec l'idée de rendre le bureau plus intelligent, 5 parties prenantes de SEIDOR Opentrends ont participé à un exercice pour trouver la meilleure solution autour de ce concept. Finalement, nous avons identifié le besoin d'améliorer la gestion de la réservation des salles de réunion.
- Définition du ton de voix du bot
Tout d'abord, nous avons défini le ton de voix du bot. À travers une analyse rapide du marché, nous avons créé trois personnalités possibles auxquelles nous avons attribué des traits spécifiques de leur discours : mots-clés et mots de remplissage, intonation et rythme. De cette manière, nous pouvions humaniser le bot et en même temps, donner de la cohérence pour les évolutions futures.
- Conception de l'arbre conversationnel
Quelles questions sont essentielles ? Quel flux de conversation est le plus adapté à l'utilisabilité du service ? Où pourrait-il se bloquer lors de la fourniture de réponses adéquates ? L'arbre conversationnel prévoit tous les points de contact entre l'utilisateur et le bot, ainsi que les réponses aux questions mal formulées ou même aux insultes. De cette manière, nous minimisons au maximum les erreurs possibles lors de l'utilisation de l'assistant vocal.
Si vous voulez savoir comment nous définissons la personnalité et le ton de voix d'un bot ou comment nous construisons des arbres conversationnels, vous trouverez tous les détails dans cet article.
Technologie
Dans le processus d'analyse du flux de conversation entre l'utilisateur et Google Home pour réserver une salle de réunion, nous avons décidé de créer 2 actions : les utilisateurs peuvent réserver une salle directement ou demander quelle salle de réunion est disponible. Le flux commence lorsque l'utilisateur réveille l'application avec l'expression "Ok Google, parler avec réserver salles". Avec cela, Dialogflow détecte qu'il s'agit d'une "welcome intent" et demande au serveur la réponse correcte. Pour sa part, l'assistant Google est la partie qui détecte la voix et transcrit le message vocal en texte et vice versa.
Lorsque nous concevons des chatbots ou des VUIs, nous parlons d'"intents" et d'"entities". L'"intent" est l'intention de l'utilisateur. Identifier l'"intent" signifie découvrir ce que l'utilisateur veut lorsqu'il interagit avec un bot. Une "entity" agit comme une variable qui modifie un "intent".
Nous utilisons DialogFlow pour créer l'application qui recevra le message et déterminera l'intention afin de fournir la meilleure réponse à l'utilisateur. DialogFlow communiquera avec un serveur NodeJs, ce qui rend l'application intelligente : le serveur renverra le message correct en fonction de l'heure, des messages précédents et de la disponibilité des salles de réunion.
Le processus de DialogFlow est le suivant :
- DialogFlow reçoit le texte et détermine à quel agent l'envoyer.
- L'agent de Dialogflow identifie l'intention de l'utilisateur et la transmet à l'intention correcte de DialogFlow.
- L'intention de Dialogflow utilise des entités pour stocker les valeurs des paramètres.
- L'intention de Dialogflow transmet la demande ainsi que les entités à Fulfilment.
- Fulfilment utilise un webhook pour appeler le serveur.
Nous avons créé un serveur avec NodeJS où nous avons la logique métier. Le serveur reçoit le message de l'utilisateur, quelques mots-clés et l'action (réserver ou demander des informations). Avec ces informations et le contexte de la conversation, il se connecte au dépôt de données et extrait des données pertinentes.
La dernière partie du projet consistait à tester et former l'IA dans DialogFlow. Pour cela, nous avons demandé la collaboration de différents collègues de SEIDOR Opentrends et les avons intégrés au programme de test. Nos collègues ont passé un certain temps à parler avec Google Home (appareil, téléphone ou environnement de test). De notre côté, nous travaillions dans DialogFlow, qui dispose d'une section de formation où nous pouvions voir l'historique des conversations. Il était très positif de savoir comment les gens parlent avec l'interface, car ils exprimaient des choses que nous ne pouvions pas imaginer lors de la définition du flux. Cela nous a permis d'enrichir et d'ajouter ces nouvelles façons de poser des questions ou de réserver une salle dans l'application.
Share
Peut-être que cela pourrait vous intéresser
Android 14 protégera les utilisateurs mobiles contre les logiciels malveillants
Il ne fait aucun doute qu'un système d'exploitation mobile ouvert, comme c'est le cas d'Android, présente des avantages, mais il pose également d'importants défis en matière de sécurité. Par conséquent, lors de son implémentation en tant qu'actif dans l'organisation, il faut sérieusement le considérer comme une surface d'attaque.
Le Dilemme de la Plateforme d'Analyse pour les Clients de SAP ERP
En tant qu'expert en analytique, nous sommes de plus en plus confrontés à des clients SAP qui recherchent des conseils sur la manière de moderniser leur plateforme d'analytique. Avec la majorité des clients SAP en voie de transition vers le cloud avec SAP RISE, la modernisation de leur plateforme d'analytique devient également une considération importante.