Seidor
persona hablando

27 de juny de 2024

Com crear un assistent de veu per a Google Home?

A SEIDOR no només escrivim codi o dissenyem per als usuaris. També estem preparats per parlar amb ells. En aquest sentit, les interfícies d'usuari amb veu (VUI) han revolucionat les interaccions de l'audiència amb els dispositius. Però, com es construeix un assistent de veu?

Hem creat un concepte per a Google Home que reserva sales de reunions de manera senzilla. A continuació, us mostrem un flux de treball real per conceptualitzar i construir una interfície d'usuari amb veu a través de la tecnologia.

A SEIDOR vam crear un concepte amb l'aplicació Google Assistant per reservar una sala de reunions.

Procés

Abans de crear una aplicació d'assistent de Google és imprescindible complir uns requisits tècnics:

  • Un compte de Google per accedir a tots els serveis i eines.
  • Un Google Home o telèfon amb l'assistent / emulador de Google per provar l'aplicació (Us ho passareu molt millor amb un Google Home en realitzar tests).
  • Un servidor amb NodeJS on tindrem la lògica de negoci.

Amb aquests elements, comencem a construir l'assistent de veu amb Google Home. Els passos que vam seguir a SEIDOR Opentrends van ser els següents:

  • Conceptualització de l'Assistent
  • Disseny del to de veu
  • Disseny de l'arbre conversacional
  • Configuració de l'entorn
  • Construir amb Dialogflow
  • Construir el servidor per gestionar la lògica de negoci (NodeJs)
  • Proves
  • Implementació
asistente voz

Disseny

  • Co-creació per escollir l'objectiu de l'assistent de veu

Amb la premissa de fer l'oficina més intel·ligent, 5 stakeholders de SEIDOR Opentrends van participar en un exercici per trobar la millor solució al voltant d'aquest concepte. Finalment, vam detectar la necessitat de millorar la gestió per a la reserva de les sales de reunions.

  • Definició del to de veu del bot

En primer lloc, vam definir el to de veu del bot. A través d'una anàlisi ràpida del mercat, vam crear tres possibles personalitats a les quals els vam assignar trets específics de les seves parles: paraules clau i paraules crossa, entonació i ritme. D'aquesta manera, podíem humanitzar el bot i al mateix temps, donar consistència per a futurs evolutius.

  • Disseny d'arbre conversacional

Quines preguntes són essencials? Quin flux de conversa és més adequat per a la usabilitat del servei? On podria encallar-se a l'hora de donar respostes adequades? L'arbre conversacional preveu tots els punts de contacte entre l'usuari i el bot, així com les respostes a preguntes mal formulades o fins i tot a insults. D'aquesta manera, minimitzem al màxim els possibles errors durant l'ús de l'assistent de veu.

Si vols saber com definim la personalitat i to de veu d'un bot o com construïm arbres conversacionals, en aquest article trobaràs tots els detalls.

Tecnologia

En el procés d'analitzar el flux de conversa entre l'usuari i Google Home per reservar una sala de reunions, vam decidir crear 2 accions: els usuaris poden reservar una sala directament o preguntar quina sala de reunions està disponible. El flux comença quan l'usuari desperta l'aplicació mitjançant l'expressió "Ok Google, parlar amb reservar sales". Amb això, Dialogflow detecta que és una "welcome intent" i sol·licita al servidor la resposta correcta. Per la seva banda, l'assistent de Google és la part que detecta la veu i transcriu el missatge de veu a text i viceversa.

Quan dissenyem chatbot o VUIs, parlem d'"intents" i d'"entities". L'"intent" és la intenció de l'usuari. Identificar l'"intent" significa esbrinar què és el que vol l'usuari quan interactua amb un bot. Una "entity" actua com una variable que modifica un "intent".

sala reuniones

Utilitzem DialogFlow per crear l'aplicació que rebrà el missatge i esbrinarà la intenció i amb això, la millor resposta a l'usuari. DialogFlow es comunicarà amb un servidor NodeJs que és el que fa que l'aplicació sigui intel·ligent: el servidor retornarà el missatge correcte depenent de l'hora, els missatges anteriors i la disponibilitat de les sales de reunions.

El procés de DialogFlow és el següent:

  1. Dialog Flow rep el text i determina a quin agent enviar-lo.
  2. L'agent de Dialogflow identifica la intenció de l'usuari i els passa a la intenció de DialogFlow correcta.
  3. La intenció de Dialogflow utilitza entitats per emmagatzemar valors de paràmetres.
  4. La intenció de Dialogflow passa la sol·licitud juntament amb les entitats a Fulfilment.
  5. Fulfilment utilitza webhook per trucar al servidor.
proceso google asistant

Cream un servidor amb NodeJS on tenim la lògica de negoci. El servidor rep el missatge de l'usuari, algunes paraules clau i l'acció (reservar o demanar informació). Amb aquesta informació i el context de la conversa, es connecta al magatzem de dades i extreu dades rellevants.

La part final del projecte va ser provar i capacitar la IA dins de DialogFlow. Per a això, vam demanar la col·laboració de diferents companys de SEIDOR Opentrends i els vam unir al programa de prova. Els nostres companys van estar un temps parlant amb Google Home (dispositiu, telèfon o entorn de prova). Per part nostra, nosaltres treballàvem en DialogFlow, el qual disposa d'una secció de capacitació on podíem veure l'historial de les converses. Va ser molt positiu saber com les persones parlen amb la interfície, ja que aquestes expressaven coses que no podíem imaginar quan definíem el flux. Això ens va permetre enriquir i afegir aquestes noves formes de preguntar o reservar sala a l'aplicació.

Potser et pot interessar

13 de juliol de 2023

Android 14 blindarà els usuaris mòbils davant del malware

No hi ha dubte que un sistema operatiu mòbil obert, com és el cas d'Android, té els seus avantatges, però també presenta importants desafiaments de seguretat, per la qual cosa, a l'hora d'implementar-lo com a actiu en l'organització, cal considerar-lo seriosament com una superfície d'atac.

SEIDOR
27 de juny de 2024

Apostem per la tecnologia Blockchain

SEIDOR ha entrat en el capital de Caelum Labs, empresa especialitzada en desenvolupament blockchain.

Edge Technologies
SEIDOR
25 de juny de 2024

El Dilema de la Plataforma d'Analítica per a Clients de SAP ERP

Com a expert en analítica, ens enfrontem cada vegada més a clients de SAP que busquen orientació sobre com modernitzar la seva plataforma d'analítica. Amb la majoria dels clients de SAP en camí de fer la transició al núvol amb SAP RISE, la modernització de la seva plataforma d'analítica també es converteix en una consideració important.

ERP Ecosystem
SEIDOR