Recherche
Se connecter

L'IA donne de la voix

Publié par Barbara Haddad le - mis à jour à
L'IA donne de la voix

Dans le domaine vocal, si l'intelligence artificielle semble encore à ses balbutiements, elle participe à créer une conversation plus "humaine" sur les assistants vocaux.

Je m'abonne
  • Imprimer

Allo j'écoute, ici l'IA ! Derrière les robots vocaux, chatbots comme assistants vocaux, se cache en réalité une bonne dose d'intelligence artificielle, nichée dans la compréhension du langage parlé et l'analyse sémantique, notamment. L'IA a, en la matière, du travail : même si 5 % seulement des foyers français déclarent être équipés d'une enceinte connectée (source Nielsen et Médiamétrie), 50 % des recherches se feront à la voix d'ici 2020, prévoit l'institut Comscore. "Ce n'est pas étonnant puisque le langage oral est la façon la plus ancienne et naturelle de communiquer. C'est aussi une façon plus simple et rapide de s'exprimer : nous pouvons dire 200 mots à l'oral par minute contre 31 mots écrits en moyenne dans le même laps de temps", constate Loïc de Saint Andrieu, Mobile Evangelist chez Google France. Pour les marques, l'enjeu est de taille : l'alliance de l'IA à la reconnaissance vocale ouvre de nouvelles opportunités d'interactions et d'expériences avec leurs clients. Mais, attention, "un projet d'IA c'est 60 % de cadrage (définition des objectifs et des indicateurs de performance), 30 % de travail sur les data, et 10 % de mise en action des algorithmes", prévient Raphaël Fétique, co-fondateur et directeur associé de Converteo.

Dans la vie réelle, comme dans une conversation avec un assistant vocal, la réponse à une demande dépend de la compréhension de celle-ci. L'IA entre en scène : la compréhension vocale par les systèmes de Natural Language Understanding (NLU), comme Google DialogFlow ou Amazon Alexa, semble aujourd'hui plutôt mature. Sundar Pichai, PDG de Google, qui place l'IA au coeur de la conception des 'produits' Google a, ainsi, annoncé dès 2017 un taux d'erreur inférieur à 5 % dans la compréhension de la demande utilisateur, aux États-Unis. Il reste, néanmoins, l'objectif d'une meilleure compréhension des nuances de la demande. Ainsi, derrière la question "quel temps fait-il" se cache sûrement les besoins de savoir comment s'habiller ou s'il est nécessaire de prendre un parapluie : "Nous avons observé plus de 5 000 variations pour la simple demande de mettre une alarme", observe Loïc de Saint Andrieu. Xavier Prin, directeur marketing et portail de Boursorama confirme cet objectif : "Pour nous, l'enjeu est que l'intelligence artificielle sache comprendre et parler le vocabulaire bien spécifique de la banque." Les marques doivent donc entraîner leurs algorithmes pour progresser dans cette compréhension nuancée des différentes demandes : "L'importance est de pouvoir entraîner les robots et de vérifier s'ils ont bien compris le contexte et le contenu des demandes des utilisateurs", confirme Xavier Fisselier, co-fondateur et CMO d'hellomybot.io.

D'autres progrès sont attendus dans les mois et années à venir quant à la capacité par l'IA à s'adapter au profil de chaque utilisateur, mais, aussi, au contexte de la demande - est-ce le matin ou le soir, la personne a-t-elle les mains libres ou occupées - et même être en mesure de capter des émotions comme l'agacement, la tristesse ou la fatigue. L'assistant vocal pourra alors adapter le volume sonore et chuchoter ou adopter un ton plus joyeux pour égayer son interlocuteur s'il détecte de la tristesse dans sa voix.

La reconnaissance vocale au service du client

C'est d'ailleurs cette capacité d'adaptation qui est particulièrement attendue dans la relation client. "Grâce à la brique de reconnaissance de langage naturel et au speech to text, les téléconseillers n'ont plus besoin de remplir une fiche, après un appel. L'IA automatise cette tâche et peut retranscrire des heures de conversation, explique Raphaël Fétique. Le text mining et l'analyse sémantique oeuvrent ensuite à faire ressortir les principaux aspects de la conversation, dont les sentiments de l'interlocuteur."

L'automatisation des tâches peut aussi s'appliquer à d'autres usages, comme la vérification des mentions légales des spots TV ou radio. "Un de nos clients faisait systématiquement une double écoute sur un nombre de spots limité afin de vérifier la présence de ces mentions. L'IA permet un gain de temps et d'argent", poursuit Raphaël Fétique qui pointe, néanmoins, les limites de la technologie : "L'efficacité de l'IA dépend de l'usage spécifique pour laquelle elle a été entrainée. Par exemple, l'IA génère les sous-titres sur You Tube. Au début, si le résultat n'était pas satisfaisant, c'est que les algorithmes avaient été entraînés sur de la dictée et non des conversations naturelles, avec plusieurs interlocuteurs se coupant la parole", illustre-t-il. Allomedia est l'une des sociétés qui apportent une valeur ajoutée dans la relation marques-clients, notamment au niveau des call centers. Ainsi, son cookie vocal permet d'identifier de façon omnicanal les pages qui génèrent le plus d'appels. En couplant l'analyse humaine des conversations à celle du machine learning, Allomedia est également en capacité de pouvoir résumer les conversations téléphoniques et ainsi aider les conseillers à ne pas passer à côté d'informations qu'ils n'auraient pas entendus, en raison d'une discussion complexe ou du bruit de fond. La start-up a d'ailleurs dupliqué ce service sur l'analyse des messages laissés sur les répondeurs via une offre nommée Voice Catcher.

La reconnaissance vocale ouvre également de nouvelles perspectives de relation client personnalisée dans le secteur du tourisme et de l'hôtellerie : "L'intégration de la voix à un hologramme ou à un miroir connecté permettra aux hôtels de proposer un service hôtelier personnalisé dans chaque chambre. Chaque client pourra ainsi, dans sa langue natale, commander un room service, demander le code wifi, indiquer qu'il ne veut pas être dérangé ou encore demander les activités à faire aux alentours", explique William Simonin, PDG de Vivoka. "L'avantage de l'utilisation de l'IA est que cela permet de mémoriser les demandes effectuées pour un même client. Si celui-ci réserve plus tard une nuit dans un autre hôtel de la même chaîne, ses préférences et demandes seront conservées pour un service personnalisé." Enfin, l'arrivée de nouvelles enceintes avec écran laisse percevoir une convergence de la voix et de l'écran pour une optimisation du parcours d'achat : "La voix va rapidement atteindre ses limites. L'écran étant rassurant. Cela permettrait ainsi de commencer certaines actions à la voix puis de les finaliser de façon tactile à l'écran", prédit Xavier Prin.

Comment émerger dans un monde vocal générique ?

Dans ce nouveau monde vocal où ni le logo, la charte graphique ou encore le packaging ne jouent pas leur rôle différenciant, l'usage prévaut de nombreuses fois sur le nom d'une marque en particulier. Les utilisateurs demandant bien souvent à leur assistant d'ajouter simplement à la liste de courses les ingrédients nécessaires pour réaliser des crêpes ou les rasoirs les moins chers : "Les marques ont désormais à gagner leur place dans ce nouvel écosystème générique par un bon référencement et la création d'expériences vocales mémorables", confirme Olivier Vigneaux, Président de BETC Digital. Les marques et enseignes se mettent donc à retravailler le contenu éditorial de leur site web pour qu'il soit facilement lisible par les assistants vocaux : les titres se transforment en question et le travail de mots-clés se fait désormais sur la longue traîne (plus de trois mots) car force est de constater que les utilisateurs se remettent à faire des phrases complètes lors de leurs demandes vocales là où ils ne tapaient sur leur clavier que quelques mots dans le moteur de recherche.

Ainsi, grâce au développement des chatbots puis désormais des applications vocales, l'utilisation de l'IA permet aux marques de rentrer dans une nouvelle ère conversationnelle avec leurs clients: "Les skills sont de nouvelles expériences vocales personnalisables par les marques. L'enjeu étant de privilégier une expérience simple et coeur de métier au démarrage pour bâtir progressivement un territoire de marque et aller ensuite vers de la conversion", explique Philippe Daly, Country Manager Skills Alexa France. Parmi les premières initiatives d'applications vocales cette année, certaines marques ont ainsi fait le choix de préempter un domaine sémantique bien précis et de développer du contenu en vertical : "Il est important de pouvoir maîtriser son champ sémantique métier et de pouvoir devenir rapidement la référence dans un domaine, à l'instar d'Auchan qui a développé un conseiller en vin pour accompagner à la voix le meilleur accord met et vins", démontre Pascal Malotti, directeur business développement et stratégie de Valtech. Mais, à développer cette démarche, ne risque-t-on pas de se retrouver dans la cacophonie actuelle sur le web où chacun y va de son blog expert dans un domaine et où le consommateur ne sait plus où trouver la bonne information ?

L'expérience vocale : client centric

Pour réussir sa présence de marque en vocal, c'est donc bel et bien, et avant tout, vers le client que l'IA doit se tourner. Boursorama Banque, première banque à proposer une action sur Google Assistant et Google Home, l'a bien compris : "L'innovation est dans notre ADN, nous investissons dans des innovations qui ont du sens pour nos clients et c'est la raison pour laquelle nous avons développé de façon pionnière la première application vocale bancaire, dans un souci d'utilité et de simplicité, afin de faire gagner du temps", explique Xavier Prin. L'application vocale développée doit donc être simple tant dans son utilisation que dans la valeur d'usage qu'elle va apporter : rapidité et gain de temps, simplification d'un processus pour une demande d'information, un achat ou encore la mise en relation avec un conseiller : "Il ne s'agit pas de dupliquer l'arborescence de son site web, mais de faire l'effort de se rappeler comment se construit une conversation dans le monde réel", explique Pascal Lannoo. C'est ainsi que les équipes de Oui SNCF, ont remarqué que la liste des horaires de trains fournie pour une demande de destination était difficilement mémorisable par les utilisateurs. L'application a donc évolué pour ne donner au départ que les horaires arrondis et trois par trois, en simplifiant l'information, pour qu'ils soient retenus plus facilement. Puis, une fois un train choisi, les heures exactes sont délivrées.

L'usage des assistants vocaux étant amené à se développer, il y a fort à parier que les utilisateurs s'y attacheront, d'où l'importance de développer une expérience vocale mémorable et différenciante des concurrents : "Une importance particulière doit être portée sur le design de la conversation pour effacer l'aspect robot et l'effet transcription d'un formulaire à la voix", conseille Xavier Fisselier. L'objectif est donc pour les marques de créer une identité vocale fidèle à la personnalité et aux valeurs de la marque : "ll s'agit de se demander comment je crée une identité vocale qui permet à ma marque d'être reconnue à la voix", confirme Pascal Lannoo. Olivier Vigneaux, lui aussi, invite à se poser les questions suivantes marque "quelle sera la voix choisie ? Sera-t-on dans le tutoiement ou le vouvoiement ? Quelle sera la tonalité : plutôt sérieuse, dans l'humour?", pour finalement instaurer ce dont rêvent la plupart des marques depuis l'installation de leur programme relationnel : la création d'un lien plus émotionnel avec leurs clients et ainsi jouer la préférence lors d'un futur achat.

Pour aller plus loin :

Je m'abonne
Eloïse Cohen,<br/>rédactrice en chef Eloïse Cohen,
rédactrice en chef

La Lettre de la Rédac

Chaque matin, l'essentiel de l'actu

La rédaction vous recommande

Par Yext

La recherche vocale et les experiences vocales sont les tendances les plus brulantes du moment Elles donnent forme une nouvelle forme dexperience [...]

Sur le même sujet

IA
Emarsys

Par Emarsys via Marketme

Automatiser l’orchestration des campagnes marketing permet de les gérer plus efficacement, en pré-embarquant les modèles statistiques et les [...]