Coup de pouce à l’intégration des services vocaux Alexa d’Amazon dans les objets connectés

[EDITION ABONNES] Deux fournisseurs majeurs de semi-conducteurs proposent déjà des kits de développement dont l’objectif est de faciliter le travail des développeurs qui souhaitent intégrer dans leurs équipements connectés des fonctions de reconnaissance vocale compatibles avec le service AVS (Alexa Voice Service) d’Amazon. ...

Chez Amazon, Alexa est un peu ce que Siri est à Apple dans le domaine de la reconnaissance vocale, de la compréhension du langage naturel et de la synthèse de la voix. Mais là où Siri reste la chasse gardée de la firme à la pomme, Alexa (qu’Amazon a déjà mis en œuvre dans ses haut-parleurs intelligents Echo, photo ci-dessous) a vocation à être intégré au sein d’interfaces homme/machine de produits divers et variés dans des domaines aussi divers que l’Internet des objets, l’IoT industriel ou les produits d’assistance automatisée.

Certains fabricants majeurs de semi-conducteurs ne s’y sont d’ailleurs pas trompés. Microsemi et NXP ont ainsi tout récemment mis à leur catalogue des kits de développement destinés à simplifier le processus d’intégration de la technologie Alexa Voice Service (AVS) dans un produit, dès lors que celui-ci dispose d’un ou de plusieurs microphones, d’un haut-parleur et d’une connexion Internet (avec AVS, la reconnaissance vocale et la compréhension du langage naturel sont en effet gérées dans le cloud).

Microsemi propose ainsi au prix de 299 dollars le kit AcuEdge pour Amazon AVS (photo ci-contre) qui dispose de fonctions de traitement audio évoluées afin d’améliorer le taux de reconnaissance vocale dans des environnements sonores bruyants. Avec ce kit, les développeurs tierces parties et les équipementiers peuvent évaluer les performances d’Alexa, puis les intégrer dans des applications d’interface homme/machine bâties sur le processeur audio Timberwolf ZL38063 à multiples entrées pour microphones.

Ce circuit est un processeur de signal numérique programmable doté d'accélérateurs matériels spécifiques capables d’exécuter simultanément trois moteurs d’annulation d'écho acoustique (AEC). Equipé de trois interfaces pour microphones, de deux convertisseurs analogiques/numériques 16 bits indépendants et de deux interfaces TDM (Time-Division Multiplexed) flexibles, c’est lui qui traite les signaux vocaux tout en appliquant des algorithmes de réduction du bruit, de formation de faisceau acoustique (beamforming), de contrôle automatique du gain, d'annulation d'écho, de réduction du bruit psycho-acoustique, de détection et de rejet des bruits forts et soudains. L’idée étant d’assurer in fine la compréhension de commandes vocales et la reconnaissance vocale non seulement à distance mais aussi en présence de bruit et de sons parasites.

Dans la pratique, le kit de développement AcuEdge pour Amazon AVS s’appuie sur une carte d’évaluation Timberwolf (photo ci-contre) où l’on trouve aussi deux microphones capables de fonctionner dans des modes de capture audio à 180 degrés et à 360 degrés. Cette carte est aussi équipée d’un connecteur ad hoc qui permet de la greffer sur une Raspberry Pi où sont exécutés en pratique le logiciel client AVS et la détection de mots clés Alexa (pour le déclenchement d’actions).

« L'objectif d'Amazon est que les développeurs et les fabricants d’équipements connectés aient accès à un large éventail de solutions de référence collant à leurs besoins, précise Priya Abani, directeur d'Alexa Voice Service. En travaillant avec Microsemi, nous fournissons aux fabricants un moyen d'intégrer rapidement et facilement Alexa dans leurs produits pour toute une variété de facteurs de forme, y compris les appareils accrochés aux murs et posés sur des tables, les haut-parleurs intelligents et les dispositifs domotiques connectés. »

Principe du prototypage d'un objet compatible Amazon Alexa (source : Microchip)

De son côté, NXP a annoncé en avril une collaboration avec Amazon afin de proposer un design de référence complet pour le développement d’objets connectés compatibles AVS (photo ci-contre). Cette solution s’appuie sur un kit Amazon Alexa qui reprend les éléments clés du haut-parleur intelligent Amazon Echo, soit un réseau de sept microphones couplé à des technologies de capture et de traitement de signaux vocaux « lointains » (détection du mot clé Alexa, formation de faisceau acoustique, réduction de bruit, annulation d’écho acoustique…) et à un logiciel client AVS.

NXP, quant à lui, fournit un processeur d’application i.MX (i.MX6, i.MX7 ou i.MX8) sur une plate-forme de développement ad hoc. Sur son site, NXP propose notamment un design de référence Amazon Alexa bâti sur un module Pico i.MX 7Dual (d’origine TechNexion). Un module où l’on trouve un processeur i.MX 7Dual architecturé autour de deux cœurs ARM Cortex-A7 et d’un cœur Cortex-M4 ainsi que la connectivité Wi-Fi 802.11ac et Bluetooth 4.1.