L'embarqué > Logiciel > Algorithmes > Ceva injecte des réseaux de neurones dans les objets connectés dotés de reconnaissance vocale

Ceva injecte des réseaux de neurones dans les objets connectés dotés de reconnaissance vocale

Publié le 25 janvier 2019 à 06:18 par Pierrick Arlot        Algorithmes Ceva

Ceva Whispro

Début janvier, à l’occasion du CES 2019, le fournisseur de cœurs de DSP et de processeurs d’intelligence artificielle pour objets connectés Ceva a dévoilé, sous le nom de WhisPro, une technologie de reconnaissance vocale bâtie sur un réseau de neurones et destinée aux produits de plus en plus nombreux qui utilisent la voix comme interface utilisateur. S’appuyant sur l’expertise de la société dans le domaine du traitement audio et vocal basse consommation, WhisPro se présente comme un procédé toujours actif de déclenchement multiple sur phrases clés, permettant aux utilisateurs d’enceintes connectées, d’oreillettes Bluetooth et autres assistants vocaux numériques d’interagir avec des services dans le nuage du type Amazon Alexa, Google Assistant, Baidu DuerOS, etc.

Dans le détail WhisPro a été conçu pour fonctionner en tandem avec la technologie logicielle de traitement de la voix en amont ClearVox (voir illustration ci-dessous) et se présente comme une solution de reconnaissance vocale s’appuyant au niveau matériel sur un cœur de DSP Ceva, en l’occurrence un DSP Ceva-TeakLite-4, un Ceva-X2 ou un Ceva-BX (également annoncé à l’occasion du CES 2019).

Selon la société, l’intégration holistique d’algorithmes de prétraitement de la voix et de réseaux de neurones assure un niveau élevé de reconnaissance (supérieur à 95%) tout en minimisant les ressources de calcul et la consommation. Par ailleurs la technologie serait efficace même dans les environnements bruités, que l’utilisateur soit près ou loin des microphones. Enfin, ajoute Ceva, WhisPro fonctionne localement au niveau de l’objet connecté sans recours au cloud et, partant, garantit la confidentialité tout en fournissant une réponse instantanée avec une latence minimale.

« La voix est rapidement devenue l’interface humaine de choix pour les objets grand public intelligents mais c’est l’une des technologies les plus complexes à implémenter, indique Erez Bar-Niv, le directeur technique de Ceva. Avec WhisPro, nous capitalisons sur nos cœurs de DSP basse consommation et nos algorithmes maison de réduction du bruit et d’annulation d’écho pour fournir une technologie de reconnaissance vocale à la fois peu onéreuse, très précise et résistante aux bruits. Elle est compatible avec les services d’assistant vocal proposés aussi bien en local que dans le cloud et permet aux utilisateurs d’y ajouter leurs propres phrases de déclenchement d’actions pour le contrôle de leurs produits. » La technologie de réseau de neurones récurrents au cœur du procédé WhisPro serait capable de reconnaître plusieurs de ces phrases simultanément.

Sur le même sujet