Ceva et Fluent.ai amènent la compréhension vocale multilingue aux wearables et aux objets connectés

[EDITION ABONNES] La société Ceva, qui fournit sous licence des blocs d’IP de détection et de connectivité sans fil, s’est associée à la jeune société canadienne Fluent.ai afin de proposer des solutions de compréhension vocale à ultrabasse consommation pour dispositifs électroniques portés sur soi, appareils d’électronique grand public et autres objets IoT. ...Des solutions présentées comme s’exécutant intégralement en local (sans recourir à des ressources dans le nuage), de faible empreinte mémoire, résistantes au bruit acoustique et... multilingues.

Les logiciels de Fluent.ai, une entreprise créée en 2015, ont été portés et optimisés pour les DSP basse consommation orientés audio et fusion de capteurs de Ceva pour que les équipementiers puissent intégrer aisément des fonctions d’activation et de commande vocales dans leurs produits, indique Ceva. La technologie de la société canadienne, qui est censée s’accommoder de n’importe quel langue ou accent, permet aux utilisateurs de parler dans leur langue natale de manière naturelle et donc sans qu’ils aient à s’inquiéter de problèmes de confidentialité.

Les cœurs de DSP de Ceva, dont les modèles Ceva-X2, Ceva-BX1, Ceva-BX2 et SensPro, disposent, quant à eux, de suffisamment de ressources pour que l’ensemble des solutions de Fluent.ai s’exécutent en mode toujours actif. Ces DSP peuvent également faire tourner des logiciels et des algorithmes qui améliorent les performances et les fonctionnalités de l’ensemble comme l’algorithme de réduction de bruit ClearVoice, l’algorithme de fusion de capteurs MotionEngine ou le framework de compréhension de l’environnement contextuel SenslinQ.

« La position de Ceva sur le marché des DSP basse consommation accessibles sous licence et des logiciels pour produits embarqués à commande vocale en fait un partenaire idéal pour la dissémination de notre technologie speech-to-intent, s’est réjoui Vikrant Tomar, le fondateur et directeur technique de Fluent.ai. L'activation et le contrôle à la voix deviennent des technologies recherchées dans un monde de plus en plus sans contact et, avec Ceva, nous proposons une solution IA de périphérie de réseau à la fois peu onéreuse et précise qui peut comprendre les intentions du locuteur à partir de la parole, même dans les environnements les plus bruyants. »

Dans le détail, la technologie speech-to-intent de Fluent.ai utilise des algorithmes à réseau de neurones spécifiques pour mapper directement la voix d'un utilisateur à l'action prévue sans qu'il soit nécessaire d'effectuer une transcription de la parole en texte (une opération effectuée par les algorithmes traditionnels de reconnaissance automatique de la parole (ASR) implantés notamment dans le nuage, voir illustration ci-dessous). Pendant l’apprentissage, la technologie Fluent.ai apprend en associant directement les représentations sémantiques des actions prévues d'un locuteur aux énoncés effectivement prononcés. D'une certaine manière, les modèles élaborés s’appuient sur un concept similaire de vocabulaire et d'acquisition du langage chez l'homme, assure la start-up canadienne.

Cette approche indépendante de toute transcription phonétique en texte permettrait de développer des modèles de compréhension de la parole qui peuvent apprendre à reconnaître une langue, quelle qu’elle soit, à partir d'une petite quantité de données. Avec la technologie Fluent.ai, l'utilisateur n'aurait pas besoin de se conformer à des phrases prédéfinies et serait libre de choisir ses propres mots à sa guise. Selon les informations de la jeune société, les systèmes Fluent.ai sont capables de reconnaître des milliers d’intentions avec un modèle dont la taille n’excède pas quelques centaines de kilo-octets.  En outre, grâce à la capacité à comprendre plusieurs langues avec un seul modèle, les utilisateurs pourraient basculer sans problème entre différentes langues lorsqu'ils interagissent avec leur équipement, sans avoir à modifier les paramétrages du langage utilisé. Avec sa technologie, Fluent.ai cible les appareils intelligents à la maison ou au bureau, les dispositifs d’électronique grand public portés sur soi et les robots industriels.

Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA

L'approche conventionnelle de reconnaissance automatique du langage

L'approche développée par Fluent.ai