Avec Snips, les assistants vocaux intégrés dans les objets connectés sont indépendants du cloud

La jeune société française Snips a développé une plate-forme de reconnaissance vocale bâtie sur une technologie d’intelligence artificielle maison qui peut s’exécuter sur un équipement quel qu’il soit, et ce indépendamment du cloud. Une caractéristique garante de faible latence et de protection des données utilisateur. ...

Les géants des technologies de la communication et de l’information parient sur les interfaces vocales pour populariser leurs assistants personnels connectés. Le service Alexa d’Amazon a ainsi rapidement gagné ses lettres de noblesse avec les enceintes connectées Echo et Google a mis tout son poids derrière son assistant numérique à travers Google Home. De leur côté, Apple, avec sa plate-forme HomeKit et le haut-parleur intelligent HomePod, et Microsoft, avec son service Cortana et l’enceinte connectée Invoke, sont résolus à concurrencer les deux susnommés.

Seul problème, tous ces produits dopés à l’intelligence artificielle reposent sur le cloud, ce qui n’est pas sans poser des questions sur la confidentialité des informations (et notamment des données biométriques) qui transitent vers le nuage. Quant à savoir si les produits des géants du Web seront alignés sur le RGPD (Règlement européen sur la protection des données) qui sera applicable dans l’Union européenne à partir du 25 mai prochain, rien ne permet aujourd’hui de l’affirmer. Une ambiguïté que la jeune société Snips, que L'Embarqué a pu rencontrer fin février sur le salon Embedded World, n’entretient pas. Bien au contraire.

La start-up a en effet développé une plate-forme de reconnaissance vocale bâtie sur une technologie d’intelligence artificielle maison qui peut s’exécuter sur un équipement quel qu’il soit, et ce indépendamment du cloud. Une caractéristique qui, selon la société, garantit une faible latence, la conformité aux normes générales de protection des données, et le contrôle sur l’identité de marque et les données des fabricants desdits équipements sur des marchés explicitement ciblés par Snips comme la maison connectée, le bâtiment intelligent, le commerce électronique ou les automobiles. « Avec les technologies d’assistants vocaux Amazon ou Google, il y a obligation d’utiliser les marques Alexa ou Google qui sont des mots clés pour activer le processus de reconnaissance et cela peut représenter un inconvénient pour des entreprises fortement identifiées sur leurs marchés comme Samsung ou Nespresso », précise Genia Shipova, directrice de la communication de Snips.

Faire disparaître la technologie

La société a été créée à Paris en 2013 par Mael Primet, Michael Fester et Rand Hindi (photo ci-contre) en tant que laboratoire de recherche en intelligence artificielle. Et il lui a fallu quatre ans pour mettre au point une technologie vocale industrialisable avec détection de mot d’activation, reconnaissance vocale, compréhension du langage naturel et fonctions de gestion des dialogues permettant aux fabricants et programmeurs d’ajouter des assistants vocaux à leurs produits. « Depuis 2013, nous travaillons pour intégrer l’intelligence artificielle à tous les équipements afin de faire disparaître la technologie, indique Rand Hindi, le PDG de Snips. En 2017, nous avons lancé notre plate-forme vocale en anglais et en français et, à l’occasion d’Embedded World, nous annonçons sa disponibilité en allemand. La vision de Snips consiste à garantir qu’il n’y ait plus à choisir entre l’intelligence artificielle, les fonctions vocales et la confidentialité des données. »

S’exécutant intégralement sur l’équipement, indépendamment du cloud, la plate-forme s’appuie sur des modèles IA reposant sur l’apprentissage profond optimisés pour être à la fois performants et efficaces. Ils peuvent d’ailleurs, précise la start-up, s’exécuter sur des équipements aussi « simples » qu’un calculateur Raspberry Pi 3 (architecturé, rappelons-le autour d’un processeur à quadruple cœur ARM Cortex-A53). « Depuis 2017, notre modèle commercial repose sur les ventes de notre plate-forme soit en direct, soit avec des partenaires parmi lesquels on peut d’ores et déjà citer NXP, Nvidia ou Analog Devices, détaille Genia Shipova. Et nous sommes déjà en contact avec plus de 300 sociétés potentiellement intéressées par notre technologie. » A noter que, contrairement aux fournisseurs de technologies vocales dans le nuage qui proposent un tarif par requête utilisateur, Snips propose un paiement unique par objet pour un nombre illimité de requêtes, ce qui fait de l’assistant vocal un composant plutôt qu’un service.

Des démonstrations sur Embedded World

Sur Embedded World, la plate-forme de la start-up était en démonstration sur plusieurs stands et notamment sur celui de NXP dans le cadre d’une application locale de kiosque de visualisation de films à la demande, développée avec la collaboration de l’éditeur Crank Software, spécialiste des interfaces homme-machine graphiques. L’application mettait en œuvre au niveau matériel un processeur multimédia NXP i.MX 8M justement conçu pour répondre aux exigences vocales, audio et vidéo des applications de la maison connectée et de la mobilité « intelligente » comme les décodeurs TV OTT (Over-The-Top), les serveurs multimédias résidentiels, les barres de son et les systèmes surround, les assistants vocaux, les télécommandes vocales, la signalisation numérique et autres solutions d’interface homme/machine génériques. Ici le processeur i.MX 8M mis en œuvre, qui s’articule autour de quatre cœurs ARM Cortex-A53 cadencés à 1,5 GHz et épaulés par un Cortex-M4, est censé répondre aux besoins des développeurs qui recherchent une plate-forme unique associant audio/vidéo et apprentissage automatique pour créer des produits connectés qui puissent être commandés à la voix.

Ajoutons que la technologie Snips garantit les excellentes performances des assistants vocaux à travers une solution de génération de données en cours de brevetage, qui ne nécessite pas de données réelles fournies par des utilisateurs. Les assistants utilisant la technologie Snips peuvent dès lors être entraînés avec l’équivalent de mois de données utilisateur avant même leur lancement, ce qui résout le problème classique du lancement à froid que rencontrent toutes les technologies bâties sur l’intelligence artificielle, précise la start-up. Enfin les créateurs et les équipes qui souhaitent réaliser rapidement un prototype d’assistant vocal peuvent le faire gratuitement avec la console Web en libre-service de Snips. Celle-ci inclut la possibilité d’associer des fonctions prédéveloppées disponibles sur un marché particulier à des fonctions personnalisées créées par le programmeur.

Fort d’un effectif d’une quarantaine de personnes, Snips, qui a déjà ouvert un bureau à New York, a levé en 2017 treize millions d’euros auprès de Bpifrance, MAIF Avenir, Korelya Capital (le fonds d’investissement géré par Fleur Pellerin) et Eniac Ventures.