Le français VSora promet une puce pour relever les défis du traitement de l’IA générative

VSora Jotunn

Spécialiste des circuits et des blocs d’IP multicœurs utilisés dans les systèmes d’assistance évoluée à la conduite automobile (ADAS) et les systèmes de communication numériques (5G compris) pour le traitement de l’intelligence artificielle (IA) et le traitement du signal de haut niveau, la jeune pousse francilienne VSora a dévoilé cet été, sous le nom de Jotunn, une famille de puces tout-en-un censées assurer des performances massivement élevées pour répondre aux défis posés par l’IA générative (*).

« Alors que l’intérêt pour ChatGPT et d'autres IA génératives atteint son paroxysme, l'industrie des semi-conducteurs doit intensifier ses efforts pour fournir des ressources matérielles adaptées, indique Khaled Maalej, le fondateur et P-DG de VSora. C’est le but que nous recherchons avec notre architecture à puce unique qui est capable de surmonter les problèmes du goulet d’étranglement de la mémoire et d’accélérer les implémentations d'IA générative. »

Selon la société française, la plupart des processeurs actuels sont inactifs pendant près de 97% du temps dans l’attente des données à traiter lors de la mise en œuvre de GPT-3 ou GPT-4. Or, assure VSora, ChatGPT, qui repose sur GPT-3.5, peut être pris en charge intégralement sur la puce Jotunn4, dont la disponibilité est prévue courant 2024. Ce qui abaisserait la consommation d'énergie de plus d'un ordre de grandeur par rapport à ses concurrents. Par ailleurs, Jotunn4 serait en mesure d’améliorer le rapport coût-efficacité d'une solution GPT-4 de plus de 150 fois par rapport à son concurrent le plus proche.

« L'architecture ChatGPT-sur-une-puce de VSora peut libérer le potentiel illimité de l'IA générative telle que ChatGPT, déclare Nicolas von Bülow, directeur associé chez Clipperton Finance, un conseiller financier de la firme hexagonale. Elle sera le fer de lance d'un changement de paradigme dans l'industrie des semi-conducteurs. »

La solution Jotunn4 fournit en pratique une puissance de traitement de 1,6 pétaflops avec une efficacité algorithmique de plus de 50% pour GPT-3.5 et GPT-4, indique encore VSora, alors qu’en règle générale, les rendements se situent actuellement autour de 2% à 4%. De plus, le circuit Jotunn4 dispose de 192 Go de mémoire intégrée sur la puce et consomme moins de 100 W dans un boîtier de 45 x 45 mm.

VSora rappelle que son architecture brevetée a été initialement conçue pour les puces à faible consommation d'énergie, à coût réduit et à hautes performances pour les véhicules à conduite autonome de niveau L3 à L5, mais la société a pris la décision de l’étendre pour accélérer les applications de type GenAI. Dans ce cadre, assure le Français, la mise en œuvre algorithmique est rapide et facile, en utilisant le langage de haut niveau et le flot de développement avec compilateur de graphes de VSora.

L'architecture mise au point par la firme hexagonale est ainsi présentée comme indépendante des algorithmes, ce qui permet d'exécuter des algorithmes existants ainsi que de nouveaux algorithmes sur n'importe quelle puce VSora.

La société, qui a levé 4,2 millions de dollars en début d’année, dispose de bureaux à Meudon-la-Forêt (Hauts-de-Seine), San Diego (Californie) et Taïwan.

(*) L'intelligence artificielle générative est un type de système d’IA capable de générer du texte, des images ou d'autres médias en réponse à des invites. Les modèles génératifs apprennent les modèles et la structure des données d'entrée, puis génèrent un nouveau contenu similaire aux données d'apprentissage mais avec un certain degré de nouveauté.

Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA