L’israélien Hailo, spécialiste des puces IA pour l’embarqué, lève 120 M$ et lance un accélérateur pour l’IA générative

[EDITION ABONNES] Fondée en 2017, la société israélienne Hailo, qui développe des processeurs pour apprentissage profond en périphérie de réseau (edge), annonce avoir étendu sa levée de fonds de série C avec un investissement supplémentaire de 120 millions de dollars (qui s’ajoutent donc aux 136 millions de dollars levés en 2021). Le nouveau tour de table a été mené par des investisseurs existants et nouveaux, notamment la famille Zisapel, Gil Agmon, Delek Motors, Alfred Akirov, DCLBA, Vasuki, OurCrowd, Talcar, Comasco, Automotive Equipment (AEV) et Poalim Equity.

La nouvelle levée de fonds porte à plus de 340 millions de dollars la somme totale injectée dans la start-up depuis sa création.

Parallèlement Hailo a annoncé le lancement de la famille Hailo-10 d’accélérateurs d’intelligence artificielle générative (GenAI) qui, dixit la société, ouvre une ère où les applications GenAI pourront s’exécuter localement sur site sans que les utilisateurs aient à s’abonner à des services GenAI dans le cloud.

Les puces Hailo-10 ont été spécifiquement conçues pour traiter des grands modèles de langage (LLM) à basse consommation et ciblent plus particulièrement les marchés des ordinateurs personnels et des systèmes d’infodivertissement automobiles. « Nous avons conçu Hailo-10 pour intégrer de manière transparente les capacités GenAI dans la vie quotidienne des utilisateurs, les libérant ainsi des contraintes du cloud, souligne Orr Danon, le CEO et cofondateur de Hailo. L’idée est de leur permettre d'utiliser des agents conversationnels, des copilotes et autres outils de génération de contenu émergents avec une flexibilité et une immédiateté inégalées, pour une productivité améliorée et des expériences enrichies. »

L’accélérateur GenAI Hailo-10 est censé maintenir la position dominante de la firme israélienne sur le plan des rapports performances/coût et performances/consommation d’énergie. La nouvelle famille s'appuie sur la même suite logicielle utilisée pour les accélérateurs IA Hailo-8 et les processeurs de vision IA Hailo-15, afin d’assurer une intégration sans couture des capacités IA sur plusieurs équipements et plates-formes edge.

Dans la pratique, les puces Hailo-10, qui seront échantillonnées au cours du deuxième trimestre 2024, affichent des performances maximales de 40 Tops et s’avéreraient plus rapides et plus éco-efficaces que les moteurs neuronaux (NPU) intégrés, tout en offrant des performances au moins deux fois supérieures que les NPU Intel Ultra Core pour une consommation deux fois moindre, selon des benchmarks récemment publiés.

Hailo-10 peut ainsi exécuter le modèle de langage Llama2-7B avec jusqu'à 10 jetons par seconde (TPS) pour une consommation inférieure à 5 W, précise Hailo. Lors de l’exécution de Stable Diffusion 2.1, un modèle populaire qui produit des images à partir d'invites de texte, Hailo-10 serait en mesure de générer une image en moins de 5 secondes pour la même enveloppe de consommation.

La société israélienne rappelle que l'activation de l'IA générative à la périphérie de réseau garantit un accès continu aux services GenAI, quels que soient le type et l’état de la connexion réseau. Elle évite les problèmes de latence réseau, favorise la confidentialité en gardant les informations personnelles anonymisées et améliore la durabilité en réduisant la dépendance à la puissance de traitement gigantesque des centres de données dans le cloud.

« Alors que l’IA générative en périphérie de réseau devient immersive, l'accent est mis sur la gestion des grands modèles de langage dans la plus petite enveloppe de consommation possible, en général sous la barre des cinq watts, ajoute Orr Danon. Que les utilisateurs utilisent l’IA générative pour automatiser des services de traduction ou de synthèse en temps réel, générer du code logiciel ou créer des images et des vidéos à partir d'invites de texte, la puce Hailo-10 leur permet de le faire directement sur leur PC ou d'autres systèmes edge, sans surcharger le processeur ni épuiser la batterie. »

Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA