Blaize repense architecture matérielle et logicielle pour un traitement IA 10 à 100 fois plus éco-efficace

[EDITION ABONNES] Alors que les start-up spécialistes des puces neuronales fleurissent un peu partout et que les grands fournisseurs de semi-conducteurs se mettent à intégrer des moteurs d’accélération d’algorithmes d’intelligence artificielle (IA) dans leurs processeurs, la société américaine Blaize compte bien faire la différence ...avec une architecture IA matérielle et logicielle repensée pour repousser les limites des solutions actuelles, grevées par leur consommation, leur complexité et leur coût.

C’est en tout cas l’objectif que s’est fixé cette entreprise créée en 2010 sous le nom de ThinCI, déjà forte d’un effectif de plus de 325 personnes réparties entre les Etats-Unis, l’Inde et le Royaume-Uni, et qui a déjà réussi à lever 87 millions de dollars auprès d’un aéropage d’investisseurs parmi lesquels on trouve les équipementiers automobiles Denso et Magna ainsi que le constructeur Daimler.

Dans la pratique, l’offre produits de Blaize, qui cible divers cas d’usage sur les secteurs de l’automobile, de la vision « intelligente » et de l’informatique d’entreprise, se décline autour d’une architecture matérielle de processeur du nom de GSP (Graph Streaming Processor) présentée comme la première à pouvoir exécuter simultanément plusieurs réseaux de neurones et des flux de traitements complets sur une seule puce, tout en étant capable d’effectuer diverses tâches de calcul intensives et hétérogènes. Cette architecture, une fois associée à une plate-forme de développement logiciel (Blaize Picasso), constitue une solution associant méthodes de gestion de flots de données dynamiques et modèles de calcul orientés graphe sur des puces-systèmes SoC programmables propriétaires.

Cette approche, explique la société, permet aux plates-formes de traitement Blaize d'exploiter la structure de graphe native inhérente aux réseaux de neurones tout au long de l'exécution. Le gain massif (entre 10 et 100) en éco-efficacité est assuré par un mécanisme de traitement de données par flot où les déplacements de données hors calcul sont minimisés voire éliminés, précise la société américaine. Ce qui contribuerait à minimiser considérablement la latence, les besoins en mémoire et la consommation au niveau de la puce, d’une carte et d’un système complet.

Plus globalement, la solution Blaize GSP serait la première à associer une architecture processeur entièrement programmable et une plate-forme logicielle, conçues dès le départ pour être nativement 100% orientées graphe. De fait, explique Blaize, s’il existe de nombreux types de réseaux de neurones, tous les réseaux de neurones sont des graphes.

Grâce à la structure inhérente orientée graphe de la plate-forme Blaize GSP, les développeurs peuvent en conséquence créer plusieurs réseaux de neurones et des flux de traitement complets sur une architecture unique applicable à de nombreux marchés et cas d'usage. Des applications entières peuvent ainsi être construites en intégrant des fonctions non neuronales, telles que le traitement d'image, avec des fonctions de réseaux de neurones, toutes représentées sous forme de graphes qui sont traités de 10 à 100 fois plus efficacement que les solutions existantes, assure la jeune société. Les développeurs d'applications AI seraient ainsi en mesure de concevoir des applications plus rapidement, les optimiser pour les adapter aux contraintes des déploiements en bordure de réseau (edge), et les exécuter de façon éco-efficace à l'aide de méthodes de gestion de flot de données automatisées.

« Blaize est déjà un partenaire important pour nous, déclare Yukihide Niimi, le CEO de NSitexe et membre du conseil consultatif de Denso. NSitexe a été créé par Denso pour suivre les ruptures technologiques du secteur automobile et accélérer le développement de solutions de calcul flexibles telles que notre Data Flow Processor (DFP). Une technologie qui a bénéficié de la collaboration entre NSitexe et Denso. » « La vision d’un processeur de traitement par flot nativement orienté graphe propre à Blaize est pratiquement unique sur le marché, déclare pour sa part Karl Freund, analyste spécialiste de l’IA chez Moor Insights & Strategy. Le GSP est plus générique disons qu’un Asic à fonctionnalité unique développé pour l’IA, et peut donc créer des opportunités sur de nombreux marchés, de l’automobile à la bordure de réseau jusqu’au nuage. »

On rappellera qu'en ce moment, la pression monte sur le front des processeurs et des blocs d’IP conçus pour traiter des algorithmes d’apprentissage profond, non plus dans le cloud, mais dans des périphériques en bordure de réseau IoT comme ceux que l’on peut trouver dans les véhicules autonomes, les drones ou la maison connectée (assistants personnels, caméras intelligentes, Smart TV…). Plus d’une soixantaine de sociétés de toutes tailles auraient en effet déjà annoncé de tels circuits ou cœurs d’IP ad hoc, à l’instar d’Arm, Cadence, Ceva, Eta Compute, Imagination, Intel, Kalray, Lattice, Nvidia, Qualcomm, Socionext, Synopsys et VeriSilicon ou des start-up AnotherBrain, GML, GreenWaves, Gyrfalcon, Hailo, NeuroBlade, Syntiant ou XNOR. Selon certains analystes, les ventes de puces optimisées pour l'intelligence artificielle (IA) en périphérie de réseau vont être multipliées par vingt d'ici à 2023 (lire notre article ici)..

Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA