Synopsys propose un cœur de traitement neuronal apte à effectuer jusqu’à 250 téraopérations par seconde

Synopsys

Avec les NPU (Neural Processing Unit) DesignWare ARC NXP6 et NPX6FS, la société Synopsys affirme proposer aux fabricants de puces-systèmes SoC dopées à l’intelligence artificielle (IA) les cœurs de traitement neuronal les plus performants du moment... avec la capacité d’exécuter les modèles de réseaux de neurones les plus complexes.

Afin de répondre à un éventail d’applications IA à basse consommation sur des marchés comme les systèmes d’assistance évoluée à la conduite automobile (ADAS), la surveillance, la télévision numérique et autres applications reposant sur l’usage de caméras, le NPU NXP6 intègre de 4K à 96K blocs MAC et affiche une performance qui peut atteindre 250 Tops (téraopérations par seconde) à 1,3 GHz dans un procédé de gravure 5 nm (dans les conditions les plus défavorables) et ce pour une éco-efficacité de 30 Tops/W. Une performance qui peut monter jusqu’à 440 Tops en utilisant de nouvelles fonctionnalités de codage parcimonieux (sparsity).

Le NPU NXP6 dispose en outre de caractéristiques de connectivité matérielle et logicielle qui permet d’en coupler plusieurs instances au sein d’une seule puce-système SoC pour atteindre une performance de 3 500 Tops (*), assure Synopsys. Le dernier-né des blocs d’IP NPU de l’Américain peut aussi en option traiter les données 16 bits en virgule flottante, ce qui simplifie la transition entre les processeurs graphiques (GPU) utilisés pour le prototypage IA et des SoC optimisés au niveau de l’empreinte silicium.

La variante NXP6F, quant à elle, vise à répondre aux exigences de la norme de sûreté de fonctionnement automobile ISO 26262 jusqu’au niveau Asil-D.

L’ensemble est complété par la suite de développement ARC MetaWare MX qui comprend des compilateurs et un débogueur, un kit de développement logiciel (SDK) pour réseaux de neurones, des SDK pour plates-formes virtuelles, des environnements d’exécution et des bibliothèques, ainsi que des modèles de simulation évolués.

(*) Soit des performances 50 fois supérieures à celles d'une configuration maximale de blocs d'IP ARC EV7x, disponibles depuis 2020.  

Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA