Gateworks avec NXP veut faciliter le déploiement de l’IA embarquée dans l’Edge

La société américaine Gateworks, concepteur de calculateurs monocartes durcis conçus pour satisfaire les besoins des applications industrielles, et partenaire au niveau Gold du fournisseur de semi-conducteurs NXP, lance une solution d'accélération d’algorithmes d’intelligence artificielle (IA) pour les applications embarquées en bordure de réseau (Edge), comme par exemple la robotique industrielle.

Ainsi, la carte d'accélération d’IA GW16168 au format M.2 de la société est une solution qui apporte un traitement IA haute performance de qualité industrielle directement au niveau des plateformes embarquées en périphérie de réseau.

Selon Gateworks, pour de nombreux systèmes embarqués, le défi consiste à prendre en charge les charges de travail d'IA actuelles, sans compromettre les performances globales d’un système, son efficacité énergétique ni les délais de développement. Les ingénieurs sont donc contraints de faire des compromis entre capacité de calcul et complexité du système.

Parmi les difficultés courantes rencontrées, Gateworks note les performances d’IA limitées sur les processeurs généralistes ou les unités de traitement neuronal (NPU) intégrées, les goulots d'étranglement constatés sur un système lorsque les charges de travail d'IA entrent en concurrence avec les tâches de traitement principales ou encore les cycles de développement longs dus au matériel personnalisé et aux travaux d’intégration, sans oublier les incertitudes de la chaîne d'approvisionnement et le manque de disponibilité des produits à long terme.

Dans ce paysage, la carte d'accélération IA M.2 GW16168 dissocie le traitement de l’IA du processeur hôte grâce à une unité de traitement neuronal “discrète” (Discret NPU) Ara240 de NXP.

Cette architecture permet d'atteindre jusqu'à 40 téraopérations par seconde (TOPS) de performances d'inférence autorisant ainsi l'exécution indépendante de charges de travail d'IA complexes sans impacter la réactivité du système.

Selon Gateworks, les avantages de cette solution sont liées au fait qu’elle a été conçue nativement pour un déploiement en conditions réelles. Dotée de 16 Go de mémoire LPDDR4 (Low-Power Double Data Rate 4) intégrée, elle prend en charge les modèles d’IA avancés, notamment la vision, l’analyse vidéo intelligente et les grands modèles d’apprentissage du langage naturel (LLM), directement en périphérie du système.

Le format M.2 M-Key 2280 choisi avec son interface PCIe Gen4 permet en outre, toujours selon Gateworks, une intégration facilitée dans une large gamme de systèmes embarqués, réduisant ainsi les délais de développement.

Cette solution, conçue et fabriqués aux Etats-Unis, est optimisée pour les plateformes NXP, notamment les processeurs i.MX 95, i.MX 8M Plus et i.MX 8M Mini. Au cœur de ce processeur, l’unité de traitement numérique Ara240 prend en charge les frameworks standards du secteur, notamment TensorFlow, PyTorch et ONNX.