ARM va lui aussi apporter l’apprentissage automatique aux terminaux mobiles et embarqués

[EDITION ABONNES] Sous le nom de code de Projet Trillium, ARM planche d’arrache-pied sur une suite de blocs d’IP destinés à apporter l’apprentissage automatique et les réseaux de neurones aux terminaux mobiles dans un premier temps, puis aux équipements embarqués (capteurs, enceintes connectées, caméras, ...produits audio/vidéo grand public, drones, robots, etc.) ultérieurement.

Au cœur des efforts de la société britannique, aujourd’hui propriété du japonais SoftBank et dont les IP intéressent au premier chef les fabricants de semi-conducteurs, on trouve en particulier deux processeurs, à la fois flexibles et échelonnables, qui se veulent à la fois performants et éco-efficaces.

Le premier baptisé ARM ML (Machine Learning) a été conçu spécifiquement pour l’apprentissage automatique, à partir d’une feuille blanche. Selon le Britannique, il repose sur l’architecture hautement échelonnable ARM ML, constituée de moteurs d’accélération à fonction fixe, associés à des moteurs programmables pour l’exécution de couches non convolutives et l’implémentation de primitives et d’opérateurs particuliers. Une unité de contrôle réseau, de la mémoire locale et un contrôleur DMA complètent l’ensemble. Le processeur ARM ML s’avère capable de développer une puissance de plus de 4,6 trillions d’opérations par seconde (Tops) – un record en la matière – et affiche une efficacité de plus 3 Tops/W.

Le processeur ARM OD (Object Detection), quant à lui, a été développé spécifiquement pour l’identification de personnes et d’objets avec, virtuellement, un nombre illimité d’objets par image. Apte à effectuer un traitement en temps réel sur des flux vidéo Full HD à 60 images/s, il afficherait des performances jusqu’à 80 fois supérieures à celles d’un DSP traditionnel et une qualité de détection significativement améliorée par rapport à celles de technologies ARM plus anciennes. Les deux processeurs (ARM ML et ARM OD), une fois associés, peuvent alors constituer une solution puissante de détection et de reconnaissance de personnes, assure ARM, et ce avec une éco-efficacité très nettement supérieure à ce que peuvent offrir les processeurs généralistes (CPU), les processeurs graphiques (GPU), les accélérateurs et les DSP.

La société complète en outre cette offre matérielle avec le logiciel ARM NN (Neural Networks), la bibliothèque ARM Compute Library et la couche d’abstraction CMSIS-NN. L’ensemble, optimisé pour l’exécution de réseaux de neurones, est censé combler le gap entre les frameworks de réseaux de neurones, tels que TensorFlow, Caffe ou Android NN, et la gamme de processeurs Cortex (CPU), Mali (GPU) et ML du Britannique.

Selon ARM, la disponibilité des blocs d’IP ARM ML pour les fabricants de semi-conducteurs est prévue à la mi-2018. Mais, pour l'heure, aucun d'entre eux ne s'est officiellement engagé à acquérir une licence de ces technologies auprès de la société d'outre-Manche. Il faut dire que certains, et non des moindres, ont déjà pris les devants en matière d'intelligence artificielle et d'apprentissage machine (Qualcomm, Samsung, Nvidia, etc.). Et d'autres fournisseurs de blocs d'IP, comme Cadence, Ceva ou Synopsys, sont aussi sur les rangs.