Le chinois Rockchip lance son premier processeur avec unité de calcul neuronal intégrée

Rockchip

La société de semi-conducteurs chinoise Rockchip rejoint la liste des fabricants de puces-systèmes SoC ayant pris l’option d’intégrer dans leurs circuits une unité de calcul dévolue au traitement de réseaux de neurones (NPU). ...Calibré pour répondre aux besoins des applications d’intelligence artificielle (IA) sur les marchés de la conduite automobile intelligente, de la reconnaissance d’images, de la surveillance, des drones et de la reconnaissance vocale, le processeur RK3399Pro, qui repose sur une structure CPU+GPU+NPU, s’appuie en outre sur un mode de fonctionnement big.LITTLE avec un double cœur ARM Cortex-A72, épaulé par un quadruple cœur Cortex-A53. On y trouve aussi une unité de traitement graphique (GPU) haut de gamme à quatre cœurs ARM Mali-T860.

Selon Rockchip, le NPU atteint une performance de calcul de 2,4 Tops (trillions d’opérations par seconde), présentée comme 150% supérieure aux autres processeurs NPU du même type, tout en affichant une consommation électrique inférieure à 1% de celle des solutions ayant adopté un GPU comme bloc de calcul pour les applications d’intelligence artificielle.

Le NPU du RK3399Pro s’accommode des précisions de 8 bits et de 16 bits pour les modèles de réseaux de neurones et s’avère compatible avec divers frameworks IA logiciels, assure la firme chinoise qui précise que ses interfaces existantes prennent en charge les API OpenVX et TensorFlow/AndroidNN tandis que les outils logiciels permettent l’importation, le mappage et l’optimisation de modèles Caffe/TensorFlow.

Côté matériel, la puce-système de Rockchip dispose d’une double interface USB 3.0 Type-C, de deux canaux de traitement d’image ISP (chacun étant capable de travailler sur des images de 13 millions de pixels), d’une sortie pour afficheur 4096 x 2160 pixels et d’une entrée pour un réseau de 8 microphones numériques. Les API OpenGL ES 1.x/2.x/3.1/3.2, Vulkan 1.0, OpenCL 1.1/1.2 et RenderScript sont également prises en charge par le processeur.

Performances comparées sur différents modèles de réseaux de neurones profonds