IA embarquée : Renesas associe un Arm Cortex-M85, un Cortex-M33 et une unité neuronale Arm Ethos-U55 dans un seul microcontrôleur

IA Renesas associe un Arm Cortex-M85, un Cortex-M33 et une unité neuronale Arm Ethos-U55 dans un seul microcontrôleur

Toujours, à notre connaissance, le seul fabricant de microcontrôleurs à avoir ajouté à son catalogue des modèles 32 bits bâtis sur le cœur Arm Cortex-M85, le japonais Renesas apporte aujourd’hui les performances de ce coeur de processeur à sa série des microcontrôleurs RA, avec le modèle RA8P1, en l’associant cette fois-ci à un coeur Cortex-M33 cadencé à 250 MHz et à une unité de traitement neuronal (NPU, Neural Processor Unit) Ethos-U55 d’Arm.

Ces circuits sont destinés aux applications d'intelligence artificielle (IA) et d'apprentissage automatique (ML), ainsi qu'à l'analyse en temps réel.

Pour rappel, lancés sur le marché en 2023, les microcontrôleurs de la famille RA8 de Renesas sont architecturé autour du coeur Cortex-M85 d’Arm, présenté comme le plus puissant du moment, avec une performance supérieure à 3 000 CoreMarks, et apte à répondre aux contraintes des applications temps réel et déterministes à faible latence.

Par ailleurs, le Cortex-M85 à un ou deux coeurs de calcul, intègre la technologie Arm Helium qui vise à apporter des capacités d’extensions vectorielles, et donc des performances de calcul améliorées, avec des performances DSP et ML (apprentissage automatique) multipliées par quatre par rapport au Cortex-M7.

Aujourd’hui, avec le RA8P1 et son coeur Cortex-M85, Renesas place la barre des performances de ses microcontrôleurs à un niveau de performance inédit en les dotant de capacités d’accélération d’algorithmes artificielle capables de délivrer des performances jusqu'à 256 Giga opérations/s (GOPS), et jusqu’à un score de 7300 CoreMarks avec des Cortex-M85 à double coeur.

Des performances liées à l’architecture du processeur lui même et ses trois unités de calcul, mais aussi à à son processus de fabrication et à l’utilisation de mémoire Mram (en lieu et place de mémoires flash).

Ainsi, les microcontrôleurs RA8P1 sont fabriqués selon le processus 22ULL (22nm à très faible courant de fuite) de TSMC, ce qui permet d'obtenir en partie les performances très élevées affichée par le circuit avec une très faible consommation d'énergie. Ce procédé permet également l'utilisation des mémoires embarquées non volatiles Mram (Magnetic Random Access Memory). Cette technologie permet notamment d'optimiser la densité de stockage, la consommation d'énergie et les vitesses de lecture/écriture, en faisant d’elle une alternative aux technologies mémoire traditionnelles, notamment pour les nœuds technologiques au-dessous de 22 nanomètres, là où les solutions traditionnelles comme la flash qui posent des défis en termes de coût et d'intégration.

Conçu pour les applications d’IA en périphérie de réseau (Edge), le RA8P1 utilise l’unité neuronale NPU Ethos-U55 pour décharger le processeur des opérations de calcul intensif dans les réseaux neuronaux convolutifs et récurrents (CNN, Convolutional Neural Network et RNN, Recurrent Neural Networks) et fournir une performance de 256 GOPS à 500 MHz.

Ce NPU Ethos-U55 prend en charge les réseaux les plus couramment utilisés - notamment DS-CNN, ResNet, Mobilenet TinyYolo, etc. - et selon le réseau neuronal utilisé, fournit jusqu'à 35 fois plus d'inférences par seconde que le processeur Cortex-M85 seul.

« La demande d'applications AIoT de pointe à hautes performances connaît une croissance explosive, explique Daryl Khoo, vice-président de la division Embedded Processing Marketing chez Renesas. Les circuits RA8P1 mettent en valeur notre expertise technologique, en particulier au niveau du process de fabricaitn 22UL de TSMC et dans dans l’intégration des métiers MArm, et soulignent les partenariats que nous avons noués dans l'ensemble du secteur afin de délivrer des plate-formes optimisées pour les applications d'intelligence artificielle. »

Au-delà, Renesas a intégré des périphériques spécifiques, une mémoire importante et une sécurité avancée pour répondre aux applications d'analyse en temps réel et d'IA vocale et visuelle. Pour l'IA visuelle, une interface de caméra 16 bits est incluse et prend en charge des capteurs jusqu'à 5 mégapixels, ce qui permet de réaliser des applications d’IA fondées sur des caméra. Une interface MIPI CSI-2 séparée procure en outre un lien fondé sur un faible nombre de broches avec deux voies, chacune pouvant atteindre 720 Megabit/s.

De pous, plusieurs interfaces audios (I2S et PDM) prennent en charge les entrées de microphone pour les applications d'intelligence artificielle vocale.

Côté mémoire, le RA8P1 procure 2 Mo de mémoire Sram pour le stockage des activations intermédiaires ou des framebuffers graphiques et une mémoire Mram sur puce de 1 Mo disponible pour le code applicatif et le stockage des poids des modèles ou des ressources graphiques. Des interfaces de mémoire externe à grande vitesse sont également disponibles pour les modèles haut de gamme.

Ce microcontrôleur existe aussi en version SiP (System In Package) avec 4 ou 8 Mo de mémoire flash externe dans un seul boîtier pour les applications d'IA les plus exigeantes.

Enfin, à l’occasion de la sortie de ses microcontrôleurs RA8P1, Renesas introduit l’environnement logiciel Ruhmi (Renesas Unified Heterogenous Model Integration), un cadre complet commun aux architectures de microcontrôeurs et de processeurs qui autorise un déploiement des  modèles de réseaux neuronaux. Il permet l'optimisation des modèles, la quantification, la compilation et la conversion des graphes, et génère un code source optimisé.

L’environnement Rhumi procure en outre un support natif pour les frameworks d’IA pour l'apprentissage automatique tels que TensorFlow Lite, Pytorch et ONNX. Il fournit également les outils, API, générateurs de code et runtime nécessaires au déploiement d'un réseau neuronal pré-entraîné, avec en sus des exemples d'application prêts à l'emploi et des modèles optimisés pour le RA8P1.

Ruhmi est intégré à l’environnement de développement intégré e2 studio de Renesas pour permettre un développement transparent de l’IA dans un cade plus global.

Enfin côté sécurité, on notera que le microcontrôleur RA8P1 intègre la nouvelle IP de sécurité de Renesas (référencée RSIP-E50D) qui comprend des accélérateurs cryptographiques (CHACHA20, Ed25519), des courbes NIST ECC jusqu'à 521 bits, des chiffrements SHA2 et SHA3 jusqu’à 4K, avec de concert le support de la technologie Arm TrustZone.

Ces microcontrôleurs sont en outre dotés d’interfaces XSPI (Extended Serial Peripheral Interface) avec une fonction de décryptage à la volée qui permet de stocker des images de code cryptées dans une mémoire flash externe et de les décrypter à la volée lors de leur transfert sécurisé vers le microcontrôleur pour exécution.