Socionext innove dans le domaine de la reconnaissance d’image et de la détection d'objet à très faible luminosité

[EDITION ABONNES] Socionext et l’université d’Osaka ont développé en commun une nouvelle méthode d’apprentissage profond qui permettrait d’effectuer de la reconnaissance d’image et de la détection d’objet dans des conditions de luminosité extrêmement faible. ...En fusionnant plusieurs modèles, cette méthode assure la détection d’objet sans avoir à générer un ensemble de données (dataset) gigantesque, une tâche jugée jusqu’alors essentielle pour ce type de tâche, indique la société nippone. Socionext envisage déjà d’implanter cette technologie dans ses processeurs de traitement d’image (ISP) afin de proposer des puces-systèmes inédites (et des caméras les intégrant) sur des marchés nécessitant une reconnaissance d’image hautes performances comme l’automobile, la sécurité ou l’industriel.

Dans le domaine de la vision artificielle, l’un des principaux défis a toujours été d’améliorer les performances de la reconnaissance d’image au sein d'applications comme les caméras embarquées à bord des véhicules ou les systèmes de surveillance lorsque les conditions de luminosité sont mauvaises. Pour ce faire a été développée une méthode d’apprentissage profond qui utilise les données brutes issues des capteurs (RAW), baptisée « Learning to See in the Dark ». Mais, précise Socionext, cette méthode nécessite un dataset de plus de 200 000 images avec plus de 1,5 million d’annotations pour un apprentissage de bout-en-bout. La préparation d’un tel dataset avec des images RAW est à la fois coûteuse et chronophage.

Afin de contourner ce handicap, Socionext et l’université d’Osaka proposent une nouvelle méthode dite d’« adaptation de domaine » qui bâtit le modèle requis avec des datasets existants et ce en utilisant des techniques récentes d’apprentissage automatique telles que l’apprentissage par transfert (Transfer Learning) et la "distillation des connaissances" (Knowledge Distillation). L’apprentissage par transfert peut être vu comme la capacité d’un système à reconnaître et appliquer des connaissances et des compétences, apprises à partir de tâches antérieures, sur de nouvelles tâches ou domaines partageant des similitudes. La distillation des connaissances, quant à elle, est une technique qui vise à diminuer la taille d’un réseau de neurones. 

Selon le Japonais, cette approche permet l’apprentissage d’un modèle recherché de reconnaissance d’image en utilisant des datasets existants (voir illustration ci-dessous). En utilisant cette méthode d’adaptation de domaine, l’équipe de recherche commune à Socionext et à l’université d’Osaka a construit un modèle de détection d’objet « Yolo in the Dark » qui utilise des images RAW prises dans des conditions de luminosité extrêmement faibles et ce à partir du modèle Yolo existant. (Yolo est l’une des méthodes reconnues de détection d’objets par apprentissage profond.) Ainsi l’apprentissage du modèle de détection d’objets sur des images RAW peut être réalisé avec le dataset existant sans avoir à générer des datasets additionnels. Et, alors que l’objet ne peut pas être détecté en améliorant artificiellement la luminosité des images RGB avec le modèle Yolo existant, le nouveau modèle proposé rend possible la reconnaissance d’images RAW et la détection d’objets, assure Socionext. Et ce pour des ressources de calcul deux fois plus faibles. A suivre donc.

Le principe de la méthode d'adaptation de domaine mise au point par Siocionext et l'université d'Osaka