OpenCV 5, la célèbre bibliothèque en open source de traitement d’image fait un saut technologique vers l’IALa communauté des développeurs d’OpenCV, une bibliothèque industrielle standard en open source initialement développée par Intel et destinée au traitement temps réel de la vision industrielle, annonce la sortie de la version 5, jugée comme une des versions les plus importantes de l'histoire d’OpenCV. Notamment pour les développeurs travaillant sur la reconstruction 3D par photogrammétrie et la robotique et qui intègrent de l’intelligence artificielle (IA). Pour rappel, depuis plus de vingt ans, OpenCV constitue le socle de la recherche en vision par ordinateur, de la robotique, de la vision embarquée, des applications d'IA, du contrôle industriel, de de l'imagerie médicale et de systèmes de production. Aujourd'hui, cette bibliothèque compte plus de 86 000 dépôts de code sur GitHub, plus d'un million d'installations par jour et l'une des plus vastes collections d'algorithmes de vision par ordinateur au monde. En s’appuyant sur ces fondements, OpenCV 5 apporte un saut technologique en intégrant un nouveau moteur DNN - Dense Neural Network (*) - avec une prise en charge renforcés du format d’échange ONNX et des modèles LLM/VLM (Large Langage Model/Vision Langage Model) ainsi qu'une optimisation de fonctionnement sur les architectures matérielle Intel, Arm et RISC-V. La cinquième version de cette bibliothèque de vision améliore aussi les opération sur la vision 3D, la prise en charge des nombres N-dimensionnels et scalaires et propose aux développeurs une documentation améliorée.
Alors que le moteur DNN d’OpenCV4 prenait en charge environ 22 % des opérateurs ONNX, le nouveau moteur DNN d’OpenCV 5 porte cette couverture à plus de 80 %. Ce qui signifie que les modèles qui échouaient avec OpenCV 4.x devraient désormais fonctionner, car, selon la communauté OpenCV 5, le moteur 5.x a été entièrement repensé.
OpenCV 5 peut également exécuter des modèles de langage complexes (LLM) et des modèles de vision-langage (VLM) directement au sein du module DNN, sans environnement d'exécution séparé. Concrètement, désormais divers modèles de détection, de segmentation, de vision-langage et d'IA générative sont désormais pris en charge par OpenCV 5 avec des performances nettement améliorées. (*) Un DNN, Dense Neural Network ou réseaux de neurones denses, est un type de réseau neuronal dans lequel chaque neurone d’une couche est connecté à tous ceux de la couche suivante ce qui permet de capturer des relations complexes et non linéaires entre les données d’entrée et de sortie du réseau. Ceette approche est adaptée à des tâches comme la classification d’images, la reconnaissance vocale, le traitement naturel du langage, notamment.
|