Puces pour l’IA économes : la start-up américaine Positron lève 23,5 millions de dollars

Positron AI lève 23 millions de dollars

Fondée en 2023 et basée à Reno (Nevada), la jeune société Positron, concepteur d’une technologie matérielle d'inférence de transformeurs pour le calcul d'intelligence artificielle (IA) vient de lever 23,5 millions de dollars de financement auprès d'un groupe d'investisseurs, dont Flume Ventures, Valor Equity Partners, Atreides Management et Resilience Reserve.

Ce financement va permettre à Positron d'augmenter la production de ses puces d'IA économes en énergie fabriquées aux États-Unis, offrant aux entreprises, selon la société, une alternative rentable aux processeurs pour l’IA de Nvidia, dominant sur le marché.

« Ce qui distingue Positron, ce n'est pas seulement sa rentabilité, mais aussi sa capacité à commercialiser rapidement du matériel pour des calculs d’IA et à fournir des performances élevées par watt, souligne Mitesh Agrawal, le CEO de Positron. Notre approche innovante permet aussi aux entreprises de faire évoluer les charges de travail de l'IA sans les barrières habituelles du coût et de la consommation d'énergie. »

Les systèmes Atlas de Positron, installés pour le moment sur un FPGA Agilex 7 d’Intel/Altera, atteignent actuellement, selon Positron, des performances 3,5 fois supérieures par dollar et une efficacité énergétique 3,5 fois supérieure à celles des processeurs graphiques H100 de Nvidia pour les calculs d'inférence.

Tirant parti d'une architecture optimisée en mémoire, la technologie qui affiche une utilisation de la bande passante à 93 % (contre 10 à 30 % pour les GPU), les serveurs alimentés par les FPGA de Positron prennent en charge des modèles jusqu’à mille milliards de paramètres tout en offrant une compatibilité plug-and-play avec la technologie de la société franco-américaine Hugging Face et les API d’OpenAI.

Toujours selon Positron, ces systèmes offrent une inférence 70 % plus rapide avec une consommation d’énergie inférieure de 66 % à celle des configurations H100/H200, soit moins de 2 kW, réduisant ainsi de 50 % les dépenses d’investissement des centres de données.

A terme, Positron souhaite développer sa technologie sous la forme d’un Asic dont la sortie est prévue en 2026.