UALink : un protocole d'interconnexion pour GPU au coeur des datacenters IA
lun, 09/06/2025 - 17:33
Un des défis de l'IA est d'utiliser au mieux la puissance de calcul des GPU installées dans les datacenters. UALink (pour Ultra Aceelerator Link) a l'ambition de proposer une solution ouverte et interopérable. La version 1.0 du protocole était attendue depuis plusieurs mois. Elle a été définie par un consortium soutenu par AMD, AWS, Broadcom, HPE, Google, etc. pour créer une alternative au NVLink de NVIDIA. UALink a donc l'ambition de pouvoir créer des réseaux (Ethernet) de GPU interconnectées à faible latence. Ce protocole est taillé pour les usages intensifs de l'IA.
La version 1.0 permet d'utiliser une bande passante de 200 Gbps, tout en utilisant des GPU, des TPU et même des FPGA ou tout autre composant haute performance. Ces accélérateurs peuvent alors être connectées entre eux pour créer de véritables réseaux que les applications pourront exploiter (à condition de les adapter et de disposer du hardwave requis).
Les objectifs d'UALink sont claires :
- améliorer l'efficacité des connexions bidrectionnelles entre la mémoire et la bande passante disponible pour les données
- réduire le coût des infrastructures Ethernet actuels en utilisant le matériel déjà déployé
- réduire la complexité logicielle
Les spécifications 1.0 définit une vitesse de transfert de 200 Gb/s maximum par ligne. Il est possible de déployer 4 lignes UALink par atteindre une bande passante théorique de 800 Gb/s. NVIDIA a bien compris que ce nouveau protocole est un concurrent direct à son NVLink. Le fondeur a annoncé qu'il ouvre les interconnexions vers des composants non-NVIDIA...