Supercomputer che risolve i colli di bottiglia della velocità dell’IA
I ricercatori e le istituzioni accademiche possono ora eseguire in modo efficiente modelli di intelligenza artificiale di grandi dimensioni, simulazioni ed esperimenti ad alta intensità di dati con un supercomputer ad alte prestazioni.

La ricerca sull’intelligenza artificiale è sempre più limitata a causa della limitata potenza di calcolo.L'addestramento di modelli di grandi dimensioni, l'esecuzione di simulazioni complesse e l'elaborazione di enormi set di dati richiedono sistemi ad alte prestazioni.In America Latina, le istituzioni accademiche hanno dovuto affrontare limitazioni nelle infrastrutture, rallentando l’innovazione dell’intelligenza artificiale e limitando lo sviluppo di modelli adattati ai contesti locali.I ricercatori avevano bisogno di ambienti scalabili in grado di supportare carichi di lavoro di intelligenza artificiale, apprendimento automatico e calcolo scientifico ad alta intensità di dati.
Il supercomputer Jairu risponde a questa esigenza.Dotato di 96 GPU NVIDIA B200 e server Supermicro, consente ai ricercatori di eseguire modelli di intelligenza artificiale, eseguire simulazioni ed elaborare algoritmi complessi in modo efficiente.Il sistema integra storage ad alta capacità e interconnessioni a bassa latenza, riducendo i colli di bottiglia e consentendo esperimenti su larga scala.
La sua architettura offre numerosi vantaggi.I nodi head gestiscono l'ambiente, inclusi accesso, orchestrazione e distribuzione del carico di lavoro.I nodi GPU seguono lo standard HGX e utilizzano NVLink per una comunicazione veloce tra GPU.Lo storage e la rete sono progettati per mantenere un throughput elevato e una bassa latenza.Il sistema include anche software per la gestione centralizzata, la pianificazione GPU e la riproducibilità degli esperimenti.
Le caratteristiche principali del supercomputer includono:
5 nodi principali gestiscono la gestione, l'accesso e l'orchestrazione.
12 nodi GPU hanno ciascuno 8 GPU NVIDIA B200 SXM-5.
NVLink collega le GPU per comunicazioni veloci.
Lo spazio di archiviazione utilizza BeeGFS con circa 300 TB utilizzabili.
La rete combina Ethernet 200 Gb/s e InfiniBand 800 Gb/s.
Il software NVIDIA AI gestisce i carichi di lavoro e pianifica le attività.
Fabio G. Cozman, Centro per l’intelligenza artificiale e l’apprendimento automatico (CIAAM-USP) dell’USP, afferma: “Con Jairu, disponiamo di un’infrastruttura di intelligenza artificiale che ci consentirà di sviluppare modelli di grandi dimensioni e approfondire la ricerca rilevante per il contesto brasiliano”.Combinando hardware ad alte prestazioni, software aziendale e ingegneria specializzata, il sistema rafforza la capacità accademica e la competitività del Brasile nell’intelligenza artificiale e nel calcolo ad alte prestazioni.