La crisi nascosta di DRAM e NAND: i dati dell’era dell’intelligenza artificiale non possono rimanere archiviati
Nell’era dell’intelligenza artificiale, ci siamo concentrati a lungo sulla potenza, capacità e velocità di calcolo.Aggiungiamo più DRAM, stackiamo HBM ed espandiamo la NAND 3D per supportare modelli più grandi e un'inferenza più rapida.Ma sta emergendo una crisi silenziosa e pericolosa: i dati non possono più essere archiviati in modo affidabile.
Man mano che l’intelligenza artificiale si evolve da intelligenza artificiale generativa a intelligenza artificiale agentica autonoma, i sistemi richiedono uno stato persistente, memoria a lungo termine e un processo decisionale continuo.Non possono più tollerare dati temporanei o instabili.Allo stesso tempo, l’incessante ridimensionamento di DRAM e NAND per raggiungere una maggiore densità sta erodendo seriamente la conservazione dei dati e il margine di errore.
La sfida principale dello storage è cambiata: da "possiamo conservarlo?"a “possiamo mantenerlo correttamente?”
Tendenza principale: l’intelligenza artificiale rende fondamentale l’affidabilità dello storage
I sistemi di intelligenza artificiale non sono più attività informatiche una tantum.La moderna intelligenza artificiale agentica si basa su:
- Memoria a lungo termine
- Stato del sistema sostenuto
- Processo decisionale autonomo e continuo
Ciò significa che lo spazio di archiviazione deve essere mantenuto dati accurati nel tempo, non solo lavorare per un breve periodo.L’affidabilità è diventata un fattore determinante per la stabilità dell’infrastruttura IA.
Causa principale: la scalabilità riduce l’affidabilità
I miglioramenti della densità danneggiano direttamente la stabilità.Questo è un compromesso inevitabile.
Per NAND-Flash
- Dimensioni XY ridotte
- Aumento dei livelli di impilamento 3D
- Risultato: margine di errore inferiore, perdita di carica più semplice
Per la DRAM
- Transizione alla DRAM 3D
- Dimensioni delle cellule più piccole
- Risultato: tempo di ritenzione più breve, minore tolleranza al rumore
Regola: maggiore densità = minore affidabilità
Il problema essenziale della NAND: perdita di carica
Il fallimento della NAND si riduce a perdita di carica, che avviene principalmente in due modi:
- Perdita di carica verticale: la carica fuoriesce nel canale
- Diffusione laterale della carica: la carica si diffonde tra le linee di parola
Fallimento della conservazione a breve termine e a lungo termine
- A breve termine: trappole poco profonde, spostamento della tensione iniziale (IVS), i cambiamenti appaiono rapidamente
- A lungo termine: trappole profonde, meccanismi combinati (TAT / DT / TE), i problemi diventano più complessi nel tempo
Punto debole nascosto della DRAM: non può nemmeno "contenere" i dati
La DRAM non è esente da errori di ritenzione.Soffre di molteplici percorsi di perdita:
- Perdita del condensatore
- Tunneling diretto
- Perdita sottosoglia e GIDL
- Perdita di giunzione
Il cambiamento fondamentale nello stoccaggio
Passato: Memoria = capacità + velocità, errori risolti con ECC
Adesso: Storage = affidabilità a lungo termine + coerenza dello stato, lo storage è il fondamento della stabilità del sistema
Conclusione
La vera crisi nell’era dell’intelligenza artificiale non è una potenza di calcolo insufficiente: lo è conservazione dei dati inaffidabile.
Poiché la NAND 3D e la DRAM si adattano a geometrie più piccole e densità più elevate, la perdita di carica e le perdite peggiorano.La richiesta di memoria persistente da parte dell’intelligenza artificiale amplifica questi difetti.
Per creare sistemi IA stabili e di livello aziendale, il settore deve spostare l’attenzione dalla velocità e dalla capacità alla fidelizzazione, al controllo dei costi e all’affidabilità a lungo termine.
