Notebookcheck Logo

Nvidia GeForce RTX 5090 si discosta dalla tradizione dell'ammiraglia RTX 3090 Ti e RTX 4090, abbandonando la VRAM ECC per i carichi di lavoro pro

Non è più possibile alternare gli stati ECC sulla GPU RTX 5090 Blackwell
Non è più possibile alternare gli stati ECC sulla GPU RTX 5090 Blackwell
Nvidia ha curiosamente rimosso l'opzione per attivare lo stato ECC della VRAM tramite il driver nella RTX 5090. Schede come la RTX 3090 Ti e la RTX 4090 consentono di attivare lo stato ECC tramite il driver per migliorare l'affidabilità della memoria per i carichi di lavoro professionali, anche se queste schede utilizzano un "soft ECC" invece di un chip di memoria ECC dedicato on-die.

Dalla generazione Ampere, Nvidia ha sostituito la sua ammiraglia Titan con le offerte della serie 90, destinate ai professionisti che giocano.

La Nvidia GeForce RTX 5090gB202 porta con sé miglioramenti hardware sostanziali rispetto alla scheda RTX 4090aD102 e della RTX 3090 Ti's GA102 GPU.

Mentre sia la RTX 3090 Ti che la RTX 4090 offrivano l'opzione di attivare lo stato ECC della VRAM nel driver, questa opzione è curiosamente assente con la RTX 5090.

Che cos'è esattamente la memoria ECC?

L'ECC, che sta per codice di correzione degli errori, è una tecnica che consente alla memoria di autocorreggersi. Gli errori di memoria si verificano in caso di capovolgimenti di bit durante la trasmissione dei dati o quando gli errori si insinuano nei dati quando le celle di memoria si scaricano e ricaricano la loro carica.

L'autocorrezione è realizzata da un nono chip di memoria dedicato che controlla la parità tra gli altri otto chip del modulo RAM (noto come ECC on-die) o a livello del controller di memoria (ECC DRAM).

La memoria di sistema consumer DDR5 supporta l'ECC, ma non nella sua interezza. Per impostazione predefinita, la RAM DDR5 è in grado di rilevare gli errori a più bit, ma può correggere solo gli errori a singolo bit attraverso il controllo dei dati incorporato.

A causa del modo fondamentale in cui DDR5 divide la memoria a 64 bit in due sottocanali a 32 bit, la RAM DDR5-ECC è disponibile in moduli EC4 a 72 bit (32+4) o EC8 a 80 bit (32+8).

La memoria ECC è raramente necessaria per la maggior parte dei casi d'uso dei consumatori. Se non è sicuro di questo termine, è probabile che non abbia bisogno della memoria ECC.

Tuttavia, la memoria ECC è fondamentale nelle applicazioni mission-critical e di machine learning, dove l'integrità dei dati deve essere mantenuta lungo l'intera catena.

Google l'ha capito molto bene nel 1999, quando l'uso improprio della memoria ECC ha compromesso drasticamente le prestazioni del suo motore di ricerca a causa della corruzione della memoria.

L'EDR su GDDR6X riduce la probabilità di crash durante l'overclocking della VRAM. (Fonte immagine: Nvidia)
L'EDR su GDDR6X riduce la probabilità di crash durante l'overclocking della VRAM. (Fonte immagine: Nvidia)

Tutte le GPU con GDDR5 e GDDR6/6X VRAM hanno un modo per rilevare gli errori di memoria chiamato Error Detection Code (EDC).

Le GPU Nvidia si riferiscono a questa funzione come Error Detection and Replay (EDR), che è un modo di richiedere la ritrasmissione dei bit dal controller di memoria dopo aver eseguito un controllo di ridondanza ciclico (CRC).

L'EDR aiuta a ridurre al minimo gli artefatti dei pixel quando la VRAM viene overcloccata, anche se può influire leggermente sulle prestazioni.

VRAM ECC su RTX 4090 e RTX 5090

Anche se non se ne parla molto, una caratteristica distintiva che si trova sulla Nvidia GeForce RTX 3090 Ti e la RTX 4090 è la possibilità di alternare gli stati di memoria ECC e non-ECC tramite il driver.

Tuttavia, questa caratteristica è assente nella nuova RTX 5090.

Commutazione dello stato ECC nella RTX 4090
Commutazione dello stato ECC nella RTX 4090
Nessuna opzione per attivare lo stato ECC con la RTX 5090
Nessuna opzione per attivare lo stato ECC con la RTX 5090

Impatto sulle prestazioni dell'abilitazione dell'ECC

Le RTX 3090 Ti e RTX 4090 implementano qualcosa chiamato "soft ECC". Questo approccio non prevede un chip separato per mantenere la parità; invece, l'attivazione di questa funzione alloca una porzione di VRAM per funzionare in modo simile a un modulo ECC on-die.

Di conseguenza, la VRAM totale disponibile e la velocità della memoria diminuiscono. Nel caso della RTX 4090, la VRAM utilizzabile si riduce da 24 GB a 22,5 GB, con 1,5 GB riservati alle funzioni ECC.

1.5 GB di VRAM sono allocati per l'ECC
1.5 GB di VRAM sono allocati per l'ECC
Questo si riflette anche nel Task Manager
Questo si riflette anche nel Task Manager

L'attivazione dello stato ECC ha un impatto sulle prestazioni, come si vede di seguito. Con l'ECC attivato sulla RTX 4090, i punteggi di 3DMark Speed Way diminuiscono del 6,4%, mentre Cyberpunk 2077 2.21 Phantom Liberty registra una riduzione di circa il 5% degli fps medi.

Il grado di impatto sulle prestazioni varia a seconda del carico di lavoro.

3DMark Speed Way su RTX 4090
3DMark Speed Way su RTX 4090
Il punteggio scende quando l'ECC è abilitato
Il punteggio scende quando l'ECC è abilitato
Cyberpunk 2077 2.21 4K RT Ultra (senza DLSS/FG) su RTX 4090
Cyberpunk 2077 2.21 4K RT Ultra (senza DLSS/FG) su RTX 4090
Un lieve calo delle prestazioni con ECC attivato
Un lieve calo delle prestazioni con ECC attivato

La VRAM GDDR7 dell'RTX 5090 è ufficialmente dotata di specifiche per l'ECC on-die

Con GDDR7, JEDEC ha incorporato l'ECC on-die come parte della specifica VRAM, tenendo conto dell'aumento della probabilità di errori dovuti alle densità di memoria più elevate. GDDR7 utilizza l'ECC on-die con un protocollo di trasparenza che informa il controller di memoria sul tipo di errori riscontrati.

Secondo JEDEC, GDDR7 è in grado di correggere al 100% gli errori a 1 bit e di rilevare al 100% gli errori a 2 bit, anche se il tasso di rilevamento scende leggermente al 99,3% per i rari errori a 3 bit.

Inoltre, la specifica ufficiale include anche la parità dell'indirizzo di comando con blocco del comando (CAPARBLK) per migliorare ulteriormente l'affidabilità del bus dell'indirizzo di comando.

Panoramica dell'ECC on-die su GDDR7 VRAM. (Riprodotto dal documento JEDEC JESD239A)
Panoramica dell'ECC on-die su GDDR7 VRAM. (Riprodotto dal documento JEDEC JESD239A)

Tuttavia, non è chiaro se il controller di memoria di Blackwell utilizzi questa capacità ECC on-die per impostazione predefinita.

La memoria GDDR7 a 512 bit della RTX 5090 è valutata per una larghezza di banda di 1,792 TB/s con un clock veloce di 28 Gbps, che può potenzialmente causare errori di trasmissione. Inoltre, Nvidia propone la RTX 5090 per i flussi di lavoro AI, che possono beneficiare dell'ECC durante l'addestramento di grandi serie di dati.

Nonostante questo, il whitepaper dell'architettura di Nvidia menziona solo il supporto per "Enhanced Cyclic Redundancy Check (CRC) for Reliability, Availability, and Serviceability (RAS)", che non è la stessa cosa di ECC.

Sebbene sia lecito aspettarsi che Nvidia abiliti la funzionalità ECC on-die di GDDR7 per le GPU per workstation Blackwell, di cui si parla da https://www.tomshardware.com/pc-components/gpus/nvidias-rtx-blackwell-workstation-gpu-spotted-with-96gb-gddr7-proviz-gpu-with-a-512-bit-busresta da vedere se il toggle dello stato ECC arriverà alla RTX 5090 consumer tramite un futuro aggiornamento del driver o del VBIOS.

Fonte(i)

Proprio

Please share our article, every link counts!
Mail Logo
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2025 02 > Nvidia GeForce RTX 5090 si discosta dalla tradizione dell'ammiraglia RTX 3090 Ti e RTX 4090, abbandonando la VRAM ECC per i carichi di lavoro pro
Vaidyanathan Subramaniam, 2025-02-13 (Update: 2025-02-14)