Panoramica di Deduplicazione dati
Che cos’è la deduplicazione dei dati?
La deduplicazione dei dati è una funzionalità che consente di ridurre l'impatto dei dati ridondanti sui costi di archiviazione. Quando è abilitata, la deduplicazione dei dati consente di ottimizzare lo spazio disponibile in un volume cercando parti duplicate nel volume stesso. Le parti duplicate del set di dati del volume vengono archiviate una sola volta e, facoltativamente, possono essere compresse per ottenere un risparmio di spazio aggiuntivo. La deduplicazione dei dati consente di ottimizzare le ridondanze senza compromettere la fedeltà o l'integrità dei dati. Per altre informazioni sul funzionamento della deduplicazione dei dati, vedere la sezione How does Data Deduplication work? (Come funziona la deduplicazione dei dati?) della pagina Understanding Data Deduplication (Informazioni sulla deduplicazione dei dati).
Importante
L'articolo KB4025334 contiene un rollup di correzioni per Deduplicazione dati, incluse correzioni importanti per l'affidabilità ed è consigliabile installarlo quando si usa Deduplicazione dati con Windows Server 2016 e Windows Server 2019.
Perché è utile la deduplicazione dei dati?
La deduplicazione dei dati consente agli amministratori di archiviazione di ridurre i costi associati alla duplicazione dei dati. I set di dati di grandi dimensioni hanno spesso molti dati duplicati, che aumentano i costi di archiviazione. Ad esempio:
- Le condivisioni file utente possono contenere molte copie dello stesso file o di file simili.
- I guest di virtualizzazione possono essere quasi identici da una macchina virtuale a un'altra.
- Gli snapshot di backup possono presentare differenze trascurabili tra un backup giornaliero e un altro.
Il risparmio di spazio ottenibile con la deduplicazione dei dati dipende dal set di dati o dal carico di lavoro del volume. I set di dati con duplicazione elevata potrebbero registrare percentuali di ottimizzazione fino al 95% o una riduzione di 20 volte dell'uso dello spazio di archiviazione. Nella tabella seguente sono illustrati i vantaggi in termini di risparmio di spazio offerti dalla deduplicazione per vari tipi di contenuto:
Scenario | Contenuto | Risparmio di spazio tipico |
---|---|---|
Documenti degli utenti | Documenti aziendali, foto, musica, video e così via | 30-50% |
Condivisioni di distribuzione | File binari del software, file CAB, simboli e così via | 70-80% |
Librerie di virtualizzazione | File ISO, file disco rigido virtuale e così via | 80-95% |
Condivisioni file generali | Tutte le risposte precedenti | 50-60% |
Nota
Se si vuole semplicemente liberare spazio in un volume, è consigliabile usare Sincronizzazione file di Azure con il cloud a livelli abilitato. Questa soluzione consente di memorizzare nella cache i file a cui si accede più di frequente in locale e di archiviare i file a cui si accede più raramente in livelli nel cloud, risparmiando spazio di archiviazione locale e garantendo al tempo stesso le prestazioni. Per informazioni dettagliate, vedere Pianificazione della distribuzione di Sincronizzazione file di Azure.
Quando è possibile usare Deduplicazione dati?
Illustrazione dello scenario | Descrizione |
---|---|
File server per utilizzo generico: i file server per utilizzo generico sono file server che possono contenere i tipi di condivisioni seguenti:
|
|
Distribuzioni VDI (Virtual Desktop Infrastructure): i server VDI, ad esempio Servizi Desktop remoto, offrono alle organizzazioni un’opzione poco impegnativa per effettuare il provisioning di computer desktop per gli utenti. Esistono molti motivi per cui le organizzazioni si affidano a questa tecnologia:
|
|
Destinazioni di backup, come applicazioni di backup virtualizzate: le applicazioni di backup, ad esempio Microsoft Data Protection Manager (DPM), sono ottime candidate per la deduplicazione dei dati, vista la duplicazione significativa tra gli snapshot di backup. | |
Altri carichi di lavoro: anche altri carichi di lavoro possono essere adatti alla deduplicazione dei dati. |