
Nei moderni sistemi informatici, la facilità con cui si possono creare e gestire le informazioni, il sempre più basso costo dello storage dei dati fa sì che la quantità dei dati memorizzati sia sempre più elevata. Ma questi dati bisogna poi tenerli al sicuro e soprattutto fare le copie.
Interviene a questo punto la deduplica.
La deduplica dei dati è una forma particolare di compressione che elimina i dati doppi o ripetuti. Questa tecnica si utilizza per ottimizzare lo storage e si può anche utilizzare in ambienti di rete per ottimizzare il traffico dei dati. Nel processo di deduplica un insieme di byte ‘unici’ vengono scritti su disco durante il processo di analisi dei dati. Col procedere dell’analisi dei dati tutti i blocchi di byte vengono confrontati con quelli già memorizzati e, se sono ridondanti, non vengono memorizzati ma si mette solo un puntatore al dato effettivo.
Proviamo a fare un esempio per rendere più chiaro il concetto.
I dieci dipendenti di un’azienda ricevono un’email con un allegato.
Se tutti i dipendenti salvano l’allegato sul file server, ecco che abbiamo dieci volte ripetuta la stessa informazione, ossia il file ricevuto in allegato.
Per avere un’idea del concetto di deduplica si deve pensare ad avere una sola copia del file originale e nove “puntatori” collegati all’informazione effettivamente memorizzata.
Nel campo dello storage ed in particolare dei processi di backup è oramai tassativo disporre di un sistema di deduplica. Un buon sistema di deduplica è in grado di ridurre sensibilmente lo spazio occupato dai backup ma anche del tempo di backup, il che significa acquistare meno dischi o meno capienti, copie più veloci ed alla fine riduzione dei costi. Ma la deduplica, oltre che nel processo di backup, può essere usata anche nella fase di salvataggio dei dati nei dischi (ovviamente se il sistema operativo lo prevede).