Revista si suplimente
MarketWatch
Inapoi Inainte

Factorii care influenţează rata de succes a deduplicării

25 Octombrie 2012




Deduplicarea la nivel de fişier este cea mai rapidă metodă, însă, în acest caz, mecanismul de eliminare a duplicatelor acţionează doar atunci când fişierele sunt identice la nivel de bit. Dacă două fişiere diferă numai la nivel de nume, de exemplu, ambele vor fi stocate. Deduplicarea „bit-level“ şi deduplicarea „blok-level“ sunt procese mult mai detaliate, care analizează fiecare fişier în căutarea secvenţelor de bits sau a blocurior de date duplicate. Sunt metode mai „eficiente“ de eliminare a duplicatelor, dar care presupun un volum mai mare de procesare, respectiv un timp mai lung decât deduplicarea la nivel de fişier.

Raportul de deduplicare este principalul argument invocat de vendorii de astfel de tehnologii, corelaţia cu scăderea costurilor de stocare fiind directă. Însă există numeroşi factori care fac ca valorile promovate de vendori să varieze în funcţie de situaţia specifică a fiecărui client.

Raportul de deduplicare se calculează în mod simplu: volumul total de date pentru backup (date care vor fi analizate pentru identificarea duplicatelor) se împarte la capacitatea de stocare utilizată în final (datele rezultate după eliminarea duplicatelor).

Diferenţele rezultate între mesajele comerciale ale vendorilor şi rezultatul concret obţinut de clienţi se datorează unui număr de factori care influenţează direct raportul de deduplicare. Astfel, în afară de variaţiile generate de tipul de tehnologii de deduplicare utilizate, raportul este influenţat de:
- politica de backup a companiei – cu cât numărul backup-urilor integrale (versus backup-ul incremental sau diferenţial) va fi mai mare, cu atât raportul de deduplicare poate fi mai mare, volumul de date redundante crescând de la zi la zi;
- politicile de păstrare a datelor – cu cât durata de păstrare a datelor este mai mare, cu atât creşte posibilitatea ca soluţiile de deduplicare să identifice mai multe date redundante;
- tipul datelor şi rata de schimbare a acestora – cu cât este mai mică rata de schimbare a datelor, cu atât creşte posibilitatea identificării mai multor date redundante;
- domeniul asupra căruia acţionează soluţiile de deduplicare – cu cât este mai mare numărul de surse asupra căreia acţionează soluţia de deduplicare, cu atât mai mare este volumul de date redundante identificate. (Deduplicarea locală se referă la identificarea şi eliminarea redundanţei dintr-o singură resursă locală, în timp de deduplicarea globală înseamnă inspectarea mai multor surse pentru localizarea şi eliminarea datelor duplicate.)
Deşi există atâţia factori care influenţează rezultatul final, identificarea unei soluţii adecvate de deduplicare nu este o loterie. Iar criteriul unic al preţului de achiziţie nu se poate aplica fără asumarea anumitor riscuri, inerente unei alegeri de acest tip.



Parerea ta conteaza:

(0/5, 0 voturi)

Lasa un comentariu



trimite