Revista si suplimente
MarketWatch
Inapoi Inainte

Deduplicarea datelor, aplicabilitate şi tendinţe

25 Iulie 2010




O simplă analiză a pieţei arată că tehnologiile pentru deduplicare datelor sunt foarte diferite şi alegerea unui producător poate fi mai mult sau mai puţin inspirată, mai ales pentru back-up-ul bazelor de date, aplicaţii mai sensibile la procesul de deduplicare a datelor. Astfel, nu toată lumea este încântată de ideea deduplicării datelor.


Deduplicarea datelor poate avea loc la nouă niveluri diferite. Primul nivel îl reprezintă sursa care produce fişierele, acestea putând fi scanate, indexate şi amprentate. Ulterior, fiecare fişier cu o amprentă identică este şters şi este creată o trimitere către fişierul sursă. Al doilea nivel îl reprezintă stocarea secundară (SAN, NAS), aceste soluţii fiind oferite chiar de producătorii acestor sisteme. În acest caz, fişierele pot exista redundant pe hard discul staţiilor de lucru sau la nivel de server, însă, la momentul stocării datelor, se aplică procese de scanare şi amprentare şi, ulterior, eliminarea instanţelor multiple. În funcţie de vendor, deduplicarea datelor poate avea loc simultan cu copierea pe echipamentele de stocare sau mai târziu, pe baza unei rutine programabile.


Concluzii

Majoritatea specialiştilor pe care i-am abordat în realizarea acestui articol sunt de părere că deduplicarea datelor este un proces ce utilizează intens puterea de calcul. Aceasta face ca sistemele SAN/NAS cu deduplicare să fie destul de scumpe, deoarece au nevoie de un volum mare de memorie internă, precum şi de performanţă la nivel de CPU pentru analiza, indexarea şi amprentarea fişierelor. Astfel, dacă deduplicarea datelor poate aduce beneficii importante pentru e-mail, servere de fişiere, soluţii de colaborare (precum Microsoft Sharepoint/Lotus etc.), în cazul bazelor de date tranzacţionale şi a back-up-ului acestora situaţia este diferită, mai ales dacă acestea conţin deja funcţionalităţi de compresie a datelor. Mai mult, aplicate greşit, tehnologiile de deduplicare a datelor pot influenţa negativ timpul de back-up şi recuperare şi pot crea blocaje ale traficului la nivel de reţea. Concluzia generală este că deduplicarea datelor este indicată pentru stocarea datelor existente la nivel de desktop, aplicaţii de colaborare, aplicaţii web şi e-mail, dar mai puţin recomandată pentru back-up-ul bazelor de date, pentru care se pot găsi soluţii cu beneficii mai importante.


(articolul este realizat cu informaţii oferite de principalii vendori)



Parerea ta conteaza:

(0/5, 0 voturi)

Lasa un comentariu



trimite