Revista si suplimente
MarketWatch
Inapoi Inainte

Industry Watch >> IT&C >> Stiri si comunicate

EMC adopta Apache Hadoop pentru gestionarea volumelor mari de date

10 Mai 2011



Una dintre primele noutati de la EMC World 2011 este integrarea de catre EMC a software-ului open source Apache Hadoop (http://hadoop.apache.org) in aplicatiile proprii, pentru gestionarea volumelor mari de date. Strategia EMC legata de Apache Hadoop prevede integrarea, distribuirea si asigurarea suportului necesar pentru rularea acestei tehnologii. Aplicatia a fost integrata intr-un produs dedicat: GreenplumHD Data Computing Appliance, care combina Hadoop cu baza de date EMC Greenplum, permitand astfel procesarea printr-o soutie unica atat a datelor structurate, cat si a celor nestructurate (care reprezinta peste 80% din datele existente in cadrul companiilor).
Totodata, a fost anuntata si disponibilitatea unor aplicatii complementare Hadoop: EMC Greenplum HD Community Edition si EMC Greenplum HD Enterprise Edition software. Aceste produse certificate de mai multi parteneri vor permite interactiunea in timp real cu volume mari de date, o fiabilitatea ridicata, precum si usurinta in instalare si utilizare. Platforma hardware pe care ruleaza noul produs este o configuratie standard bazata pe procesoare Intel.
Hadoop este un proiect open source dezvoltat de Apache Software Foundation, inspirat de Google MapReduce si Google FileSystems, in esenta o platforma ce permite analiza si stocarea volumelor mari de date si folosita intens de Google, Yahoo, Facebook si alte companiile orientate catre WEB.
Din punct de vedere tehnic, Hadoop este formata din doua elemente-cheie: Hadoop Distributed File System (HDFS), care fragmenteaza fisierele in blocuri mai mici si le stocheaza redundant intr-un cluster, si un sistem de procesare paralela a datelor, bazat de MapReduce. Astfel, Hadoop permite adaugarea sau eliminarea facila a serverelor intr-un cluster si detecteaza si compenseaza automat orice problema hardware sau software, permitand analiza si livrarea datelor indiferent de schimbarile sau disfunctionalitatile aparute in sistem. In opinia EMC, prin combinarea Hadoop cu o baza de date tranzactionala puternica, utilizatorii vor inregistra beneficii majore in gestionarea volumelor mari de date, deoarece companiile nu au nevoie doar de stocarea datelor, ci si de utilizarea si manevrarea eficienta a acestora.
Prin anuntarea acestei strategii, EMC arata un interes deosebit pentru Greenplum, companie achizitionata si integrata anul trecut, dar pastrata ca divizie separata. Mai mult, numarul de angajati ai acestei divizii a crescut de la 150 la peste 600. Produsele anuntate astazi - EMC Greenplum HD Community Edition, EMC Greenplum HD Enterprise Edition si EMC GreenplumHD Data Computing Appliance - vor fi disponibile din trimestrul trei 2011, la nivel global. Complementar, in cadrul EMC Global Services au fost dezvoltate o serie de servicii pentru asigurarea suportului necesar clientilor care doresc sa migreze de la bazele de date Oracle sau Teradata la Greenplum Data Computing Appliance.



Parerea ta conteaza:

(0/5, 0 voturi)

Lasa un comentariu



trimite