Revista si suplimente
MarketWatch
Inapoi Inainte

O abordare proactiva a bazelor de date: OLAP

14 Iulie 2005



OLAP este un acronim, ca de altfel multe dintre denumirile ciudate din industria IT. In engleza el inseamna online analytical processing, sau in traducere libera procesare analitica online. Este o modalitate de a furniza raspunsuri la interogari complexe ale bazelor de date. OLAP face parte din ceea ce numim Business Intelligence impreuna cu ETL (Extract, Transform and Load), cu relational reporting si cu data mining.


Ce este OLAP?


Principalele caracteristici ale OLAP sunt: operarea cu modele de date multidimensionale (spre deosebire de modelul relational), efectuarea de interogari analitice complexe ad-hoc si viteza mare de procesare. S-a sugerat din acest motiv si ca OLAP sa fie numit mai degraba FASMI (Fast Analysis of Shared Multidimensional Information), prin prisma atributelor sale.


OLAP copiaza bazele de date relationale si le restructureaza in date dimensionale. Interogarile se fac apoi pe acestea. Rezultatul, in cazul unor procese complexe, s-a dovedit a fi de pana la 1000 de ori mai rapid decat lucrul cu baze de date relationale. Structura OLAP creata din datele operationale se numeste cub OLAP. Acesta este format dintr-o schema stea (star schema) de tabele. Aceasta reprezinta cel mai simplu sistem de data warehouse, cu un singur „fact table“, continand o cheie primara, cu un segment pentru fiecare dimensiune si cu coloane suplimentare, numerice.


In cubul OLAP de fact table sunt legate numeroase tabele dimensionale. Acestea indica modul in care pot fi analizate diferitele agregari ale datelor. Numarul agregarilor este determinat de posibilitatile de ierarhizare ale datelor initiale. Calcularea agregarilor si datele de baza, impreuna, formeaza cubul OLAP, care contine toate raspunsurile pentru toate interogarile potentiale ale datelor initiale. Este asadar o abordare proactiva a unei actiuni, cosiderate pana acum, prin excelenta reactiva.


Tipologizare


Trecand dincolo de aceste caracteristici generale distingem trei tipuri de OLAP: Multidimensional (MOLAP), Relational (ROLAP) si Hibrid (HOLAP). Primul este modelul clasic. Cel mai adesea este aplicat informatiilor din data warehouse, stocate in „facts tables”. MOLAP modeleaza aceste date intr-o matrice multi-dimensionala, mai degraba decat intr-un tabel cu inregistrari si coloane. Datorita posibilitatii de interogare a matricelor dupa referinte fixe aceste procese sunt foarte rapide, sacrificand insa spatiul de stocare si scalabilitatea matricei multidimensionale.


ROLAP este modelul relational, asadar bidimensional. Stocheaza datele in tabele relationale si creeaza apoi alte tabele pentru agregari. Este mai lent decat MOLAP, dar are nevoie de mai putin spatiu si poate fi scalat. HOLAP este o incrucisare intre celelalte doua modele. Datele sunt stocate in tabele, iar agregarile speculative sunt pastrate sub forma de matrice multi-dimensionale.


MOLAP este folosit mai mult in general pentru cantitati mai reduse de date initiale. Este mai rapid in agregarea datelor si in interogari, dar creeaza cantitati enorme de date speculative si nu poate fi scalat. ROLAP dimpotriva poate fi cu usurinta redimensionat dar este mai lent in ceea ce priveste procesele de preprocesare si de interogare. HOLAP ca orice hibrid se afla undeva la mijloc, nu exceleaza nici ca viteza nici ca scalabilitate, dar le ofera pe amandoua in parametrii destul de buni.


Piata de OLAP



Parerea ta conteaza:

(0/5, 0 voturi)

Lasa un comentariu



trimite