Revista si suplimente
MarketWatch
Inapoi Inainte

Enterprise search, firul Ariadnei īn potopul de informaţii

25 Septembrie 2008



Informatizarea are şi punctele sale slabe – volumul informaţiilor cumulate în cadrul organizaţiilor creşte exponenţial odată cu evoluţia business-ului. Iar decelarea informaţiilor cu adevărat importante şi accesarea lor reprezintă o problemă delicată pe care nu multe companii au rezolvat-o cu brio. Demersul este laborios, dar nu imposibil spun specialişti, care susţin că rezultatul consistă într-o creştere a performanţei la nivelul întregii organizaţii.


La 10 ani de la lansarea oficială pe piaţă (7 septembrie 1998), pentru foarte multă lume a căuta o informaţie a ajuns sinonim cu a accesa Google. Un automatism firesc în era Internetului, în care motorul de căutare creat de Sergei Brin şi Larry Page şi-a dobândit relativ rapid statutul de lider incontestabil. Cu foarte puţini pretendenţi la titlu. (Cota pe piaţa motoarelor de căutare a Google la nivelul lui iunie 2008 era de 86%, cu mult înaintea Yahoo şi Microsoft).
Unul dintre secretele deceniului de succes înregistrat de Google a fost inovarea continuă şi extinderea spre zone mai mult sau mai puţin adiacente pro-iectului de început (cum ar fi lansarea aplicaţiilor Google Documents, Google Maps, Google Earth, Android şi recentul browser Chrome sau achiziţiile DoubleClick şi YouTube). Dar cum Google înseamnă în primul rând căutare, gigantul nu a ratat oportunitatea de a intra şi pe piaţa de desktop search. Unde însă nu a reuşit să obţină acelaşi succes pe care l-a înregistrat în căutarea on-line. Motivele – existau deja destui concurenţi pe piaţă, cu state vechi în domeniu, iar unii foarte greu de învins, cum este cazul sistemelor de căutare native din sistemele de operare Windows sau Mac OS. (Concurenţa nu se rezumă doar la atât, mai există Yahoo, Blinkx, Copernic etc.)


Piaţa de desktop search nu trebuie privită ca un domeniu minor. Potrivit celor mai citate statistici, circa 80% din datele companiilor se află stocate, în formă preponderent nestructurată, în calculatoarele angajaţilor respectivelor companii, în fişiere şi directoare create în reţea, pe scurt într-o multitudine de locaţii în care nu ar trebui să se afle (adică nu în baze de date dedicate). Totodată, specialiştii de la Radicati Group susţin că 45% din informaţiile critice pentru bunul mers al multor afaceri se află în mail-uri şi documentele ataşate acestora. Iar pentru a complica şi mai mult situaţia, foarte multe companii se află în situaţia în care deţin date importante, structurate sau nestructurate, în formate pe care nu le mai pot accesa rapid sau chiar deloc. În atari condiţii, nu este de mirare că studiile indică faptul că un manager alocă în medie 50% din timpul său de lucru managementului datelor cu care lucrează. Iar un alt studiu demonstrează faptul ca un angajat consumă, în medie, săptămânal, între 3 şi 5 ore căutând diverse informaţii.


Pentru astfel de manageri şi angajaţi, o soluţie de tipul desktop search este un instrument de lucru mai mult decât necesar. Dar nu suficient...


Scenarii de haos
Statisticile citate pot fi catalogate uşor drept catastrofice. Iată însă un scenariu perfect viabil şi în România: compania X înregistrează creşteri anuale de peste 50% ale business-ului (caz care se regăseşte încă frecvent pe piaţa românească) şi se extinde rapid teritorial şi ca domeniu de activitate prin achiziţia a unor competitori mai mici, transformaţi în filiale. La rândul ei, devenită un jucător cu o cotă de piaţă acceptabilă, compania X este achiziţionată de multinaţionala Y care doreşte să-şi facă intrarea pe piaţa locală. Din punctul de vedere al departamentului IT al noii companii XY problema începe să fie dstul de delicată – implementarea standardelor şi politicilor impuse de multinaţională este dificilă într-un mediu de lucru eterogen, cu multe sisteme informatice „legacy“ (pe care compania românească nu a apucat să le integreze într-un sistem unitar, fiind prea preocupată de dezvoltare şi extindere, şi nu de consolidare), rulând diferite tehnologii şi având informaţiile stocate în varii moduri şi locaţii. În atari condiţii, „pretenţiile“ multinaţionalei ca un manager să poată accesa anumite tipuri de informaţii în timp util par utopice.


O piaţă cu o creştere considerabilă
Nici Google, nici Yahoo, nici Copernic şi nici alţi jucători din zona desktop search nu ar putea satisface o asemenea cerere în condiţiile schiţate anterior. Motivul este simplu: nu mai este vorba de căutare pe Internet şi nici de desktop search, ci de o piaţă mult mai „pretenţioasă“, cea a tehnologiilor de enterprise search, tehnologii de căutare de informaţii în sistemele informatice organizaţionale.
Piaţă pe care analiştii Gartner o cotează, într-o abordare generală, ca înregistrând o creştere substanţială. Astfel, conform studiului „Dataquest Insight: Forecast for Information Access With Search Technology in the Enterprise, 2006-2011“, valoare pieţei de „Information access technology“ (concept introdus în ultimii ani de Gartner pentru a defini un domeniu mult mai larg decât „enterprise search“) va evolua astfel: 2007 – 728.2 milioane de dolari; 2008 – 815,5; 2009 – 913,4; 2010 – 1.004,8 şi în 2011 – 1.105,2 milioane de dolari.
Conform sursei citate, conceptul „Information access“ acoperă o arie mai mare de tehnologii, care include enterprise search, clasificarea de conţinut, clustering, crearea şi managementul taxonomiilor, tehnologii analitice de conţinut etc. Un concept vast şi complex, inaccesibil încă multor companii.


Paşii spre un sistem de date omogen
Există însă şi o cale de mijloc, accesibilă firmelor cu nevoi mai restrânse şi mai puţine capabilităţi tehnologice. În viziunea Association for Information and Image Management. (AIIM este o comunitate internaţională de specialişti în domeniul organizării informaţiei, cu o vechime de 65 de ani), soluţia este un alt concept, mai pragmatic, intitulat „Information Oragnization & Access“. IOA este o strategie de management al conţinutului care adresează fundamentul structurii informaţionale. În termeni practici, IOA postulează că, pentru ca informaţia deţinută de o companie să fie utilă, ea trebuie să poată fi identificată rapid, să permită accesări repetate şi să poată fi localizată facil.
Iar pentru a realiza acest lucru este nevoie însă de parcurgerea unei succesiuni de paşi/etape. Primul pas, şi cel mai natural, este acela de a stabili de ce tip de informaţie este nevoie pentru a răspunde obiectivelor de business şi cine sunt utilizatorii acestui tip de date. Întrebări care sunt frecvent ignorate la startarea unui proiect de acest tip. Dacă nu există destule argumente pentru construi o schemă de clasificare a informaţiilor, un sistem de metadate şi o taxonomie la nivelul întregii companii, demersul nu merită demarat pentru că este prea costisitor pentru a se justifica.


În cazul în care necesitatea este decelată, aceasta trebuie susţinută
printr-un business case solid şi o echipă de proiect care să poată susţine un proiect de asemenea amploare.
Următoarele etape sunt cele care se ocupă de organizarea efectivă a informaţiilor, respectiv a conţinutului, astfel încât să poată fi utilizat eficient în procesele de business. Prima dintre aceste etape este cea de a identifica unde se află informaţiile de care este nevoie – staţii de lucru individuale, laptop-uri, platforme colaborative, servere de lucru în reţea, PDA-uri etc. Este o operaţiune dificilă, dar care trebuie realizată mai ales cu aportul user-ilor. Implicarea acestora este esenţială, pentru că ei cunosc cel mai bine problemele cu care se confruntă în accesarea acelor date. Totodată, fără înţelegerea motivului pentru care aceste date sunt accesate, nu se poate construi o structură de date coerentă.
După ce se realizează această etapă se impune identificarea tipului de conţinut şi realizarea unui inventar al tuturor tipurilor de date considerate importante pentru procesele de business. Se pot astfel elimina datele redundante, cele „expirate“ sau neimportante, se pot face actualizări. Şi în acest, utilizatorii şi autorii acestor informaţii sunt principalii actori, ei fiind aceia care definesc utilitatea sau inutilitatea unui tip de informaţie. Odată parcurs acest traseu, se poate trece la crearea grupurilor de informaţii, care pot fi asociate (cum ar fi grupul – oferte, contracte, facturi etc.). Atributele acestor grupuri de informaţii sunt capturate într-un sistem de metadate, cu ajutorul cărora se poate crea o listă de inventar. (Crearea sistemului de metadate este utilă în identificarea, structurarea sau gestionarea datelor rezultate în procesul de business, însă acesta trebuie proiectat riguros pentru a nu consuma inutil din resurse – un sistem laborios, dezvoltat inutil cu prea multe atribute, consumă timp şi bani.) La finalizarea acestei etape se poate trece la migrarea tipurilor de date considerate relevante într-un nou mediu, consolidat, care să ofere acces pe baza unei structuri coerente.


Proba practică
Etapa finală a acestei succesiuni de paşi constă în proba practică – accesarea informaţiei. Şi aici există însă câteva elemente importante, care nu trebuie neglijate. Cum ar fi întrebările: Cum se realizează accesarea? Cu instrumente – de căutare, prin navigare sau folosind o metodă mixtă? Cum se realizează căutarea (prin cuvânt-cheie, operatori booleeni etc.)? Cine are dreptul să acceseze anumite tipuri de informaţie? Iar lista poate continua, pentru că nevoile utilizatorilor informaţiei evoluează în timp, volumul informaţiilor creşte constant, apar noi tipuri de date, noi cerinţe de business... Deci procesul nu se încheie. Dar odată creată o structură de date şi metadate, sistemul poate fi manageriat mult mai uşor.


Radu Ghiţulescu



Parerea ta conteaza:

(0/5, 0 voturi)

Lasa un comentariu



trimite