Revista si suplimente
MarketWatch
Inapoi Inainte

Proiectul European CLARIN

16 Decembrie 2010






Rezumat

Printre proiectele europene în consorţiile cărora, în baza experienţei câştigate şi a instrumentelor şi serviciilor create, se regăseşte în prezent Institutul de Cercetări pentru Inteligenţă Artificială al Academiei Române – ICIA (cunoscut în proiectele europene ca RACAI) se numără şi proiectul CLARIN (http://www.clarin.eu). Acest articol prezintă pe scurt acest proiect şi activităţile în care este implicat Institutul de Cercetări pentru Inteligenţă Artificială al Academiei Române.

Cuvinte cheie: resurse lingvistice şi tehnologie, infrastructură pentru resurse lingvistice şi tehnologie; Virtual Language Observatory

Comunitatea de resurse lingvistice este caracterizată de faptul că specialiştii, ingineri şi specialişti în calculatoare, au o înţelegere profundă cu privire la toate aspectele legate de resursele lingvistice şi tehnologie, de exemplu, creare, arhivare, prelucrare şi servicii. Datorită naturii sale, această comunitate face parte din domeniul umanist, dar tehnologia prelucrării limbajului uman are legături puternice cu ştiinţa calculatoarelor şi obiectivele acestei iniţiative au multe în comun cu obiectivele comunităţii web-ul semantic. Ceea ce distinge comunitatea de resurse lingvistice de alte discipline umaniste este felul său de a privi la resurse, metodologiile şi tradiţiile sale. În timp ce alte ştiinţe umaniste lucrează pe conţinutul resurselor şi aplică instrumente specifice, adaptate la interesele lor de cercetare, comunitatea de resurse lingvistice este orientată pe conţinutul lingvistic, structuri, semantică formală etc.

Crearea şi utilizarea de resurse lingvistice şi dezvoltarea tehnologiei de prelucrare de limbaj adecvate este destul de costisitoare. Stabilirea unei reţele de abilităţi în a construi şi întreţine resurse şi instrumente este un proces consumator de timp şi costisitor, deoarece limbile sunt sisteme extrem de neliniare şi printre cele mai complicate pe care le-a creat natura. Limbile sunt rezultate unice ale proceselor de evoluţie şi codifică tezaurele culturale şi de identitate. Pierderea acestora înseamnă supunerea la riscul de pierdere a identităţii.

CLARIN (Common Language Resources and Technology Infrastructure) este un proiect care îşi propune să stabilească o infrastructură interoperabilă de cercetare a resurselor lingvistice şi tehnologii asociate. Prin aceasta se propune să se elimine fragmentarea curentă, oferindu-se o infrastructură de resurse lingvistice stabilă, persistentă şi accesibilă.

CLARIN se angajează să stabilească o infrastructură de cercetare integrată şi interoperabilă a resurselor lingvistice şi a tehnologiilor specifice. Acesta va conduce la evitarea fragmentării actuale, oferind o infrastructură stabilă, persistentă, accesibilă şi extensibilă şi care să permită, eHumanities prin:

• integrare: centre de resurse şi servicii sunt conectate prin intermediul tehnologiei Grid şi formează un domeniu practic integrat;
• interoperabilitate: resursele şi serviciile vor fi bazate pe tehnologii Semantic Web pentru a depăşi formatul, structura şi diferenţe terminologice;
• stabilitate: resursele şi serviciile sunt oferite cu un grad mare de disponibilizare;
• persistenţă: resursele şi serviciile sunt planificate să fie accesibile pentru mai mulţi ani, astfel încât cercetătorii să se bazeze pe ele;
• accesibilitate: resursele şi serviciile sunt accesibile prin intermediul web; diferitele metode de acces şi posibilităţile de formare oferite sunt adaptate la nevoile comunităţilor care le utilizează;
• extensibilitate: infrastructura este deschisă, astfel încât cu uşurinţă resursele şi servicii noi pot fi adăugate.

CLARIN (http://www.clarin.eu) (figura 1) oferă servicii pentru:

(1) comunităţi diferite de lingvişti, pentru a-şi optimiza modelele şi instrumentele în beneficiul tuturor celor care utilizează materialele;
(2) specialişti în ştiinţe umaniste, pentru a le facilita accesul la resursele lingvistice şi tehnologie;
(3) societăţi, pentru a micşora barierele la conţinut multicultural şi multilingv.



Parerea ta conteaza:

(0/5, 0 voturi)

Lasa un comentariu



trimite