Sunteți pe pagina 1din 10

Situaia lexicografiei romneti n context european

Elena TAMBA, Marius-Radu CLIM,


Ana CATAN-SPENCHIU, Mdlin PTRACU

Key-words: Romanian lexicography, digitalized_lexicography, lexicographic


corpus, linguistic_resources, e-lexicography

n lexicografia din ntreaga lume se observ un amplu proces de schimbare, de


modernizare a mijloacelor de redactare, de consultare etc., prin intermediul unor
demersuri interdisciplinare. i lexicografia romneasc este marcat de aceast
schimbare, creia nu i se poate opune, ci se ncearc s se gseasc o cale de
gestionare a ei. n acest sens, principalele elemente de schimbare care se pot remarca
sunt legate mai ales de crearea unor corpusuri de limb romn, adic colecii de
texte de diferite tipuri care s ajute la redactarea de dicionare sau corpusuri
lexicografice, a unor dicionare pe suport electronic, cu prezentare on-line sau nu.
Schimbarea este vizibil n modul de lucru pentru crearea lucrrilor
lexicografice. Astfel, i n lexicografia romneasc, ntr-un ritm mai mult sau mai
puin alert, se face trecerea de la dicionarele n format clasic, editate pe hrtie la
dicionarele redactate cu ajutorul unor programe speciale de scriere de dicionare.
n acest scop, i n Romnia s-au realizat n ultimii ani proiecte menite s
creeze resurse similare. Astfel, pentru realizarea unor corpusuri de limba romn,
s-au fcut unele demersuri pentru crearea unor corpusuri lexicografice, graie unor
iniiative private, care ofer accesul nelimitat la resursele dezvoltate (vezi
dexonline.ro1, care propune un corpus de cca 38 de dicionare aliniate la nivel de
intrare; vocabular.ro2, corpus de 15 dicionare aliniate la nivel de intrare; site-ul
editurii Litera, care ofer posibilitatea de consultare a unora dintre dicionarele pe
care le-a editat3 etc.), sau graie iniiativei unor instituii academice (proiecte de
informatizare a Dicionarului-tezaur al limbii romne), ns accesul la resursele
create prin aceste ultime proiecte este restricionat/limitat, n scop de cercetare (n
funcie de legislaia n vigoare privitoare la drepturile de autor), ceea ce conduce
spre ideea necesitii unor politici lingvistice coerente.

Institutul de Filologie Romn A. Philippide, Academia Romn, Filiala Iai.


Acest articol a fost realizat n cadrul proiectului CLRE. Corpus lexicografic romnesc esenial. 100
de dicionare de baz din Bibliografia DLR aliniate la nivel de intrare i la nivel de sens,
CNCS-UEFISCDI, cod TE_246/2010, 2010 2013 (nr. 55/2010).
1
http://dexonline.ro.
2
http://vocabular.ro.
3
http://nodex.litera.ro/cautare_dex/.

Philologica Jassyensia, Anul VIII, Nr. 2 (16), 2012, p. 259268

Elena TAMBA, Marius-Radu CLIM, Ana CATAN-SPENCHIU, Mdlin PTRACU

Dicionarul-tezaur al limbii romne reprezint cea mai important lucrare


lexicografic aprut sub egida Academiei Romne. A fost nceput acum 105 ani i a
aprut n dou serii: DA (19071944) i DLR (19652010); n 14 tomuri/37 volume,
totaliznd cca 18.000 pagini i mai mult de 175.000 intrri, cu tot cu variante;
elaborarea variantei electronice a nceput n 2007, n cadrul unui proiect, eDTLR, care
a primit finanare pn n 2010, dar care este nc n lucru. Proiectul eDTLR4
reprezint prima colaborarea naional ntre institute ale Academiei Romne i
faculti de la Universitatea Alexandru Ioan Cuza din Iai, pentru realizarea unui
demers de informatizare a unei lucrri lexicografice de asemenea dimensiuni5.
Acest proiect a beneficiat iniial de o finanare naional din partea CNMP, iar
ulterior, dup decembrie 2010, lucrndu-se la finalizarea site-ului eDTLR doar cu
ajutorul unor voluntari cercettori informaticieni i lexicografi. Proiectul menionat,
dup ncheierea sa, ar trebui, pe de o parte, s pun la dispoziia tuturor cunosctorilor
sau celor interesai de limba romn formatul electronic al Dicionarului Academiei,
pe suport electronic i, poate ulterior, n funcie de schimbarea politicii lingvistice
din Romnia, i on-line, n acces liber sau condiionat i, pe de alt parte, s pun la
dispoziia deocamdat doar a cercettorilor o arhiv electronic care s cuprind toate
textele din Bibliografia DLR.
Proiectul de informatizare a Dicionarului-tezaur a fost pregtit de o serie de
granturi anterioare6: Dicionarul limbii romne (DLR) n format electronic. Studii
privind achiziionarea, proiect finanat de CNCSIS, 20032005, Iai; Resurse
lingvistice n format electronic: Monumenta linguae Dacoromanorum. Biblia 1688.
Regum I, Regum II Ediie critic i corpus adnotat, proiect finanat de CNCSIS,
20062007, Iai; DLRI. Baz lexical informatizat. Derivate, proiect finanat de
CNCSIS, 20072008, Iai; CNR Corpus de referin al limbii romne pentru
constituirea de dicionare academice, proiect finanat de CNCSIS, 20072008,
Bucureti.
Aa cum artam i n alte studii7, varianta informatizat a Dicionarului
academic ar pune lexicografia fundamental pentru limba romn ntr-o situaie de
egalitate cu cea a limbilor care au deja dezvoltate astfel de resurse: Le Trsor de la
Langue Franaise Informatis (tlfi http://atilf.atilf.fr/); Diccionario de la lengua
espanola de la Real Academia Espagnola (drae http://buscon.rae.es/draeI/);
Tesoro della lingua italiana delle origini (tlio http://tlio.ovi.cnr.it/TLIO/index2.
4

Pentru o prezentare detaliat a proiectului eDTLR, vezi Dnil 2010a.


Echipa proiectului a fost coordonat de Facultatea de Informatic, Universitatea Alexandru Ioan
Cuza din Iai, prin prof. dr. Dan Cristea, i a inclus ca parteneri: Institutul de Lingvistic Iorgu Iordan
Al. Rosetti, Academia Romn, Bucureti; responsabil de proiect acad. Marius Sala (prin dr. Monica
Busuioc); Institutul de Filologie Romn A. Philippide, Academia Romn, Iai; responsabil de
proiect dr. Gabriela Haja; Institutul de Lingvistic i Istorie Literar Sextil Pucariu, Academia
Romn, Cluj-Napoca; responsabil de proiect dr. Rodica Marian; Institutul de Cercetri pentru
Inteligen Artificial, Academia Romn, Bucureti; responsabil de proiect acad. Dan Tufi; Institutul
de Informatic Teoretic, Academia Romn, Iai; responsabil de proiect acad. Horia Neculai
Teodorescu; Facultatea de Litere, Universitatea Alexandru Ioan Cuza din Iai; responsabil de proiect
dr. Eugen Munteanu.
6
Pentru o prezentare detaliat a proiectelor care au pregtit i susinut informatizarea
Dicionarului-tezaur al limbii romne, vezi Tamba Dnil et al. 2012: 1015.
7
Vezi Tamba Dnil et al. 2012: 1015.
5

260

Situaia lexicografiei romneti n context european

html); Deutsches Worterbuch der Grimm (dwb http://germazope.uni-trier.de/


Projects/DWB); Oxford English Dictionary (oed http://www.oed.com/) .a.
Proiectul eDLTR a condus i la ideea necesitii realizrii unui corpus lexicografic
romnesc8 CLRE. Corpus lexicografic romnesc esenial. 100 de dicionare din
bibliografia DLR aliniate la nivel de intrare i la nivel de sens, care este finanat de
CNCS-UEFISCDI pentru perioada 20102013 i care se desfoar tot la Institutul
de Filologie Romn A. Philippide din Iai.
Cu ajutorul unei echipe formate din doar 4 cercettori (3 lexicografi Elena
Tamba, Marius-Radu Clim i Ana-Veronica Catan-Spenchiu i un informatician
Marius Rschip) i cu aportul unui alt informatician voluntar Mdlin Ptracu ,
proiectul i propune s realizeze o baz de date care s cuprind dicionarele eseniale
din Bibliografia DLR, aliniate la nivel de intrare i parial la nivel de sens; s
construiasc un mediu de programe care s permit consultarea interactiv a acestui
corpus i care s se constituie ntr-un cadru modern de lucru i cercetare
lexicografic, uor adaptabil la o diversitate de obiective; s realizeze o list de
cuvinte cvasi-exhaustiv, pentru limba romn, pornind de la corpusul aliniat.
Dicionarele alese au fost incluse n trei categorii: 1. dicionare generale (de tipul:
DA = Dicionarul limbii romne, tom I-II, Tipografia ziarului Universul,
Bucureti, Imprimeria Naional, 1907-1944; DLR = Dicionarul limbii romne,
serie nou, tom VI-XIV, Bucureti, Editura Academiei, 19652010); 2. dicionare
auxiliare, care sunt strns legate de redactarea Dicionarului-tezaur (de tipul:
Alexandru Ciornescu, Dicionarul etimologic al limbii romne, ediie ngrijit i
traducere din limba spaniol de Tudora Sandru-Mehedini i Magdalena Popescu
Marin, Bucureti, Editura Saeculum I. O., 2002; Dicionarul ortografic, ortoepic i
morfologic al limbii romne, ediia a II-a revzut i adugit, Bucureti, Univers
Enciclopedic, 2005 .a.); 3. dicionare speciale, enciclopedice ori dicionare
speciale, alese dup criteriul importanei lor pentru perspectiva diacronic asupra
limbii (de tipul: Dicionar enciclopedic. [Vol.] I: AC (1993), [vol.] II: DG (1996),
[vol.] III: HK (2000), [vol.] IV: LN (2001), [vol. V]: OQ (2004). [vol.] VI: RS
(2006). [vol.] VII: TZ (2009), Bucureti, Editura Enciclopedic; Lexiconul tehnic
romn, I .u., elaborare nou, Bucureti, Editura Tehnic, 1957 . u.) 9.
Etapele de lucru n realizarea acestui corpus lexicografic presupun scanarea i
OCR-izarea10 dicionarelor vizate, introducerea lor ntr-o baz de date, parsarea11
textului la nivel de intrare i, parial, la nivel de sens, validarea/corectarea parsrii cu
ajutorul unei interfee on-line, precum i validarea alinierii ntre textul
Dicionarului-tezaur al limbii romne (n format electronic, rezultat al proiectului
eDTLR) i dicionarele de referin din Bibliografia DLR.
n faza de validare a rezultatelor, lexicografii verific corectitudinea decuprii
intrrilor i a formei cuvntului-titlu, n interfaa de lucru creat special de
specialitii informaticieni:

Pentru o prezentare detaliat a acestor aspecte, vezi Dnil 2010b.


Pentru o prezentare detaliat, vezi Dnil 2010b: 4647.
10
Convertirea din format imagine n format text.
11
Identificarea automat a intrrilor din dicionarele scanate i OCR-izate anterior.
9

261

Elena TAMBA, Marius-Radu CLIM, Ana CATAN-SPENCHIU, Mdlin PTRACU

Practic, din formatul original, scanat al paginii de dicionar se ajunge la


formatul XML, dup cum se poate vedea n imaginea de mai jos

apoi, prin intermediul interfeei de validare, se ajunge la pagina n care sunt


recunoscute intrrile i sunt verificate de lexicografi, care tot n aceast faz,
introduc manual cuvintele-titlu n cazul dicionarelor n alfabet chirilic i al celor n
alfabet de tranziie. Aceast operaiune este necesar din cauza erorilor de
262

Situaia lexicografiei romneti n context european

recunoatere automat a caracterelor, ntruct nu exist nc un program de


OCR-izare pentru texte vechi romneti. Dat fiind faptul c grafia chirilic
romneasc este destul de diferit pentru texte din epoci i surse variate, este practic
imposibil, pentru moment, s se fac recunoaterea automat a unei scrieri vechi
romneti din format imagine n format text; de aceea s-a optat pentru o validare
manual fcut de lexicografi, care, practic, au ataat o etichet cu transcrierea n
alfabet latin a cuvintelor-titlu. n plus, dicionarele vechi vor fi aliniate la nivel de
imagine i nu de text, fiind afiat n format imagine doar poriunea aferent
cuvntului cutat.

Ultima etap din acest proiect vizeaz alinierea la nivel de intrare i, parial, la nivel
de sens a informaiei din dicionarele vizate.
La sfritul proiectului, ne dorim s oferim utilizatorului posibilitatea de a
vizualiza, pentru un anumit cuvnt, toate intrrile corespunztoare din cele 100 de
dicionare, ntr-o structur de tipul celei prezentate mai jos.

263

Elena TAMBA, Marius-Radu CLIM, Ana CATAN-SPENCHIU, Mdlin PTRACU

De asemenea, pentru alinierea parial la nivel de sens, corelaiile vor fi fcute n


funcie de definiiile din DLR, folosindu-se astfel rezultatele din proiectul eDTLR.
n lexicografia internaional exist deja astfel de corpusuri, care faciliteaz
mult cercetarea att n domeniul studiului limbii/limbilor, ct i n cel al informaticii
aplicate, al prelucrrii limbajului natural.
Pentru limba francez poate fi consultat, n acces liber, o colecie de
dicionare informatizate franceze, din secolul al XVI-lea pn n secolul al XX-lea
Le rayon des dictionnaires (http://www.atilf.fr/), care permite cutarea unui cuvnt
n patru dicionare vechi, n ase ediii ale dicionarului Academiei Franceze i n
TLFi (Trsor de la Langue Franaise informatis http://atilf.atilf.fr/), cu afiarea
cuvntului-titlu cutat, cu ntreaga intrare n toate dicionarele care l conin,
cronologic, i cu posibilitatea vizualizrii ntregii pagini de pe care a fost extras
articolul respectiv, n cazul n care se opteaz pentru o astfel de cerin. n imaginea
de mai jos se poate observa rezultatul pentru cutarea lemei dictionnaire.

Pentru limba spaniol se poate consulta o baz de date Nuevo tesoro


lexicogrfico de la lengua espaola (http://buscon.rae.es/ntlle/SrvltGUILoginNtlle)
care cuprinde versiunile facsimilate pentru cca 70 de dicionare de limb spaniol,
din secolul al XV-lea pn n secolul al XX-lea, proiect realizat de Real Academia
Espagnola.
Practic, un cuvnt poate fi cutat i va fi afiat o list complet cu toate
apariiile sale n dicionarele aflate n baza de date, iar apoi, pentru a se vizualiza
articolul cutat ntr-un anumit dicionar, se acceseaz doar acel dicionar i este
afiat ntreaga pagin n care este prezent articolul vizat cuvntul diccionario, n
cazul de fa , dup cum se poate vedea i n captura de ecran urmtoare:

264

Situaia lexicografiei romneti n context european

Cei interesai pot consulta o reea de dicionare de limba german, creat la


Universitatea Trier din Germania Das Wrterbuchnetz (http://germazope.
uni-trier.de/Projects/WBB/). Interfaa de consultare permite cutarea unui anumit
cuvnt, care apare cu toate ocurenele sale n cele 24 de dicionare aliniate, ulterior
putndu-se opta pentru vizualizarea articolului dintr-un anumit dicionar, cu
posibilitatea de a selecta i accesarea pdf care cuprinde articolul respectiv. Interfaa
de consultare permite, de asemenea, i alte opiuni de cutare, dup cum se poate
observa i n printscreen-ul urmtor:

265

Elena TAMBA, Marius-Radu CLIM, Ana CATAN-SPENCHIU, Mdlin PTRACU

Practic, exemplele de corpusuri lexicografice prezentate supra reprezint un


argument n plus pentru realizarea Corpusului lexicografic romnesc esenial,
precum i o dovad a posibilitilor multiple de utilizare a unor astfel de resurse
lingvistice electronice.


Pentru a vedea unde se situeaz lexicografia romneasc n context euopean,
trebuie spus c marile lucrri lexicografice se realizeaz:
fie sub egida Academiilor din anumite ri (a se vedea DWB Deutsches
Wrterbuch der Grimm, care se editeaz sub patronajul Academiei Germane sau
DLR Dicionarul limbii romne, redactat n institute care aparin Academiei
romne);
fie n institute special create (vezi, pentru limba francez, LUnit mixte de
recherche ATILF Analyse et Traitement Informatique de la Langue Franaise
http://www.atilf.fr/, organizat n 2001, sau, pentru limba sloven Trojina, Institute
for Applied Slovene Studies www.trojina.si/, creat n 2004).
Tendinele n lexicografia european actual pot fi grupate astfel:
continuarea editrii (cu termen de finalizare de 10-15 ani) a unor ediii
clasice (vezi DWB Deutsches Wrterbuch von Jacob Grimm und Wilhelm
Grimm);
realizarea (n paralel) a unor dicionare (on-line), plecnd de la corpusuri de
texte din ce n ce mai mari i cu instrumente variate (cu ajutorul unor programe de
extragere de exemple12);
realizarea de corpusuri lexicografice (vezi supra, corpusurile de dicionare
prezentate);
utilizarea sistemelor de scriere de dicionar (DWS)13, ceea ce permite mult
mai uor alinierea ulterioar a diverselor lucrri lexicografice. n acest ultim caz este
necesar i un program de colaborare ntre diverse instituii cu profil lexicografic,
editori etc.
Prin raportare la aceste tendine n lexicografia european, n lexicografia
romneasc se observ:
continuarea editrii (cu termen neprecizat) a unor ediii clasice (vezi DLR,
reeditare DEX etc.);
realizarea unor corpusuri de texte pentru limba romn (proces n curs de
realizare, deocamdat, nesistematic);
realizarea de corpusuri lexicografice (n lucru);
utilizarea sistemelor de scriere de dicionar (n lucru).
Concluzii
Din informaiile prezentate n acest articol se poate observa c lexicografia
romneasc se afl n plin proces de adaptare la schimbrile pe care modernizarea
12

Pentru o prezentare a unor aspecte privitoare la Sketch Engine sistem de cutare n corpus,
utilizabil ca instrument de lucru pentru lexicografi, vezi Dnil et al. 2011: 194195.
13
Pentru o analiz a sistemelor de scriere de dicionar, vezi Dnil et al. 2011: 195196.

266

Situaia lexicografiei romneti n context european

instrumentelor de lucru n lexicografia european/mondial le presupune. Astfel, i


n lexicografia romneasc se observ tendina de a edita n continuare lucrri
lexicografice n format clasic (pe hrtie), care este completat de realizarea unor
corpusuri de texte de limb romn, a unor corpusuri lexicografice sau utilizarea
(nc n faz incipient) a unor sisteme de scriere de dicionare, pentru a eficientiza
munca lexicografilor.
Astfel, prin toate aceste demersuri, lexicografia romneasc se aliniaz la
tendinele existente n lexicografia european.

Bibliografie
OED =
DRAE

Oxford English Dictionary (http://www.oed.com/).


= Diccionario de la lengua espanola de la Real Academia Espagnola
(http://buscon.rae.es/draeI/).
DWB = Deutsches Wrterbuch der Grimm (http://germazope.uni-trier.de/Projects/DWB).
TLFI = Le Trsor de la Langue Franaise Informatis (http://atilf.atilf.fr/).
TLIO = Tesoro della lingua italiana delle origini (http://tlio.ovi.cnr.it/TLIO/index2.html).


Atkins, Rundell 2008: B.T.S. Atkins, M. Rundell, The Oxford Guide to Practical
Lexicography, Oxford, Oxford University Press.
Clim et al. 2008: Marius Clim, Elena Dnil, Gabriela Haja, Premise ale informatizrii
cercetrii lexicografice academice romneti, n volumul Limba romn. Dinamica
limbii, dinamica interpretrii, Editura Universitii din Bucureti, p. 585591.
Cristea et al. 2007: Dan Cristea, Marius Rschip, Corina Forscu, Gabriela Haja, Cristina
Florescu, Bogdan Aldea, Elena Dnil, The Digital Form of the Thesaurus Dictionary
of the Romanian Language, n vol. Advances in Spoken Language Technology
(editors Corneliu Burileanu, Horia-Nicolai Teodorescu), Bucureti, Editura
Academiei Romne, p. 195206.
Dnil 2010a: Elena Dnil, eDTLR base de donnes et instrument pour la recherche
lexicographique roumaine, n Philologica Jassyensia, an VI, nr. 1 (11), 2010, p. 3746.
Dnil 2010b: Elena Dnil, Despre necesitatea realizrii unui corpus lexicografic romnesc
esenial, n Philologica Jassyensia, an VI, nr. 2 (12), 2010, p. 4150.
Dnil et al. 2011: Elena Dnil, Marius-Radu Clim, Ana Catan-Spenchiu, Towards a
Romanian Lexicographic Corpus, n Philologica Jassyensia, an VII, nr. 2 (14),
2011, p. 191198.
Haja et al. 2005: Gabriela Haja, Elena Dnil, Corina Forscu, Bogdan-Mihai Aldea,
Dicionarul limbii romne (DLR) n format electronic. Studii privind achiziionarea,
Iai, Editura Alfa (i n format electronic: www.consilr.info.uaic.ro).
Tamba Dnil et al. 2012: Elena Tamba Dnil, Marius-Radu Clim, Mdlin Ptracu, Ana
Catan-Spenchiu, The Evolution of the Romanian Digitalized Lexicography. The Essential
Romanian Lexicographic Corpus, in Proceedings of the 15 th EURALEX International
Congress, 711 august 2012, Oslo, eds. Ruth Vatvedt Fjeld, Julie Matilde Torjusen, Press
Reprosentrales, UiO, p. 225, in extenso (pe suport electronic), p. 10141017 (on-line
http://www.euralex.org/proceedings-toc/euralex_2012/).

267

Elena TAMBA, Marius-Radu CLIM, Ana CATAN-SPENCHIU, Mdlin PTRACU

The Status of the Romanian Lexicography in the European Context


The evolution of the new Romanian lexicography based on the web resources has
changed the view concerning the dictionaries and how to create them. The Romanian
lexicography is also on a high process of modernisation and computerisation. The project we
presented here, called CLRE (ERLC. Essential Romanian lexicographic corpus. 100
dictionaries from DLR bibliography aligned at entry and, partially, at meaning level) is one
of the necessary steps for Romanian lexicography to adapt itself to the digital world.
The present project has as purpose creating a Romanian lexicographic corpus, which
will contain 100 dictionaries (from the 16th century to present day) aligned at entry and,
partially, at meaning level. This lexicographic corpus will have the potential of being an
useful database for linguistic research, in the country or abroad, becoming an indispensable
instrument for future researches, for implementing and developing the Romanian
lexicographical research according to international standards.

268

S-ar putea să vă placă și