Sunteți pe pagina 1din 16

Generare de concordanţe

pentru dicţionarul limbajului


poetic eminescian

Lect. dr. Mihaela Brut


Prof. dr. Dumitru Irimia
Prep. drd. Oana Panaite
Contextul problemei
Dicţionarul limbajului poetic
eminescian:
⇒ Proiect iniţiat în anii ‘90:
‰ Concordanţele poeziilor
eminesciene
⇒ modelul din lexicografia
poetică europeană
‰ Semne şi sensuri poetice
⇒ modelul: Dictionnaire des
Symboles, Jean Chevalier, Alain
Gheerbrant

2
Concordanţe eminesciene
9 Concordanţele poeziilor
antume
9 Concordanţele poeziilor
postume
‰ ... Concordanţele din teatru,
proza literară, publicistică,
critică literară/teatrală
/muzicală, corespondenţă,
însemnări manuscrise
‰ În alte literaturi: G.Leopardi,
E.Montale, G.Pascoli,
D’Annuzio, Ungaretti; Blake,
Byron, Yeats; F.G.Lorca;
E. Dickinson

3
Instrumente utilizate
‰CONCORD - Sistem de
lematizare automată şi
generare a concordanţelor,
Sanda CHERATA, Univ.
“Babeş-Bolyai” Cluj Napoca
‰SILEX – Sistem lexical
informatizat, Teodor VUŞCAN,
Univ. “Babeş-Bolyai”
Cluj Napoca

4
Funcţionare
‰Poezia eminesciană
‰Ed. Perpessicius, 1952
‰Ed. D.Murăraşu, 1970-1972
‰Transformată într-o bază de
date ME.POE

‰Lematizată, fiecare poezie


separat,
lemele analizate sintactic

5
Funcţionare
‰ O primă generare a
concordanţelor, conform
analizei sintactice automatizate
‰ unele leme nu sunt recunoscute
de analizor
‰ Corectură pe hârtie
‰ Operarea corecturilor utilizând
CONCORD
‰ Generarea concordanţelor
‰ Re-corectare sau
Pregătirea pentru tipărire

6
CONCORD
‰Operare corecturi

7
CONCORD
‰Funcţionalităţi

8
CONCORD
Generare Concordanţe
‰ Integrare/Volum
‰ Integrare operă
⇒ generate urm. fişiere:
‰ Me_C.tlm → concordanţe poezie
‰ Me_ct_C.txt → lemele ordonate pe
clase lexico-gramaticale;
‰ Me_fr_C.txt
→ lemele ordonate descrescător
după frecvenţa de utilizare;
‰ Me_Lm_C.txt
→ lemele ordonate alfabetic; 9
CONCORD
‰Generare Concordanţe

‰Folosite codificări pentru


caractere româneşti şi
pentru marcarea lemelor
‰Lemele ne-recunoscute
gramatical → marcate cu ??

10
Procesare WORD
‰ Codificările utilizate în fişierele
anterioare sunt de-codate
utilizând două macrocomenzi:
‰ ConvConc
→ pt. fişierul Me_C.tlm
→ se obţin concordanţele
întregului volum în format doc
‰ Conv_Car_Conc
→ Pentru fiecare dintre fişierele
Me_ct_C.txt, Me_fr_C.txt,
Me_Lm_C.txt

11
Concordanţe

12
Frecvenţe

13
Re-utilizare
‰ Poezia eminesciană – format
XML
‰ Sistem de lematizare cu
marcatori XML
‰ Sistem de generare a
concordanţelor utilizând
procesare DOM
‰ Instrumentele existente impun
restricţii legate de formatul
fişierelor ce vor fi procesate

14
Sisteme de generare a
concordanţelor
‰AntConc
‰http://www.antlab.sci.wased
a.ac.jp/antconc_index.html
‰Waseda University, Japonia
‰Wordsmith, Mike Scott,
Oxford University
‰http://www.oup.com/elt/cat
alogue/isbn/6890?cc=gb

15
Sisteme de generare a
concordanţelor
‰Concordance, R.J.C. Watt of
Dundee University
‰http://www.dundee.ac.uk/en
glish/wics/wics.htm
‰Monoconc, Athelstan
‰http://www.athel.com/mono.h
tml#monopro
‰etc.
‰Selectare, integrarea unui
analizor gramatical,
reproiectare sistem de
reprezentare a datelor...
16

S-ar putea să vă placă și