Sunteți pe pagina 1din 10

133

EMOII N CUVINTE: ELABORAREA RESURSEI MULTILINGVE


VICTORIA BOBICEV, VICTORIA MAXIM, TATIANA PRODAN,
NATALIA BURCIU, VICTORIA ANGHELU
Universitatea Tehnic a Moldovei, Chiinu, Moldova

vika@rol.md, maxivica@yahoo.com, tatiana.ursulenco@gmail.com,
natusicb@yahoo.com, lazu_vic@yahoo.com
Rezumat
n lucrarea dat este descris procesul de creare a WordNet-Affect pentru
limbile romn i rus. WordNet-Affect reprezint o resurs lexical elaborat
n baza WordNet-ului englez ce conine informaii despre emoiile pe care le
transmit cuvintele. WordNet-Affect este organizat n ase emoii de baz:
anger, disgust, fear, joy, sadness, surprise.
Noi am tradus cuvintele din WordNet-Affect n limbile romn i rus i am
creat o resurs lexical aliniat englez - romn - rus. Resursa dat este
accesibil gratuit n scopuri de cercetare.
1. Introducere
Creterea spectaculoas a tehnologiilor Web 2.0 permite fiecrui utilizator s participe
activ la crearea de coninut web (bloguri, reele sociale, chat-uri). Volumul de texte cu
coninut emoional bogat crete n progresie geometric. Acest lucru face ca analiza
subiectiv a textelor s fie de actualitate n mod special.
Pn n prezent, analiza sentimentelor i studiile asupra afectelor cuvintelor s-au
concentrat pe limba englez. Un exemplu este sarcina SemEval-2007 de clasificare a
textelor afective (Liu et al., 2003). De asemenea, cele mai multe resurse lexicale au fost
create pentru limba englez. De exemplu, SentiWordNet este o resurs lexical pentru
extragerea opiniilor care atribuie fiecrui synset al Wordnet-ului trei marcaje ale
sentimentelor: pozitivitate, negativitate, obiectivitate (Esuli, Sebastiani, 2006).
Recent, cea mai mare cretere a utilizrii Internetului a fost nregistrat pentru vorbitorii
de limbi diferite de limba englez: n anii 2000-2009, pentru limbile diferite de englez,
creterea a depit 690% n comparaie cu 237% a creterii pentru limba englez
1
.
n consecin, cantitatea informaiei textuale scrise n alte limbi dect engleza crete
rapid ce sporete cererea pentru instrumentele de analiz automat a textelor i pentru
resursele lexicale pentru alte limbi, diferite de englez. Elaborarea instrumentelor a
progresat pentru limbile vest-europene (francez, german) i asiatice (japonez,
chinez, arab) (Edmonds, 2004), se simte nevoia de astfel de resurse i pentru limbile
est-europene. Pentru a umple acest gol, am elaborat o resurs lexical, n baza
WordNet-Affect, prin traducerea n romn i rus, redactarea synset-urilor traduse i
alinierea acestora la sursa englez.

1
http://www.internetworldstats.com/stats7.htm

VICTORIA BOBICEV, VICTORIA MAXIM, TATIANA PRODAN,
NATALIA BURCIU, VICTORIA ANGHELU
134
2. WordNet-Affect
WordNet-Affect
2
este o resurs lexical ce conine informaii despre emoiile pe care le
transmit cuvintele. n comparaie cu WordNet-ul complet, WordNet-Affect este o
resurs lexical mic, dar valoroas pentru adnotarea sa afectiv.
a#01943022 awed awestruck awestricken in_awe_of
Figura 1: Un synset din WordNet-Affect.
WordNet-Affect (Strapparava, Valitutti, 2004) a fost creat pornind de la WordNet
DOMAINS (Magnini, Cavaglia, 2002). WordNet-Affect produce o ierarhie
suplimentar a etichetelor domeniilor afective, independent de ierarhia domeniilor, cu
care sunt adnotate synset-urile ce reprezint concepte afective. Cuvintele afective sunt
considerate a fi cuvintele ce au conotaie emoional (Ortony, 1987). Exist cuvinte ce
nu descriu direct unele emoii (de exemplu, bucurie, tristee sau fric), dar, de asemenea,
sunt legate de emoii precum cuvintele ce descriu strile mintale, strile fizice sau
trupeti, trsturile de personalitate, comportamente, atitudini i sentimente (cum ar fi
plcere sau durere).
Tabel 1: Seturile de date ale cuvintelor afective.
Clasele #synset-uri %synset-uri #cuvinte %cuvinte
anger 128 21.0 318 20.7
disgust 20 3.3 72 4.7
fear 83 13.5 208 13.5
joy 228 37.2 539 35.1
sadness 124 20.3 309 20.1
surprise 29 4.7 90 5.9
Total 612 100.0 1536 100.0

Colecia de synset-uri din WordNet-Affect utilizat n lucrarea dat a fost furnizat ca o
resurs pentru SemEval-2007 Affective Text
3
. Aceast sarcin a fost axat pe
adnotarea textelor prin etichete afective (Strapparava, Mihalcea, 2008). Toate synset-
urile din WordNet-Affect sunt adnotate utiliznd ase etichete de categorii emoionale:
joy, fear, anger, sadness, disgust, surprise (Strapparava et al., 2006). Aceast alegere a
celor ase emoii rezult din cercetarea psihologic a emoiilor umane exprimate non-
verbal (Ekman, 1992).
Datele despre resursa iniial sunt descrise n tabelul 1. Toat resursa este prezentat n
ase fiiere denumite conform celor ase emoii. Fiecare fiier conine o list de synset-
uri; un synset pe un singur rnd. Un exemplu de synset este prezentat n figura 1.
Prima liter din rnd indic partea de vorbire; aceasta este urmat de numrul synset-
ului i apoi sunt enumerate toate cuvintele din synset. Aceast reprezentare a fost simpl
i uoar pentru prelucrarea ulterioar. n synset-uri iniiale este un numr mare de
combinaii de cuvinte, sintagme i expresii. Un exemplu poate fi vzut n figura 1:
in_awe_of. Aceste pri ale synset-urilor au generat probleme n timpul traducerii.

2
n scopuri de cercetare, WordNet-Affect este accesibil la cerere la http://wndomains.itc.it
3
http://www.cse.unt.edu/~rada/affectivetext
EMOII N CUVINTE: ELABORAREA RESURSEI MULTILINGVE
135
3. Elaborarea WordNet-ului pentru limbile romn i rus
WordNet-ul Romn a fost creat de ctre Universitatea Alexandru Ioan Cuza din Iai n
cadrul proiectului european Balkanet (Tu et al., 2006). Dup ce proiectul Balkanet s-a
ncheiat, Institutul de Cercetri pentru Inteligen Artificial, de la Academia Romn a
continuat s lucreze cu WordNet-ul Romn i, n prezent, acesta conine 33151 synset-
uri de substantive, 8929 synset-uri de verbe, 851 synset-uri de adjective i 834 synset-
uri de adverbe (Tu et al., 2008). Acesta poate fi accesat prin intermediul interfeei
online a MultiWordNet
4
n care WordNet-urile pentru cteva limbi sunt aliniate la
WordNet-ul Princeton.
n lucrarea dat, mai nti de toate am verificat synset-urile din WordNet-Affect
folosind interfaa online a MultiWordNet. Astfel, am copiat la setul nostru toate synset-
urile care deja exist n WordNet-ul Romn i nu am procesat aceste synset-uri
suplimentar. Ca rezultat, n WordNet-ul Romn au fost gsite 166 synset-uri,
majoritatea dintre ele fiind pentru substantive i verbe. Adjectivele i adverbele sunt
reprezentate mai puin. Statistica privind synset-urile deja existente n romn este
prezentat n tabelul 2.
Tabel 2: Seturile de date a synset-urilor deja existente n Wordnet-ul Romn.
Clasele
# synset-uri n
WordNet-Affect
# synset-uri din
WordNet Romn
% synset-uri din
WordNet Romn
anger 116 35 30.1
disgust 17 7 41.1
fear 76 25 32.8
joy 209 63 30.0
sadness 98 24 24.7
surprise 26 12 46.1
Total 542 166 30.6

Pentru limba rus situaia este complet diferit. Au fost fcute mai multe ncercri
pentru a crea WordNet-ul pentru limba rus. RussNet este un proiect pentru crearea
tezaurului rusesc electronic (Azarova et al., 2002). Un proiect alternativ al versiunii
ruseti a WordNet-ului este WordNet-ul Rus (Balkova et al., 2004). Ambele proiecte
sunt necomerciale. De asemenea, exist dou proiecte comerciale menite s elaboreze
WordNet-uri pentru limba rus: RuThes este un tezaur informaional utilizat n UIS
RUSSIA
5
i proiectul privind WordNet-ul Rus creat de ctre grupul companiei
Novosoft
6
. Din pcate, puin informaie i nc mai puine resurse sunt accesibile n
mod gratuit.
4. Crearea WordNetAffect pentru limbile romn i rus
Pentru crearea acestor dou seturi de date, am parcurs trei etape: (1) traducere automat;
(2) nlturarea traducerilor irelevante; (3) generarea synset-urilor pentru romn i rus.

4
http://multiwordnet.itc.it/english/home.php
5
http://www.cir.ru
6
http://research-and-development.novosoft-us.com
VICTORIA BOBICEV, VICTORIA MAXIM, TATIANA PRODAN,
NATALIA BURCIU, VICTORIA ANGHELU
136

4.1 Traducerea Automat
Traducerea a fost fcut automat utiliznd dicionare bilingve. Am folosit dicionarul
electronic RomnEnglez ROMEN de la PRIMASOFT
7
. Dicionarul const din
urmtoarele compartimente: EnglezRomn, RomnEnglez, EnglezRus, RusEnglez,
fiecare coninnd mai mult de 200 000 de intrri. Noi am utilizat doar compartimentele
n care limba englez este limba surs. n dicionare au fost combinri de cuvinte,
sintagme i expresii pe care le-am folosit n limbile int. Pentru traducerea automat,
dicionarul a fost organizat ntr-o list de cuvinte surs urmate de traducerile int. Un
exemplu de intrare a dicionarului este prezentat n figura 2.
Joy
Dicionar general:
noun: bucurie; confort; fericire; plcere; tihn; veselie;
voioie;
verb: a bucura; a nveseli;
Figura 2: Un exemplu de intrare a dicionarului.
La aceast etap, scopul nostru a fost s obinem ct mai multe cuvinte afective posibile
pentru analiz. Pentru aceasta, am tradus fiecare cuvnt din synset-urile WordNet-
Affect. Am decis s excludem din synset-urile engleze toate combinrile de cuvinte,
sintagmele i expresiile, deoarece ele nu pot fi traduse automat. Figura 3 prezint un
exemplu de synset tradus, obinut dup aceast etap. Dup cum se vede n exemplu,
pentru traducerea romn, de asemenea am obinut combinaii de cuvinte care erau n
dicionar: a avea gust, a degusta (un aliment).
Unele elemente ale synset-urilor nu au fost traduse. Acestea pot fi divizate n patru
grupe. (1) Combinri de cuvinte, sintagme i expresii pe care le-am nlturat intenionat
din synset-urile engleze nainte de traducere. (2) Variaii n ortografia aceluiai cuvnt;
de exemplu, jubilance, jubilancy primul cuvnt a fost tradus, al doilea nu a
fost gsit n dicionar. (3) Cuvinte care au fost formate cu ajutorul sufixelor ness,
less, ful (de exemplu heartlessness); este puin probabil ca acestea s
apar n dicionare, la fel ca i adverbele formate cu sufixul ly. (4) Cuvinte care nu au
fost traduse din cauza limitilor dicionarului utilizat. n timp ce WordNet poate fi, n
mod rezonabil, menionat ca unul din cele mai mari dicionare engleze, dicionarul
nostru bilingv este destul de modest. Tabelul 3 arat procentajul cuvintelor care nu au
fost traduse. Media n procente a cuvintelor netraduse a fost 21%.

7
http://www.primasoft.biz/romen_eng.php
EMOII N CUVINTE: ELABORAREA RESURSEI MULTILINGVE
137
Tabel 3: Numrul i procentajul cuvintelor netraduse.
Clase
# de cuvinte
engleze
# de cuvinte
traduse
# de cuvinte
netraduse
% de cuvinte
netraduse
anger 318 248 70 22.0
disgust 72 60 13 18.0
fear 208 162 47 22.5
joy 539 420 119 22.0
sadness 309 246 63 20,5
surprise 90 72 18 21.0
Total 1536 1208 330 21.0

A doua grup de cuvinte nu prezint o problem, dar prima, a treia i a patra au trebuit
traduse manual. Aceasta s-a fcut la etapa a treia.
05573914 n:
preference =
preferin
penchant =
nclinaie
slbiciune
predilection =
predilecie
taste =
a avea gust
a gusta, a cunoate
a gusta; a degusta (un aliment)
degustare
frm, bucic, mbuctur (de)
gust
nclinaie, preferin
Figura 3: Un exemplu de traducere a unui synset.
4.2 nlturarea Traducerilor Irelevante
Multe cuvinte din synset-urile engleze au cteva sensuri. Este evident c traducerea
automat a generat toate traducerile posibile pentru toate sensurile. Noi am ales doar o
singur traducere care era relevant pentru semnificaia synset-ului. Traducerea
relevant a fost selectat manual. Am nlturat toate traducerile a cror sensuri nu aveau
legtur cu emoia. De exemplu, cuvntul taste n synset-ul cu nelesul de
preference are cteva semnificaii, ns doar ultima din lista traducerilor posibile
avea legtur cu sensul comun al synset-ului. Exemplul este prezentat n figura 3.
Astfel, noi am nlturat toate traducerile cu excepia ultimei.
Deoarece am tradus fiecare cuvnt n mod separat, am obinut o mulime de duplicate
care la fel au trebuit eliminate. Am tras atenia, de asemenea, la corespondena prilor
de vorbire. n multe cazuri, a fost destul de dificil, n special pentru substantivele deja
menionate, formate cu ajutorul sufixelor, de exemplu, plaintiveness sau
uncheerfulness.
VICTORIA BOBICEV, VICTORIA MAXIM, TATIANA PRODAN,
NATALIA BURCIU, VICTORIA ANGHELU
138
4.3 Generarea synset-urilor romne i ruse
Toate cuvintele dintr-un synset reprezint un concept, un singur sens. Scopul etapei a
treia a fost de a gsi traducerea adecvat, exact corespunztoare acestui sens. La aceast
etap, a trebuit mai nti s atam explicaia n englez a fiecrui synset. Aceasta a
determinat claritatea n semnificaia synset-ului pentru traductori. Dup ce au fost
adugate explicaiile la synset-uri, ntregul set a fost dat la trei traductori care au lucrat
independent. Sarcina lor a fost dubl: (1) s elimine traducerile care, din punctul lor de
vedere, nu erau relevante semnificaiei synset-ului descrise de explicaia acestuia; (2) s
adauge ct mai multe sinonime posibile relevante la synset-urile romne i ruse. Astfel,
sarcina lor a fost s verifice echivalena sensurilor synset-urilor engleze, ruse i romne.
De asemenea, au trebuit s traduc cuvintele care au rmas netraduse la prima etap.
Pentru traducere au fost folosite dicionare online.
Dicionarele bilingve romne utilizate:
http://hallo.ro,
http://dictionar.netflash.ro,
http://www.ectaco.co.uk/English-Romanian-Dictionary;
Dicionar explicativ romn: http://dexonline.ro/.
Dicionarele bilingve ruse utilizate:
http://en.bab.la,
http://dictionary.babylon.com,
http://russianlessons.net/dictionary/dictionary.php;
Dicionare explicative ruse:
http://slovo.freecopy.ru/,
http://slovari.yandex.ru/dict/ushakov.
Aceast etap a fost cea mai dificil care a necesitat cel mai mult lucru. Multe synset-uri
engleze aveau aproape aceleai sensuri, doar cu careva nuane. n unele cazuri, synset-
urile conineau cuvinte arhaice, care nu erau gsite n dicionare. Dup cum s-a
menionat mai sus, am ncercat s evitm combinrile de cuvinte, sintagmele i
expresiile. Cu toate acestea, n unele cazuri, sensul exact al unui synset englez putea fi
reprezentat doar de o singur combinaie de cuvinte romne sau ruse. n unele cazuri,
chiar i synset-ul englez era prezentat de combinri de cuvinte. De exemplu,
n#05591681 stage_fright. Un alt exemplu conine un cuvnt german:
n#05600844 world-weariness Weltschmerz. n aa cazuri, nu am obinut
traducerea corespunztoare. n unele cazuri, cteva synset-uri engleze au fost traduse n
aceleai cuvinte romne sau ruse deoarece nu am putut reflecta n limba int nuanele
sensurilor limbii surs.
Referindu-se la problema cu sufixe, de exemplu, cuvintele weepiness,
plaintiveness, mournfulness, ruthulness, cu greu pot fi gsite n
dicionare. Pentru a rezolva aceast problem, am eliminat sufixele i am cutat
rdcinile cuvintelor menionate n dicionare disponibile. n acest fel, am putut gsi
sensul cuvintelor i, prin adugarea afixelor necesare, au fost create echivalentele n
EMOII N CUVINTE: ELABORAREA RESURSEI MULTILINGVE
139
romn i rus. De exemplu, pentru a gsi traducerea adecvat pentru cuvntul
mournfulness, am cutat n dicionar cuvntul mournful. Rezultatul pentru
limba romn este ndoliat i pentru rus . Avnd n vedere c
cuvntul mournfulness este un substantiv, am transformat adjectivele obinute n
substantive. Astfel, echivalentul romnesc este doliu i n rus - .
Cu toate acestea, cele mai multe probleme au aprut la alinierea adjectivelor. De
exemplu, pentru eticheta emoional sadness, multe synset-uri adjectivale traduse n
limba rus conin cuvintele i . Prin urmare, pentru synset-
uri adjectivale diferite obinem traduceri destul de asemntoare.
4.4 Acordul ntre traductori
Avnd ca rezultatul traducerii seturi de sinonime, nu am putut folosi msurile standard
pentru acordul ntre traductori. Astfel, acordul a fost calculat dup cum urmeaz. Dac
A este o mulime de cuvinte selectate de ctre primul traductor pentru un synset i B
este o mulime de cuvinte selectate de al doilea traductor pentru acelai synset, acordul
ntre traductori IntAgr este egal cu raportul dintre numrul de cuvinte n intersecia
mulimilor A i B i numrul de cuvinte n uniunea mulimilor A i B:
IntAgr = (A B) / (A B)
(1)
De exemplu, dac un traductor a format un synset din trei cuvinte w
k
, w
l
i w
m
, iar al
doilea traductor a format acelai synset din patru cuvinte w
k
, w
l
, w
m
i w
n
, i primele trei
cuvinte sunt aceleai, atunci A=(w
k
w
l
w
m
), B=(w
k
w
l
w
m
w
n
), A B = (w
k
w
l

w
m
), A B = (w
k
w
l
w
m
w
n
), numrul de cuvinte din intersecia A i B ar fi egal cu
3, numrul de cuvinte din uniunea A i B ar fi egal cu 4 i, prin urmare, acordul ntre
traductori - ar fi 3 / 4 = 0.75.
Spre exemplu synset-ul a#01195320 friendly a fost tradus de primul traductor
ca prietenos prietenesc amical, de al doilea traductor ca binevoitor amical
prietenos, i de al treilea, ca binevoitor prietenesc prietenos. Pentru
primul i al doilea traductor intersecia traducerilor era de dou cuvinte: prietenos
amical i uniunea traducerii a fost patru cuvinte prietenos prietenesc
binevoitor amical. Acordul ntre traductori, n acest caz a fost de 2 / 4 = 0.5.
Pentru al doilea i al treilea traductor, intersecia traducerilor era de dou cuvinte:
prietenos binevoitor, i uniunea - patru cuvinte prietenos prietenesc
binevoitor amical. Prin urmare, acordul este acelai: 0.5. Pentru primul i al
treilea traductor acordul, de asemenea, este acelai: 0.5. Toi cei trei traductori au n
comun doar un singur cuvnt prietenos i uniunea de traduceri a constat din patru
cuvinte. Astfel, acordul a fost de 1 / 4 = 0.25.
Tabelul 4 prezint valorile medii ale acordului ntre traductori. Cei trei traductori sunt
prezentai ca T1, T2 i T3.
VICTORIA BOBICEV, VICTORIA MAXIM, TATIANA PRODAN,
NATALIA BURCIU, VICTORIA ANGHELU
140
Tabel 4: Acordul ntre traductori.
Perechile de traductori Acordul ntre traductori
Date pentru limba rus
T1 T2 0.57
T2 T3 0.61
T1 T3 0.59
Toi 0.29
Date pentru limba romn
T1 T2 0.58
T2 T3 0.57
T1 T3 0.67
Toi 0.32

Unele synset-uri aveau acordul egal cu unu, spre exemplu, n synset-ul a#00863650
euphoriant, toi trei traductori au tradus cuvnt respectiv ca euforizant. Cu
toate acestea, pentru majoritatea synset-urilor, traductorii au furnizat mai multe
traduceri diferite, dar nu multe dintre aceste traduceri au fost comune pentru toi
traductorii. n unele synset-uri traduse, nu a fost gsit nici un cuvnt comun n
traducerile celor trei traductori. De exemplu, pentru synset-ul a#00670851
gladdened exhilarated, cele trei traduceri au fost bucurat nveselit
nviorat bine_dispus, bucuros vesel voios ncntat bine_dispus
i bucurat voios bucuros nveselit. Nu a fost gsit nici un cuvnt comun
pentru toate cele trei traduceri. Astfel, ne-am decis s formm synset-uri din cuvintele
care au aprut n cel puin dou dintre cele trei variante de traduceri. n acest fel, am
format synset-uri finale. De exemplu, synset-ul a#01195320 friendly a fost
tradus ca prietenos prietenesc binevoitor amical, pentru c toate aceste
cuvinte au aprut de cel puin dou ori n traduceri. Synset-ul a#00670851
gladdened exhilarated a fost tradus ca bucurat nveselit bine_dispus
bucuros voios.
Tabelul 5 conine date privind numrul final de cuvinte n traduceri pentru fiecare din
cele ase emoii din WordNet-Affect .
Tabel 5: Seturile de date a cuvintelor afective din limba romn i rus.
Clasele #synset-urile # Cuvinte ruse # Cuvinte romne
anger 116 393 330
disgust 17 73 60
fear 76 327 248
joy 209 765 641
sadness 98 437 364
surprise 26 129 87
Total 542 2199 1869

Trebuie de menionat c n sursa WordNet-Affect englez au fost gsite unele synset-uri
duplicate. Am eliminat toate aceste repetiii i numrul de synset-uri n sursa noastr
este mai mic. n plus, au fost depistate unele diferene mici dintre WordNet-Affect,
EMOII N CUVINTE: ELABORAREA RESURSEI MULTILINGVE
141
MultiWordNet i versiunea online a WordNet pentru c WordNet-Affect s-a creat n
baza WordNet versiunea 1.6, MultiWordNet utilizeaz versiunea 2.0 a WordNet-ului i
versiunea online a WordNet-ului este 3.0. n ciuda numrului mai mic de synset-uri,
numrul de cuvinte n seturile pentru limbile romn i rus este mai mare dect n
limba englez. Acest lucru se datoreaz tendinei noastre de a colecta n resursele
noastre ct mai multe cuvinte posibile. Scopul nostru este de a folosi aceast resurs
pentru metodele statistice de recunoatere a emoiilor n text.
5. Concluzie i planuri pe viitor
Acest articol descrie procesul de creare a resursei lexicale multilingve WordNet-Affect
ce conine partea englez, partea rus i partea romn aliniate la nivel de synset.
WordNet-Affect este o resurs lexical creat n baza WordNet-ului Princeton care
codific informaiile despre emoiile pe care le transmit cuvintele. Acesta este organizat
n ase emoii de baz: anger, disgust, fear, joy, sadness, surprise. WordNet-Affect este
o resurs lexical comparativ mic, dar valoroas pentru adnotrile sale afective.
n lucrare este descris procesul traducerii synset-urilor WordNet-Affect n limba romn
i rus i crerii WordNet-Affect aliniat Englez - Romn - Rus. Resursa poate fi
folosit pentru recunoaterea automat a emoiilor i afectelor n text. Aceasta poate fi
obinut gratuit n scopuri de cercetare, pe http://lilu.fcim.utm.md. Resursa este nc n
dezvoltare. Prima versiune bazat pe WordNet-Affect a fost lansat n august 2009; a
doua, lansat n octombrie 2009, este aliniat cu WordNet-ul romn. Resursa a fost deja
folosit n (Sokolova, Bobicev, 2009) i aceasta este numai una dintre multiplele
posibiliti de utilizare a seturilor de cuvinte.
n viitor plnuim s mrim resursa noastr. Recent am obinut WordNet Domains care
este distribuit cu WordNet-Affect. n resursa dat sunt incluse dou versiuni ale
WordNet-Affect original englez. Prima versiune a fost obinut semiautomat i conine
aproximativ 1 500 de synseturi. A doua versiune a fost creat dup verificarea manual
a primei versiuni i excluderea synset-urilor care aveau o legtur mai slab cu emoia
respectiv. Versiunea aceasta conine 914 synset-uri. Intenia noastr este de a traduce
toate 914 synset-uri i de a alinia acestea la WordNet romn. n afar de aceasta, vom
crea resurse bag-of-words pentru utilizarea imediat n sisteme de recunoatere a
emoiilor i afectelor n text.
Referine bibliografice
Azarova, I., Mitrofanova, O., Sinopalnikova, A., Yavorskaya, M., Oparin I. (2002).
Russnet: Building a lexical database for the russian language. Workshop on
Wordnet Structures and Standardization and How this affect Wordnet
Applications and Evaluation, Las Palmas, pp. 60-64.
Balkova V., Suhonogov A., Yablonsky S.A. (2004). Russian WordNet. From UML-
notation to Internet/Intranet Database Implementation. Second International
WordNet Conference, GWC 2004, Brno, Czech Republic, 31-38.
Edmonds, P. (2002). Introduction to Senseval. ELRA Newsletters, 7(3), 337344.
VICTORIA BOBICEV, VICTORIA MAXIM, TATIANA PRODAN,
NATALIA BURCIU, VICTORIA ANGHELU
142
Ekman, P. (1992). An argument for basic emotions. Cognition and Emotion, vol. 6(3-4),
169200.
Liu, H., Lieberman, H., Selker, T. (2003). A model of textual affect sensing using real-
world knowledge. ACM Conference on Intelligent User Interfaces, Miami,
Florida, USA, pp. 125-132.
Strapparava, C., Mihalcea, R. (2008). Learning to identify emotions in text. ACM
Symposium on Applied Computing, Fortaleza, Brazil, 556-1560.
Strapparava, C., Valitutti, A. (2004). Wordnet-affect: an affective extension of wordnet.
4th International Conference on Language Resources and Evaluation, 1083
1086.
Strapparava, C., Valitutti, A., Stock, O. (2006). The affective weight of the lexicon. 5th
International Conference on Language Resources and Evaluation (LREC 2006),
Genoa, Italy, 474481.
Tu, D., Mititelu, B., Bozianu, L., Mihaila, C. (2006). Romanian wordnet: New
developments and applications. 3rd Conference of the Global WordNet
Association, Korea, 337344.
Tufi, D., Ion, R., Bozianu, L., Ceauu, A., tefnescu, D. (2008). Romanian Wordnet:
Current State, New Applications and Prospects. 4th Global WordNet Conference,
GWC-2008, University of Szeged, Hungary, 441-452.
Esuli, A., Sebastiani, F. (2006). SentiWordNet: A Publicly Available Lexical Resource
for Opinion Mining. 5th International Conference on Language Resources and
Evaluation (LREC 2006), Genoa, Italy, 417-422.
Magnini, B., Cavaglia G. (2002). Integrating subject field codes into Wordnet. Second
International Conference on Language Resources and Evaluation (LREC 2002),
Athens, Greece, 14131418.
Ortony, A., Clore, G. L., Foss, M. A. (1987). The psychological foundations of the
affective lexicon. Journal of Personality and Social Psychology, American
Psychological Association, vol. 53, 751766.
Sokolova M., Bobicev V. (2009). Classification of Emotion Words in Russian and
Romanian Languages. RANLP-2009 conference, Borovets, Bulgaria, 415-419.

S-ar putea să vă placă și