Sunteți pe pagina 1din 12

UTILIZAREA TEHNOLOGIILOR DE PRELUCRARE A LIMBAJULUI

NATURAL N CONTEXT ELECTORAL: METODA LIWC-20071


Cercet. post-doc Daniela GFU
Universitatea Alexandru Ioan Cuza, Iai
Abstract
This paper presents and interprets the 2009 presidential campaign through a new computational
technique of political discourse linguistic processing (method LIWC-2007 - Linguistic Inquiry and Word Count),
providing a rapid and robust possibility to understand the public sphere through political language. The concept
behind this method is that the manner in which individuals speak and write represents an open window to their
emotional and cognitive worlds. In other words, the vocabulary identifies the emotionalism of a speech.
Investigation supports research specialists in political science, being helpful, mainly in the attached social
prospects of election campaigns, to measure media reactions of the developments in the political arena.
Keywords: political speech, computational technique, linguistic analysis, political language, electoral
context

1. Introducere
Opiunea pentru un asemenea studiu - prezentarea i interpretarea contextului electoral
cu ajutorul tehnicii computaionale de prelucrare lingvistic a discursurilor politice (metoda
LIWC-2007 - Linguistic Inquiry and Word Count -, dezvoltat n colaborare de Universitatea
din Texas at Austin i Universitatea din Auckland), a evideniat influena discursului politic
asupra receptorilor si, discursivitatea politic instituind o realitate posibil i alternativ.
Metoda LIWC-2007, a fost aplicat pentru prima dat pentru limba romn pe un
corpus discursiv-electoral la finele anului 2009, rezultatele fiind prezentate n luna martie
a.c. 2, ofer o posibilitate rapid i riguroas de a nelege sfera public prin intermediul
limbajului, mai precis al discursului politic, situat la intersecia a trei spaii simbolice
importante: spaiul politic, spaiul public i spaiul comunicaional 3. Limbajul politic, esenial
n construirea discursului 4, necesit o abordare interdisciplinar 5 n care lingvistica
conlucreaz cu retorica, cu tiinele comunicrii, cu politologia i cu sociologia. Folosirea

Aceast lucrare rspunde tematicii proiectului de cercetare tiinific postdoctoral, propus n iunie 2010, din
cadrul Departamentului de cercetare tiinific al Facultii de Informatic i al Facultii de Psihologie i
tiine ale Educaiei, domeniul D4 (tiine ale omului i ale societii), proiect finanat prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane, proiectului POSDRU/89/1.5/S/63663: Reea
transnaional de management integrat al cercetrii postdoctorale n domeniul Comunicarea tiinei.
Construcie instituional (coal doctoral) i program de burse (CommScie).
2
Daniela GFU, Discursul presei scrise i violena simbolic. Analiza unei campanii electorale, tez de doctorat
susinut la Facultatea de Filosofie, Universitatea Al. I. Cuza, Iai, 19 martie 2010
(v. http://www.uaic.ro/uaic/bin/download/Academic/Doctorate_martie_2010/GfuC.Daniela.pdf)
3
Dominique WOLTON, Les contradictions de la communication politique, n Philippe CABIN (ed.) La
communication. tat des savoirs, d. Sciences Humaines, Paris, 1998, pp. 344-345
4
David D. PERLMUTTER, The Manship School guide to political communication, Baton Rouge, Louisiana
State University Press, 1999, n Clin SINESCU, Comunicare politic, Ed. Universitar, Bucureti, 2007, pp.
166-167
5
Laureniu OITU, Philosophy of communication, Ed. Institutul European, Iasi, 2001
1

87

limbajului n politic are rolul de a sanctifica aciunea 6, ctignd acordul deplin, de durat,
al electoratului.
2.

Metodologia de lucru
n elaborarea concluziilor preliminare privind desfurarea procesului electoral
prezidenial, realizat n perioada octombrie-decembrie 2009, am cules, stocat i centralizat
electronic n dou etape (turul I i turul II al campaniei prezideniale) texte politice,
editorialele a 3 publicaii naionale cu profil comun 7, Evenimentul zilei, Gndul i Ziua,
precum i discursurile politice 8 (n ambele forme: oratoric i dialogic) a celor patru
prezideniabili cotai 9 pe primele patru locuri: Crin Antonescu (PNL), Traian Bsescu (PDL),
Mircea Geoan (PSD+PC) i Sorin Oprescu (independent).
2.1.

Softul LIWC-2007
n componena programului intr un dicionar, care, n varianta originar american,
include 4500 de cuvinte i rdcini de cuvinte. n varianta romneasc acesta are aproximativ
5100 de cuvinte i rdcini (diferena n plus datorndu-se cu precdere mai marii
productiviti lexicale a limbii romne prin flexionare dect a limbii engleze, care a trebuit
oglindit prin includerea mai multor rdcini pentru acelai cuvnt). Rdcinile sunt marcate
prin simboluri terminate prin semnul *.
Fiecrei intrri de dicionar (cuvnt sau rdcin) i este asignat o list de categorii
semantice. Programul incrementeaz contoarele corespunztoare claselor respective la fiecare
detectare a acelui cuvnt (ori a acelei rdcini) n textul de intrare. De exemplu, rdcinii
plictico* i sunt asignate clasele: 125=emoional, 127=emoional_negativ i 130=suprare. De
fiecare dat cnd acest cuvnt ori o variant a lui este detectat n fiierul de intrare, toate cele
3 contoare, corespunztoare claselor menionate, sunt incrementate.
Exist o parial clasificare ierarhic a claselor. De exemplu, orice cuvnt care aparine
clasei suprare aparine i clasei emoional_negativ i toate cuvintele acestei clase aparin i
clasei emoional. n varianta originar, LIWC numr 64 de categorii (sintactice i
semantice) 10, din care noi am reinut 28 de clase, considerate cu un grad optim n
Murray EDELMAN, Politica i utilizarea simbolurilor, Ed. Polirom, Iai, 1999, p. 111
Aceste trei publicaii au profil comun, cf. MediaPress (www.mediapres.ro): sunt cotidiane naionale de
informaie general, se prezint sub form de tabloide, cu un tiraj de la cteva zeci de mii de exemplare pe ediie,
forma tiprit a editorialelor se regsete integral i pe paginile de internet ale celor trei cotidiane monitorizate:
Evenimentul zilei www.evz.ro, Gndul www.gandul.info, Ziua www.ziua.ro.
8
Surse de informare: Crin Antonescu - www.crinantonescu.ro, www.pnl.ro, Traian Bsescu - www.basescu.ro,
www.pdl.org.ro, www.presidency.ro, Mircea Geoan - www.mirceageoana.ro, www.psd.ro i Sorin Oprescu www.sorinoprescu.ro.
9
Amintim sondajul privind alegerile prezideniale, publicat n 12 octombrie 2009. Acesta a fost realizat n
perioada 17 septembrie - 7 octombrie de CSOP, pe un eantion naional de 18.348 de persoane, reprezentativ
pentru populaia n vrst de 18 ani i peste. Eroarea este de 0,7%, iar probabilitatea de 0,95. Intenia de vot:
Traian Bsescu - 37%, Mircea Geoan - 24%, Crin Antonescu - 13%, Sorin Oprescu - 10%.
10
Amintim cele 64 de clase, clasificate n 4 categorii, precedate de un anumit cod regsit n structura
programului LIWC2007: lingvistic (22 de clase) - 1 funct (Total function words), 2 pronoun (Total pronouns), 3
ppron (Personal pronouns), 4 i (1st pers singular), 5 we (1st pers plural), 6 you (2nd person), 7 shehe (3rd pers
singular), 8 they (3rd pers plural), 9 ipron (Impersonal pronouns), 10 article (Articles), 11 verb (Common verbs),
12 auxverb (Auxiliary verbs), 13 past (Past tense), 14 present (Present tense), 15 future (Future tense), 16 adverb
(Adverbs), 17 preps (Prepositions), 18 conj (Conjunctions), 19 negate (Negations), 20 quant (Quantifiers), 21
number (Numbers), 22 swear (Swear words); psihologic (32 clase) - 121 social (Social processes), 122 family
6
7

88

determinarea unei anumite atitudini politice care poate influena decizia de vot. Raportndune la criteriul convingere, pe baza cruia se construiete fiecare etap a discursului politic,
finalitatea urmrit va evidenia legtura ntre proporia claselor predominante n discurs i
opiunea de vot. Menionm c au fost pstrate codurile claselor ca n programul american,
numele clasei fiind tradus n limba romn.
Tabel 1. Descrierea celor 28 de clase reinute n varianta romneasc a softului LIWC-2007
Cod

Clasa
eng.
(abr.)

Clasa rom.

22

swear

injurii

121

social

social

122
123
124

family
friend
human

familie
prieteni
oameni

125

affect

emoional

126

posemo

emoional_pozitiv

127

negemo

emoional_negativ

128

anx

nelinite

129
130

anger
sad

furie
suprare

131

cogmech

raional

132
133
135
136
137

insight
cause
tentat
certain
inhib

intuiie
determinare
nesiguran
siguran
inhibiie

140

percept

perceptiv

141

see

vizual

Descrierea semnificaiei clasei n funcie de


lexicurile ataate corespunztor
Cuvinte care lezeaz demnitatea/reputaia cuiva.
Exemple: afurisit, cretin, jigodie, nemernic, nevrednic...
Cuvinte cu referire la apartenena la un anumit grup social.
Exemple: celebrare, preedinie, consultaie, eveniment, intervenie...
Exemple: clan, fii, nrudire, naiune, prini.
Exemple: camarazi, colegi, companioni, membru, partener...
Exemple: adult, individ, oreni, personalitate, tipi...
Cuvinte care provoac emoii (pozitive sau/i negative), transpun
realitatea n zona afectiv.
Exemple: abtut, binevoitor, curajos, impasibil, necinstit, revigorant...
Cuvinte care provoac emoii pozitive.
Exemple: ademenitor, fermector, plcut, tonic, popular...
Cuvinte care provoac emoii negative.
Regsim o parial clasificare ierarhic - clasele: nelinite, furie,
suprare.
Exemple: agresiv, cinic, obscen, punga, trndav...
Exemple: alarmant, bnuitor, nervos, descumpnitor, tensionat,
vulnerabil, refractar.
Exemple: agitat, brutal, irascibil, mincinos, ofensator...
Exemple: ngrijortor, plicticos, revolttor, trist, pesimist...
Cuvinte care exprim un raionament, o judecat.
Exemple: buimcit, discernmnt, inventiv, la, precaut...
Exemple: ager, explicativ, lmuritor, logic, realist...
Exemple: afectat, deductiv, independent, insinuant, manipulator...
Exemple: ambiguu, confuz, ipotetic, probabilistic, vag...
Exemple: categoric, clar, exact, hotrt, just...
Exemple: absent, blocat, descurajat, prevztor, ovitor...
Cuvinte n legtur cu facultatea de a percepe vizual, auditiv i tactil.
Exemple: aude, consonant, febril, palpabil, observabil...
Cuvinte n legtur cu facultatea de a percepe vizual.

(Family), 123 friend (Friends), 124 humans (Humans), 125 affect (Affective processes), 126 posemo (Positive
emotion), 127 negemo (Negative emotion), 128 anx (Anxiety), 129 anger (Anger), 130 sad (Sadness), 131
cogmech (Cognitive processes), 132 insight (Insight), 133 cause (Causation), 134 discrep (Discrepancy), 135
tentat (Tentative), 136 certain (Certainty), 137 inhib (Inhibition), 138 incl (Inclusive), 139 excl (Exclusive), 140
percept (Perceptual processes), 141 see (See), 142 hear (Hear), 143 feel (Feel), 146 bio (Biological processes),
147 body (Body), 148 health (Health), 149 sexual (Sexual), 150 ingest (Ingestion), 250 relativ (Relativity), 251
motion (Motion), 252 space (Space), 253 time (Time); preocupri socio-profesionale (7 clase) - 354 work
(Work), 355 achieve (Achievement), 356 leisure (Leisure), 357 home (Home), 358 money (Money), 359 relig
(Religion), 360 death (Death) i paralingvistic (3 clase): 462 assent (Assent), 463 nonfl (Nonfluencies), 464
filler (Fillers).

89

142

hear

auditiv

143

feel

tactil

149

sexual

sexual

354

work

munc

355

achieve

realizri

356

leisure

agrement

357

home

cmin

358

money

bani

359

relig

religie

Exemple: holbat, licrire, lumin, orb, scnteie...


Cuvinte n legtur cu facultatea de a percepe auditiv.
Exemple: acustic, consonant, rspicat, tcut, surd...
Cuvinte n legtur cu facultatea de a percepe tactil.
Exemple: ascuit, fragil, estompat, ndemnatic, neputincios...
Cuvinte cu conotaie sexual.
Exemple: atingere, dezmierdare, ncins, mngie, pipie...
Cuvinte cu referire la activiti/instituii specifice muncii.
Exemple: calificare, organizaie, departament, privilegii, proiecte...
Cuvinte cu referire la aciuni de eficientizare a vieii socio-umane.
Exemple: competene, achiziii, faculti, prelegere, succese...
Cuvinte cu referire la activitile de recreere.
Exemple: artist, camping, cazinou, dans, whisky...
Cuvinte cu referire la arealul cminului.
Exemple: camer, cldire, decor, mansard, vatr...
Cuvinte referitoare la domeniul economico-financiar.
Exemple: afacere, avere, conturi, financiar, licitaii...
Cuvinte cu referire la zona spiritual.
Exemple: Biblie, Dumnezeu, cruce, cretini, milostenie...

Au fost eliminate clasele care dau o categorizare asupra prii de vorbire a cuvintelor
(pronume, verbe, adverbe, prepoziii, conjuncii etc.) i implicit asupra timpurilor verbelor
(prezent, trecut, viitor), precum i cteva clase din categorii precum: procese cognitive
(inclusiv, exclusiv), procese biologice (corp, sntate, ingestie), relativitate (spaiu, timp,
micare) etc. n esen softul realizeaz o numrare a apariiei cuvintelor corespunztoare
diferitelor clase semantice, ntorcnd tabele de frecvene. Acestea pot fi apoi uor tranformate
n grafice.
2.2 Alegerea lexicului
Alegerea lexicului englezesc al LIWC-2007 (i a variantei precedente LIWC2001 11) sa fcut n mai muli pai (n perioada anilor 1992-2007):
s-a fcut mai nti o selecie, folosind ca surse dicionare (Rogets Thesaurus .a.),
urmat de sesiuni de brain-storming n care dimensiunile claselor au fost mrite;
colecia astfel obinut a fost apoi trecut n minile a 3 experi, care au lucrat
independent unul de altul. Ei au avut misiunea s decid asupra fiecrui cuvnt, dac trebuia
ori nu pstrat n categoria respectiv, i au avut libertatea de a aduga cuvinte noi. S-a aplicat
apoi un sistem de votare, pentru a decide pe baz de majoritate care cuvinte s fie pstrate;
s-a fcut apoi o evaluare pe un corpus de texte, n urma creia un numr de clase, a
cror reprezentativitate s-a dovedit slab (mai puin de 0.3%), au fost eliminate, dup cum au
fost eliminate i cuvinte a cror rat de apariie n clase a fost mai mic de 0.005%;
Documentaia originar a LIWC menioneaz testele de validitate care au nsoit darea n exploatare a
programului. Se apreciaz c aproximativ 86% din lexicul utilizat curent de indivizii umani n scris ori n vorbire
se regsete n LIWC. Testul s-a fcut pe un corpus englezesc (cules n SUA, Canada i Noua Zeeland) de
aproximativ 167 milioane de cuvinte, incluznd registrele: scrieri emoionale, scrieri neutre din punct de vedere
emoional, tiin, beletristic, blogg-uri i transcrierea vorbirii, pe o perioad care se ntinde aproximativ ntre
anii 1700 i 2007. Unul dintre primele teste de validare ale LIWC a fost efectuat de Pennebaker i Francis n
1996. (v. James W. PENNEBAKER, Martha E. FRANCIS, Roger J. BOOTH, Linquistic Inquiry and Word
Count LIWC2001, Erlbaum Publishers, Mahwah, NJ, 2001 i pe www.erlbaum.com).
11

90

varianta actual (2007) a dicionarului a suferit modificri substaniale fa de varianta


2001. Printre altele, o echip de 4 experi a evaluat care cuvinte, din fondul celor mai
frecvente 2000 de cuvinte ale limbii engleze, ar trebui incluse n dicionarul LIWC.
Dicionarul LIWC a fost tradus (dup originarul englezesc) n cteva limbi, printre
care: spaniol, italian, german, olandez, norvegian, portughez etc.
2.3 Construirea lexicului romnesc
innd cont de procesul extrem de sofisticat i de durat dup care s-a constituit
dicionarul LIWC-2007, pentru utilizarea n cercetarea descris n aceast lucrare am decis
asupra unui proces de localizare prin traducere, n defavoarea unuia n care colectarea
dicionarului ar fi fost complet decuplat de varianta englezeasc. Desigur, am fost contieni
de riscul major pe care o astfel de decizie l-ar putea avea i care const n obinerea unui lexic
puternic influenat de limba englez, prin preluarea termenilor (echivalenilor de traducere)
din dicionar, n afara contextelor semantice, ct i invers, prin neincluderea unor termeni
curent utilizai n limba romn, dar care nu sunt sugerai imediat de echivalenii originari.
Pentru a corecta aceste dezavantaje, procesul de constituire a dicionarului romnesc s-a
desfurat n urmtoarele etape:
mai nti termenii englezeti s-au tradus, n ordine alfabetic (cu preluarea identic a
claselor). n aceast etap s-a decis, pentru fiecare cuvnt ori rdcin inclus, care trebuie s
fie familia de rdcini a lui, capabil s asigure o acoperire ct mai bun a variabilitii
flexionare, fr ns a capta (prin procesul de pattern-matching) termeni strini de familia
avut n vedere;
lexicul astfel constituit a fost apoi sortat dup fiecare numr de clas, obinndu-se un
numr de 64 de liste (evident, nedisjuncte, datorit posibilitii ca anumii termeni s aparin
la mai multe clase);
s-au reinut din acestea doar 28 de clase, considerate semnificative pentru acest tip de
analiz.
cuvintele/rdcinile din fiecare clas au fost apoi sortate alfabetic;
s-a evaluat apoi fiecare clas n parte, eliminndu-se cuvintele care puteau introduce
ambiguiti i incluznd alte cuvinte/rdcini din sfera sinonimic a celor existente. Acest
proces a fost uurat de faptul c s-a lucrat asupra unei clase (sfere semantice) odat.
Corectarea n interiorul aceleiai clase are avantajul c ochiul uman poate urmri doar cuvinte
din aceeai sfer semantic i poate astfel recunoate uor cnd au fost fcute greeli de
clasificare. Totodat, ordonarea alfabetic ofer posibilitatea operrii anumitor optimizri de
scriere a familiilor de cuvinte, prin exploatarea jolly-jokerului * (semnul care marcheaz
apariia a zero ori mai multe caractere la sfritul rdcinii unui cuvnt) 12;
- n final, toate dicionarele asignate claselor au fost puse mpreun, lista astfel
obinut s-a sortat din nou alfabetic i s-au eliminat apariiile multiple (prin concatenarea
listelor de clase, cu lsarea o singur dat a unui numr de clas n lista unui cuvnt/unei
rdcini).

n informatic, simboluri de forma xxx*, unde xxx reprezint un numr oarecare de caractere, se numesc
expresii regulate.

12

91

2.4 Optimizri n dicionar


n faza corectrii dicionarelor asignate claselor s-au operat o seam de optimizri
asupra cuvintelor. Iat o list de exemple:
Condensri:
modifica*, modificat*, modific*, modificnd
nlocuite cu: modific*
care are i avantajul de a include i formele: modific, modifici
ce ar fi fost ignorate n varianta precedent.
Grupuri ce erau cuprinse unul n altul, precum:
necesi*, necesit*
au fost reduse la necesi*
sau grupul: ascul*, ascult, ascult*, ascultare*, ascultat, ascultai, ascult, ascultm, ascultri*,
ascultto*, asculi
a fost redus la ascul*
Completarea cu forme noi:
nouti*
a fost nlocuit cu: noutate*, nouti*
Cuvinte ambigue eliminate:
nsu* la clasa 133 (determinare), cu intenia de a genera familia verbului a nsui, pentru c
poate genera coliziuni cu nsui a fost transformat n nsuit*.
Intrarea prefcut*, form a verbului preface, a fost eliminat din clasa 133 (determinare),
pentru c genereaz confuzia cu sensul reflexiv (care este un sens emoional_negativ).
Eliminarea unor cuvinte aflate n clase neadecvate:
grsim*, eliminat din clasa 140 (perceptiv), pentru c dei grsimea poate fi un aliment i
deci e legat de gust, deci de percepie, ea poate avea i sensul de stare a unei fiine grase.
Alte observaii
n clasa 355 (realizri) sunt incluse att cuvinte care numesc realizare / succes / ncununare
(majoritatea) ct i unele care dau nume nfrngerii / nerealizrii / nereuitei.
Exemple: mediocr*, neadecva*, necalifica*, necorespunzto*, nendestulto*, nepricepu*,
neputincio*, nereuit*, nesbui*, renun*, rata*.
3. Studiu de caz: Alegerile prezideniale 2009
ntregul corpus discursiv selectat din presa scris monitorizat a fost procesat cu softul
LIWC-2007 (al crui parametru este calculul de frecven - analiza cantitativ), rezultatele
fiind apoi interpretate calitativ (analiza calitativ) pe baza reprezentrilor grafice realizate cu

92

ajutorul utilitarului Excel. n esen, programul primete la intrare unul sau mai multe fiiere
text n care numr apariii ale cuvintelor, ordonate n clase. Am optat pentru genul de
reprezentri grafice de tip funcie, clasele fiind aranjate pe axa orizontal n ordinea
numerelor de cod.
n partea a doua a evalurilor noastre (pentru analizele comparative ale abordrilor
discursive din timpul turului I i turului II) am considerat c valorile pot fi exprimate mai
intuitiv prin cilindri. n interpretarea reprezentrilor grafice a editorialelor celor 3 cotidiane,
dar i a discursurilor politice (att n form oratoric, ct i n form dialogal) ale celor 4
candidai s-a inut cont de pragul limit de 0,5%, considerat suficient pentru ca acea clas
care-l atinge s aib importan n interpretarea discursiv. Desigur, softul d aprecieri globale
n clasele respective, concluziile desprinse aici nu pleac de la un singur text, ci reprezint o
medie pe toat colecia de texte scanate. Utilizarea reprezentrilor de tip funcie pentru
punerea n eviden a unor pattern-uri discursive ale subiecilor ce reprezint, n cele din
urm, ferestre ctre lumile lor interioare (emoionale i cognitive), interpretarea realizndu-se
prin compararea datelor statistice furnizate de program, n trei moduri, pe care le-am denumit
unu-la-unu, unu-la-doi i unu-la-trei, susinute prin formule matematice 13;
Utilizarea instrumentarului informatic n aprecierea discursului politic (prelucrare,
prezentare grafic i interpretare) ne-a ajutat s conturm cteva trsturi distinctive care au
dat o viziune nou asupra tabloului discursiv al candidailor la preedinie i al electoratului
romnesc de la sfritul anului 2009. Din reprezentarea grafic, lum spre exemplificare turul
II de campanie, reiese faptul c votanii care au decis numele noului preedinte, conform
diferenelor observate n graficele de tip unu-la-unu dintre Traian Bsescu i Mircea Geoan
(graficul 1 - discursul oratoric), a fost preferat primul care s-a distins prin abordarea raionalintuitiv (clasa intuiie), ton acuzator (clasa emoional_negativ), n timp ce la adversar,
conform valorilor negative, se remarc preocuparea pentru aspectele lucrative (clasele munc
i bani), abordndu-le deschis (clasa siguran).
13

Graficele

diferenelor

unu-la-unu au fost construite folosind n fiecare clas formula


, n care x si y sunt fie dou cotidiane, fie doi prezideniabili, iar media(x),

respectiv media(y) reprezint mediile frecvenelor clasei respective pentru x, respectiv y. Graficele trebuie citite
astfel: valorile aflate deasupra axei orizontale sunt cele care prevaleaz la cotidianul/candidatul x fa de
cotidianul/candidatul y, iar cele aflate dedesubtul axei orizontale sunt cele care au valori mai mari la
cotidianul/candidatul y dect la cotidianul/candidatul x. O valoare de zero nseamn egalitatea celor dou mrimi
comparate.
Graficele diferenelor unu-la-doi au fost construite folosind n fiecare clas formula
, n care x, y i z reprezint cele trei cotidiane ce se compar, iar
media(x), media(y) i respectiv media(z) reprezint mediile frecvenelor clasei respective pentru cotidianele x, y
i respectiv z. Valorile aflate deasupra axei orizontale scot n eviden clasele n care primul cotidian prevaleaz
fa de mediile celorlalte dou cu care este comparat, n timp ce valorile de dedesubtul axei orizontale
evideniaz clasele n care, dimpotriv, primul cotidian se plaseaz sub media celorlalte dou. Graficele
diferenelor
unu-la-trei
au
fost
construite
folosind
n
fiecare
clas
formula
, n care x, y, z i t i reprezint pe cei patru candidai ce se
compar, iar media(x), media(y), media(z) i respectiv media(t) reprezint mediile frecvenelor clasei respective
pentru candidaii x, y, z i respectiv t. Valorile aflate deasupra axei orizontale scot n eviden clasele n care
primul candidat prevaleaz fa de mediile celorlali trei candidai cu care este comparat, n timp ce valorile de
dedesubtul axei orizontale evideniaz clasele n care, dimpotriv, primul candidat se plaseaz sub media
acestora.

93

(1)
Diferena medie frecvenelor (Traian Bsescu, Mircea Geoan) - turul II
1.5

0.5

bani

religie

cmin

agrement

munc

realizri

tactil

sexual

vizual

auditiv

inhibiie

perceptiv

siguran

nesiguran

intuiie

determinare

raional

furie

suprare

nelinite

pozitiv

negativ

oameni

emoional

familie

-0.5

prieteni

injurii

social

-1

-1.5

n privina comportamentului discursiv din timpul dezbaterii finale (graficul 2), Traian
Bsescu fa de Mircea Geoan i accentueaz discursul prin cuvinte ce in de percepii
(clasa perceptiv), fiind mai prevztor (clasa inhibiie), n timp ce adversarul su (conform
valorilor negative) este mai nclinat spre afectiv (clasa emoional), manifestndu-se politicos
(clasa emoional_pozitiv), interesul pentru aspectul lucrativ (clasa munc) rmnnd mult
mai pregnant.
(2)
Diferena media frecvenelor dezbatere final (Traian Bsescu, Mircea Geoan) turul II
1.5

0.5

religie

bani

cmin

agrement

munc

realizri

tactil

sexual

vizual

auditiv

perceptiv

inhibiie

siguran

nesiguran

determinare

intuiie

raional

suprare

furie

nelinite

pozitiv

negativ

oameni

emoional

familie

prieteni

injurii
-0.5

social

-1

-1.5

Referitor la cele trei cotidiane monitorizate n timpul campaniei prezideniale 2009


(Evenimentul zilei, Gndul i Ziua), lum spre exemplificare tot turul II de campanie. Din
reprezentarea grafic, conform diferenelor observate n graficele de tip unu-la-doi,
Evenimentul zilei (graficul 3) este cel mai preocupat n abordare de aspectul lucrativ (clasa
munc), descrierea fiind prevztoare (clasa inhibiie). Dac privim la valorile negative,
putem sublinia c descrierile sunt mai puin raionale (clasa raional), acestea fiind mai
pregnante la celelalte cotidiane monitorizate.
(3)
Diferena media frecvenelor (Evenimentul zilei, media mediilor frecvenelor
(Ziua, Gndul)) - turul II
1.5

0.5

-1

-1.5

94

religie

bani

cmin

agrement

munc

realizri

tactil

sexual

vizual

auditiv

perceptiv

inhibiie

siguran

nesiguran

determinare

intuiie

raional

suprare

furie

nelinite

pozitiv

negativ

oameni

emoional

familie

prieteni

injurii
-0.5

social

Cotidianul Gndul (graficul 4) se bazeaz cel mai mult pe percepii (clasa perceptiv),
explicnd o stare de fapt (clasa intuiie). Evit, conform valorilor negative, subiectele cu
aspect lucrativ (clasa munc) sau abordrile raionale (clasa raional), tonul prea afectiv
(clasa emoional) sau categoric (clasa siguran), care nu apar la fel de pregnant ca la
celelalte cotidiane monitorizate.
(4)
Diferena media frecvenelor (Gndul, media mediilor frecvenelor (Ziua,
Evenimentul zilei)) - turul II
1

0.5

bani

religie

cmin

agrement

munc

realizri

tactil

sexual

vizual

auditiv

inhibiie

perceptiv

siguran

nesiguran

intuiie

determinare

raional

furie

suprare

nelinite

pozitiv

negativ

oameni

-0.5

emoional

familie

prieteni

injurii

social

-1

-1.5

Cotidianul Ziua (graficul 5) se evideniaz prin capacitatea de a descrie raional o stare


de fapt (clasa raional), de cele mai multe ori pe un ton categoric (clasa siguran) i
acuzator (clasa emoional_negativ), evitnd, conform valorile negative, informarea bazat pe
percepii (clasa perceptiv), aceasta fiind regsit mai pregnant n editorialele celorlalte dou
cotidiane monitorizate.
(5)
Diferena media frecvenelor (Ziua, media mediilor frecvenelor (Evenimentul
zilei, Gndul)) - turul II
3
2.5
2
1.5
1
0.5

religie

bani

cmin

agrement

munc

realizri

tactil

sexual

vizual

auditiv

perceptiv

inhibiie

siguran

nesiguran

intuiie

raional

suprare

furie

nelinite

pozitiv

negativ

oameni

emoional

familie

prieteni

injurii

determinare

-1

social

0
-0.5

Comparnd abordarea discursiv, ntre cele dou tururi de scrutin, regsit n


editorialele celor 3 cotidiane monitorizate, constatm din graficele de tip unu-la-doi c i
pstreaz stilul. Astfel, editorialele cotidianului Evenimentul zilei n turul I fa de turul II de
campanie (graficul 6) se nscriu n tipul de discurs raional (clasa raional), descriere popular
(clasa emoional_pozitiv), un interes mai mare pentru teme din sfera lucrativ (clasa munc).
In turul II (conform valorilor negative) descrierea e mult mai acuzatoare (clasa
emoional_negativ).

95

(6)
Diferena media frecvenelor Evenimentul zilei (turul I, turul II)
1
0.8
0.6
0.4
0.2
0
-0.2

bani

religie

cmin

agrement

munc

realizri

tactil

sexual

vizual

auditiv

inhibiie

perceptiv

siguran

nesiguran

intuiie

determinare

raional

furie

suprare

nelinite

pozitiv

negativ

oameni

emoional

familie

prieteni

injurii

-0.6

social

-0.4

Editorialele cotidianului Gndul n turul I fa de turul II de campanie (graficul 7) se


nscriu n tipul de discurs raional (clasa raional), un interes mai mare pentru teme din sfera
lucrativ (clasa munc) descrise raional (clasa raional). Nu se remarc n turul II (conform
valorilor negative) schimbri radicale n tonul de abordare, dat fiind c valorile nu depesc 0,5%, pragul minim de interpretare.
(7)
Diferena media frecvenelor Gndul (turul I, turul II)
0.8
0.6
0.4
0.2
0

religie

bani

cmin

realizri

agrement

sexual

munc

tactil

vizual

auditiv

perceptiv

inhibiie

siguran

nesiguran

determinare

intuiie

raional

suprare

furie

nelinite

pozitiv

negativ

emoional

prieteni

oameni

familie

injurii

-0.4

social

-0.2

Editorialele cotidianului Ziua n turul I fa de turul II de campanie (graficul 8) au fost


mai pregnant interesate de teme din sfera economic (clasele munc, realizri i bani). n
turul II de campanie (conform valorilor negative) observm o tendin mai mare pentru
descrierile raionale (clasa raional), pe un ton acuzator (clasa emoional_negativ).
(8)
Diferena media frecvenelor Ziua (turul I, turul II)
1
0.8
0.6
0.4
0.2
0
-0.2
-0.4

4.

religie

bani

cmin

realizri

agrement

sexual

munc

tactil

vizual

auditiv

perceptiv

inhibiie

siguran

nesiguran

determinare

intuiie

raional

suprare

furie

nelinite

pozitiv

negativ

emoional

oameni

familie

prieteni

injurii

-0.8

social

-0.6

Concluzii
La ora actual domeniul prelucrrii limbajului natural a ajuns la o maturitate tiinific
i tehnologic care l face util n activitile derulate de cercettorii din sfera socio-uman.
Totui, ceea ce lipsete este o interaciune susinut i constant a cercettorilor care activeaz

96

n cele dou domenii, care s probeze, pe de o parte, aplicabilitatea n sfera tiinelor sociale i
umane (SSU) a tehnologiilor 14 create de informaticienii care se ocup de prelucrarea textelor
i, pe de alt parte, avantajele pe care cercettorii din SSU le pot obine prin utilizarea n
domeniile lor de interes a tehnologiilor lingvistice.
Pentru a-i da metodei probitatea tiinific, ce permite ataarea de valori simbolice
interpretative n locul unor valori numerice, mai este nevoie de nc o etap, compararea
valorilor obinute de LIWC-2007 varianta romneasc existent cu ceea ce se tie din
analize de alt tip i care au deja o recunoatere oficial ori chiar o anumit notorietate. Dac,
de exemplu, ceea ce am aflat acum prin program (campania prezidenial 2009, supus
testului) c a reprezentat diferena cea mai notabil ntre discursurile candidailor este
confirmat i din alte surse, care, desigur, nu au dect posibiliti de interpretare nuanate i
puin riguroase, datele furnizate n urma acestei cercetri vor deveni suficient de relevante
pentru a reliefa deja nite preferine ale electoratului romnesc ctre un anumit profil cognitiv
definit statistic, prin mijloace riguroase, i vor putea fi preluate n viitor n arsenalul de
instrumente ale campaniilor electorale.
Mulumiri
Teza de doctorat, care a stat la baza cercetrii raportat n aceast lucrare a fost
realizat sub ndrumarea prof. univ. dr. Laureniu oitu. Softul pentru preprocesarea textelor a
fost realizat de drd. Alex Moruz de la Facultatea de Informatic a Universitii Al. I. Cuza
Iai. La realizarea lexicului romnesc am fost ajutat de studenii masteranzi din anul 1 (anul
universitar 2009-2010) de la Masteratul de Lingvistic Computaional a aceleiai faculti,
sub ndrumarea prof. univ. dr. Dan Cristea.
Referine bibliografice
* CABIN, Philippe (ed.) La communication. tat des savoirs, d. Sciences Humaines, Paris,
1998
* CRISTEA, Dan; TUFI, Dan (2002): Resurse lingvistice romneti i tehnologii
informatice aplicate limbii romne, n ICHIM, O. i OLARIU, F.-T. (eds.): Identitatea limbii
i literaturii romne n perspectiva globalizrii, Academia Romn, Institutul de Filologie
Romn A. Philippide, Ed. Trinitas, Iai
* EDELMAN, Murray, Politica i utilizarea simbolurilor, Ed. Polirom, Iai, 1999
* GFU, Daniela, Discursul presei scrise i violena simbolic. Analiza unei campanii
electorale, lucrare de doctorat susinut la Facultatea de Filosofie, Universitatea Al. I. Cuza,
Iai
(v.
http://www.uaic.ro/uaic/bin/download/Academic/Doctorate_martie_2010/GfuC.Daniela.pdf)

A se vedea Dan CRISTEA, Dan TUFI (2002): Resurse lingvistice romneti i tehnologii informatice
aplicate limbii romne, n O. ICHIM i F.-T. OLARIU (eds.): Identitatea limbii i literaturii romne n
perspectiva globalizrii, Academia Romn, Institutul de Filologie Romn A. Philippide, Ed. Trinitas, Iai
14

97

* PENNEBAKER, James W., FRANCIS, Martha E., BOOTH, Roger J., Linquistic Inquiry
and Word Count LIWC2001, Erlbaum Publishers, Mahwah, NJ, 2001 i pe
www.erlbaum.com
* PERLMUTTER, David D., The Manship School guide to political communication, Baton
Rouge, Louisiana State University Press, 1999
* SINESCU, Clin, Comunicare politic, Ed. Universitar, Bucureti, 2007
* OITU, Laureniu, Philosophy of communication, Ed. Institutul European, Iai, 2001
* WOLTON, Dominique, Les contradictions de la communication politique, CNRS ditions,
Paris, 1995

98

S-ar putea să vă placă și