Documente Academic
Documente Profesional
Documente Cultură
LBJ Basescu
LBJ Basescu
1. Introducere
Opiunea pentru un asemenea studiu - prezentarea i interpretarea contextului electoral
cu ajutorul tehnicii computaionale de prelucrare lingvistic a discursurilor politice (metoda
LIWC-2007 - Linguistic Inquiry and Word Count -, dezvoltat n colaborare de Universitatea
din Texas at Austin i Universitatea din Auckland), a evideniat influena discursului politic
asupra receptorilor si, discursivitatea politic instituind o realitate posibil i alternativ.
Metoda LIWC-2007, a fost aplicat pentru prima dat pentru limba romn pe un
corpus discursiv-electoral la finele anului 2009, rezultatele fiind prezentate n luna martie
a.c. 2, ofer o posibilitate rapid i riguroas de a nelege sfera public prin intermediul
limbajului, mai precis al discursului politic, situat la intersecia a trei spaii simbolice
importante: spaiul politic, spaiul public i spaiul comunicaional 3. Limbajul politic, esenial
n construirea discursului 4, necesit o abordare interdisciplinar 5 n care lingvistica
conlucreaz cu retorica, cu tiinele comunicrii, cu politologia i cu sociologia. Folosirea
Aceast lucrare rspunde tematicii proiectului de cercetare tiinific postdoctoral, propus n iunie 2010, din
cadrul Departamentului de cercetare tiinific al Facultii de Informatic i al Facultii de Psihologie i
tiine ale Educaiei, domeniul D4 (tiine ale omului i ale societii), proiect finanat prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane, proiectului POSDRU/89/1.5/S/63663: Reea
transnaional de management integrat al cercetrii postdoctorale n domeniul Comunicarea tiinei.
Construcie instituional (coal doctoral) i program de burse (CommScie).
2
Daniela GFU, Discursul presei scrise i violena simbolic. Analiza unei campanii electorale, tez de doctorat
susinut la Facultatea de Filosofie, Universitatea Al. I. Cuza, Iai, 19 martie 2010
(v. http://www.uaic.ro/uaic/bin/download/Academic/Doctorate_martie_2010/GfuC.Daniela.pdf)
3
Dominique WOLTON, Les contradictions de la communication politique, n Philippe CABIN (ed.) La
communication. tat des savoirs, d. Sciences Humaines, Paris, 1998, pp. 344-345
4
David D. PERLMUTTER, The Manship School guide to political communication, Baton Rouge, Louisiana
State University Press, 1999, n Clin SINESCU, Comunicare politic, Ed. Universitar, Bucureti, 2007, pp.
166-167
5
Laureniu OITU, Philosophy of communication, Ed. Institutul European, Iasi, 2001
1
87
limbajului n politic are rolul de a sanctifica aciunea 6, ctignd acordul deplin, de durat,
al electoratului.
2.
Metodologia de lucru
n elaborarea concluziilor preliminare privind desfurarea procesului electoral
prezidenial, realizat n perioada octombrie-decembrie 2009, am cules, stocat i centralizat
electronic n dou etape (turul I i turul II al campaniei prezideniale) texte politice,
editorialele a 3 publicaii naionale cu profil comun 7, Evenimentul zilei, Gndul i Ziua,
precum i discursurile politice 8 (n ambele forme: oratoric i dialogic) a celor patru
prezideniabili cotai 9 pe primele patru locuri: Crin Antonescu (PNL), Traian Bsescu (PDL),
Mircea Geoan (PSD+PC) i Sorin Oprescu (independent).
2.1.
Softul LIWC-2007
n componena programului intr un dicionar, care, n varianta originar american,
include 4500 de cuvinte i rdcini de cuvinte. n varianta romneasc acesta are aproximativ
5100 de cuvinte i rdcini (diferena n plus datorndu-se cu precdere mai marii
productiviti lexicale a limbii romne prin flexionare dect a limbii engleze, care a trebuit
oglindit prin includerea mai multor rdcini pentru acelai cuvnt). Rdcinile sunt marcate
prin simboluri terminate prin semnul *.
Fiecrei intrri de dicionar (cuvnt sau rdcin) i este asignat o list de categorii
semantice. Programul incrementeaz contoarele corespunztoare claselor respective la fiecare
detectare a acelui cuvnt (ori a acelei rdcini) n textul de intrare. De exemplu, rdcinii
plictico* i sunt asignate clasele: 125=emoional, 127=emoional_negativ i 130=suprare. De
fiecare dat cnd acest cuvnt ori o variant a lui este detectat n fiierul de intrare, toate cele
3 contoare, corespunztoare claselor menionate, sunt incrementate.
Exist o parial clasificare ierarhic a claselor. De exemplu, orice cuvnt care aparine
clasei suprare aparine i clasei emoional_negativ i toate cuvintele acestei clase aparin i
clasei emoional. n varianta originar, LIWC numr 64 de categorii (sintactice i
semantice) 10, din care noi am reinut 28 de clase, considerate cu un grad optim n
Murray EDELMAN, Politica i utilizarea simbolurilor, Ed. Polirom, Iai, 1999, p. 111
Aceste trei publicaii au profil comun, cf. MediaPress (www.mediapres.ro): sunt cotidiane naionale de
informaie general, se prezint sub form de tabloide, cu un tiraj de la cteva zeci de mii de exemplare pe ediie,
forma tiprit a editorialelor se regsete integral i pe paginile de internet ale celor trei cotidiane monitorizate:
Evenimentul zilei www.evz.ro, Gndul www.gandul.info, Ziua www.ziua.ro.
8
Surse de informare: Crin Antonescu - www.crinantonescu.ro, www.pnl.ro, Traian Bsescu - www.basescu.ro,
www.pdl.org.ro, www.presidency.ro, Mircea Geoan - www.mirceageoana.ro, www.psd.ro i Sorin Oprescu www.sorinoprescu.ro.
9
Amintim sondajul privind alegerile prezideniale, publicat n 12 octombrie 2009. Acesta a fost realizat n
perioada 17 septembrie - 7 octombrie de CSOP, pe un eantion naional de 18.348 de persoane, reprezentativ
pentru populaia n vrst de 18 ani i peste. Eroarea este de 0,7%, iar probabilitatea de 0,95. Intenia de vot:
Traian Bsescu - 37%, Mircea Geoan - 24%, Crin Antonescu - 13%, Sorin Oprescu - 10%.
10
Amintim cele 64 de clase, clasificate n 4 categorii, precedate de un anumit cod regsit n structura
programului LIWC2007: lingvistic (22 de clase) - 1 funct (Total function words), 2 pronoun (Total pronouns), 3
ppron (Personal pronouns), 4 i (1st pers singular), 5 we (1st pers plural), 6 you (2nd person), 7 shehe (3rd pers
singular), 8 they (3rd pers plural), 9 ipron (Impersonal pronouns), 10 article (Articles), 11 verb (Common verbs),
12 auxverb (Auxiliary verbs), 13 past (Past tense), 14 present (Present tense), 15 future (Future tense), 16 adverb
(Adverbs), 17 preps (Prepositions), 18 conj (Conjunctions), 19 negate (Negations), 20 quant (Quantifiers), 21
number (Numbers), 22 swear (Swear words); psihologic (32 clase) - 121 social (Social processes), 122 family
6
7
88
determinarea unei anumite atitudini politice care poate influena decizia de vot. Raportndune la criteriul convingere, pe baza cruia se construiete fiecare etap a discursului politic,
finalitatea urmrit va evidenia legtura ntre proporia claselor predominante n discurs i
opiunea de vot. Menionm c au fost pstrate codurile claselor ca n programul american,
numele clasei fiind tradus n limba romn.
Tabel 1. Descrierea celor 28 de clase reinute n varianta romneasc a softului LIWC-2007
Cod
Clasa
eng.
(abr.)
Clasa rom.
22
swear
injurii
121
social
social
122
123
124
family
friend
human
familie
prieteni
oameni
125
affect
emoional
126
posemo
emoional_pozitiv
127
negemo
emoional_negativ
128
anx
nelinite
129
130
anger
sad
furie
suprare
131
cogmech
raional
132
133
135
136
137
insight
cause
tentat
certain
inhib
intuiie
determinare
nesiguran
siguran
inhibiie
140
percept
perceptiv
141
see
vizual
(Family), 123 friend (Friends), 124 humans (Humans), 125 affect (Affective processes), 126 posemo (Positive
emotion), 127 negemo (Negative emotion), 128 anx (Anxiety), 129 anger (Anger), 130 sad (Sadness), 131
cogmech (Cognitive processes), 132 insight (Insight), 133 cause (Causation), 134 discrep (Discrepancy), 135
tentat (Tentative), 136 certain (Certainty), 137 inhib (Inhibition), 138 incl (Inclusive), 139 excl (Exclusive), 140
percept (Perceptual processes), 141 see (See), 142 hear (Hear), 143 feel (Feel), 146 bio (Biological processes),
147 body (Body), 148 health (Health), 149 sexual (Sexual), 150 ingest (Ingestion), 250 relativ (Relativity), 251
motion (Motion), 252 space (Space), 253 time (Time); preocupri socio-profesionale (7 clase) - 354 work
(Work), 355 achieve (Achievement), 356 leisure (Leisure), 357 home (Home), 358 money (Money), 359 relig
(Religion), 360 death (Death) i paralingvistic (3 clase): 462 assent (Assent), 463 nonfl (Nonfluencies), 464
filler (Fillers).
89
142
hear
auditiv
143
feel
tactil
149
sexual
sexual
354
work
munc
355
achieve
realizri
356
leisure
agrement
357
home
cmin
358
money
bani
359
relig
religie
Au fost eliminate clasele care dau o categorizare asupra prii de vorbire a cuvintelor
(pronume, verbe, adverbe, prepoziii, conjuncii etc.) i implicit asupra timpurilor verbelor
(prezent, trecut, viitor), precum i cteva clase din categorii precum: procese cognitive
(inclusiv, exclusiv), procese biologice (corp, sntate, ingestie), relativitate (spaiu, timp,
micare) etc. n esen softul realizeaz o numrare a apariiei cuvintelor corespunztoare
diferitelor clase semantice, ntorcnd tabele de frecvene. Acestea pot fi apoi uor tranformate
n grafice.
2.2 Alegerea lexicului
Alegerea lexicului englezesc al LIWC-2007 (i a variantei precedente LIWC2001 11) sa fcut n mai muli pai (n perioada anilor 1992-2007):
s-a fcut mai nti o selecie, folosind ca surse dicionare (Rogets Thesaurus .a.),
urmat de sesiuni de brain-storming n care dimensiunile claselor au fost mrite;
colecia astfel obinut a fost apoi trecut n minile a 3 experi, care au lucrat
independent unul de altul. Ei au avut misiunea s decid asupra fiecrui cuvnt, dac trebuia
ori nu pstrat n categoria respectiv, i au avut libertatea de a aduga cuvinte noi. S-a aplicat
apoi un sistem de votare, pentru a decide pe baz de majoritate care cuvinte s fie pstrate;
s-a fcut apoi o evaluare pe un corpus de texte, n urma creia un numr de clase, a
cror reprezentativitate s-a dovedit slab (mai puin de 0.3%), au fost eliminate, dup cum au
fost eliminate i cuvinte a cror rat de apariie n clase a fost mai mic de 0.005%;
Documentaia originar a LIWC menioneaz testele de validitate care au nsoit darea n exploatare a
programului. Se apreciaz c aproximativ 86% din lexicul utilizat curent de indivizii umani n scris ori n vorbire
se regsete n LIWC. Testul s-a fcut pe un corpus englezesc (cules n SUA, Canada i Noua Zeeland) de
aproximativ 167 milioane de cuvinte, incluznd registrele: scrieri emoionale, scrieri neutre din punct de vedere
emoional, tiin, beletristic, blogg-uri i transcrierea vorbirii, pe o perioad care se ntinde aproximativ ntre
anii 1700 i 2007. Unul dintre primele teste de validare ale LIWC a fost efectuat de Pennebaker i Francis n
1996. (v. James W. PENNEBAKER, Martha E. FRANCIS, Roger J. BOOTH, Linquistic Inquiry and Word
Count LIWC2001, Erlbaum Publishers, Mahwah, NJ, 2001 i pe www.erlbaum.com).
11
90
n informatic, simboluri de forma xxx*, unde xxx reprezint un numr oarecare de caractere, se numesc
expresii regulate.
12
91
92
ajutorul utilitarului Excel. n esen, programul primete la intrare unul sau mai multe fiiere
text n care numr apariii ale cuvintelor, ordonate n clase. Am optat pentru genul de
reprezentri grafice de tip funcie, clasele fiind aranjate pe axa orizontal n ordinea
numerelor de cod.
n partea a doua a evalurilor noastre (pentru analizele comparative ale abordrilor
discursive din timpul turului I i turului II) am considerat c valorile pot fi exprimate mai
intuitiv prin cilindri. n interpretarea reprezentrilor grafice a editorialelor celor 3 cotidiane,
dar i a discursurilor politice (att n form oratoric, ct i n form dialogal) ale celor 4
candidai s-a inut cont de pragul limit de 0,5%, considerat suficient pentru ca acea clas
care-l atinge s aib importan n interpretarea discursiv. Desigur, softul d aprecieri globale
n clasele respective, concluziile desprinse aici nu pleac de la un singur text, ci reprezint o
medie pe toat colecia de texte scanate. Utilizarea reprezentrilor de tip funcie pentru
punerea n eviden a unor pattern-uri discursive ale subiecilor ce reprezint, n cele din
urm, ferestre ctre lumile lor interioare (emoionale i cognitive), interpretarea realizndu-se
prin compararea datelor statistice furnizate de program, n trei moduri, pe care le-am denumit
unu-la-unu, unu-la-doi i unu-la-trei, susinute prin formule matematice 13;
Utilizarea instrumentarului informatic n aprecierea discursului politic (prelucrare,
prezentare grafic i interpretare) ne-a ajutat s conturm cteva trsturi distinctive care au
dat o viziune nou asupra tabloului discursiv al candidailor la preedinie i al electoratului
romnesc de la sfritul anului 2009. Din reprezentarea grafic, lum spre exemplificare turul
II de campanie, reiese faptul c votanii care au decis numele noului preedinte, conform
diferenelor observate n graficele de tip unu-la-unu dintre Traian Bsescu i Mircea Geoan
(graficul 1 - discursul oratoric), a fost preferat primul care s-a distins prin abordarea raionalintuitiv (clasa intuiie), ton acuzator (clasa emoional_negativ), n timp ce la adversar,
conform valorilor negative, se remarc preocuparea pentru aspectele lucrative (clasele munc
i bani), abordndu-le deschis (clasa siguran).
13
Graficele
diferenelor
respectiv media(y) reprezint mediile frecvenelor clasei respective pentru x, respectiv y. Graficele trebuie citite
astfel: valorile aflate deasupra axei orizontale sunt cele care prevaleaz la cotidianul/candidatul x fa de
cotidianul/candidatul y, iar cele aflate dedesubtul axei orizontale sunt cele care au valori mai mari la
cotidianul/candidatul y dect la cotidianul/candidatul x. O valoare de zero nseamn egalitatea celor dou mrimi
comparate.
Graficele diferenelor unu-la-doi au fost construite folosind n fiecare clas formula
, n care x, y i z reprezint cele trei cotidiane ce se compar, iar
media(x), media(y) i respectiv media(z) reprezint mediile frecvenelor clasei respective pentru cotidianele x, y
i respectiv z. Valorile aflate deasupra axei orizontale scot n eviden clasele n care primul cotidian prevaleaz
fa de mediile celorlalte dou cu care este comparat, n timp ce valorile de dedesubtul axei orizontale
evideniaz clasele n care, dimpotriv, primul cotidian se plaseaz sub media celorlalte dou. Graficele
diferenelor
unu-la-trei
au
fost
construite
folosind
n
fiecare
clas
formula
, n care x, y, z i t i reprezint pe cei patru candidai ce se
compar, iar media(x), media(y), media(z) i respectiv media(t) reprezint mediile frecvenelor clasei respective
pentru candidaii x, y, z i respectiv t. Valorile aflate deasupra axei orizontale scot n eviden clasele n care
primul candidat prevaleaz fa de mediile celorlali trei candidai cu care este comparat, n timp ce valorile de
dedesubtul axei orizontale evideniaz clasele n care, dimpotriv, primul candidat se plaseaz sub media
acestora.
93
(1)
Diferena medie frecvenelor (Traian Bsescu, Mircea Geoan) - turul II
1.5
0.5
bani
religie
cmin
agrement
munc
realizri
tactil
sexual
vizual
auditiv
inhibiie
perceptiv
siguran
nesiguran
intuiie
determinare
raional
furie
suprare
nelinite
pozitiv
negativ
oameni
emoional
familie
-0.5
prieteni
injurii
social
-1
-1.5
n privina comportamentului discursiv din timpul dezbaterii finale (graficul 2), Traian
Bsescu fa de Mircea Geoan i accentueaz discursul prin cuvinte ce in de percepii
(clasa perceptiv), fiind mai prevztor (clasa inhibiie), n timp ce adversarul su (conform
valorilor negative) este mai nclinat spre afectiv (clasa emoional), manifestndu-se politicos
(clasa emoional_pozitiv), interesul pentru aspectul lucrativ (clasa munc) rmnnd mult
mai pregnant.
(2)
Diferena media frecvenelor dezbatere final (Traian Bsescu, Mircea Geoan) turul II
1.5
0.5
religie
bani
cmin
agrement
munc
realizri
tactil
sexual
vizual
auditiv
perceptiv
inhibiie
siguran
nesiguran
determinare
intuiie
raional
suprare
furie
nelinite
pozitiv
negativ
oameni
emoional
familie
prieteni
injurii
-0.5
social
-1
-1.5
0.5
-1
-1.5
94
religie
bani
cmin
agrement
munc
realizri
tactil
sexual
vizual
auditiv
perceptiv
inhibiie
siguran
nesiguran
determinare
intuiie
raional
suprare
furie
nelinite
pozitiv
negativ
oameni
emoional
familie
prieteni
injurii
-0.5
social
Cotidianul Gndul (graficul 4) se bazeaz cel mai mult pe percepii (clasa perceptiv),
explicnd o stare de fapt (clasa intuiie). Evit, conform valorilor negative, subiectele cu
aspect lucrativ (clasa munc) sau abordrile raionale (clasa raional), tonul prea afectiv
(clasa emoional) sau categoric (clasa siguran), care nu apar la fel de pregnant ca la
celelalte cotidiane monitorizate.
(4)
Diferena media frecvenelor (Gndul, media mediilor frecvenelor (Ziua,
Evenimentul zilei)) - turul II
1
0.5
bani
religie
cmin
agrement
munc
realizri
tactil
sexual
vizual
auditiv
inhibiie
perceptiv
siguran
nesiguran
intuiie
determinare
raional
furie
suprare
nelinite
pozitiv
negativ
oameni
-0.5
emoional
familie
prieteni
injurii
social
-1
-1.5
religie
bani
cmin
agrement
munc
realizri
tactil
sexual
vizual
auditiv
perceptiv
inhibiie
siguran
nesiguran
intuiie
raional
suprare
furie
nelinite
pozitiv
negativ
oameni
emoional
familie
prieteni
injurii
determinare
-1
social
0
-0.5
95
(6)
Diferena media frecvenelor Evenimentul zilei (turul I, turul II)
1
0.8
0.6
0.4
0.2
0
-0.2
bani
religie
cmin
agrement
munc
realizri
tactil
sexual
vizual
auditiv
inhibiie
perceptiv
siguran
nesiguran
intuiie
determinare
raional
furie
suprare
nelinite
pozitiv
negativ
oameni
emoional
familie
prieteni
injurii
-0.6
social
-0.4
religie
bani
cmin
realizri
agrement
sexual
munc
tactil
vizual
auditiv
perceptiv
inhibiie
siguran
nesiguran
determinare
intuiie
raional
suprare
furie
nelinite
pozitiv
negativ
emoional
prieteni
oameni
familie
injurii
-0.4
social
-0.2
4.
religie
bani
cmin
realizri
agrement
sexual
munc
tactil
vizual
auditiv
perceptiv
inhibiie
siguran
nesiguran
determinare
intuiie
raional
suprare
furie
nelinite
pozitiv
negativ
emoional
oameni
familie
prieteni
injurii
-0.8
social
-0.6
Concluzii
La ora actual domeniul prelucrrii limbajului natural a ajuns la o maturitate tiinific
i tehnologic care l face util n activitile derulate de cercettorii din sfera socio-uman.
Totui, ceea ce lipsete este o interaciune susinut i constant a cercettorilor care activeaz
96
n cele dou domenii, care s probeze, pe de o parte, aplicabilitatea n sfera tiinelor sociale i
umane (SSU) a tehnologiilor 14 create de informaticienii care se ocup de prelucrarea textelor
i, pe de alt parte, avantajele pe care cercettorii din SSU le pot obine prin utilizarea n
domeniile lor de interes a tehnologiilor lingvistice.
Pentru a-i da metodei probitatea tiinific, ce permite ataarea de valori simbolice
interpretative n locul unor valori numerice, mai este nevoie de nc o etap, compararea
valorilor obinute de LIWC-2007 varianta romneasc existent cu ceea ce se tie din
analize de alt tip i care au deja o recunoatere oficial ori chiar o anumit notorietate. Dac,
de exemplu, ceea ce am aflat acum prin program (campania prezidenial 2009, supus
testului) c a reprezentat diferena cea mai notabil ntre discursurile candidailor este
confirmat i din alte surse, care, desigur, nu au dect posibiliti de interpretare nuanate i
puin riguroase, datele furnizate n urma acestei cercetri vor deveni suficient de relevante
pentru a reliefa deja nite preferine ale electoratului romnesc ctre un anumit profil cognitiv
definit statistic, prin mijloace riguroase, i vor putea fi preluate n viitor n arsenalul de
instrumente ale campaniilor electorale.
Mulumiri
Teza de doctorat, care a stat la baza cercetrii raportat n aceast lucrare a fost
realizat sub ndrumarea prof. univ. dr. Laureniu oitu. Softul pentru preprocesarea textelor a
fost realizat de drd. Alex Moruz de la Facultatea de Informatic a Universitii Al. I. Cuza
Iai. La realizarea lexicului romnesc am fost ajutat de studenii masteranzi din anul 1 (anul
universitar 2009-2010) de la Masteratul de Lingvistic Computaional a aceleiai faculti,
sub ndrumarea prof. univ. dr. Dan Cristea.
Referine bibliografice
* CABIN, Philippe (ed.) La communication. tat des savoirs, d. Sciences Humaines, Paris,
1998
* CRISTEA, Dan; TUFI, Dan (2002): Resurse lingvistice romneti i tehnologii
informatice aplicate limbii romne, n ICHIM, O. i OLARIU, F.-T. (eds.): Identitatea limbii
i literaturii romne n perspectiva globalizrii, Academia Romn, Institutul de Filologie
Romn A. Philippide, Ed. Trinitas, Iai
* EDELMAN, Murray, Politica i utilizarea simbolurilor, Ed. Polirom, Iai, 1999
* GFU, Daniela, Discursul presei scrise i violena simbolic. Analiza unei campanii
electorale, lucrare de doctorat susinut la Facultatea de Filosofie, Universitatea Al. I. Cuza,
Iai
(v.
http://www.uaic.ro/uaic/bin/download/Academic/Doctorate_martie_2010/GfuC.Daniela.pdf)
A se vedea Dan CRISTEA, Dan TUFI (2002): Resurse lingvistice romneti i tehnologii informatice
aplicate limbii romne, n O. ICHIM i F.-T. OLARIU (eds.): Identitatea limbii i literaturii romne n
perspectiva globalizrii, Academia Romn, Institutul de Filologie Romn A. Philippide, Ed. Trinitas, Iai
14
97
* PENNEBAKER, James W., FRANCIS, Martha E., BOOTH, Roger J., Linquistic Inquiry
and Word Count LIWC2001, Erlbaum Publishers, Mahwah, NJ, 2001 i pe
www.erlbaum.com
* PERLMUTTER, David D., The Manship School guide to political communication, Baton
Rouge, Louisiana State University Press, 1999
* SINESCU, Clin, Comunicare politic, Ed. Universitar, Bucureti, 2007
* OITU, Laureniu, Philosophy of communication, Ed. Institutul European, Iai, 2001
* WOLTON, Dominique, Les contradictions de la communication politique, CNRS ditions,
Paris, 1995
98