Sunteți pe pagina 1din 12

UTILIZAREA TEHNOLOGIILOR DE PRELUCRARE A LIMBAJULUI NATURAL N CONTEXT ELECTORAL: METODA LIWC-20071

Cercet. post-doc Daniela GFU Universitatea Alexandru Ioan Cuza, Iai Abstract
This paper presents and interprets the 2009 presidential campaign through a new computational technique of political discourse linguistic processing (method LIWC-2007 - Linguistic Inquiry and Word Count), providing a rapid and robust possibility to understand the public sphere through political language. The concept behind this method is that the manner in which individuals speak and write represents an open window to their emotional and cognitive worlds. In other words, the vocabulary identifies the emotionalism of a speech. Investigation supports research specialists in political science, being helpful, mainly in the attached social prospects of election campaigns, to measure media reactions of the developments in the political arena. Keywords: political speech, computational technique, linguistic analysis, political language, electoral context

1. Introducere Opiunea pentru un asemenea studiu - prezentarea i interpretarea contextului electoral cu ajutorul tehnicii computaionale de prelucrare lingvistic a discursurilor politice (metoda LIWC-2007 - Linguistic Inquiry and Word Count -, dezvoltat n colaborare de Universitatea din Texas at Austin i Universitatea din Auckland), a evideniat influena discursului politic asupra receptorilor si, discursivitatea politic instituind o realitate posibil i alternativ. Metoda LIWC-2007, a fost aplicat pentru prima dat pentru limba romn pe un corpus discursiv-electoral la finele anului 2009, rezultatele fiind prezentate n luna martie a.c. 2, ofer o posibilitate rapid i riguroas de a nelege sfera public prin intermediul limbajului, mai precis al discursului politic, situat la intersecia a trei spaii simbolice importante: spaiul politic, spaiul public i spaiul comunicaional 3. Limbajul politic, esenial n construirea discursului 4, necesit o abordare interdisciplinar 5 n care lingvistica conlucreaz cu retorica, cu tiinele comunicrii, cu politologia i cu sociologia. Folosirea

Aceast lucrare rspunde tematicii proiectului de cercetare tiinific postdoctoral, propus n iunie 2010, din cadrul Departamentului de cercetare tiinific al Facultii de Informatic i al Facultii de Psihologie i tiine ale Educaiei, domeniul D4 (tiine ale omului i ale societii), proiect finanat prin Programul Operaional Sectorial Dezvoltarea Resurselor Umane, proiectului POSDRU/89/1.5/S/63663: Reea transnaional de management integrat al cercetrii postdoctorale n domeniul Comunicarea tiinei. Construcie instituional (coal doctoral) i program de burse (CommScie). 2 Daniela GFU, Discursul presei scrise i violena simbolic. Analiza unei campanii electorale, tez de doctorat susinut la Facultatea de Filosofie, Universitatea Al. I. Cuza, Iai, 19 martie 2010 (v. http://www.uaic.ro/uaic/bin/download/Academic/Doctorate_martie_2010/GfuC.Daniela.pdf) 3 Dominique WOLTON, Les contradictions de la communication politique, n Philippe CABIN (ed.) La communication. tat des savoirs, d. Sciences Humaines, Paris, 1998, pp. 344-345 4 David D. PERLMUTTER, The Manship School guide to political communication, Baton Rouge, Louisiana State University Press, 1999, n Clin SINESCU, Comunicare politic, Ed. Universitar, Bucureti, 2007, pp. 166-167 5 Laureniu OITU, Philosophy of communication, Ed. Institutul European, Iasi, 2001
1

87

limbajului n politic are rolul de a sanctifica aciunea 6, ctignd acordul deplin, de durat, al electoratului. Metodologia de lucru n elaborarea concluziilor preliminare privind desfurarea procesului electoral prezidenial, realizat n perioada octombrie-decembrie 2009, am cules, stocat i centralizat electronic n dou etape (turul I i turul II al campaniei prezideniale) texte politice, editorialele a 3 publicaii naionale cu profil comun 7, Evenimentul zilei, Gndul i Ziua, precum i discursurile politice 8 (n ambele forme: oratoric i dialogic) a celor patru prezideniabili cotai 9 pe primele patru locuri: Crin Antonescu (PNL), Traian Bsescu (PDL), Mircea Geoan (PSD+PC) i Sorin Oprescu (independent). Softul LIWC-2007 n componena programului intr un dicionar, care, n varianta originar american, include 4500 de cuvinte i rdcini de cuvinte. n varianta romneasc acesta are aproximativ 5100 de cuvinte i rdcini (diferena n plus datorndu-se cu precdere mai marii productiviti lexicale a limbii romne prin flexionare dect a limbii engleze, care a trebuit oglindit prin includerea mai multor rdcini pentru acelai cuvnt). Rdcinile sunt marcate prin simboluri terminate prin semnul *. Fiecrei intrri de dicionar (cuvnt sau rdcin) i este asignat o list de categorii semantice. Programul incrementeaz contoarele corespunztoare claselor respective la fiecare detectare a acelui cuvnt (ori a acelei rdcini) n textul de intrare. De exemplu, rdcinii plictico* i sunt asignate clasele: 125=emoional, 127=emoional_negativ i 130=suprare. De fiecare dat cnd acest cuvnt ori o variant a lui este detectat n fiierul de intrare, toate cele 3 contoare, corespunztoare claselor menionate, sunt incrementate. Exist o parial clasificare ierarhic a claselor. De exemplu, orice cuvnt care aparine clasei suprare aparine i clasei emoional_negativ i toate cuvintele acestei clase aparin i clasei emoional. n varianta originar, LIWC numr 64 de categorii (sintactice i semantice) 10, din care noi am reinut 28 de clase, considerate cu un grad optim n
Murray EDELMAN, Politica i utilizarea simbolurilor, Ed. Polirom, Iai, 1999, p. 111 Aceste trei publicaii au profil comun, cf. MediaPress (www.mediapres.ro): sunt cotidiane naionale de informaie general, se prezint sub form de tabloide, cu un tiraj de la cteva zeci de mii de exemplare pe ediie, forma tiprit a editorialelor se regsete integral i pe paginile de internet ale celor trei cotidiane monitorizate: Evenimentul zilei www.evz.ro, Gndul www.gandul.info, Ziua www.ziua.ro. 8 Surse de informare: Crin Antonescu - www.crinantonescu.ro, www.pnl.ro, Traian Bsescu - www.basescu.ro, www.pdl.org.ro, www.presidency.ro, Mircea Geoan - www.mirceageoana.ro, www.psd.ro i Sorin Oprescu www.sorinoprescu.ro. 9 Amintim sondajul privind alegerile prezideniale, publicat n 12 octombrie 2009. Acesta a fost realizat n perioada 17 septembrie - 7 octombrie de CSOP, pe un eantion naional de 18.348 de persoane, reprezentativ pentru populaia n vrst de 18 ani i peste. Eroarea este de 0,7%, iar probabilitatea de 0,95. Intenia de vot: Traian Bsescu - 37%, Mircea Geoan - 24%, Crin Antonescu - 13%, Sorin Oprescu - 10%. 10 Amintim cele 64 de clase, clasificate n 4 categorii, precedate de un anumit cod regsit n structura programului LIWC2007: lingvistic (22 de clase) - 1 funct (Total function words), 2 pronoun (Total pronouns), 3 ppron (Personal pronouns), 4 i (1st pers singular), 5 we (1st pers plural), 6 you (2nd person), 7 shehe (3rd pers singular), 8 they (3rd pers plural), 9 ipron (Impersonal pronouns), 10 article (Articles), 11 verb (Common verbs), 12 auxverb (Auxiliary verbs), 13 past (Past tense), 14 present (Present tense), 15 future (Future tense), 16 adverb (Adverbs), 17 preps (Prepositions), 18 conj (Conjunctions), 19 negate (Negations), 20 quant (Quantifiers), 21 number (Numbers), 22 swear (Swear words); psihologic (32 clase) - 121 social (Social processes), 122 family
6 7

2.

2.1.

88

determinarea unei anumite atitudini politice care poate influena decizia de vot. Raportndune la criteriul convingere, pe baza cruia se construiete fiecare etap a discursului politic, finalitatea urmrit va evidenia legtura ntre proporia claselor predominante n discurs i opiunea de vot. Menionm c au fost pstrate codurile claselor ca n programul american, numele clasei fiind tradus n limba romn.
Tabel 1. Descrierea celor 28 de clase reinute n varianta romneasc a softului LIWC-2007 Cod 22 121 122 123 124 125 126 Clasa eng. (abr.) swear social family friend human affect posemo Clasa rom. injurii social familie prieteni oameni emoional emoional_pozitiv Descrierea semnificaiei clasei n funcie de lexicurile ataate corespunztor Cuvinte care lezeaz demnitatea/reputaia cuiva. Exemple: afurisit, cretin, jigodie, nemernic, nevrednic... Cuvinte cu referire la apartenena la un anumit grup social. Exemple: celebrare, preedinie, consultaie, eveniment, intervenie... Exemple: clan, fii, nrudire, naiune, prini. Exemple: camarazi, colegi, companioni, membru, partener... Exemple: adult, individ, oreni, personalitate, tipi... Cuvinte care provoac emoii (pozitive sau/i negative), transpun realitatea n zona afectiv. Exemple: abtut, binevoitor, curajos, impasibil, necinstit, revigorant... Cuvinte care provoac emoii pozitive. Exemple: ademenitor, fermector, plcut, tonic, popular... Cuvinte care provoac emoii negative. Regsim o parial clasificare ierarhic - clasele: nelinite, furie, suprare. Exemple: agresiv, cinic, obscen, punga, trndav... Exemple: alarmant, bnuitor, nervos, descumpnitor, tensionat, vulnerabil, refractar. Exemple: agitat, brutal, irascibil, mincinos, ofensator... Exemple: ngrijortor, plicticos, revolttor, trist, pesimist... Cuvinte care exprim un raionament, o judecat. Exemple: buimcit, discernmnt, inventiv, la, precaut... Exemple: ager, explicativ, lmuritor, logic, realist... Exemple: afectat, deductiv, independent, insinuant, manipulator... Exemple: ambiguu, confuz, ipotetic, probabilistic, vag... Exemple: categoric, clar, exact, hotrt, just... Exemple: absent, blocat, descurajat, prevztor, ovitor... Cuvinte n legtur cu facultatea de a percepe vizual, auditiv i tactil. Exemple: aude, consonant, febril, palpabil, observabil... Cuvinte n legtur cu facultatea de a percepe vizual.

127

negemo

emoional_negativ

128 129 130 131 132 133 135 136 137 140 141

anx anger sad cogmech insight cause tentat certain inhib percept see

nelinite furie suprare raional intuiie determinare nesiguran siguran inhibiie perceptiv vizual

(Family), 123 friend (Friends), 124 humans (Humans), 125 affect (Affective processes), 126 posemo (Positive emotion), 127 negemo (Negative emotion), 128 anx (Anxiety), 129 anger (Anger), 130 sad (Sadness), 131 cogmech (Cognitive processes), 132 insight (Insight), 133 cause (Causation), 134 discrep (Discrepancy), 135 tentat (Tentative), 136 certain (Certainty), 137 inhib (Inhibition), 138 incl (Inclusive), 139 excl (Exclusive), 140 percept (Perceptual processes), 141 see (See), 142 hear (Hear), 143 feel (Feel), 146 bio (Biological processes), 147 body (Body), 148 health (Health), 149 sexual (Sexual), 150 ingest (Ingestion), 250 relativ (Relativity), 251 motion (Motion), 252 space (Space), 253 time (Time); preocupri socio-profesionale (7 clase) - 354 work (Work), 355 achieve (Achievement), 356 leisure (Leisure), 357 home (Home), 358 money (Money), 359 relig (Religion), 360 death (Death) i paralingvistic (3 clase): 462 assent (Assent), 463 nonfl (Nonfluencies), 464 filler (Fillers).

89

142 143 149 354 355 356 357 358 359

hear feel sexual work achieve leisure home money relig

auditiv tactil sexual munc realizri agrement cmin bani religie

Exemple: holbat, licrire, lumin, orb, scnteie... Cuvinte n legtur cu facultatea de a percepe auditiv. Exemple: acustic, consonant, rspicat, tcut, surd... Cuvinte n legtur cu facultatea de a percepe tactil. Exemple: ascuit, fragil, estompat, ndemnatic, neputincios... Cuvinte cu conotaie sexual. Exemple: atingere, dezmierdare, ncins, mngie, pipie... Cuvinte cu referire la activiti/instituii specifice muncii. Exemple: calificare, organizaie, departament, privilegii, proiecte... Cuvinte cu referire la aciuni de eficientizare a vieii socio-umane. Exemple: competene, achiziii, faculti, prelegere, succese... Cuvinte cu referire la activitile de recreere. Exemple: artist, camping, cazinou, dans, whisky... Cuvinte cu referire la arealul cminului. Exemple: camer, cldire, decor, mansard, vatr... Cuvinte referitoare la domeniul economico-financiar. Exemple: afacere, avere, conturi, financiar, licitaii... Cuvinte cu referire la zona spiritual. Exemple: Biblie, Dumnezeu, cruce, cretini, milostenie...

Au fost eliminate clasele care dau o categorizare asupra prii de vorbire a cuvintelor (pronume, verbe, adverbe, prepoziii, conjuncii etc.) i implicit asupra timpurilor verbelor (prezent, trecut, viitor), precum i cteva clase din categorii precum: procese cognitive (inclusiv, exclusiv), procese biologice (corp, sntate, ingestie), relativitate (spaiu, timp, micare) etc. n esen softul realizeaz o numrare a apariiei cuvintelor corespunztoare diferitelor clase semantice, ntorcnd tabele de frecvene. Acestea pot fi apoi uor tranformate n grafice. 2.2 Alegerea lexicului Alegerea lexicului englezesc al LIWC-2007 (i a variantei precedente LIWC2001 11) sa fcut n mai muli pai (n perioada anilor 1992-2007): s-a fcut mai nti o selecie, folosind ca surse dicionare (Rogets Thesaurus .a.), urmat de sesiuni de brain-storming n care dimensiunile claselor au fost mrite; colecia astfel obinut a fost apoi trecut n minile a 3 experi, care au lucrat independent unul de altul. Ei au avut misiunea s decid asupra fiecrui cuvnt, dac trebuia ori nu pstrat n categoria respectiv, i au avut libertatea de a aduga cuvinte noi. S-a aplicat apoi un sistem de votare, pentru a decide pe baz de majoritate care cuvinte s fie pstrate; s-a fcut apoi o evaluare pe un corpus de texte, n urma creia un numr de clase, a cror reprezentativitate s-a dovedit slab (mai puin de 0.3%), au fost eliminate, dup cum au fost eliminate i cuvinte a cror rat de apariie n clase a fost mai mic de 0.005%;
Documentaia originar a LIWC menioneaz testele de validitate care au nsoit darea n exploatare a programului. Se apreciaz c aproximativ 86% din lexicul utilizat curent de indivizii umani n scris ori n vorbire se regsete n LIWC. Testul s-a fcut pe un corpus englezesc (cules n SUA, Canada i Noua Zeeland) de aproximativ 167 milioane de cuvinte, incluznd registrele: scrieri emoionale, scrieri neutre din punct de vedere emoional, tiin, beletristic, blogg-uri i transcrierea vorbirii, pe o perioad care se ntinde aproximativ ntre anii 1700 i 2007. Unul dintre primele teste de validare ale LIWC a fost efectuat de Pennebaker i Francis n 1996. (v. James W. PENNEBAKER, Martha E. FRANCIS, Roger J. BOOTH, Linquistic Inquiry and Word Count LIWC2001, Erlbaum Publishers, Mahwah, NJ, 2001 i pe www.erlbaum.com).
11

90

varianta actual (2007) a dicionarului a suferit modificri substaniale fa de varianta 2001. Printre altele, o echip de 4 experi a evaluat care cuvinte, din fondul celor mai frecvente 2000 de cuvinte ale limbii engleze, ar trebui incluse n dicionarul LIWC. Dicionarul LIWC a fost tradus (dup originarul englezesc) n cteva limbi, printre care: spaniol, italian, german, olandez, norvegian, portughez etc. 2.3 Construirea lexicului romnesc innd cont de procesul extrem de sofisticat i de durat dup care s-a constituit dicionarul LIWC-2007, pentru utilizarea n cercetarea descris n aceast lucrare am decis asupra unui proces de localizare prin traducere, n defavoarea unuia n care colectarea dicionarului ar fi fost complet decuplat de varianta englezeasc. Desigur, am fost contieni de riscul major pe care o astfel de decizie l-ar putea avea i care const n obinerea unui lexic puternic influenat de limba englez, prin preluarea termenilor (echivalenilor de traducere) din dicionar, n afara contextelor semantice, ct i invers, prin neincluderea unor termeni curent utilizai n limba romn, dar care nu sunt sugerai imediat de echivalenii originari. Pentru a corecta aceste dezavantaje, procesul de constituire a dicionarului romnesc s-a desfurat n urmtoarele etape: mai nti termenii englezeti s-au tradus, n ordine alfabetic (cu preluarea identic a claselor). n aceast etap s-a decis, pentru fiecare cuvnt ori rdcin inclus, care trebuie s fie familia de rdcini a lui, capabil s asigure o acoperire ct mai bun a variabilitii flexionare, fr ns a capta (prin procesul de pattern-matching) termeni strini de familia avut n vedere; lexicul astfel constituit a fost apoi sortat dup fiecare numr de clas, obinndu-se un numr de 64 de liste (evident, nedisjuncte, datorit posibilitii ca anumii termeni s aparin la mai multe clase); s-au reinut din acestea doar 28 de clase, considerate semnificative pentru acest tip de analiz. cuvintele/rdcinile din fiecare clas au fost apoi sortate alfabetic; s-a evaluat apoi fiecare clas n parte, eliminndu-se cuvintele care puteau introduce ambiguiti i incluznd alte cuvinte/rdcini din sfera sinonimic a celor existente. Acest proces a fost uurat de faptul c s-a lucrat asupra unei clase (sfere semantice) odat. Corectarea n interiorul aceleiai clase are avantajul c ochiul uman poate urmri doar cuvinte din aceeai sfer semantic i poate astfel recunoate uor cnd au fost fcute greeli de clasificare. Totodat, ordonarea alfabetic ofer posibilitatea operrii anumitor optimizri de scriere a familiilor de cuvinte, prin exploatarea jolly-jokerului * (semnul care marcheaz apariia a zero ori mai multe caractere la sfritul rdcinii unui cuvnt) 12; - n final, toate dicionarele asignate claselor au fost puse mpreun, lista astfel obinut s-a sortat din nou alfabetic i s-au eliminat apariiile multiple (prin concatenarea listelor de clase, cu lsarea o singur dat a unui numr de clas n lista unui cuvnt/unei rdcini).

12

n informatic, simboluri de forma xxx*, unde xxx reprezint un numr oarecare de caractere, se numesc expresii regulate.

91

2.4 Optimizri n dicionar n faza corectrii dicionarelor asignate claselor s-au operat o seam de optimizri asupra cuvintelor. Iat o list de exemple: Condensri: modifica*, modificat*, modific*, modificnd nlocuite cu: modific* care are i avantajul de a include i formele: modific, modifici ce ar fi fost ignorate n varianta precedent. Grupuri ce erau cuprinse unul n altul, precum: necesi*, necesit* au fost reduse la necesi* sau grupul: ascul*, ascult, ascult*, ascultare*, ascultat, ascultai, ascult, ascultm, ascultri*, ascultto*, asculi a fost redus la ascul* Completarea cu forme noi: nouti* a fost nlocuit cu: noutate*, nouti* Cuvinte ambigue eliminate: nsu* la clasa 133 (determinare), cu intenia de a genera familia verbului a nsui, pentru c poate genera coliziuni cu nsui a fost transformat n nsuit*. Intrarea prefcut*, form a verbului preface, a fost eliminat din clasa 133 (determinare), pentru c genereaz confuzia cu sensul reflexiv (care este un sens emoional_negativ). Eliminarea unor cuvinte aflate n clase neadecvate: grsim*, eliminat din clasa 140 (perceptiv), pentru c dei grsimea poate fi un aliment i deci e legat de gust, deci de percepie, ea poate avea i sensul de stare a unei fiine grase. Alte observaii n clasa 355 (realizri) sunt incluse att cuvinte care numesc realizare / succes / ncununare (majoritatea) ct i unele care dau nume nfrngerii / nerealizrii / nereuitei. Exemple: mediocr*, neadecva*, necalifica*, necorespunzto*, nendestulto*, nepricepu*, neputincio*, nereuit*, nesbui*, renun*, rata*. 3. Studiu de caz: Alegerile prezideniale 2009 ntregul corpus discursiv selectat din presa scris monitorizat a fost procesat cu softul LIWC-2007 (al crui parametru este calculul de frecven - analiza cantitativ), rezultatele fiind apoi interpretate calitativ (analiza calitativ) pe baza reprezentrilor grafice realizate cu

92

ajutorul utilitarului Excel. n esen, programul primete la intrare unul sau mai multe fiiere text n care numr apariii ale cuvintelor, ordonate n clase. Am optat pentru genul de reprezentri grafice de tip funcie, clasele fiind aranjate pe axa orizontal n ordinea numerelor de cod. n partea a doua a evalurilor noastre (pentru analizele comparative ale abordrilor discursive din timpul turului I i turului II) am considerat c valorile pot fi exprimate mai intuitiv prin cilindri. n interpretarea reprezentrilor grafice a editorialelor celor 3 cotidiane, dar i a discursurilor politice (att n form oratoric, ct i n form dialogal) ale celor 4 candidai s-a inut cont de pragul limit de 0,5%, considerat suficient pentru ca acea clas care-l atinge s aib importan n interpretarea discursiv. Desigur, softul d aprecieri globale n clasele respective, concluziile desprinse aici nu pleac de la un singur text, ci reprezint o medie pe toat colecia de texte scanate. Utilizarea reprezentrilor de tip funcie pentru punerea n eviden a unor pattern-uri discursive ale subiecilor ce reprezint, n cele din urm, ferestre ctre lumile lor interioare (emoionale i cognitive), interpretarea realizndu-se prin compararea datelor statistice furnizate de program, n trei moduri, pe care le-am denumit unu-la-unu, unu-la-doi i unu-la-trei, susinute prin formule matematice 13; Utilizarea instrumentarului informatic n aprecierea discursului politic (prelucrare, prezentare grafic i interpretare) ne-a ajutat s conturm cteva trsturi distinctive care au dat o viziune nou asupra tabloului discursiv al candidailor la preedinie i al electoratului romnesc de la sfritul anului 2009. Din reprezentarea grafic, lum spre exemplificare turul II de campanie, reiese faptul c votanii care au decis numele noului preedinte, conform diferenelor observate n graficele de tip unu-la-unu dintre Traian Bsescu i Mircea Geoan (graficul 1 - discursul oratoric), a fost preferat primul care s-a distins prin abordarea raionalintuitiv (clasa intuiie), ton acuzator (clasa emoional_negativ), n timp ce la adversar, conform valorilor negative, se remarc preocuparea pentru aspectele lucrative (clasele munc i bani), abordndu-le deschis (clasa siguran).
13

Graficele

diferenelor

unu-la-unu au fost construite folosind n fiecare clas formula , n care x si y sunt fie dou cotidiane, fie doi prezideniabili, iar media(x),

respectiv media(y) reprezint mediile frecvenelor clasei respective pentru x, respectiv y. Graficele trebuie citite astfel: valorile aflate deasupra axei orizontale sunt cele care prevaleaz la cotidianul/candidatul x fa de cotidianul/candidatul y, iar cele aflate dedesubtul axei orizontale sunt cele care au valori mai mari la cotidianul/candidatul y dect la cotidianul/candidatul x. O valoare de zero nseamn egalitatea celor dou mrimi comparate. Graficele diferenelor unu-la-doi au fost construite folosind n fiecare clas formula , n care x, y i z reprezint cele trei cotidiane ce se compar, iar media(x), media(y) i respectiv media(z) reprezint mediile frecvenelor clasei respective pentru cotidianele x, y i respectiv z. Valorile aflate deasupra axei orizontale scot n eviden clasele n care primul cotidian prevaleaz fa de mediile celorlalte dou cu care este comparat, n timp ce valorile de dedesubtul axei orizontale evideniaz clasele n care, dimpotriv, primul cotidian se plaseaz sub media celorlalte dou. Graficele diferenelor unu-la-trei au fost construite folosind n fiecare clas formula , n care x, y, z i t i reprezint pe cei patru candidai ce se compar, iar media(x), media(y), media(z) i respectiv media(t) reprezint mediile frecvenelor clasei respective pentru candidaii x, y, z i respectiv t. Valorile aflate deasupra axei orizontale scot n eviden clasele n care primul candidat prevaleaz fa de mediile celorlali trei candidai cu care este comparat, n timp ce valorile de dedesubtul axei orizontale evideniaz clasele n care, dimpotriv, primul candidat se plaseaz sub media acestora.

93

(1)
Diferena medie frecvenelor (Traian Bsescu, Mircea Geoan) - turul II
1.5

0.5

vizual

negativ

nesiguran

emoional

siguran

perceptiv

familie

intuiie

inhibiie

raional

auditiv

pozitiv

furie

nelinite

determinare

suprare

prieteni

munc

cmin

realizri

oameni

sexual

-0.5

-1

-1.5

n privina comportamentului discursiv din timpul dezbaterii finale (graficul 2), Traian Bsescu fa de Mircea Geoan i accentueaz discursul prin cuvinte ce in de percepii (clasa perceptiv), fiind mai prevztor (clasa inhibiie), n timp ce adversarul su (conform valorilor negative) este mai nclinat spre afectiv (clasa emoional), manifestndu-se politicos (clasa emoional_pozitiv), interesul pentru aspectul lucrativ (clasa munc) rmnnd mult mai pregnant.
(2)
Diferena media frecvenelor dezbatere final (Traian Bsescu, Mircea Geoan) turul II
1.5

0.5

vizual

negativ

nesiguran

emoional

siguran

perceptiv

familie

intuiie

inhibiie

raional

auditiv

pozitiv

furie

agrement

nelinite

determinare

suprare

prieteni

munc

realizri

cmin

oameni

sexual

-0.5

-1

-1.5

Referitor la cele trei cotidiane monitorizate n timpul campaniei prezideniale 2009 (Evenimentul zilei, Gndul i Ziua), lum spre exemplificare tot turul II de campanie. Din reprezentarea grafic, conform diferenelor observate n graficele de tip unu-la-doi, Evenimentul zilei (graficul 3) este cel mai preocupat n abordare de aspectul lucrativ (clasa munc), descrierea fiind prevztoare (clasa inhibiie). Dac privim la valorile negative, putem sublinia c descrierile sunt mai puin raionale (clasa raional), acestea fiind mai pregnante la celelalte cotidiane monitorizate.
(3)
Diferena media frecvenelor (Evenimentul zilei, media mediilor frecvenelor (Ziua, Gndul)) - turul II
1.5

0.5

pozitiv

vizual

negativ

nesiguran

emoional

siguran

perceptiv

familie

intuiie

inhibiie

raional

auditiv

furie

agrement

nelinite

suprare

determinare

prieteni

munc

realizri

cmin

oameni

sexual

-0.5

-1

-1.5

94

agrement

religie

injurii

social

tactil

bani

religie

injurii

tactil

social

bani

religie

injurii

tactil

social

bani

Cotidianul Gndul (graficul 4) se bazeaz cel mai mult pe percepii (clasa perceptiv), explicnd o stare de fapt (clasa intuiie). Evit, conform valorilor negative, subiectele cu aspect lucrativ (clasa munc) sau abordrile raionale (clasa raional), tonul prea afectiv (clasa emoional) sau categoric (clasa siguran), care nu apar la fel de pregnant ca la celelalte cotidiane monitorizate.
(4)
Diferena media frecvenelor (Gndul, media mediilor frecvenelor (Ziua, Evenimentul zilei)) - turul II
1

0.5

pozitiv

vizual

negativ

nesiguran

emoional

siguran

perceptiv

intuiie

familie

inhibiie

raional

auditiv

furie

nelinite

suprare

determinare

prieteni

munc

realizri

cmin

oameni

sexual

-0.5

-1

-1.5

Cotidianul Ziua (graficul 5) se evideniaz prin capacitatea de a descrie raional o stare de fapt (clasa raional), de cele mai multe ori pe un ton categoric (clasa siguran) i acuzator (clasa emoional_negativ), evitnd, conform valorile negative, informarea bazat pe percepii (clasa perceptiv), aceasta fiind regsit mai pregnant n editorialele celorlalte dou cotidiane monitorizate.
(5)
Diferena media frecvenelor (Ziua, media mediilor frecvenelor (Evenimentul zilei, Gndul)) - turul II
3 2.5 2 1.5 1 0.5 0

pozitiv

vizual

negativ

nesiguran

emoional

siguran

perceptiv

familie

intuiie

inhibiie

raional

auditiv

furie

agrement

nelinite

suprare

determinare

prieteni

munc

cmin

realizri

oameni

sexual

-0.5 -1

Comparnd abordarea discursiv, ntre cele dou tururi de scrutin, regsit n editorialele celor 3 cotidiane monitorizate, constatm din graficele de tip unu-la-doi c i pstreaz stilul. Astfel, editorialele cotidianului Evenimentul zilei n turul I fa de turul II de campanie (graficul 6) se nscriu n tipul de discurs raional (clasa raional), descriere popular (clasa emoional_pozitiv), un interes mai mare pentru teme din sfera lucrativ (clasa munc). In turul II (conform valorilor negative) descrierea e mult mai acuzatoare (clasa emoional_negativ).

95

agrement

religie

injurii

tactil

social

bani

religie

injurii

social

tactil

bani

(6)
Diferena media frecvenelor Evenimentul zilei (turul I, turul II) 1 0.8 0.6 0.4 0.2 0 -0.2 -0.4
pozitiv negativ vizual perceptiv auditiv realizri inhibiie intuiie furie injurii tactil prieteni raional sexual emoional determinare nesiguran agrement familie nelinite siguran oameni suprare munc religie cmin social bani

-0.6

Editorialele cotidianului Gndul n turul I fa de turul II de campanie (graficul 7) se nscriu n tipul de discurs raional (clasa raional), un interes mai mare pentru teme din sfera lucrativ (clasa munc) descrise raional (clasa raional). Nu se remarc n turul II (conform valorilor negative) schimbri radicale n tonul de abordare, dat fiind c valorile nu depesc 0,5%, pragul minim de interpretare.
(7)
Diferena media frecvenelor Gndul (turul I, turul II) 0.8 0.6 0.4 0.2 0 -0.2 -0.4

pozitiv

negativ

perceptiv

vizual

auditiv

realizri

furie

intuiie

inhibiie

injurii

tactil

prieteni

raional

sexual

determinare

agrement

familie

nelinite

siguran

oameni

suprare

emoional

Editorialele cotidianului Ziua n turul I fa de turul II de campanie (graficul 8) au fost mai pregnant interesate de teme din sfera economic (clasele munc, realizri i bani). n turul II de campanie (conform valorilor negative) observm o tendin mai mare pentru descrierile raionale (clasa raional), pe un ton acuzator (clasa emoional_negativ).
(8)
Diferena media frecvenelor Ziua (turul I, turul II) 1 0.8 0.6 0.4 0.2 0 -0.2 -0.4 -0.6

pozitiv

negativ

perceptiv

vizual

auditiv

realizri

furie

intuiie

inhibiie

injurii

prieteni

raional

tactil

sexual

emoional

agrement

familie

siguran

nelinite

oameni

suprare

munc

determinare

Concluzii La ora actual domeniul prelucrrii limbajului natural a ajuns la o maturitate tiinific i tehnologic care l face util n activitile derulate de cercettorii din sfera socio-uman. Totui, ceea ce lipsete este o interaciune susinut i constant a cercettorilor care activeaz

4.

96

nesiguran

religie

social

cmin

bani

-0.8

nesiguran

munc

religie

social

cmin

bani

n cele dou domenii, care s probeze, pe de o parte, aplicabilitatea n sfera tiinelor sociale i umane (SSU) a tehnologiilor 14 create de informaticienii care se ocup de prelucrarea textelor i, pe de alt parte, avantajele pe care cercettorii din SSU le pot obine prin utilizarea n domeniile lor de interes a tehnologiilor lingvistice. Pentru a-i da metodei probitatea tiinific, ce permite ataarea de valori simbolice interpretative n locul unor valori numerice, mai este nevoie de nc o etap, compararea valorilor obinute de LIWC-2007 varianta romneasc existent cu ceea ce se tie din analize de alt tip i care au deja o recunoatere oficial ori chiar o anumit notorietate. Dac, de exemplu, ceea ce am aflat acum prin program (campania prezidenial 2009, supus testului) c a reprezentat diferena cea mai notabil ntre discursurile candidailor este confirmat i din alte surse, care, desigur, nu au dect posibiliti de interpretare nuanate i puin riguroase, datele furnizate n urma acestei cercetri vor deveni suficient de relevante pentru a reliefa deja nite preferine ale electoratului romnesc ctre un anumit profil cognitiv definit statistic, prin mijloace riguroase, i vor putea fi preluate n viitor n arsenalul de instrumente ale campaniilor electorale. Mulumiri Teza de doctorat, care a stat la baza cercetrii raportat n aceast lucrare a fost realizat sub ndrumarea prof. univ. dr. Laureniu oitu. Softul pentru preprocesarea textelor a fost realizat de drd. Alex Moruz de la Facultatea de Informatic a Universitii Al. I. Cuza Iai. La realizarea lexicului romnesc am fost ajutat de studenii masteranzi din anul 1 (anul universitar 2009-2010) de la Masteratul de Lingvistic Computaional a aceleiai faculti, sub ndrumarea prof. univ. dr. Dan Cristea. Referine bibliografice * CABIN, Philippe (ed.) La communication. tat des savoirs, d. Sciences Humaines, Paris, 1998 * CRISTEA, Dan; TUFI, Dan (2002): Resurse lingvistice romneti i tehnologii informatice aplicate limbii romne, n ICHIM, O. i OLARIU, F.-T. (eds.): Identitatea limbii i literaturii romne n perspectiva globalizrii, Academia Romn, Institutul de Filologie Romn A. Philippide, Ed. Trinitas, Iai * EDELMAN, Murray, Politica i utilizarea simbolurilor, Ed. Polirom, Iai, 1999 * GFU, Daniela, Discursul presei scrise i violena simbolic. Analiza unei campanii electorale, lucrare de doctorat susinut la Facultatea de Filosofie, Universitatea Al. I. Cuza, Iai (v. http://www.uaic.ro/uaic/bin/download/Academic/Doctorate_martie_2010/GfuC.Daniela.pdf)

A se vedea Dan CRISTEA, Dan TUFI (2002): Resurse lingvistice romneti i tehnologii informatice aplicate limbii romne, n O. ICHIM i F.-T. OLARIU (eds.): Identitatea limbii i literaturii romne n perspectiva globalizrii, Academia Romn, Institutul de Filologie Romn A. Philippide, Ed. Trinitas, Iai
14

97

* PENNEBAKER, James W., FRANCIS, Martha E., BOOTH, Roger J., Linquistic Inquiry and Word Count LIWC2001, Erlbaum Publishers, Mahwah, NJ, 2001 i pe www.erlbaum.com * PERLMUTTER, David D., The Manship School guide to political communication, Baton Rouge, Louisiana State University Press, 1999 * SINESCU, Clin, Comunicare politic, Ed. Universitar, Bucureti, 2007 * OITU, Laureniu, Philosophy of communication, Ed. Institutul European, Iai, 2001 * WOLTON, Dominique, Les contradictions de la communication politique, CNRS ditions, Paris, 1995

98