Analiza Datelor Cantitative.: O Scurtă Întroducere În Statistica Aplicată În Științe Socio-Umane

Analiza datelor cantitative.
O scurtă întroducere în statistica aplicată în științe socio-umane
Trebuie să ne amintim că măsurile au fost făcute

pentru om, nu omul pentru măsuri.
Isac Asimov
Scopul cercetării în științele socio-umane este de a face inferențe despre comportamentele,

valorile, dorințele, obiceiurile etc. unei populații, pornind de la datele colectate de la un eșantion
reprezentativ, pe baza unui instrument de colectare a datelor realizat în concordanță cu întrebările
de cercetare, cu ipotezele formulate (dacă acestea există) care pun în ecuație concepte. În
cercetările cantitative, datele colectate sunt convertite în formă numerică (Babbie, E. 2010, p.543)
și analizate cu ajutorul programelor de calculator care au pachete de analiză statistică. În acest
capitol, ne propunem să trecem în revistă principalii indicatori statistici care pot fi calculați și să
folosim două programe (Excel și R studio) de calcul. Facem acestă selecție de programe, lăsând
deoparte SPSS-poate cel mai cunoscut astfel de program, din păcate cu un cost pe măsură, chiar și
pentru pachetul Student- pornind de la premisa că, cu mici diferențe de interfață, toate programele
folosesc aceleași indicatori, fapt ce ușurează învățarea. Menționăm că R Studio este gratuit iar
Excel (și varianta Numbers pentru Mac-uri) este instalat pe majoritatea calculatoarelor.
1.Măsurarea în științele socio-umane
În cercetările cantitative, cele mai multe aspecte de interes pentru cercetător sunt culese -direct
acolo unde este posibil, sau aduse în formă numerică printr-o operație de codare— în formă
numerică, ce poate fi citită mecanic (op.cit. p.543) de către calculator. Acestă transformare a unor
informații adeseori calitative în caracteristici cuantificabile trebuie luată în sens larg al atribuirii
de numere datelor continue sau discontinue (discrete), pe baza unor soluții derivate din teorii
științifice și/sau din alte cercetări empirice.
1.1 Variabile și atribute
Datele culese într-o cercetare sunt variabile, în sensul că variază de la individ la individ (nu are
sens să măsurăm ceva ce este
constant!).Din această perspectivă, o Exhaustivitatea se referă la capacitatea setului de
atribute asociat unei variabile de a acoperi întreaga
variabilă poate fi văzută ca un set logic de plajă de valori posibile.
atribute. De remarcat faptul că setul de Excluderea reciprocă se referă la clasi carea unei
observații cu un singur atribut din set.
atribute care formează o variabilă nu este
un dat în sine ci rezultă din interesul de
cercetare și din definiția operativă a conceptului pecare urmează să-l măsurăm; pentru ca o variabilă
să aibă utilitate în cercetare, trebuie să clasificăm orice observație în corelație cu unul și doar unul
dintre atributele care compun respectiva variabilă. Cu alte cuvinte, un set de atribute care
formează o variabilă, trebuie să aibă două caracteristici: exhaustivitate și excludere reciprocă
(op.cit., p.198- 199).
In practica cercetării, aceleiași variabile i se pot asocia seturi diverse de atribute, stabilirea setului
de atribute fiind o decizie foarte importantă, luată de cercetător pe baza literaturii de specialitate, a
experienței și a întrebărilor de cercetate și ipotezelor formulate.
În cele mai multe cercetări sociale, variabila gen are două atribute: masculin
și feminin; cu toate acestea, există cercetări (who makes the new, de exemplu)
care consideră necesar să stabilească pentru variabila gen un set mai larg de
atribute:
1.masculin 2. feminin 3. transsexual 4. nu se poate estima
captură ecran: setul de atribute pentru variabila ”Sex” folosite în ultimul val de cercetare
(septembrie 2020) al proiectului GMMP-who makes the news, disponibil aici: https://
whomakesthenews.org
fi

Folosind baza de date World Value Survey (accesibilă aici: worldvaluesurvey.org)

identificați setul de atribute pentru variabila religia respondentului (Q289 în ultimul val de
cercetare) și explicați de ce nu este practic să fie utilizat într-o BOP (barometru de opinie
publică) românesc; propuneți un set de atribute fezabil a fi utilizat într-o astfel de cercetare.
1.2. Niveluri de măsurare ale variabilelor
Pentru a realiza măsurători științifice trebuie să ținem cont de obiectul de măsurat, etalonul de
măsură și regulile de atribuire a valorilor (Dicționar de sociologie, 1993, p.347).
Obiectul de măsurat, în științele socio-umane, este alcătuit, potrivit aceluiași dicționar de

sociologie, dintr-o mare diversitate de fapte, fenomene și procese sociale, începând cu cele de
natură macrosocială care privesc societatea globală și sfârșind cu cele de natură microsocială
referitoare la acțiuni, comportamente, relații individuale și de grup. Pentru a se surprinde întreaga
gamă de manifestări ale fenomenelor și proceselor sociale, trebuie avute în vedere atât
determinările numerice cât și nenumerice, cum ar ordinea, redată prin numerale, și chiar
clasi cările, redate prin nume, etichete sau simboluri (ibidem).
Etalonul de măsură reprezintă o

mărime definită, cu care urmează a fi Și în științele naturii procesul de stabilire a etaloanelor a
fost unul dificil și îndelungat. În lucrarea Măsura lucrurilor
comparate aspectele cantitative care (2008), Andreaw Robinson plasează începuturile
măsurătorilor fizice în era glacială, odată cu apariția
caracterizează fenomenele sociale în calendarelor după ciclul lunii inscripționate pe oase. În
vederea determinării lor. Dacă în viziunea sa, unificarea etaloanelor de măsurare s-a impus
odată cu ”rapida evoluție a științei și tehnologiei în secolele
științele naturii (chimie, fizică), al XIX-lea și XX. Oamenii de știință, indiferent de locul în
care lucrau pe glob, aveau nevoie de scale universal valabile
etaloanele de măsură sunt clar și convenabile din punct de vedere matematic pentru
determinate și larg acceptate, în măsurători și calcule.” (p.16)
științele sociale cel mai adesea se

lucrează cu etaloane conceptuale, cu
semnificație relativă, restricționată de delimitările conceptuale ale cercetării
Regulile de atribuire a valorilor (numere, numerale sau simboluri) urmează îndeaproape natura
obiectului studiat și caracteristicile etalonului utilizat în măsurare.
fi

fi

Literatura de specialitate reține patru niveluri de măsură, redate mai jos în ordinea complexității (de la
cel mai simplu, la cel mai complex), proprietățile nivelurilor inferioare fiind cuprinse în cele ale
nivelurilor superioare. Alegerea nivelului și a scalei de măsurare sunt părți importante ale
procesului de proiectare a cercetării, deoarece acestea sunt necesare pentru măsurarea
sistematizată și clasificarea datelor, astfel încât să fie analizate și să tragă concluzii din ele, care
sunt considerate valide. În științele sociale, există patru niveluri și scale de măsurare utilizate în
mod obișnuit: nominal, ordinal, interval și raport.
1.2.1.Nivelul nominal
Acest nivel de măsurare surprinde doar diferențele existente între categorii; atribuirea valorilor se
face strict pe baza relației de egalitate/inegalitate; variabilele nominale sunt formate dintr-o serie
de atribute care satisfac strict condițiile de exhaustivitate și excludere reciprocă. Astfel, variabila
nominală gen, având setul de atribute masculin și feminin, împarte populația analizată în două
categorii între care nu se poate stabili o ordine ci doar se poate afirma:
• că includerea in categoria masculin reprezintă automat excluderea din categoria feminin;
• nu există nicio persoană din populația analizată căreia să nu i se poată găsi loc într-una dintre
aceste două categorii.
Din motive de eficientizare a procesului de codare a datelor, adeseori, în etapa de culegere a
datelor, se atribuie valori aparent ordinale (care stabilesc o ordine 1,2,3 sau a,b,c) atributelor
variabilelor nominale. Facem precizarea că acestea sunt simple nume investite cu funcția de
clasificare și nu stabilesc o relație de tipul mai mic-mai mare între atributele variabilei.
Măsurarea variabilei V1-religie cu atribute ortodox, catolic,

protestant, altă religie și nicio religie și a variabilei V2-religie
cu atribute protestant, ortodox, catolic, altă religie și nicio
religie, pe același corpus de date, returnează distribuții
echivalente.
Rezultatele obținute sunt aceleași, indiferent dacă folosim

primul set de atribute:
sau cel de-al doilea:
Pentru fiecare din ipotezele de cercetare de mai jos,

determinați variabilele nominale și stabiliți, pentru fiecare,
setul de atribute:
H1: procentul jurnalistelor1 care semnează editoriale a crescut

din 1990 până în prezent, în presa quality din România
H2 în postările pe Facebook despre imigranții musulmani sunt

utilizate preponderent emoțiile negative
H3: genul și starea civilă ale utilizatorilor de Instagram

inflențează tipul de poze postate pe această rețea de socializare
Acest nivel de măsurare permite stabilirea (prin numărare):
• frecvenței absolute: reprezintă numărul de unități care corespunde fiecărui atribut al

variabilei măsurate. Se exprimă în unități concrete, reprezentând numărul de unități de analiză
care au un anumit atribut.
• frecvenței relative (procentale): permite analiza structurii unei serii de distribuție a unei
variabile și compararea a două repartiții. Frecvențele relative se obțin raportând frecvența
fiecărei grupe la totalul frecvențelor, după relația:
1 Din totalul jurnalistelor care semnează articole de orice fel
Pentru a sublinia necesitatea utilizării frecvențelor absolute în

studiile comparative, folosim următorul exemplu:
Într-o cercetare despre știrile de televiziune, cercetătorul

decide să analizeze două canale (TVR și Pro TV). Datele
pentru variabila subiectul știrii sunt centralizate în tabelul de
mai jos:
Privind datele de mai sus am fi tentați să spunem că, în perioada

analizată, pe Pro TV au fost de aproape 4 ori (3,64 ori) mai
multe știri despre celebrități decât pe TVR. Această afirmație
este greșită, deoarece, în total, pe Pro TV au fost 237 știri iar pe
TVR doar 104.
Pentru a putea compara cele două serii este necesar calculul
frecvențelor relativă, ca în tabelul de mai jos:
Comparând frecvențele relative ale știrilor despre celebrități

putem trage concluzia, de această dată corectă, că pe Pro TV,
în perioada analizată, au fost de 1,6 ori mai multe știri despre
celebrități decât pe TVR.
În Excel, pentru calculul de frecvențe al variabilelor nominale se folosește funcția COUNTIF iar
frecvențele relative se calculează cu ajutorul formulei (1).
Am folosit pentru exemplul de mai jos o bază de date cu 150 intrări (subiecți ai cercetării) care
are pe coloana L informații despre genul subiecților, cu setul de atribute ”feminin” și ”masculin”.
captură ecran: utilizarea funcției COUNTIF într-o bază de date pentru calculul de frecvențe
ATENȚIE:
pentru menținerea zonei de selectare a datelor, nu uitați să folositi semnul $ care are rolul de a
stabiliza aria de selecție e cazurilor luate în analiză. În caz contrar, după ce ați scris formula în
caseta O5 (pentru calcularea frecvenței atributului ”feminin”), extrapolarea formulei la caseta O6
(cea în care urmează să fie calculată frecvența atributului ”masculin”) va fi făcută pentru setul de
date aflat în L3:L152. In cazul de mai sus nu este complicat de modificat manual, dar atunci când
care setul de atribute este mai mare, se pot produce greșeli. Nu uitați să calculați totalul (cu
ajutorul funcției SUM) și să verificați dacă acesta este egal cu numărul de subiecți.
captură ecran 1: calculul frecvențelor absolute cu adaptarea formulei (1)
În R Studio sunt mai multe modalități de a calcula frecvența (pe unele le voi prezenta ulterior).
Pentru exemplul de mai jos, am salvat baza de date cu numele ”exemplu_baza” și am importat
datele în R.
Dacă mă interesează doar frecvențele absolute, cea mai usoară cale este prin funcția table cu
precizarea căii și, dacă doriți, a altor elemente (useNA=”ifany” include datele lipsă, de exemplu).
Rezultatele returnate sunt identice cu cele din EXCEL.
Dacă doresc să aflu și frecvențele absolute, pot folosi funcția prop.table din pachetul preinstalat
sau tabyl din pachetul janitor. Mai jos, sunt ambele variante.
Indiferent de programul folosit si de modul în care

sunt prezentate rezultatele, putem citi datele astfel: în
baza de date analizată sunt 150 de subiecți, din care
37 femei, adică 24,66% și 113 bărbați, adică 75,33%.
captură ecran 2: calcul frecvența și frecventa

absolută in R
În multe cazuri este util să apelăm la prezentarea grafică a variabilelor. Vom prezenta pe scurt în
această secţiune principalele grafice utilizate în analiza statistică. Variabilele nominale sunt
reprezentate cel mai des prin diagramă-coloană sau prin diagrame circulare. Personal, le prefer
pe acestea din urmă (eventual cu o presortare a rezultatelor în mod crescător sau decrescător)
tocmai pentru a arăta că nu există o ordine firească a atributelor. Voi folosi spre exemplificare
datele din worldvaluesurvy (2020), cu observația că am folosit doar răspunsurile valide, adică am
eliminat non-răspunsurile (nu știu/nu răspund și valorile lipsă din setul de date.
captură ecran 3: reprezentarea grafică a distribuției frecvențelor unei variabile nominale
Pe lângă calculul de frecvente, măsurarea presupune calcularea unor indicatori ai tendinței

centrale, valori sintetice reprezentative pentru întreaga serie studiată. Pentru nivelul nominal de
măsurare se poate calcula un singur astfel de indicator:
Valoarea modală Mo (dominanta seriei) reprezintă valoarea ce caracterizează individul
tipic al populației și se determină prin identi carea atributului care are cea mai mare
frecvență de apariție în corpusul analizat.
10

fi

Folosind datele Eurostat cu privire la statutul marital al personalor cuprinse în recensământul

european din 1991 (date care pot fi descărcate aici: https://ec.europa.eu/
eurostat/databrowser/view/cens_91smsta/default/table?lang=en),
răspundeți la următoarele întrebări:
1.câte persoane necăsătorite trăiau în 1991 în Belgia și cât %

reprezintau ele din totalul populației acestei țări?
2. în ce tară se intregistrează cel mai mare procent de persoane
separate?
Problemele pe care le-ați întâmpinat (eventual) în încercarea de a rezolva problema de mai sus
derivă din faptul că în tabel sunt date obținute din intersecția (cross-tabularea, despre care vom
vorbi mai târziu) a două variabile, ambele nominale: variabila ”statut marital” și variabila ”tară”.
Asfel, variabila statut marital al cetățenilor belgieni are următoarea distribuție:
Răspunsul la prima întrebare rezultă acum cu claritate, nu-i așa?

După cum remarcați, în Belgia, ca de altfel în cele mai multe țări cuprinse în analiza, nu exista,
în 1991, nicio informație oficială despre personele separate. Doar în 3 state sunt culese astfel de
date:
11
de aceea, prima tentație ar fi să răspundem Italia, la cea de-a doua întrebare. Dacă am fi calculat
frecvența absolută, tentația ar părea chiar că se confimă:
Este clar, din datele de mai sus că, din totalul persoanelor separate înregistrate în recensământul
analizat, cel mai mare procent (57,05%) se înregistrează în Italia. DAR, nu asta era
întrebarea.Pentru a răspunde corect la întrebarea 2 este necesar să luăm în considerare și
populația totală a fiecărei țări, astfel:
iar răspunsul este Norvegia, cu un procent de 1,43% din populație.
1.2.2 Nivelul ordinal
Acest nivel induce o relație de ordine (de ordonare) între atributele variabilei. Pe lângă a spune că
două unități de analiză sunt similare sau diferite dacă ținem cont de o anumită variabilă, în cazul
variabilelor ordinale putem spune, de asemenea, că o unitate de analiză este ”mai mult” sau ”mai
puțin” decât alta sub aspectul variabilei măsurate (tonalitatea generală a unui articol este mai
agresivă sau mai puțin agresivă decât a altuia; un om politic folosește în mai mare măsură decât
un altul discursul emoțional în campania electorală, etc.), fără însă a se putea preciza diferențele
12

dintre ele (putem spune despre un articol că este mai homofob sau mai puțin homofob decât un altul,
dar nu putem spune cu cât este mai homofob).
Spre deosebire de nivelul nominal de măsurare, în cazul codării variabilelor ordinale trebuie să
ținem cont de faptul că etichetele asociate atributelor au semnificație de rang. Regula de
atribuire a etichetelor speci că ordine crescătoare sau descrescătoare a atributelor, care sunt ele
însele într-o ordine crescătoare, respectiv descrescătoare.
Să presupunem că dorim să analizăm comentariile din siajul articolelor

despre imigranți cu ajutorul unei variabile ordinale care să surprindă gradul de
acord sau dezacord al comentatorului față de cele scrise în articol. În acest
context, putem folosi oricare dintre formele de mai jos:
Acordul față de articolul comentat:
dar nu putem folosi forma:
Acordul față de articolul comentat:

a. acord total
b. dezacord total
c. acord parțial
d. dezacord parțial
e. nici acord, nici dezacord
ATENȚIE: la acest set de atribute se adaugă, în cazul instrumentelor de

cercetare care presupun obținerea datelor de la respondenți, varianta ”nu
știu/nu răspund”.
Pe lângă frecvența absolută și frecvența relativă, în cazul variabilelor ordinale se pot calcula și:
Frecvența cumulată care atribuie valorii empirice a atributului xi o valoare egală cusuma
frecvențelor tuturor valorilor mai mici sau mai mari decât xi, inclusiv aceea a lui xi, în
funcție de sensul cumulării
13
fi

a.Dacă se calculează cumularea dinspre atributul de nivel minim al variabilei X spre cel
maxim, formula de calcul a frecvenței cumulate este:
b. Dacă se calculează cumularea dinspre atributul de nivel maxim al variabilei X spre cel
minim, formula de calcul a frecvenței retrocumulate este:
Într-o cercetare ce își propune să analizeze amploarea discursului urii în

mediul on-line românesc, măsurăm variabila agresivitatea limbajului și
obținem următoarea distribuție:
14
Folosind graficul de mai jos (din Barometrul de consum cultural 2019, care
poate fi descărcat aici: https://www.culturadata.ro/wp-content/uploads/
2020/12/BCC2019-web- nal.pdf) răspundeți la următoarele întrebări și
precizați ce formulă ați folosit și de ce:
1. care este procentul românilor care merg mai rar de o dată pe lună la
biserică;
2. are este procentul românilor care au mers cel puțin o dată pe an la
bibilotecă pentru a citi sau a împrumuta cărți;
3. care este a treia activitate în funcție de procentul românilor care o fac
lunar sau mai des;
4. dar a doua activitate în funcție de procentul românilor care o fac mai
rar decât lunar?
15
fi

În ceea ce privește indicatorii tendinței centrale, pe lângă modul, se pot calcula:
Mediana: reprezintă valoarea centrală a unei serii statistice, ordonate crescător sau
descrescător, care împarte termenii seriei în două parți egale. Pentru variabilele ordinale se
poate stabili doar locul medianei:
Rezultatul returnat se compară cu frecvențele cumulate; locul medianei îl reprezintă cel mai
mic atribut pentru care:
Fj≥ LMe (5)
Cuartilele: acele valori care împart distribuția variabilei în patru părți egale. Q1, cuartila
inferioară, este mai mare sau egală decât 25% din atributele variabilei; Q2, coincide cu Me
și separă seria în două părți egale ca efectiv; Q3, cuartila superioara, este mai mare sau egală
cu 75% din atributele variabilei.
16

Analog, se pot calcula decilele care divid seria de atribute în zece părți egale. În
acest caz, factorul de divizare al seriei este 10, iar p ia valori între 1 și 9; Q5 coincide
cu Me.
Deoarece acești indicatori ai tendinței centrale sunt mai reprezentativi pentru următorul
nivel de măsurare, în cadrul căruia, pe lângă locul medianei și al cuartilelor se poate
calcula șivaloarea lor, vom exemplifica cu respectiva ocazie modul de calcul.
1.2.3Nivelul de interval și de raport
Pentru anumite variabile valoarea numerică a unui atribut nu se reduce la semnalizarea unei
diferențe sau a intensității unui fenomen ci se pretează la calcule (adunare și scădere, respectiv
împărțire) care permit comparația între date. Variabilele măsurate pe seturi de atribute de acest tip
se numesc variabile de tip interval respectiv variabile de tip raport. Singura diferență între cele
două niveluri de măsurare îl
reprezintă existența unui 0 natural Măsura de interval: descrie o variabilă ale cărei
atribute sunt ordonate și au distanțe egale între
(zero real) care permite, în cazul atributele adiacente.
Măsura de raport: un nivel de măsurare care descrie o
variabilelor de tip raport, inferențe de variabilă ale cărei atribute au toate calitățile măsurilor
nominale, ordinale și de interval și, în plus, sunt bazate
tipul de două ori mai mare sau de pe un punct ”zero real”
Babbie, E.,2010, p.200-201
trei ori mai mic.
În științele sociale, nivelul de

interval presupune o formulă de tipul: pe o scală de la 1 la k, (în România, de obicei 10, datorită
asocierii cu sistemul de notare) unde 1 înseamnă foarte puțin iar k înseamnă foarte mult sau scale
de măsurare complexe, calculate ca sumă de indici, cum este inteligența măsurată printr-un test
standard.
Așa cum remarcă Ioan Mărginean, cel care de nește termenul de măsurare socială în Dicționarul
de sociologie (1993, 347-350), în cercetarea socială, nivelul de interval este doar aproximat prin
intermediul diferitelor tehnici de scalare a intensității opiniilor, atitudinilor, comportamentelor,
fără a se dispune totuși de un model matematic care să ateste în mod riguros egalitatea distanțelor
dintre punctele scalei, bazându-se mai mult pe caracteristicile presupuse ale procesului
discriminatoriu.
17
fi

Nivelul de raport prezintă cele mai multe restricții (ordine, distanță și origine naturală) și de aceea
este dificil de atins în cercetarea socială; în analiza de conținut există o serie de variabile cu caracter
tehnic (numărul de cuvinte al unui articol, durata unei știri, etc.) care se măsoară în acest fel. În
plus, dacă folosim ca unitate de analiză articolul sau știrea, de exemplu, o serie de variabile care la
o prima vedere par nominale, pot deveni variabile de proporție.
Dacă unitatea de analiză a cercetării este știrea, variabila număr de femei în

știre cu setul de atribute continuu 0, 1-3, 4-6, 7-9, 10-12, ≥13 sau cu setul de
atribute discret 1,2……n este de tip interval (zero absolut în acest caz este egal
cu 0)
Deoarece există o unitate de măsură (diferența între două atribute consecutive, n.a.) informația
colectată permite calcularea următorilor indicatori ai tendinței centrale:
Valoarea medianei se calculează printr-un procedeu de interpolare, care pornește de la

presupunerea că, în cadrul intervalului median frecvențele sunt distribuite uniform.
Formula de calcul ține cont limita inferioară a intervalului median (Xme) la care se adaugă
o proporție (K) din diferența între locul medianei (calculat mai sus cu formula 4) și frecvența
cumulată a intervalelor anterioare intervalului median, totul raportat la frecvența
intervalului mediat
18
Pornind de la premisa că cu cât numele unui om politic este mai des menționat
în știri TV, cu atât crește notorietatea acestuia analizăm timp de o lună știrile de
pe un canal TV, măsurând pentru fiecare știre politică în parte, de câte ori este
menționat numele politicianului Popescu2 Distribuția variabilei și modul de
calcul a valorii medianei, în tabelul de mai jos:
19
Complicat, nu-i așa? Ce bine că nu va trebui să faci acest calcul niciodată. Este suficient să
înțelegi ce înseamnă, cum se interpretează rezultatele și, evident, să cunoști formulele de calcul în
Excel și/sau R.
Pentru exemplificarea calcului și modului de interpretare a acestor indicatori (mediană, quartile,

decile) voi folosi o bază de date numită note_examen care colectează următoarele date de la 280
subiecți:
1. nota obținută la examen (coloana A în Excel; nota_examen în R)
2. gen (coloana B în Excel; gen în R)
3. număr de ore de studiu (coloana C în excel; ore_studiu în R)
În Excel se folosește funcția MEDIAN, așa cum rezultă din captura de ecran de mai jos:
captură ecran 4: formula de calcul a medianei în Excel
iar pentru quartile se folosește funcția QUARTILE.INC cu precizarea atât a domeniului de

selecție a datelor cât și a rangului quartilei:
20
Similar, în R se folosește ”median” pentru detarminarea medianei:
captură ecran 6 formula de calcul a medianei în R
Respectiv ”quantile” pentru determinarea cuartilelor:
captură ecran 7 formula de calcul a cuartilelor în R
Toate aceste date pot rezulta din formula ”summary”, care returnează și media (mean, despre care
vom vorbi ulterior):
captură ecran 8 utilizarea funcției summary in R
Informația de mai sus se citește: 50% dintre studenți au obținut note sub/peste 7 la examen
(pentru variabila nota la examen; respectiv, 50% dintre studenți (atenție, nu neaparat aceeași-
pentru asta trebuie să facem un tabel de corelație) au alocat mai puțin de 6 ore de studiu pentru
pregătirea acestui examen. În ceea ce privește cuartilele, citirea este similară: cele mai mici 25%
dintre notele obținute la examen au fost sub 5 sau 25% dintre studenți au luat note sub 5/ peste 9
(a treia cuartilă).
Grafic, în Excel, mediana se poate stabili pornind de la calculul frecvențelor cumulate:
21

captură ecran 9: stabilirea medianei
În R, unei histograme i se poate adăuga mediana (ca de altfel și alți indicatori ai tendinței
centrale) în mod automat, cu ajutorul funcție abline, unde col și lwd reprezintă elemente de
grafică (grosimea liniei și culoarea):
rezultând:
captură ecran 10: stabilirea locului medianei în R (versiunea 1)
22
Acest mod grafic de stabilire a medianei își arată utilitatea atunci când acest indicator al tendintei
centrale trebuie comparat cu media. De exemplu, pentru variabila ore de studiu:
rezultând:
(cu roșu este mediana; iar cu

albastru, media)
captură ecran 11: stabilirea medianei și a mediei într-o histogramă în R
O altă variantă grafică de prezentare a medianei în R este cea în care se folosește funcția boxplot:
rezultând un grafic în care este

evidențiată mediana, cele cuartila 1
(partea inferioară a dreptunghiului),
cuartila 3 (partea superioară a
dreptunghilui), minimul și maximul
(mustățile- wiskers) și excepțiile
23
Acest tip de reprezentare grafică este mai valoros atunci când comparăm mai subpopulații între
ele (de exemplu: gen) sau când încercăm să detectăm aberațiile (statistice) și eventualele erori.
captură ecran 12: stabilirea medianei în două subpopulații
Se citește astfel: Jumătate dintre femeile care au dat examen au alocat studiului maxim 8 ore;
jumătate dintre bărbații care au dat examen au alocat studiului maxim 6 ore. Un sfert dintre
femei au alocat studiului mai între 3 (minim) și 5 (prima cuartilă) ore; similar cu 25% dintre
bărbați. 50% dintre femei au alocat studiului între 5 și 10 ore (prima și a treia cuartilă) îm timp ce
50% dintre bărbați au alocat studiului între 5 și 7,5ore (anticipez puțin și afirm că de aici începe
să fie vizibil că subpopulația masculină ar putea fi mai omogenă decât cea feminină în privința
numărului de ore alocat studiului, dar acestă afirmație trebuie ponderată cu existența acelor
excepții care studiază 12, 13 și respectiv 14 ore și care ar putea să determine, mai ales pe
subpopulații mici cum este aceasta o abatere standard mai mare; voi reveni cu analiza atunci când
vom studia abaterea standard)
24
Extrageți cât mai multe informatii din graficul de mai jos în care sunt prezentate
orele de studiu pentru fiecare dintre subpopulațiile reprezetate din indivizii care
au aceeși notă la examen
Media sintetizează într-o singură expresie numerică toate valorile pe care variabila le
înregistrează în corpusul analizat, punând în evidență ceea ce este esențial și comun tuturor
unităților. La fel ca si mediana, media este un indicator derivat, ce returnează ovaloare care
nu coincide cu niciuna dintre
valorile individuale din care este Variabile discrete: în care atributele pot măsurate cu
un număr limitat de categorii, clar separate între ele
calculată. Pe lângă media

Variabile continue: sunt măsurate pe un continuu care
aritmetică despre care vom vorbi face posibilă o in nitate de gradații între atributele
variabilei
în continuare se pot calcula:
media armonică și media
geometrică. Formulele acestora și explicații despre utilizarea lor sunt accesibile în cărțile de
statistică; pe de altă parte, considerăm că detalierea lor aici depășește scopul acestei lucrări
și, din acest motiv, dacă nu se specifică altceva, atunci când vom face referire la medie vom
avea în minte media aritmetică, a cărei mod de calcul îl vom detalia în cele ce urmează.
25
fi

fi

a. pentru variabile discrete, media se calculează astfel:
b.
b. Pentru variabile continue, este necesar un mic ”artificiu” statistic. Deoarece atributele
sunt de tip interval, pentru a putea calcula media trebuie determinat mijlocul intervalului
cu formula:
unde
ximax-limita maximă a intervalului i
ximin-limita minimă a intervalului i
deoarece, adeseori, ultimul atribut al variabilei este un interval a cărei limită superioară nu
este precizată, pentru calculul mediei se precizează o limită ( e ea naturală, e ținând cont
de valoare celorlalte intervale)
26
:
fi
fi
În EXCEL, funcția de calculare a mediei este AVERAGE cu selectarea domeniului datelor
captură ecran 13: calculul mediei în EXCE
În R, pe lângă funcția SUMMARY care returnează inclusiv media, se poate folosi si formula
MEAN. De remarcat faptul că în R, spre deosebire de EXCEL, se poate calcula direct media
datelor rezultate din suma (dau diferenta) unor variabile
27
L
Extrageți cât mai multe informatii din datele de mai jos, unde sunt calculate
următoarele:
1.media (în două moduri) a două populații statistice (notele la două
examene)
2.mediana, minimul, maximul, cuartilele
3.media mediilor notelor obținute la cele două examene de către fiecare
individ din populație
De ajutor în analiza ar putea fi si cele două histograme în care sunt evidențiate -pentru fiecare în
parte- ei doi indicatori ai tendinței centrale:
se observă că în prima histogramă media și mediana sunt aproape egale (dar un în totalitate), cu o
ușoară deplasare spre notele mari, datorată frecvenței mari luate de nota 10. Deplasarea este
accentată în cel de-al doilea grafic, unde media este mult mai mică decât mediana.
28
Cu cât media și mediana sunt mai apropiate, cu atât mai aproape este distribuția de normală
(curba lui Gauss). O discuție despre acestă funcție depășește limitele lucrării de față, trebuie doar
reținut faptul că multe fenomene aleatoare din natura și societate se supun exact sau aproximativ
acestei legi.
Vom folosi pentru exemplele următoare vom folosi o bază de date în care este măsurată
încrederea într-o serie de produse 790 de indivizi.
Cu funcția SUMMARY, de data asta fără precizarea coloanei, facem o analiză sumară a întregii
baze de date și observăm că avem 3 variabile numerice și una nominală (genul). Mai mult,
observăm că mediana este egală cu 3 pentru toate cele 3 variabile (asta însemnând că pentru
fiecare produs în parte 50% dintre respondenți aleg valori mai mici, respectiv mai mari decât 3
atunci când selectează nivelul de încredere pe o scală de la 1 la 5), ceea ce diferă este media.
în primul caz, media este egală cu mediana, de unde rezultă următorul grafic:
29
în cel de-al doilea caz, media este mai mică decât mediana și rezultă o deplasare a seriei spre
valori mici (putem spune că populația analizată tinde să aibă mai puțină încredere în al doilea
produs decât în primul, deși peste valorile mediane sunt identice în cele două cazuri). Invers,
atunci când media este mai mare decât mediana și când, chiar și în mod grafic, rezultă că
populația analizată înclină spre valorile mari ale variabilei.
Câteodată este necesar să comparăm două subpopulații, iar segmentarea acestora se realizează cu
FILTER în EXCEL și cu funcția subset.dataframe în R.
30
Astfel, punând condiția ca în coloana ”gen” din baza de date ”incredere_produse” să fie
atributul ”feminin”, se selectează într-o nouă baza numită ”incredere_feminin” toate informațiile
care indeplinesc condiția (494 intrări).
Compararea mediilor aduce informație relevantă în analiza datelor, dar câteodată nu este
suficientă. Este posibil ca, în spatele unor medii egale să se ascundă populații cu o distribuție
total diferită.
Vom folosi ca exemplu baza de date note_examen, unde media și mediana notelor obținute de
studenți la examenul 1 și la examenul 3 sunt identice, ceea ce ne-ar putea face să presupunem că
populațiile au avut același comportament:
Desenând cele două histograme, certitudinea dispare:
31

Este clar că cele două populații nu au distribuții identice și că pentru a surprinde acestă diferență
trebuie calculat un nou indicator statistic: abaterea pătratică standaAbaterea pătratică standard
este cel mai des calculat indicator al varianței. Se pot calcula abateri pătratice standard de la orice
valori asociate seriei (medie, mediană sau o valoare din interiorul seriei), dar cel mai des se
calculează abaterea pătratică standard de la medie. Acest indicator intervine, de altfel, în cele
mai multe calcule de corelații statistice și este foarte util în analiza rezultatelor cercetării. Din acest
motiv, dacă nu se speci că altceva, în această lucrare, atunci când vorbim de abaterea pătratică
standard ne gândim la abaterea pătratică standard de la media aritmetică.
Formula de calcul a abaterii medie pătratică este următoarea:
32
fi

Reluând datele din exemplul precedent, calculăm Ϭ
În EXCEL, formula de calcul este STDEV cu selectarea domeniului datelor:
În R, funcția similară este sd
33
Acest indicator măsoară gradul de omogenitate a unei variabile, într-o populație dată
Reluând exemplul de mai sus, cu notele de la cele două examene, calculăm
Devine evident, din comparea celor două abateri standard că notele la primul examen sunt mai grupate în
jurul mediei și implicit populația este mai omogenă (a luat note mai apropiate de medie).
34

Analiza
conținutului
comunicării
lect.univ.dr. Adriana Ștefănel
adriana.stefănel@fjsc.ro
https://www.futurelearn.com/courses/social-media-research-plan
După acest curs studenții și studentele ar trebui:
• să de nească metoda analizei de conținut

• să distingă între abordarile calitative și cele cantitative
ale metodei
https://depositphotos.com/65739929/stock-photo-man-walking-on-stairs.html
• să aplice metoda la o temă de cercetare
fi
Să trăiești în lumea actuală însemnă să te confrunți cu o
multitudine de texte, pe cât de efemere, pe atât de
invadatoare: mesaje publicitare, cărți de telefon, ziare,
a șe, ghiduri turistice, e-mailuri publicitare (….) Enunțuri
peste care aruncăm o privire, le consultăm, dar rareori le
citim în adevăratul sens al cuvântului.
Dominique Maingueneau 2005/2007, p.13

fi
Cantitativ Calitativ
in funcție de gradul de formalizare a ipotezelor
in functie de structura eșantionului
în funcție de rezultatele așteptate

Pe parcursul acestui curs vom utiliza termenul de text
pentru a identi ca datele care constau în cuvinte și/sau
imagini înregistrate fără intervenția cercetătorului.
Caracteristici ale textelor:

•Un text nu este în mod necesar produs de un singur locutor
•În același text pot coexista semne lingvistice și semne iconice
•Un text nu mai este doar un ansamblu de semne pe o pagină
fi
Analiza de conținut reprezintă un set de tehnici de cercetare cantitativă a comunicării, în
scopul identificării și descrierii obiective și sistematice a conținutului manifest al acesteia
(Berelson, B., 1952, apud Wimmer, R., Dominick, J., 2010, p. 157)
Ansamblu de tehnici de cercetare cantitativă a comunicării, constând în identificarea și

descrierea obiectivă și sistematică a conținutului comunicării în vederea formulării unor
concluzii științifice privind personalitatea celor ce comunică, societatea în care se
realizează comunicarea, precum și comunicarea însăși ca interacțiune socială .(C. Zamfir;
L. Vlăsceanu 1993 p. 26)
Analiza conținutului reprezintă o modalitate cantitativ-calitativă de studiere a comunicării,

dar nu numai a conținutului manifest al acestuia, ci și a celui latent. (Chelcea S. 2007,
p.568)
https://whomakesthenews.org/gmmp-2015-reports/
De ce facem analiză de conținut •ca orice artefact, textele sunt accesibile unei lecturi la
nivelul simțului comun;
•Indivizii umani posedă, mai mult sau mai puțin cristalizată,

o concepție cu privire la diferite aspecte și fenomene ale
socioumanului, au explicații și formulează predicții în
legătură cu acestea.
Limite ale cunoașterii comune:
1.Subiectivitatea
2.Particularizarea
3.Înregistrarea legăturilor aparente
4.Observația selectivă: eliminarea disonanței cognitive
5.Lipsa precizie
ascensiunea media și creșterea importanței Dacă există o știință a societăților, ar de așteptat ca acesta să
propagandei/combaterii propagandei nu e o simplă parafrază a prejudecăților tradiționale, ci să ne
facă să vedem lucrurile altfel decât cum le apar ele oamenilor
obișnuiți; căci obiectul oricărei științe este să facă descoperiri
Depășirea simțului comun în și orice descoperire zdruncină mai mult sau mai puțin opiniile
analiza textelor primite de-a gata
E.Durkheim 1895/2002 , p.13

fi
fi

Atenție: analizăm un text pentru a trage concluzii, a face

inferențe de natură psihologică și sociologică
De ce analizăm textele?
• NU valoarea literară a textelor

• NU aflarea adevărului
• NU importanța mesajului
• CI formularea de inferențe asupra particularităților
nonlingvistice ale persoanelor și structurilor sociale
• Apărută ca reacție la subiectivitatea criticii literare

• Implică stabilirea unor categorii, iar apoi numărarea
ocurențelor
Curs: Analiza conținutului comunicării

Subiecte potrivite pentru analiză de text
• Influențe ideologice in discursul jurnaliștilor;

• Stereotipuri de gen în noul val al cinematografiei românești;
• Imaginea românilor în presa britanică;
• Structuri narative în discursul electoral;
• Construirea identității în mediul on-line;
• Teme naționale în mesajele publicitare;

Avantajele analizei de conținut:
• Rigoarea: depășirea impresiei, a afirmațiilor fără acoperire empirică

• Evoluție comparativă
• Caracterul neprovocat al artefactelor studiate
• Cost relativ redus
• Accesibilitatea : studii ”la distanță”
Limite ale analizei de conținut:
• Stabilirea ”obiectivă” a grilei de analiză;

• Interpretarea atitudinilor, valorilor și intențiilor autorului documentului supus investigației nu se rezolvă doar
prin relevarea tendințelor statistice.

Factori favorizanți ai dezvoltării metodei:
• Grija de a identifica mecanismele de influență prin intermediul mass-media

• Apariția societății informaționale
• ”Explozia” siguranței statistice
• Ascensiunea limbajului informatic
Adaptare după Bardin, L., în Moscovici,S., Buschini, F., (coord) 2007, p.298

ATENȚIE: Scopul unei cercetări bazate pe analiză de
conținut este ca înțelegerea materialul analizat să
depășească lectura obișnuită. Acest lucru este posibil
Etapele analizei de conținut : doar dacă se iau toate precauțiunile necesare cu privire la
• Planificarea cercetării: rigoarea științifică.
v Identificarea teoriilor ce configurează tema
v Stabilirea ipotezelor și întrebărilor cercetării În funcție de materialul ce trebuie observat și de problema
v Conceptualizare, operaționalizare, sistem de pe care caută să o rezolve, analistul are la dispoziție un
dispozitiv de operațiuni, cum ar fi: clasamente,
codare (schema de categorii)
condensările, adunările, numărarea, indiciile și altele.
v Eșantionare
El este ca un bucătar ce are la dispoziție o carte de rețete:
• Culegerea datelor inspirația de moment și jongleriile nu sunt excluse,
+10%
v Codarea datelor bucătarul încercând să obțină un preparat cât mai bun.
v Analiza fidelității codării Analistul speră la o interpretare finală temeinică.

Bucătarul adună ingredientele în vederea unui amestec
• Analiza datelor subtil. Analistul elaborează ipoteze pe care speră să le
v Analiza de frecvențe (ocurențe) dovedească pe materiale simbolice. In ambele cazuri,
exisă un demers bazat pe răbdare, iar, uneori, există
v Analiza de corelații (co-ourențe) momente de impas, de rateuri dar și de reușite.
v Analiza de tendința
Bardin, L., în Moscovici,S., Buschini, F., (coord) 2007,
v Analiza de contingență p.299

Atunci când nu sunt utilizate categorii
Schema de categorii: standard, analistul procedează prin încercare și
eroare creând o schemă de categorii originală.
• Conținuturile comunicării urmează să fie

clasificate, introduse în rubrici sau clase
(categorii) relevante
• Stabilirea sistemului de categorii decurge
în mod logic din ipotezele ce trebuie
testate sau din întrebările de cercetare

Unitățile de analiză:
Utilizarea tehnicii analizei de conținut presupune determinarea unităților de înregistrare, de context și de numărare.
• Unitatea de înregistrare: acea parte din comunicare ce urmează a fi caracterizată și introdusă într-una
dintre categoriile schemei de analiză.
• Unitatea de context: acel segment al comunicării care permite a se vedea dacă unitatea de analiză
are orientare pozitivă, neutră sau negativă.
• Unitatea de numărare: are funcție de cuantificare.
Unitatea de numărare:
Unitatea de înregistrare: Unitatea de context:
• Se preferă unitățile de numărare cu caracteristici fizice evidente (lungimea, suprafața,

• Cuvântul sau simbolul constituie cele mai mici
durata).
unități de înregistrare.
• Mărimea unității de context este condiționată de mărimea unității de înregistrare;
• De cele mai multe ori, tema – o aserțiune
despre un anumit subiect – reprezintă unitatea
• Unitățile de înregistrare pot fi reperate în contexte diferite (ex: Avem nevoie de un altfel de președinte…
de înregistrare cea mai convenabilă.
președintele Traian Băsescu nu…) și de aceea, a spune că într-o comunicare au fost reperate unele
cuvinte nu este o informație valoroasă. Nu este același lucru dacă o temă beneficiază de o
expunere pe mai multe pagini sau pe câteva rânduri. De
asemenea nu este lipsit de interes poziționarea sau durata
Alegerea unității de înregistrare are consecințe directe în analiza conținutului; : unei știri în cadrul unui calup de știri.
unitățile de înregistrare foarte mici nu ajută suficient la înțelegerea mesajului.

Procedee de analiză a conținutului:
• Analiza frecvențelor: constă în determinarea numărului de apariții ale unităților de înregistrare în

sistemul categoriilor de analiză.
• Analiza tendinței: pune în evidență orientarea față de subiect.
• Analiza contingenței: evidențierea structurilor de asociere a termenilor dintr-un text.

https://www.bbva.com/en/a-big-data-analysis-of-media-coverage-shines-light-on-covid-19-impact/
https://www.york.ac.uk/study/postgraduate-taught/courses/pgcert-health-research-and-statistics/
Elemente de statistică
lect.univ.dr. Adriana ȘTEFĂNEL
adriana.stefanel@fjsc.ro
ATENȚIE: CALCULE STATISTICE ȘI DURERI DE CAP
sursă:https://in.sagepub.com/sites/default/files/upm-binaries/66078_Priviteria_Chapter_1.pdf
Delimitări conceptuale
populație
combinarea specificificată teoretică a elementelor dintr-un studiu
eșantion
număr de persoane sau unități sociale selecționate
după anumite reguli, pe care urmează să se
realizeze cercetarea
eșantion probabilistic
• eșantion în care selecție unităților de analiză se face pe baza legilor hazardului.
reprezentativitatea eșantionului probabilistic

calitatea unui eșantion de a avea aceeași distribuție a caracteristicilor precum populația din care a fost extras eșantionul
surse:
Cât de mare trebuie să fie un eșantion pentru a fi reprezentativ? Babbie, E.,2010
Chelcea, S.,2008
avem o secție cu 100 clienți potențiali care au note la la 1 la 10 la o ținută propusă spre vânzare:
nota 1: 5 clienți
nota 2: 7 clienți
nota 3: 9 clienți
nota 4: 8 clienți
nota 5: 13 clienți
nota 6: 14 clienți
nota 7: 15 clienți
nota 8: 17 clienți
nota 9: 6 clienți
nota 10: 6 clienți

interpretare medie: dacă toți studenții ar avea aceeași notă la mmc, acesta ar fi
5.77
ce pot să fac cu această informație:

• să o compar cu un obiectiv (la începutul semestrului, mi-am propus ca studenții să aibă media de 6,5)
• să o compar cu altă secție (transversal) sau cu studenții de anul trecut de la aceași secție (longitudinal)
interpretare mediană: dacă am aranja studenții în ordinea notelor la mmc, al 50
student (studentul median) ar avea nota 6
ce pot să fac cu această informație:

• să văd cât de multă materie au învătat 50% (25%, 75% sau 10%) dintre studenții la mmc
• să compar cu media
realitate
ridicăm la pătrat
pentru a nu se adunăm abaterile
abatere individuală
anula individuale și le
xi-xmediu diferențele împărțim la nr de
ex: indivizi
(1-5,77)+(10-5,77)=-0,54
adică:
standard (de obicei media, dar poate fi și altceva)
sau, în R:
68,2 % dintre studenți
3,35 5,77 8,01

feminin masculin
admisi
53 21 32
adică 53% adică 39, 6% din cei admiși
adică 52,2 % din totalul femeilor
adică 21 % din totalul studenților
respinsi
47 19 28
adică 47%
40 60
adică 40% adică 60%
Metode și metodologii de
cercetare în științele comunicării
Curs introductiv
Lect.univ.dr. Adriana Ștefănel

Adriana.stefanel@fjsc.ro
Sursă:https://www.scientificamerican.com/article/unraveling-the-mindset-of-victimhood/
De ce este nevoie de
cercetare în științe sociale?
cercetare în științe sociale te
7.929.085.747
din
23.02.2022 ora 10.00 CET

motive
https://www.worldometers.info/world-population/
Over 1,000 journalists from across the world unite in defence of Julian
Assange
https://morningstaronline.co.uk/article/w/over-1000-journalists-from-across-the-world-unite-in-defence-of-julain-assange
Trăim într-o lume glocală
https://www.discovermagazine.com/technology/sourcemap-slick-app-for-tracking-the-supply-chain-for-your-laptop-or-tuna-or-nutella
https://cen.acs.org/biological-chemistry/genomics/genomic-epidemiology-tracking-spread-COVID/98/i17
https://cen.acs.org/biological-chemistry/genomics/genomic-
epidemiology-tracking-spread-COVID/98/i17
Să identifice și să delimiteze cunoașterea
comună de cunoașterea științifică
După acest curs introductiv

studenții și studentele trebuie să
fie capabilli/le să:
Să înțeleagă limitele gândirii comune
Să înțeleagă necesitatea aplicării gândirii

științifice în activitățile practice
Ceilalți ucenici i-au zis ”Am văzut pe
Domnul!” Dar el le-a răspuns ”Dacă nu voi
vedea în mâinile Lui semnul cuielor, și
dacă nu voi pune degetul meu în semnul
O (foarte scurtă) introducere în
sociologia cunoașterii
cuielor, și dacă nu voi pune mâna mea în
coasta lui, nu voi crede (...)
Tomo, i-a zis Isus, pentru că m-ai văzut, ai
crezut. Ferice de cei ce n-au văzut și au
crezut”
Isus i se arată lui Toma, Ioan 24-28
Gândire Gândire Gândire
magică religioasă științifică
Afirmația ”toate lebedele sunt albe” este
adevărată, până la descoperirea primei
lebede negre. Sau roz!
Gândire
științifică
Indivizii umani posedă, mai mult sau mai puțin cristalizată, o concepție cu privire la diverse aspecte și
fenomene ale socioumanului, au explicații și formulează predicții în legătură cu ele.
• Rotaru&Iluț, 2006, p.12
Indivizii umani posedă, mai mult sau mai puțin cristalizată, o
concepție cu privire la diverse aspecte și fenomene ale
socioumanului, au explicații și formulează predicții în legătură cu
ele.
• Rotaru&Iluț, 2006, p.12
Un articol interesant
https://www.romania-
insider.com/study-facebook-social-
media-romania
http://statistici.insse.ro:8077/tempo-online/#/pages/tables/insse-table Sursă: studiu IRES Sărbători de iarnă în pandemie 2021
https://www.worldvaluessurvey.org/WVSOnline.jsp
Cunoașterea comună (neștiințifică)
Indivizii umani posedă, mai mult sau mai puțin cristalizată, o

concepție cu privire la diverse aspecte și fenomene ale
Surse ale cunoașterii comune: socioumanului, au explicații și formulează predicții în legătură cu
Autoritatea ele.
Tradiția • Rotaru&Iluț, 2006, p.12
Propria experiență
Instanțele de socializare (familie, scoală, grup de egali, media)
Atenție: omul în sine este rareori subiectul științelor sociale.
(E.Babbie, 2020,p.42)
Știința este Teorie, Căutarea

logico-empirică nu filosofie regularităților
sau credințe sociale
Nivel agregat, nu individual

ideografic-nomotetic
Dublete teorii inductive-teorii deductive
conceptuale date calitative-date cantitative

cercetare pură-cercetare
aplicată
Dublete teorii inductive-teorii deductive
conceptuale Observație Teorie
Generalizare Observație
Teorie
Confirmare
Dublete ideografic-nomotetic
conceptuale
Dublete date calitative-date cantitative
conceptuale
Dublete cercetare pură-cercetare aplicată
conceptuale
Gând de final de curs
• De ce avem nevoie de mai multe metode de

cercetare și de mai multe paradigme ca să
explicăm o singură realitate
ipoteze >> concepte >> itemi
adriana.stefanel@fjsc.ro
ipoteze
ipoteza este o propoziție derivată din întrebarea de cercetare a cărei valoare de adevăr urmează a fi stabilită prin cercetare.
Ipoteze:
cuvinte cheie
Femei
Tineri
Din mediul urban
H1: peste x% dintre consumatorii produsului YZ sunt Persoane cu studii superioare/educate
Conservatori
Orientați spre protecția mediului
Ipoteze:
cuvinte cheie
Femei
Tineri
Din mediul urban
Conservatori
Cercetare descriptivă
Ipoteze:
cuvinte cheie
Valoarea de adevăr a ipotezei se
stabilește prin analiză de
frecvență Femei
Tineri
Din mediul urban
Conservatori
Ipoteze:
cuvinte cheie
frecvență Femei
Tineri
Din mediul urban
Conservatori
Date colectate de la
subiecți umani
Ipoteze:
cuvinte cheie
frecvență Femei
Tineri
Din mediul urban
Conservatori
Date colectate de la
subiecți umani
Anchetă cantitativă
Concepte:
tipologii.delimitari conceptuale
Femei
Tineri
Din mediul urban
H1: peste x% dintre consumatorii produsului YZ sunt
Persoane cu studii superioare/educate
Conservatori
Concepte:
Non bărbați
Femei: Variabilă nominală dihotomică
Calcul de frecvențe (procentuale)
Tineri grafic de tip pie (recomandat)
H1: peste x% dintre consumatorii produsului YZ sunt Din mediul urban
Conservatori
Concepte:
Non bărbați
Din mediul urban
Conservatori
Itemi în chestionar:
forma si rezultate asteptate
Non bărbați
Din mediul urban
Conservatori
Q1.Genul dvs. este/sexul dvs. este:
Orientați spre protecția mediului a. Masculin. b.Feminin
1. Feminin 2. Masculin
99. nu răspund
99. nu răspund
Atenție: nu există o ordine firească a atributelor. În

cazul în care etichetele sunt numerice (1,2) asta nu
înseamnă că se pot calcula medii sau alți indicatori
ai tendinței centrale
Q1.Genul dvs. este/sexul dvs. este:

a. Masculin. b.Feminin 99. nu răspund
1. Feminin 2. Masculin 99. nu răspund
Valoarea de adevăr a ipotezei

H1: peste x% dintre consumatorii produsului YZ sunt femei
se stabilește prin compararea procentului de femei obținut din cercetare cu valoarea lui X (stablită inițial)
Concepte:
Variabilă ordinală:
Femei
adolescenți/tineri/adulți/persoane în vârstă
Tineri
Variabilă măsurată pe intervale: 16-20; 21-
Din mediul urban 31… sau pe o scală a vârstelor în ani împliniți
Conservatori
Q2.1: Dumneavoastră suneți:
a. Adolescent
Variabilă ordinală: b. Tânăr
adolescenți/tineri/adulți/persoane în vârstă c. Adult
d. Persoană în vârstă
99.Ns/Nr
Q2.2 Vârsta dvs în ani împliniți

este:
a. 16-20
Variabilă măsurată pe intervale: 16-20; 21- b. 21-35
31… sau pe o scală a vârstelor în ani împliniți c. 36-50 Q2.3 Vârsta dvs în ani împliniți
d. 51-65 este:
e. Peste 65 ………(răspuns deschis)….
99.Ns/Nr 99.Ns/Nr
Q2.1: Dumneavoastră suneți:

a. Adolescent
b. Tânăr
c. Adult
DISTRIBUȚIA ÎN FUNCȚIE DE valori cumulate ale frecvențelor în funcție
d. Persoană în vârstă de vârstă a consumatorilor produsului YZ
VÂRSTĂ A CONSUMATORILOR
99.Ns/Nr PRODUSULUI YZ
145 persoane în vârstă, adulți, tineri
272
adolescenți
adulți, tineri adolescenți 254
tineri adolescenți 201

56
53
18
adolescenți 56
3
ADOLESCENȚI TINERI ADULȚI PERSOANE ÎN NS/NR 0 50 100 150 200 250 300
VÂRSTĂ
forma si rezultate asteptate (media)
Q2.2 Vârsta dvs în ani împliniți este:

a. 16-20
Calculul mediei
b. 21-35
c. 36-50
d. 51-65
e. Peste 65
99.Ns/Nr
forma si rezultate asteptate (media)
Q2.3 Vârsta dvs în ani împliniți

este:
………(răspuns deschis)….
99.Ns/Nr
Indicatorii tendinței centrale calculați pe

variabile de tip interval sunt mult mai de
încredere
Concepte:
Femei
Tineri
Din mediul urban
Conservatori
Concepte:
tipologii.delimitari
conceptuale
Teatru
Cinematograf
Muzeu, expoziție, galerie de artă
Spectacole de muzică (orice gen)
Mers la biblioteca publică pentru a împrumuta sau citi cărți
https://culturadatainteractiv.ro/tendinte-ale-consumului-cultural-in-pandemie/
Construirea instrumentelor de cercetare
În afara testării ipotezelor, instrumentul de cercetare nu are nicio valoare. Chiar și
cele mai banale întrebări dintr-un instrument de cercetare sunt formulate în
conformitate cu ipotezele stabilite anterior.
Întrebarea În ultimele șase luni, în medie, de câte ori pe săptămână v-ați uitat la
emisiunea X implică ipoteza că nu există un număr standard de zile în care oamenii
se uită la emisiunea respectivă.
Tipologii: factual vs. opinional
Q1. În ultima lună, cât de des ați achiziționat haine de pe site-uri specializate:
a. foarte des. b. des. c.rar. d. foarte rar 99.ns/nr
Q2. În ultima lună, cât de des ați achiziționat haine de pe site-uri generaliste:
Q3. În opinia dvs., site-urile generaliste au prețuri mai mari sau mai mici decât site-urile specializate:
a. site-urile generaliste au prețuri mai mari decât site-urile specializate
b. site-urile generaliste și cele specializate au prețuri aproximativ egale
c. site-urile generaliste au prețuri mai mici decât site-urile specializate
99. ns/nr
Tipologii: întrebări închise vs. întrebări deschise
Q1. În ultima lună, cât de des ați achiziționat haine de pe site-uri specializate:
Q2. În ultima lună, cât de des ați achiziționat haine de pe site-uri generaliste:
Q3. Care sunt motivele pentru care ați achiziționat haine de pe site-uri specializate
.....................................................................................................................................................................
99. ns/nr
• Q4. vă voi citi o serie de motive pentru care oamenii cumpără haine de pe site-urile online. Pe o
scală de la 1 la 5, unde 1 înseamnă total dezacord iar 5 înseamnă total de acord în ce măsură
sunteți de acord cu fiecare dintre acestea:
Modă, publicitate, consum
Lect.univ.dr. Adriana Ștefănel
Esantioane posibile= C 100
84023
0 ?
10
0 ?
2 0
0 ?
0 0
0 ?
0 0
Mărimea eșantionului nu este dependentă
direct de mărimea populației ci de criteriile de
selecție și de nivelul de analiză urmărit
?
Putem să folosim ținuta
respectivă în promovarea
magazinului
Medie
Mediană
Abatere
standard
Indicatori ai
tendinței centrale
Medie
Mediană
Abatere
standard
Medie
Mediană
Abatere
standard
Medie
Mediană
Abatere
standard
FOCUS GRUPUL | Interviul
MMC
Istoric
? Originat în al doilea război mondial – eficiența unor programe de radio pentru ridicarea
moralului trupelor;
? Revenită în uz prin cercetările de marketing;
? În fine, din anii 80/90, focus grupul revine în cercetarea științifică;
Ne permit accesul la
Motivațiile comportamentelor umane

Opiniile și atitudinile oamenilor
Răspunsurile lor la probleme practice
Acces la interacțiunea socială și dinamica de grup
Metodă „socială” | reprezentări sociale, credințe, ideologii, prin negocieri discursive de sens.
Întrebarea de bază | Cum gândește „societatea”? sau „Ce zice lumea?”
Răspunsuri create social, nu atât individual. Artificiale, nu așa cum apar ele într-un cadru
spontan.
Poate aborda
? Atitudini publice (subiecte de interes public)

? Comportamente personale (confruntarea cu anumite situații personale)
? Produse
? Candidați
Poate da acces la/ poate fi limitat de
+
? Cum vorbesc oamenii liber pe subiecte de interes
? Interpretarea calitativă a datelor cantitative
? O voce pentru opiniile marginale
-
? Efectul de polarizare*
? Limita subiectelor abordate
? Mai puține idei decât în interviurile semi-structurate
? Întrebări generale fără răspuns
Structură
? 4-12 persoane | eșantionaj calitativ | omogen sau ne-omogen

? Discuții pe baza unor direcții sau întrebări focalizate
? Moderator | dirijează conversația | include participanții | întreține „tensiunile” | ajută la
clarificarea pozițiilor exprimate
? Componența eșantionului: de status diferit sau de același status?
? Structura unui focus-grup:
? Introducere (scopul, prezentările)
? Explicarea regulilor de bază (cum va decurge interacțiunea/conversația)
? Sesiune de întrebări – răspunsuri (script vs adaptare)
? Eventuale aplicații/exerciții
? Gestionarea subiectelor sensibile
Față de alte metode
? Importanța unor subiecte/teme

? Pertinența percepută
? Motivele opiniilor/atitudinilor exprimate
? Diverse legături/corelări
? Înțelegerea modului de a gândi
Analizarea conversației
? Analiza de conținut – teme, subteme | codificare

? Analiza „thematelor” (patternuri conversaționale) | categorii binare | problematizarea
unor tipare din gândirea și limbajul comun
? Analiza progresiei tematice
? Analiza conversațională
INTERVIUL
Metodă calitativă, interactiv-discursivă, ce oferă acces la universul simbolic/de semnificații

ale interlocutorilor;
De ce „de profunzime”?
Structurat vs Nestructurat
„Povești de viață”;
Tipuri de interviuri
STRUCTURATE / directive: întrebări gata-făcute, tematică și ordine fixă;

SEMI-STRUCTURATE/ semi-directive: ghid cu întrebări, fără ordine prestabilită;
LIBER/ non-directiv: ghid tematic, fără ordine prestabilită;
Rezultatele interviurilor
Conținuturi
Forme de limbaj
Expresii non-verbale
metode de cercetare
EXPERIMENTUL ȘI
ANCHETA
lect.univ.dr. Adriana Ștefănel

adriana.stefănel@fjsc.ro
sursă:https://www.futurelearn.com/courses/ethical-research
Experimentul
Un experiment este veri carea unei ipoteze cauzale prin cercetarea situațiilor contrastante, în care sunt controlați toți factorii în
afara celui care interesează, acesta din urmă ind cauza ipotetică sau efectul ipotetic (după Greenwood)
ATENȚIE: controlul factorilor care ar putea

Nota: experimentele sunt
avea efect asupra relației cauzale este
speci ce cercetărilor explicative
foarte important.
Cel mai convențional tip de experiment presupune trei perechi majore de componente:
1. variabile independente și variabile dependente
2. pretestarea și posttestare
3. grupuri experimentale și de control

fi
fi
fi
Un experiment examinează efectul unei variabile independente
asupra unei variabile dependente; de regulă variabila
independentă ia forma unui stimul experimental, care este e
prezent, e absent.
Exemplu de cercetare bazată pe experiment:
Presupunem că o bună cunoaștere a contribuției afro-americanilor la istoria

Statelor Unite va reduce prejudecățile rasiale. (…) Pentru început, putem testa
un grup de subiecți experimentali pentru a determina nivelul lor de prejudecată
împotriva afro-americanilor. Apoi, putem prezenta un lm documentar care
descrie numeroasele modalități importante prin care afro-americanii au
contribuit la dezvoltarea științi că, literară, politică și socială a națiunii. În cele
din urmă, vom măsura din nou nivelul de prejudecată împotriva afro-
americanilor ale subiecților noștri, pentru a determina dacă lmul a avut vreun
impact asupra lor (Babbie, E., p.310)
fi
fi
fi
fi
fi
diferențele între prima și ultima măsurătoare sunt atribuite variabilei independente
pretestare posttestare
problema rezidă din aceea că subiecții - ințe raționale- își dau/pot da seama de scopul experimentului și pot răspunde diferit la
întrebările din al doilea chestionar, chiar dacă atitudinile lor rămân neschimbate.
fi
grup experimental: grup de subiecți cărora li se aplică un stimul experimental
grup de control: grup de subiecți căruia nu i se aplică niciun stimul

experimental sau i se aplică un stimul placebo. Grupul de control trebuie să
e asemănător cu grupul experimental în toate celelalte aspecte.
fi
A/B testing
Probleme de validitate în cercetarea experimentală
1. problema invalidității interne: apare atunci când orice altceva în afara stimulului experimantal poate afecta variabila
dependentă (istoria, maturizarea, părtinirea selecției, difuzarea sau imitarea tratamentelor, compensarea și rivalitatea
compensatorie, demoralizarea)
2. invaliditatea externă: legată de posibilitatea de a genera concluzii experimentelor la ”lumea reală” (validitatea populațională și
validitatea ecologică)
Probleme deontologice în cercetarea experimentală
Experimentele nu trebuie să lezeze integritatea personală și demnitatea umană a indivizilor implicați
o severitate fără milă trebuie să condamne pe cercetătorii care, din interes, din neglijență
sau dintr-o greșală de judecată ar uita că experimentarea pe oameni este diferită (C.
Lauwe, 1971 apud Chelcea 2007, p.438)
ANCHETA
subiecți numeroși, aleși aleatoriu pentru a reprezenta
puțini subiecți, aleși cf. unor populația din care a fost extras eșantionul
speci cații clare ale cercetării
date colectate pe baza unui

datele sunt colectate prin interviu; grila de chestionar cu întrebări și variante de
interviu este schematică, intervievatul are răspuns xe și în ordinea stabilită de
capacitatea de a modi ca direcția cercetător
interviului
nu se poate estima timpul necesar colectării toate elementele generatoare de costuri pot estimate
datelor din faza de proiectare
rezultatele sunt de cele mai multe ori de tip

text rezultatele sunt cuanti cabile și supuse
analizei statistice
AFLU LUCRURI NOI (adesea surprinzătoare)

TESTEZ DACĂ CE ȘTIU ESTE ADEVĂRAT
nestructurată structurată
fi
fi
fi
fi
fi
INTERVIUL
tehnică de obținere, prin întrebări și răspunsuri, a informațiilor verbale de la indivizi și (grupuri umane)
cuvânt cheie: convorbirea
Avantaje: exibilitate, rată mare de

Dezavantaje: cost ridicat, timp îndelungat,
răspunsuri, observarea comportamentelor
distorsionări datorate operatorilor de teren,
nonverbale, asigurarea de răspunsuri
neasigurarea anonimatului, lipsa
personale, studierea unor probleme
standardizării, di cultăți de acces
complexe
fl
fi
FOCUS GRUPUL
îmbină caracteristicile interviului centrat cu cele ale interviului de grup
un defect cercetării cantitative care are ca scop acumularea de informații practice în

cercetarea științi că este faptul că intervievatorul preia conducerea. Adică subiectul
intervievat are un rol mai curând pasiv. Este posibil ca anumite puncte de vedere de
mare valoare să nu e dezvăluite deoarece direcția impusă de chestionarul pe care se
bazează inteviul se îndepărtează de acestea. (Stuart Rice, apud S. Chelcea 309)
Avantaje: permit interacțiunea dintre participanți, sub presiunea grupului se pot produce dezvăluiri oneste/sensibile, exibilitate, permit spontaneitate
fi
fi
fl
ANCHETA BAZATĂ PE CHESTIONAR
Ansamblu de întrebări scrise și, eventual, imagini gra ce, ordonate logic și psihologic, care, prin
administrare de către operatori de anchetă sau prin autoadministrare determină din partea
persoanelor anchetate răspunsuri ce urmează a întegistrate în scris și analizate statistic
rentabilitate economică
pentru colectare
chestionare aplicate:
față-în-față online
CATI
delitate
fi
fi
fi

Analiza Datelor Cantitative.: O Scurtă Întroducere În Statistica Aplicată În Științe Socio-Umane

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Analiza Datelor Cantitative.: O Scurtă Întroducere În Statistica Aplicată În Științe Socio-Umane

Încărcat de

Drepturi de autor:

Formate disponibile

Analiza datelor cantitative.

O scurtă întroducere în statistica aplicată în științe socio-umane

Trebuie să ne amintim că măsurile au fost făcute

Scopul cercetării în științele socio-umane este de a face inferențe despre comportamentele,

1.Măsurarea în științele socio-umane

1.1 Variabile și atribute

1.masculin 2. feminin 3. transsexual 4. nu se poate estima

Folosind baza de date World Value Survey (accesibilă aici: worldvaluesurvey.org)

1.2. Niveluri de măsurare ale variabilelor

Obiectul de măsurat, în științele socio-umane, este alcătuit, potrivit aceluiași dicționar de

Etalonul de măsură reprezintă o

științele sociale cel mai adesea se

• că includerea in categoria masculin reprezintă automat excluderea din categoria feminin;

Măsurarea variabilei V1-religie cu atribute ortodox, catolic,

Rezultatele obținute sunt aceleași, indiferent dacă folosim

sau cel de-al doilea:

Pentru fiecare din ipotezele de cercetare de mai jos,

H1: procentul jurnalistelor1 care semnează editoriale a crescut

H2 în postările pe Facebook despre imigranții musulmani sunt

H3: genul și starea civilă ale utilizatorilor de Instagram

Acest nivel de măsurare permite stabilirea (prin numărare):

• frecvenței absolute: reprezintă numărul de unități care corespunde fiecărui atribut al

1 Din totalul jurnalistelor care semnează articole de orice fel

Pentru a sublinia necesitatea utilizării frecvențelor absolute în

Într-o cercetare despre știrile de televiziune, cercetătorul

Privind datele de mai sus am fi tentați să spunem că, în perioada

Comparând frecvențele relative ale știrilor despre celebrități

captură ecran 1: calculul frecvențelor absolute cu adaptarea formulei (1)

Indiferent de programul folosit si de modul în care

captură ecran 2: calcul frecvența și frecventa

captură ecran 3: reprezentarea grafică a distribuției frecvențelor unei variabile nominale

Pe lângă calculul de frecvente, măsurarea presupune calcularea unor indicatori ai tendinței

Folosind datele Eurostat cu privire la statutul marital al personalor cuprinse în recensământul

1.câte persoane necăsătorite trăiau în 1991 în Belgia și cât %

Răspunsul la prima întrebare rezultă acum cu claritate, nu-i așa?

iar răspunsul este Norvegia, cu un procent de 1,43% din populație.

1.2.2 Nivelul ordinal

Să presupunem că dorim să analizăm comentariile din siajul articolelor

Acordul față de articolul comentat:

dar nu putem folosi forma:

Acordul față de articolul comentat:

ATENȚIE: la acest set de atribute se adaugă, în cazul instrumentelor de

Într-o cercetare ce își propune să analizeze amploarea discursului urii în

În ceea ce privește indicatorii tendinței centrale, pe lângă modul, se pot calcula:

Fj≥ LMe (5)

cu 75% din atributele variabilei.

1.2.3Nivelul de interval și de raport

În științele sociale, nivelul de

Dacă unitatea de analiză a cercetării este știrea, variabila număr de femei în

Valoarea medianei se calculează printr-un procedeu de interpolare, care pornește de la

Pentru exemplificarea calcului și modului de interpretare a acestor indicatori (mediană, quartile,

captură ecran 4: formula de calcul a medianei în Excel

iar pentru quartile se folosește funcția QUARTILE.INC cu precizarea atât a domeniului de

Similar, în R se folosește ”median” pentru detarminarea medianei:

captură ecran 6 formula de calcul a medianei în R

Respectiv ”quantile” pentru determinarea cuartilelor:

captură ecran 7 formula de calcul a cuartilelor în R

captură ecran 8 utilizarea funcției summary in R

Grafic, în Excel, mediana se poate stabili pornind de la calculul frecvențelor cumulate:

captură ecran 9: stabilirea medianei

captură ecran 10: stabilirea locului medianei în R (versiunea 1)

(cu roșu este mediana; iar cu

captură ecran 11: stabilirea medianei și a mediei într-o histogramă în R