Documente Academic
Documente Profesional
Documente Cultură
SP 01notiuni Introductive
SP 01notiuni Introductive
Noţiuni introductive
INTRODUCERE
Statistica face parte din viaţa noastră de zi cu zi într-o măsură mai mare decât ne
imaginăm. Aceasta, în primul rând, pentru că informaţia numerică este omniprezentă.
„Toate lucrurile ce se cunosc au un număr: fără număr nu ne-ar fi cu putinţă să cunoaştem
sau să gândim nimic” (Philolaos, Fragmente din presocratici, sec. V î.e.n., cit. din U. Eco,
Istoria frumuseţii, Ed. Rao, 2005). Informaţiile vehiculate în mass media abundă de cifre
care se referă la cele mai variate aspecte ale realităţii economice, sociale, tehnologice,
medicale etc. Nici psihologia nu face excepţie. Teoriile elaborate în acest domeniu se
sprijină pe cercetări care presupun evaluări numerice, cantitative sau calitative, supuse
apoi unor proceduri de analiză statistică. În al doilea rând, statistică face parte efectivă din
viaţa de fiecare zi. Aplicăm concepte statistice în cele mai variate situaţii de viaţă. Cineva
care doreşte să cumpere un CD cu muzică şi ascultă câteva zeci de secunde pentru a se
decide, nu face decât să pună în practică un model statistic bazat pe eşantionare şi decizie
probabilistă. La un alt nivel, decizia de a ne căsători cu cineva sau opţiunea pentru o
anumită profesie, sunt tot decizii de natură statistic probabilistă. În ambele situaţii enunţate
estimăm o serie de caracteristici şi facem predicţii asupra „şansei de succes” a deciziei pe
care o luăm. Atunci când, la apariţia pe stradă a unei mingi, şoferul reduce viteza o face
pentru că estimează creşterea probabilităţii de apariţie a unui copil imprudent care doreşte
să recupereze. Desigur, nu întotdeauna acest lucru este adevărat, dar ignorarea acestei
probabilităţi poate avea consecinţe tragice. Exemplele ar putea continua la nesfârşit. În fapt,
toate fiinţele vii, funcţionează ca nişte mecanisme statistice fine şi supersofisticate, chiar
dacă actele lor nu decurg în mod formal din prelucrări numerice.
Modalităţile cunoaşterii comune, enunţate mai sus, nu sunt prin ele însele lipsite de
valoare. Deşi nu pot constitui argumente pentru enunţarea de concluzii generalizabile, ele
pot sluji în calitate de furnizoare de probleme şi ipoteze de cercetare. În nici un caz însă
nu pot înlocui demersul doveditor al metodei ştiinţifice. Aceasta reprezintă o modalitate
de abordare empirică şi sistematică a manifestărilor realităţii, indiferent de natura lor şi
este, de aceea, comună tuturor cercetătorilor ştiinţifici, fie ei fizicieni, biologi, medici,
astronomi sau psihologi.
Un demers de tip ştiinţific este, în esenţă, un proces sistematic testare a ipotezelor
prin proceduri de recoltare de date empirice, evaluare şi interpretare a acestora, predicţii
şi decizii cu privire la validitatea acestor predicţii. În domeniul psihologiei, obiectivul
fundamental al metodei ştiinţifice este înţelegerea, explicarea şi predicţia
comportamentului uman şi proceselor mintale. În acest proces, statistica nu face decât să
pună la dispoziţie un set de proceduri de calcul şi de raţionamente decizionale cu privire la
semnificaţia datelor de cercetare. Rolul statisticii este acela de a descrie, de a face
predicţii şi de a conferi credibilitate datelor de observaţie. Ea nu exclude intuiţia, ci o
supune unui control critic. Să presupunem că un psihoterapeut intuieşte că depresia
cronică a uneia dintre pacientele sale poate fi pusă în legătură cu faptul că este mică de
statură. În raport cu acest caz singular el îşi poate verifica intuiţia prin dialogul terapeutic,
dar dacă doreşte să probeze faptul că în general femeile scunde sunt mai predispuse la
depresie cronică, va trebui să iniţieze un proces de cercetare.
Aceste sunt doar câteva dintre aspectele care argumentează că statistica este un
demers esenţial al metodei ştiinţifice în psihologie. Dar, în acelaşi timp, nu trebuie să
uităm că nici statistica şi nici metodologia de investigare psihologică (teste, dispozitive
computerizate etc), oricât de sofisticate ar fi, nu dau psihologiei, prin ele însele, un
caracter de ştiinţă. Ştiinţa este o metodă, un model de cunoaştere a realităţii, o cale prin
care se explorează necunoscutul şi se fac previziuni. Statistica, la fel ca şi metodele
psihologice, nu sunt decât instrumente utile, indispensabile, pentru abordarea ştiinţifică a
fenomenelor psihice.
Măsurarea în psihologie
Scopul oricărei măsurări este, într-un fel sau altul, mai direct sau mai puţin direct,
acela de a trage concluzii şi de a susţine raţionamente. De aceea, conştientizarea
procesului de măsurare este importantă pentru:
> Cunoaşterea tipurilor de transformări la care putem spune în mod legitim
valorile rezultate prin măsurare. De exemplu, dacă am măsurat distanţa în
centimetri, ştim că o putem transforma în inch prin aplicarea unei reguli,
fără a altera semnificaţia valorilor. Sau, în cazul grupului de tinere fete,
dacă am măsurat culoarea ochilor şi am atribuit valorile 1, 2, şi 3 pentru
fiecare culoare, vom şti că nu putem calcula media culorii ochilor
grupului, aşa cum putem calcula media de înălţime a acestuia.
> Evitarea concluziilor lipsite de sens. De exemplu, dacă azi sunt afară 20 de
grade C şi ieri au fost doar 10, nu putem spune că azi este de două ori mai
cald, ci că este cu 10 grade mai cald decât ieri.
> Alegerea procedurilor statistice adecvate datelor numerice şi scopurilor pe
care ni le propunem. De exemplu, nu vom putea alege proceduri de tip
1
Modalităţi de etalonare, standardizare a seriilor(eşantioanelor) de valori sau scoruri,
primare sau brute
„metric” (cantitativ) atunci când variabila dependentă este de tip „non-
metric” (calitativ).
Statistica operează cu valori, numerice sau de altă natură, care rezultă dintr-un
proces de măsurare. Dar numerele, deşi au aceeaşi formă, nu sunt asemănătoare unele cu
altele. Ele pot avea diferite semnificaţii sau proprietăţi în funcţie de tipul de măsurare din
care rezultă. În funcţie de cantitatea de informaţie pe care o reprezintă valorile, ca rezultat al
procesului de măsurare, putem distinge mai multe tipuri de scale de măsurare (Stevens,
1946): nominală, ordinală, de interval şi de raport. Aceste scale trebuie înţelese ierarhic,
ordonate după anumite criterii care se referă la sistemul de măsurare, astfel încât, fiecare
scală include criteriile tuturor scalelor inferioare.
Scala nominală
Scala de interval
Scala de raport
Valorile exprimate pe o scală de raport deţin cel mai înalt grad de măsurare. Pe
lângă egalitatea intervalelor, specifică scalei de interval, acest tip de valori se raportează
şi la o valoare 0 absolut (nu este posibilă nici o valoare mai mică de 0). Din acest motiv,
este permisă aprecierea raportului dintre două valori.
Exemple:
• dacă ne referim la temperaturi, atunci scala Kelvin, este un bun exemplu
(0 Kelvin este temperatura minimă absolută)
• timpul
• numărul de răspunsuri corecte sau de erori, la un test psihologic
În psihologie puţine sunt variabilele acceptate ca fiind măsurate pe scală de raport,
deoarece sunt puţine situaţiile în care avem de a face cu caracteristici ce pot lua valoarea 0
absolut.
La fel ca şi valorile măsurate pe scale de interval, valorile măsurate pe scală de
raport suportă toate transformările matematice posibile. Din acest motiv, în practică,
valorile măsurate pe scală de interval sau de raport sunt considerate similare, fiind
prelucrate prin acelaşi gen de proceduri statistice. Ca urmare, în acest caz, se spune că o
variabilă este măsurată pe o „scală de interval/raport”2.
Dacă luăm în considerare proprietăţile numerice şi tipul de transformări suportate
de fiecare scală de măsurare, atunci ordinea crescătoare a acestora este nominal-ordinal-
interval-raport. Din acest punct de vedere se poate chiar spune că scalele de măsurare se
plasează pe o scală ordinală.
Deoarece, uneori, scalele de măsurare sunt dificil de înţeles şi, mai ales, pentru că
operarea unei distincţii clare între acestea este de importanţă crucială pentru operarea cu
procedurile statistice, vom analiza în continuare câteva situaţii concrete.
2
Mai mult, chiar, în programele de prelucrări statistice se utilizează termenul generic de
„scală”, pentru a desemna o variabilă măsurată pe scală de interval/raport.
(a) Avem o variabilă numerică (să zicem coeficientul de inteligenţă, măsurat în
unităţi QI), pe care o transformăm în clase sau categorii (frecvenţe grupate). Asta
presupune că am creat o nouă variabilă care prezintă o altă valoare (cea atribuită clasei)
corespunzătoare fiecărei valori „originale”. De exemplu, pentru orice valoare QI între 85-
89, atribuim valoarea convenţională „1”, pentru valorile cuprinse între 90-94, atribuim
valoarea „2”, ş.a.m.d. Întrebarea este, pe ce scală sunt reprezentate valorile
corespunzătoare claselor de frecvenţe grupate?
Răspuns: ordinală categorială
Argumente:
• Valorile atribuite claselor reprezintă simple „denumiri” („etichete”,
identificatori numerici) ale acestora. Cu toate acestea, ele sunt legate
de proprietăţile cantitative ale caracteristicii măsurate, care prezintă o
variaţie cantitativă ordonată natural. În acelaşi timp, utilizarea pentru
acest tip de variabilă a procedurilor statistice tipice pentru variabilele
categoriale, nu este greşită.
• Valorile corespunzătoare grupelor de frecvenţă nu au proprietăţi
aritmetice. Nu putem calcula, în mod legitim, media lor, de exemplu.
(c) Avem un chestionar de evaluare a atitudinii faţă de risc, să zicem. Fiecare item
(întrebare) este de forma: În ce măsură sunteţi atras de experienţe noi, neobişnuite, cu
răspunsurile: Foarte mică măsură (1), Mică măsură (2), Oarecare măsură (3), Mare
măsură (4), Foarte mare măsură (5). În acest caz, ce scală de măsurare statistică se
utilizează? Desigur, ordinală.
> Fiecare valoare are semnificaţie prin raportare la celelalte şi nu ca valoare în sine.
Dar, chestionarul nostru conţine, să zicem, 30 de itemi similari cu cel de mai sus.
Pentru fiecare răspuns subiectul primeşte un punctaj egal cu valoarea asociată
(între paranteze). La urmă, se calculează un scor de risc care exprimă preferinţa
pentru risc a fiecărui subiect. Pe ce scală se consideră variabila scor de risc?
> Există controverse teoretice cu privire la răspunsul la această întrebare. Totuşi,
răspunsul uzual este „scală de interval” dar există şi cercetători care consideră că
răspunsul cel mai adecvat este „scală ordinală”.
> Argumente pentru „scală de interval”: Valorile variabilei scor de risc nu rezultă
prin comparaţia uneia cu cealaltă, ci prin adiţionarea „punctajului” realizat de fiecare
subiect, pe baza unei reguli identice pentru toţi („etalon extern”). Scorul astfel
obţinut se compune din unităţi (puncte) abstracte, „egale” între ele. Ca urmare, cu
acest scor se pot efectua transformări aritmetice uzuale.
Exemplele de mai sus ridică o problemă delicată, aceea a legăturii cauzale dintre
variabile. Modul de formulare a exemplelor prezentate poate sugera ideea că în cazurile
respective am putea face aprecieri de natură cauzală: „relaxarea cauzează creşterea
performanţei”, „fumatul are efecte asupra stării emoţionale”. În realitate, aceste afirmaţii nu
sunt de loc justificate prin simpla utilizare a unor proceduri statistice, oricât de precise
sau de sofisticate ar părea acestea.
Cronbach (1957) face distincţie între două „discipline psihologice”, de fapt, între
două metode de abordare a cunoaşterii în psihologie, metoda experimentală şi metoda
corelaţională. În cazul studiilor experimentale, cercetătorul nu se limitează la măsurarea
variabilei independente, ci o şi manipulează. De exemplu, dacă analizăm rezultatele a
două grupe de trăgători la ţintă, unii care au efectuat în prealabil şedinţe de relaxare şi
alţii care nu au efectuat, avem de a face cu un studiu numit „corelaţional”. Pe baza lui
putem constata dacă există o legătură între cele două variabile, dar în nici un caz dacă
relaxarea determină („cauzează”) creşterea performanţelor. Rezultatele ar putea fi
influenţate pur şi simplu prin efectul de mobilizare suplimentară pe care îl creează
includerea subiecţilor într-un program de studiu. Dacă dorim să fim absolut siguri de
relaţia cauzală dintre exerciţiile de relaxare şi performanţa ţintaşilor, iniţiem un studiu
experimental, în care „controlăm” variabila relaxare. În acest scop, putem evalua
performanţa trăgătorilor la ţintă în zilele în care au efectuat relaxare, comparativ cu zilele în
care nu au efectuat relaxare, având grijă să nu intervină alte variabile care să influenţeze
rezultatele. Concluziile unui astfel de studiu pot fi interpretate în mod cauzal.
În cazul studiilor numite corelaţionale, variabilele dependente şi independente
sunt măsurate în condiţii care nu permit inferenţe de tip cauzal. Aplicarea unui test de
personalitate unor categorii de subiecţi (diferenţiate prin sex, vârstă, de ex.), compararea
rezultatelor între categorii şi constatarea existenţei unor diferenţe, fie şi semnificative
statistic, nu înseamnă că personalitatea este „influenţată” de apartenenţa la o anumită
categorie. Totuşi, rezultatele studiilor „corelaţionale” pot fi interpretate uneori în termeni
cauzali, utilizând teorii existente sau ipoteze, dar astfel de rezultate nu pot constitui în
nici un caz o dovadă a unei relaţii de tip cauzal.
În psihologie, ponderea studiilor corelaţionale este mult mai mare decât a celor
experimentale, care sunt mai pretenţioase şi mai dificil de realizat. Ceea ce nu înseamnă
că studiile „corelaţionale” nu sunt relevante. Ar trebui să mai adăugăm ideea că prin
studiu „corelaţional” nu se înţelege o cercetare în care se utilizează „coeficientul de
corelaţie”, care este doar unul dintre testele statistice, şi despre care vom mai târziu, ci
utilizarea oricărui tip de test statistic care urmăreşte punerea în evidenţă a legăturii dintre
variabile, fără ca datele cercetării să fi fost obţinute într-un context experimental. Pentru
evitarea confuziei, unii autori folosesc termenul de „studiu observaţional” în loc de
„corelaţional” (Runyon et. al, 1996).
Populaţie şi eşantion
Exemple:
- Într-un studiu asupra efectelor accesului la internet asupra elevilor de liceu,
elevii de liceu reprezintă „populaţia”, iar elevii selecţionaţi pentru investigaţie,
„eşantionul”.
- Într-un studiu care vizează influenţa inteligenţei asupra performanţei în
instruirea de zbor, populaţia este reprezentată de toţi piloţii, iar eşantionul, de subiecţii
incluşi în studiu.
Dacă am reuşi recoltarea datelor cu privire la întreaga populaţie care face obiectul
cercetării, am putea trage concluzii directe cu privire la aceasta prin utilizarea
indicatorilor statistici descriptivi cunoscuţi (medie, dispersie, abatere standard) numiţi şi
„parametrii populaţiei”. Dar acest lucru nu este aproape niciodată posibil şi, ca urmare,
indicatorii statistici ai eşantionului sunt utilizaţi pentru a face estimări, inferenţe, cu
privire la parametrii populaţiei. În esenţă, a testa o ipoteză statistică înseamnă a emite
concluzii asupra unei „populaţii” pe baza rezultatelor obţinute pe un eşantion care
aparţine acelei populaţii. În acest context, demersul ştiinţific presupune următorii paşi:
- formularea problemei cercetării (sub forma unei întrebări, cu referire la o
anumită populaţie)
- emiterea unei ipoteze privind cel mai probabil răspuns
- selectarea unui eşantion
- aplicarea unei proceduri care sa permită acceptarea sau respingerea ipotezei
Reprezentativitatea eşantionului
2. ORDINALE
Nivelurile variabilei exprimă doar ordinea unora faţă de
celelalte. Lungimea intervalelor dintre valori este incertă,
subiectivă. O anumită valoare ne spune că există valori mai
mari sau mai mici decât ea, dar nu şi şi care este dimesiunea
acestei diferenţe dintre valori ( de exemplu, în ce măsură îţi
plac petrecerile în aer liber cu colegii: f. puţin, puţin, mult, f.
mult).
Atribuirea unei valori se face în comparaţie cu alte valori, şi
nu prin raportare la un criteriu extern, bine definit
(“obiectiv”).
Proceduri
II. SCALE CANTITATIVE statistice
adecvate
Nivelurile sunt egal distribuite, adică, o
unitate într-o zonă a scalei este egală cu o
unitate din orice altă zonă a scalei. Definesc
o anumită caracteristică prin raportare la un
1.Interval “etalon extern” cel care garantează PARAME-
echivalenţa intervalelor (de exemplu: scala TRICE
termometrului, cronometrului, notele sau (dacă sunt
cotele standardizate ale testelor psihologice). respectate
anumite
La fel ca mai sus, cu specificaţia că condiţii)
nivelurile variabilei nu sunt doar egal
2. Raport distribuite, ci există şi un zero absolut, adică
valoarea ce indică absenţa totală a
caracteristicii măsurate.
Notă: În psihologie, distincţia dintre scala de interval şi cea de raport rămâne pur
teoretică. Unii autori susţin că, în cazul unui om viu, nici o caracteristică
psihologică nu poate lipsi în mod absolut! Oricum, din perspectiva alegerii
tipului de procedură statistică diferenţa dintre ele nu produce nici un efect.
Ideea fundamentală este aceea că, atunci când variabila dependentă
implicată într-un studiu statistic este măsurată pe o scală de tip calitativ (nominal
sau ordinal), se aplică una dintre procedurile statistice neparametrice. În cazul
variabilelor măsurate pe scale cantitative se aplică, de regulă, statistici
parametrice, fără ca acest lucru să fie posibil întotdeauna.
Rezumat
Exerciţii
1. Daţi câte două exemple de variabile pentru fiecare tip de scală de măsurare
2. Daţi câte două exemple din fiecare tip de variabilă
continuă/discretă, independentă/dependentă
3. Într-un studiu asupra efectului laptelui cald consumat seara, înainte de culcare,
asupra timpului până la adormire, care este variabila dependentă şi cea
independentă?
4. Daţi un exemplu de variabilă măsurată pe toate cele trei tipuri de scală, precizând
unitatea de măsură
5. Pe ce scală se exprimă fiecare din următoarele variabile: numele subiectului,
greutatea (kg), înălţimea (cm), sexul (M/F), sportul practicat, poziţia în clasament,
numărul de accidentări.
6. Identificaţi în următoarele exemple scala de măsurare pentru variabilele scoase în
evidenţă cu litere subliniate:
a. Distanţa parcursă de muncitorii unei fabrici de acasă până la locul de
muncă
b. Numărul de angajări la o firmă de construcţii in fiecare semestru al anului.
c. Numărul de voturi pozitive pe care le primeşte fiecare dintre cei trei
candidaţi la un
concurs de conducere.