Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
STATISTICA IFEREȚIALĂ
Concepte fundamentale
(distribuţia de eşantionare; ipoteze şi decizii statistice)
Testul z(t) pentru un singur eşantion
POPULAŢIE
eşantion 1 eşantion 2 eşantion 3 eşantion 4
Dacă fiecare dintre cele patru eşantioane de valori are propria sa medie, atunci distribuţia
valorilor alcătuită din mediile tuturor eşantioanelor extrase se numeşte distribuţia mediei de
eşantionare sau, mai scurt, distribuţia de eşantionare. La rândul ei, distribuţia mediilor, ca orice
distribuție, are şi ea o medie, numită medie de eşantionare, care se calculează, după următoarea
formulă:
m1 + m2 + m3 + ... + mk
µ=
k
unde µ este media populaţiei, valorile m sunt mediile fiecărui eşantion constituit, iar k este
numărul eşantioanelor.
1/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
Distribuţia
Populaţia Eşantioane mediei de
eşantionare
1 1,2,3 m1=2.00
2 1,2,4 m2=2.33
3 3,4,1 m3=2.67
4 2,3,4 m4=3.00
µ=2.5 Toate eşantioanele Σ=10.00
σ=1.29 posibile pentru =3 m=10/4=2.5
Aşa cum se observă, dacă extragem toate eşantioanele posibile (în acest caz 4) dintr-o
populaţie de valori, atunci media mediilor eşantioanelor extrase (denumită medie de eşantionare)
este identică cu media populaţiei (în cazul dat: m=µ=2.5). Datele din tabel ne mai arată şi faptul
că media fiecărui eşantion oscilează (variază) în jurul mediei de eşantionare. De aceea ele pot fi
considerate o estimare a acesteia din urmă, în ciuda impreciziei pe care o conţine fiecare. Această
imprecizie se numeşte eroare de estimare. Desigur, exemplul are o valoare de ilustrare teoretică
deoarece, în practică, niciodată nu se ajunge la selectarea tuturor eşantioanelor posibile dintr-o
anumită populaţie de valori.
În acest exemplu cele cinci eşantioane nu sunt toate, ci doar o parte din eşantioanele
posibile de 3 valori extrase din populaţia cercetată. Media distribuţiei de eşantionare în acest caz
este:
m1 + m2 + m3 + m4 + m5
µ= = 4.3
5
În ceea ce priveşte împrăştierea distribuţiei de eşantionare, aceasta este, aşa cum am spus,
mai mică decât împrăştierea variabilei la nivelul întregii populaţii, deoarece o parte a împrăştierii
generale se concentrează (se „pierde”) în media fiecărui eşantion extras. Ca urmare, abaterea
standard a distribuţiei de eşantionare este o fracţiune din abaterea standard a populaţiei, fiind
2/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
dependentă de mărimea eşantionului. Mai precis, fără a intra în detalii explicative, abaterea
standard a distribuţiei de eşantionare este egală cu din abaterea standard a populaţiei, unde
N este volumul eşantionului.
Deoarece împrăştierea mediei de eşantionare arată cât de mult se abat aceste medii de la
media populaţiei, abaterea standard a mediei de eşantionare este denumită eroare standard a
mediei şi se calculează cu formula:
σ
sm = (formula 3.1)
unde sm este eroarea standard a mediei de eşantionare, σ este abaterea standard a
populaţiei, iar N este volumul eşantionului. În cazul distribuţiei din ultimul exemplu, eroarea
standard a mediei este
σ 3 . 02
sm = = = 1 . 74
3
Pentru că, în mod obişnuit, abaterea standard a populaţiei nu este cunoscută, eroarea
standard a mediei de eşantionare se calculează utilizând abaterea standard a eşantionului, care
reprezintă o estimare a împrăştierii la nivelul populaţiei.
Figura de mai jos sugerează foarte bine modul în care, prin creşterea volumului
eşantionului, media eşantionului se apropie tot mai mult de media populaţiei, cu alte cuvinte,
comportă o eroare din ce în ce în mai mică faţă de aceasta.
Așa cum se observă, pe măsură ce N este din ce în ce mai mare, împrăștierea distribuției
de eșantionare devine din ce în ce mai mică.
Expresia de „eroare standard a mediei” poate fi mai greu de înţeles, dat fiind faptul că
este folosită pentru a defini un indicator al împrăştierii, în timp ce are în compunere cuvântul
„medie”. Trebuie însă să reţinem faptul că acest indicator măsoară cât de departe poate fi media
unui eşantion de media populaţiei din care a fost extras. Altfel spus, câtă „eroare” poate conţine
media unui eşantion în estimarea mediei populaţiei. Având în vederea faptul că la numitor avem o
expresie bazată pe N (volumul eşantionului), este limpede de ce, cu cât eşantionul este mai mare,
cu atât eroarea standard a mediei este mai mică.
În exemplele date anterior am extras eşantioane din populaţii foarte mici de valori.
Problema este că, dacă am avea populaţii atât de mici, atunci nu am avea nevoie să facem studii
3/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
1
Sau „teorema limită centrală”.
2
Dincolo de aceste considerente teoretice, mărimea eşantioanelor utilizate în studiile statistice psihologice
face obiectul unor recomandări specifice pentru diferite situaţii practice de cercetare. Acestea vor fi
prezentate mai târziu.
4/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
Ne vom referi acum la exemplul anterior, în care avem cinci eşantioane extrase dintr-o
populaţie de 10 valori. Dacă avem media distribuţiei de eşantionare şi abaterea standard a acesteia
(calculată ca eroare standard a mediei, cu formula 3.1), atunci putem exprima media unui
eşantion oarecare, ca scor standardizat z, într-o manieră similară cu scorul standardizat z pentru o
valoare oarecare. Rostul acestei transformări ar fi acela de a vedea în ce măsură media
eşantionului de studiu se îndepărtează de media populaţiei de referinţă. Cu alte cuvinte, în ce
măsură rezultatul obţinut pe eşantion este unul „obişnuit” (mai aproape de media populaţiei) sau
unul „neobişnuit” (mai îndepărtat de media populaţiei).
Formula de calcul este foarte asemănătoare cu formula lui z pentru valori individuale:
m−µ
z= (formula 3.2)
sm
unde m este media eşantionului, µ media populaţiei, iar sm este eroarea standard a
mediei.
Dacă presupunem că obiectul studiului îl face eşantionul 1, atunci putem calcula mai întâi
eroarea standard a mediei, astfel:
σ 3.02
sm = = = 1.74
3
Exemplu:
Să presupunem că, la un examen de cunoştinţe de statistică, o grupă de 45 de studenţi
obţine un scor mediu de m=28.5 puncte. Presupunând că media pe populaţia studenţească care a
mai dat acest examen (calculată de-a lungul anilor anteriori) este µ=27.3, cu o abatere standard
σ=8.2, trebuie să aflăm care este performanţa grupei respective transformată în notă z.
Calculăm mai întâi abaterea standard a mediei:
σ 8.2 8.2
sm = = = = 1.22
45 6.70
5/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
Dacă vrem să ştim unde se plasează performanţa grupului nostru pe o curbă normală,
atunci ne uităm pe tabela notelor z şi găsim, în dreptul scorului z=0.98, valoarea tabelară 0.3365.
Aceasta poate fi interpretat în mai multe feluri. De exemplu, putem spune că procentul
performanţelor posibile peste nivelul grupului nostru este 50%-33%, adică 17%. Sau, în termeni
probabilistici, putem sune şi că: „probabilitatea de a avea o grupă (un eşantion, de aceeaşi
mărime) care să obţină un scor mai bun la un examen de statistică (cu aceleaşi întrebări) este de
0.17”.
Ipoteza cercetării
H1 → µpo≠µeg
unde µpo reprezintă media inteligenţei populaţiei de șahiști, iar µeg reprezintă media
inteligenţei populaţiei în general.
În conformitate cu ipoteza cercetării, există două populaţii distincte sub aspectul nivelului
de inteligenţă, cea a șahiștilor şi cea a ”tuturor oamenilor”, indiferent dacă joacă șah sau nu.
6/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
Ca urmare, pentru a decide cu privire la ipoteza cercetării („șahiștii sunt mai inteligenţi
decât oamenii în general”) cercetătorul trebuie să evalueze probabilitatea ca media eşantionului
cercetării să fie rezultatul hazardului de eşantionare. Rezultă de aici că, pentru a putea afirma că
șahiștii sunt mai inteligenţi decât media populaţiei, cercetătorul trebuie să dovedească faptul că
nivelul de inteligenţă al eşantionului este mai mare decât al unui eşantion care ar fi fost extras
absolut la întâmplare din populaţia generală.
Procedura statistică care se bazează pe acest raţionament se numeşte „ipoteză de nul” (se
utilizează şi alte variante: „ipoteza diferenţei nule” sau, pur si simplu, „ipoteză statistică”).
Respingerea ei implică o dovadă indirectă a validităţii ipotezei cercetării, şi se bazează pe un
scenariu „negativ” (similar cu „a pune răul în faţă”). Ipoteza de nul se formulează ca opusul
ipotezei cercetării. În cazul nostru ipoteza de nul va fi exprimată astfel: „șahiștii nu au o
inteligenţă mai mare decât populaţia generală”.
Ipoteza de nul este simbolizată cu H0, iar expresia ei formală este:
H0 → µpo=µeg
ceea ce semnifică faptul că mediile celor două populaţii comparate nu diferă, ci sunt
egale. Cu alte cuvinte, ipoteza de nul afirmă că nu există două populaţii distincte sub aspectul
nivelului de inteligenţă, ci una singură. Șahiștii nu se deosebesc sub aspectul inteligenţei de
populaţia oamenilor în general.
Expresia µpo=µeg descrie situaţia în care media șahiștilor nu diferă de media populaţiei
generale, care poate fi definită, din acest motiv, drept „populaţia diferenţei nule” sau, pe scurt,
„populaţia de nul”. Corespunzător, distribuţia mediilor eşantioanelor aleatoare extrase din
populaţia de nul se numeşte „distribuţia populaţiei de nul” sau „distribuţia de nul”.
Aşa cum am spus anterior, extragerea unui număr mare de eşantioane (eventual infinit de
mare), produce ceea ce se numeşte distribuţia de eşantionare, care respectă legea curbei normale.
Din perspectiva cercetării statistice, aceasta este chiar distribuţia de nul, deoarece ilustrează forma
în care se distribuie mediile tuturor eşantioanelor posibile, dacă acestea ar fi constituite pe o bază
pur întâmplătoare, cu alte cuvinte, exact situaţia în care ipoteza de nul ar fi adevărată.
Dacă avem în vedere eşantioane extrase la întâmplare din populaţia de nul, atunci, în
conformitate cu teorema limitei centrale, mediile acestora se distribuie pe o curbă normală. Ca
urmare, putem utiliza tabela distribuţiei normale standard pentru a răspunde întrebărilor cu privire
la media eşantionului de cercetare, în acelaşi mod în care am făcut-o pentru notele z individuale.
Dacă vrem să ştim care este probabilitatea de a obţine o medie mai mare prin jocul şansei,
nu trebuie decât să vedem unde se plasează rezultatul cercetării pe distribuţia de nul. Apoi
calculăm aria de dincolo de acest punct, deoarece aceasta ne arată proporţia (probabilitatea)
cazurilor în care eşantioane de aceeaşi mărime, selectate la întâmplare din populaţia de nul, ar
putea avea un QI mediu mai mare decât eşantionul șahiști.
7/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
unde m este media eşantionului, µ este media populaţiei, iar sm este eroarea standard a
mediei.
m − µ 106 − 100 6 6
z= = = = = +2.18
sm σ/ 15 / 5.47 2.74
În exemplul de mai sus, fiind vorba de o valoare QI, a cărei abatere standard la nivelul
populaţiei ne este cunoscută (am optat pentru σ=15) şi am utilizat-o ca atare. Dacă ar fi fost vorba
de o variabilă pentru care nu cunoşteam abaterea standard la nivelul populaţiei, am fi putut
utiliza aceeaşi valoare calculată pe eşantionul de studiu (s=7).
Dacă citim frecvenţa corespunzătoare valorii z calculate (2.18) în tabelul distribuţiei
normale, constatăm că între media populaţiei de nul (z=0) şi nivelul inteligenţei eşantionului de
șahiști se află 48.54% dintre valorile posibile. De aici rezultă că există 50-48.54 adică 1.46%
şanse (sau o probabilitate p=0.0146) ca hazardul să producă un eşantion cu un QI egal sau mai
mare decât eşantionul cercetării noastre. Imaginea de mai jos ilustrează grafic poziţia mediei
eşantionului de cercetare pe distribuţia de nul.
Ne putem imagina o situaţie în care scorul mediu QI al eşantionului de șahiști este atât de
mare încât să nu existe nici o şansă de a se obţine un rezultat mai bun ca urmare a unei selecţii
întâmplătoare din populaţia de nul? Teoretic, acest lucru nu este posibil. Oricât de mare ar fi
media unui eşantion de șahiști, hazardul poate produce un eşantion cu medie mai mare din
populaţia de nul, deoarece curba normală este asimptotică. Există însă un „prag” dincolo de care
probabilitatea unui eşantion aleatoriu din populaţia generală cu un QI mai mare decât cel al
eşantionului de șahiști este atât de mică, încât să ne putem permite să o considerăm neglijabilă.
Într-un asemenea caz, putem concluziona că valoarea calculată pe eşantionul cercetării nu
decurge din variaţia întâmplătoare a mediei de eşantionare, ci provine din acţiunea unui factor
sistematic care a condus la îndepărtarea semnificativă a mediei eşantionului de studiu de media
populaţiei (în cazul nostru, faptul că fac parte dintre șahiștii de performanță). Despre „pragul”
evocat mai sus, vom vorbi în continuare.
Decizia statistică
Următorul pas pe care trebuie să îl facă cercetătorul este acela de a decide dacă valoarea
medie a eşantionului de șahiști decurge din faptul că aceştia sunt într-adevăr mai inteligenţi decât
8/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
ceilalți oameni în general, sau reprezintă rezultatul unui joc al şansei, care a condus la selecţia
unui eşantion ce nu se diferenţiază în mod real de populaţia de nul.
Este evident faptul că, dacă media eşantionului de șahiști ar fi fost egală cu 100,
cercetătorul ar fi decis că valoarea nu confirmă ipoteza cercetării. În exemplul dat însă, media
eşantionului cercetării fiind mai mare, ne punem problema, cât de mare trebuie să fie diferenţa
faţă de media populaţiei pentru a accepta că este o diferenţă „reală” (determinată de un factor de
influenţă, faptul de a fi șahiști). Altfel spus, trebuie să decidem dacă acceptăm sau respingem
ipoteza de nul.
Din păcate, nu există un criteriu obiectiv de decizie într-o situaţie de acest gen.
Acceptarea sau respingerea ipotezei de nul depinde de gradul de risc pe care suntem dispuşi să ni-
l asumăm în acest sens. Este evident că cineva interesat în acceptarea ideii că șahiștii sunt mai
inteligenţi ar fi dispus să considere că valoarea obţinută este suficient de îndepărtată de medie
pentru a respinge ipoteza de nul. La fel cum, cineva neîncrezător în această ipoteză, ar putea fi
dispus să impună un prag de respingere mult mai sever. Iată de ce, în practica cercetării ştiinţifice
s-a impus convenţia unui prag maxim de risc acceptat pentru decizia statistică. Acest prag „critic”
se numeşte nivel alfa (α) şi corespunde probabilităţii de 0.05. Pe curba normală z, fiecărei
probabilităţi îi corespunde o anumită valoare z, ca urmare şi probabilităţii „critice” alfa îi
corespunde o valoare critică z. Dat fiind faptul că a început prin a fi citită dintr-un tabel, mai este
desemnată şi ca „valoare tabelară”.
Avem acum toate elementele pentru luarea deciziei statistice în cazul cercetării noastre,
pe baza unui raţionament convenţional, identic pentru întreaga comunitate ştiinţifică. Esenţa
acestuia constă în comparaţia rezultatelor derivate dintr-un context de cercetare cu cele specifice
unui context ipotetic, aleatoriu (bazat pe şansa pură), după cum urmează:
a. Dacă rezultatul calculat pentru eşantion este cel puţin egal sau mai mare decât scorul
critic, atunci avem un rezultat semnificativ al cercetării. Aceasta, deoarece se acceptă că şansele
ca acest rezultat să fi decurs din întâmplare sunt suficient de mici pentru a fi ignorate. În
consecinţă, într-un astfel de caz, ipoteza de nul (H0) se respinge, iar ipoteza cercetării (H1) se
consideră confirmată la un prag alfa=0.05 (dacă acesta a fost nivelul ales).
b. Dacă rezultatul eşantionului este mai mic decât scorul z critic, atunci avem un rezultat
nesemnificativ al cercetării, prin faptul că există prea multe şanse ca acesta să poată fi obţinut în
condiţii pur aleatoare. În această variantă, ipoteza de nul se acceptă, iar ipoteza cercetării se
consideră infirmată la un prag alfa=0.05.
c. Cele două reguli decizionale de la punctele a şi b sunt exprimate pe baza comparaţiei
dintre valoarea calculată a testului şi valoarea critică tabelară, aferentă nivelului alfa. Programele
statistice specializate calculează direct probabilitatea asociată valorii calculate a testului. Ca
urmare, în cazul utilizării acestora, decizia statistică se va lua prin compararea directă a
probabilității calculate (p sau Sig. în SPSS) cu alfa (care este ”probabilitatea critică”). În aceste
condiții, ipoteza de nul se va admite dacă probabilitatea (p) a valorii calculate este mai mare decât
alfa şi se respinge dacă este egală sau mai mică decât acesta. Această modalitate de decizie este
aplicabilă numai atunci când se utilizează programe statistice.
Imaginea de mai jos ilustrează poziţia valorii calculate a testului z în raport cu valoarea
critică pentru alfa=0.05.
9/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
Oricare dintre raționamente am utiliza, decizia statistică în acest caz este respingerea
ipotezei de nul („șahiștii nu sunt mai inteligenţi decât ceilalți oameni în general”) ceea ce
înseamnă, implicit, confirmarea ipotezei de cercetare. („șahiștii sunt mai inteligenţi decât ceilalți
oameni în general”).
În exemplul nostru, ipoteza cercetării a fost aceea că șahiștii au o inteligenţă mai mare
decât media populaţiei de nul. Din acest motiv, ne-a interesat să vedem în ce măsură rezultatul
nostru confirmă ipoteza pe direcţia valorilor din dreapta curbei normale (valori mari, cu z
pozitiv). Ca urmare, am efectuat ceea ce se numeşte un test unilateral (one-tailed). În acest caz,
ipoteza că șahiștii ar putea avea o inteligenţă sub medie, nu este viabilă, dar dacă am fi obţinut un
z negativ pentru eşantionul cercetării, ar fi trebuit să îl testăm în partea din stânga curbei de
distribuţie, În aceste două situaţii am fi avut acelaşi z critic (1.65) cu semnul + sau – în funcţie de
zona scalei pentru care făceam testarea. Imaginea din figura 2 ilustrează grafic cele două direcţii
de testare a ipotezelor statistice unilaterale şi ariile valorilor semnificative/nesemnificative, în
funcţie de valoarea critică a lui z.
Ce s-ar fi întâmplat însă dacă eşantionul cercetării ar fi obţinut un scor QI=94, ceea ce ar
fi corespuns unui scor z=-2.18? În acest caz, aplicând un test unilateral orientat spre valori
superioare mediei, conform ipotezei, ar fi trebuit să acceptăm ipoteza de nul, concluzionând că
șahiștii nu sunt mai inteligenţi decât media, fără a putea emite o concluzie privitoare la faptul că
ei sunt, de fapt, mai puţin inteligenţi, aşa cum ar fi cerut-o datele cercetării.
Pentru a elimina acest neajuns putem verifica ipoteza pe ambele laturi ale distribuţiei,
aplicând ceea ce se numeşte un test bilateral (two-tailed). În acest caz se păstrează acelaşi nivel
alfa (0.05), dar el se distribuie în mod egal pe ambele extreme ale curbei, astfel încât pentru 2.5%
de fiecare parte, avem un z critic de 1.96 (cu semnul - sau +). Această valoare este luată din
tabelul ariei de sub curbă, în dreptul probabilităţii 0.4750 care corespunde unei probabilităţi
complementare de 0.025 (echivalent cu 2.5%). Figura nr. 3 indică scorurile critice pentru un test z
bilateral. Se observă că în cazul alegerii unui test bilateral (z=±1.96) nivelul α de 5% se împarte
3
Acest raționament nu este însă posibil decât atunci când utilizăm programe statistice specializate.
10/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
în mod egal între cele două laturi ale curbei. Este de la sine înţeles faptul că semnificaţia statistică
este mai greu de atins în cazul unui test bilateral decât în cazul unui test unilateral, deoarece
valoarea testului trebuie să fie mai mare de 1.65, cât este în cazul pentru un test unilateral.
O scurtă discuţie pe tema nivelului alfa maxim acceptabil (0.05) se impune, având în
vedere faptul că întregul eşafodaj al deciziei statistice se sprijină pe acest prag. Vom sublinia din
nou faptul că p=0.05 este un prag de semnificaţie convenţional, impus prin consensul
cercetătorilor din toate domeniile, nu doar în psihologie. Faptul că scorul critic pentru atingerea
pragului de semnificaţie este ±1.96 a jucat, de asemenea, un rol în impunerea acestei convenţii.
Practic, putem considera că orice îndepărtare mai mare de două abateri standard de la media
populaţiei de referinţă este semnificativă. Chiar dacă persistă posibilităţi de a ne înşela, ele sunt
suficient de mici pentru a le trece cu vederea.
11/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
Impunerea unui prag minim de semnificaţie a testelor statistice are însă, mai ales, rolul de a
garanta faptul că orice concluzie bazată pe date statistice răspunde aceluiaşi criteriu de exigenţă,
nefiind influenţată de subiectivitatea cercetătorului. Nivelul alfa de 0.05 nu este decât pragul
maxim acceptat. Nimic nu împiedică un cercetător să îşi impună un nivel mai exigent pentru
testarea ipotezei de nul, ceea e înseamnă un prag alfa mai scăzut. În practică mai este utilizat
pragul de 0.01 şi, mai rar, cel de 0.001. Toate aceste praguri pot fi exprimate şi în procente, prin
opusul lor, care exprimă nivelul de încredere în rezultatul cercetării. Astfel, printr-o probabilitate
de 0.05 se poate înţelege şi un nivel de încredere de 95% în rezultatul cercetării (99%, pentru
p=0.01 şi, respectiv, 99.9% pentru p=0.001). Un nivel de încredere de 95% înseamnă că dacă am
efectua același studiu de 100 de ori, am obține același rezultat care să permită respingerea
ipotezei de nul în 95% din cazuri și un rezultat care să impună acceptarea ipotezei de nul în cel
mult 5% din situații.
În fine, este bine să subliniem faptul că utilizarea acestor „praguri” vine din perioada în
care nu existau calculatoare şi programe automate de prelucrare statistică. Din acest motiv,
cercetătorii calculau valoarea testului statistic pe care apoi o comparau cu valori tabelare ale
probabilităţii de sub curba de referinţă. Pentru a face mai practice aceste tabele, ele nu cuprindeau
toate valorile de sub curbă, ci doar o parte dintre acestea, printre ele, desigur, cele care marcau
anumite „praguri”. Rezultatul cercetării era raportat, de aceea, prin invocarea faptului de a fi
„sub” pragul de semnificaţie sau „deasupra” sa. Odată cu diseminarea pe scară largă a tehnicii de
calcul şi cu apariţia programelor de prelucrări statistice, semnificaţia valorilor testelor statistice
nu mai este căutată în tabele, ci este calculată direct şi exact de către program, putând fi afişată ca
atare. De aici, aşa cum am mai spus, rezultă şi posibilitatea de a lua decizia statistică prin
compararea directă a valorii calculate a lui p cu pragul alfa critic asumat.
Eşantionul cercetării noastre a obţinut medie QI=106, care s-a dovedit semnificativă.
Acest lucru înseamnă că valorile inteligenţei șahiștilor fac parte dintr-o populaţie specială de
valori QI, care are o medie mai mare decât media populaţiei generale. Dar cât de mare este
această medie? Media eşantionului cercetării ne oferă o estimare a acesteia dar, ca orice estimare,
conţine o anumită imprecizie, exprimată prin eroarea standard a mediei. Nu vom putea şti
niciodată cu precizie care este media inteligenţei populaţiei de șahiști, dar teorema limitei centrale
ne permite să calculăm, cu o anumită probabilitate, în ce interval se află ea, pe baza mediei
eşantionului cercetării şi a erorii standard a acesteia.
Acest lucru se bazează pe proprietatea curbei normale de a avea un număr bine definit de
valori pe un interval simetric în jurul mediei. Astfel, dacă luăm pe curba normală un interval
cuprins între z=±1.96 de o parte şi de alta a mediei, ştim că acoperim aproximativ 95% din
valorile posibile ale distribuţiei. În acest caz, z=±1.96 se numeşte z critic deoarece reprezintă un
prag limită, pe cele două laturi ale distribuţiei (care, pentru curba normală standardizată, este 0).
Alegerea acestor limite pentru z critic este convenţională. Se pot alege, la fel de bine, valori
simetrice ale lui z care să cuprindă între ele 99% sau 99.9% dintre valorile de pe curba normală.
Prin consens, însă, se consideră că asumarea unui nivel de încredere de 95% (corespunzător
pentru valori „critice” ale lui z=±1.96) este considerat suficient pentru păstrarea unui echilibru
între precizia estimării şi probabilitatea estimării. Ca urmare, în această condiţie, putem spune că
există 95% şanse ca, având media unui eşantion aleator, media populaţiei să se afle undeva în
intervalul:
µ = m ± z critic * s m (formula 3.3)
unde µ=media populaţiei, pe care o căutăm
m=media eşantionului de cercetare
zcritic=valoarea corespunzătoare pentru alfa ales (de regulă 0.05)
12/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
În ce priveşte eroarea standard a mediei, aceasta este dată de raportul dintre abaterea
standard a populaţiei, pe care în acest caz o cunoaştem (15) şi radical din volumul eşantionului:
15
sm = = 2.74
30
Mai departe, utilizând formula 3.3 pentru datele eşantionului cercetării, limitele de
încredere pentru media populaţiei mediei pot fi calculate astfel:
Aşa cum am precizat mai sus, testul z poate fi utilizat doar atunci când cunoaştem
media populaţiei de referinţă şi avem la dispoziţie un eşantion „mare” (adică de cel puţin 30 de
subiecţi, în cazul unei variabile despre care avem motive să credem că se distribuie normal). Dar
nu întotdeauna putem avea la dispoziţie eşantioane „mari” (minim 30 de subiecţi). Pentru
situaţiile care nu corespund acestei condiţii, testul z nu poate fi aplicat. Şi aceasta, pentru că
distribuţia mediei de eşantionare urmează legea curbei normale standardizate doar pentru
eşantioane de minim 30 de subiecţi, conform teoremei limitei centrale.
La începutul secolului XX, William Gosset, angajat al unei companii producătoare de
bere din SUA, trebuia să testeze calitatea unor eşantioane de bere pentru a trage concluzii asupra
întregii şarje. Din considerente practice, el nu putea utiliza decât eşantioane (cantităţi) mici de
bere. Pentru a rezolva problema, a dezvoltat un model teoretic propriu, bazat pe un tip special de
distribuţie, denumită distribuţie t, cunoscută însă şi ca distribuţia „Student”, după pseudonimul cu
care a semnat articolul în care şi-a expus modelul.
În esenţă, distribuţia t este o distribuţie teoretică care are toate caracteristicile unei
distribuţii normale (este perfect simetrică şi are formă de clopot). Specificul acestei distribuţii
constă în faptul că forma ei (mai exact, înălţimea) depinde de un parametru denumit „grade de
libertate” (df sau degrees of freedom), care este egal cu N-1 (unde N este volumul eşantionului).
Acest parametru poate fi orice număr mai mare decât 0, iar mărimea lui este aceea care defineşte
forma exactă a curbei şi, implicit, proporţia valorilor de sub curbă între diferite puncte ale
acesteia. Imaginea de mai jos ilustrează modul de variaţie a înălţimii distribuţiei t, în funcţie de
gradele de libertate.
13/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
Figura 4. Valorile critice ale distribuției t pentru p=0.05, în funcție de gradele de libertate
Aşa cum se observă, curba devine din ce în ce mai aplatizată pe măsură ce df (volumul
eşantionului) este mai mic. Acest fapt are drept consecinţă existenţa unui număr mai mare de
valori spre extremele distribuţiei. Nu este însă greu de observat că, pe măsură ce df este mai
mare, distribuţia t se apropie de o distribuţie normală standard astfel încât, pentru valori ale lui N
de peste 31 (df=30), aria de sub curba distribuţiei t se apropie foarte mult de valorile de sub aria
curbei normale standard (z), iar scorul critic pentru t este acelaşi ca şi cel pentru z pe curba
normală (1.96).
Din cele spuse rezultă că, dacă avem un eşantion de volum mic (N<30), vom utiliza testul
t în loc de testul z, pe baza unei formule asemănătoare:
m−µ
t= (formula 3.4)
sm
unde:
m este media eşantionului
µ este media populaţiei
sm este eroarea standard a mediei
Interpretarea valorii lui t se face în mod similar cu cea pentru valoarea lui z, cu
deosebirea că se utilizează tabelul distributiei t (Anexa 2). În acest caz, valorile critice ale lui t vor
fi diferite în funcţie de numărul de grade de libertate. Citind tabelul, se observă că pragurile
critice ale lui t (subînţelegând alfa=0.05, pentru test bilateral) se plasează la valori diferite în
funcţie de nivelul df. În acelaşi timp, dacă df este mare (peste 30), valorile tabelare ale lui t se
apropie de cele ale lui z. La infinit, ele sunt identice (±1.96, la fel ca şi în cazul valorilor lui z).
Date fiind caracteristicile enunţate, în practică, testul t se poate utiliza şi pentru
eşantioane mari (N≥30). În nici un caz însă, nu poate fi utilizat testul z pentru eşantioane mici
(N<30). Utilizarea testului bazat pe un singur eşantion (fie z sau t) depinde într-o măsură decisivă
de asigurarea caracteristicii aleatoare a eşantionului.
Publicarea rezultatelor diferitelor proceduri statistice trebuie făcută astfel încât cititorii să
îşi poată face o imagine corectă şi completă asupra rezultatelor. În acest scop la publicarea
rezultatelor trebuie respectate anumite reguli, la care vom face trimitere în continuare, în legătură
cu fiecare nou test statistic ce va fi introdus.
14/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
În principiu, publicarea rezultatelor unui test statistic se poate face în două moduri:
• sintetic (de regulă sub formă tabelară), atunci când numărul variabilelor testate
este relativ mare;
• narativ, atunci când se referă, să zicem, la o singură variabilă.
În cazul testului pentru un singur eşantion se vor raporta: media eşantionului, media
populaţiei, valoarea lui z (sau t), nivelul lui p, tipul de test (unilateral/bilateral).
Dacă avem în vedere rezultatele obţinute pe exemplul de mai sus, se apelează la o
raportare de tip narativ, care poate utiliza o formulare în maniera următoare: „Eşantionul de
șahiști a obţinut un scor (QI=106; 95%CI:100.6-111.3) peste media populaţiei generale
(QI=100). Testul z, cu alfa 0.05, a demonstrat că diferenţa este semnificativă statistic, z=+2.13,
p>0.05, unilateral”.
În acest exemplu de prezentare nu formularea ca atare este esenţială, ci informaţiile
asociate publicării testului z. Formularea poate diferi de cea enunţată, dar elementele
informaţionale trebuie să fie complete. Expresia „95%CI” vine de la 95% Confidence Interval şi
exprimă intervalul de încredere pentru media populaţiei.
Aşa cum am spus mai sus, utilizarea programelor statistice oferă pentru orice valoare a
lui z (sau oricare alt test statistic) valoarea exactă a lui p. Ea poate fi utilizată ca atare, păstrând
însă raportarea acesteia la pragul de semnificaţie. Orice valoare a lui p mai mare de 0.05 este
considerată nesemnificativă4, dacă nu a fost fixat un alt prag, mai sever.
---
UN EXEMPLU DE STUDIU BAZAT PE TESTUL z(t)
Aşa cum am precizat deja, testul z sau testul t pentru un singur eşantion (comparat cu
populaţia de referinţă) sunt teste statistice destul de rar utilizate în practică, deoarece rareori
cunoaştem parametrii populaţiei (medie, abatere standard). Vom prelua aici un studiu efectuat de
Sara Tonin, (B.H. Cohen, op.cit., p. 205) cu privire la relaţia dintre depresia de lungă durată
(cronică) şi înălţime. Ipoteza cercetării, bazată pe experienţă şi observaţie îndelungată, a fost
aceea că femeile care suferă de depresie cronică sunt mai scunde decât cele care nu prezintă
această suferinţă psihică. În acest caz, ipoteza statistică („de nul” sau „a diferenţei nule”) este că
nu există nici o diferenţă de înălţime între femeile care suferă şi cele care nu suferă de depresie
cronică.
În primul rând, este necesară luarea în considerare a mediei populaţiei feminine. Aceasta
a fost luată din studii de antropometrie, fiind: µ=165 cm. În faza următoare cercetătoarea a ales
valoarea lui α=0,05. A decis să utilizeze un test de tip bilateral (aceasta pentru a acoperi şi
eventualitatea că femeile depresive sunt chiar mai înalte decât cele care nu suferă de depresie). În
acest caz, pentru a afla valorile critice ale lui z, a împărţit α la 2 (0.05/2=0.025 ceea ce,
transformat în procente de sub curbă, înseamnă 2.5%). A scăzut 50-2.5=47.5% pentru a găsi
procentul corespunzător lui z critic, pe care l-a citit din tabel, aşa cum se vede în imaginea de mai
jos: zcritic=1.96. Fiind vorba de un test bilateral, există de fapt două valori pentru z critic, una cu
plus şi una cu minus, pentru fiecare dintre cele două extreme ale curbei (zcritic=±1.96).
În continuare, cercetătoarea a selectat un eşantion aleator de femei cu depresie cronică
(N=30), pentru care a calculat înălţimea medie: m=160 cm şi abaterea standard s=7.62.
În final, a calculat valoarea lui z:
m − µ 160 − 165 −5
z= = = = −3.59
sm 7,62 / 30 1.39
4
Programele de prelucrări statistice utilizează termenul „Sig.” (de la „significance” în loc de „p”. Ele sunt
strict echivalente.
15/16
Actualizat la: 27.01.2008 / 1:01:54 PM
© M. Popa: Statistica inferențiala; concepte fundamentale. Testul z(t) pentru un singur eșantion
---
16/16
Actualizat la: 27.01.2008 / 1:01:54 PM