Documente Academic
Documente Profesional
Documente Cultură
SP 05 Ipoteze Si Decizii Statistice, Testul Z (T) PT - Unsingur Esantion
SP 05 Ipoteze Si Decizii Statistice, Testul Z (T) PT - Unsingur Esantion
Concepte fundamentale
(populaie/eantion; distribuia de eantionare; ipoteze i decizii statistice)
Testul z(t) pentru un singur eantion
Lect. univ. dr. Gheorghe Perea
Populaie i eantion
Obiectivul legitim al cercetrii tiinifice este identificarea unor adevruri cu un
anumit grad de generalitate. Din punct de vedere statistic generalul este reprezentat de
totalitatea valorilor care descriu o anumit caracteristic, i este numit populaie. Din
pcate ns, investigarea tuturor indivizilor (valorilor) care compun o anumit populaie
nu este aproape niciodat posibil. Ca urmare, n practica cercetrii tiinifice se supun
cercetrii psihologice loturi mai restrnse, numite eantioane, extrase din ansamblul
populaiei vizate. Parametrii descriptivi ai acestor eantioane (medie, abatere stadard) sunt
extrapolai, n anumite condiii i cu ajutorul unor proceduri specializate, la populaia din
care fac parte.
m s2 s
esantion
Indicatorii
esantionului
estimeaza
Parametrii populatiei
s2
s
studiate. Ideea pe care se bazeaz cercetrile bazate pe eantioane este aceea c se pot face
aprecieri asupra
unei ntregi populaii, n anumite condiii, doar pe baza caracteristicilor msurate pe o
parte a acesteia.
Exemple:
-ntr-un studiu asupra efectelor accesului la internet asupra elevilor de liceu, elevii
de liceu reprezint populaia, iar elevii selecionai pentru investigaie,
eantionul.
-ntr-un studiu care vizeaz influena inteligenei asupra performanei n instruirea
de zbor, populaia este reprezentat de toi piloii, iar eantionul, de subiecii inclui
n studiu.
Dac am reui recoltarea datelor cu privire la ntreaga populaie care face obiectul
cercetrii, am putea trage concluzii directe cu privire la aceasta prin utilizarea
indicatorilor statistici descriptivi cunoscui (medie, dispersie, abatere standard) numii i
parametrii populaiei. Dar acest lucru nu este aproape niciodat posibil i, ca urmare,
indicatorii statistici ai eantionului sunt utilizai pentru a face estimri, inferene, cu privire
la parametrii populaiei. n esen, a testa o ipotez statistic nseamn a emite concluzii
asupra unei populaii pe baza rezultatelor obinute pe un eantion care aparine acelei
populaii. n acest context, demersul tiinific presupune urmtorii pai:
-formularea problemei cercetrii (sub forma unei ntrebri, cu referire la o
anumit populaie);
-emiterea unei ipoteze privind cel mai probabil rspuns;
-selectarea unui eantion;
-aplicarea unei proceduri care sa permit acceptarea sau respingerea ipotezei.
Reprezentativitatea eantionului
Verificarea statistic a ipotezelor se bazeaz pe o idee simpl: dac avem un
eantion a crui alegere respect anumite condiii, extras dintr-o populaie orict de mare,
rezultatele obinute pe acesta pot fi extrapolate la ntreaga populaie.
Calitatea unui eantion de a permite extinderea concluziilor la ntreaga populaie
din care a fost extras se numete reprezentativitate. De fapt, nici un eantion nu poate
reprezenta perfect datele populaiei. De aceea reprezentativitatea are o semnificaie relativ.
Ca urmare estimrile pe baz de eantion conin ntotdeauna o doz mai mare sau mai mic
de eroare. Cu ct eroarea este mai mic, cu att concluziile obinute pe eantion pot fi
generalizate mai sigur asupra populaiei.
Pentru a permite fundamentarea inferenelor statistice, eantionul trebuie s fie
constituit din uniti de informaie (subieci, valori, etc.) independente unele de altele.
Independena valorilor se refer la faptul c fiecare valoare (sau unitate experimental)
trebuie s fie absolut distinct de celelalte. n esen constituirea unui eantion trebuie s
evite efectele unor factori sistematici care s interfereze cu obiectivele studiului, orientnd
rezultatele ntr-o anumit direcie (situaie desemnat n limba englez prin termenul de
bias).
Cteva exemple:
Dac msurm timpul de reacie la un numr de cinci subieci, dar facem trei evaluri
la fiecare subiect, nu avem eantion de 15 valori independente, deoarece valorile
aceluiai subiect au n comun o constant personal care le face dependente una de
cealalt. Pentru avea un singur eantion am putea s utilizm media celor trei
determinri pentru fiecare subiect.
Dac dorim s investigm efectul inteligenei asupra performanei colare trebuie s
avem grij s includem n eantion subieci provenind din familii cu un nivel variat al
veniturilor, pentru a anihila influena statutului socio-economic asupra performanei
colare.
Dac fiecare dintre cele patru eantioane de valori are propria sa medie, atunci
distribuia mediilor tuturor eantioanelor extrase se numete distribuia mediei de
eantionare sau, mai scurt,
unde este media populaiei, valorile m sunt mediile fiecrui eantion constituit, iar k este
numrul eantioanelor.
Dac am extrage toate eantioanele posibile dintr-o populaie, atunci media de
eantionare este identic cu media populaiei. Pentru exemplificare, s presupunem c
avem o populaie constituit din valorile 1,2,3,4 i s ne propunem constituirea tuturor
eantioanelor posibile de cte 3 valori. Tabelul de mai jos ilustreaz aceast situaie:
Populaia
Eantioane
1
2
3
4
=2.5
=1.29
1,2,3
1,2,4
3,4,1
2,3,4
Toate eantioanele
posibile pentru N=3
Distribuia
mediei de
eantionare
m1=2.00
m2=2.33
m3=2.67
m4=3.00
=10.00
m=10/4=2.5
m2=4.5
s2=4.94
m3=4.0
s3=4.24
m4=2.5
s4=2.12
m5=5.5
s5=6.36
n acest exemplu, cele cinci eantioane nu sunt toate, ci doar o parte din
eantioanele posibile de 3 valori extrase din populaia cercetat. Media distribuiei de
eantionare pentru acest exemplu este:
Expresia de eroare standard a mediei poate fi mai greu de neles, dat fiind
faptul c este folosit pentru a defini un indicator al mprtierii, n timp ce are n
compunere cuvntul medie. Trebuie ns s reinem faptul c acest indicator msoar
ct de departe poate fi media unui eantion de media populaiei din care a fost extras.
Altfel spus, ct eroare poate conine media unui eantion n estimarea mediei
populaiei. Avnd n vederea faptul c la numitor avem o expresie bazat pe N (volumul
eantionului), este limpede de ce, cu ct eantionul este mai mare, cu att eroarea
standard a mediei este mai mic.
mediei.
unde m este media eantionului, media populaiei, iar sm este eroarea standard a
Dac presupunem c obiectul studiului l face eantionul 1, atunci putem calcula mai
nti eroarea standard a mediei, astfel:
Exemplu:
S presupunem c, la un examen de cunotine de statistic, o grup de 45 de studeni
obine un scor mediu de m=28.5 puncte. Presupunnd c media pe populaia studeneasc care
a mai dat acest examen (calculat de-a lungul anilor anteriori) este =27.3, cu o abatere
standard =8.2, trebuie s aflm care este performana grupei respective transformat n not
z. Calculm mai nti abaterea standard a mediei:
n realitate, media QI este diferit n funcie de vrst, dar, pentru exemplul nostru,
vom accepta c populaia general de elevi are o medie de 100 i o abatere standard de
15.
unde m este media eantionului, este media populaiei, iar sm este eroarea standard
a mediei.
n exemplul de mai sus, fiind vorba de o valoare QI, a crei abatere standard la
nivelul populaiei ne este cunoscut (am optat pentru =15) i am utilizat-o ca atare. Dac
ar fi fost vorba de o variabil pentru care nu cunoteam abaterea standard la nivelul
populaiei, am fi putut utiliza aceeai valoare calculat pe eantionul de studiu (s=7).
Dac citim frecvena corespunztoare valorii z calculate (2.18) n tabelul distribuiei
normale, constatm c ntre media populaiei de nul (z=0) i nivelul inteligenei
eantionului de elevi olimpici se afl 48.54% dintre valorile posibile. De aici rezult c
exist 50-48.54 adic 1.46% anse (sau o probabilitate p=0.0146) ca hazardul s produc
un eantion cu un QI egal sau mai mare dect eantionul cercetrii noastre. Imaginea de
mai jos ilustreaz grafic poziia mediei eantionului de cercetare pe distribuia de nul.
influen, accesul la olimpiad pe baza inteligenei). Altfel spus, trebuie s decidem dac
acceptm sau respingem ipoteza de nul.
Din pcate, nu exist un criteriu obiectiv de decizie ntr-o situaie de acest gen.
Acceptarea sau respingerea ipotezei de nul depinde de gradul de risc pe care suntem
dispui s ni-l asumm n acest sens. Este evident c cineva interesat n acceptarea ideii
c olimpicii sunt mai inteligeni ar fi dispus s considere c valoarea obinut este
suficient de ndeprtat de medie pentru a respinge ipoteza de nul. La fel cum, cineva
nencreztor n aceast ipotez (considernd c efortul de studiu, motivaia, fac diferena
dintre participanii i neparticipanii la olimpiadele colare), ar putea fi dispus s impun un
prag de respingere mult mai sever. Iat de ce, n practica cercetrii tiinifice s-a impus
convenia unui prag maxim de risc acceptat pentru decizia statistic. Acest prag critic
se numete nivel alfa () i corespunde probabilitii de 0.05. Pe curba normal z, fiecrei
probabiliti i corespunde o anumit valoare z, ca urmare i probabilitii critice alfa i
corespunde o valoare critic z. Dat fiind faptul c a nceput prin a fi citit dintr-un tabel,
mai este desemnat i ca valoare tabelar.
Avem acum toate elementele pentru luarea deciziei statistice n cazul cercetrii
noastre, pe baza unui raionament convenional, identic pentru ntreaga comunitate
tiinific. Esena acestuia const n comparaia rezultatelor derivate dintr-un context de
cercetare cu cele specifice unui context ipotetic, aleatoriu (bazat pe ansa pur), dup cum
urmeaz:
a. Dac rezultatul calculat pentru eantion este cel puin egal sau mai mare dect
scorul critic, atunci avem un rezultat semnificativ al cercetrii. Aceasta, deoarece se
accept c ansele ca acest rezultat s fi decurs din ntmplare sunt suficient de mici
pentru a fi ignorate. n consecin, ntr-un astfel de caz, ipoteza de nul (H 0) se respinge,
iar ipoteza cercetrii (H1) se consider confirmat la un prag alfa=0.05 (dac acesta a fost
nivelul ales).
b. Dac rezultatul eantionului este mai mic dect scorul z critic, atunci avem un
rezultat nesemnificativ al cercetrii, prin faptul c exist prea multe anse ca acesta s
poat fi obinut n condiii pur aleatoare. n aceast variant, ipoteza de nul se accept, iar
ipoteza cercetrii se consider infirmat la un prag alfa=0.05.
c. Cele dou reguli decizionale de la punctele a i b sunt exprimate pe baza
comparaiei dintre valoarea calculat a testului i valoarea critic tabelar, aferent
nivelului alfa. Ele ns pot fi exprimate i direct, prin comparaia probabilitii valorii
calculate cu alfa. Singura diferen este dat de faptul c raportul dintre probabilitatea
asociat scorului calculat i alfa este invers dect n cazul valorilor. Astfel, ipoteza de nul
se admite dac probabilitatea (p) a valorii calculate este mai mare dect alfa, i se
respinge dac este egal sau mai mare dect acesta. Aceast precizare, i dovedete
utilitatea n momentul n care se utilizeaz programe statistice, care fac inutil consultarea
tabelelor distribuiei de nul, deoarece dau direct probabilitatea asociat valorii calculate a
testului.
Imaginea de mai jos ilustreaz poziia valorii calculate a testului z n raport cu
valoarea critic pentru alfa=0.05.
Dat fiind faptul c z calculat (+2.18) este mai mare dect z critic pentru valoarea
lui alfa=0.05 (+1.65), decidem respingerea ipotezei de nul 5. Ca urmare, n legtur cu
studiul nostru demonstrativ, trebuie s decidem respingerea ipotezei de nul (participanii
la olimpiade nu sunt mai inteligeni dect elevii n general) ceea ce nseamn, implicit,
confirmarea ipotezei de cercetare. (participanii la olimpiade sunt mai inteligeni dect
elevii n general).
Raionamentul deciziei statistice exemplificat astfel, se va regsi n toate situaiile
de testare a ipotezelor statistice cu care ne vom confrunta mai departe, indiferent de
modelul de cercetare i de natura relaiei pe care vrem s o demonstrm ntre variabile.
Decizii statistice unilaterale i bilaterale
n exemplul nostru, ipoteza cercetrii a fost aceea c elevii participani la olimpiade
au o inteligen mai mare dect media populaiei de nul. Din acest motiv, ne-a interesat s
vedem n ce msur rezultatul nostru confirm ipoteza pe direcia valorilor din dreapta
curbei normale (valori mari, cu z pozitiv). Ca urmare, am efectuat ceea ce se numete un
test unilateral (one-tailed). n acest caz, ipoteza c participanii la olimpiadele colare ar
putea avea o inteligen sub medie, nu este viabil, dar dac am fi obinut un z negativ
pentru eantionul cercetrii, ar fi trebuit s l testm n partea din stnga curbei de
distribuie, n aceste dou situaii am fi avut acelai z critic (1.65) cu semnul + sau n
funcie de zona scalei pentru care fceam testarea. Imaginea de mai jos ilustreaz grafic
cele dou direcii de testare a ipotezelor statistice unilaterale i ariile valorilor
semnificative/nesemnificative, n funcie de valoarea critic a lui z.
Figura de mai sus indic scorurile critice pentru un test z bilateral. Se observ c
n cazul alegerii unui test bilateral (z=1.96) nivelul de 5% se mparte n mod egal ntre
cele dou laturi ale curbei. Este de la sine neles faptul c semnificaia statistic este mai
greu de atins n cazul unui test bilateral dect n cazul unui test unilateral, deoarece
valoarea testului trebuie s fie mai mare de 1.65, ct este n cazul pentru un test
unilateral.
Alegerea tipului de test, unilateral sau bilateral, este la latitudinea cercettorului.
De regul ns, se prefer testul bilateral, chiar i n situaii de cercetare cum este aceea din
exemplul nostru, cnd o diferen negativ fa de media populaiei este improbabil.
Motivul l constituie necesitatea de a introduce mai mult rigoare i de a lsa mai puin loc
hazardului. Se alege testul unilateral doar atunci cnd suntem interesai de evaluarea
semnificaiei strict ntr-o anumit direcie a curbei, sau atunci cnd miza rezultatului este
prea mare nct s fie justificat asumarea unui risc sporit de eroare. n mod uzual,
ipotezele statistice sunt testate bilateral, chiar dac ipoteza cercetrii este formulat n
termeni unilaterali. Testarea unilateral este utilizat numai n mod excepional, n cazuri
bine justificate.
O scurt discuie pe tema nivelului alfa maxim acceptabil (0.05) se impune, avnd
n vedere faptul c ntregul eafodaj al deciziei statistice se sprijin pe acest prag. Vom
sublinia, din nou, c p=0.05 este un prag de semnificaie convenional, impus prin
consensul cercettorilor din toate domeniile, nu doar n psihologie. Faptul c scorul critic
pentru atingerea pragului de semnificaie este 1.96 a jucat, de asemenea, un rol n
impunerea acestei convenii. Practic, putem considera c orice ndeprtare mai mare de
dou abateri standard de la media populaiei de referin este semnificativ. Chiar dac
persist posibiliti de a ne nela, ele sunt suficient de mici pentru a le trece cu vederea.
Impunerea unui prag minim de semnificaie a testelor statistice are ns, mai ales,
rolul de a garanta faptul c orice concluzie bazat pe date statistice rspunde aceluiai
criteriu de exigen, nefiind influenat de subiectivitatea cercettorului. Nivelul alfa de
0.05 nu este dect pragul maxim acceptat. Nimic nu mpiedic un cercettor s i impun
un nivel mai exigent pentru testarea ipotezei de nul, ceea e nseamn un prag alfa mai
sczut. n practic mai este utilizat pragul de 0.01 i, mai rar, cel de 0.001. Toate aceste
praguri pot fi exprimate i n procente, prin opusul lor, care exprim nivelul de ncredere
n rezultatul cercetrii. Astfel, printr-o probabilitate de 0.05 se poate nelege i un nivel
de ncredere de 95% n rezultatul cercetrii (99%, pentru p=0.01 i, respectiv, 99.9%
pentru p=0.001).
n fine, este bine s subliniem faptul c utilizarea acestor praguri vine din
perioada n care nu existau calculatoare i programe automate de prelucrare statistic. Din
acest motiv, cercettorii calculau valoarea testului statistic pe care apoi o comparau cu
valori tabelare ale probabilitii de sub curba de referin. Pentru a face mai practice aceste
tabele, ele nu cuprindeau toate valorile de sub curb, ci doar o parte dintre acestea, printre
ele, desigur, cele care marcau anumite praguri. Rezultatul cercetrii era raportat, de
aceea, prin invocarea faptului de a fi sub pragul de semnificaie sau deasupra sa.
Odat cu diseminarea pe scar larg a tehnicii de calcul i cu apariia programelor de
prelucrri statistice, semnificaia valorilor testelor statistice nu mai este cutat n tabele,
ci este calculat direct i exact de ctre program, putnd fi afiat ca
atare. De aici, aa cum am mai spus, rezult i posibilitatea de a lua decizia statistic prin
compararea direct a valorii calculate a lui p cu pragul alfa critic asumat.
Mai departe, utiliznd formula 3.3 pentru datele eantionului cercetrii, limitele
de ncredere pentru media populaiei mediei pot fi calculate astfel:
pentru limita inferioar = 106-1.96*2.74 = 100.62
pentru limita superioar = 106 +1.96 * 2.74 =
111.37
Ca urmare, putem afirma, cu o probabilitate de 95%, c media real a populaiei de
elevi olimpici, estimat prin media eantionului cercetrii, se afl undeva ntre 100.6 i
111.3. Acest interval a crui limit inferioar este foarte aproape de media populaiei
generale de valori QI (100), ne arat c, dei semnificativ, diferena eantionului nostru
nu are o valoare foarte ridicat. Trebuie s observm, de asemenea, c mrimea
intervalului de ncredere rezult din imprecizia mediei, exprimat prin eroarea standard a
mediei. Acesta, la rndul ei, este cu att mai mare cu ct volumul eantionului este mai
mic. Desigur, cu ct limitele intervalului de estimare sunt mai apropiate de media
eantionului, cu att aceasta din urm estimeaz mai precis media populaiei i prezint
mai mult ncredere.
unde:
Interpretarea valorii lui t se face n mod similar cu cea pentru valoarea lui z, cu
deosebirea c se utilizeaz tabelul distributiei t (Anexa 2). n acest caz, valorile critice ale
lui t vor fi diferite n funcie de numrul de grade de libertate. Citind tabelul, se observ
c pragurile critice ale lui t (subnelegnd alfa=0.05, pentru test bilateral) se plaseaz la
valori diferite n funcie de nivelul df. n acelai timp, dac df este mare (peste 30),
valorile tabelare ale lui t se apropie de cele ale lui z. La infinit, ele sunt identice (1.96, la
fel ca i n cazul valorilor lui z).
Date fiind caracteristicile enunate, n practic, testul t se poate utiliza i pentru
eantioane mari (N30). n nici un caz ns, nu poate fi utilizat testul z pentru eantioane
mici (N<30). Utilizarea testului bazat pe un singur eantion (fie z sau t) depinde ntr-o
msur decisiv de asigurarea caracteristicii aleatoare a eantionului.
Publicarea rezultatelor testului z sau t
Publicarea rezultatelor diferitelor proceduri statistice trebuie fcut astfel nct
cititorii s i poat face o imagine corect i complet asupra rezultatelor. n acest scop la
publicarea rezultatelor trebuie respectate anumite reguli, la care vom face trimitere n
continuare, n legtur cu fiecare nou test statistic ce va fi introdus.
n principiu, publicarea rezultatelor unui test statistic se poate face n dou
moduri:
sintetic (de regul sub form tabelar), atunci cnd numrul variabilelor
testate este relativ mare;
narativ, atunci cnd se refer, s zicem, la o singur variabil.
n cazul testului pentru un singur eantion se vor raporta: media eantionului,
media populaiei, valoarea lui z (sau t), nivelul lui p, tipul de test (unilateral/bilateral).
Dac avem n vedere rezultatele obinute pe exemplul de mai sus, se apeleaz la o
raportare de tip narativ, care poate utiliza o formulare n maniera urmtoare: Eantionul
de elevi participani la olimpiade a obinut un scor (QI=106; 95%CI: 100.6-111.3) peste
media populaiei generale (QI=100). Testul z, cu alfa 0.05, a demonstrat c diferena nu
este semnificativ statistic, z=+2.13, p>0.05, unilateral.
n acest exemplu de prezentare nu formularea ca atare este esenial, ci
informaiile asociate publicrii testului z. Formularea poate diferi de cea enunat, dar
elementele informaionale trebuie s fie complete. Expresia 95%CI vine de la 95%
Confidence Interval i exprim intervalul de ncredere pentru media populaiei.
Aa cum am spus mai sus, utilizarea programelor statistice ofer pentru orice
valoare a lui z (sau oricare alt test statistic) valoarea exact a lui p. Ea poate fi utilizat ca
atare, pstrnd ns raportarea acesteia la pragul de semnificaie. Orice valoare a lui p mai
mare de 0.05 este considerat nesemnificativ6, dac nu a fost fixat un alt prag, mai sever.
--6
EXERCIII
1. S presupunem c media populaiei pentru o scal de anxietate este =40.
Dup un cutremur puternic se obin urmtoarele scoruri pe un eantion de subieci care
se adreseaz unui cabinet de psihologie clinic: 62, 49, 44, 46, 48, 52, 57, 51, 44, 47.
-Testai ipoteza conform creia nivelul anxietii este influenat de cutremur.
(=0,05, bilateral).
-Calculai intervalul de ncredere pentru media populaiei (95%).
2. Scorurile obinute la o scal de satisfacie profesional de ctre angajaii unui
compartiment dintr-o companie privat sunt urmtoarele: 10, 12, 15, 11, 10, 22, 14, 19,
18, 17, 25, 9, 12, 16, 17.
Scala a fost aplicat ntregului personal al companiei (=13 i =4)
-Este nivelul de satisfacie al compartimentului respectiv semnificativ mai mic dect
satisfacia la nivelul ntregii companii? (pentru alfa=0.01)