Sunteți pe pagina 1din 21

STATISTICA INFERENTIALA

Concepte fundamentale
(populaie/eantion; distribuia de eantionare; ipoteze i decizii statistice)
Testul z(t) pentru un singur eantion

Lect. univ. dr. Gheorghe Perea

Populaie i eantion

Obiectivul legitim al cercetrii tiinifice este identificarea unor adevruri cu un


anumit grad de generalitate. Din punct de vedere statistic generalul este reprezentat de
totalitatea valorilor care descriu o anumit caracteristic, i este numit populaie. Din
pcate ns, investigarea tuturor indivizilor (valorilor) care compun o anumit populaie
nu este aproape niciodat posibil. Ca urmare, n practica cercetrii tiinifice se supun
cercetrii psihologice loturi mai restrnse, numite eantioane, extrase din ansamblul
populaiei vizate. Parametrii descriptivi ai acestor eantioane (medie, abatere stadard) sunt
extrapolai, n anumite condiii i cu ajutorul unor proceduri specializate, la populaia din
care fac parte.

Parametrii populatiei
Indicatorii
m s2 s
esantion
esantionului s2
estimeaza
s

A fundamenta un adevr statistic nseamn a trage o concluzie care descrie


parametrii unei populaii de valori, pe baza indicatorilor unui eantion din acea populaie.
n contextul cercetrii statistice utilizm urmtoarele definiii:
Populaia reprezint totalitatea unitilor de informaie care constituie obiectivul
de interes al unei investigaii. Prin uniti de informaie nelegem cel mai adesea
persoane (subieci, cu un termen uzual in cercetarea psihologic 1). Dar, la fel de bine,
putem nelege i populaia de cupluri familiale, sau populaia de diferene dintre
mediile a dou variabile, de exemplu. n esen, prin populaie trebuie s nelegem
extinderea maxim posibil, sub aspectul volumului, a respectivei uniti de informaie.
Extinderea menionat este, la rndul ei, definit prin obiectivul de cercetare, ceea ce
nseamn ca are o dimensiune subiectiv. Aceasta se refer la domeniul de interes pe care
i-l propune cercettorul. De exemplu, ntr-un studiu cu privire la efectul oboselii asupra
performanei cognitive, pot fi vizate diferite categorii de populaii: a aviatorilor, a
studenilor, a mecanicilor de locomotiv, a ahitilor, etc. Este de la sine neles faptul c,
nc de la nceputul unei cercetri tiinifice, se va preciza populaia cercetrii, cu alte
cuvinte, domeniul de extindere a rezultatelor i a concluziilor ce urmeaz a fi trase.

Eantionul reprezint unitile de informaie selecionate pentru a fi efectiv


studiate. Ideea pe care se bazeaz cercetrile bazate pe eantioane este aceea c se pot face
aprecieri asupra
unei ntregi populaii, n anumite condiii, doar pe baza caracteristicilor msurate pe o
parte a acesteia.

Exemple:
-ntr-un studiu asupra efectelor accesului la internet asupra elevilor de liceu, elevii
de liceu reprezint populaia, iar elevii selecionai pentru investigaie,
eantionul.
-ntr-un studiu care vizeaz influena inteligenei asupra performanei n instruirea
de zbor, populaia este reprezentat de toi piloii, iar eantionul, de subiecii inclui
n studiu.

Dac am reui recoltarea datelor cu privire la ntreaga populaie care face obiectul
cercetrii, am putea trage concluzii directe cu privire la aceasta prin utilizarea
indicatorilor statistici descriptivi cunoscui (medie, dispersie, abatere standard) numii i
parametrii populaiei. Dar acest lucru nu este aproape niciodat posibil i, ca urmare,
indicatorii statistici ai eantionului sunt utilizai pentru a face estimri, inferene, cu privire
la parametrii populaiei. n esen, a testa o ipotez statistic nseamn a emite concluzii
asupra unei populaii pe baza rezultatelor obinute pe un eantion care aparine acelei
populaii. n acest context, demersul tiinific presupune urmtorii pai:
-formularea problemei cercetrii (sub forma unei ntrebri, cu referire la o
anumit populaie);
-emiterea unei ipoteze privind cel mai probabil rspuns;
-selectarea unui eantion;
-aplicarea unei proceduri care sa permit acceptarea sau respingerea ipotezei.

Reprezentativitatea eantionului

Verificarea statistic a ipotezelor se bazeaz pe o idee simpl: dac avem un


eantion a crui alegere respect anumite condiii, extras dintr-o populaie orict de mare,
rezultatele obinute pe acesta pot fi extrapolate la ntreaga populaie.
Calitatea unui eantion de a permite extinderea concluziilor la ntreaga populaie
din care a fost extras se numete reprezentativitate. De fapt, nici un eantion nu poate
reprezenta perfect datele populaiei. De aceea reprezentativitatea are o semnificaie relativ.
Ca urmare estimrile pe baz de eantion conin ntotdeauna o doz mai mare sau mai mic
de eroare. Cu ct eroarea este mai mic, cu att concluziile obinute pe eantion pot fi
generalizate mai sigur asupra populaiei.
Pentru a permite fundamentarea inferenelor statistice, eantionul trebuie s fie
constituit din uniti de informaie (subieci, valori, etc.) independente unele de altele.
Independena valorilor se refer la faptul c fiecare valoare (sau unitate experimental)
trebuie s fie absolut distinct de celelalte. n esen constituirea unui eantion trebuie s
evite efectele unor factori sistematici care s interfereze cu obiectivele studiului, orientnd
rezultatele ntr-o anumit direcie (situaie desemnat n limba englez prin termenul de
bias).

Cteva exemple:
Dac msurm timpul de reacie la un numr de cinci subieci, dar facem trei evaluri
la fiecare subiect, nu avem eantion de 15 valori independente, deoarece valorile
aceluiai subiect au n comun o constant personal care le face dependente una de
cealalt. Pentru avea un singur eantion am putea s utilizm media celor trei
determinri pentru fiecare subiect.
Dac dorim s investigm efectul inteligenei asupra performanei colare trebuie s
avem grij s includem n eantion subieci provenind din familii cu un nivel variat al
veniturilor, pentru a anihila influena statutului socio-economic asupra performanei
colare.
Un studiu asupra atitudinii fa de utilizarea computerelor n educaie, poate fi
influenat n mod sistematic dac eantionul este constituit numai din elevi care
utilizeaz frecvent calculatorul.
n cazul unui sondaj cu privire la inteniile de vot bazat pe interviul telefonic, vom
obine rezultate afectate de starea social a respondenilor (i permit montarea unui
telefon) sau de ora apelului (n orele dimineii sunt acas, s zicem, mai multe femei
casnice).

Este clar de ce modul de constituire a eantionului este decisiv pentru nivelul de


reprezentativitate. Esenial n acest caz este asigurarea condiiilor ca acesta s acopere n
mod real caracteristicile populaiei, evitndu-se favorizarea sistematic a unor subieci
nereprezentativi. Fr a intra n amnunte tehnice cu privire la procedurile de
eantionare, iat care sunt cele mai utilizate metode de constituire a eantioanelor:
a)Eantionare stratificat multistadial. Populaia se mparte n categorii, fiecare
categorie n subcategorii .a.m.d., iar subiecii sunt selecionai aleator la nivelul
categoriei de nivelul cel mai sczut. Se obine astfel un eantion care reproduce fidel
structura populaiei.
b)Eantionare prin clasificare unistadial. Se identific categorii pe un singur nivel
iar subiecii se extrag aleator din fiecare categorie.
c)Eantionare aleatoare. Subiecii sunt extrai aleator (la ntmplare) din ansamblul
populaiei. La ntmplare, nseamn n acest caz utilizarea unei proceduri care
asigur fiecrui subiect al populaiei absolut aceleai anse de a fi extras. n acest
scop se pot utiliza programe de calculator (de ex. SPSS) sau tabele de numere
aleatoare.
d)Eantionare pseudo-aleatoare (haphazard, sau de convenien). Sunt utilizai
subiecii disponibili. Este cazul cel mai frecvent ntlnit n practic i, dac
disponibilitatea nu este afectat de un aspect care s influeneze semnificativ
obiectivul cercetrii, atunci reprezentativitatea este acceptabil.

n concluzie, presupunnd c am obinut anumite rezultate pe un eantion aleator,


raionamentul statistic ne permite s aplicm concluziile la ntreaga populaie din care a
fost extras acel eantion. Se impune ns, o precizare clar a populaiei de referin pentru
c, dincolo de limitele acesteia, extrapolarea nu este permis. De exemplu, rezultatele
unui studiu asupra atitudinii fa de internet efectuat pe un eantion de studeni nu poate fi
extrapolat la alte categorii sociale, i nici chiar la alte categorii de studeni, dac n
eantionul nostru au intrat numai studeni de la faculti umaniste, s zicem.

Distribuia mediei de eantionare

Atunci cnd constituim un eantion de studiu nu facem dect s utilizm doar


unul dintre eantioanele posibil a fi selecionate (alese, constituite, extrase) din populaia
cercetrii. Dac am selecta mai multe eantioane din aceeai populaie, fiecare dintre ele
ar fi caracterizat prin indicatori sintetici specifici, vor avea, fiecare, media i abaterea lor
standard. Imaginea de mai jos sugereaz situaia descris:

Dac fiecare dintre cele patru eantioane de valori are propria sa medie, atunci
distribuia mediilor tuturor eantioanelor extrase se numete distribuia mediei de
eantionare sau, mai scurt,
distribuia de eantionare. La rndul ei, distribuia mediilor are i ea o medie, numit
medie de eantionare, i care se calculeaz, evident, dup urmtoarea formul:

unde este media populaiei, valorile m sunt mediile fiecrui eantion constituit, iar k este
numrul eantioanelor.

Dac am extrage toate eantioanele posibile dintr-o populaie, atunci media de


eantionare este identic cu media populaiei. Pentru exemplificare, s presupunem c
avem o populaie constituit din valorile 1,2,3,4 i s ne propunem constituirea tuturor
eantioanelor posibile de cte 3 valori. Tabelul de mai jos ilustreaz aceast situaie:

Populaia Eantioane Distribuia


mediei de
eantionare
1 1,2,3 m1=2.00
2 1,2,4 m2=2.33
3 3,4,1 m3=2.67
4 2,3,4 m4=3.00
=2.5 Toate eantioanele =10.00
=1.29 posibile pentru N=3 m=10/4=2.5

Aa cum se observ, dac extragem toate eantioanele posibile (n acest caz 4)


dintr-o populaie de valori, atunci media mediilor eantioanelor extrase (denumit medie
de eantionare) este identic cu media populaiei (n cazul dat: m==2.5). Datele din tabel
ne mai arat i faptul c media fiecrui eantion oscileaz (variaz) n jurul mediei de
eantionare. De aceea ele pot fi considerate o estimare a acesteia din urm, n ciuda
impreciziei pe care o conine fiecare. Aceast imprecizie se numete eroare de estimare.
Desigur, exemplul are o valoare de ilustrare teoretic deoarece, n practic, niciodat nu
se ajunge la selectarea tuturor eantioanelor posibile dintr-o anumit populaie de valori.

mprtierea distribuiei de eantionare (eroarea standard a mediei)

Distribuia de eantionare nu are aceeai mprtiere ca i distribuia valorilor


individuale ale variabilei de origine. Aceasta pentru c, la nivelul fiecrui eantion, o
parte din mprtierea total este absorbit de media fiecrui eantion n parte. Cu ct
eantioanele sunt mai mari, cu att media fiecrui eantion tinde s fie mai apropiat de
media variabilei originale i, implicit, abaterea standard a distribuiei de eantionare este
mai mic prin comparaie cu abaterea standard a variabilei.
Exemplu: S considerm populaia valorilor 1,2,3,4,5,6,7,8,9,10, pentru care am
calculat =5.5 i =3,0276. Am extras, cu ajutorul unui program statistic, cinci
eantioane aleatoare (pentru uurina calculelor, am ales pentru fiecare eantion N=3). Iat
cum se prezint mediile i abaterile standard pentru cele cinci eantioane selectate:

m1=5.00 m2=4.5 m3=4.0 m4=2.5 m5=5.5


s1=5.65 s2=4.94 s3=4.24 s4=2.12 s5=6.36

n acest exemplu, cele cinci eantioane nu sunt toate, ci doar o parte din
eantioanele posibile de 3 valori extrase din populaia cercetat. Media distribuiei de
eantionare pentru acest exemplu este:
n ceea ce privete mprtierea distribuiei de eantionare, aceasta este, aa cum am
spus, mai mic dect mprtierea variabilei la nivelul ntregii populaii, deoarece o parte a
mprtierii generale se concentreaz (se pierde) n media fiecrui eantion extras. Ca
urmare, abaterea standard a distribuiei de eantionare este o fraciune din abaterea standard
a populaiei, fiind dependent de mrimea eantionului. Mai precis, fr a intra n detalii
explicative, abaterea
standard a distribuiei de eantionare este egal cu N din abaterea standard a populaiei,
unde N este volumul eantionului.
Deoarece mprtierea mediei de eantionare arat ct de mult se abat aceste
medii de la media populaiei, abaterea standard a mediei de eantionare este denumit
eroare standard a mediei i se calculeaz cu formula:

unde sm este eroarea standard a mediei de eantionare, a este abaterea standard a


populaiei iar N este volumul eantionului. n cazul distribuiei de mai sus, eroarea
standard a mediei este

Pentru c, n mod obinuit, abaterea standard a populaiei nu este cunoscut,


eroarea standard a mediei de eantionare se calculeaz utiliznd abaterea standard a
eantionului, care reprezint o estimare a mprtierii la nivelul populaiei.

Figura de mai jos sugereaz foarte bine modul n care, prin creterea volumului
eantionului, media eantionului se apropie tot mai mult de media populaiei, cu alte
cuvinte, comport o eroare din ce n ce n mai mic fa de aceasta.

Expresia de eroare standard a mediei poate fi mai greu de neles, dat fiind
faptul c este folosit pentru a defini un indicator al mprtierii, n timp ce are n
compunere cuvntul medie. Trebuie ns s reinem faptul c acest indicator msoar
ct de departe poate fi media unui eantion de media populaiei din care a fost extras.
Altfel spus, ct eroare poate conine media unui eantion n estimarea mediei
populaiei. Avnd n vederea faptul c la numitor avem o expresie bazat pe N (volumul
eantionului), este limpede de ce, cu ct eantionul este mai mare, cu att eroarea
standard a mediei este mai mic.
Teorema limitei centrale

n exemplele date anterior am extras eantioane din populaii foarte mici de


valori. Problema este c, dac am avea populaii att de mici, atunci nu am avea nevoie s
facem studii pe baz de eantion, ci am putea investiga fr dificultate ntreaga populaie.
n realitate populaiile care fac obiectul de interes al cercetrilor de psihologie sunt prea
mari pentru a fi accesibile n ntregimea lor. i chiar dac ar fi accesibile, ar fi prea
costisitor s fie investigate integral. n acest caz se pune problema msurii n care putem
estima caracteristicile statistice ale distribuiei populaiei (media, abaterea standard) pe
baza acelorai indicatori, calculai doar la nivelul unui anumit eantion, selectat pentru
studiu.
Soluia acestei probleme rezid n teorema limitei centrale2 care certific dou
adevruri statistice fundamentale:
1.Cu ct numrul eantioanelor realizate dintr-o populaie (tinznd spre infinit) este
mai mare, cu att media distribuiei de eantionare se apropie de media populaiei.
2.Distribuia mediei de eantionare se supune legilor curbei normale, chiar i atunci
cnd distribuia variabilei la nivelul ntregii populaii nu are un caracter normal, cu
condiia ca volumul eantioanelor s fie suficient de mare. Cu alte cuvinte,
distribuia mediei de eantionare se apropie de distribuia normal, cu att mai mult
cu ct volumul eantionului este mai mare.

Teorema limitei centrale este adevrat n urmtoarele condiii fundamentale:


a. eantioanele sunt aleatoare sau neafectate de erori (bias);
b. valorile care compun eantioanele sunt independente unele de altele
(msurarea
unei valori nu este influenat de msurarea altei valori din eantion);
c. eantioanele au acelai volum de valori (subieci).

Utilitatea teoremei limitei centrale const n faptul c ea permite fundamentarea


inferenelor statistice fr a ne preocupa prea mult de forma distribuiei valorilor
individuale la nivelul populaiei. Este de ajuns s utilizm un eantion suficient de mare
pentru a ne putea asuma presupunerea unei distribuii normale la nivelul mediei de
eantionare.
ntrebarea care se pune este, ns, ct de mare trebuie s fie un eantion pentru a
putea fi considerat suficient de mare ? Fr a intra n amnunte, vom spune c, Pe
aceast baz orice eantion avnd cel puin 30 de valori este considerat eantion mare n
timp ce orice eantion cu mai puin de 30 de valori este considerat eantion mic.
Pentru a nelege mai bine modul n care se distribuie mediile de eantionare vom
apela la un set de imagini obinute prin simulare computerizat. Au fost luate n considerare
distribuiile a dou variabile. Prima, cea din stnga, nu are un caracter normal n timp ce a
doua, din dreapta, are un caracter normal. Pentru fiecare dintre ele au fost simulate
distribuii de eantionare pentru eantioane progresive ca volum: 2, 10, 25, 50 sau 100 de
valori. Figurile de mai jos ne ajut s desprindem dou concluzii:
1.indiferent de forma distribuiei variabilei, distribuia de eantionare tinde spre curba
normal, pe msur ce volumul eantionului crete
2.dac distribuia variabilei la nivelul populaiei este normal, atunci distribuia de
eantionare atinge o form normal pentru eantioane de volum mai mic.
2
Sau teorema limit central.

n concluzie, distribuia mediei de eantionare are o evoluie diferit de distribuia


valorilor individuale ale unei caracteristici. Chiar i atunci cnd acestea din urm nu se
distribuie dup regulile curbei normale, mediile eantioanelor tind spre o distribuiei
normal dac volumul lor este suficient de mare. Mrimea eantionului trebuie s fie de
cel puin 30 de valori pentru a avea ncredere c teorema limitei centrale se verific. Dar
chiar i eantioane de volum mai mic pot avea medii ce se plaseaz pe o distribuie
normal, dac provin din populaii normale. Din pcate, forma distribuiei la nivelul
populaiei nu este aproape niciodat cunoscut. n acest caz singurul lucru pe care l
putem face este s utilizm, ori de cte ori ne putem permite, eantioane mari, adic de
cel puin 30 de valori, i chiar mai mari, dac acest lucru este posibil. Cu toate acestea,
aa cum vom vedea mai departe, exist soluii statistice i pentru eantioane mai mici de
30 de valori3.

Scoruri standardizate z pentru eantioane (grupuri)

Ne vom referi acum la exemplul anterior, n care avem cinci eantioane extrase
dintr-o populaie de 10 valori. Dac avem media distribuiei de eantionare i abaterea
standard a acesteia (calculat ca eroare standard a mediei, cu formula 3.1), atunci putem
exprima media unui eantion oarecare, ca scor standardizat z, ntr-o manier similar cu
scorul standardizat z pentru o valoare oarecare. Rostul acestei transformri ar fi acela de a
vedea n ce msur media eantionului de studiu se ndeprteaz de media populaiei de
referin. Cu alte cuvinte, n ce msur rezultatul obinut pe eantion este unul obinuit
(mai aproape de media populaiei) sau unul neobinuit (mai ndeprtat de media
populaiei).

Formula de calcul este foarte asemntoare cu formula lui z pentru valori individuale:
3
Dincolo de aceste considerente teoretice, mrimea eantioanelor utilizate n studiile
statistice psihologice face obiectul unor recomandri specifice pentru diferite situaii
practice de cercetare. Acestea vor fi prezentate mai trziu.
unde m este media eantionului, media populaiei, iar sm este eroarea standard a
mediei.

Dac presupunem c obiectul studiului l face eantionul 1, atunci putem calcula mai
nti eroarea standard a mediei, astfel:

n exemplul nostru, limitat la o populaie cunoscut, am putut calcula


abaterea standard a populaiei (=3.02), dar pentru situaii reale, cu populaii
nelimitate, acest lucru nu este posibil. n astfel de cazuri se accept faptul c
abaterea standard a populaiei este suficient de bine reprezentat de abaterea
standard a eantionului extras din aceasta. Ca urmare, dac nu aveam abaterea
standard a populaiei, am fi putut utiliza n formula erorii standard a mediei
abaterea standard a eantionului (n cazul nostru s 1=5.65 n loc de =3.02). Mai
departe, scorul standard z pentru eantionul 1, se calculeaz astfel:

Exemplu:
S presupunem c, la un examen de cunotine de statistic, o grup de 45
de studeni obine un scor mediu de m=28.5 puncte. Presupunnd c media pe
populaia studeneasc care a mai dat acest examen (calculat de-a lungul anilor

Calculm apoi scorul z pentru grup:

anteriori) este =27.3, cu o abatere standard =8.2, trebuie s aflm care


este performana grupei respective transformat n not z. Calculm mai nti
abaterea standard a mediei:

Dac vrem s tim unde se plaseaz performana grupului nostru pe o


curb normal, atunci ne uitm pe tabela notelor z i gsim, n dreptul scorului
z=0.98, valoarea tabelar 0.3365. Aceasta poate fi interpretat n mai multe feluri.
De exemplu, putem spune c procentul performanelor posibile peste nivelul
grupului nostru este 50%-33%, adic 17%. Sau, n termeni probabilistici, putem
sune i c: probabilitatea de a avea o grup (un eantion, de aceeai mrime)
care s obin un scor mai bun la un examen de statistic (cu aceleai ntrebri)
este de 0.17.
Ipoteze i decizii statistice. Testul z pentru un singur eantion.

S ne imaginm c un psiholog colar i pune ntrebarea dac elevii participani


la olimpiadele colare au un nivel de inteligen (QI) superior elevilor n general. Dac
acceptm c aceast problema prezint interes din punct din vedere practic-pedagogic sau
tiinific, atunci se justific transformarea ei ntr-o problem de cercetare. n esen,
aceast problem ar putea fi formulat astfel: Elevii participani la olimpiade sunt mai
inteligeni dect toi elevii n general, fie ei participani sau nu la olimpiade?.

Ipoteza cercetrii

n mod obinuit, o cercetare tiinific se bazeaz pe estimarea unui rezultat


ateptat, denumit ipotez. n cazul nostru, psihologul se poate atepta n mod legitim ca
participanii la olimpiad s fie mai inteligeni dect elevii n general. Acest rezultat
ateptat, prefigurat, se numete ipoteza cercetrii, fiind codificat cu H1. Am putea
formaliza ipoteza cercetrii astfel:

H1 mpomeg

unde mpo reprezint media inteligenei populaiei participanilor la olimpiade, iar meg
reprezint media inteligenei populaiei elevilor n general.
n conformitate cu ipoteza cercetrii, exist dou populaii distincte sub aspectul
nivelului de inteligen, cea a elevilor participani la olimpiade i cea a elevilor n general.

Ipoteza statistic (de nul)

Avnd n vedere c este imposibil s evalueze inteligena tuturor participanilor la


olimpiade, psihologul cercettor trebuie s gseasc un rspuns la problema cercetrii
sale cu ajutorul unui eantion. n acest scop, selecteaz la ntmplare, din populaia de
participani la olimpiade, un grup de 30 de elevi, crora le aplic un test de inteligen
general. S presupunem c analiza rezultatelor indic pentru acest grup o medie a
coeficientului de inteligen m=106 i o abatere standard s=7. Amintindu-ne c media
valorilor QI la nivelul ntregii populaii este =100 (=15)4, se poate trage concluzia c
elevii din populaia de olimpici sunt mai inteligeni dect cei din populaia general de
elevi? Aparent diferena de 6 uniti QI n favoarea eantionului cercetrii i-ar ngdui o
astfel de concluzie. Rigoarea tiinific l oblig ns s observe c generalizarea mediei
eantionului de cercetare asupra ntregii populaii de elevi olimpici comport anumite
riscuri. Eantionul cercetrii, compus aleatoriu din elevi participani la olimpiade, nu este
dect unul din eantioanele de olimpici care ar fi putut fi selectat. Astfel, faptul c
eantionul su are un QI mediu mai mare dect media populaiei se poate ncadra n
caracteristica oricrei medii de eantion de a oscila n jurul mediei populaiei din care este
extras. Ar fi posibil deci, ca valoarea medie de 106 s fie doar rezultatul hazardului, care
face ca mediile eantioanelor extrase din aceeai populaie s varieze n jurul mediei
populaiei.
Ca urmare, pentru a decide cu privire la ipoteza cercetrii (olimpicii sunt mai
inteligeni dect elevii n general) cercettorul trebuie s evalueze probabilitatea ca
media eantionului cercetrii s fie rezultatul hazardului de eantionare. Rezult de aici
c, pentru a putea afirma c olimpicii sunt mai inteligeni dect media populaiei,
cercettorul trebuie s dovedeasc faptul c nivelul de inteligen al eantionului de
olimpici este mai mare dect al unui eantion care ar fi fost extras absolut la ntmplare
din populaia general de elevi.

4
n realitate, media QI este diferit n funcie de vrst, dar, pentru exemplul nostru,
vom accepta c populaia general de elevi are o medie de 100 i o abatere standard de
15.
Procedura statistic care se bazeaz pe acest raionament se numete ipotez de
nul (se utilizeaz i alte variante: ipoteza diferenei nule sau, pur si simplu, ipotez
statistic). Respingerea ei implic o dovad indirect a validitii ipotezei cercetrii, i se
bazeaz pe un scenariu negativ (similar cu a pune rul n fa). Ipoteza de nul se
formuleaz ca opusul ipotezei cercetrii. n cazul nostru ipoteza de nul va fi exprimat
astfel: participanii la olimpiad nu au o inteligen mai mare dect populaia de elevi n
general.
Ipoteza de nul este simbolizat cu H0, iar expresia ei formal este:

H0 mpo=meg

ceea ce semnific faptul c mediile celor dou populaii comparate nu difer, ci


sunt egale. Cu alte cuvinte, ipoteza de nul afirm c nu exist dou populaii distincte sub
aspectul nivelului de inteligen, ci una singur. Elevii participani la olimpiade nu se
deosebesc sub aspectul inteligenei de populaia elevilor n general.

Distribuia ipotezei de nul

Expresia mpo=meg descrie situaia n care media olimpicilor nu difer de media


populaiei generale de elevi, care poate fi definit, din acest motiv, drept populaia
diferenei nule sau, mai scurt, populaia de nul. Corespunztor, distribuia mediilor
eantioanelor aleatore extrase din populaia de nul se numete distribuia populaiei de nul
sau distribuia de nul.
Aa cum am spus anterior, extragerea unui numr mare de eantioane (eventual
infinit de mare), produce ceea ce se numete distribuia de eantionare, care respect legea
curbei normale. Din perspectiva cercetrii statistice, aceasta este chiar distribuia de nul,
deoarece ilustreaz forma n care se distribuie mediile tuturor eantioanelor posibile, dac
acestea ar fi constituite pe o baz pur ntmpltoare, cu alte cuvinte, exact situaia n care
ipoteza de nul ar fi adevrat.
Dac avem n vedere eantioane extrase la ntmplare din populaia de nul, atunci,
n conformitate cu teorema limitei centrale, mediile acestora se distribuie pe o curb
normal. Ca urmare, putem utiliza tabela distribuiei normale standard pentru a rspunde
ntrebrilor cu privire la media eantionului de cercetare, n acelai mod n care am fcut-
o pentru notele z individuale.
Dac vrem s tim care este probabilitatea de a obine un rezultat mai bun prin jocul
ansei, nu trebuie dect s vedem unde se plaseaz rezultatul cercetrii pe distribuia de
nul. Apoi calculm aria de dincolo de acest punct, deoarece aceasta ne arat proporia
(probabilitatea) cazurilor n care eantioane de aceeai mrime, selectate la ntmplare din
populaia de nul, ar putea avea un QI mediu mai mare dect eantionul de participani la
olimpiad.

Procedura de calcul a testului z pentru un singur eantion

n urma aplicrii testului de inteligen pentru eantionul de participani la


olimpiad (N=30) am obinut urmtoarele valori statistice: m=106 i s=7. Ne amintim c
media inteligenei populaiei, exprimat n uniti QI, este =100, iar abaterea standard
=15. Cu aceste date putem calcula nota z corespunztoare eantionului cercetrii, cu
formula:

unde m este media eantionului, este media populaiei, iar sm este eroarea standard
a mediei.
Rezultatul calculului este:

n exemplul de mai sus, fiind vorba de o valoare QI, a crei abatere standard la
nivelul populaiei ne este cunoscut (am optat pentru =15) i am utilizat-o ca atare. Dac
ar fi fost vorba de o variabil pentru care nu cunoteam abaterea standard la nivelul
populaiei, am fi putut utiliza aceeai valoare calculat pe eantionul de studiu (s=7).
Dac citim frecvena corespunztoare valorii z calculate (2.18) n tabelul distribuiei
normale, constatm c ntre media populaiei de nul (z=0) i nivelul inteligenei
eantionului de elevi olimpici se afl 48.54% dintre valorile posibile. De aici rezult c
exist 50-48.54 adic 1.46% anse (sau o probabilitate p=0.0146) ca hazardul s produc
un eantion cu un QI egal sau mai mare dect eantionul cercetrii noastre. Imaginea de
mai jos ilustreaz grafic poziia mediei eantionului de cercetare pe distribuia de nul.

Ne putem imagina o situaie n care scorul mediu QI al eantionului de participani


la olimpiad este att de mare nct s nu existe nici o ans de a se obine un rezultat mai
bun ca urmare a unei selecii ntmpltoare din populaia de nul? Teoretic, acest lucru nu
este posibil. Orict de mare ar fi media unui eantion de olimpici, hazardul poate produce
un eantion cu medie mai mare din populaia de nul, deoarece curba normal este
asimptotic. Exist ns un prag dincolo de care probabilitatea unui eantion aleatoriu
din populaia general de elevi cu un QI mai mare dect cel al eantionului de olimpici
este att de mic, nct s ne putem permite s o considerm neglijabil. ntr-un asemenea
caz, putem concluziona c valoarea calculat pe eantionul cercetrii nu decurge din
variaia ntmpltoare a mediei de eantionare, ci provine din aciunea unui factor
sistematic care a condus la ndeprtarea semnificativ a mediei eantionului de studiu de
media populaiei (n cazul nostru, accesul celor mai inteligeni elevi la olimpiadele
colare). Despre pragul evocat mai sus, vom vorbi n continuare.

Decizia statistic

Urmtorul pas pe care trebuie s l fac cercettorul este acela de a decide dac
valoarea medie a eantionului de olimpici decurge din faptul c acetia sunt ntr-adevr
mai inteligeni dect elevii n general, sau reprezint rezultatul unui joc al ansei, care a
condus la selecia unui eantion ce nu se difereniaz n mod real de populaia de nul.
Este evident faptul c, dac media eantionului de olimpici ar fi fost egal cu 100,
cercettorul ar fi decis c valoarea nu confirm ipoteza cercetrii. n exemplul dat ns,
media eantionului cercetrii fiind mai mare, ne punem problema, ct de mare trebuie s
fie diferena fa de media populaiei pentru a accepta c este o diferen real
(determinat de un factor de
influen, accesul la olimpiad pe baza inteligenei). Altfel spus, trebuie s decidem dac
acceptm sau respingem ipoteza de nul.
Din pcate, nu exist un criteriu obiectiv de decizie ntr-o situaie de acest gen.
Acceptarea sau respingerea ipotezei de nul depinde de gradul de risc pe care suntem
dispui s ni-l asumm n acest sens. Este evident c cineva interesat n acceptarea ideii
c olimpicii sunt mai inteligeni ar fi dispus s considere c valoarea obinut este
suficient de ndeprtat de medie pentru a respinge ipoteza de nul. La fel cum, cineva
nencreztor n aceast ipotez (considernd c efortul de studiu, motivaia, fac diferena
dintre participanii i neparticipanii la olimpiadele colare), ar putea fi dispus s impun un
prag de respingere mult mai sever. Iat de ce, n practica cercetrii tiinifice s-a impus
convenia unui prag maxim de risc acceptat pentru decizia statistic. Acest prag critic
se numete nivel alfa () i corespunde probabilitii de 0.05. Pe curba normal z, fiecrei
probabiliti i corespunde o anumit valoare z, ca urmare i probabilitii critice alfa i
corespunde o valoare critic z. Dat fiind faptul c a nceput prin a fi citit dintr-un tabel,
mai este desemnat i ca valoare tabelar.

Avem acum toate elementele pentru luarea deciziei statistice n cazul cercetrii
noastre, pe baza unui raionament convenional, identic pentru ntreaga comunitate
tiinific. Esena acestuia const n comparaia rezultatelor derivate dintr-un context de
cercetare cu cele specifice unui context ipotetic, aleatoriu (bazat pe ansa pur), dup cum
urmeaz:
a. Dac rezultatul calculat pentru eantion este cel puin egal sau mai mare dect
scorul critic, atunci avem un rezultat semnificativ al cercetrii. Aceasta, deoarece se
accept c ansele ca acest rezultat s fi decurs din ntmplare sunt suficient de mici
pentru a fi ignorate. n consecin, ntr-un astfel de caz, ipoteza de nul (H 0) se respinge,
iar ipoteza cercetrii (H1) se consider confirmat la un prag alfa=0.05 (dac acesta a fost
nivelul ales).
b. Dac rezultatul eantionului este mai mic dect scorul z critic, atunci avem un
rezultat nesemnificativ al cercetrii, prin faptul c exist prea multe anse ca acesta s
poat fi obinut n condiii pur aleatoare. n aceast variant, ipoteza de nul se accept, iar
ipoteza cercetrii se consider infirmat la un prag alfa=0.05.
c. Cele dou reguli decizionale de la punctele a i b sunt exprimate pe baza
comparaiei dintre valoarea calculat a testului i valoarea critic tabelar, aferent
nivelului alfa. Ele ns pot fi exprimate i direct, prin comparaia probabilitii valorii
calculate cu alfa. Singura diferen este dat de faptul c raportul dintre probabilitatea
asociat scorului calculat i alfa este invers dect n cazul valorilor. Astfel, ipoteza de nul
se admite dac probabilitatea (p) a valorii calculate este mai mare dect alfa, i se
respinge dac este egal sau mai mare dect acesta. Aceast precizare, i dovedete
utilitatea n momentul n care se utilizeaz programe statistice, care fac inutil consultarea
tabelelor distribuiei de nul, deoarece dau direct probabilitatea asociat valorii calculate a
testului.

Imaginea de mai jos ilustreaz poziia valorii calculate a testului z n raport cu


valoarea critic pentru alfa=0.05.

Dat fiind faptul c z calculat (+2.18) este mai mare dect z critic pentru valoarea
lui alfa=0.05 (+1.65), decidem respingerea ipotezei de nul 5. Ca urmare, n legtur cu
studiul nostru demonstrativ, trebuie s decidem respingerea ipotezei de nul (participanii
la olimpiade nu sunt mai inteligeni dect elevii n general) ceea ce nseamn, implicit,
confirmarea ipotezei de cercetare. (participanii la olimpiade sunt mai inteligeni dect
elevii n general).
Raionamentul deciziei statistice exemplificat astfel, se va regsi n toate situaiile
de testare a ipotezelor statistice cu care ne vom confrunta mai departe, indiferent de
modelul de cercetare i de natura relaiei pe care vrem s o demonstrm ntre variabile.

Decizii statistice unilaterale i bilaterale

n exemplul nostru, ipoteza cercetrii a fost aceea c elevii participani la olimpiade


au o inteligen mai mare dect media populaiei de nul. Din acest motiv, ne-a interesat s
vedem n ce msur rezultatul nostru confirm ipoteza pe direcia valorilor din dreapta
curbei normale (valori mari, cu z pozitiv). Ca urmare, am efectuat ceea ce se numete un
test unilateral (one-tailed). n acest caz, ipoteza c participanii la olimpiadele colare ar
putea avea o inteligen sub medie, nu este viabil, dar dac am fi obinut un z negativ
pentru eantionul cercetrii, ar fi trebuit s l testm n partea din stnga curbei de
distribuie, n aceste dou situaii am fi avut acelai z critic (1.65) cu semnul + sau n
funcie de zona scalei pentru care fceam testarea. Imaginea de mai jos ilustreaz grafic
cele dou direcii de testare a ipotezelor statistice unilaterale i ariile valorilor
semnificative/nesemnificative, n funcie de valoarea critic a lui z.

Ce s-ar fi ntmplat ns dac eantionul cercetrii ar fi obinut un scor QI=94, ceea


ce ar fi corespuns unui scor z=-2.18? n acest caz, aplicnd un test unilateral orientat spre
valori superioare mediei, conform ipotezei, ar fi trebuit s acceptm ipoteza de nul,
concluzionnd c olimpicii nu sunt mai inteligeni dect media, fr a putea emite o
concluzie privitoare la faptul c ei sunt, de fapt, mai puin inteligeni, aa cum ar fi cerut-o
datele cercetrii.
Pentru a elimina acest neajuns putem verifica ipoteza pe ambele laturi ale
distribuiei, aplicnd ceea ce se numete un test bilateral (two-tailed). n acest caz se
pstreaz acelai nivel alfa (0.05), dar el se distribuie n mod egal pe ambele extreme ale
curbei, astfel nct pentru 2.5% de fiecare parte, avem un z critic de 1.96 (cu semnul - sau
+). Aceast valoare este luat din tabelul ariei de sub curb, n dreptul probabilitii
0.4750 care corespunde unei probabiliti complementare de 0.025 (echivalent cu 2.5%) 5.
Puteam ajunge la aceeai concluzie pe baza faptului c probabilitatea valorii calculate
(0.014) este mai mic dect alfa (0.05), dar acest raionament nu este posibil dect atunci
cnd utilizm programe specializate de calcul, care ne ofer direct valoarea lui p calculat.
Figura de mai sus indic scorurile critice pentru un test z bilateral. Se observ c
n cazul alegerii unui test bilateral (z=1.96) nivelul de 5% se mparte n mod egal ntre
cele dou laturi ale curbei. Este de la sine neles faptul c semnificaia statistic este mai
greu de atins n cazul unui test bilateral dect n cazul unui test unilateral, deoarece
valoarea testului trebuie s fie mai mare de 1.65, ct este n cazul pentru un test
unilateral.
Alegerea tipului de test, unilateral sau bilateral, este la latitudinea cercettorului.
De regul ns, se prefer testul bilateral, chiar i n situaii de cercetare cum este aceea din
exemplul nostru, cnd o diferen negativ fa de media populaiei este improbabil.
Motivul l constituie necesitatea de a introduce mai mult rigoare i de a lsa mai puin loc
hazardului. Se alege testul unilateral doar atunci cnd suntem interesai de evaluarea
semnificaiei strict ntr-o anumit direcie a curbei, sau atunci cnd miza rezultatului este
prea mare nct s fie justificat asumarea unui risc sporit de eroare. n mod uzual,
ipotezele statistice sunt testate bilateral, chiar dac ipoteza cercetrii este formulat n
termeni unilaterali. Testarea unilateral este utilizat numai n mod excepional, n cazuri
bine justificate.

O scurt discuie pe tema nivelului alfa maxim acceptabil (0.05) se impune, avnd
n vedere faptul c ntregul eafodaj al deciziei statistice se sprijin pe acest prag. Vom
sublinia, din nou, c p=0.05 este un prag de semnificaie convenional, impus prin
consensul cercettorilor din toate domeniile, nu doar n psihologie. Faptul c scorul critic
pentru atingerea pragului de semnificaie este 1.96 a jucat, de asemenea, un rol n
impunerea acestei convenii. Practic, putem considera c orice ndeprtare mai mare de
dou abateri standard de la media populaiei de referin este semnificativ. Chiar dac
persist posibiliti de a ne nela, ele sunt suficient de mici pentru a le trece cu vederea.
Impunerea unui prag minim de semnificaie a testelor statistice are ns, mai ales,
rolul de a garanta faptul c orice concluzie bazat pe date statistice rspunde aceluiai
criteriu de exigen, nefiind influenat de subiectivitatea cercettorului. Nivelul alfa de
0.05 nu este dect pragul maxim acceptat. Nimic nu mpiedic un cercettor s i impun
un nivel mai exigent pentru testarea ipotezei de nul, ceea e nseamn un prag alfa mai
sczut. n practic mai este utilizat pragul de 0.01 i, mai rar, cel de 0.001. Toate aceste
praguri pot fi exprimate i n procente, prin opusul lor, care exprim nivelul de ncredere
n rezultatul cercetrii. Astfel, printr-o probabilitate de 0.05 se poate nelege i un nivel
de ncredere de 95% n rezultatul cercetrii (99%, pentru p=0.01 i, respectiv, 99.9%
pentru p=0.001).
n fine, este bine s subliniem faptul c utilizarea acestor praguri vine din
perioada n care nu existau calculatoare i programe automate de prelucrare statistic. Din
acest motiv, cercettorii calculau valoarea testului statistic pe care apoi o comparau cu
valori tabelare ale probabilitii de sub curba de referin. Pentru a face mai practice aceste
tabele, ele nu cuprindeau toate valorile de sub curb, ci doar o parte dintre acestea, printre
ele, desigur, cele care marcau anumite praguri. Rezultatul cercetrii era raportat, de
aceea, prin invocarea faptului de a fi sub pragul de semnificaie sau deasupra sa.
Odat cu diseminarea pe scar larg a tehnicii de calcul i cu apariia programelor de
prelucrri statistice, semnificaia valorilor testelor statistice nu mai este cutat n tabele,
ci este calculat direct i exact de ctre program, putnd fi afiat ca
atare. De aici, aa cum am mai spus, rezult i posibilitatea de a lua decizia statistic prin
compararea direct a valorii calculate a lui p cu pragul alfa critic asumat.
Estimarea intervalului de ncredere pentru media populaiei

Eantionul cercetrii noastre a obinut medie QI=106, care s-a dovedit


semnificativ. Acest lucru nseamn c valorile inteligenei elevilor olimpici fac parte
dintr-o populaie special de valori QI, care are o medie mai mare dect media populaiei
generale de elevi. Dar ct de mare este aceast medie? Media eantionului cercetrii ne
ofer o estimare a acesteia dar, ca orice estimare, conine o anumit imprecizie, exprimat
prin eroarea standard a mediei. Nu vom putea ti niciodat cu precizie care este media
inteligenei populaiei de elevi olimpici, dar teorema limitei centrale ne permite s
calculm, cu o anumit probabilitate, n ce interval se afl ea, pe baza mediei eantionului
cercetrii i a erorii standard a acesteia.
Acest lucru se bazeaz pe proprietatea curbei normale de a avea un numr bine
definit de valori pe un interval simetric n jurul mediei. Astfel, dac lum pe curba
normal un interval cuprins ntre z=1.96 de o parte i de alta a mediei, tim c acoperim
aproximativ 95% din valorile posibile ale distribuiei. n acest caz, z=1.96 se numete z
critic deoarece reprezint un prag limit, pe cele dou laturi ale distribuiei (care, pentru
curba normal standardizat, este 0). Alegerea acestor limite pentru z critic este
convenional. Se pot alege, la fel de bine, valori simetrice ale lui z care s cuprind ntre
ele 99% sau 99.9% dintre valorile de pe curba normal. Prin consens, ns, se consider
c asumarea unui nivel de ncredere de 95% (corespunztor pentru valori critice ale lui
z=1.96) este considerat suficient pentru pstrarea unui echilibru ntre precizia estimrii
i probabilitatea estimrii. Ca urmare, n aceast condiie, putem spune c exist 95%
anse ca, avnd media unui eantion aleator, media populaiei s se afle undeva n
intervalul:

unde =media populaiei, pe care o


cutm m=media eantionului de
cercetare
zcritic=valoarea corespunztoare pentru alfa ales (de regul
0.05) sm=eroarea standard a mediei

n ce privete eroarea standard a mediei, aceasta este dat de raportul dintre


abaterea standard a populaiei, pe care n acest caz o cunoatem (15) i radical din volumul
eantionului:

Mai departe, utiliznd formula 3.3 pentru datele eantionului cercetrii, limitele
de ncredere pentru media populaiei mediei pot fi calculate astfel:

pentru limita inferioar = 106-1.96*2.74 = 100.62


pentru limita superioar = 106 +1.96 * 2.74 =
111.37

Ca urmare, putem afirma, cu o probabilitate de 95%, c media real a populaiei de


elevi olimpici, estimat prin media eantionului cercetrii, se afl undeva ntre 100.6 i
111.3. Acest interval a crui limit inferioar este foarte aproape de media populaiei
generale de valori QI (100), ne arat c, dei semnificativ, diferena eantionului nostru
nu are o valoare foarte ridicat. Trebuie s observm, de asemenea, c mrimea
intervalului de ncredere rezult din imprecizia mediei, exprimat prin eroarea standard a
mediei. Acesta, la rndul ei, este cu att mai mare cu ct volumul eantionului este mai
mic. Desigur, cu ct limitele intervalului de estimare sunt mai apropiate de media
eantionului, cu att aceasta din urm estimeaz mai precis media populaiei i prezint
mai mult ncredere.
Testul t (Student) pentru un singur eantion

Aa cum am precizat mai sus, testul z poate fi utilizat doar atunci cnd
cunoatem media populaiei de referin i avem la dispoziie un eantion mare (adic de
cel puin 30 de subieci, n cazul unei variabile despre care avem motive s credem c se
distribuie normal). Dar nu ntotdeauna putem avea la dispoziie eantioane mari (minim
30 de subieci). Pentru situaiile care nu corespund acestei condiii, testul z nu poate fi
aplicat. i aceasta, pentru c distribuia mediei de eantionare urmeaz legea curbei
normale standardizate doar pentru eantioane de minim 30 de subieci, conform teoremei
limitei centrale.
La nceputul secolului XX, William Gosset, angajat al unei companii
productoare de bere din SUA, trebuia s testeze calitatea unor eantioane de bere pentru
a trage concluzii asupra ntregii arje. Din considerente practice, el nu putea utiliza dect
eantioane (cantiti) mici de bere. Pentru a rezolva problema, a dezvoltat un model
teoretic propriu, bazat pe un tip special de distribuie, denumit distribuie t, cunoscut ns
i ca distribuia Student, dup pseudonimul cu care a semnat articolul n care i-a expus
modelul.
n esen, distribuia t este o distribuie teoretic care are toate caracteristicile
unei distribuii normale (este perfect simetric i are form de clopot). Specificul acestei
distribuii const n faptul c forma ei (mai exact, nlimea) depinde de un parametru
denumit grade de libertate (df sau degrees of freedom), care este egal cu N-1 (unde N
este volumul eantionului). Acest parametru poate fi orice numr mai mare dect 0, iar
mrimea lui este aceea care definete forma exact a curbei i, implicit, proporia
valorilor de sub curb ntre diferite puncte ale acesteia. Imaginea de mai jos ilustreaz
modul de variaie a nlimii distribuiei t, n funcie de gradele de libertate.

Aa cum se observ, curba devine din ce n ce mai aplatizat pe msur ce df


(volumul eantionului) este mai mic. Acest fapt are drept consecin existena unui numr
mai mare de valori spre extremele distribuiei. Nu este ns greu de observat c, pe
msur ce df este mai mare, distribuia t se apropie de o distribuie normal standard astfel
nct, pentru valori ale lui N de peste 31 (df=30), aria de sub curba distribuiei t se apropie
foarte mult de valorile de sub aria curbei normale standard (z), iar scorul critic pentru t
este acelai ca i cel pentru z pe curba normal (1.96).
Din cele spuse rezult c, dac avem un eantion de volum mic (N<30), vom
utiliza testul t n loc de testul z, pe baza unei formule asemntoare:
unde:
m este media eantionului
este media populaiei
sm este eroarea standard a mediei

Interpretarea valorii lui t se face n mod similar cu cea pentru valoarea lui z, cu
deosebirea c se utilizeaz tabelul distributiei t (Anexa 2). n acest caz, valorile critice ale
lui t vor fi diferite n funcie de numrul de grade de libertate. Citind tabelul, se observ
c pragurile critice ale lui t (subnelegnd alfa=0.05, pentru test bilateral) se plaseaz la
valori diferite n funcie de nivelul df. n acelai timp, dac df este mare (peste 30),
valorile tabelare ale lui t se apropie de cele ale lui z. La infinit, ele sunt identice (1.96, la
fel ca i n cazul valorilor lui z).
Date fiind caracteristicile enunate, n practic, testul t se poate utiliza i pentru
eantioane mari (N30). n nici un caz ns, nu poate fi utilizat testul z pentru eantioane
mici (N<30). Utilizarea testului bazat pe un singur eantion (fie z sau t) depinde ntr-o
msur decisiv de asigurarea caracteristicii aleatoare a eantionului.

Publicarea rezultatelor testului z sau t

Publicarea rezultatelor diferitelor proceduri statistice trebuie fcut astfel nct


cititorii s i poat face o imagine corect i complet asupra rezultatelor. n acest scop la
publicarea rezultatelor trebuie respectate anumite reguli, la care vom face trimitere n
continuare, n legtur cu fiecare nou test statistic ce va fi introdus.
n principiu, publicarea rezultatelor unui test statistic se poate face n dou
moduri:
sintetic (de regul sub form tabelar), atunci cnd numrul variabilelor
testate este relativ mare;
narativ, atunci cnd se refer, s zicem, la o singur variabil.
n cazul testului pentru un singur eantion se vor raporta: media eantionului,
media populaiei, valoarea lui z (sau t), nivelul lui p, tipul de test (unilateral/bilateral).
Dac avem n vedere rezultatele obinute pe exemplul de mai sus, se apeleaz la o
raportare de tip narativ, care poate utiliza o formulare n maniera urmtoare: Eantionul
de elevi participani la olimpiade a obinut un scor (QI=106; 95%CI: 100.6-111.3) peste
media populaiei generale (QI=100). Testul z, cu alfa 0.05, a demonstrat c diferena nu
este semnificativ statistic, z=+2.13, p>0.05, unilateral.
n acest exemplu de prezentare nu formularea ca atare este esenial, ci
informaiile asociate publicrii testului z. Formularea poate diferi de cea enunat, dar
elementele informaionale trebuie s fie complete. Expresia 95%CI vine de la 95%
Confidence Interval i exprim intervalul de ncredere pentru media populaiei.
Aa cum am spus mai sus, utilizarea programelor statistice ofer pentru orice
valoare a lui z (sau oricare alt test statistic) valoarea exact a lui p. Ea poate fi utilizat ca
atare, pstrnd ns raportarea acesteia la pragul de semnificaie. Orice valoare a lui p mai
mare de 0.05 este considerat nesemnificativ6, dac nu a fost fixat un alt prag, mai sever.
---

6
Programele de prelucrri statistice utilizeaz termenul Sig. (de la significance n loc
de p. Ele sunt strict echivalente.
UN EXEMPLU DE STUDIU BAZAT PE TESTUL z(t)

Aa cum am precizat deja, testul z sau testul t pentru un singur eantion (comparat
cu populaia de referin) sunt teste statistice destul de rar utilizate n practic, deoarece
rareori cunoatem parametrii populaiei (medie, abatere standard). Vom prelua aici un
studiu efectuat de Sara Tonin, (B.H. Cohen, op.cit., p. 205) cu privire la relaia dintre
depresia de lung durat (cronic) i nlime. Ipoteza cercetrii, bazat pe experien i
observaie ndelungat, a fost aceea c femeile care sufer de depresie cronic sunt mai
scunde dect cele care nu prezint aceast suferin psihic. n acest caz, ipoteza statistic
(de nul sau a diferenei nule) este c nu exist nici o diferen de nlime ntre femeile
care sufer i cele care nu sufer de depresie cronic.
n primul rnd, este necesar luarea n considerare a mediei populaiei feminine.
Aceasta a fost luat din studii de antropometrie, fiind: =165 cm. n faza urmtoare
cercettoarea a ales valoarea lui =0,05. A decis s utilizeze un test de tip bilateral
(aceasta pentru a acoperi i eventualitatea c femeile depresive sunt chiar mai nalte dect
cele care nu sufer de depresie). n acest caz, pentru a afla valorile critice ale lui z, a
mprit la 2 (0.05/2=0.025 ceea ce, transformat n procente de sub curb, nseamn
2.5%). A sczut 50-2.5=47.5% pentru a gsi procentul corespunztor lui z critic, pe care
l-a citit din tabel, aa cum se vede n imaginea de mai jos: zcritic=1.96. Fiind vorba de un
test bilateral, exist de fapt dou valori pentru z critic, una cu plus i una cu minus, pentru
fiecare dintre cele dou extreme ale curbei (zcritic=1.96).
n continuare, cercettoarea a selectat un eantion aleator de femei cu depresie
cronic (N=30), pentru care a calculat nlimea medie: m=160 cm i abaterea standard
s=7.62.
n final, a calculat valoarea lui z:

Pentru c abaterea standard a populaiei nu a fost cunoscut, a utilizat abaterea


standard a eantionului pentru aproximarea acesteia. Valoarea calculat a lui z este -3.59,
adic este mai mare (n valoare absolut) dect 1.96, ct era valoarea critic pentru z.
n concluzie, se poate respinge ipoteza de nul i, ca urmare, ipoteza cercetrii este
acceptat. Femeile depresive cronic sunt, statistic vorbind, mai scunde dect cele fr
probleme depresive. Acest rezultat nu permite tragerea unei concluzii ferme cu privire la
relaia direct ntre nlime i nivelul depresiei. Nu este exclus ca nlimea s joace un
anumit rol n echilibrul vieii de relaie, dar la fel de posibil ar fi ca nlimea s fie
determinat de anumii factori fiziologici care, abia ei, s aib o legtur direct cu
depresia.
EXERCIII

1. S presupunem c media populaiei pentru o scal de anxietate este =40.


Dup un cutremur puternic se obin urmtoarele scoruri pe un eantion de
subieci care se adreseaz unui cabinet de psihologie clinic: 62, 49, 44, 46, 48,
52, 57, 51, 44, 47.
-Testai ipoteza conform creia nivelul anxietii este influenat de cutremur.
(=0,05, bilateral).
-Calculai intervalul de ncredere pentru media populaiei (95%).

2. Scorurile obinute la o scal de satisfacie profesional de ctre angajaii unui


compartiment dintr-o companie privat sunt urmtoarele: 10, 12, 15, 11, 10, 22,
14, 19, 18, 17, 25, 9, 12, 16, 17.

Scala a fost aplicat ntregului personal al companiei (=13 i =4)


-Este nivelul de satisfacie al compartimentului respectiv semnificativ mai mic
dect satisfacia la nivelul ntregii companii? (pentru alfa=0.01)

S-ar putea să vă placă și