Sunteți pe pagina 1din 11

AUREL STAN

UNITAT
TEA DE ÎN
NVĂȚARE 8.
8
A TESTELOR STATISTICE. ST
TEORIA TABILIREA
A SEMNIFIC
CAȚIEI DIFFERENŢEI
DINTRE
E MEDII

CONSIDERAŢIII PRELIMINARE

Î statistică testul este o procedură de calcul peentru verificaarea unor ipooteze emise anterior.
În
Deci, tesstul statistic este
e util, mai ales, în condiţiile în caree dorim să affirmăm sau ssă infirmăm o ipoteză.
Pentru a afirma sau infirma validditatea ipotezzelor în statistică se disppune de un număr maree de teste
statisticee. Astfel, exisstă, teste caare compară mediile întree ele, teste carec comparră proporţiile între ele
care com mpară variannţele, teste caare studiază legăturile înntre variabile.. Cea mai cuurentă clasificcare este
între testte statistice de
d diferenţierre (teste caree compară mediile
m între ele,
e teste carre compară proporţiile
p
între ele) şi teste staatistice de associere (caree studiază legăturile întree variabile). ÎÎnainte de puunerea în
aplicare a unui test statistic trebbuiesc formullate două ipooteze, în genneral opuse, care vor fi alternativ
testate pentru
p a ajutaa cercetătorul sau practiciianul în ceeaa ce el îşi proopune să reallizeze.
Ipoteza de nulitate Aceeastă ipotezăă statistică mai m este dennumită ipoteeza de nul şi este, în
general, notată cu H0. Ipoteza de d nul presuupune că difeerenţele constatate întree doi indicatoori supuşi
analizei sunt
s nesemnnificative, legate de factorri aleatori rezzultând din vaariaţia eşantioonajului şi nuu din unul
sau mai mulţi factori sistematici, explicând ceeea ce un ceercetător a observat.
o A foormula ipotezza de nul
înseamnnă a afirma ca nu există nimic n diferit, că toate măssurile sunt eggale, că meddii diferite sunnt de fapt
identice, că proporţii neechivaleente sunt ideentice în semnificaţie. Înnseamnă a spune că diferenţele
observatte depind de hazard şi nuu de un alt facctor.
Ipoteza alternativă. Estee ipoteza pee care o form mulează cerceetătorul caree a prelevat unul sau
mai mullte eşantioanne dintr-o populaţie, care a manipuulat sau stuudiat mai muulte variabilee şi care
gândeştee că ceea cee el a observvat nu este legat de flucttuaţii fireşti de d eşantionaare, ci de unuul sau de
mai mulţţi factori deteerminanţi. Acceastă ipotezză, notată în general cu H1, arată că hazardul nu poate să
explice rezultatul
r caree s-a obţinut.
După ce o anumită
a ipoteeză a fost foormulată, poaate fi practiccat testul carre va putea susţine o
astfel dee ipoteză mai mult decât alta.a Ipoteza nulă este ceea care este totdeauna
t testată. În urm ma acestui
demers sunts posibile două alternaative:
 ipoteeza nulă este conservatăă şi, în acesst caz, nu see poate adoppta punctul dde vedere al ipotezei
alterrnative;
 ipoteeza nulă estee respinsă şi, în acest cazz, se poate reeţine ipoteza alternativă.
Î realizarea testelor stattistice se pot întâlni două tipuri de erori: erori de tipp I şi erori dee speţa II.
În
În tabeluul care urmeaază prezentăm schematicc condiţiile dee apariţie a acestor erori.

Decizia
D Ho adevărat
a Ho fals
H0 acceptat Deciizie corectă Eroare de tip II
H respins
Ho Eroaare de tip I Decizie corectă

IMPORTANT T
Există risscuri atât prinn acceptareaa H0, cât şi prrin respingereea H0. Probaabilitatea de a respinge ippoteza de
nul, în tim
mp ce aceassta este adevvărată se num meşte, eroarre de prima speţă
s sau ero
roare de tip I.. Această
eroare ses numeşte pragul
p de înccredere sau de semnificaaţie a unui teest. Valoareaa sa fixează riscul pe
care cineeva şi-l ia unn cercetător spunând
s că ceea
c ce se observa
o estee legat de un factor sistem
matic mai
curând decât
d de flucttuaţiile normaale ale eşanttionării. Acest tip de risc se
s fixează la 5% sau 1% (se poate
reduce dacă
d condiţii imperioase justifică acest lucru. Probaabilitatea de a accepta ippoteza nulă, în î timp ce

212
STATISTICĂ

aceasta este falsă este numită eroare de a doua speţă sau eroare de tip II. Este riscul pe care cineva îl
ia de a spune că ceea ce s-a observat este legat de fluctuaţii normale ale eşantionării, pe când în
realitate aceste observaţii sunt explicate printr-un alt factor sau prin alţi factori. În mod paradoxal, erorile
de tip I si tip II sunt strâns legate. Diminuând eroarea de tip 1 creşte, în acelaşi timp, eroarea de tip II, şi
mărind eroarea de tip 1 se diminuează eroarea de tip II. Deoarece este dificil; de a fixa un compromis
între cele 2 riscuri de eroare, pragul fixat pentru fiecare din aceste riscuri va fi în funcţie de miza
inferenţelor, voinţa sau lipsa voinţei de a detecta factorul activând variaţia (factorul sistematic)
eşantionului pe care cineva îl utilizează, de caracterului novator sau lipsit de această caracteristică al
rezultatelor. Se va putea reduce riscul de a doua speţă fără a modifica riscul primei speţe, optimizând
metoda de eşantionare, prelevând indivizi suplimentari, utilizând anumite tipuri de teste sau optând
pentru un test unilateral mai curând decât bilateral. Testul unilateral poate obţine doar rezultate pozitive,
pe când cel bilateral poate obţine rezultate pozitive şi negative.

TESTE STATISTICE PARAMETRICE ŞI NEPARAMETRICE

Folosirea unui anumit test depinde de tipul de scală de măsură utilizată pentru a culege
informaţia statistică. Uneori se poate folosi un test independent de scală pentru că distribuţia nu oferă
caracteristici de formă şi de dispersie necesare pentru folosirea acestui test.
Se pot distinge două familii de teste statistice:
 teste parametrice, în care concluziile se sprijină pe legea probabilităţii care certifică că distribuţia
sau distribuţiile observate respectă anumite caracteristici;
 teste nonparametrice care nu necesită respectarea acestor caracteristici.
Testele parametrice prezintă următoarele exigenţe:
▪ datele distribuţiei trebuie să se repartizeze în maniera "normală", adică, în alţi termeni, curba trebuie
să aibă o formă apropiată aceleia a legii normale;
▪ datele de care se dispune să provin din scala de măsură de interval (cel puţin);
▪ varianţele acestora trebuie să fie omogene, adică nu trebuie să existe dezechilibre importante ale
dispersiilor, în cazul în care se cere compararea mediilor a două eşantioane.
Aceste trei condiţii trebuie să fie verificate înaintea oricărei folosiri a unui test parametric. Dacă
condiţiile sunt îndeplinite cercetătorul sau practicianul are la dispoziţie un evantai de teste puternic,
pentru că ele permit de a diminua riscul de a doua speţă. Dacă una din condiţii nu este îndeplinită (şi a
fortiori toate trei) se riscă de a respinge pe nedrept ipoteza de nulitate, adică de a observa diferenţe şi
relaţii acolo unde ele nu există.
Testele nonparametrice pot să se elibereze de această condiţie de normalitate sau de
echivalenţă a dispersiilor. Ele sunt independente de un anumit tip de distribuţie sau, cum se mai spune,
au o distribuţie liberă. Un alt mare avantaj al acestor teste este acela ca ele nu cer să se dispună de
eşantioane de mare dimensiune. În schimb, prezintă inconvenientul de a fi mai puţin puternice ca
testele parametrice, adică informaţia pe care o oferă este mai puţin consistentă. Consecinţa acestei
slăbiciuni poate să conducă la creşterea riscului de a doua speţă, la concluzia că nu există nimic
diferenţiat, pe când în realitate există unele diferenţe.

COMPARAŢIA MEDIILOR

Principalele teste statistice. Realizarea tipurilor de teste pentru compararea mediilor pleacă de
la premisa că eşantioanele care se obţin dintr-o populaţie se situează mult mai frecvent în intervalul de
fluctuaţie al populaţiei studiate. Acest principiu poate fi înţeles la diferenţa dintre două medii provenind
din eşantioane diferite. Se consideră că fluctuaţiile de eşantionare pot să conducă la diferenţe, dar că
frecvenţele acestor diferenţe se repartizează de manieră neomogenă. Astfel probabilitatea de a obţine o

213
AUREL STAN

diferenţă nulă (mediile să fie identice) este cazul cel mai frecvent, în timp ce probabilitatea de a obţine o
diferenţă nenulă este teoretic mai puţin frecvent, cu atât mai mult cu cât amplitudinea acestor diferenţe
este mai mare.

EXEMPLU: Se aplică unei populaţii de 8 subiecţi o probă de dexteritate manuală la care scorul maxim
este 18. Scorurile obţinute sunt următoarele:

Subiect 1 2 3 4 5 6 7 8 9
Scor 9 11 14 10 12 13 8 16 15

Se prelevează la întâmplare doi subiecţi (S1 şi S2) în această populaţie şi se face diferenţa
scorurilor lor (S1 – S2). Aceasta trebuie să corespundă uneia din diferenţele din cele două tabele.

Subiectul 2 Subiectul 1
8910111213141516 8 9 10111213141516
8 8
9 1 9 -1
1021 10.2 -1
11321 11-3-2-1
Subiectul 1

Subiectul 2

12432 1 12.4 -3-2 -1


13543 2 1 13-5-4-3 -2 -1
14654 3 2 1 14-6-5-4 -3 -2 -1
15765 4 3 2 1 15-7-6-5 -4 -3 -2 -1
16876 5 4 3 2 1 16-8-7-6 -5 -4 -3 -2 -1

Prezentăm, în continuare, un tabel cu efectivele diferenţelor posibile în valoare absolută.


Observăm că cea mai mică diferenţă este egală cu 1 (în valoare absolută) şi cea mai mare diferenţă
este egală cu 8.

Amplitudine diferenţei 1 2 3 4 5 6 7 8 Total


Frecvenţe absolute(efective) 16 14 12 10 8 6 4 2 72
Frecvenţe relative ( în %) 22 19 17 14 11 8 6 3 100

Cu cât amplitudinea diferenţelor este mai importantă cu atât probabilitatea unui subiect de a fi
obţinut o astfel de diferenţă este mai slabă. Se pune următoarea întrebare la testul de comparare a
mediilor: «Care este probabilitatea pe care o vom avea de a obţine o astfel de diferenţă prin hazardul
eşantionării?». Testele de comparare a mediilor vor să răspundă cu precizie la această întrebare,
evaluând probabilitatea de a obţine în manieră aleatorie toate diferenţele observate. Dacă aceasta
probabilitate este superioară unui prag, fixat prin convenţie la 5%, atunci se estimează ca diferenţele
sunt imputabile hazardului eşantionajului. Se va conserva atunci ipoteza nulă. Dacă această
probabilitate va fi egală sau inferioară acestui prag, atunci se va respinge ipoteza de nul şi se va
propune ipoteza alternativă. Atunci se va concluziona că diferenţa este statistic semnificativă şi că
diferenţa este imputabilă efectului variabilei sau variabilelor pe care cineva a putut să le manipuleze.
Există totdeauna, în schimb, un risc ca diferenţele să fie imputabile hazardului eşantionării.
Un test de comparaţie a mediilor nu trebuie să se efectueze decât plecând de la distribuţii de date
provenind din scale de măsură de interval şi de raport. Testele de comparare a mediilor sunt teste
parametrice şi, deci, la efectuarea lor, cercetătorul trebuie să verifice conformitatea caracteristicilor
distribuţiei cu aşteptările statisticianului. Distribuţiile studiate trebuie să fie normale şi variantele lor
trebuie să fie echivalente. Dacă lucrurile stau aşa, atunci se dispune de instrumente statistice care devin

214
STATISTICĂ

"parteneri" foarte fiabili în procesele de decizie care se pun în operă. În majoritatea cazurilor, aceasta se
verifică grafic, comparând valorile parametrilor.

COMPARAREA UNEI MEDII LA O NORMĂ

Norma poate să îmbrace diverse accepţiuni, funcţie de fenomenul studiat sau de câmpul de
studiu, chiar de disciplina ştiinţifică. Statisticienii impun aici o valoare, care reprezintă o valoare
aşteptată a mediei, având foarte puţină importanţă dacă este o valoare întreagă sau fracţionară, dacă
este pozitivă sau negativă. Este imperativ ca valoarea să se exprime sub formă numerică. Psihologul
trebuie să se acomodeze la această constrângere, exprimând fenomenul psihologic sub forma unei
valori numerice. Media nu poate să rămână la starea de definiţie conceptuală.
În psihologie, norma poate să fie un efect aşteptat (memorizarea medie a 7 elemente de
informaţie) sau cunoaşterea prealabilă a unui fenomen psihologic pentru care se dispune de o normă
provenind de la o populaţie (media QI-ul, media naţională a rezultatelor unui test şcolar). Ea poate, de
asemenea, să se caracterizeze printr-o valoare aşteptată de către un cercetător sau un practician, care
estimează că o poată justifica teoretic. De asemenea, norma poate să fie o valoare nulă într-o sarcină
oarecare de polarizare. În toate cazurile, exploatarea sa va fi aceeaşi. Testul statistic va avea drept
obiectiv de a verifica dacă diferenţa dintre media unui eşantion (media observată) şi valoarea numerică
acordată normei poate fi atribuită la un factor aleator (factor legat de o eroare de eşantionare) sau de un
factor sistematic (variabila independentă, manipulată sau determinată). Ipoteza unui factor sistematic
(numita H1 ) este adoptată după ce s-a respins ipoteza unui factor aleator (numit H0).

Metoda de calcul. Obiectivul testului este de a răspunde la întrebarea următoare: Care este
probabilitatea ca diferenţa observată între media unui eşantion şi media normei să poată fi atribuită
fluctuaţiilor normale de eşantionare? Există mai multe metode de a răspunde, dar a fost aleasă aceea
care permite de a evalua cu exactitate probabilitatea de a obţine prin hazard de eşantionaj o astfel de
diferenţă. Formula pentru diferenţă dintre o medie de eşantion şi o normă este asemănătoare cu
formulele găsite anterior.
X   (norma )
z
s ( )
N
în care: z = variabila normată redusă
X = media eşantionului
μ = media populaţiei
s = abaterea standard a eşantionului
N = efectivul eşantionului
σ = abaterea standard a populaţiei.
În paranteză au fost trecute simboluri alternative.
Formula este un raport între diferenţa a două medii cu eroarea standard asociată acestei
diferenţe. Norma este numită în acest caz media populaţiei, pentru că funcţia principală a testului este
de a spune dacă se poate considera sau nu eşantionul ca fiind prelevat din populaţia părinte din care
este extrasă. Fluctuaţia eşantionării face posibilă apariţia unei infinităţi de medii de eşantion. Rămâne
de ştiut care poate fi probabilitatea de a obţine în această populaţie, un eşantion de aceeaşi medie ca
aceea care s-a observat practic. Examinând formula se poate observa că indicele obţinut nu este nimic
altceva decât o abatere pe care cineva o va putea situa în spaţiu unei legi de distribuţie, aşa cum s-a
făcut cu valoarea unui subiect. S-a substituit, deci, valorii unui subiect valoarea unei diferenţe. O astfel
de evaluare presupune luarea în considerare simultană a mai multor elemente:

215
AUREL STAN
T

 ammplitudinea abaterii
a între medii: cu cât amplitudineea se măreştte, cu atât m mai puţin are ea şanse
dee a se întâlni prin hazarduul eşantionăriii;
 vaarianţa asociaată acestei abateri: cu câât aceasta este mai slabă cu atât abatterea redusă este mai
maare. Formulaa ia în calcul două cazuri: primul esste acela în care varianţţa populaţiei (varianţa
associată normeei) este cunooscută, în acest caz se iaa în calcul vaarianţa populaaţiei. Al doileea caz, în
geeneral mai frrecvent, estee acela în carec varianţaa populaţiei este necunooscută şi, înn această
sittuaţie, aceastta este estimmată prin variaanţa eşantionnului (estimaaţie fără contoorsionări);
 măărimea eşantionului: cu cât c mai multt diferenţele se observă la marile eşaantioane, cu atât mai
muult factorii suusceptibili dee a exprima diferenţa
d pot să se exprim me. Influenţaa mărimii eşaantionului
esste proporţionnală rădăcinnii sale pătraate. Abatereaa dintre douuă medii estte deci pondderată de
vaaloarea numittorului care, odată mai mult,
m depindee de două vaariabile: dispeersia (sau vaarianţa) şi
măărimea eşanntionului. Cu cât variabilitatea este mai redusăă cu atât maai mult indiccele final
(abbaterea reduusă) are şanse de a fi marem şi deci ipoteza de nulitate
n are m
mai multe şaanse de fi
resspinsă.
Î cazul în caare varianţa populaţiei esste cunoscutăă formula sufferă o uşoarăă modificare, sugerată
În
de noi înn formula prrecedentă. Prin varianţa populaţiei see înţelege vaarianţa asociiată mediei populaţiei
p
c corespunde normei).. Abaterea reedusă se obţine făcând raaportul următtor:
(aceea care
X 
z

N
S
Semnificaţia simbolurilorr utilizate înn formulă esste cunoscuttă. Cazurile în care cercetătorul
posedă o informaţie asupra variaanţei populaţţiei (populaţie din care eşantionul
e coomparat a fosst extras)
sunt puţţin frecvente în cercetarrea psihopeddagogică. În majoritatea situaţiilor de cercetare, varianţa
populaţieei nu este cuunoscută cu certitudine, şi se considderă ca ataree. Este cazuul în care cercetătorul
dispune de măsuri anterioare
a făcute cu un eşantion
e de foarte mare mărime, exxtras cu cel mai
m mare
respect faţa
f de regulile eşantionăării. Este, de asemenea,
a cazul
c în care măsura a fost repetată înn multiple
circumsttanţe (cu muultiple eşantiioane), situaaţie în care ea oferă unn indice de vvariabilitate particular
constantt. Varianţa caa valoare a normei poate fi determinatta fără ca să existe, în mood necesar, o măsură
prealabilă a acesteeia. Ea poatte să se juustifice printtr-un model teoretic, inndependent de toate
măsurătoorile efectuatte.

APLICAŢIE.
A
NUMĂRUL MAAGIC. Cercetăările destinatte evaluării memoriei
m de scurt termenn arată că apptitudinea
de memorizare imeddiată pentru diferite
d inform
maţii este dee 7 ± 2. În scopul
s de a vverifica dacăă această
limită o posedă şi liceenii, doi cercetători
c au prezentat o serie de 18 cuvinte ccomune la 193 1 elevi.
Cuvintelee apar pe dissplay-ul, un cuvânt
c la douuă secunde.
Imediat dupăă proiecţia lisstei, subiecţii trebuie să-şi aminteascăă, cât mai reppede posibil, cuvintele
prezentaate pe displaay. Media am mintirii liceenilor este de 7,13. Cerceetătorii se înttrebă dacă, adoptând
riscul dee 5%, scorul mediu al rezzultatului asuupra liceeniloor este diferiit de acela înn general obbservat în
lucrările anterioare. În acest caz valoarea
v 7 este consideraată o normă,, iar 2 abaterrea standard.. Formula
de calcul este următooarea:
7,133  7,00 0,13 0,133
z    0,909
2 2 0,1443
193 13,89
z teoreticc, dat de leggea normală centrată reddusă, este dee 1.96 la risccul de 5% (fixxarea acesteei valori a
fost făcuută anterior). Valoarea z calculată
c de noi este multt inferioară valorii
v tabelarre. La riscul de
d 5% nu
se aducce proba uneei diferenţe între î cele doouă probe comparate.
c Ipoteza de nnulitate trebuuie să fie

216
STATISTICĂ

conservată. Eşantionul liceenilor poate fi considerat ca aparţinând populaţiei din care a fost extras.
Diferenţa de reamintire de 0.13 poate fi atribuită fluctuaţiilor normale de eşantionare. Se poate, deci,
considera că această diferenţă nu are nimic excepţional.

CAZUL ÎN CARE VARIANŢA POPULAŢIEI ESTE NECUNOSCUTĂ

În cercetarea psihopedagogică este rară situaţia în care se dispune de elemente de informaţie


cantitativă precisă asupra populaţiei, plecând de la care este extras eşantionul studiat. În situaţia în care
varianţa populaţiei nu este cunoscută se ia în consideraţie varianţa eşantionului pentru estimarea erorii
standard. Va fi o estimaţie fără deformare. Indiferent dacă este vorba de mici sau mari eşantioane,
formula de comparaţie a unei medii la o normă este totdeauna aceeaşi.
X   (norma )
t sau z = .
s
N
Alegerea acestora depinde esenţial de mărimea eşantionului. Dacă mărimea eşantionului este
inferioară sau egală cu 30 indicele, ales este t-ul a lui Student. Tabela consultată va fi tabela t a lui
Student. Dacă această mărime este superioară lui 30, atunci indicele ales va fi z. Tabele de referinţă va
fi, deci, legea normală centrată redusă.

COMPARAREA A DOUĂ MEDII OBSERVATE

Situaţia în care se dispune de o normă numerică sau de o medie a populaţiei nu este cea mai
frecventă în psihologie şi în alte disciplinele ştiinţifice şi experimentale. În majoritatea cazurilor se
compară între ele distribuţii ale datelor provenind din două eşantioane. Faptul că nu se dispune de
norme sau de medii ale populaţiei (în psihologie şi alte discipline) este legat de două particularităţi:
 amplitudinea rezultatelor din domeniul psihologiei;
 specificitatea metodologică a studiului acestor rezultate.
Când se concepe un plan de studiu original, cu instrumente de măsură şi ipoteze originale,
cercetătorul nu este în măsură de a avea la dispoziţia sa o medie a populaţiei sau chiar o anumită idee
a valorii pe care aceasta trebuie să o ia. Originalitatea unui câmp de cercetare, originalitatea unei
variabile independente manipulate sau originalitatea unei ipoteze teoretice propuse provin în majoritatea
timpului din faptul că nimic nu a fost studiat, făcut sau propus anterior. Un cercetător nu-şi pierde timpul
reluând cercetări la care concluziile se cunosc foarte bine. În situaţia în care nici o informaţie nu este
disponibilă cercetătorul se vede obligat de a recurge la compararea a două eşantioane. Chiar situaţiile
experimentale cele mai simple, care compară un grup de control cu un grup supus la aceleaşi condiţii
experimentale ca şi grupul de control, dar afectat printr-o variabilă suplimentară, trebuie adesea să facă
apel la două grupe de subiecţi, apoi de a le compara pentru a "aprecia" efectul variabilei suplimentare.
Obiectivul principal este de preciza dacă două eşantioane observate pot fi considerate ca fiind extrase
din aceeaşi populaţie. Testele de comparare a două medii ne dau probabilitatea de a obţine a astfel de
abatere între medii, prelevând din aceeaşi populaţie două eşantioane de subiecţi. Dacă această
probabilitate este rară, în general inferioară lui 5% , se consideră că eşantioanele nu provin din aceeaşi
populaţie.

COMPARAREA A DOUĂ MEDII PROVENIND DIN EŞANTIOANE INDEPENDENTE

Eşantioanele independente sunt eşantioanele în care indivizii care le compun (indivizi luaţi în
sens larg pentru că poate să fie vorba de persoane, de grupuri, instituţii) sunt totdeauna diferiţi sau în

217
AUREL STAN

care alegerea unui individ într-un eşantion nu influenţează alegerea altui individ în alt eşantion. Deci,
indivizi care nu pot fi afectaţi decât în unul sau altul din eşantioanele comparate.
Cazul în care varianţa populaţiei este cunoscută. Situaţie puţin frecventă în psihologie, întâlnită,
totuşi în cazul replicării experienţelor sau în cazul în care se dispune de informaţii numerice provenind
din precedentele studii. De asemenea, se poate estima că varianţa fiecăruia din eşantioane trebuie să
aibă o asemenea valoare (provenind din studii anterioare). De asemenea, se poate estima că varianţa
este constantă (aceeaşi pentru cele două eşantioane). Desigur, se presupune că aceasta se justifică
teoretic şi doar responsabilitatea aceluia care face această estimaţie poate fi angajată. Formula este
următoarea:
X1  X 2
z
 21  2 2

N1 N2
Există puţine diferenţe în comparaţie cu metoda de determinare a abaterii reduse folosite
anterior.
Cazul în care varianţa populaţiei este necunoscută. În cazul în care varianţa populaţiei nu
este cunoscută sau, cel puţin, una din ele nu este cunoscută, se ia în consideraţie varianţa
eşantioanelor pentru estimarea erorii standard. În acest caz trebuie să se ţină seama de mărimea
eşantionului. Metoda de determinare a abaterii reduse variază după mărimea fiecărui eşantion şi tabela
de probabilităţi care se aplică pentru a aprecia probabilitatea abaterii.

Cazul eşantioanelor mari

Precizare. Testul statistic t este o abreviere de la “test statistic”. Întâlnim expresia testul t al lui Student.
Numele de student este un pseudonim pentru William Sealy Gosset, contabil care lucra la fabrica de
bere Guiness în Dublin, Irlanda şi care în 1908 a introdus testul t. Problema este următoare: când
apelăm la testul z şi când apelăm la testul t? Dacă parametrii populaţiei sunt cunoscuţi, atunci se poate
calcula testul z mai degrabă decât testul t. Practic distribuţiile t sunt formulate pentru eşantioane mai
mici decât 30 şi pentru cele mai mari de 30. Valorile t şi z ale unei distribuţii teoretice diferă mult, în
consecinţă tabelele de valori z şi t nu pot fi folosite unul în locul altuia. Diferenţele între distribuţia z şi t
este insignifiantă în cazul în care eşantionul are un volum superior lui 30. Ca atare, tabele t pot fi
utilizate locul tabelelor z.

Condiţia este ca mărimea eşantioanelor să fie mai mare de 30 şi distribuţiile acestora să se


conformeze legii normale. În acest caz se poate utiliza legea normală centrată redusă pentru a testa
probabilitatea de apariţie a abaterii reduse obţinute. Indicatorul de diferenţe va fi, deci, binecunoscutul z.
X1  X 2
z
2
s1 s22

N2 N2
Există puţine diferenţe între această formulă şi cea utilizată anterior. Varianţa eşantionului ia
locul varianţei populaţiei.
Pentru test putem folosi o statistică t sau una z, deoarece avem valori mai mari de 3p.
Prezentat într-o formă detaliată, testul t pentru eşantioane mari, arată astfel:

Etapele testului t pentru eșantioane mari independente

Pasul 1: se calculează mediile celor două distribuții: X=34 ; Y=45


Pasul 2: se calculează cele două abateri standard: sx = 5,42; sY = 6,45
Pasul 3: se calculează erorile standard ale celor două medii (Nx=75; Ny= 97)

218
STATISTICĂ

sX 5,42 sY 6,45
sX    0,63; s Y    0,65
N X 1 75  1 N y 1 97  1
Pasul 4: se calculează eroarea standard a diferenței dintre medii:
s X Y  s X2  sY2  0,632  0,652  0,9
Pasul 5: se calculează valoarea t:
X  Y 34  45
t   12,2
s X Y 0,9
Pasul 6: se interpretează t: se respinge ipoteza de nul pentru p<0,01

Cazul eşantioanelor mici


În cazul în care mărimea eşantioanelor este egală sau mai mică decât 30 şi când varianţa
populaţiei este necunoscută se estimează că repartiţia eşantioanelor diferenţelor mediilor nu mai
urmează o lege normală, ci o lege t a lui Student. Concluziile se vor baza pe legea t a lui Student,
funcţie de numărul gradelor de libertate care se aplică. Formula de determinare a abaterii reduse va fi în
acest caz:
X1  X 2
t
s1 *  N1  1  s2 *  N 2  1
2 2
1 1
* 
N1  N 2  2 N1 N 2
Gradul de libertate este egal cu N1+N2-2.
Să presupunem că avem două eşantioane mici independente cu următorii indicatori cunoscuţi:
X 1 =22, s21=3,2, N1 = 24 şi X 2 =19, s22=2,6, N2=19. Vom aplica formula pentru efectuarea testului t
pentru a stabili semnificaţia diferenţei dintre medii.

22  19 3
T=  
3,2 * 22  1  2,6 19  1
2 2
1 1 11,24 * 21  6,76 *18
* 0,041* 0,0523
* 
22  19  2 22 19 39
3 3 3 3 3
      3,26
236,04  128,44 364,08 9,94 * 0,304 3,05 * 0,304 0,92
* 0,093 * 0,304
39 39
Valoarea lui t egală cu 3,26 o vom compara cu valoarea tabelară a lui t pentru un prag de risc
de 0,05 pentru 39 de grade de libertate. În tabel nu vom găsi valoarea 39, ci o valoare apropiată,
valoarea 40 a gradului de libertate. Observăm că valoarea tabelară găsită de noi (2,02) este mai mică
decât cea calculată în testul t. Observăm, de asemenea, că valorile tabelare mai mari corespund unor
praguri de risc mai mici. Concluzia: vom respinge ipoteza de nul, deci, diferenţele dintre mediile celor
două eşantioane nu sunt întâmplătoare, ci se datorează intervenţiei unor factori sistematici. Formularea
concluziei este următoarea: «Dacă vom respinge în mod constant ipoteza de nul în mai puţin de 5% din
cazuri o respingem pe nedrept», deci, în peste 95% din cazuri respingem pe drept ipoteza de nul.
p
0,20 0,10 0,05 0,02 0,01 0,001 0,0001 0,00001
f
1
2
3
……
40 2,02 2,43 2,71 3,55 4,32 5,05

219
AUREL STAN

COMPARAŢIA A DOUĂ MEDII PROVENIND DIN DOUĂ EŞANTIOANE PERECHE SAU CORELATE

În cazul acestui gen de eşantioane indivizii care le compun sunt aceeaşi în diferite etape ale
prelevării măsurărilor sau posedă similitudini care se pot considera, după regruparea prin cupluri, ca
echivalente (vârstă, aptitudini cognitive, funcţii ocupate). Măsurile distribuţiilor împerechiate sunt adesea
calificate ca "măsuri repetate". Din acest motiv calculul diferenţelor mediilor şi a variaţiei se realizează
"în interiorul" indivizilor şi nu între indivizi. Operaţiile se fac, deci, prin cupluri. După caz cuplurile se
compun din aceeaşi indivizi cu două măsurători, din indivizi "asemănători", având fiecare o măsură
distinctă. Se presupune că indivizii sunt extraşi în respectul tehnicii de eşantionare şi că distribuţiile
diferenţelor în interiorul fiecărui cuplu se face într-un mod normal.

Cazul micilor eşantioane. Legea lui Student. Deoarece analiza se face în interiorul cuplurilor,
pentru a obţine indicele (aici t) corespunzând diferenţei dintre cupluri de date, este suficient de a aplica
formula următoare:
D
t
sD
N
în care:
D - media diferenţelor cuplurilor de date (suma diferenţelor între fiecare cuplu de date împărţită la
numărul de cupluri de date);

sD 
D 2

 D 2 - abaterea standard a diferenţelor.


N
Nu există nimic fundamental diferit cu cea ce s-a văzut în cazul comparării mediilor rezultate din
eşantioane independente. Se face totdeauna raportul între abaterea mediilor şi eroarea standard
asociată acestei abaterii. În cazul eşantioanelor perechi abaterea între două distribuţii nu se aplică la
media distribuţiilor, ci pentru fiecare cuplu de date. Aici calculul abaterii între medii şi mai ales acela al
abaterii standard se face de la diferenţele conţinute în fiecare cuplu de date. Pentru determinarea
abaterii standard, numărătorul raportului nu este altul decât suma pătratelor abaterilor tuturor
diferenţelor observate în fiecare din cupluri prin raport la media acestor diferenţe.
Să presupunem că la acelaşi eşantion mic de 14 de subiecţi am aplicat un test de atenţie
concentrată, înainte şi după efectuarea unei activităţi obositoare care a durat mai multe ore. Rezultatele
obţinute înaintea efectuării unei sarcini foarte obositoare le vom nota cu X şi pe cele obţinute după
efectuarea unei sarcini foarte obositoare le vom nota cu Y.
Ceea ce prezintă importanţă este faptul că ele provin de la aceeaşi subiecţi. Vom avea 4 etape
de calcul:
Nr.crt. X Y D D2
1 72 70 5 25
2 64 60 4 16
3 81 80 1 1
4 87 83 4 16
5 65 62 3 9
6 69 63 6 36
7 70 65 5 25
8 89 86 3 9
9 76 71 5 25
10 64 61 3 9
11 55 52 3 9
12 68 63 5 25

220
STATISTICĂ

13 65 60 5 25
14 74 72 2 4 1. Calcularea mediei diferenţelor:
Σ 54 234
D
 D  54  3,857
N 14
2. Calculul varianţei diferenţelor şi a abaterii standard:

s 
2  D2
 D2 
234
 3,857 2  16.71  14,87 .
N 14
s = 1,84  s=1,36.
2

3. Calculul erorii standard a mediei diferenţelor:


s 1,36 1,36
sD     0,37.
N 1 13 3,6
D 3,857
4. Calculul valorii t: t =  =10,42.
sD 0,37
După ce am aflat valoarea lui t, vom compara valoarea lui t tabelar cu cea calculată de noi la un anumit
prag de risc. În cazul nostru concret pragul de risc adoptat este de 0,05 sau, exprimat procentual, 5%.
Gradele de libertate se calculează după formula: f = N-1, deci f = 14–1= 13. Valoarea tabelară
comparată este valoarea aflată la intersecţia liniei egală cu 13 şi a coloanei 0,05.

p
0,20 0,10 0,05 0,02 0,01 0,001 0,0001 0,00001
f
1
2
3
……
13 2,16 2,65 3,01 4,22 5,51 6,96

Observăm cu uşurinţă că valoarea tabelară (2,16) este mult mai mică decât valoarea calculată de
noi (10,42). Drept urmare, respingem ipoteza de nul şi adoptăm ipoteza alternativă care susţine că
diferenţa dintre medii este semnificativă. În concluzie considerăm diferenţele ca fiind expresia
intervenţiei unui factor sistematic.

TEST CU O IEŞIRE, TEST CU DOUĂ IEŞIRI

Cunoaştem faptul că ipoteza nulă susţine faptul că mediile eşantioanelor sunt identice. Ipoteza
alternativă susţine faptul că mediile sunt diferite. În fapt, se pot propune 3 ipoteze alternative:
 mediile sunt diferite (ipoteza 1);
 media 1 este superioară mediei 2 (ipoteza 2);
 media 2 este superioara mediei 1 (ipoteza 3).
Principiul primului caz este acela pe care noi l-am studiat în exemplele noastre. În statistică el
poarta numele de test bilateral sau test cu două ieşiri. În cazul ipotezelor 2 şi 3 se poate testa direct
sensul unei diferenţe. Când există ipoteza cu un sens se spune ca este vorba de un test unilateral sau
test cu o singură ieşire. Probabilitatea asociată acestui tip de test se găseşte modificată prin raport la
aceea care însoţeşte un test bilateral. Testul bilateral a fost cel studiat până în prezent.

221
AUREL STAN
T

Referinţţe bibliograffice
obligatorrii
▪ Cloccotici, V., Stan, A., Statistiică aplicată în
î psihologie,, Editura Poliirom, Iaşi, 20000
▪ Cloccotici, V., Stan, A., Statistiică aplicată în
î psihologie,, Editura Poliirom, Iaşi, 20000
suplimenntare
▪ Andrrei ,T., Stanccu, S., Statisttică - Teorie şi
ş aplicaţii, Edditura All, Buucureşti, 19955
▪ Andrrei ,T., Stanccu, S., Statisttică - Teorie şi
ş aplicaţii, Edditura All, Buucureşti, 19955
▪ Popaa, Marian(2008) Statisticăă pentru psihhologie, Edituura Polirom, Iaşi I

222

S-ar putea să vă placă și