Documente Academic
Documente Profesional
Documente Cultură
Testul z (t) pentru un singur eşantion este util într-un model de cercetare în care ne
propunem compararea valorii măsurate pe un eşantion cu media populaţiei din care acesta provine.
Aşa cum am precizat deja, acest tip de cercetare este destul de rar întâlnit, ca urmare a dificultăţii
de a avea acces la media populaţiei.
Un model de cercetare mult mai frecvent însă, este acela care vizează punerea în evidenţă a
diferenţelor care există între două categorii de subiecţi (diferenţa asumării riscului între bărbaţi şi
femei, diferenţa dintre timpul de reacţie al celor care au consumat o anumită cantitate de alcool faţă
de al celor care nu au consumat alcool etc.). În situaţii de acest gen psihologul compară mediile unei
variabile (preferinţa pentru risc, timpul de reacţie etc.), măsurată pe două eşantioane compuse din
subiecţi care diferă sub aspectul unei alte variabile (sexul, consumul de alcool, etc.). Variabila
supusă comparaţiei este variabila dependentă, deoarece presupunem că suportă „efectul”
variabilei sub care se disting cele două eşantioane şi care, din acest motiv, este variabilă
independentă1. În studii de acest gen, eşantioanele supuse cercetării se numesc „independente”,
deoarece sunt constituite, fiecare, din subiecţi diferiţi.
Să ne imaginăm că dorim să vedem dacă un lot de sportivi, trăgători la ţintă, care practică
trainingul autogen2 (variabila independentă) obţin o performanţă (variabila dependentă) mai bună
decât un lot de sportivi care nu practică această tehnică de autocontrol psihic. În acest caz,
variabila dependentă ia valori prin evaluarea performanţei de tragere, iar variabila independentă ia
valori convenţionale, pe o scală nominală categorială, dihotomică (practicanţi şi nepracticanţi de
şedinţe de relaxare).
În acest exemplu avem două eşantioane de cercetare, unul format din sportivi practicanţi ai
trainingului autogen (TA) şi altul format din sportivi nepracticanţi ai TA. Ipoteza cercetării susţine
că media performanţei celor două grupuri este diferită. Sau, cu alte cuvinte, că cele două grupuri
provin din populaţii diferite, respectiv, populaţia sportivilor practicanţi de TA şi cea a
nepracticanţilor de TA. Trebuie să acceptăm faptul că perechea de eşantioane studiate nu este decât
una din perechile posibile. Să privim figura de mai jos, care ne sugerează ce se întâmplă dacă,
teoretic, am extrage (selecta) în mod repetat de eşantioane perechi din cele două populaţii:
1
Am pus cuvântul „efect” între ghilimele deoarece, chiar dacă este logic să considerăm că este
vorba de o relaţie de tip cauză-efect, simpla măsurare a diferenţelor pe două eşantioane de subiecţi
nu este suficientă pentru a concluziona o relaţie cauzală. Pentru aceasta, ar fi mai potrivit, spre
exemplu, să măsurăm timpul de reacţie la aceiaşi subiecţi înainte şi după consumarea unei cantităţi de
alcool.
2
O metodă de relaxare psihică
Imaginea arată faptul că, pe măsură ce constituim perechi de eşantioane (m11-m21, etc.) cu
valori ale performanţei la ţintă, diferenţa dintre medii devine o distribuţie în sine, formată din valorile
acestor diferenţe. Dacă am reuşi constituirea tuturor perechilor posibile de eşantioane, această
distribuţie, la rândul ei, ar reprezenta o nouă populaţie, populaţia diferenţei dintre mediile practicanţilor
şi nepracticanţilor de training autogen. Şi, fapt important de reţinut, curba diferenţelor dintre medii
urmează legea distribuţiei t. Cu alte cuvinte, la un număr mare (tinzând spre infinit) de eşantioane
perechi, trebuie să ne aşteptăm ca cele mai multe medii perechi sa fie apropiate ca valoare, diferenţa
dintre mediile fiind, ca urmare, mică, tinzând spre 0 şi ocupând partea centrală a curbei.
Diferenţele din ce în ce mai mari fiind din ce în ce mai puţin probabile, vor ocupa marginile
distribuţiei (vezi figura de mai jos). Aceasta este ceea ce se numeşte „distribuţia ipotezei de nul”
pentru diferenţa dintre mediile a două eşantioane independente.
În acest moment este bine să accentuăm din nou semnificaţia statistică a noţiunii de
populaţie. După cum se observă, aceasta nu face referire neapărat la indivizi, ci la totalitatea
valorilor posibile care descriu o anumită caracteristică (psihologică, biologică sau de altă natură).
În cazul nostru, diferenţele dintre mediile eşantioanelor perechi (fiecare provenind dintr-o
„populaţie fizică” distinctă) devin o nouă „populaţie”, de această dată statistică, compusă din
totalitatea diferenţelor posibile, a cărei distribuţie se supune şi ea modelului curbei t.
Procedura statistică pentru testarea semnificaţiei diferenţei dintre mediile a două
eşantioane
Problema pe care trebuie să o rezolvăm este următoarea: este diferenţa dintre cele două
eşantioane suficient de mare pentru a o putea considera că este în legătură cu variabila
independentă, sau este doar una dintre diferenţele probabile, generată de jocul hazardului la
constituirea perechii de eşantioane? Vom observa că sarcina noastră se reduce, de fapt, la ceea
ce am realizat anterior în cazul testului z sau t pentru un singur eşantion. Va trebui să vedem dacă
diferenţa dintre două eşantioane reale se distanţează semnificativ de diferenţa la care ne putem
aştepta în cazul extragerii absolut aleatoare a unor perechi de eşantioane, pentru care distribuţia
diferenţelor este normală. Mai departe, dacă probabilitatea de a obţine din întâmplare un astfel de
rezultat (diferenţă) este prea mică (maxim 5%) o putem neglija şi accepta ipoteza că între cele
două variabile este o relaţie semnificativă.
Dacă avem valoarea diferenţei dintre cele două eşantioane cercetate, ne mai sunt necesare
doar media populaţiei (de diferenţe ale mediilor) şi abaterea standard a acesteia, pentru a calcula
testul z (în cazul eşantioanelor mari) sau cel t (în cazul eşantioanelor mici). În final, nu ne
rămâne decât să citim valoarea tabelară pentru a vedea care este probabilitatea de a se obţine un
rezultat mai bun (o diferenţă mai mare ) pe o bază strict întâmplătoare.
Media populaţiei de diferenţe. Diferenţa dintre mediile celor două eşantioane ale cercetării
face parte, aşa cum am spus, dintr-o populaţie compusă din toate diferenţele posibile de eşantioane
perechi. Media acestei populaţii este 0 (zero). Atunci când extragem un eşantion aleator dintr-o
populaţie, valoarea sa tinde să se plaseze în zona centrala cea mai probabilă). Dar aceeaşi tendinţă
o va avea şi media oricărui eşantion extras din populaţia pereche. Ca urmare, la calcularea
diferenţei dintre mediile a două eşantioane, cele mai probabile sunt diferenţele mici, tinzând spre
zero. Astfel, ele vor ocupa partea centrală a distribuţiei, conturând o medie tot mai aproape de
zero cu cât numărul eşantioanelor extrase va fi mai mare.
Din raţiuni practice, pentru a obţine o formulă care să sugereze diferenţa dintre medii (m1-
m2), formula de mai sus este supusă unor transformări succesive. Prin ridicarea la pătrat a ambilor
termeni, şi după extragerea radicalului din noua expresie, se obţine:
Formula 3.8 ne indică faptul că eroarea standard a diferenţei dintre medii este dată de
suma erorii standard a celor două eşantioane. Unul dintre eşantioane are N1 subiecţi şi o dispersie
σ12 iar celălalt eşantion, N2 subiecţi şi dispersia σ22. Faptul că obţinem eroarea standard a diferenţei
dintre medii ca sumă a erorilor standard a celor două eşantioane este fundamentat pe o lege
statistica a cărei demonstraţie nu se justifică aici.
Pentru a calcula scorul z al diferenţei, vom utiliza o formulă asemănătoare cu
formula notei z pe care o cunoaştem deja:
Aceasta va fi:
Dispersiile celor două eşantioane pot fi considerate împreună pentru a forma o singură
estimare a dispersiei populaţiei (σ2). Obţinem astfel ceea ce se numeşte „dispersia cumulată”, pe
care o vom nota cu s2c şi o vom calcula cu formula următoare:
Expresia 3.13 este formula uzuală pentru calcularea diferenţei dintre medii pentru două
eşantioane independente. Chiar dacă a fost introdusă ca utilizabilă pentru „eşantioane mici”,
caracteristicile distribuţiei t ne permit utilizarea ei şi pentru eşantioane mari, deoarece distribuţia t
tinde spre cea normală la valori din ce în ce mai mari ale gradelor de libertate.
EXEMPLU DE CALCUL:
Datele cercetării
practicanţi TA („1”) ne-practicanţi TA („2”)
X1 (X1-m1)2 X2 (X2-m2)2
15 2.78 10 2.78
9 18.74 8 0.10
12 1.76 11 7.12
13 0.10 5 11.08
16 7.12 7 1.76
15 2.78 9 0.44
Σ 80 33.28 50 23.28
N 6 6
m 13.33 8.33
Iar apoi:
Comparăm t calculat cu t critic din tabelul distribuţiei t: 3.73 > 2.228 Decizia
statistică: Se respinge ipoteza de nul
Concluzia cercetării: Se admite ipoteza cercetării. „Practicarea trainingului autogen este
în legătură cu performanţa de tragere”
Mărimea efectului
Atunci când calculăm testul t, nu valoarea obţinută este relevantă ci probabilitatea care este
asociată acestei valori (p). De exemplu, dacă avem în vedere formula de calcul pentru t, atunci
înţelegem că o valoare t=3.73 nu înseamnă altceva decât faptul că diferenţa dintre mediile
comparate este 3.73 ori mai mare decât eroarea standard estimată a acelei diferenţe. Chiar dacă
probabilitatea asociată acestei valori t este foarte mică, sub pragul alfa, magnitudinea diferenţei
dintre medii poate fi mică. Ca urmare, aprecierea „importanţei” diferenţei dintre mediile grupurilor
cercetate are nevoie de informaţii suplimentare. Acestea sunt oferite de indicele de mărime a
efectului.
Pentru a afla „mărimea efectului” pentru testul t pentru eşantioane independente, se
utilizează indicele d al lui Cohen. Din păcate, pachetele de programe statistice uzuale (inclusiv
SPSS) nu oferă acest valoarea lui d. El poate fi însă obţinut relativ uşor cu formula:
unde numitorul exprimă abatarea standard cumulată a celor două grupuri comparate.
Pentru exemplul nostru, calculăm mărimea efectului înlocuind datele în formula 3.14,
după cum urmează:
Interpretarea mărimii lui d se face utilizând aceleaşi praguri propuse de Cohen: 0.20 –
efect mic; 0.50 – efect mediu; 0.80 – efect mare. Valoarea obţinută de noi indică un nivel ridicat al
mărimii efectului, semn al faptulului că practicarea şedinţelor de relaxare are un „efect” important
asupra performanţei sportivilor din eşantionul cercetării.
Aşa cum ştim, mediile grupurilor comparate reprezintă doar o estimare a mediei populaţiilor
din care provin, oscilând jurul mediei „adevărate”. În mod similar, diferenţa dintre mediile celor două
eşantioane estimează media populaţiei de diferenţe. Cât de precisă este această estimare putem afla
prin calcularea intervalului de încredere pentru diferenţa mediilor. Principial, limitele de încredere
în acest caz se calculează la fel ca şi limitele de încredere pentru media populaţiei, după următoarea
formulă:
µdif=mdif±tcritic* sdif (formula 3.15)
unde:
µdif=media populaţiei de diferenţe (µ1-µ2)
mdif=diferenţa dintre mediile eşantioanelor cercetării (m1-m2 )
tcritic=valoarea lui t pentru nivelul de încredere ales (de regulă 95%)
sdif=eroarea standard a diferenţei (calculată cu expresia de la numitorul formulei
3.13)
Înlocuind datele în formulă, obţinem următoarele limite de încredere pentru media populaţiei
de diferenţe:
Limita inferioară µdif=5-2.228* 1.34=2.01
Limita superioară µdif=5+2.228* 1.34=7.98
Imaginea de mai jos ilustrează limitele între care se află, pe distribuţia populaţiei de diferenţe,
având media 0, cu un nivel de încredere de 95%, poziţia mediei reale a diferenţei dintre grupurile
comparate:
Relevanţa intervalului de încredere poate fi discutată din mai multe puncte de vedere:
(a)Faptul că media populaţiei de nul (µdif=0) se află în afara limitelor de încrerede
subliniază odată în plus caracterul semnificativ al diferenţei dintre mediile grupurilor
comparate. Cu cât una dintre limite ar fi mai aproape de valoarea 0, cu atât faptul de a fi
obţinut un rezultat semnificativ ar fi mai puţin relevant. Dacă media distribuţiei de nul ar
fi cuprinsă între limitele de încredere ipoteza de nul ar trebui acceptată, indiferent de
rezultatul testului statistic.
(b)Mărimea intervalului de încredere arată precizia estimării rezultatului cercetării.
Aceasta este legată în mod direct de eroarea standard a diferenţei (eroarea de estimare) care,
la rândul ei, depinde de numărul subiecţilor din cele două eşantioane, dar şi de
omogenitatea valorilor măsurate.
(c)În măsura în care variabila testată are o utilitate practică, limitele de încredere scot în
evidenţă dacă rezultatul are o semnificaţie în raport cu criterii de ordin practic. De exemplu, în
cazul nostru, antrenorul sportivilor respectivi poate aprecia în ce măsură un progres al
performanţei care poate fi între 2 şi 7 puncte ar aduce o clasare mai bună la concursurile de
profil sau, dimpotrivă, este „nerentabil”.
(d) Limitele de încredere nu prezintă o utilitate practică atunci când valorile variabilei nu
au o semnificaţie prin ele însele. Să ne imaginăm, spre exemplu, un experiment în care un grup
priveşte un film trist, iar un alt grup priveşte un film vesel, după care starea de spirit a celor două
grupuri este evaluată prin numărarea cuvintelor triste sau vesele pe care subiecţii şi le pot aminti
dintr-o listă citită imediat după vizionare. În această situaţie este greu de atribuit o utilitate practică
limitelor de încredere ale „numărului de cuvinte evocate”. Nu acelaşi lucru se întâmplă dacă, de
exemplu, în cazul unui experiment în care utilizarea unui anumit tip de exerciţii la locul de muncă
se traduce în creşterea productivităţii muncii, măsurată prin numărul de produse finite. Este evident
că numărul de produse finite este un indicator cu relevanţă practică, uşor de interpretat. Cu toate
acestea, chiar şi atunci când nu prezintă o relevanţă practică directă, calcularea limitelor de încredere
oferă o imagine a gradului de precizie a estimării testului statistic, fapt care face necesară
cunoaşterea lor şi raportarea lor.
Atunci când valoarea calculată a testului este egală sau mai mare decât t critic (ceea ce
este echivalent cu „p este mai mic sau egal cu alfa”), rezultatul justifică aprecierea ca
semnificativă a diferenţei dintre mediile celor două eşantioane (adică suficient de mare pentru a
respinge ipoteza că ar putea fi întâmplătoare). Modelul de cercetare nu permite formularea acestei
concluzii în termenii unei relaţii cauzale între practicarea trainingului autogen şi performanţa
sportivă, oricât de tentată ar fi această concluzie. Cel puţin nu în contextul acestui model de de
cercetare. Dacă acelaşi grup de subiecţi ar fi fost supus evaluării performanţei de extragere în zile cu
training autogen şi în zile fără training autogen, concluzia ar fi putut fi de ordin cauzal.
În plus, existenţa unei diferenţe semnificative nu este similară cu existenţa unei diferenţe cu
valoare practică. Este posibil ca diferenţa dintre cele două loturi de sportivi, deşi semnificativă
statistic, să nu justifice costurile angajate în desfăşurarea programului de relaxare psihică. Într-o
asemenea situaţie, studiul nu este lipsit de valoare dar concluziile sunt utile doar în plan teoretic.
Publicarea rezultatului
Generic, acest test statistic se utilizează în situaţiile în care vrem sa aflăm dacă o variabilă
dependentă, măsurată pe o scală de interval/raport, diferă semnificativ între două grupuri
(eşantioane) diferenţiate pe o variabilă independentă măsurată pe scala de tip nominal (dihotomic),
sau bi-categorială, indiferent de natura ei. Deoarece este unul dintre modelele frecvent întâlnite în
practica cercetării psihologice, utilizarea testului t pentru eşantioane independente este şi ea des
întâlnită în literatura de specialitate.
EXERCIŢII
Într-un studiu asupra efectelor unui nou tratament al fobiei, datele pentru grupul experimental
obţinute printr-o scală de evaluare a tendinţelor fobice sunt: m1=27.2, s1=4 şi N1=15 Datele
pentru grupul de control sunt: m2=34.4, s2=14 şi N2=15 Formulaţi:
•Problema (întrebarea) cercetării
•Ipoteza cercetării (H1)
•Ipoteza de nul (H0)
Aflaţi t critic pentru α=0.05; bilateral
Notă: Deşi datele din exemplu arată că m1 este mai mic decât m2, vom alege un test bilateral
pentru că, să nu uităm, în practică, criteriile deciziei statistice sunt fixate înaintea măsurării
experimentale, când, deci, nu aveam de unde şti care vor fi valorile pe care le vom obţine.
•Calculaţi testul t pentru diferenţa dintre cele două eşantioane
•Calculaţi intervalul de încredere (99%) pentru diferenţa dintre mediile populaţiilor.
•Calculaţi mărimea efectului
•Formulaţi şi motivaţi decizia statistică
•Formulaţi concluzia cercetării, cu respectarea recomandărilor de raportare pentru acest test.