Sunteți pe pagina 1din 11

Capitolul 28

Testul t pentru eantioane independente

Testul t pentru eantioane independente se folosete atunci cnd dorim s determinm


dac exist diferene semnificative ntre mediile a dou grupuri pentru o variabil continu. Este
numit i testul t bivariat pentru eantioane independente sau, mai rar, testul t pentru msurtori
independente ori testul t intergrupuri.
Acest test i gsete aplicaia n foarte multe tipuri de cercetri, att experimentale ct i
non-experimentale. ntr-o cercetare experimental el este utilizat pentru a evalua diferenele
dintre grupul de control i cel experimental relativ la variabilele studiate de exemplu, pentru a
stabili dac exist o diferen sennificativ, n medie, ntre performanele sportivilor carora li s-a
administrat o vitamin i ale celor care nu au luat vitamina respectiv. n cercetrile non-
experimentale putem apela la testul t dac suntem interesai de diferenele dintre diverse
subgrupuri sau straturi ale populaiei studiate de exemplu, diferena dintre salariul mediu al
brbailor i cel al femeilor ntr-o ramur economic.
Ipotezele testului t pentru eantioane independente se scriu n felul urmtor:

H0: nu exist diferene semnificative ntre mediile celor dou grupuri n populaia total
H1: exist diferene semnificative ntre mediile celor dou grupuri n populaia total

Ipoteza nul va fi respins dac nivelul de semnificaie calculat al testului t (Sig.) este
mai mic dect nivelul de semnificaie teoretic (5%).
Putem folosi testul t n analiza datelor noastre dac sunt ndeplinite urmtoarele condiii:
1. Variabila independent este nominal. Dac aceast variabil are trei sau mai multe
categorii trebuie s stabilim exact, nainte de a rula testul, ce categorii dorim s
comparm (dat fiind c testul t se folosete doar pentru compararea a dou grupuri).
2. Variabila dependent este continu (numeric).
3. Observaiile sunt independente; cu alte cuvinte, nu exist nici o legtur ntre datele
culese din cele dou grupuri analizate. Exist mai multe modaliti de a asigura
aceast independen. n primul rnd, este necesar ca fiecare subiect sau participant la
anchet (experiment) s fac parte dintr-un singur grup i numai unul. n cazul
cercetrilor experimentale, independena observaiilor poate fi obinut i prin
repartizarea aleatoare a participanilor n grupul experimental i cel de control. n
sfrit, ar fi ideal ca ntre subiecii celor dou grupuri s nu existe nici un fel de
legtur care ar putea influena valorile variabilei dependente (de exemplu, legturi de
tip so-soie, frai gemeni etc.).
4. Variabila dependent este distribuit aproximativ normal pe ambele grupuri.
5. Nu exist valori extreme semnificative ale variabilei dependente, pentru nici unul
dintre grupuri.
6. Varianele variabilei dependente pe cele dou grupuri sunt egale (ipoteza omogeniti
varianelor). Din fericire, nclcarea acestei ipoteze nu reprezint o problem major,
deoarece exist o variant robust a testului t, numit corecia Welch, care se
folosete n cazul n care varianele grupurilor sunt diferite i pe care programul SPSS
o calculeaz automat.
Respectarea ipotezelor 1, 2 i 3 trebuie verificat n procesul de concepere a design-ului
cercetrii. Celelalte trei ipoteze vor fi verificate cu ajutorul programului SPSS.
Nu este obligatoriu ca numrul cazurilor s fie egal n cele dou grupuri, dei ar fi ideal.
Cu ct dimensiunile celor dou grupuri sunt mai apropiate, cu att testul t este mai rezistent la
valorile extreme i la nclcrile ipotezei de normalitate ale variabilei dependente. Totui, aceast
condiie este adesea dificil de respectat n practic.
Dei testul t ne spune dac exist o diferen ntre mediile grupurilor, el nu ne ofer
informaii asupra dimensiunii sau magnitudinii acestei diferene. Pentru depirea acestui
inconvenient, statisticianul Jacob Cohen a introdus noiunea de mrimea efectului, propunnd
i o formul de calcul pentru aceasta. ntruct a devenit foarte uzual includerea mrimii
efectului n rapoartele de cercetare, alturi de valoarea i semnificaia testului, vom acorda i noi
atenia cuvenit acestui indicator.
S dm acum un exemplu de aplicare i interpretare a testului t pe eantioane
independente.
S presupunem c se urmrete evaluarea eficienei unui curs de limba englez pentru
angajaii din companiile multinaionale. n acest scop se constituie un eantion aleator de 268 de
angajai, dintre care 110 au urmat recent respectivul curs. Toi aceti angajai sunt supui unui
test de limba englez notat cu un calificativ de la 1 la 100. Dorim s determinm dac exist
diferene semnificative ntre calificativul mediu al angajailor care au participat la respectivul
curs i al acelora care nu au participat.
Rezultatele la testul de limba englez sunt introduse n baza de date dup cum urmeaz:
Fig. 28.1. Baza de date a rezultatelor la testul de limb englez (fragment)

Variabila calificativ stocheaz, evident, calificativul obinut de fiecare angajat la test, iar
variabila curs_engleza este o variabil nominal codificat astfel:

Fig. 28.2. Codificarea variabilei curs_engleza

Cu ajutorul testului t vom stabili dac mediile variabilei dependente calificativ sunt
diferite pe cele dou grupuri.
nainte de aceasta ns, trebuie s stabilim dac sunt sau nu ndeplinite condiiile 4 i 5 de
mai sus.
Pentru a verifica ipoteza de normalitate a variabilei calificativ pe cele dou grupuri, vom
utiliza procedura Explore (vezi capitolul 14), utiliznd ca factor variabila curs_engleza:
Fig. 28.3. Caseta de dialog a procedurii Explore

n tabelul de mai jos se gsete rezultatul testului de normalitate Shapiro-Wilk:

Fig. 28.4. Rezultatele testului de normalitate pe cele dou grupuri

Se observ c valoarea nivelului de semnificaie Sig. este mai mare dect 0.05 pentru
ambele grupuri (0.376, respectiv 0.591). Ipoteza de normalitate a variabilei este aadar
respectat.
Dac variabila dependent nu este distribuit normal (situaie destul de frecvent n
practic), avem la dispoziie mai multe alternative:
- s transformm aceast variabil n scopul obinerii unei variabile noi, distribuite
aproximativ normal (vezi capitolul 19)
- s utilizm testul neparametric Mann-Whitney, care nu pune condiia de normalitate a
variabilei dependente (vezi capitolul 38)
- s ignorm nclcarea ipotezei i s efectum testul t, avnd n vedere c acest test
este robust la abaterile uoare de la normalitate, mai ales atunci cnd dimensiunile
celor dou grupuri sunt apropiate (cum este n cazul de fa)
- s efectum o analiz de senzitivitate, rulnd att testul t ct i testul Mann-
Whitney (pentru aceleai variabile) i comparnd rezultatele. Dac aceste rezultate
conduc la aceleai concluzii, putem spune c abaterile de la normalitate nu afecteaz
validitatea testului t.
Dac hotrm s utilizm testul t chiar i n condiiile n care distribuia variabilei
dependente nu este normal, va trebui s precizm acest lucru n raportul de cercetare.
Pentru a identifica eventualii outlieri vom construi diagrama boxplot a variabilei
dependente calificativ, separat pe cele dou grupuri. Diagramele respective se gsesc n figura
28.5:

Fig. 28.5. Diagramele boxplot ale variabilei calificativ

Se poate observa c exist o singur valoare extrem, corespunztoare cazului 121,


pentru grupul 1 (angajai care n-au participat la curs). Putem considera c acest outlier nu pune n
pericol analiza, deoarece testul t este suficient de rezistent la valori extreme atunci cnd acestea
sunt n numr mic i nu sunt foarte ndeprate de medie. Dac totui nu dorim s ne asumm nici
un risc, putem exclude aceast valoare din analiz cu ajutorul opiunii Select Cases. n orice caz,
prezena acestui outlier, precum i orice decizie pe care o lum n ceea ce-l privete, trebuie
menionate n raportul de cercetare.
Pentru exemplul nostru vom decide s lum n considerare i cazul 121 atunci cnd vom
efectua analiza.

Putem rula acum testul t pentru eantioane independente, care se apeleaz cu comenzile
Analyze>Compare Means>Independent-Samples T Test:

Fig. 28.6. Apelarea testului t pentru eantioane independente

n caseta de dialog vom introduce variabila calificativ n fereastra Test Variable(s), iar
variabila independent curs_engleza n cmpul Grouping Variable:

Fig. 28.7. Caseta de dialog a testului t pentru eantioane independente

Prezena celor dou semne de ntrebare n parantez, dup variabila curs_engleza,


nseamn c programul ne cere definirea celor dou grupuri care urmeaz a fi analizate. Vom
apsa n acest scop butonul Define Groups.
n noua caset de dialog, vom introduce codurile celor dou grupuri, 1 i 2, n cmpurile
corespunztoare, dup cum se arat n figura 28.8:
F28.8. Definirea celor dou grupuri

Dup ce apsm butonul Continue i revenim la caseta iniial, vom observa c aceste
dou coduri se gsesc acum n parantez n locul semnelor de ntrebare.

Fig. 28.9. Caseta de dialog a testului dup definirea grupurilor

Dac trebuie s comparm cele dou grupuri pentru mai multe variabile continue, le vom
introduce pe toate n fereastra Test Variable(s), iar programul va rula testul t pentru fiecare
variabil pe rnd.
Acum programul are toate informaiile necesare pentru a rula testul t. Dac dorim s
schimbm o serie de opiuni implicite, trebuie s apsm butonul Options, care deschide
urmtoarea caset de dialog:
Fig. 28.10. Caseta de dialog Options

Aici putem modifica nivelul de ncredere al estimrilor, setat implicit la 95%, i


modalitatea n care programul va gestiona valorile lips (important doar n cazul n care avem
dou sau mai multe variabile dependente). Cele dou opiuni din chenarul Missing Values sunt
explicate n capitolul 20.
S apsm acum butonul OK din caseta principal pentru a produce rezultatele testului.
Aceste rezultate se gsesc n figura de mai jos:

Fig. 28.11. Rezultatele testului t pe eantioane independente

S verificm acum ultima condiie a testului t pe eantioane independente, cea de


egalitate a varianelor grupurilor. Pentru aceasta vom inspecta rezultatul testului F al lui Levene
pentru egalitatea varianelor, afiate n primele coloane ale tabelului din figura 28.11.
Valoarea testului F este de 0.879, iar Sig.-ul de 0.349. ntruct avem Sig.>0.05, vom trage
concluzia c nu exist diferene semnificative ntre dispersiile celor dou grupuri. Aadar,
condiia 6 de mai sus este satisfcut.
n cele ce urmeaz, vom observa c tabelul din figura 28.11 prezint dou seciuni:
- seciunea Equal variances assumed, care prezint rezultatul testului t n condiiile n
care ipoteza de egalitate a varianelor este confirmat
- seciunea Equal variances not assumed, unde este prezentat rezultatul versiunii
robuste a testului t pe eantioane independente (corecia Welch), care trebuie luat n
considerare atunci cnd ipoteza omogenitii varianelor este nclcat.
n raportul de cercetare vom include informaiile dintr-una din aceste seciuni, n funcie
de rezultatul testului Levene (semnificativ sau nesemnificativ). n exemplul nostru testul lui
Levene este nesemnificativ; aadar, vom raporta i interpreta cifrele din seciunea Equal
Variances Assumed.
Valoarea testului t pentru cazul omogenitii varianelor este de -16.594, cu 266 grade de
libertate. Inspectnd coloana Sig. (2-tailed) observm c avem Sig.<0.0005 aadar testul t este
semnificativ statistic. Cu alte cuvinte, exist o diferen semnificativ ntre calificativele medii
pe cele dou grupuri. n concluzie vom respinge ipoteza nul i vom accepta ipoteza alternativ.
Pentru a obine informaii suplimentare vom studia i cel de-al doilea tabel al outputului
pentru aceast procedur:

Fig. 28.12. Tabelul Group Statistics

Observm c subiecii care nu au urmat cursul prezint un calificativ mediu de 46.19, iar
cei ce au participat la curs un calificativ mediu de 62.13. Diferena dintre acestea este de 15.94
puncte n favoarea grupului al doilea (coloana Mean Difference din tabelul de la figura 28.11).
Aceast diferen este semnificativ, dup cum arat testul t; aadar, putem extinde concluziile la
nivelul populaiei totale, afirmnd c angajaii care urmeaz respectivul curs au (n medie)
cunotine de englez mai bune dect cei care nu-l urmeaz.
Mai mult dect att, putem spune n ce interval se situeaz diferena dintre aceste grupuri,
pe populaia total. Dac vom examina ultimele coloane ale tabelului din figura 28.11 (prima
linie), vom constata c aceast diferen este cuprins ntre 14.04 i 17.83 puncte, cu un nivel de
ncredere de 95%.

n afar de rezultatele testului t, se raporteaz de obicei i mrimea efectului pentru acest


test, aa cum am artat la nceputul capitolului. Pentru a nelege noiunea de mrime a efectului
trebuie mai nti s clarificm diferena dintre semnificaia statistic i semnificaia practic a
unui indicator. Vom face aceasta cu ajutorul unui exemplu.
S presupunem c managerul unei firme care urmeaz s lanseze o nou reclam TV
dorete s afle dac exist diferene ntre reacia brbailor i cea a femeilor fa de respectiva
reclam. Aceast reacie este msurat pe o scal de la 1 la 10, unde 1 nseamn nu-mi place
deloc iar 10 mi place foarte mult. Se efectueaz un test t pe un eantion aleator format
deopotriv din consumatori brbai i femei, rezultatul fiind urmtorul: diferena dintre scorurile
medii este de 1.52 n favoarea brbailor, Sig.-ul fiind de 0.03. ntruct avem Sig.<0.05, deducem
c diferena este semnificativ cu un nivel de ncredere de 95%. Aadar, brbailor le place
reclama mai mult dect femeilor.
Este totui posibil ca n urma analizei acestor rezultate, managerul s decid c diferena
este prea mic pentru a merita s fie luat n considerare. Din punctul su de vedere, femeilor le
place reclama la fel de mult ca brbailor. n consecin, diferena de 1.52 puncte, dei
semnificativ statistic, nu prezint semnificaie practic (sau importan practic, cum i se mai
spune) pentru persoana de decizie.
Indicatorul mrimea efectului a fost definit tocmai cu scopul de a estima semnificaia
practic. Pentru testul t pe eantioane independente, mrimea efectului se msoar cu ajutorul
coeficientului d al lui Cohen. Precizm c acest coeficient se poate calcula numai dac este
ndeplinit condiia omogenitii varianelor. Formula sa este urmtoarea:

|m1m2|
d= (28.1)
sc

unde m1 i m2 sunt mediile celor dou grupuri, iar sc este abaterea standard comun a grupurilor,
calculat la rndul su cu formula:

sc=
s 21 ( n 11 ) +s 22 (n2 1)
n1+ n22 (28.2)

unde s1 i s2 sunt abaterile standard ale grupurilor, iar n1 i n2 numrul de subieci din fiecare
grup.
Programul SPSS nu calculeaz automat valoarea lui d, dar ne ofer toate informaiile
necesare pentru a-l calcula manual. Aceste informaii se gsesc n tabelul din figura 28.12.
n cazul nostru, abaterea standard comun a grupurilor este:

sc=
8.0542 (1581 ) +7.2532 (1101)
158+1102
=7.736

iar mrimea efectului este:

|46.1962.13|
d= =2.06
7.736
Nu exist deocamdat o regul unanim acceptat pentru interpretarea indicatorui d
(acesta fiind de fapt unul din inconvenientele legate de folosirea mrimii efectului). Drept urmare
vom folosi valorile critice sugerate de Cohen nsui pentru a exprima importana practic:

Valoare critic Importana


0.2 Mic
0.5 Medie
0.8 Mare

Tab. 28.1. Valorile critice orientative ale coeficientului d al lui Cohen

n cazul nostru avem de-a face cu un efect foarte puternic, ntruct valoarea lui d este
mult mai mare de 0.8. Putem afirma o dat n plus c diferena de calificativ dintre cele dou
grupuri, datorat cursului de limba englez, este considerabil.

S-ar putea să vă placă și