Documente Academic
Documente Profesional
Documente Cultură
H0: nu exist diferene semnificative ntre mediile celor dou grupuri n populaia total
H1: exist diferene semnificative ntre mediile celor dou grupuri n populaia total
Ipoteza nul va fi respins dac nivelul de semnificaie calculat al testului t (Sig.) este
mai mic dect nivelul de semnificaie teoretic (5%).
Putem folosi testul t n analiza datelor noastre dac sunt ndeplinite urmtoarele condiii:
1. Variabila independent este nominal. Dac aceast variabil are trei sau mai multe
categorii trebuie s stabilim exact, nainte de a rula testul, ce categorii dorim s
comparm (dat fiind c testul t se folosete doar pentru compararea a dou grupuri).
2. Variabila dependent este continu (numeric).
3. Observaiile sunt independente; cu alte cuvinte, nu exist nici o legtur ntre datele
culese din cele dou grupuri analizate. Exist mai multe modaliti de a asigura
aceast independen. n primul rnd, este necesar ca fiecare subiect sau participant la
anchet (experiment) s fac parte dintr-un singur grup i numai unul. n cazul
cercetrilor experimentale, independena observaiilor poate fi obinut i prin
repartizarea aleatoare a participanilor n grupul experimental i cel de control. n
sfrit, ar fi ideal ca ntre subiecii celor dou grupuri s nu existe nici un fel de
legtur care ar putea influena valorile variabilei dependente (de exemplu, legturi de
tip so-soie, frai gemeni etc.).
4. Variabila dependent este distribuit aproximativ normal pe ambele grupuri.
5. Nu exist valori extreme semnificative ale variabilei dependente, pentru nici unul
dintre grupuri.
6. Varianele variabilei dependente pe cele dou grupuri sunt egale (ipoteza omogeniti
varianelor). Din fericire, nclcarea acestei ipoteze nu reprezint o problem major,
deoarece exist o variant robust a testului t, numit corecia Welch, care se
folosete n cazul n care varianele grupurilor sunt diferite i pe care programul SPSS
o calculeaz automat.
Respectarea ipotezelor 1, 2 i 3 trebuie verificat n procesul de concepere a design-ului
cercetrii. Celelalte trei ipoteze vor fi verificate cu ajutorul programului SPSS.
Nu este obligatoriu ca numrul cazurilor s fie egal n cele dou grupuri, dei ar fi ideal.
Cu ct dimensiunile celor dou grupuri sunt mai apropiate, cu att testul t este mai rezistent la
valorile extreme i la nclcrile ipotezei de normalitate ale variabilei dependente. Totui, aceast
condiie este adesea dificil de respectat n practic.
Dei testul t ne spune dac exist o diferen ntre mediile grupurilor, el nu ne ofer
informaii asupra dimensiunii sau magnitudinii acestei diferene. Pentru depirea acestui
inconvenient, statisticianul Jacob Cohen a introdus noiunea de mrimea efectului, propunnd
i o formul de calcul pentru aceasta. ntruct a devenit foarte uzual includerea mrimii
efectului n rapoartele de cercetare, alturi de valoarea i semnificaia testului, vom acorda i noi
atenia cuvenit acestui indicator.
S dm acum un exemplu de aplicare i interpretare a testului t pe eantioane
independente.
S presupunem c se urmrete evaluarea eficienei unui curs de limba englez pentru
angajaii din companiile multinaionale. n acest scop se constituie un eantion aleator de 268 de
angajai, dintre care 110 au urmat recent respectivul curs. Toi aceti angajai sunt supui unui
test de limba englez notat cu un calificativ de la 1 la 100. Dorim s determinm dac exist
diferene semnificative ntre calificativul mediu al angajailor care au participat la respectivul
curs i al acelora care nu au participat.
Rezultatele la testul de limba englez sunt introduse n baza de date dup cum urmeaz:
Fig. 28.1. Baza de date a rezultatelor la testul de limb englez (fragment)
Variabila calificativ stocheaz, evident, calificativul obinut de fiecare angajat la test, iar
variabila curs_engleza este o variabil nominal codificat astfel:
Cu ajutorul testului t vom stabili dac mediile variabilei dependente calificativ sunt
diferite pe cele dou grupuri.
nainte de aceasta ns, trebuie s stabilim dac sunt sau nu ndeplinite condiiile 4 i 5 de
mai sus.
Pentru a verifica ipoteza de normalitate a variabilei calificativ pe cele dou grupuri, vom
utiliza procedura Explore (vezi capitolul 14), utiliznd ca factor variabila curs_engleza:
Fig. 28.3. Caseta de dialog a procedurii Explore
Se observ c valoarea nivelului de semnificaie Sig. este mai mare dect 0.05 pentru
ambele grupuri (0.376, respectiv 0.591). Ipoteza de normalitate a variabilei este aadar
respectat.
Dac variabila dependent nu este distribuit normal (situaie destul de frecvent n
practic), avem la dispoziie mai multe alternative:
- s transformm aceast variabil n scopul obinerii unei variabile noi, distribuite
aproximativ normal (vezi capitolul 19)
- s utilizm testul neparametric Mann-Whitney, care nu pune condiia de normalitate a
variabilei dependente (vezi capitolul 38)
- s ignorm nclcarea ipotezei i s efectum testul t, avnd n vedere c acest test
este robust la abaterile uoare de la normalitate, mai ales atunci cnd dimensiunile
celor dou grupuri sunt apropiate (cum este n cazul de fa)
- s efectum o analiz de senzitivitate, rulnd att testul t ct i testul Mann-
Whitney (pentru aceleai variabile) i comparnd rezultatele. Dac aceste rezultate
conduc la aceleai concluzii, putem spune c abaterile de la normalitate nu afecteaz
validitatea testului t.
Dac hotrm s utilizm testul t chiar i n condiiile n care distribuia variabilei
dependente nu este normal, va trebui s precizm acest lucru n raportul de cercetare.
Pentru a identifica eventualii outlieri vom construi diagrama boxplot a variabilei
dependente calificativ, separat pe cele dou grupuri. Diagramele respective se gsesc n figura
28.5:
Putem rula acum testul t pentru eantioane independente, care se apeleaz cu comenzile
Analyze>Compare Means>Independent-Samples T Test:
n caseta de dialog vom introduce variabila calificativ n fereastra Test Variable(s), iar
variabila independent curs_engleza n cmpul Grouping Variable:
Dup ce apsm butonul Continue i revenim la caseta iniial, vom observa c aceste
dou coduri se gsesc acum n parantez n locul semnelor de ntrebare.
Dac trebuie s comparm cele dou grupuri pentru mai multe variabile continue, le vom
introduce pe toate n fereastra Test Variable(s), iar programul va rula testul t pentru fiecare
variabil pe rnd.
Acum programul are toate informaiile necesare pentru a rula testul t. Dac dorim s
schimbm o serie de opiuni implicite, trebuie s apsm butonul Options, care deschide
urmtoarea caset de dialog:
Fig. 28.10. Caseta de dialog Options
Observm c subiecii care nu au urmat cursul prezint un calificativ mediu de 46.19, iar
cei ce au participat la curs un calificativ mediu de 62.13. Diferena dintre acestea este de 15.94
puncte n favoarea grupului al doilea (coloana Mean Difference din tabelul de la figura 28.11).
Aceast diferen este semnificativ, dup cum arat testul t; aadar, putem extinde concluziile la
nivelul populaiei totale, afirmnd c angajaii care urmeaz respectivul curs au (n medie)
cunotine de englez mai bune dect cei care nu-l urmeaz.
Mai mult dect att, putem spune n ce interval se situeaz diferena dintre aceste grupuri,
pe populaia total. Dac vom examina ultimele coloane ale tabelului din figura 28.11 (prima
linie), vom constata c aceast diferen este cuprins ntre 14.04 i 17.83 puncte, cu un nivel de
ncredere de 95%.
|m1m2|
d= (28.1)
sc
unde m1 i m2 sunt mediile celor dou grupuri, iar sc este abaterea standard comun a grupurilor,
calculat la rndul su cu formula:
sc=
s 21 ( n 11 ) +s 22 (n2 1)
n1+ n22 (28.2)
unde s1 i s2 sunt abaterile standard ale grupurilor, iar n1 i n2 numrul de subieci din fiecare
grup.
Programul SPSS nu calculeaz automat valoarea lui d, dar ne ofer toate informaiile
necesare pentru a-l calcula manual. Aceste informaii se gsesc n tabelul din figura 28.12.
n cazul nostru, abaterea standard comun a grupurilor este:
sc=
8.0542 (1581 ) +7.2532 (1101)
158+1102
=7.736
|46.1962.13|
d= =2.06
7.736
Nu exist deocamdat o regul unanim acceptat pentru interpretarea indicatorui d
(acesta fiind de fapt unul din inconvenientele legate de folosirea mrimii efectului). Drept urmare
vom folosi valorile critice sugerate de Cohen nsui pentru a exprima importana practic:
n cazul nostru avem de-a face cu un efect foarte puternic, ntruct valoarea lui d este
mult mai mare de 0.8. Putem afirma o dat n plus c diferena de calificativ dintre cele dou
grupuri, datorat cursului de limba englez, este considerabil.