Sunteți pe pagina 1din 18

METODE DE COMPARATIE: Tehnici parametrice t si z

Tehnici parametrice ANOVA


Proceduri ANOVA de comparatii multiple
Tehnici non-parametrice

Tehnici de comparatie între grupuri.


Testele parametrice t si z

Pe lânga studiul asocierii dintre variabile, tehnicile statistice pot fi utilizate si pentru
determinarea diferentelor dintre grupuri. Aceste medode se utilizeaza frecvent în analiza
datelor în cercetarile experimentale.

În acest capitol vom prezenta acele tehnici parametrice care ne permit sa evaluam
efectele unei variabile independente (manipulate de cercetator) sau categoriale (vârsta,
sex, etc) asupra unei variabile dependente în situatia în care se va lucra cu una sau doua
grupe de subiecti.

Cu ajutorul acestor teste statistice se ridica problema daca diferentele constatate între
grupele de subiecti sunt datorate interventiei cercetatorului (variabilei independente),
caracteristicilor variabilei categoriale sau dimpotriva, întâmplarii.

Exista trei tipuri de tehnici principale care vor fi discutate în acest capitol:

1. Tehnici care privesc diferenta dintre un esantion si media populatiei din care
acesta face parte - "the one simple t Test";
2. Tehnici care privesc diferenta dintre doua grupe independente de subiecti – "the t
test for independent samples";
3. Tehnici care privesc diferenta dintre doua grupe dependente de subiecti – "the t
test for correlated samples".

• Tehnicile t si z pentru un esantion.

În acest caz dorim sa aflam daca un esntion de subiecti difera de o populatie mai mare. Sa
presupunem ca un test de empatie a fost administrat pe o populatie mare de subiecti elevi
abia intrati la liceu (N= 1000), iar media obtinuta pe întreaga populatie testata a fost de
76. Când s-a efectuat acelasi test pe o clasa de elevi de n=32 subiecti, s-a obtinut media
de 81 si o estimare a abaterii standard de 9(s). Se pune problema daca elevii din aceasta
clasa au un nivel de empatie diferit de media specifica pentru clasa a IX-a.

Pentru solutionarea acestei probleme exista doua teste statistice adecvate, si anume testele
z si t.
Vom utiliza testul z daca:
se cunoaste abaterea standard a variabilei dependente la nivelul populatiei;
daca numarul de subiecti cuprinsi în esantionul comparativ este suficient de mare
(de regula peste 30 de subiecti).

În situatia în care una din cele doua conditii nu sunt îndeplinite, utilizam testul t pentru un
esantion.

În problema de fata se observa ca nu putem aplica testul z desi avem un esantion


comparativ destul de mare n=32 (mai mare decat 30) deoarece nu se cunoaste
abaterea standard a populatiei din care face parte esantionul.

Ca urmare, calculam testul t care valideaza sau infirma ipoteza nula potrivit careia, nu
exista nici o diferenta între media (m) obtinuta pe esantion de subiecti (n= 32) si media
(m ) obtinuta pe populatia din care a fost extras esantionul.

Matematic, ipoteza nula si cea de lucru (alternativa) se formuleaza astfel:

Ho: M = m

H1a: M > m < M

H1b: M > m ori M < m

În cazul H1a ipoteza alternativa specifica ca exista o diferenta între cele doua medii fara a
arata directia acestei diferente. În acest caz avem de a face cu un test t bilateral (two-
tailed test).

În cazul H1b ipoteza alternativa specifica directia diferentei între cele doua medii - o
medie este mai mica (mare) decât cealalta datorita unor considerente teoretice. Aceasta
situatie necesita un test t unilateral (one-tailed).

Cele doua tipuri de test t utilizeaza aceeasi formula, specificul unilateral vs. bilateral
influentând doar valorile comparative prezente în tabelul lui t.

Formula lui t este:

Unde: M este media esantionului

miu este media populatiei din care face parte esantionul;

EEM este eroarea standard a mediei esantionului;


Unde: s este estimarea abaterii standard a esantionului (s=9); n este volumul (marimea)
esantionului (n=32)

Înlocuind datele problemei prezentate în formula lui t data mai sus obtinem:

Urmatorul pas care trebuie facut dupa calcularea lui t este de a compara valoarea obtinuta
cu cea corespunzatoare în tabelul lui t. Daca valoarea calculata este mai mare decât cea
din tabel ipoteza nula este respinsa. Pentru aceasta sunt necesari trei pasi:

a. Stabilirea gradelor de libertate. Numarul de grade de libertate notate cu df se


obtine din numarul de subiecti cuprinsi în esantionul de comparatie, asupra caruia
se opereaza cu o corectie de deviere. Calcularea gradelor de libertate pentru acesta
situatie se face astfel: df = n-1. Pentru exemplul dat avem 31 df (32-1) grade de
libertate.
b. Al doilea pas intermediar este alegerea tipului de situatie a lui t, între t unilateral
sau t bilateral. Aceasta alegere se face dependent de cunostintele teoretice
implicate în problema. Daca avem motive sa credem datorita unor caracteristici
speciale ca media esantionului comparativ este mai mare (sau mai mica) decât
media populatiei din care face parte esantionul vom utiliza valorile testului t
unilateral din tabel. Daca consideram ca cele doua medii difera semnificativ, fara
a putea anticipa ca una ar fi mai mare decât cealalta dintr-o perspectiva teoretica
exprimata în ipoteza de lucru vom utiliza valorile lui t bilateral din tabelul lui t. În
exemplul dat nu exista nici o premisa care sa ne îndreptateasca sa consideram ca
una din medii este mai mare decât cealalta, de aceea vom consulta valorile lui t
bilateral.
c. Stabilirea pragului de semnificatie p. Practica statistica considera necesara
stabilirea unui nivel de încredere de maxim 0,05(.05).

Revenind la problema data, urmeaza sa consultam tabelul lui t pentru a compara valoarea
obtinuta de noi t=3,14 cu valoarea prezentata în tabel pentru 31 df (grade de libertate)
pentru t bilateral la un prag de semnificatie de p£ .05.

Deoarece în tabel nu sunt prezentate valorile lui t pentru 31 df, ne uitam la valoarea cea
mai apropiata, dar anterioara acestor grade de libertate. Astfel, la 30 df, valoarea lui t
bilateral pentru un p < .05 este 2,042.

Se poate observa ca valoarea obtinuta de noi t=3,14 este mai mare decât valoarea din
tabel t=2,042, situatie care se interpreteaza astfel: ipoteza nula este respinsa, ca urmare
rezultatele obtinute nu pot fi puse în totalitate pe seama întâmplarii, deci exista o
diferenta semnificativa din punct de vedere statistic în ce priveste diferenta dintre cele
doua medii. Rezultatul obtinut se noteaza matematic astfel:

t(31)=3,14, p < .05.

Marimea efectului

Verificarea ipotezelor raspunde la întrebarea daca esantionul extras are caracteristici


diferite fata de populatia specificata în ipoteza nula. Daca obtinem o diferenta
semnificativa statistic ne putem pune o întrebare suplimentara: Cât de mare este aceasta
diferenta? Pentru aceasta se calculeaza marimea efectului propus de Cohen si notat cu d.

Indexul marimii efectului pentru testul t în cazul de fata este dependent de datele oferite
în problema:

a) Daca se cunoaste abaterea standard a populatiei, iar esantionul comparativ este sub 30
de subiecti (testul t), vom utiliza urmatoarea formula:

Unde: M este media esantionului supus comparatiei;

µ este media populatiei în ce priveste variabila urmarita;

σ este abaterea standard a variabilei de interes la nivelul populatiei.

Daca nu se cunoaste abaterea standard a populatiei, iar esantionul de comparatie are sub
30 de subiecti (testul t) -cazul problemei data exemplu- avem o formula apropiata de
calcul a marimii efectului:

Unde: M si µ au aceeasi semnificatie;

s reprezinta estimarea abaterii standard a variabilei de interes la nivelul populatiei


pornind d la grupul comparativ (în problema data s=9 ).

Putem calcula marimea efectului înlocuind datele problemei prezentate.


Interpretarea acestei valori obtinute se face prin raportarea ei la conventia propusa de
Cohen si adoptata de cercetatori:

Efect mic d=.20;

Efect mediu d=.50;

Efect mare d=.80

Marimea efectului obtinuta de noi a fost de .55 ceea ce înseamna ca am obtinut o valoare
medie. Revenind la întrebare: Cât de mare este aceasta diferenta? Putem afirma ca
diferenta statistica are o valoare medie.

Valoarea lui d are o importanta deosebita în determinarea puterii experimentului si în


calcularea marimii esantionului necesar pentru a da credibilitate cercetarii efectuate.

Calcularea testului z necesita utilizarea formulei:

Unde: M este media esantionului comparat;

µ este media populatiei;

EEµ este eroarea standard a mediei populatiei.

Unde: σ (sigma) este abaterea standard a populatiei; N este volumul esantionului


comparat.

Sa presupunem ca în problema anterioara pe lânga media (µ = 76) obtinuta la proba de


empatie la nivelul populatiei era specificata si abaterea standard (σ = 8).

În acest caz, se aplica testul z pentru ca stim valoarea abaterii standard a populatiei , iar
volumul esantionului de comparatie n era peste 30 subiecti (n=32).
Interpretarea valorii lui z obtinute se face raportând aceasta valoare la valorile
standardizate ale lui z. Spre deosebire de testul t, care necesita consultarea tabelului t în
vederea admiterii sau respingerii ipotezei nule, în cazul testului z, valoarea obtinuta se
confrunta cu patru valori standardizate:

Testul bilateral: z = 1,96 pentru un p < .05

z = 2,58 pentru un p < .01

Testul unilateral: z = 1,65 pentru un p < .05

z = 2,33 pentru un p < .01

În cazul de fata am obtinut un z = 3,53, valoare superioara celor prezentate mai sus. Acest
fapt înseamna ca ipoteza nula este respinsa, existând o diferenta semnificativa între
mediile celor doua grupe de subiecti care nu poate fi datorata în întregime întâmplarii.

Si în acest caz poate fi calculata marimea efectului, formula fiind asemanatoare cu prima
cu exceptia înlocuirii abaterii standard a esantionului comparat (s) cu abaterea standard a
populatiei (σ ).

Interpretarea lui d se face asemanator cu modelul explicat anterior. Putem trage concluzia
ca rezultatul obtinut, d=0,62, înseamna un efect de valoare medie.

Testele t si z pentru doua esantioane independente

Testele t si z aplicate anterior pentru a determina daca un esantion difera de o populatie


nu se aplica prea frecvent. Mai des sunt utilizate testele z si t pentru esantioane
independente pentru a determina daca mediile a doua esantioane difera semnificativ.

Doua probleme trebuie clarificate de la început. Când aplicam testul t si când aplicam
testul z? Cum diferentiem esantioanele independente de cele dependente?

La prima întrebare, utilizam aceleasi criterii prezentate în cazul unui singur esantion
comparat cu o populatie anume. Se iau în considerare cunoasterea abaterii standard a
celor doua esantioane si a volumului acestora. În cazul esantioanelor dependente sau
independente, prima conditie este atinsa mult mai usor, de aceea criteriul hotarâtor în
alegerea tipului de test (t sau z) este volumul esantionului. Exista conform teoremei limita
centrala o evolutie a distributiei datelor în functie de numarul de subiecti. Se considera si
se accepta de majoritatea cercetatorilor, ca un esantion de 30 de subiecti sau mai mult are
o distributie normala a datelor z. Un numar mai mic de 30 de subiecti determina o
distributie asimetrica a datelor de tip t. Chiar daca se utilizeaza o împartire grosiera, s-a
stabilit de catre cercetatori urmatoarea clauza pentru cazul a doua esantioane:

a. Daca n1 < 30 (numarul de subiecti din prima grupa) si n2 < 30 (numarul de


subiecti din a doua grupa) se aplica testul t.
b. Daca n1 ≥ 30 si n2 ≥ 30 se aplica testul z.

În ce priveste diferentierea între testele independente si dependente, aceasta se face în


functie de natura esantionului cuprins în experiment. Apar doua situatii:

a. Daca cele doua esantioane sunt alese la întâmplare pe baza situatiei lor naturale
(ex. Doua clase paralele, doua grupe de vârsta etc) se utilizeaza testele
independente.
b. Daca cele doua esantioane sunt în relatie unul cu celalalt prin interventia
experimentatorului se utilizeaza testele dependente. Uzual, exista doua situatii în
care avem de a face cu esantioane dependente:

• doua grupe de subiecti sunt formate dupa una sau mai multe caracteristic
prealabile. Spre exemplu, aplicam un test preliminar în functie de care împartim
subiectii pe grupe astfel încât grupele sunt echilibrate, fiecarui subiect din grupa A
corespunzându-i un participant din grupa B;
• o grupa de subiecti este testata de doua ori asupra aceleiasi variabile (pre-test si
post-test), experimentatorul fiind interesat de modificarile aparute între cele doua
testari.

Testul t independent

Exemplu: Un cercetator doreste sa studieze daca strategiile sintetice conduc la rezultate


diferite fata de strategiile analitice în ce priveste deprinderea citirii la elevii de clasa I. El
utilizeaza în acest sens 2 clase (esantioane) de câte 15 elevi fiecare, în care deprinderea
citirii s-a facut diferit (într-o clasa analitic, în cealalta sintetic). Variabila dependenta din
acest studiu a constat într-o proba de performanta de citire (numar de cuvinte pe minut /
numarul de erori).

Primul grup de elevi a fost învatat sa citeasca analitic (începând cu litera si terminând cu
cuvântul) a obtinut o medie de 12,4 cuvinte/minut si o abatere standard de 1,5. Cel de-al
doilea grup a fost învatat sa citeasca într-o maniera sintetica (pornind de la asocierea
cuvântului cu o imagine pentru fiecare litera). S-a obtinut o medie de 10 cuvinte pe minut
si o abatere standard de 0,9. Se pune problema daca exista o diferenta semnificativa între
cele doua medii, implicit între cele doua strategii de învatare a citirii.

Pentru a rezolva aceasta problema trebuie sa identificam mai întâi metoda statistica care
trebuie utilizata. Observam ca grupele sunt independente, ca numarul subiectilor din
fiecare grupa este mai mic decât 30, ca urmare putem utiliza testul t independent.
Unde: M1 si M2 reprezinta mediile celor doua esantioane; EEM1-M2 reprezinta eroarea
standard a diferentei dintre cele doua medii.

Unde: s1² reprezinta dispersia primului grup (abaterea standard la patrat); s2² reprezinta
dispersia celui de-al doilea grup; n1 - numarul de subiecti din primul grup; n2 - numarul
de subiecti din al doilea grup.

Daca n1 este egal n2 avem o formula (a), aplicabila si în exemplul oferit, daca n1 este
diferit de n2 vom utiliza o alta formula (b).

a)

(b) Pentru n1 diferit de n2 avem:

În cazul problemei date referitoare la deprinderea de a citi în clasa I dupa cele doua
metode, numarul de elevi din cele doua esantioane este egal (n1=n2=15), de aceea vom
aplica una din cele doua formule de calcul a erorii standard a diferentelor dintre medii (nu
si formula prezentata la punctul b). Deoarece se cunosc dispersiile (patratul abeterii
standard) si mediile esntioanelor la proba de performanta vom aplica prima formula, pe
care o vom integra în formula de calcul al testului t independent.
Dupa calcularea lui t independent va trebui sa comparam valoarea obtinuta cu valoarea
data în tabelul lui t. Pentru aceasta sunt necesari pasii intermediari descrisi în cazul lui t
pentru un esantion:

a. Stabilirea gradelor de libertate (pentru a cunoaste valoarea din tabel a lui t care va
fi comparata cu valoarea obtinuta de noi). Calcularea gradelor de libertate pentru
testul t independent se face astfel: df = (n1 + n2) - 2. În cazul de fata avem 28 df
(15 + 15 - 2) grade de libertate.
b. Al doilea pas intermediar este alegerea tipului de situatie a lui t, adica avem un
test t unilateral sau bilateral. În acest caz se utilizeaza testul t independent
bilateral. Daca cercetatorul dorea sa demonstreze ca strategia analitica este mai
eficienta decât cea sintetica (sau invers), adica M1 > M2 sau M1 < M2 s-ar fi
aplicat testul t independent unilateral.
c. Stabilirea valorii lui t conform pragului de semnificatie ales. Practica statistica
considera necesara stabilirea unui nivel de încredere de maximum 0,05(.05).

Urmarind în tabel valoarea lui t bilateral pentru 28 df si p de .05, gasim valoarea 2,048.
Deoarece valoarea gasita de noi t= 5,314 este mult mai mare decât cea din tabel
respingem ipoteza nula Ho: M1 = M2 si concluzionam ca exista o diferenta semnificativa
statistic în ce priveste performantele elevilor în citire în functie de strategia adoptata în
învatarea citirii de catre copii. Matematic vom scrie:

t(28) = 5,314, p< .05 test bilateral.

Inspectând datele problemei se constata ca elevii care au utilizat strategia analitica în


deprinderea citirii, au obtinut rezultate mai bune la citire decât grupul de elevi care au
utilizat o strategie globala (sintetica) în deprinderea citirii.

Deoarece rezultatul obtinut (5,314) este mai mare decât valorile tabelare a lui t pentru p
=.02 (2,467); p=.01 (2,763); sau p=.001 (3,674) putem prezenta rezultatul obtinut ca fiind
semnificativ si la acesta din urma valoare (exista 1 la 1000 sanse ca rezultatul obtinut sa
se datoreze întâmplarii). În acest caz notam: t(28) = 5,314, p< .001 test bilateral.

În cazul în care numarul de subiecti din cele doua grupe nu era egal (n1 ≠ n2) am fi
aplicat o alta formula pentru calculul lui t (formula ce includea dispersiile celor doua
grupe sau formula prezentata la punctul b). Dupa aflarea valorii lui t, se urmareste acelasi
algoritm prezentat mai sus.

Marimea efectului

Ea ofera informatii importante pe care testul t nu le ofera. Acesta din urma arata doar
daca ipoteza nula este respinsa si daca exista sau nu o diferenta semnificativa între
mediile celor doua grupe de subiecti. Marimea efectului arata care este efectul variabilei
independente în determinarea diferentei dintre medii. În cazul testului t independent avem
mai multe formule de calcul ale marimii efectului (d):
Unde : M1 si M2 sunt mediile celor doua grupe de subiecti; s înseamna estimarea abaterii
standard (la numnaratorul lui s vom avea N-1).

Întrebarea care se pune este care abatere standard trebuie aplicata. Exista o mare
controversa între statisticieni. Unii cred ca trebuie utilizata abaterea standard a grupului
de control daca acesta exista.

Atunci când nu exista un grup de control (cazul exemplului nostru), se recomanda


utilizarea unor formule mediate de abatere standard.

a) daca n1 = n2, atunci:

Unde: M1 si M2 sunt mediile celor doua grupe; n1 este numarul de subiecti dintr-o grupa
(n1 egal cu n2); s1² si s2² sunt dispersiile celor doua grupe (abaterile standard la patrat).

În cazul problemei oferite drept model se observa ca cele doua esantioane sunt egale (n1
= n2) si nu exista un grup de control (strategii analitice vs. strategii sintetice). Astfel vom
obtine:

Interpretarea lui d se face identic cu cea prezentata în cazul lui t pentru un esantion. Se
observa în acest sens ca valoarea obtinuta înseamna un efect mare al variabilei
independente (strategii analitice vs. sintetice) în determinarea rezultatelor la proba
performantiala de citire.

b) daca n1 ≠ n2 se utilizeaza o alta formula de calcul a abaterii standard mediate:

Unde: s1 si s2 sunt dispersiile grupelor 1 respectiv 2; N1 si n2 sunt numarul de subiecti


din grupele 1, respectiv 2.
Pentru a calcula d (marimea efectului) în acest caz se înlocuieste simbolul s de la numitor
cu formula prezentata mai sus.

Testul z pentru esantioane independente

În situatia în care n1 > 30 si n2 > 30 si a doua esantioane independente aplicam testul z.


Formula de calcul este:

Dupa cum se observa formula de calcul a lui z în aceasta situatie este identica cu cea a lui
t independent pentru n1 = n2. Spre deosebire de testul t independent, testul z are aceeasi
formula si în cazul în care n1 ≠ n2.

Rezultatul obtinut este comparat cu cele doua valori standardizate z (1,96 pentru p < .05,
respectiv 2,58 pentru p < .01 pentru testul bilateral, respectiv cu 1,65 pentru p < .05,
respectiv 2,33 pentru p < .01 pentru testul unilateral). Algoritmul rezolvarii problemelor
care necesita testul z este asemanator cu cel prezentat în cazul lui z pentru un esantion.

OBSERVATII: Se observa ca formula pentru testul z este identica cu cea a testului t


independent pentru esantioane egale. De altfel, tendinta ultimilor ani este de a înlocui
testul z cu testul t. Acestea sunt si recomandarile revistelor de cercetare stiintifica
patronate de Asociatia Psihologilor Americani. Tot în acest sens programe de statistica
computerizate precum SPSS au renuntat la testul z în favoarea testului t.

Testul t poate fi utilizat prin formulele prezentate mai sus si în cazul esantioanelor mai
mari decât 30 de subiecti fiecare.

Testele t si z pentru esantioane dependente


Pâna acum am luat în considerare utilizarea testelor t si z pentru a evalua daca un
esantion difera de populatia din care se presupune ca face parte (testele t si z pentru un
esantion) si situatia compararii a doua esantioane independente (testele t si z
independent).

O a treia aplicatie este cazul a doua esantioane dependente. Aceasta înseamna ca


elementele componente ale celor doua grupe sunt în relatie de corespondenta.

Exista trei situatii în care se aplica testele de comparatie dependente (corelate):

a. Perechile naturale: acestea nu sunt realizate de experimentator ci exista în mod


natural. Spre exemplu, o cercetare care ar privi nivelul de rasism pe doua grupe de
subiecti de sex masculin: o grupa formata din tati, iar o alta din fiii lor. Acestia
trebuie grupati în concordanta astfel încât fiecarui tata sa-i corespunda fiul sau.
Apropiat de aceasta situatie este si studiul gemenilor care trebuie împartiti în mod
randomizat în doua grupe. Diferenta care apare între cele doua exemple este data
de simetria relatiei gemenilor (care pot fi împartiti aleator în grupe, pastrând însa
criteriul familial) si asimetria relatiei tata-fiu (care trebuie sa fie separati în doua
grupe tati, respectiv fii, pastrând însa acelasi criteriu familal).
b. Perechile artificiale: acestea sunt realizate de catre experimentator pentru a
egaliza cât mai mult grupele de subiecti. Daca un cercetator doreste sa studieze
efectul atmosferei de lucru asupra rezolvarii de probleme, el poate decide sa
împarta subiectii pe grupe în perechi. Criteriul de divizare are la baza rezultatul
obtinut la testul de inteligenta deoarece acest factor influenteaza capacitatea de
rezolvare a problemelor. Pentru aceasta cercetatorul ia primii doi subiecti în ce
priveste nivelul de inteligenta si îi împarte randomizat în cele doua grupe (o grupa
care lucreaza într-o atmosfera amiabila; cealalta grupa care va lucra într-o
atmosfera tensionanta); apoi trece la urmatorii doi subiecti din perspectiva
rezultatelor la testul de inteligenta pe care-i împarte în cele doua grupe. Se
continua algoritmul pâna sunt divizati toti subiectii. Este necesar un numar par de
subiecti, astfel încât grupele obtinute sa fie egale ca volum.
c. Masuratori repetate: reprezinta cazurile mai des întâlnite în special în terapie si
recuperare. Este vorba în aceasta situatie de un singur grup de subiecti care vor fi
testati de doua ori (înainte si dupa introducerea variabilei independente). Pentru
clarificare vom prezenta o problema care necesita utilizarea testului t dependent si
care se încadreaza în aceasta ultima categorie amintita.

Testul t dependent

(n1 < 30 si n2 < 30)

Un cercetator doreste sa studieze influenta metodelor de relaxare asupra reducerii


conduitelor agresive la adolescenti. O grupa de 12 subiecti cu tulburari comportamentale
este testata initial (pre-test) în ce priveste nivelul agresivitatii. Dupa acest moment, cei 12
adolescenti sunt învatati sa practice relaxarea si urmeaza sedinte de relaxare de câte 1 ora
de 5 ori pa saptamâna.

Dupa o perioada de 2 luni subiectii sunt retestati (post-test) utilizând aceeasi proba pentru
a observa daca nivelul lor de agresivitate a scazut în urma practicarii metodelor de
relaxare.

Prezentam mai jos datele obtinute de cei 12 adolescenti la chestionarul de agresivitate pe


parcursul celor doua testari.

Subiectul Pre Post Pre-Post Diferenta²


1 21 15 6 36
2 18 13 5 25
3 15 16 -1 1
4 11 13 -2 4
5 24 13 11 121
6 23 12 11 121
7 17 11 6 36
8 19 10 9 81
9 19 15 4 16
10 17 17 0 0
11 20 14 6 36
12 15 16 -1 1

M1=18,25 M2=13,75 Σ d= 54 Σ d patrat=478

Formula lui t dependent este:

Unde: M1 si M2 sunt mediile celor doua grupe;

EEd este eroarea standard a diferentei (d)

Pentru a calcula EEd utilizam una din formulele:

Unde: d este diferenta dintre pre-test si post-test, între pozitia unu în prima grupa si
pozitia unu din a doua grua s.a.m.d.;

N este numarul de perechi de subiecti (în cazul problemei date 12).

sau

Unde: s1 patrat si s2 patrat sunt dispersiile celor doua grupe;

n1 si n2 sune egale si reprezinta numarul de perechi de subiecti;


r12 este coeficientul de corelatie între datele celor doua grupe; s1 si s2 sunt
abaterile standard a celor doua grupe.

Observând datele care ne sunt cunoscute în problema trebuie sa calculam t dependent


utilizând prima formula a lui EEd.

Dupa calcularea lui t dependent va trebui sa comparam valoarea obtinuta cu valoarea data
în tabelul lui t. Pentru aceasta vom utiliza acelasi algoritm descris în cazul lui t pentru un
esantion si t independent:

a. Stabilirea gradelor de libertate (pentru a cunoaste valoarea din tabel a lui t care va
fi comparata cu valoarea obtinuta de noi). Calcularea gradelor de libertate pentru
testul t dependent se face astfel: df = n-1. În cazul de fata avem 11 df (12 perechi
de date - 1) grade de libertate.
b. Al doilea pas intermediar este alegerea tipului de situatie a lui t, adica avem un
test t unilateral sau bilateral. Observam ca cercetatorul a presupus ca metodele de
relaxare vor conduce la scaderea nivelului agresivitatii. Ipoteza de lucru
(alternativa) este: H1: M1 > M2, în timp ce ipoteza nula este M1 = M2. În acest
caz se utilizeaza testul t independent unilateral. Daca cercetatorul dorea sa
demonstreze ca nivelul agresivitatii înainte de utilizarea relaxarii este diferit de
nivelul agresivitatii post-test adica M1 ≠ M2 ca ipoteza de lucru, atunci s-ar fi
aplicat testul t independent bilateral.
c. Urmarirea valorii lui t conform pragului de semnificatie ales. Practica statistica
considera necesara stabilirea unui nivel de încredere de maxim 0,05(.05).

Se compara valoarea obtinuta de noi t=0,973 cu cea exprimata în tabelul de distributie a


lui t unilateral pentru 11 df (grade de libertate) si un prag de semnificatie stabilit de p<
.05. Valoarea din tabel este de 1,796 (mai mare decât valoarea gasita de noi) ceea ce
înseamna ca ipoteza nula nu poate fi respinsa, deci nu s-a gasit o diferenta semnificativa
statistic între cele doua grupe. Transpusa la problema de fata înseamna ca relaxarea nu a
avut un efect semnificativ în reducerea nivelului agresivitatii.

Marimea efectului.

Se calculeaza si în cazul testului t dependent dupa urmatoarea formula:


Algoritmul de interpretare a marimii efectului (d) este asemanator cu cel prezentat la
celelalte categorii de test t descrise anterior. Trebuie însa reamintit ca acest index al
efectului variabilei independente asupra celei dependente se calculeaza numai în situatiile
în care testul t a fost semnificativ, iar ipoteza nula a fost respinsa.

În cazul problemei date anterior nu putem calcula marimea efectului deoarece rezultatul
obtinut de noi nu a fost semnificativ statistic.

Testul z dependent

(n1 > 30; n2 > 30)

Acesta poate fi utilizat în cazul esantioanelor mai mari de 30 de subiecti fiecare. În


aceasta situatie EEd (eroarea standard a diferentei se calculeaza utilizând formula
prezentata pentru t dependent care contine coeficientul de corelatie r12.

Interpretarea rezultatului obtinut se face dupa acelasi algoritm prezentat si la celelalte


teste z pentru un esantion si doua esantioane independente.

Consideratiile facute în cazul testului z independent cu privire la tendinta actuala de a


înlocui testul z cu testul t chiar în cazul esantioanelor mai mari de 30 de subiecti ramâne
valida si pentru testelor dependente.

Asumptiile distributiei t

Pentru ca testele t studiate în acest capitol sa fie aplicate trebuie îndeplinite mai multe
conditii:

Testul t pentru un esantion

1. Esantionarea sa fie simpla aleatoare;


2. Datele masurate sa fie pe scala de interval sau raport;
3. Rezultatele variabilei dependente sa fie normal distribuite (în cazul în care n este
mai mic de 30, se urmareste forma distributiei datelor, astfel încât indicatorii de
oblicitate (skewness) si de boltire (kurtosis) sa fie cât mai apropiate de zero
(maxim doi).

Testul t pentru doua esantioane independente

Ramân valabile primele trei asumptii la care se adauga înca doua:


4. Independenta grupurilor;
5. Omogenitatea variantei, adica grupurile trebuie sa provina din esantioane cu
dispersii egale (raportul lor sa fie cât mai apropape de unu).

Testul t pentru doua esantioane dependente

Ramân valabile primele trei asumptii la care se adauga o conditie suplimentara.

4. Normalitatea diferentelor dintre scorurile obtinute la pre-test si post-test. Aceasta se


constata pe baza consultarii indicatorilor de oblicitate (skewness) si de boltire (kurtosis).

PROBLEME

1. Cititi valorile tabelare ale lui t pentru:


a) alfa = .01 df = 17 (t bilateral);

b) alfa = .05 df = 26 (t bilateral);

c) alfa = .05 df = 7 (t unilateral).

2. Daca un cercetator alege sa utilizeze un nivel alfa de .01 ¾n locul unui alfa de .05
¾nseamna ca el stabileste un criteriu:

a) mai conservator; b) la fel de strict; c) mai permisiv.

3. Valoarea medie pentru populatia pe care s-a etalonat o proba de extraversie este de 50,
iar abaterea standard este 10,2. Sa presupunem ca 16 persoane care lucreaza în comert cu
succes au obtinut o medie de 56,10 si o abatere standard de 10 la acelasi test. Calculati
testul t si scrieti concluziile.

4. Un grup de 49 de subiecti au participat timp de un an de zile la un program de


promovare a drepturilor minoritatilor. La final au fost rugati sa completeze o scala de
evaluare a atitudinilor fata de minoritati. Au obtinut o medie de 12,50 si o abatere de 3.
La nivelul populatiei generale media a fost de 12 si abaterea de 2. Utilizati metoda
adecvata pentru a verifica ipoteza urmatoare: programul a fost eficient (a crescut toleranta
fata de minoritati), existând diferente în plan atitudinal între cele doua rezultate la un prag
p de .05.

5. Pentru situatia prezentata la punctul 4, calculati marimea efectului.

6. Identificati variabilele independente si cele dependente în urmatoarele situatii:

a. comparati persoanele cu o personalitate de tip A fata de cea de tip B, în ce priveste


gradul de satisfactie în viata;
b. comparati o metoda didactica noua cu una veche din perspectiva randamentului
scolar.
7. Stabiliti numarul de grade de libertate adecvate pentru testul t în cazul a doua
esantioane independente:

a) N b) N-1 c) N1+N2-2 d) N-2

8. Stabiliti numarul de grade de libertate adecvate pentru testul t în cazul a doua


esantioane dependente:

a) N b) N-1 c) N1+N2-2 d) N-2

9. Decideti daca în urmatoarele cazuri avem nevoie de un test t independent sau de un test
t dependent:

a. compararea rezultatelor la proba de audiometrie pentru fiecare ureche utilizând


aceeasi subiecti;
b. compararea rezultatelor la audiometrie în conditiile în care o parte a subiectilor au
fost testati aleator la urechea stânga, cealalta parte fiind evaluata la urechea
dreapta;
c. comparati stilul de comunicare la gemeni, în conditiile în care acestia au fost
despartiti în doua grupe diferite echivalente;
d. comparati capacitatea de rezolvare a problemelor, în conditiile în care cele doua
grupe au fost formate pe baza unui test de inteligenta dat anterior pentru a egaliza
grupele din perspectiva acestui criteriu.

10. Stabiliti daca valoarea t sau z este semnificativa statistic în conditiile a doua
esantioane independente si în cazul testului bilateral:

a. n1 = 23; n2 = 23; s1 = 4; s2 = 5; m1 = 14,5; m2 = 12,8;


b. n1 = 32; n2 = 31; s1 = 6; s2 = 5; m1 = 20,1; m2 = 23,4;
c. n1 = 31; n2 = 29; s1 = 2; s2 = 2; m1 = 11; m2 = 11,9;

d)

A 7 8 6 8 9 7 8 6 8 6
B 6 7 5 6 7 6 7 6 6 5

e)

A 7 8 6 8 9 7 8 6 8 6
B 6 7 5 6 7 6 7 6

11. Stabiliti daca valoarea t sau z este semnificativa statistic în conditiile a doua
esantioane corelate (dependente) în care:
a) n1 = 28; n2 = 28; s1 = 6; s2 = 5; m1 = 20,1; m2 = 23,5; r = -.61;

b)

A 34 22 25 31 27 32 29 26
B 38 19 36 40 36 31 36 37

c). n1 = 36; n2 = 36; s1 = 1; s2 = 1; m1 = 7; m2 = 6; r = .41.

I. TEHNICI STATISTICE: Statistica descriptiva, Studiul corelational, Metode de


comparatie, Tabele, Formule si raspunsuri la intrebari, Bibliografie recomandata
II. APLICATII STATISTICE: Baze de date - Exemple
III. TESTE
IV. LINK-URI RECOMANDATE