Sunteți pe pagina 1din 26

Compararea mediilor

Conf .Dr. Cornelia Muresan


Universitatea Babes-Bolyai
Structura cursului

Ipoteze care implica compararea mediilor


Cat de mare trebuie sa fie diferenta dintre doua medii?
Testul z pentru esantioane mari
Testul Student pentru esantioane mici (t )
Exemplu
Problema egalitatii variantelor
Testul Ficher
Testul t pentru esantioane perechi
Exemplu
Restrictii de utilizare a testului t
Lucrare de laborator

2
Ipoteze care implica compararea mediilor

Cauta legatura dintre o variabila calitativa (de regula cea


independenta) si una cantitativa (cea dependenta).

Examineaza daca diferentele dintre doua sau mai multe


(sub)esantioane sunt suficient de mari ca sa nu se datoreze
erorii de esantionare.

O diferenta statistic semnificativa nu sugereaza ca o variabila


este cauza variatiei celeilalte.

3
Ipoteze care implica compararea mediilor

Variabile independente categoriale des intalnite in asistenta sociala:


- tratament 1 si tratament 2
- inainte si dupa interventie
- grup experimental si grup de control

Variabile dependente cantitative de interes in asistenta sociala:


Operationalizate cantitativ
- stima de sine
- aspiratia spre bunastare
- satisfactia maritala
- nivelul de adaptare sociala
- cunostintele acumulate intr-un anume domeniu
- rezultate scolare
Cantitative prin natura lor
- numar de interventii reusite
- numar comportamente violente indreptate impotriva sotiei /copilului
- numar de absente de la scoala
4
Ipoteze care implica compararea mediilor

Atuuri ale testelor de comparare a mediilor:

Se poate utiliza si pentru dimensiuni relativ mici a


esantioanelor (20-30 cazuri)

Posibilitatea ca grupul experimental si cel de control sa


aiba dimensiuni diferite

Test parametric (puternic)

Testul Student sau Testul t (autor William Gosset)

5
Cat de mare trebuie sa fie diferenta dintre doua medii?

6
Distributia ipotezei nule

Diferena dintre medii

11
Populatia 1 E. 1 m - m21 E. 1 Populatia 2

Elevii cu care Elevii carora li


se lucreaza 12
se distribuie
E. 2 m - m22 E. 2
interactiv la doar
clasa sau materiale
extrascolar 13 scrise
E. 3 m - m23 E. 3

7
Distributia ipotezei nule

(m1-1 m2-1)
1-2 = 0
(m1-2 m2-2) (m1-3 m2-3)

Problema de rezolvat: diferenta dintre mediile celor doua


esantioane este suficient de mare sa nu se datoreze doar
intamplarii?
1

Daca s-ar datora doar intamplarii (Ipo) cele doua medii (m si m2)
ar face parte din aceeasi populatie diferenta dintre ele ar tinde
catre 0

Va trebui sa comparam diferenta noastra cu marimi care s-ar


obtine prin extragerea aleatoare a doua esantioane dintr-o
8 aceeasi populatie distribuita normal in jurul mediei 0
Testul z pentru esantioane mari

Mediile de esantionare tind catre media populatiei, daca


esantioanele sunt suficient de mari (teorema limitei centrale)
Mediile de esantionare au o distributie normala, daca volumul
esantioanelor e mare (teorema limitei centrale)
Daca ambele esantioane apartin aceleiasi populatii (Ipo),
diferenta dintre medii tinde catre 0
Distributia diferentelor mediilor fata de zero (Ipo ) este o
distributie z standardizata (normala, m=0, =1)

z este raportul dintre diferenta mediilor si eroarea standard a


diferentei
Eroarea standard a diferentei = suma erorilor standard a
celor doua esantioane
m1 m2
z=
12 22
+
n1 n2
9
Testul z pentru esantioane mari

Nivelul de semnificatie p asociat testului z se afla din tabelele


cu ariile de sub curba normala si z , valoarea calculata

Aria cuprins ntre curba normal, medie i valoarea Z


Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.00 0.40 0.80 1.20 1.60 1.99 2.39 2.79 3.19 3.59
0.1 3.98 4.38 4.78 5.17 5.57 5.96 6.36 6.75 7.14 7.53
0.2 7.93 8.32 8.71 9.10 9.48 9.87 10.26 10.64 11.03 11.41
0.3 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15.17
0.4 15.54 15.91 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79
0.5 19.15 19.50 19.85 20.19 20.54 20.48 21.23 21.57 21.90 22.24
0.6 22.57 22.91 23.24 23.57 23.89 24.22 24.54 24.86 25.17 25.49
0.7 25.80 26.11 26.42 26.73 27.04 27.34 27.64 27.94 28.23 28.52
0.8 28.81 29.10 29.39 29.67 29.95 30.23 30.51 30.78 31.06 31.33
0.9 31.59 31.86 32.12 32.38 32.64 32.90 33.15 33.40 33.65 33.89
1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
...

10
Testul Student pentru esantioane mici (t )

Probleme pentru esantioanele mici:

1. Distributia diferentei dintre medii nu este normala


(nu are forma de clopot) si este cu atat mai ascutita cu cat
dimensiunile esantioanelor sunt mai mici
Marimea t (calculata dupa aceasi formula ca z) depinde de
gradele de libertate (df)
df = n1 + n2 2

m1 m2
t=
s12 s22
+
n1 n2

11 Obs. La esantioane mici la calculul variantei (s2 ) in loc de n se foloseste n-1


Testul Student pentru esantioane mici (t )

Nivelul de semnificatie se determina din tabelele cu valori t

Tabel cu valori critice pentru testul t


. Nivele de semnificaie pentru test direcional (one-tailed) .
0.10 0.05 0.025 0.01 0.005 0.0005 .
Nivele de semnificaie pentru test nedirecional (two-tailed) .
df 0.20 0.10 0.05 0.02 0.01 0.001 .
1 3.078 6.314 12.706 31.821 63.657 636.619
2 1.886 2.920 4.303 6.965 9.925 31.689
3 1.638 2.353 3.182 4.541 5.841 12.941
4 1.533 2.132 2.776 3.747 4.604 8.610
5 1.476 2.015 2.571 3.365 4.032 6.859
6 1.440 1.943 2.447 3.143 3.707 5.959
7 1.415 1.895 2.365 2.998 3.499 5.405
...

12
Testul Student pentru esantioane mici (t )

Probleme pentru esantioanele mici:

2. Daca variantele din cele doua populatii de provenienta a


esantioanelor sunt egale, formula erorii standard a diferentei
introduce distorsiuni mari

se foloseste formula variantei cumulate (s2cum)

( n1 1) s12 + ( n2 1) s22
2
scum =
n1 + n2 2
Marimea t pentru variante egale:

m1 m2
t=
(n1 1) s12 + ( n2 1) s22 1 1
( + )
n1 + n2 2 n1 n2
13
Exemplu: calcul manual

Esantion 1: Esantion 2:
Preventie cu metode interactive (discutii, activitati) Preventie cu metode indirecte (brosuri, pliante
2 2 2 2
X1 k1 x1*k1 x-m1 (x-m1) (x-m1) * k1 X2 k2 x2*k2 x-m2 (x-m2) (x-m2) * k2
6 1 6 -2.14 4.59 4.59 5 1 5 -2.33 5.44 5.44
7 1 7 -1.14 1.31 1.31 6 2 12 -1.33 1.78 3.56
8 2 16 -0.14 0.02 0.04 7 2 14 -0.33 0.11 0.22
9 2 18 0.86 0.73 1.47 8 2 16 0.67 0.44 0.89
10 1 10 1.86 3.45 3.45 9 1 9 1.67 2.78 2.78
10 1 10 2.67 7.11 7.11
7 57 10.86 9 66 20.00
media m1 = 8.14 media m2 = 7.33
varianta s12=10.86/(n1 -1) = 1.81 varianta s22=20/(n2 -1) = 2.50

diferenta intre medii m1 - m2 = 0.81


scom 2 = ((n1-1)*s12 +(n2-1)*s22 / (n1+n2-2)) = 2.20
2
Es = sqrt (scom * (1/n1+1/n2) ) = 0.75 Tabel cu valori t
. Nivele de semnificaie pentru testul direcionat (one-tailed) .
0.10 0.05 0.025 0.01 0.005 0.0005
Nivele de semnificaie pentru testul nedirecionat (two-tailed) .
t = (m1-m2) / Es = 1.08 df 0.20 0.10 0.05 0.02 0.01 0.001

df = n1+n2-2=9+7-2=14 14 1.345 1.761 2.145 2.624 2.977 4.140
t critic = 2,145 p > 0,20 > 0,05

Ip0 nu poate fi respinsa


14
Exemplu: Prezentarea rezultatelor

1. Se prezinta mediile variabilei cantitative calculate pentru pentru


cele doua esantioane si se fac comparatii directe

15
SPSS: COMPARE MEANS, Independet Sample T Test

T-Test
Group Statistics
Metoda preventie N Mean Std. Deviation Std. Error
Mean

Nivel cunostinte HIV Indirecte 9 7.33 1.581 .527

Interactive 7 8.14 1.345 508

Independent Samples Test


Levene's Test for t-test for Equality of Means
Equality of
Variances
F Sig. t df Sig. (2- Mean Std. 95% Confidence
tailed) Differen Error Interval of the
ce Differe Difference
nce

Lower Upper

Nivel cunostinte Equal variances .338 .570 -1.082 14 .298 -.810 .748 -2.414 .795
HIV assumed

Equal variances -1.105 13.839 .288 -.810 .732 -2.382 .763


not assumed

16
Problema egalitatii variantelor

Formula de calcul al erorii standard a diferentelor (numitorul din


formula de calcul al lui t) este diferita pentru esantioane
provenind din populatii cu variante egale sau, respectiv, diferite

nevoia testarii egalitatii variantelor in populatie

Ip0: Variantele sunt egale

17
Testul Ficher (F)

Cum determinam daca cele doua esantioane provin din


populatii cu acelasi grad de omogenitate (variante egale) ?
Testul Ficher de egalitate a variantelor:
2
s
F= 1
2
s
2
unde s12 este varianta mai mare si s22 varianta mai mica (de obicei)
Nivelul de semnificatie a lui F depinde de doua grade de libertate:
df1 = n1 - 1 si df2 = n2 - 1

Tabel cu valori critice pentru testul F


A. Nivelul p = 0.05 B. Nivelul p = 0.01
df1 2 3 4 df1 2 3 4
df2 df2 .
2 19.00 19.16 19.25 2 99.00 99.17 99.25
3 9.55 9.28 9.12 3 30.81 29.46 28.71
4 6.94 6.59 6.39 4 18.00 16.69 15.98
5 5.79 5.41 5.19 5 13.27 12.06 11.39
6 5.14 4.79 4.53 5 10.91 9.78 9.15
18 7 4.74 4.35 4.12 7 9.55 8.45 7.85
...
SPSS: COMPARE MEANS, Independet Sample T Test

T-Test
Group Statistics
Metoda preventie N Mean Std. Deviation Std. Error
Mean

Nivel cunostinte HIV Indirecte 9 7.33 1.581 .527

Interactive 7 8.14 1.345 .508

Independent Samples Test


Levene's Test for t-test for Equality of Means
Equality of
Variances
F Sig. t df Sig. (2- Mean Std. 95% Confidence
tailed) Differen Error Interval of the
ce Differe Difference
nce

Lower Upper

Nivel cunostinte Equal variances .338 .570 -1.082 14 .298 -.810 .748 -2.414 .795
HIV assumed

Equal variances -1.105 13.839 .288 -.810 .732 -2.382 .763


not assumed

19
Testul t pentru esantioane perechi

Ipoteze in care esantioanele nu sunt independente

Individul statistic
1. un individ statistic in doua ipostaze:
inainte si dupa o interventie
inainte si dupa o perioada de timp
inainte si dupa o actiune
2. individul statistic este cuplul:
sot - sotie
copil - parinte
elev - profesor
3. individul statistic este perechea:
individ din individ corespondent in
grupul experimental grupul de control
pereche de gemeni

Variabile de comparat
- atitudini, cunostinte, comportamnete, etc.
- se urmareste sesizarea diferentelor: se masoara cu acelasi
20 instrument
- comparatiile se fac intre 2 variabile, nu intre 2 esantioane
Testul t pentru esantioane perechi

unde
mD este media diferentelor individuale
mD
t= di = xi dupa xi inainte
s D2 di = xindivid xpereche

n sD2 este varianta diferentelor individuale


21 df = n -1
Exemplu: calcul manual

Cuntintele despre HIV ale elevilor din program, inainte si dupa interventie
Inainte de Dupa
interventie interventie
X1 X2 D = X2-X1 D-mD (D-mD)2
6 6 0 -1 1
6 8 2 1 1
7 9 2 1 1
7 7 0 -1 1
8 8 0 -1 1
8 9 1 0 0
8 10 2 1 1
suma: 50 57 7 6
media: m1 = 7,143 m2 = 8,143 mD = 1
varianta: sD2= 6/(n-1) = 1

Es = sqrt (sD2 /n ) = 0.378


t = mD / Es = 2.646 Tabel cu valori t
df = n-1 = 7-1 = 6 . Nivele de semnificaie pentru testul direcionat
0.10 0.05 0.025 0.01
t critic = 2,447 p < 0,05 Nivele de semnificaie pentru testul nedirecio
df 0.20 0.10 0.05 0.02

6 1.440 1.943 2.447 3.143

22 se repincge Ip0, se accepta Ipc


Exemplu: Prezentarea rezultatelor

1. Se prezinta mediile variabilei cantitative calculate pentru cele


doua ipostaze si se fac comparatii directe

23
Restrictii de utilizare a testului t

Situatii in care testul t nu poate fi folosit:

Cand distributia variabilei cantitative in populatie nu este normala


(numai pt esantioane mici)

Cand avem de comparat mai mult decat doua medii, pentru ca


nivelurile de semnificatie isi pierd semnificatia prin cumulare, chiar
daca ele sunt acceptabile fiecare in parte analize ANOVA

Abordarea socanta, cu o baterie de variabile dependente de


comparat fara justificare teoretica sau practica

24
Laborator SPSS: exercitiu 1

Fisierul de date: 1991 US General Social Survey

Ipc: Barbatii au un nivel de educatie mai inalt decat femeile

Variabila dependenta: nivelul de educatie, operationalizat in


numarul anilor de scoala absolviti
Variabila independenta: sexul

Comanda SPSS: COMPARE MEANS, Independent Sample, T Test

Se cere: a) analiza datelor cu SPSS


b) interpretarea rezultatelor (pe o foaie de hartie, semnata)

25
Laborator SPSS: exercitiu 2

Fisierul de date: Employee data.sav

Ipc: Veniturile salariale ale angajatilor cresc semnificativ dupa


angajare

Indvid statistic : salariatul inainte si dupa o perioada de timp

Perechea de variabile:
- salariu curent
- salariu la angajare

Comanda SPSS: COMPARE MEANS, Paired-Sample T Test

Se cere: a) analiza datelor cu SPSS


b) interpretarea rezultatelor (pe o foaie de hartie, semnata)
26