Sunteți pe pagina 1din 47

1.

Modulul 10: Compararea


mediilor
2. Modulul 11: Corelaia

Lect. Dr. Teo Hrgu


mail:
tpharagus@socasis.ubbcluj.ro
tpharagus@yahoo.com

1. Compararea mediilor
n anumite situaii poate fi necesar s comparm
media unei variabile dependente ntre dou
grupuri.
De ex.: vrem s studiem numrul de absene la
populaia din eantion, apoi separat pe baie i i
pe fete, iar n cele din urm s vedem dac
aceast diferen este semnificativ statistic.
Cerin: pentru a putea calcula media avem
nevoie de o variabil continu (cantitativ, de
nivel/scal interval sau rapoarte)
? de ce nu putem folosi asocierea n astfel de
cazuri ?

Testul t pentru eantioanele independente


Existena unui design independent: msurile
sunt independente (vs. esantioane legate)
Scopul acestei tehnici este s testeze dac
diferena ntre mediile a dou grupuri este
semnificativ.
ntrebarea de cercetare
Testul t este folosit pentru a rspunde la
ntrebri de cercetare ce se concentreaz pe
diferena mediei unei variabile dependente n
dou grupuri.

Pe lng o variabil continu avem nevoie de o


variabil nominal, cu cel puin dou categorii
(ex. sex: brbat i femeie; etnia: romni i
maghiari etc.)
Ipoteza nul
Testul t se folosete pentru a testa ipoteza nul
c nu exist diferene ntre mediile celor dou
grupuri:
media A = media B

Asumpii
Testul t este un test parametric, aa c se fac
urmtoarele asumpii:
1. Nivelul de msur al variabilei dependente
trebuie s fie cel puin la nivel Interval
2. Variabila dependent are o distribuie normal
n populaie
3. Varianele celor dou grupuri nu sunt
semnificativ diferite
Dac una din asumpii este nclcat, se pot face
corecii. De ex., cel mai adesea, asumpia 3
cea a omogenitii varianelor este nclcat,
aa c SPSS va calcula un test statistic
alternativ.

Abaterea standard (Eroarea)

femei

brbai

Situaia ideal I:
- Valoarea maxim a nlimii la femei este mai mic dect
valoarea minim a nlimii la brbai

femei

brbai

Situaia ideal II:


- Valoarea maxim a nlimii la femei este mai mic dect
media nlimii la brbai

femei

brbai

Nu exista diferente semnificative:

Situaia real: nlimea la brbai i


femei

Sumar
Aceast metod testeaz ipoteza nul
c mediile a dou eantioane sunt
semnificativ diferite. Dac acest
lucru ar fi adevrat, diferena
mediilor ar fi zero, astfel c urmeaz
urmtorii pai:
Calculeaz diferena ntre medii
Calculeaz variana diferenelor
pentru a estima abaterea standard a
acestei distribuii
Calculeaz numrul de abateri
standard ale mediei observate de la
0. Aceast valoare este cunoscut

Folosirea SPSS in compararea mediilor: testul t


pentru eantioane independente

Vom face o aplicaie SPSS pentru


acest test, folosind fiierul de date
1991 US General Social Survey:
Dorim s testm dac exist o
diferen semnificativ ntre femei i
brbai n ceea ce privete nivelul
educaional atins, msurat n
numrul total de ani de studiu
absolvii. Nivelul educaional al
respondenilor este dat de variabila
educ.

Pasul 1.
Reprezentarea grafic a distribuiei:
Boxplot pentru compararea a dou
distribuii

Grafic pentru descrierea situaiei: Boxplot

Highest Year of School Completed

30

20

1441
2
4
219
443
592
757
876
899
126
130
317
555
741
914
960
1058
1397
1503
51
86
155
158
196
209
228
372
447
516
519
645
649
731
866
932
942
944
961
993
1176
1214
35
143
166
205
216
238
240
287
291
328
463
665
756
856
874
951
983
1097
1204
1364
1440

10
702
1493
1398
1383
1314
1054
910
1448
244
1387
695
620
75
1476
834
596

22
1405
1380
1325
1307
1284
1281
1266
1261
1156
1144
1136
1062
862
844
843
840
826
824
806
633
565
464
423
336
267
257
246
194
185
179
115
101
90
72
24
1452
1450
1426
1412
1407
1404
1389
1384
1378
1370
1365
1331
1286
1258
1236
1235
1188
1115
1110
1041
1039
837
830
825
822
812
811
771
770
737
696
694
686
670
618
399
391
311
310
303
102
99
1510
1469
1443
1442
1427
1294
1238
1182
1074
886
836
819
802
797
691
530
529
513
1470
1366
1149
897
804
1453
1189
693
621
688
821
765
828
735

-10
N=

633

877

Male

Female

Respondent's Sex

Highest Year of School Completed


SEX: 1 Male
30

20

Percent

10

0
3

9 10 11 12 13 14 15 16 17 18 19 20

Highest Year of School Completed

Highest Year of School Completed


SEX: 2 Female
40

30

Percent

20

10

0
0

4
3

6
5

8
7

10
9

12
11

Highest Year of School Completed

14
13

16
15

18
17

20
19

Group Statistics

Highest Year of
School Completed

Respondent's Sex
Male
Female

N
633
877

Mean
13.23
12.63

Std. Deviation
3.143
2.839

Std. Error
Mean
.125
.096

Independent Samples Test


Levene's Test
for Equality of
Variances

Highest
Year of
School
Completed

Equal
variances
assumed
Equal
variances
not
assumed

11.226

Sig.

.001

t-test for Equality of Means

df

Sig.
(2-tailed)

Mean
Difference

Std.
Error
Difference

95%
Confidence
Interval of the
Difference
Lower

Upper

3.887

1508

.000

.60

.155

.298

.906

3.824

1276.5

.000

.60

.157

.293

.911

Rezultat:
2 tabele primul conine statistica
descriptiv a celor dou grupuri:
valorile mediilor variabilei nivelul
educaional al respondentului
pentru cele dou populaii (din
eantion), abaterile standard i
erorile standard corespunztoare.

Ultimul tabel este cel care prezint


rezultatele testului de semnificaie.
n primele dou coloane avem valori
pentru testarea egalitii varianelor
distribuiilor variabilei pentru cele dou
populaii, sau altfel spus, similaritatea
omogenitii celor dou distribuii, folosind
testul F.
Aici cele dou distribuii sunt semnificativ
diferite (p=0.001 sau P=99.9%); n
consecin, vom citi valorile de pe rndul
de jos, calculate pentru variane
semnificativ diferite ale celor dou

Valoarea lui t este 3.824, la nivelul de


semnificaie p=0.000, ceea ce nseamn
c sunt 99.9% anse ca diferena s fie
real. De asemenea, dac ne uitm la
intervalul de confiden pentru diferena
mediilor Confidence Interval of the
(Mean) Difference, observm c nu conine
valoarea 0, deci nu este posibil ca
diferena mediilor s fie 0, adic mediile s
fie egale.
Aadar, exist o diferen semnificativ
ntre femei i brbai, la nivelul populaiei,
n ceea ce privete numrul de ani de
coal absolvii (brbaii au, n medie, mai
muli ani de coal dect femeile: mediile
lor sunt 13.23, respectiv 12.63).

Testul t pentru eantioanele perechi


Scop
Scopul acestei tehnici este s testeze dac diferena
ntre mediile a dou grupuri este semnificativ.
Cele dou grupuri nu sunt independente, n sensul c
pot fi create printr-un design cu msurri repetate. Altfel
spus, valorile nu sunt indepedente unele de altele i
pot fi msurtori ale aceluiai fenomen, la momente
diferite de timp sau pot indica situaii n care exist un
design cu valori legate
ntrebarea de cercetare
Testul t este folosit pentru a rspunde la ntrebri de
cercetare ce se concentreaz pe diferena mediei unei
variabile dependente n dou grupuri dependente. Pe
lng o variabil continu avem nevoie de o variabil
nominal, cu cel puin dou categorii (ex. nainte/dup
intervenie)

Ipoteza nul
Testul t se folosete pentru a testa ipoteza
nul c nu exist diferene ntre mediile
celor dou grupuri:
media A = media B
Asumpii
Testul t este un test parametric, aa c se
fac urmtoarele asumpii:
Nivelul de msur al variabile dependente
trebuie s fie cel puin la nivel Interval
Variabila dependent are o distribuie
normal n populaie

Sumar
Aceast metod testeaz ipoteza nul c
mediile a dou eantioane sunt
semnificativ diferite. Dac acest lucru ar fi
adevrat, diferena mediilor ar fi zero,
astfel c:
Calculeaz media diferenelor ntre valorile
legate
Calculeaz variana diferenelor pentru a
estima abaterea standard a acestei
distribuii
Calculeaz numrul de abateri standard
ale mediei observate de la 0. Aceast
valoare este cunoscut sub numele de t.

Paired Samples Statistics


Mean
Pair
1

Highest Year School


Completed, Father
Highest Year School
Completed, Mother

Std. Deviation

Std. Error
Mean

11.01

974

4.118

.132

11.02

974

3.407

.109

Paired Samples Correlations


N
Pair
1

Highest Year School


Completed, Father &
Highest Year School
Completed, Mother

Correlation
974

.672

Sig.
.000

Paired Samples Test


Paired Differences

Mean
Pair
1

Highest Year School


Completed, Father Highest Year School
Completed, Mother

-.01

Std. Deviation

Std. Error
Mean

3.115

.100

95% Confidence
Interval of the
Difference
Lower
Upper
-.20

.19

t
-.072

df

Sig. (2-tailed)
973

.943

Interpretare
H1: Exist diferene ntre anii de educaie ai mamei i
ai tatlui.
H0: Nu exist diferene semnificative
Sig.: p =0.943
Nu putem respinge ipoteza nul: NU exist diferene
semnificative

Rezumat: Testul t
Testeaz Ho ce spune c diferena ntre 2
medii calculate pe eantioane nu sunt
diferite semnificativ statistic. Altfel spus,
testeaz c aceast diferen este egal
cu 0.
Independent sample t test
Eantioane independente: testm dac exist
diferene semnificative dup medii ntre
grupuri DIFERITE.

Paired sample t test


Calculeaz diferena medie ntre perechi
LEGATE de valori.

2. Corelaia
analizm legtura dintre dou
variabile de nivel interval sau
rapoarte prin procedura analizei de
corelaie.
Calcularea coeficientului de corelaie
a lui Pearson r

Relaia dintre ncredere i performan

Relaia dintre ncredere i performan


+ linia de regresie ce estimeaz cel mai bine
toate punctele

Interpretarea lui r
Intervalul n care variaz coeficientul de corelaie
|
|
|
-1.0
0.0
+1.0
Corelaie negativ

Ne-corelaie

Corelaie pozitiv

Semnificaia
Respingem Ho ce susine c nu exist corelaie dac p <
0,05
Semnul
Corelaia pozitiv: cele dou variabile cresc (sau scad)
deodat: nlimea i greutatea (n general, cu ct o
persoan este mai nalt, cu att are greutatea mai mare)
Corelaia negativ: dac una din variabile crete, cealalt
scade: cu ct cretem consumul de alcool, cu att
performana conducerii unui autovehicol scade.

Intensitatea: 0 reprezint intensitate


slab. +1 i -1 reprezint intensiti maxime.

1.
2.

cu ct o corelaie este mai slab, cu att putem prezice


mai slab o variabil n funcie de cealalt.
situaa din f: r=0, nu exist o relaie liniar DAR exis o
relaie curviliniar (curb)

Variana comun sau variana explicat


.
Valoarea lui r2 reprezint procentul de varian comun
(explicat) ntre cele dou variabile.
.
De exemplu, un coeficient r de 0,80, relativ la corelaia
dintre numrul de interviuri de tratament i la rezultatele
obinute la testul stimei de sine, nseamn c 64%
(r2=0,80 x 0,80 = 0,64) din variaia rezultatului obinut la
testul stimei de sine poate fi explicat pe baza numrului
de interviuri de tratament. Celelalte 36 de procente ale
variaiei valorilor stimei de sine (1,00 - 0,64) rmn neexplicate, sau factorii care explic acestea sunt altele.
Capacitatea noastr de a prezice imaginea de sine a
clienilor dac tim numrul de interviuri avute ar trebui
s fie bun, dar cu siguran nu poate fi perfect.
r1 = 0,3 i r12=0,09 (9%)
r2 =0,9 i r22=0,81 (81%)

Exemplu n SPSS

(vezi ex. de la testul t pentru


eantioanele perechi)
2 variabile cantitative: educaia (n
ani de coal) a mamei i a tatlui
Analiza:
1. Grafic: Scatterplot
2. Analiza de corelaie

Highest Year School Completed, Father

30

20

10

-10

Rsq = 0.4520

-10

10

20

Highest Year School Completed, Mother

30

Correlations

Highest Year School


Completed, Mother
Highest Year School
Completed, Father

Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N

Highest Year Highest Year


School
School
Completed,
Completed,
Mother
Father
1
.672**
.
.000
1233
974
.672**
1
.000
.
974
1069

**. Correlation is significant at the 0.01 level (2-tailed).

Interpretare
H1: Exist corelaie ntre anii de educaie ai mamei
i ai tatlui.
H0: Nu exist corelaie ntre anii de educaie ai
mamei i ai tatlui

Relaie semnificativ statistic: sig =


0,000 (p<0,001). Putem respinge
ipoteza nul pentru c ansa de a
grei este mai mic de 1 din 1000.
Direcia relaiei: semnul
coeficientului: + corelaie pozitiv
(ambele cresc)
Intensitatea relaiei: Coeficientul de
corelaie a lui Pearson r = 0,672 iar r2
= 0,45 variana comun a celor
dou variabile.

Intensitatea relaiei (size effect-Cohen


1988)
Valoarea lui r variaz ntre:

Variana explicat:

0-0,29 corelaie slab

0 i 9%

0,30-0,49 corelaie medie 9% i 25%

0,50-1 corelaie puternic

25%-100%

Rezumat: Corelaia
Ipoteza de cercetare: 2 variabile covariaz.
Ho: nu exista covariaie
semnificaia lui p.
Intensitatea relaiei: Coeficientul de
corelaie a lui Pearson: r (apropierea
de -1 sau +1)
Direcia relaiei: semnul
coeficientului (relaie pozitiv + sau
negativ -)

S-ar putea să vă placă și