Documente Academic
Documente Profesional
Documente Cultură
5 ID - Modul - 10 - 11 Test T + Corelatia
5 ID - Modul - 10 - 11 Test T + Corelatia
1. Compararea mediilor
n anumite situaii poate fi necesar s comparm
media unei variabile dependente ntre dou
grupuri.
De ex.: vrem s studiem numrul de absene la
populaia din eantion, apoi separat pe baie i i
pe fete, iar n cele din urm s vedem dac
aceast diferen este semnificativ statistic.
Cerin: pentru a putea calcula media avem
nevoie de o variabil continu (cantitativ, de
nivel/scal interval sau rapoarte)
? de ce nu putem folosi asocierea n astfel de
cazuri ?
Asumpii
Testul t este un test parametric, aa c se fac
urmtoarele asumpii:
1. Nivelul de msur al variabilei dependente
trebuie s fie cel puin la nivel Interval
2. Variabila dependent are o distribuie normal
n populaie
3. Varianele celor dou grupuri nu sunt
semnificativ diferite
Dac una din asumpii este nclcat, se pot face
corecii. De ex., cel mai adesea, asumpia 3
cea a omogenitii varianelor este nclcat,
aa c SPSS va calcula un test statistic
alternativ.
femei
brbai
Situaia ideal I:
- Valoarea maxim a nlimii la femei este mai mic dect
valoarea minim a nlimii la brbai
femei
brbai
femei
brbai
Sumar
Aceast metod testeaz ipoteza nul
c mediile a dou eantioane sunt
semnificativ diferite. Dac acest
lucru ar fi adevrat, diferena
mediilor ar fi zero, astfel c urmeaz
urmtorii pai:
Calculeaz diferena ntre medii
Calculeaz variana diferenelor
pentru a estima abaterea standard a
acestei distribuii
Calculeaz numrul de abateri
standard ale mediei observate de la
0. Aceast valoare este cunoscut
Pasul 1.
Reprezentarea grafic a distribuiei:
Boxplot pentru compararea a dou
distribuii
30
20
1441
2
4
219
443
592
757
876
899
126
130
317
555
741
914
960
1058
1397
1503
51
86
155
158
196
209
228
372
447
516
519
645
649
731
866
932
942
944
961
993
1176
1214
35
143
166
205
216
238
240
287
291
328
463
665
756
856
874
951
983
1097
1204
1364
1440
10
702
1493
1398
1383
1314
1054
910
1448
244
1387
695
620
75
1476
834
596
22
1405
1380
1325
1307
1284
1281
1266
1261
1156
1144
1136
1062
862
844
843
840
826
824
806
633
565
464
423
336
267
257
246
194
185
179
115
101
90
72
24
1452
1450
1426
1412
1407
1404
1389
1384
1378
1370
1365
1331
1286
1258
1236
1235
1188
1115
1110
1041
1039
837
830
825
822
812
811
771
770
737
696
694
686
670
618
399
391
311
310
303
102
99
1510
1469
1443
1442
1427
1294
1238
1182
1074
886
836
819
802
797
691
530
529
513
1470
1366
1149
897
804
1453
1189
693
621
688
821
765
828
735
-10
N=
633
877
Male
Female
Respondent's Sex
20
Percent
10
0
3
9 10 11 12 13 14 15 16 17 18 19 20
30
Percent
20
10
0
0
4
3
6
5
8
7
10
9
12
11
14
13
16
15
18
17
20
19
Group Statistics
Highest Year of
School Completed
Respondent's Sex
Male
Female
N
633
877
Mean
13.23
12.63
Std. Deviation
3.143
2.839
Std. Error
Mean
.125
.096
Highest
Year of
School
Completed
Equal
variances
assumed
Equal
variances
not
assumed
11.226
Sig.
.001
df
Sig.
(2-tailed)
Mean
Difference
Std.
Error
Difference
95%
Confidence
Interval of the
Difference
Lower
Upper
3.887
1508
.000
.60
.155
.298
.906
3.824
1276.5
.000
.60
.157
.293
.911
Rezultat:
2 tabele primul conine statistica
descriptiv a celor dou grupuri:
valorile mediilor variabilei nivelul
educaional al respondentului
pentru cele dou populaii (din
eantion), abaterile standard i
erorile standard corespunztoare.
Ipoteza nul
Testul t se folosete pentru a testa ipoteza
nul c nu exist diferene ntre mediile
celor dou grupuri:
media A = media B
Asumpii
Testul t este un test parametric, aa c se
fac urmtoarele asumpii:
Nivelul de msur al variabile dependente
trebuie s fie cel puin la nivel Interval
Variabila dependent are o distribuie
normal n populaie
Sumar
Aceast metod testeaz ipoteza nul c
mediile a dou eantioane sunt
semnificativ diferite. Dac acest lucru ar fi
adevrat, diferena mediilor ar fi zero,
astfel c:
Calculeaz media diferenelor ntre valorile
legate
Calculeaz variana diferenelor pentru a
estima abaterea standard a acestei
distribuii
Calculeaz numrul de abateri standard
ale mediei observate de la 0. Aceast
valoare este cunoscut sub numele de t.
Std. Deviation
Std. Error
Mean
11.01
974
4.118
.132
11.02
974
3.407
.109
Correlation
974
.672
Sig.
.000
Mean
Pair
1
-.01
Std. Deviation
Std. Error
Mean
3.115
.100
95% Confidence
Interval of the
Difference
Lower
Upper
-.20
.19
t
-.072
df
Sig. (2-tailed)
973
.943
Interpretare
H1: Exist diferene ntre anii de educaie ai mamei i
ai tatlui.
H0: Nu exist diferene semnificative
Sig.: p =0.943
Nu putem respinge ipoteza nul: NU exist diferene
semnificative
Rezumat: Testul t
Testeaz Ho ce spune c diferena ntre 2
medii calculate pe eantioane nu sunt
diferite semnificativ statistic. Altfel spus,
testeaz c aceast diferen este egal
cu 0.
Independent sample t test
Eantioane independente: testm dac exist
diferene semnificative dup medii ntre
grupuri DIFERITE.
2. Corelaia
analizm legtura dintre dou
variabile de nivel interval sau
rapoarte prin procedura analizei de
corelaie.
Calcularea coeficientului de corelaie
a lui Pearson r
Interpretarea lui r
Intervalul n care variaz coeficientul de corelaie
|
|
|
-1.0
0.0
+1.0
Corelaie negativ
Ne-corelaie
Corelaie pozitiv
Semnificaia
Respingem Ho ce susine c nu exist corelaie dac p <
0,05
Semnul
Corelaia pozitiv: cele dou variabile cresc (sau scad)
deodat: nlimea i greutatea (n general, cu ct o
persoan este mai nalt, cu att are greutatea mai mare)
Corelaia negativ: dac una din variabile crete, cealalt
scade: cu ct cretem consumul de alcool, cu att
performana conducerii unui autovehicol scade.
1.
2.
Exemplu n SPSS
30
20
10
-10
Rsq = 0.4520
-10
10
20
30
Correlations
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Interpretare
H1: Exist corelaie ntre anii de educaie ai mamei
i ai tatlui.
H0: Nu exist corelaie ntre anii de educaie ai
mamei i ai tatlui
Variana explicat:
0 i 9%
25%-100%
Rezumat: Corelaia
Ipoteza de cercetare: 2 variabile covariaz.
Ho: nu exista covariaie
semnificaia lui p.
Intensitatea relaiei: Coeficientul de
corelaie a lui Pearson: r (apropierea
de -1 sau +1)
Direcia relaiei: semnul
coeficientului (relaie pozitiv + sau
negativ -)