Sunteți pe pagina 1din 5

Curs 8 – ANOVA (Analiza variației)

ANOVA (Analiza variației) este o tehnică multivariată de analiză a datelor ce are ca scop testarea existenței
unei diferențe între mediile unei variabile (numită variabilă dependentă) între diferitele categorii ale unei
variabile independente (numită factor).

În funcție de relația dintre eșantioanele utilizate pentru culegerea datelor, avem:


a. Anova independentă (datele s-au cules de la eșantioane diferite pentru fiecare categorie a factorului
în parte)
b. Anova dependentă (datele s-au cules de la același eșantion pentru fiecare categorie a factorului în
parte)

În funcție de numărul de factori considerați pentru diferențierea variabilei dependente, avem:


a. Anova unifactorială (un singur factor)
b. Anova bifactorială (doi factori)
c. Anova multifactorială (mai mult de doi factori)

În funcție de numărul de variabile dependente utilizate, avem:


a. Anova (analysis of variance)
b. Manova (multiple analysis of variance)

Dacă se introduc una sau mai multe variabile continue ca variabile independente (pe langă factorii
categoriali), ale cărora covariații cu variabila dependentă se doresc a fi controlate, avem:
a. Ancova (analysis of covariance)
b. Mancova (multiple analysis of covariance)
ANOVA în SPSS
(dvdplayer.sav)
Scopul nostru este de a cerceta dacă există o diferență între grupele de vârstă (agegroup - factor) pentru
dvdscore (variabila dependentă).
Înainte de a aplica ANOVA, va trebui să testăm următoarele 2 ipoteze:

Prima ipoteză pentru ANOVA – Distribuția normală a variabilei dependente în cadrul fiecărei categorii
a factorului considerat:
 H0: Distribuția dvdscore (variabila dependentă) în cadrul fiecărei categorii a factorului considerat
(factor) este o distribuție normală
 H1: Distribuția dvdscore (variabila dependentă) în cadrul fiecărei categorii a factorului considerat
(factor) NU este o distribuție normală
Analyze => Descriptive Statistics => Explore

Tests of Normality

Kolmogorov-Smirnova Shapiro-Wilk

Age group Statistic df Sig. Statistic df Sig.

Total DVD assessment Under 25 .193 13 .199 .935 13 .399

25-34 .214 10 .200* .910 10 .282

35-44 .242 12 .050 .895 12 .138

45-54 .205 10 .200* .944 10 .601

55-64 .384 6 .006 .719 6 .010

65 and over .138 17 .200* .969 17 .808

*. This is a lower bound of the true significance.


a. Lilliefors Significance Correction

Dacă Sig.<0.05 => H0 se respinge => H1 se acceptă => în exemplul nostru avem o distribuție normală a
variabilei dvdscore în toate categoriile de vârstă, MAI PUȚIN categoria 55 – 64 ani.
A doua ipoteză pentru ANOVA – Omogenitatea variației variabilei dependente în cadrul fiecărei
categorii a factorului considerat
 H0: Variația dvdscore (variabila dependentă) este omogenă în cadrul categoriilor factorului
 H1: Variația dvdscore (variabila dependentă) NU este omogenă în cadrul categoriilor factorului

Analyze => Compare Means => One-War ANOVA

Test of Homogeneity of Variances


Total DVD assessment

Levene Statistic df1 df2 Sig.

1.292 5 62 .279

Dacă Sig.< 0.05 => H0 este respinsă => H1 este acceptată => în exemplul nostru H0 se menține (0.279 >
0.05), astfel, variația dvdscore (variabila dependentă) este omogenă în cadrul tuturor grupelor de vârstă.

Procedura ANOVA
Analyze => Compare Means => One-Way ANOVA
Și outputul:

ANOVA
Total DVD assessment

Sum of Squares df Mean Square F Sig.

Between Groups 1294.481 5 258.896 6.993 .000


Within Groups 2295.532 62 37.025
Total 3590.013 67

Dacă Sig.< 0.05 => Există o diferență între mediile variabilei dependente (dvdscore) între categoriile
factorului considerat (age groups).

Pentru a testa (statistic) între care două grupe de vârstă există o diferență (statistică), vom aplica
CONTRASTS:

Age groups C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15


Under 25 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0
25 – 34 -1 0 0 0 0 1 1 1 1 0 0 0 0 0 0
35 – 44 0 -1 0 0 0 -1 0 0 0 1 1 1 0 0 0
45 – 54 0 0 -1 0 0 0 -1 0 0 -1 0 0 1 1 0
55 – 64 0 0 0 -1 0 0 0 -1 0 0 -1 0 -1 0 1
>65 0 0 0 0 -1 0 0 0 -1 0 0 -1 0 -1 -1
Contrast Tests

Value of
Contrast Contrast Std. Error t df Sig. (2-tailed)

Total DVD assessment Assume equal variances 1 -2.9288 2.55940 -1.144 62 .257

2 -8.2688 2.43587 -3.395 62 .001

3 -10.3691 2.55940 -4.051 62 .000

4 .3019 3.00314 .101 62 .920

5 .7464 2.24187 .333 62 .740

6 -5.3400 2.60535 -2.050 62 .045

7 -7.4404 2.72120 -2.734 62 .008

8 3.2307 3.14217 1.028 62 .308

9 3.6752 2.42495 1.516 62 .135

10 -2.1003 2.60535 -.806 62 .423

Does not assume equal 1 -2.9288 2.34162 -1.251 18.230 .227


variances 2 -8.2688 2.71858 -3.042 18.660 .007

3 -10.3691 2.49260 -4.160 17.072 .001

4 .3019 2.64483 .114 9.411 .912

5 .7464 1.92508 .388 26.154 .701

6 -5.3400 2.95345 -1.808 19.719 .086

7 -7.4404 2.74686 -2.709 17.833 .014

8 3.2307 2.88571 1.120 11.311 .286

9 3.6752 2.24458 1.637 17.428 .119

10 -2.1003 3.07454 -.683 19.988 .502

Acele contraste pentru care Sig.(2-tailed) < 0.05 sunt semnificative din punct de vedere statistic, astfel putem
afirmă că între următoarele perechi de categorii de vârstă avem o diferență semnificativă a variabilei dvdscore.
a. Under 25 și 35 – 44 ani
b. Under 25 și 45 – 54 ani
c. 25 – 34 și 35 – 44 ani
d. 25 – 34 și 45 – 54 ani

Exercițiu:
(demo_cs.sav)
Testați dacă există diferențe între mediile variabilei dependente Household Income (income – variabila nr.10)
în funcție de categoria de mașină deținută (carcat – variabila nr.13).
Testați ambele ipoteze ANOVA, aplicați procedura ANOVA și Contraste în acest sens.

S-ar putea să vă placă și