Sunteți pe pagina 1din 10

M.

Popa Aplicaii SPSS (Analiza de varian factorial)

Analiza de varian factorial


(ANOVA Two-way)
Introducere
nainte de a introduce subiectul propriu-zis al acestei teme, s facem o scurt trecere n revist
a conceptului de analiz de varian. n esen, analiza de varian i propune s pun n eviden
semnificaia diferenelor dintre mediile unor eantioane, nu pe baza diferenei directe dintre ele, ci
pornind de la mprtierea (variana) lor. Cu ct mediile supuse comparaiei sunt mai diferite (au o
mprtiere mai mare), cu att este mai probabil ca aceast mprtiere s fie datorat efectului
variabilei independente i nu hazardului de eantionare.
n cazul cercetrii relaiei dintre conformism i categoriile de vrst, am avut o variabil
independent (vrsta) msurat pe o scal ordinal (categorial) cu mai mult de dou valori i o
variabil dependent (conformismul), msurat pe o scal de interval/raport. Dac variabila
independent ar fi avut doar dou valori, soluia problemei ar fi fost testul t pentru diferena dintre
medii. n cazul nostru ns, avem trei medii pentru variabila conformism, cte una pentru fiecare
categorie de vrst (raionamentul este identic pentru o variabil independent cu mai mult de dou
valori). Ne aflm n imposibilitatea de a stabili relaia dintre cele dou variabile pe baza efecturii
repetate a testului t pentru un motiv foarte simplu: cu fiecare test t ne asumm o anumit eroare de tip I
(minim 0.05). nsumat pentru toate perechile de medii aceasta ar duce, pentru o variabil
independent cu trei valori, la o eroare de tip I de 0.15, ceea ce este inacceptabil pentru a trage o
concluzie statistic corect.
Soluia acestei probleme a fost cutat n evaluarea diferenei dintre medii prin analiza
mprtierii lor. Raionamentul este simplu i ingenios: Dac mediile respective (n exemplul nostru,
3) provin din populaii diferite, adic au diferene semnificative ntre ele (ipoteza cercetrii), atunci
mprtierea lor va fi mai mare dect dac ar proveni din aceeai populaie, adic nu au diferene
semnificative ntre ele (ipoteza de nul). Mai departe problema se rezolv relativ simplu:
- Se calculeaz mprtierea mediilor grupurilor, ca valori distincte, numit din acest motiv
varian intergrup, care estimeaz amploarea efectului1 variabilei independente.
- Se estimeaz mprtierea variabilei conformism la nivelul populaiei de nul, ca i cum
cele trei medii nu ar fi diferite. Valoarea obinut se numete variaie intragrup deoarece se
calculeaz ca medie a celor 3 mprtieri (variane) din interiorul fiecrui grup.
- Se calculeaz raportul Fisher: F=variana intergrup/variana intragrup. Valoarea obinut se
raporteaz la o valoare critic a lui F, pe o distribuie teoretic specific (distribuia F), pentru
un nivel alfa minim de 0.05. Decizia statistic se ia n mod similar cu orice alt test statistic:
Orice valoare calculat a lui F mai mare sau egal cu F critic permite respingerea
ipotezei de nul i acceptarea ipotezei cercetrii.
Sau, altfel spus, orice valoare a lui F creia i corespunde o probabilitate pe curba F
mai mic sau egal cu 0.05, permite respingerea ipotezei de nul i acceptarea ipotezei
cercetrii.
Dac rezultatul testului F este semnificativ, analiza poate fi continuat cu aa numitele teste
post hoc al cror obiectiv este acela de a pune n eviden diferenele ntre perechile de eantioane,
cu minimizarea pe ct posibil a cumulului de eroare de tip I. Acest tip de analiz contribuie la
rafinarea concluziilor care decurg din analiza de baz.
n situaia analizat, conformismul a fost studiat prin efectul unei singure variabile (vrsta),
numit i factor. Din acest motiv, acest tip de situaie este definit prin expresia analiz de varian
univariat, unifactorial sau pe o singur cale (one-way ANOVA). Concluzia cercetrii a fost c
preferina spre conformism crete odat cu vrsta, nivelul cel mai redus de nonconformism
consemnndu-se la subiecii din prima categorie de vrst (21-30 de ani).

Termenul de efect este ntrebuinat doar simbolic, deoarece o relaie de tip cauz/efect nu poate decurge dect
dac datele cercetrii au fost recoltate n condiiile unui experiment.

1/10
Actualizat la: 27.03.2006/08:00:10

M. Popa Aplicaii SPSS (Analiza de varian factorial)

Fundamentarea conceptual a analizei de varian factoriale (pe mai multe ci)


n exemplul de mai sus conformismul a fost pus n relaie cu vrsta, ca singur variabil
independent. Este tiut ns, c variabilele din sfera uman suport numeroase influene simultane.
Este legitim s ne ntrebm dac relaia dintre conformism i vrst nu este cumva i sub efectul altei
variabile, de exemplu genul (masculin, feminin). ntr-un astfel de caz, problema iniial se mbogete
cu o nou variabil, a crei influen poate s se manifeste concomitent cu vrsta. De exemplu, putem
avansa ipoteza c, dac atitudinea conformist crete odat cu vrsta, este posibil ca aceast cretere s
fie mai accentuat n cazul femeilor dect n cazul brbailor. Acest model de analiz, cu dou
variabile independente de tip categorial i cu o singur variabil dependent, msurat pe o scala de
interval/raport, se numete analiz de varian factorial sau pe dou cai (two-way ANOVA)
Spre deosebire de ANOVA unifactorial, n noua situaie avem de investigat nu doar relaia
dintre o variabil independent (vrst)i variabila dependent (conformism) ci i un eventual efect
asupra acestei relaii determinat de interaciunea dintre cele dou variabile independente (vrst-sex).
Dac ne imaginm gruparea valorilor la conformism n funcie de categoriile delimitate de variabilele
independente, atunci putem o structur tabelar a mediilor tuturor acestor grupuri, astfel:
Tabelul 1. Structura unui model ANOVA factorial de tip 2x3
Factor B (sex)
(B1)
(B2)
masculin feminin
(A1) 21-30 ani
mA1B1
mA1B2
Factor A
(A2) 31-40 ani
mA2B1
mA2B2
(vrsta)
mA3B2
(A3) 41-50 ani
mA3B1
mB1
mB2

mA1
mA2
mA3

Valoarea mA1B1 este media scorurilor la scala de conformism pentru subiecii din grupa de
vrst 20-30 ani de sex masculin; mA1B2, este media la conformism a subiecilor e 21-30 ani de sex
feminin, .a.m.d. Raporturile F calculate separat ntre dispersiile mediilor la nivelul factorului A (mA1,
mA2, mA3) i, respectiv, B (mB1, mB2) cu dispersia total (de nul), sunt numite efecte principale. n
acelai timp, raportul F calculat ntre toate mediile tabelului 1 ne d efectul global, nedifereniat, dintre
variabilele dependente i variabila dependent. Analiza de varian factorial va trebui s determine
dac fiecare dintre aceste efecte sunt semnificative sau, dimpotriv, dac ele nu depesc nivelul unei
variaii naturale care ar rezulta, oricum, ca urmare a hazardului de eantionare.
ANOVA factorial se bazeaz pe un raionament similar analizei uni-factoriale. Deosebirea
const doar n aceea c dup ce se ia n considerare raportul dintre variana intergrup i variana
intragrup (raportul F univariat), variana intergrup este, la rndul ei, mprit n trei componente, n
funcie de sursa de provenien: factorul A, factorul B i ambii factori concomitent. (vezi figura de mai
jos)
Figura 1. Partiionarea variabilitii n ANOVA factorial (de tip 2x3)

Variabilitatea
total
Variabilitatea
intragrup

Variabilitatea
intergrup
Datorat
factorului A

Datorat
factorului B

Datorat factorilor
A i B

2/10
Actualizare: 27.03.2006/08:00:10

M. Popa Aplicaii SPSS (Analiza de varian factorial)

Toate tipurile de varian intergrup se compar, una cte una, cu variana intragrup,
calculndu-se un raport F corespunztor:
- Dac variana la nivelul populaiei este diferit de variana mediilor grupurilor definite de
factorul A (dup eliminarea factorului B), atunci FA va avea o valoare semnificativ.
- Dac variana la nivelul populaiei difer semnificativ de variana mediilor grupurilor definite
de factorul B (n afara efectului factorului A), atunci FB este semnificativ. FA i FB descriu
ceea ce am denumit mai sus efectul principal al celor doi factori.
- n fine, dac variana la nivelul populaiei este diferit de combinaia factorilor A i B (dup
ce efectul individual al acestora a fost izolat), atunci FAxB va fi semnificativ (FAxB fiind
raportul Fisher pentru efectul combinat al celor doi factori).
Din cele spuse rezult c procedura ANOVA factorial testeaz nu una, ci mai multe ipoteze,
care vizeaz:
a. Efectul global (al tuturor factorilor, luai mpreun, indistinct)

Fglobal =

variana mediilor din toate celulele tabelului


;
variana tuturor valorilor (ipoteza de nul)

b. Efectele principale (cte unul pentru fiecare factor inclus n analiz)

FA =

variana mediilor factorului A (indiferent de valorile lui B)


variana tuturor valorilor (distribuia de nul)
(n mod similar, pentru fiecare factor al cercetrii)

c. Efectul cumulat al variabilelor. Acesta este, n ultim instan, obiectivul esenial al


testului ANOVA factorial, deoarece efectele principale pot fi puse n eviden prin
aplicarea ANOVA one-way pentru fiecare factor n parte. Ipoteza cercetrii n acest
caz afirm c exist diferene ntre mediile din celulele tabelului care nu pot fi
explicate prin efectele principale, distincte pentru fiecare factor n parte. Cu alte
cuvinte, interaciunea dintre factori apare atunci cnd valoarea variabilei dependente
(conformismul) determinat de un factor (vrsta), depinde i de valorile celorlali
factori (n cazul nostru, doar genul).

F factorial =

variana n afara efectelor principale


variana tuturor valorilor (distribuia de nul)

Complementar, ipoteza factorial de nul afirm c nu exist nici o diferen ntre mediile din
celulele tabelului care s nu fie explicat prin simpla nsumare a efectelor individuale ale celor doi
factori. Cu alte cuvinte, c nu exist diferene datorate altor efecte dect cele ale fiecrui factor
acionnd de unul singur.
Raportul F ne d o informaie asupra semnificaiei diferenelor dintre mediile grupurilor n
funcie de combinaiile dintre diferitele niveluri ale variabilelor independente. Pe lng raportul F, care
indic semnificaia relaiei, exist i un indicator al intensitii relaiei, sau mrimii efectului, numit
coeficientul eta ptrat (2). Mrimea efectului se calculeaz att pentru fiecare factor ct i pentru
interaciunea factorilor. El indic nivelul total al varianei explicat de variabilele independente. O
mrime a efectului de 0.50 sau mai mare, indic o interaciune important.
nainte de a trece la evaluarea numeric a raportului enunat n formula generic de mai sus, s
privim relaia dintre variabilele din acest model de analiz, din punct de vedere grafic. Mediile
scorurilor la scala de conformism pentru nivelele factorului A (vrst) i B (sex) pot fi puse simultan
pe acelai grafic. Atunci cnd exist un efect concomitent al factorilor A i B asupra variabilei
dependente, liniile celor dou grafice se vor intersecta, iar dac nu exist efect vor fi paralele, adic
independente una de alta. Imaginile de mai jos descriu cteva situaii posibile i semnificaia lor:
3/10
Actualizare: 27.03.2006/08:00:10

M. Popa Aplicaii SPSS (Analiza de varian factorial)

Graficul 1
40
30
B1
20

Distana dintre B1 i B2 este aceeai pentru fiecare


valoare a lui A, cele dou linii sunt perfect paralele.
Acest lucru ilustreaz lipsa interaciunii ntre
factorul A i B.

B2
10
0
A1

A2

A3

Graficul 2
50
40
30

B1

20

B2

Distana dintre B1 i B2 este variabil n funcie de


valorile lui A. Ca urmare, se poate aprecia c exist
un efect cumulat al celor dou variabile
independente asupra variabilei dependente. Faptul
c liniile nu se intersecteaz n suprafaa graficului
definete o interaciune numit ordonat.

10
0
A1

A2

A3

Spre deosebire de graficul 2, aici avem o


interaciune numit neordonat, datorit faptului
c cele dou linii se intersecteaz n suprafaa
graficului, situaie care.

Graficul 3
40
30
B1
20
B2
10
0
A1

A2

A3

Interpretarea rezultatelor ANOVA factorial


Atunci cnd interpretm rezultatele procedurii ANOVA factorial vom examina n primul
rnd semnificaia interaciunii globale. Dar o interaciune global semnificativ nu ne ajut prea mult
la interpretarea efectelor principale. Aceasta ne spune c variabilele independente au un efect asupra
variabilei dependente, fr a putea ti dac una, alta sau ambele luate mpreun, determin acest efect.
Dac ambii factori, concomitent, au un efect asupra variabilei dependente, acest lucru ne aduce mai
mult informaie dect dac aflm c una sau alta dintre acestea au un efect individual asupra
variabilei dependente. Dar i atunci cnd descoperim o interaciune comun semnificativ pot exista
situaii n care este necesar s evalum efectele principale, adic relaia distinct dintre fiecare
variabil independent i variabila dependent. Este cazul interaciunilor de tip ordonat, n care
interaciunea nu are un caracter la fel de pronunat ca n cazul celor neordonate. Dac interaciunea nu
este semnificativ, cercettorul trebuie s procedeze la analiza efectelor principale, separat pentru
fiecare factor. Atunci cnd se descoper diferene semnificative ntre grupuri, se vor efectua teste posthoc pentru determinarea exact a surselor acestor diferene.

4/10
Actualizare: 27.03.2006/08:00:10

M. Popa Aplicaii SPSS (Analiza de varian factorial)

Condiiile pentru ANOVA factorial


-

Eantioane aleatoare i independente


Distribuie normal la nivelul populaiei a scorurilor variabilei dependente. Condiie a crei
violare este cu att mai uor suportat cu ct eantionul este mai mare.
Omogenitatea varianei la nivelul subgrupurilor determinate de variabilele independente
pentru variabila dependent. Dac aceast condiie nu este ntrunit, exist consecine
importante asupra analizei.

Facem precizarea c modul de calcul este diferit pentru situaia n care numrul cazurilor din
fiecare celul a tabelului este identic, fa de situaia cu numr diferit de subieci. Acest fapt este ns
puin important atunci cnd prelucrrile sunt efectuate de un program specializat.

Un exemplu de cercetare ANOVA factorial


S presupunem c dorim s studiem conformismul n funcie de vrst i sex. ntrebrile la
care trebuie s rspundem sunt urmtoarele:
- Variaz conformismul n funcie de categoriile de vrst?
- Variaz conformismul n funcie de sex?
- Exist o variaie a conformismului n funcie de un efect combinat al vrstei i sexului?
Structura de ansamblu a datelor se prezint ca n tabelul 1. Vom face ns diferena dintre
aceast structur, construit pentru a nelege mai uor logica modelului, i matricea de date, a crei
form complet este prezentat n anexa 1.

Efectuarea ANOVA factorial cu SPSS


Ne propunem s studiem modul n care vrsta i sexul sunt implicate n variaia atitudinii de
conformism. Matricea de date2 este cea din anexa 1.
Se activeaz procedura Statistics-General Linear Model-Univariate, care deschide urmtoarea
caset de dialog:

Am trecut variabila conform n zona Dependent Variable i variabilele virsta i genul n


lista Fixed Factors.
Mai departe, vom parcurge principalele opiuni de setare a prelucrrii, prin acionarea
butoanelor corespunztoare:

Exemplul se bazeaz pe date fictive. Nici una dintre concluziile acestor prelucrri nu se refer la situaii reale
de cercetare.

5/10
Actualizare: 27.03.2006/08:00:10

M. Popa Aplicaii SPSS (Analiza de varian factorial)

Prin acionarea butonului Model se poate alege modelul de analiz. Modelul Full factorial este
cel implicit, i este i cel mai potrivit pentru majoritatea situaiilor, alturi de Type III (care indic
modul de calcul al sumei ptratelor diferenelor). Acesta va fi utilizat i n analiza de mai jos.

Caseta Options:
Display Means for- produce mediile pentru cei doi factori
Descriptives statistics- produce mediile, abaterile
standard i numrul subiecilor din fiecare sub grup.
Estimate of Effect Size, calculeaz coeficientul eta, care
reprezint cantitatea varianei totale explicate de
variabilele independente.
Homogeneity tests, calculeaz statistica Levene pentru
testarea egalitii varianei pentru toate subgrupurile.

Caseta Post Hoc ne permite alegerea variabilelor


independente pentru care dorim analiza post-hoc. n acest
caz, doar variabila virsta este eligibil, deoarece variabila
gen ia doar dou valori. Am ales testul Bonferoni, pentru
eventualitatea c dispersiile vor fi omogene, i
Tamhanes T2, pentru eventualitatea c dispersiile vor fi
neomogene.

n caseta Profile Plots alegem tipul de grafic pe care


dorim s l utilizm pentru analiza variabilelor. Dup ce
variabilele sunt plasate, fiecare, pe axa orizontala,
respectiv vertical, se acioneaz butonul Add. Se poate
cere un singur grafic sau mai multe, inclusiv prin
inversarea factorilor pe axe.

6/10
Actualizare: 27.03.2006/08:00:10

M. Popa Aplicaii SPSS (Analiza de varian factorial)

Analiza rezultatelor
Tabelul Between-Subjects Factors ofer imaginea numrului de subieci pentru fiecare dintre
valorile factorilor. Este important s existe un numr suficient de subieci pentru fiecare valoare i, n
general, fr diferene excesive ntre grupuri.

Tabelul centralizator al statisticii descriptive ne afieaz mediile i abaterile standard pentru


fiecare subgrup rezultat din combinaia valorilor celor doi factori, precum i numrul de subieci din
fiecare subgrup. Poate constitui o surs de informaii utile.

Testul Levene al egalitii varianelor. O valoare a lui p mai mic de 0.05 indic o varian
inegal ntre subgrupuri. n cazul nostru, p=0.948 indic respingerea ipotezei de neomogenitate.

7/10
Actualizare: 27.03.2006/08:00:10

M. Popa Aplicaii SPSS (Analiza de varian factorial)

Graficele de mai jos indic variaia mediilor la conformism pentru cei doi factori, unul n
raport cu celalalt3.

Graficul din stnga arat intersecia valorilor conformismului subiecilor n funcie de sex doar
pentru categoriile de vrst de peste 31 de ani, n timp ce prima categorie de vrst nu este implicat n
variaia conformismului.
A doua reprezentare grafic indic, n alt form, acelai lucru ca i cea din stnga. i anume,
faptul c, pe ansamblu, femeile sunt mai conformiste dect brbaii, iar tendina de intersecie (deci de
relaie concomitent) este mai pronunat pentru categoriile de vrst de peste 31 de ani.
Tabelul centralizator al statisticii ANOVA factoriale de mai jos sintetizeaz principalii
indicatori ai analizei:

Valoarea lui F (6.667, p=0.001), de pe linia Corrected Model, testeaz efectul global, care
este semnificativ n cazul nostru, al vrstei i genului asupra conformismului. Acest rezultat
nu ne spune ns i de unde provine efectul, de la unul dintre factori, sau de la ambii n mod
cumulat. Pentru a afla sursele acestui efect trebuiesc analizate celelalte rezultate din tabel.

Pentru analiza iniial putem utiliza ambele reprezentri grafice dar n raportul de cercetare l vom prefera pe
cel care servete mai bine concluziile.

8/10
Actualizare: 27.03.2006/08:00:10

M. Popa Aplicaii SPSS (Analiza de varian factorial)

Valoarea lui F (10.833, p0.000), denot un efect principal semnificativ al factorului vrst
asupra conformismului. Valoarea eta ptrat (0.47) indic o intensitate relativ important
relaiei dintre aceste dou variabile.
Valoarea lui F (10.000, p=0.004) indic un efect principal semnificativ al factorului gen
asupra conformismului, dar intensitatea efectului este sczut (eta=0.29).
Valoarea F (0.83, p=0.447) indic un efect cumulat nesemnificativ al factorilor virsta*gen
asupra conformismului.

n concluzie, dei testul F global are o valoare semnificativ, analiza de detaliu nu relev dect
influene separate ale factorilor vrst i gen asupra atitudinii de conformism. Valoarea coeficientului
eta indic faptul c efectul vrstei asupra conformismului este mai important dect cel al genului.
Combinaia vrst-sex nu prezint nici un efect asupra variabilei dependente pe datele din studiul
nostru.
Dac analizm n continuare tabelul comparaiilor multiple post-hoc, observm grupele de
vrst pentru care scorurile la scala de conformism difer semnificativ, prin comparaia dou cte
dou. Ele sunt marcate cu asterisc, iar pe coloana Sig., n dreptul lor este o valoare mai mic de 0.05.

Raportarea rezultatelor
Atunci cnd se raporteaz rezultatele unui studiu statistic bazat pe procedura ANOVA
factorial se vor include:
- informaii cu privire al analiza preliminar a datelor, cu specificarea ndeplinirii condiiilor
cerute de ANOVA factorial;
- tabel cu mediile grupurilor i abaterile standard ale grupurilor analizate;
- un grafic al mediilor pe grupurile definite de cei doi factori;
- rezultatele numerice ale procedurii ANOVA (F, gradele de libertate, nivelul de semnificaie i
coeficientul eta);
- o prezentare narativ a concluziilor care sa se refere la efectul principal al fiecrui factor, al
interaciunii dintre ei, analiza post-hoc. Pentru studiul demonstrativ efectuat mai sus, aceste
concluzii ar suna astfel: Relaia dintre vrst i sex, pe de o parte, i conformism pe de alt
parte, a fost supus analizei de varian factorial. Rezultatele, prezentate n tabelul..., arat
un efect global semnificativ (F(5)=6.667, Sig.=0.001, eta=0.581), care provine n totalitate de
la efectul principal al factorului vrst (F(2)=10.833, p<0.0005, eta=0.47) i factorul gen
(F(1)=10.0, p=0.001, eta=0.29) . Combinaia virsta/sex nu are nici un efect asupra atitudinii
de conformism. Analiza post-hoc, efectuat cu testul Bonferoni, arat c atitudinea de
conformism este semnificativ mai mic la grupa de vrst 21-30 de ani fa de toate celelalte
categorii de vrst.
9/10
Actualizare: 27.03.2006/08:00:10

M. Popa Aplicaii SPSS (Analiza de varian factorial)

Anexa 1. Matricea de date pentru ANOVA factorial


(datele sunt fictive, concluziile nu au relevan tiinific, fiind expresia unui exerciiu pur didactic)
Unde:
virsta 1=21-30 ani
2=31-40 ani
3=41-50 ani
genul 1=masculin
2=feminin
Scorurile la conformism sunt exprimate pe o scal de interval/raport

10/10
Actualizare: 27.03.2006/08:00:10

S-ar putea să vă placă și