Sunteți pe pagina 1din 29

Tehnicile ANOVA

Utilizarea testelor t este o metoda foarte buna de determinare a diferentelor dintre doua grupe. Totusi, deseori, cercetatorii lucreaza cu mai mult de doua grupe. n acest caz este nevoie de o noua metoda pentru a determina diferentele ntre grupe. Tehnicile analizate n acest capitol sunt:

ANOVA simpla; ANOVA cu masuratori repetate; ANOVA factoriala.

nainte de a trece la prezentarea primei tehnici vom analiza mai nti avantajele teoretice si de ordin statistic pe care le poseda analiza dispersionala (ANOVA) fata de testul t. Vom aduce drept exemplu legea Yerkes-Dodson n ce priveste relatia dintre motivatie si nvatare. Se cunoaste ca exista un optimum motivational care determina performante crescute. Daca nivelul motivational al subiectilor este prea mic ori prea puternic, rezultatul va fi acelasi: o scadere a performantei n nvatare, n primul caz datorat submotivarii, n celalalt datorita supramotivarii. Daca un experimentator decide sa aplice testul t pe doua grupe de subiecti (puternic, respectiv slab motivati) pentru a urmarii efectul motivarii asupra performantelor n nvatare va ajunge la concluzia ca motivatia nu influenteaza eficienta nvatarii doarece nu exista diferente semnificative ntre grupul subiectilor puternic motivati si grupul celor slab motivati.

Daca nsa introduce o a treia grupa de subiecti care au un nivel mediu de motivare (apropiat de optimum motivational), se va observa ca performantele la nvatare vor creste. Iata graficul aceastei situatii:

Se observa ca acest design experimental constituit din trei grupe este mai fidel dect cel format din doua grupe, deoarece reuseste sa surprinda faptul ca eficienta nvatarii creste la un nivel mediu de motivare si scade n situatiile extreme. Acest fapt nu ar fi putut fi surprins daca am fi utilizat doar doua esantioane. Ca urmare, cu ct numarul de grupe comparative este mai mare, cu att se diversifica si gradele unei variabile independente. Astfel, putem observa care este efectul variabilei independente asupra celei dependente n situatii variate (lipsa ei, prezenta ei slaba, ntr-o masura medie sau puternica). Pentru a creste siguranta relatiei dintre o variabila independenta si una dependenta se recomanda cresterea numarului de grupe experimentale. Cel de-al doilea neajuns al testelor t n cazul designului experimental cu mai mult de doua grupe este de ordin statistic. Tipul de eroare de ordinul I este determinat de formula:

Unde: este nivelul de ncredere pentru fiecare test t efectuat; c este numarul de teste t ce trebuie efectuate. Daca exista doar doua grupe de subiecti se aplica un singur test t ntre grupul 1 si grupul 2. Daca exista nsa trei grupe de subiecti sunt necesare trei teste t (ntre grupul 1 si grupul 2; ntre 2 si 3; respectiv ntre 1 si 3). Cu ct avem un numar mai mare de grupe cu att numarul testelor t ce trebuie efectuate creste. Ori, nivelul de ncredere maxim pna la care putem respinge o ipoteza nula este de 0,05 (.05). Conform formulei date mai sus, acest nivel de ncredere se

calculeaza n functie de numarul de grupe. Daca n cazul a doua grupe aplicam un singur test t nivelul de ncredere al experimentului este:

nsa ncepnd cu situatia n care avem trei grupe trebuie aplicate mai multe teste t simultane, crescnd astfel sansa de a comite o eroare de tip I.

Aceasta valoare ar fi mai mare dect maximul acceptat (0,05), ca urmare nici din punct de vedere statistic nu este recomandabila utilizarea testului t pentru mai mult de doua grupe. Pornind de la aceasta situatie, R.A. Fisher a dezvoltat o tehnica numita analiza dispersionala sau ANOVA (care n limba engleza provine de la analysis of variance). Exista mai multe tipuri de ANOVA care vor fi discutate punctual n continuare.

ANOVA simpla Vom utiliza aceasta tehnica n situatia n care vom avea o singura variabila independenta cu mai multe trepte (mai mult de doua trepte si implicit grupe de subiecti) si o singura variabila dependenta. Tehnica este echivalentul testului t independent. De fapt, testul t independent este un tip special de ANOVA simpla n care sunt implicate doar doua grupe. ANOVA simpla permite evaluarea ipotezei nule ntre mediile a doua sau mai multe serii de date cu restrictia ca acestea sa fie trepte ale aceleiasi variabile independente. Exemplul anterior contine o variabila independenta cu trei trepte: motivare slaba, medie si puternica, respectiv o variabila dependenta, eficienta n nvatare. Pot exista mai multe trepte, cu conditia sa existe o singura variabila independenta, respectiv o singura variabila dependenta. ANOVA simpla permite compararea simultana a trei sau mai multe grupe mentinnd nivelul la valoarea dorita, de maxim 0,05. Procedeul matematic implicat n ANOVA simpla consta n analiza dispersiei variabilei dependente. n aceasta analiza dispersia totala are doua componente:

dispersia din interiorul fiecarui grup format si dispersia ntre mediile grupelor si marea medie (media totala fara a tine cont de grupele formate). De exemplu, subiectul X1 din grupa I abaterea fata de marea medie M este data de doua componente: abaterea lui X1 fata de media grupului din care face parte M1 (X1-M1), respectiv abaterea mediei grupului I fata de marea medie (M1-M). Prima componenta este denumita dispersia intragrup si se datoreaza fluctuatiilor esantionului ales pentru studiu, cea de a doua se numeste dispersia intergrup si apare mai ales ca urmare a influentei variabilei independente. Deci, n ANOVA simpla totalul dispersiei provine din doua surse: intragrupal si intergrupal. Ambele surse reflecta dispersia datorata selectiei randomizate a esantionului. n plus, dispersia intergrup reflecta abaterile datorate treptelor diferite ale variabilei independente. Dispersia datorata esantionarii aleatoare se mai numeste si dispersia erorii, n timp ce dispersia datorata variabilei independente poarta numele si de dispersie adevarata. Pentru a ntelege mai bine mecanismul matematic de calculare a lui F (simbolul rezultatului obtinut prin ANOVA) vom prezenta un exemplu si algoritmul de calcul pentru ANOVA simpla. Un cercetator doreste sa urmareasca efectul unei terapii asertive asupra stimei de sine la debilii mintali. Toti subiectii aveau un QI ntre 70 si 80 si au fost mpartiti randomizat n trei grupe de subiecti. Din totalul de 15 participanti au fost relizate trei grupe a cte cinci subiecti fiecare. O prima grupa a urmat o terapie individuala bisaptamnala timp de o luna de zile, cel de-al doilea grup a urmat o terapie de grup n aceleasi conditii n timp ce al treilea grup, de control, n-a urmat nici o forma de terapie. La sfrsitul experimentului subiectii au fost testati n ce priveste nivelul stimei de sine, care n acest caz constituie variabila dependenta. Rezultatele sunt prezentate n tabelul de mai jos:
Terapie individuala X 12 10 11 X 144 100 121 Terapie grup X 9 7 6 X 81 49 36 Grup de control X 6 7 2 X 36 49 4

7 10 X Media 50 10

49 100 514

9 4 35 7

81 16 263

3 2 20 4

9 4 102

Pentru calcuarea raportului F din ANOVA simpla, cea mai usoara cale este metoda denumita ABC. Astfel trebuie mai nti calculate A, B si C.

A se obtine prin ridicarea la patrat a rezultatelor fiecarui subiect si apoi sumarea lor (indiferent de grupa din care face parte.

B se obtine prin suma rezultatelor tuturor subiectilor (indiferent de grupa), ridicarea sumei la patrat si apoi mpartirea la numarul total de subiecti ai experimentului.

C se obtine prin suma rezultatelor subiectilor din grupa 1, ridicarea la patrat a valorii obtinute urmata apoi de mpartirea la totalul de subiecti ai primei grupe. Procedeul se repeta pentru toate grupele experimentului, n final are loc adunarea tuturor rezultatelor partiale. niante de a prezenta un tabel ANOVA trebuie prezentati ctiva termeni noi. Suma patratelor (SS) este suma abaterilor standard. Media patratica (MS) este expresia ANOVA a dispersiei esantionului.

Media mare este media tuturor rezultatelor fara a tine cont de diferentele dintre grupe. Se obisnuieste ca orice tabel ANOVA sa fie prezentat n felul urmator:
Dispersia Intergrup Intragrup Totala SS C-B A-C A-B df k-1 MS (C-B) / (k-1) F MS1/MS2

N-k (A-C) / (N-k) N-1

Nota: X- rezultatul unui subiect; N- numarul total de subiecti din experiment; k- numarul de grupe; SS- suma patratelor; df- numarul de grade de libertate; MS- media patratica F raportul ANOVA. Calculnd A, B si C pentru problema de fata obtinem: A = 514+263+102= 879; B = (50+35+20) totul la patrat / 15= 735 C = (50) la patrat / 5 + (35) la patrat / 5 + (20) la patrat / 5 = 825. Ca urmare tabele ANOVA pentru problema de fata va arata astfel:
Dispersia Intergrup Intragrup SS 90 54 df 2 12 MS 45 4,5 F 10,00

Totala

144

14

Interesul major n acest tabel l reprezinta valoarea lui F. Aceasta vine raportata la tabelul lui F pentru nivelele de semnificatie de .05 sau .01. Tabelul lui F se utilizeaza putin diferit de cel al lui t. Se observa ca raportul F este obtinut prin mpartirea Mediei patratice (MS) intergrup la media patratica (MS) intragrup. Fiecarei medii patratice i corespunde anumite grade de libertate. n cazul problemei date, se observa citind din tabelul sumar ANOVA ca MS intergrup are 2 df (doua grade de libertate), iar MS intragrup are 12 df. n tabelul lui F se citeste valoarea corespunzatoare gradelor de libertate pentru intergrup (pe coloana a doua deoarece df=2) si pentru intragrup (df=12, deci linia 12). Vom observa doua valori trecute la intersectia coloanei 2 cu linia 12 (3,88 pentru un p<.05 si 6,93 pentru un p<.01). Comparnd valoarea lui F obtinuta de noi (F=10) cu valoarile trecute n tabel n functie pragul de semnificatie ales pentru a respinge ipoteza nula (3,88 pentru un p<.05 si 6,93 pentru un p<.01) observam ca F obtinut este mai mare dect valoarea lui F tabelar. Aceasta nseamna ca raportul F obtinut este semnificativ statistic, ipoteza nula este respinsa, deci exista diferente ntre mediile celor trei grupe. Matematic rezultatul obtinut se scrie sub forma: F (2,12) = 10,00, p<.05 (se citeste "F cu 2 si 12 grade de libertate are valoarea 10 si este semnificativ la nivelul de .05". Respingerea ipotezei nule ne arata doar ca cele trei grupe nu sunt egale n ce priveste media rezultatelor variabilei dependente. Cu toate acestea, nu stim cum difera cele trei grupe ntre ele, daca spre exemplu, doar grupa 1 difera de grupele 2 si 3 sau daca toate difera semnificativ s.a.m.d. Pentru a depasi acest impas, prima solutie ar fi realizarea de teste t ntre grupele 1 si 2, 2 si 3 sau 1 si 3. n aceasta situatie reapare problema enuntata anterior privind . De aceea sunt necesare alte solutii care poarta numele de comparatii post hoc, efectuate dupa gasirea unui raport F semnificativ. De asemenea, pot fi utilizate si comparatii planificate pentru a testa diferentele ntre grupele de subiecti, nainte de efectuarea experimentului.

OBSERVATIE: Desi n problema data numarul de subiecti din fiecare grupa a fost egal, n aplicare testului ANOVA simpla numarul de subiecti din grupe poate sa nu fie egal cu conditia respectarii unei dispersii omogene n grupe. Omogenitatea dispersiei o masura a asocierii Respingerea ipotezei nule arata ca exista o diferenta semnificativa ntre medii. n cazul unor esantioane mari acest rezultat poate fi lipsit de aplicativitate. Situatia poate fi similara unui coeficient de corelatie r=.15 semnificativ statistic la un esantion mare nsa relatia dintre cele doua variabile (r=.15) arata o slaba asociere. O masura a marimii asocierii ntre variabila independenta si cea dependenta n cazul ANOVA este omogenitatea dispersiei ( omega patrat). Ea indica proportia din dispersia variabilei dependente care poate fi pusa pe seama variatiei variabilei independente. Masura este similara coeficientului de determinare (r) discutat n cadrul studiului corelational. Formula lui omega patrat propusa de Hays (1981) este:

nlocuind n formula datele problemei obtinem:

Formulnd o concluzie asupra datelor statistice, putem spune ca treptele diferite ale variabilei independente: terapia asertiva (terapie individuala, de grup, control) influenteaza semnificativ evolutia stimei de sine. F(2, 12)= 10,00, p<.05 si raspund de o proportie nsemnata din dispersie (omega patrat = 54,5%). O alta formula simpla de calcul a lui omega patrat a fost data de Tolson (1980).

Unde N este totalul subiectilor din experiment, iar k numarul de grupe formate.

Exista cteva precautii n utilizarea lui omega patrat. Cea mai importanta dintre ele se refera la utilizarea acestei masuri n conditiile n care variabila independenta a fost atent mpartita n trepte ct mai egale posibil. Grupele realizate pe baza unor variabile cantitative ar trebui sa pastreze o distanta egala ntre ele. Unitatile egale de tip (2 ore, 4 ore, 6 ore) conduc la utilizarea lui omega patrat fara nici o problema. n cazul unitatilor inegale de tip (2 ore, 5 ore, 15 ore) nu este indicata calcularea omogenitatii dispersiei. Grupele realizate pe baza unei variabile independente nominale (calitative) ar trebui sa pastreze aceasta conditie dintr-o perspectiva teoretica ct mai mult posibil. n cazul problemei noastre, cele trei trepte (tratament individual, colectiv si control) nu sunt egale din perspectiva teoretica (distanta dintre tratamentul individual si cel colectiv fiind mai mica dect cea dintre nontratament si oricare din grupele experimentale). Drept consecinta, calcularea lui omega patrat nu este recomandata, fiind realizata mai sus doar n scop pur didactic. O alta precautie a utilizarii lui omega patrat este aceea a modificarii valorii sale n functie de treptele variabilei independente. n cazul amintit (2 ore, 4 ore, 6 ore) calcularea lui omega patrat va conduce la un rezultat diferit daca ar fi fost utilizate (3 ore, 6 ore si 9 ore). n ciuda acestor neajunsuri, n situatia n care sunt respectate n mare conditiile amintite, omogenitatea dispersiei ne ofera informatii importante si merita calculat. Este n mod special util n cazurile n care obtinem un F semnificativ, foarte mare si are rolul de a tempera concluziile primare. Se poate obtine un omega patrat modest, chiar n situatiile n care raportul F ANOVA a iesit foarte mare. n acest caz, omogenitatea dispersiei va arata mai exact n ce masura variabila independenta este responsabila (influenteaza) dispersia variabilei dependente.

Marimea efectului
Daca n capitolul referitor la testele t indexul marimii efectului a fost notat cu d, n cazul ANOVA se noteaza cu f. Formula de calcul a lui f este:

N este numarul total de subiecti cuprinsi n experiment. nlocuind simbolurile cu datele problemei referitoare la efectul terapiei asertive asupra stimei de sine la deficientii mintali obtinem:

OBSERVATIE: Aceasta formula este valida numai n situatia n care numarul de subiecti din fiecare grupa este egal. Pentru situatia ANOVA factorial, MS intergrup devine MS tratament (factor), iar MS intragrup devine MS eroare (intracelula). Urmatorul pas, consta n interpretarea valorii gasite. Cohen (1992) propune urmatoarele valori ale lui f: Efect slab f =.10 Efect mediu f =.25 Efect mare f =.40 Valoarea obtinuta de noi arata un efect foarte puternic, cea ce nseamna o influenta puternica a variabilei independente asupra celei dependente. Totusi, datele problemei sunt artificiale si servesc doar ca exemplu de rezolvare pentru ANOVA simpla.

ANOVA cu masuratori repetate


Daca ANOVA simpla era n analogie cu testul t independent, ANOVA cu masuratori repetate este n corespondenta cu testul t dependent. Termenul masuratori repetate implica evaluarea unui individ de doua sau mai multe ori n ce priveste variabila dependenta. n aceasta situatie, suma patratelor totala si implicit dispersia totala sunt mpartite n trei componente: dispersia dintre indivizi; dispersia datorata variabilei independente; si dispersia reziduala.

Voi prezenta n continuare tabelul sumar pentru ANOVA cu masuratori repetate necesar n vederea aflarii lui F.
Sursa dispersiei Individuala V.independenta Reziduala Total SS C-B D-B df n-1 k-1 MS SS/df SS/df SS/df F F

(A-B)-[(C-B)+ (k-1)(n-1) (D-B)] N-1

Unde: n este numarul de subiecti a unei grupe; N numarul de subiecti din experiment, iar k este numarul de repetari a testarii. F se obtine facnd raportul ntre MS independent si MS rezidual. Mai trebuie facute cteva precizari: SS individual = C-B; SS independent (adevarat, tratament) = D-B; SS rezidual = (A-B)-[(C-B)+(D-B)]; SS total = A-B Trebuie mai nti calculate A, B si C.

A se obtine prin ridicarea la patrat a rezultatelor fiecarui subiect si apoi sumarea lor (indiferent de grupa din care face parte.

B se obtine prin sumarea rezultatelor tuturor subiectilor (indiferent de grupa), ridicarea sumei la patrat si apoi mpartirea la numarul total de subiecti ai experimentului.

C se obtine prin sumarea rezultatelor obtinute de primul subiect pe parcursul tuturor evaluarilor (k). Procedura se repeta si pentru ceilalti subiecti supusi experimentului. Aceste rezultate partiale se aduna, iar valoarea rezultata se mparte la totalul de evaluari la care este supus un subiect.

D se obtine prin sumarea rezultatelor subiectilor din grupa 1, ridicarea la patrat a valorii obtinute. Procedeul se repeta si pentru celelalte grupe, iar rezultatele partiale obtinute se aduna, suma obtinuta se mparte n final la numarul de subiecti cuprinsi ntr-o grupa. Unde: k reprezinta numarul de evaluari, implicit de grupe; N numarul de subiecti dintr-o grupa. Pentru a usura ntelegerea tehnicii ANOVA unifactoriala cu masuratori repetate vom oferi spre rezolvare urmatoarea problema. Exemplu: Un cercetator este interesat sa observe n ce masura interactiunile sociale ale populatiei cu persoane apartinnd etniei rroma vor reduce atitudinea refractara fata de acestia si vor elimina prejudecatile. Drept urmare, sase subiecti sunt pusi sa interactioneze zilnic cu un grup de alti sase minoritari rroma, n vederea realizarii unui proiect comun timp de doua luni de zile. Subiectilor li se aplica un chestionar validat de masurare a atitudinii fata de rromi, realizat n vederea depistarii impresiei populatiei majoritare asupra rromilor, pe o axa acceptare-respingere. Scorurile mari arata un nivel crescut de acceptare. Subiectii sunt testati de patru ori: nainte de nceperea experimentului; la o luna dupa declansarea proiectului comun, la finalizarea proiectului (dupa nca o luna); si la o luna dupa terminarea proiectului. Cum a influentat trecerea unui anumit interval de timp atitudinea fata de etnia rroma?

Ipoteza pe care o lanseaza cercetatorul este: persoanele cu ct interactioneaza mai frecvent cu cei din etnia rroma, cu att vor avea o atitudine mai toleranta fata de acestia. Ipoteza nula a cercetarii este: M1 = M2 = M3 = M4 Rezultatele celor sase subiecti la cele patru testari sunt trecute n tabelul de mai jos:
S nainte x 1 2 3 4 5 6 M 6 8 5 7 4 9 39 6,5 x 36 64 25 49 16 81 271 Dupa 1 luna x 9 10 6 9 8 6 48 8,0 x 81 100 36 81 64 36 398 Dupa 2 luni x 12 14 10 9 10 11 66 11,0 x 144 196 100 81 100 121 742 Dupa 3 luni x 11 15 11 10 9 10 66 11,0 x 121 225 121 100 81 100 748

Calculam mai nti valorile A, B, C si D: A = 271 + 398 + 742 + 748 = 2159 B = (39 + 48 + 66 + 66) la patrat / 24 = 1998,375 C = [(6 + 9 + 12 + 11) + (8 + 10 + 14 + 15) + (5 + 6 +10 + 11) + (7 + 9 + 9 + 10) + (4 + 8 + 10 + 9) + (9 + 6 + 11 + 10)] / 4 = 2039,75 D = (39 + 48 + 66 + 66) / 6 = 2089,5. Urmatorul pas este calcularea sumei patratelor: SS individual = C B = 2039,75 1998,375 = 41,375 SS adevarata (experiment) = DB = 2089,5 1998,375 = 91,125

SS reziduala = (A-B)-(C-B)+(D-B)=(2159 1998,375) [(2039,75 1998,375)+(2089,5 1998,375)] = 28,125 SS totala = A B = 2159 1998,375 = 160,625. Sa nu uitam ca: SS totala = SS individual+SS experiment+SS rezidual Al treilea pas consta n calcularea gradelor de libertate: df individual = n 1 = 6 1 = 5. df experimental = k 1 = 4 1 = 3. df rezidual = (k 1)(n 1) = (6 1)(4 1) = 15. df totala = N 1 = 24 1 = 23. Penultimul pas pentru a constitui tabelul ANOVA necesita calcularea mediei patratice (MS): MS individual = SS individual / df individual = 41,375 / 5 = 8,275. MS experimental = SS experimental / df experimental = 91,125 / 3 = 30,375. MS rezidual = SS rezidual / df rezidual = 28,125 / 15 = 1,875. Ultimul pas consta n calcularea raportului lui F n cazul ANOVA cu masuratori repetate: F = MS experimental / MS rezidual; F = 30,375 / 1,875 = 16,2. Iata tabelul sumar ANOVA masuratori repetate n cazul problemei date:
Sursa dispersiei Individuala Experiment SS 41,375 91,125 df 5 3 MS 8,275 30,375 16,2 3,29* F F,p<.05

Reziduala Totala

28,125 160,625

15 23

1,875

Dupa calcularea lui F se compara valoarea gasita cu cea prezenta n tabelul lui F. Se observa ca valoarea obtinuta F = 16,2 este mai mare dect cea prezenta n tabelul lui F la un prag de .05, pentru 3 si 15 grade de libertate (F = 3,29). Ca urmare ipoteza nula este respinsa, constatndu-se diferente semnificative n ce priveste mediile celor patru serii de evaluari. Matematic rezultatul obtinut se scrie: F (3, 15) = 16,2, p<.05. Orice test parametric necesita ndeplinirea mai multor conditii pentru a putea fi utilizat. Voi prezenta n continuare conditiile necesare pentru a putea aplica ANOVA simpla si ANOVA cu masuratori repetate. Asumptii ale tehnicii ANOVA simpla: 1. Esantionul a fost selectat randomizat din populatie. n cazul n care acest fapt este greu de realizat se recomanda ca masura compensatorie randomizarea subiectilor n grupele experimentale. 2. Variabila dependenta este distribuita normal. Aceasta conditie este greu de demonstrat n conditiile n care mare parte din cercetarile care utilizeaza ANOVA se realizeaza cu un numar mic de subiecti. ncalcarea acestei conditii are nsa efecte reduse asupra erorii de tip 3. Dispersia subiectilor mpartiti pe grupe de tratament diferite sa fie egala. Exista coeficienti special construiti pentru a observa n ce masura este realizata aceasta omogenitate a dispersiei. Testul ANOVA este o tehnica robusta, rezistenta la violarile prezentate (n special a primelor doua). Numai n cazuri deosebite n care exista violari majore a acestor conditii si mai ales a existentei unor dispersii inegale si a unor grupe de subiecti inegale se recomanda sa se renunte la testul ANOVA n favoarea utilizarii unor tehnici neparametrice. Asumptiile testului ANOVA cu masuratori repetate Primele trei conditii sunt identice. La acestea se adauga o conditie suplimentara:

4. Coeficientii de corelatie ntre diferitele evaluari repetate sa fie aproximativ egali. Daca omogenitatea dispersiei si egalitatea aproximativa a coeficientilor de corelatie sunt ncalcate, eroarea de tip I poate fi afectata. Totusi, se poate continua aplicarea tehnicii parametrice daca se procedeaza la aplicarea unei corectii prealabile referitoare la gradele de libertate. Valoarea lui F obtinuta va fi comparata cu valoarea prezenta n tabelul lui F pentru (1 si n-1 grade de libertate) si nu pentru k-1 si (n-1)(k-1) grade de libertate ca n situatia n care aceste conditii erau ndeplinite.

ANOVA factoriala
Pna n prezent am discutat cazurile de ANOVA n care era prezenta o singura variabila independenta cu mai multe trepte si o singura variabila dependenta, celelate variabile fiind controlate. Noi putem nsa manipula mai mult dect o singura variabila independenta. n acest caz de analiza dispersionala, ANOVA factorial, este vorba de studiul influentei simultane a doua sau mai multe variabile independente asupra unei variabile dependente. Exista mai multe avantaje n utilizarea unui design experimental factorial. Un prim cstig este eficienta studiului, deoarece doua sau mai multe variabile independente sunt analizate simultan si sunt extrase informatii referitoare att despre fiecare factor n parte, ct si despre interactiunea dintre acestia si influenta lor asupra variabilei independente. Din aceasta perspectiva, ANOVA factorial conduce la calculul a trei teste statistice F. Doua dintre ele se realizeaza pentru a gasi efectele principale (efectul principal al variabilei A si efectul principal al variabilei B), iar cel de-al treilea test masoara efectul interactiunii AB asupra variabilei dependente. Efectele principale sunt analoage dispersiei intergrup din ANOVA simpla, iar testul interactiunii (simbolizat AB) ne arata daca rezultatele obtinute la diferite nivele ale variabilei A sunt dependente de nivelul factorului B si viceversa. n cele ce urmeaza ne vom opri doar asupra testului ANOVA bifactorial (2 variabile independente cu mai multe trepte fiecare), fiind nsa posibile si experimente care necesita mai mult de doi factori (variabile independente). Algoritmul de rezolvare a acestor situatii este asemanator cu ANOVA bifactorial, dar este prea complicat de calculat manual.

Orice ANOVA factorial are specificat designul experimental realizat, sub forma unor cifre. Un design factorial cu doua variabile, fiecare avnd cte trei trepte va fi notat, ANOVA 3x3, un altul n care prima variabila are doua trepte, iar cea de a doua cinci, va fi simbolizata ANOVA 2x5. Un design factorial (cu trei variabile independente), n care primele doua variabile au cte 3 trepte, iar cea de-a treia doar doua, va fi notat ANOVA 3x3x2 s.a. Voi prezenta n continuare forma grafica a unui design experimental bifactorial, n care cele doua variabile independente au cte trei trepte.
B1 A1 A2 A3 A1B1 A2B1 A3B1 B2 A1B2 A2B2 A3B2 B3 A1B3 A2B3 A3B3 Medie A1 Medie A2 Medie A3

Medie B1 Medie B2 Medie B3

Dupa cum se observa, din combinarea celor doi factori fiecare cu trei trepte, se obtin noua situatii experimentale diferite. Acestea poarta numele de celule. Daca n cazul ANOVA simpla dispersia totala era suma dispersiei intergrup cu dispersia intragrup, n cazul ANOVA factoriala exista patru surse ale dispersiei totale, si anume: dispersia intracelula (echivalenta cu dispersia intragrup); dispersia de-a lungul mediei liniilor; dispersia de-a lungul mediei coloanelor si dispersia datorata interactiunii dintre cele doua variabile independente, suma ultimeler trei fiind echivalentul dispersiei intergrup. Din aceasta cauza sunt testate trei ipoteze nule n cazul ANOVA bifactorial. Primele doua se refera la efectul variabilelor independente luate separat (media fiecarei linii este egala, respectiv media fiecarei coloane este egala), iar cea dea treia se refera la interactiune. Pornind de la aceste coordonate voi prezenta tabelul sumar pentru ANOVA factorial.
Sursa disp. Lin.-factorA SS C-B df l-1 MS SS/df F F

Col.-factorB Interactiune Intracelule Total

D-B (E-B)-(C-B)(D-B) (A-E)-(E-B) A-B

c-1 (l-1)(c-1) (N-1)-rest N-1

SS/df SS/df SS/df

F F

Unde: l este numarul de linii (treptele variabilei A); c este numarul de coloane (treptele variabilei B), iar gradele de libertate (df) pentru intracelule se calculeaza scaznd din df total celelalte grade de libertate (linii, coloane, interactiune). Utiliznd aceasta metoda ABC n calcularea celor trei F pentru ANOVA factorial este necesar mai nti sa calculam A, B, C, D si E.

A se obtine prin ridicarea la patrat a rezultatelor fiecarui subiect si apoi sumarea lor (indiferent de celula din care face parte.

B se obtine prin sumarea rezultatelor tuturor subiectilor (indiferent de grupa), ridicarea sumei la patrat si apoi mpartirea la numarul total de subiecti ai experimentului.

C se obtine prin sumarea rezultatelor obtinute de subiectii prezenti pe linia nti, rezultatul obtinut fiind ridicat la patrat. Procedura se repeta si pentru celelalte linii. Aceste rezultate partiale se aduna, valoarea rezultata se mparte la totalul de subiecti ai unei linii, indiferent de coloane.

D se obtine prin sumarea rezultatelor subiectilor din coloana 1 si apoi ridicarea la patrat a valorii obtinute. Procedeul se repeta si pentru celelalte coloane, iar rezultatele partiale obtinute se aduna iar suma se mparte la numarul de subiecti cuprinsi ntr-o coloana, indiferent de linie.

E se obtine prin sumarea rezultatelor subiectilor din celula nti si apoi ridicarea la patrat a sumei obtinute. Procedeul se repeta pentru toate celulele designului factorial, iar rezultatele partiale obtinute se nsumeaza. Rezultatul obtinut se mparte la numarul de subiecti dintr-o celula. OBSERVATIE: Formulele date sunt aplicabile si n situatia n care celulele nu au un numar egal de subiecti, cu conditia sa nu varieze foarte mult sau sa fie proportionali. n acele situatii calculul lui C, D si E se diferentiaza nlocuind numitorul cu numarul de subiecti pentru fiecare linie, coloana sau celula n parte. De pilda, E se va calcula astfel:

Pentru a concretiza elementele teoretice prezentate n cadrul ANOVA factoriala, voi oferi drept exemplu model rezolvarea unei probleme care necesita aplicarea ANOVA factorial. Pornind de la experimentele care au aratat ca memoria are o natura reconstructiva, un cercetator doreste sa studieze n ce masura relatarile martorilor oculari sunt influentate de ntrebarile adresate si de experienta subiectilor fata de situatia n cauza, pentru a stabili gradul de ncredere n depozitiile martorilor. n experiment, cercetatorul propune subiectilor sa vizioneze un film despre un accident de circulatie. Dupa vizionare le cere subiectilor sa estimeze viteza cu care rulau masinile n momentul accidentului (variabila dependenta). El este interesat de influenta a doua variabile independente. O prima variabila este data de manipularea experimentatorului. Astfel, el cere unui grup sa estimeze viteza cu care s-au "zdrobit" masinile; unui al doilea grup

i s-a cerut acelasi lucru, dar foloseste expresia "s-au lovit", iar n a treia situatie subiectii au fost ntrebati "ce viteza" aveau masinile n momentul accidentului. Cea de a doua variabila independenta luata n calcul a fost experienta subiectiilor care a avut doua trepte: soferi si ne-soferi. Avem asadar un model de ANOVA factorial de tip 3x2 (trei linii si doua coloane). Ipoteza cercetatorului este: relatarile subiectilor sunt influentate att de expresiile utilizate (ntrebarile anchetatorului) ct si de experienta subiectilor n situatia descrisa, n sensul ca subiectii soferi pot estima mai bine dect nesoferii viteza de deplasare a masinii. A = 41706; B = 1080 la patrat / 30 = 38880; C = (447 la patrat + 321 la patrat + 312 la patrat) / 10 = 40019,4; D = (513 la patrat + 567 la patrat) / 15 = 38977,2; E = (189 la patrat + 258 la patrat + 174 la patrat + 147 la patrat + 150 la patrat + 162 la patrat) / 5 = 40582,8 Dupa calcularea lui A, B, C, D si E cu ajutorul datelor din tabel, vom calcula suma patratelor pentru fiecare situatie. SS linii (factorul A) = C-B = 40019,4-38880 = 1139,4 SS coloane (factorul B) = D-B = 38977,2-38880 = 97,2 SS linii x coloane (interactiune) = (E-B)-(C-B)-(D-B) = (40582,8-38880)(40019,4-38880)-(38977,2-38880) = 466,2 SS intracelula = (A-B)-(E-B) = (41706-38880)-(40582,8-38880) = 1123,2 SS total = A-B = 41706-38880 = 2826
B1 Soferi A1 X Zdrobit 51 2601 63 3969 X X X B2 Nesoferi

A1(linie)= 189+258= 447

45 39 30 24 Media A2 Lovit 39 33 33 27 Media A3 Accident 33 30 27 27 Media 150 174 34,8 33 189 37,8 42

2025 1521 900 576 7623

57 51 48 39 258 51,6

3249 2601 2304 1521 13644 A1=7623+13644= 21267 Media lui 1296 900 900 729 576 4401 (linie)A3 = 150+162= 312 A3 = 4536+5310 = 9846 Media lui A3 = 31,2 A2(linie)= A1 = 44,7 174+147= 321 A2 =6192 +4401= 10593 Media lui A2 = 32,1

1764 1521 1089 1089 729 6192

36 30 30 27 24 147 29,4

1089 1089 900 729 729 4536

36 33 36 30 27 162

1296 1089 1296 900 729 5310

30 32,4 B1=189+174+150=513 B2=258+147+162=567 Xtot.=1080 B1=7623+ 6192+4536 B2=13644 = 18351 +4401+5310 = 23355 Xtotal = 41706 Media lui X total = 36

Media B1= 34,2

Media B2= 37,8

De asemenea putem stabili gradele de libertate: df linii = numarul de linii(l) 1 = 3-1 = 2 df coloane = numarul de coloane(c) 1 = 2-1 =1 df interactiune = (l-1)(c-1) = (3-1)(2-1) = 2 df total = Numarul total de subiecti (N) 1 = 30-1 = 29 df intracelula = df total df linii df coloane df interactiune = 29-2-1-2 = 24 Avnd calculate att suma patratelor (SS) ct si gradele de libertate (df) putem calcula media patratica pentru aceste elemente: MS linii (A) = SS linii / df linii = 1139,4 / 2 = 569,7 MS coloane (B) = SS coloane / df coloane = 97,2 / 1 = 97,2 MS linii x coloane (interactiune - AB) = SS linii x coloane / df linii x coloane = 466,2 / 2 = 233,1 MS intracelula (eroare) = SS intracelula / df intracelula = 1123,2 / 24 = 46,8. Ultimul pas ramas de facut este calcularea celor trei F: FA = MS linii / MS intracelula = 569,7 / 46,8 = 12,17 FB = MS coloane / MS intracelula = 97,2 / 46,8 = 2,07 FC = MS interactiune / MS intracelula = 233,1 / 46,8 = 4,98 Tabelul sumar ANOVA 3x2 al problemei este:
Sursa dispersiei Linii (A) Coloane (B) SS 1139,4 97,2 df 2 1 MS F Prag p

569,7 12,17 (2,24) <.01 97,2 2,07 (1,24) >.05

Interactiune Intracelula Totala

466,2 1123,2 2826

2 24 29

233,1 46,8

4,98 (2,24)

<.05

Asadar, se observa ca din cele trei raporturi F, doua sunt semnificative statistic F linii (determinat de factorul A) si F interactiune (determinat de actiunea comuna a factorilor A si B). Se obisnuieste sa se reprezinte grafic influenta factorilor A si B si a interactiunii lor asupra variabilei dependente. Pe abscisa este trecuta una din variabilele independente (ntr-un mod arbitrar), n timp ce pe ordonata sunt trecute valorile variabilei dependente. Vom prezenta un grafic ilustrativ utiliznd datele problemei de fata.

Doua variabile independente care nu interactioneaza au o reprezentare grafica de tip paralel: Dupa cum se observa n problema de fata, variabilele interactioneaza ntre ele, cele doua linii intersectndu-se chiar n doua locuri. Asa cum am observat si n cazul precedentelor teste ANOVA se poate calcula omega patrat ca masura a asocierii ntre variabilele independente si cele dependente. Existnd trei raporturi F, se pot calcula trei omogenitati ale dispersiei (pentru dispersia liniilor, data de influenta factorului A asupra variabilei dependente; pentru dispersia coloanelor, data de influenta factorului B; si pentru dispersia interactiunii data de actiunea comuna a factorilor A si B asupra variabilei dependente).

Formulele de calcul a lui omega patrat sunt: Pentru omega linii (factorul A):

Pentru omega coloane (factorul B):

Pentru omega interactiune (factorii AB):

Trebuie amintit ca aceste tehnici omega sunt utilizate doar n conditiile n care raporturile F sunt semnificative statistic. Pentru problema de fata, doar F linii (factorul A) si F interactiune (factorii A si B) au fost semnificativi si au respins ipoteza nula. Ca urmare, n problema data vor fi calculati doar doi coeficienti omega patrat.

Datele indica ca aproximativ 36,4% din dispersia estimarii vitezei automobilelor n momentul accidentului se datoreaza manipularii afirmatiilor experimentatorului, iar 12,9% poate fi atribuita interactiunii dintre cele doua variabile (estimarea vitezei depinde de interactiunea data de exprimarea cercetatorului si experienta subiectilor ca si conducatori auto). Raporturile F stabilite n cazul ANOVA simpla, sau ANOVA cu masuratori repetate, dar si n cazul ANOVA factorial sunt denumite si teste omnibus. De la ele se porneste apoi spre analize aprofundate de comparare a datelor. Aceste analize pot avea loc att nainte de realizarea experimentului (comaparatii a

priori) ct si dupa gasirea unui F semnificativ (comparatii post-hoc). Asemenea tehnici comparative vor fi prezentate n capitolul urmator. Asumptiile testului ANOVA factorial: Primele trei asumptii prezentate n cazul celorlalte teste ANOVA ramn valide. La acestea se adauga altele doua: 4.Celulele trebuie sa fie independente. Aceasta nseamna ca formulele prezentate n cazul ANOVA factorial sunt valabile n cazul esantioanelor independente si sunt inadecvate n studiul esantioanelor corelate (dependente). Exista alte solutii pentru ANOVA factorial cu masuratori repetate, care nsa nu sunt prezentate n aceast caiet. 5.Treptele ambilor factori sunt alese de experimentator (design factorial fix). Daca treptele sunt alese randomizat din mai multe posibilitati formulele prezentate n acest capitol nu se aplica. PROBLEME 1. Pornind de la ideile behavioristilor, se doreste sa se vada care este efectul diferitelor tehnici comportamentale n tratarea fricii de persoanele decedate la 48 de persoane voluntare cuprinse n studiu. Acestea au fost mpartite n mod aleator n 4 grupe. Grupa repartizata tehnicii in vivo a petrecut n singuratatea unui cimitir izolat o ora. O alta grupa a vizionat un film pe aceasta tema. Grupa a treia a vizionat acelasi film, dar n timpul prezentarii a fost pusa muzica relaxanta, calmanta. Ultima grupa a fost de control. Eficienta tratamentului a fost apoi evaluata printr-o scala specifica, unde rezultatele mici nseamna o frica mai redusa. Iata rezultatele celor patru grupe:
Gr.1 5 4 3 7 6 Gr.2 8 7 6 8 9 Gr.3 6 7 5 6 7 Gr.4 11 8 9 10 10 Gr.1 6 5 4 5 7 Gr.2 7 8 6 8 7 Gr.3 7 6 8 7 6 Gr.4 10 11 12 10 9

11

a. b. c. d. e. f. g.

Stabiliti numarul de grade de libertate pentru F; Stabiliti daca valoarea lui F este semnificativa statistic; Interpretati rezultatele gasite; Calculati omogenitatea dispersiei daca este cazul si marimea efectului; Interpretati valorile gasite; Reprezentati grafic valorile medii pentru fiecare grupa; Utiliznd informatiile din capitolul urmator dedicat tehnicilor de comparatie multipla post-hoc, stabiliti care grupe sunt semnificativ diferite de celelalte. Folosti toate tehnicile post-hoc adecvate. h. Stabiliti daca putem infirma ipoteza nula conform careia: (Gr.1 + Gr2 +Gr.3) / 3 = Gr.4 2.Stabiliti grafic designul factorial pentru cazurile: a. Patru tipuri de scolarizare pentru trei categorii de deficiente: severe, medii, minore. b. Trei tipuri de ADHD: impulsivi, hiperactivi si atentionali fata de doua tipuri de tratament si o grupa de control. 3. Unii cercetatori au stabilit ca sexul si lateralitatea cerebrala influenteaza vrsta la care intervine decesul unei persoane.
Barbati B1 Dominanta stnga 87 A1 79 75 67 Neutru 75 A2 65 70 66 Dominanta dreapta 68 64 70 69 71 67 65 66 70 72 65 62 71 66 68 67 64 71 74 86 76 69 75 69 70 75 74 80 Femei B2

A3

62 60 67

68 65 61

67 72 65

70 69 68

a. b. c. d.

Identificati care sunt variabilele independente si cele dependente; Calculati SStot, SSA, SSB, SSAB, si SSeroare; Stabiliti si interpretati valoarea lui F pentru fiecare situatie; Calculati omogenitatea dispersiei daca este cazul si marimea efectului pentru fiecare factor si interactiune; e. Reprezentati grafic valorile medii ale vrstei de deces; f. Calculati efectele simple daca este cazul, daca nu utilizati o alta metoda post hoc. 4. Analizati datele unui studiu longitudinal desfasurat pe o perioada de 1 an si jumatate, timp n care au avut loc patru testari, imediat dupa (0 luni), la sase luni de la terminarea programului (6 luni de la prima testare), la un an de la terminarea programului (12 luni) si la 18 luni de la finalizarea programului(18 luni). Programul n cauza a fost un pachet psiho-educational destinat reducerii absenteismului din 10 scoli. Iata rezultatele obtinute:
0 luni 23 13 20 17 19 21 22 18 17 19 6 luni 20 21 18 17 16 18 19 15 18 17 12 luni 20 17 16 14 14 15 16 14 17 13 18 luni 21 17 15 13 17 16 16 14 15 14

a. Stabiliti numarul de grade de libertate pentru F; b. Construiti tabelul sumar ANOVA; c. Stabiliti daca valoarea lui F este semnificativa statistic. Interpretati rezultatele gasite; d. Calculati omogenitatea dispersiei daca este cazul si marimea efectului. Interpretati valorile gasite; e. Reprezentati grafic valorile medii pentru fiecare grupa;

f. Utiliznd informatiile din capitolul urmator dedicat tehnicilor de comparatie multipla post-hoc, stabiliti care grupe sunt semnificativ diferite de celelalte. Folosti toate tehnicile post-hoc adecvate. g. Analizati contrastele pentru problema data daca: Ho1: M1 = M4; Ho2: M2 = M3; Ho3: M1+M4 = M2+M3 h. Realizati o analiza directionala pentru problema de fata si interpretati rezultatele obtinute.

http://www.scribd.com/doc/49804862/Statistica-aplicata-in-psihologie-DumitruGheorghiu http://www.scribd.com/doc/123200924/Curs-statistica-in-psihologie foarte important

http://www.scribd.com/doc/119830919/psihologie