Documente Academic
Documente Profesional
Documente Cultură
Analiza multivariat a variaiei cuprinde un grup de metode aparinnd statisticii infereniale (deductive), utilizate mai ales pentru analiza datelor provenite din diferite tipuri de experimente, cu ajutorul crora se poate face separarea i testarea semnificaiei efectelor cauzate de aciunea simultan a mai multor factori. Numeroase tehnici de proiectare a experimentelor permit organizatorilor acestora s controleze variaia mai multor variabile independente (factori) i s estimeze efectele acestei variaii asupra variabilelor dependente msurate n scal metric. Numele de analiz a variaiei s-ar putea s conduc la impresia greit c aceste tehnici s-ar putea folosi pentru testarea diferenelor ntre dispersiile factorilor, nu ntre mediile acestora, aa cum se ntmpl de fapt. Printre cele mai cunoscute metode cu ajutorul crora se poate realiza analiza multivariat a variaiei se pot meniona: proiectrile factoriale, ptratele latine, ptratele greco-latine. Indiferent de metoda folosit pentru analiza variaiei, datele trebuie s ndeplineasc anumite cerine. n primul rnd, se presupune c datele culese provin de la grupuri experimentale a cror constituire din rndul unor populaii statistice alctuite conform repartiiei normale s-a fcut dup principii aleatoare. Mai precis, trebuie depuse eforturi pentru ca att selecia unitilor experimentale ct i aplicarea tratamentelor experimentale s aib la baz selecia aleatoare. n al doilea rnd, se face presupunerea c setul de date utilizate pentru a calcula variaia aleatoare (eroarea experimental) prezint aceleai posibiliti de a fi afectate de variaia aleatoare ntruct are o abatere standard (i deci o variaie) constant. A treia presupunere consider c variaia aleatoare este independent de la o observaie la alta. n al patrulea rnd, se presupune c efectele diferitelor surse ale variaiei (efectele factorilor experimentali, efectele de interaciune ntre factori i eroarea experimental) sunt aditive i nu multiplicative. Dac acest lucru nu ar fi adevrat, tehnicile utilizate pentru descompunerea variaiei totale n componentele ei nu ar mai fi valide. 1
n al cincilea rnd, categoriile variabilelor independente se presupune c sunt fixe. Exist ns i modele de analiz aplicabile unor definiri aleatoare a categoriilor (de regul construite ca subeantioane definite aleator).
n sfrit, Cea mai important cerin este ca factorii s fie exprimai n form discret, nu n cea continu.
Analiza variaiei
Analiza variaiei (ANOVA) i analiza covariaiei (ANCOVA) sunt folosite pentru a examina diferenele dintre valorile medii ale variabilei dependente sub efectul unor variabile independente controlate, dup izolarea efectului unor variabile independente necontrolate. n esen, ANOVA este folosit pentru a testa diferenele dintre mediile a dou sau mai multe grupuri (populaii). Mai precis, analiza variaiei testeaz ipoteza nul conform creia nu exist diferene ntre medii (altfel spus, toate mediile ar fi egale ntre ele). n forma cea mai simpl, analiza variaiei necesit o variabil dependent msurat pe o scal metric (interval sau proporional) i una sau mai multe variabile independente msurate pe o scal nemetric (nominal sau ordinal). Aceste variabile independente de tip categorial sunt denumite, de obicei, factori. Modul n care nivelurile (categoriile) factorilor acioneaz asupra variabilei dependente poart denumirea de tratament 1 . Procedurile de analiz a variaiei au la baz acelai principiu dar se difereniaz (i, ca urmare primesc denumirea corespunztoare) prin numrul de factori i numrul de variabile dependente analizate simultan n model. Vom distinge, pe de o parte, situaiile n care este analizat o singur variabil dependent, iar n funcie de numrul de factori putem realiza analiza variaiei cu un factor (one-way analysis of variance) sau analiza variaiei cu nfactori (n-way analysis of variance). Situaiile n care sunt mai multe variabile dependente i mai muli factori analizai simultan sunt cunoscute sub denumirea de analizei multivariat a variaiei (MANOVA). n situaia n care setul de variabile independente conine att variabile nemetrice (categoriale) ct i metrice, tehnica poart denumirea de analiz a covariatiei (ANCOVA). Rolul acestei forme a analizei variaiei este de a izola influena unor variabile independente (metrice) asupra variabilelor dependente pentru a putea evalua efectul factorilor.
1
Malhotra N.K. - Marketing Research: An Applied Orientation, Prentice Hali, EngleWood Cliffs, 1993, p. 522
categoriile variabilei independente. Ea reprezint partea din suma ptratelor aferent variabilei independente; Variaia din interiorul grupurilor (within variation) notat, de obicei cu SSE (sau SSin-interior sau SSeroare) reprezint variaia variabilei dependente datorat variaiei n
interiorul fiecrei categorii a variabilei independente. Aceast variaie nu este generat de variabila independente; Variaia total (total variation): notat, de obicei cu SST (sau SStotal) reprezint variaia variabilei dependente corespunztoare variaiei mediei pe categoriile variabilei independente. Ea reprezint partea din suma ptratelor abaterilor variabilei dependente aferent variabilei independente; Media ptrat (mean square): este suma ptratelor mprit la numrul gradelor de libertate; testul eta (TI2, eta2): msoar efectul variabilei independente asupra celei dependente i arat proporia explicat de prima n variabilitatea celei de a doua. Ia valori ntre 0 i 1; testul F (F statistic): verific ipoteza nul (H0) c dispersiile categoriilor variabilei independente pentru variabila dependent sunt egale; se calculeaz ca raport ntre media ptratelor aferent variabilei independente i media ptratelor aferente erorii.
SST = ( yi y ) 2
i =1
SS X = ( y j y ) 2
j =1
SS E = ( yij yi ) 2
j =1 i =1
y - media la nivelul ntregului eantion yij - valoarea i a variabilei dependente corespunztoare categoriei j a variabilei independente Msurarea efectelor: n aceast etap este determinat efectul factorului asupra variabilei dependente date de SSX. Pentru msurarea acestui efect se folosete testul eta 2 , calculat n modul urmtor:
SS X SST
2 =
Eta2 ia valori ntre 0 i 1. O valoarea apropiat de 0 indic faptul c nu exist diferene ntre medii n timp ce o valoarea apropiat de 1 arat o variabilitate ntre grupuri. Testarea semnificaiei statistice: se realizeaz cu ajutorul testului F prin verificarea ipotezei nul (H0) confom creia dispersiile variabilei dependente n cazul fiecrui grup (categorie) a variabilei independente sunt egale. Indicatorul testului F se calculeaz ca raport ntre variaia pus pe seama variabilei independente i ajustat cu numrul gradelor de libertate aferente (SSx/(k-1)) i variaia corespondent erorii ajustat i ea cu numrul gradelor de libertate diferen (SSE/(n-k)). Interpretarea testului F poate fi fcut absolut, prin compararea cu valorile tabelate sau prin prisma nivelului de semnificaie asociat. Un nivel de semnificaie sub 0,05 (aferent unei probabiliti de peste 95%) permite respingerea ipotezei nule a egalitii dispersiilor.
Neter J., Wasserman W., Kutner M. - Applied Linear Statistical Models, Irwin, Homewood, 2nd edition , 1985
Interpretarea rezultatelor: n situaia n care ipoteza nul a egalitii mediilor grupurilor a fost acceptat, variabila independent nu are un efect semnificativ asupra variabilei dependente. n caz contrar, prin neacceptarea ipotezei nule se poate concluziona c grupurile difer ntre ele din punct de vedere al caracteristicii studiate (variabila dependent) i c variabila independent exercit un efect semnificativ asupra celei dependente. Mergnd mai departe, o comparare a mediilor la nivelul grupurilor va da informaii legate de natura efectului variabilei independente.
baza nivelului de semnificaie i numrului gradelor de libertate). Dac valorile calculate sunt mai mici dect cele tabelare (teoretice), atunci factorul respectiv nu are influen semnificativ asupra procesului analizat; dac valorile calculate sunt mai mari dect cele tabelare (teoretice), atunci factorul respectiv are o influen important asupra procesului.
Analiza covariaiei
De multe ori atunci cnd se analizeaz efectul exercitat de variabilele independente controlate asupra valorilor medii ale unei variabile dependente apare necesitatea de a ine cont i izola influena altor variabile independente. Aceasta se rezolv prin utilizarea analizei covariaiei care include n model, pe lng factorii msurai pe scale nemetrice i cel puin o variabil independent de tip metric, denumit covariant Utilizarea acestui are rolul de a elimina variaiile externe exercitate asupra variabilei dependente. La fel ca i n celelalte cazuri, semnificaia statistic a efectelor variabilelor covariante este testat cu ajutorul testului F. Analiza covariaiei este util atunci cnd ntre variabilele covariante i variabila dependent exist o relaie liniar i cnd acestea nu sunt corelate cu factorii 3 . Analiza covariatiei poate fi utilizata cu o singur alternant, cu mai multe alternante, ca i prin tehnicile multivariate ANOVA.
Wildt A. R., Ahtola O. T., Analysis of Covariance; Beverly Hills, CA, Sage, 1978, p. 48-50.
MANOVA compar grupurile i explic diferenele dintre grupuri. Pentru aceasta MANOVA creeaz un nou rezumat al variabilelor dependente, care este o combinaie liniar a fiecrei variabile dependente iniiale. MANOVA poate fi folosit ntr-un sens, dou sensuri i cu un nivel ridicat de proiectare (cu multiple variabile independente), ca i n analizei covariaiei (controlnd variabilele suplimentare).