Sunteți pe pagina 1din 8

Analiza multivariat a variaiei

Analiza multivariat a variaiei cuprinde un grup de metode aparinnd statisticii infereniale (deductive), utilizate mai ales pentru analiza datelor provenite din diferite tipuri de experimente, cu ajutorul crora se poate face separarea i testarea semnificaiei efectelor cauzate de aciunea simultan a mai multor factori. Numeroase tehnici de proiectare a experimentelor permit organizatorilor acestora s controleze variaia mai multor variabile independente (factori) i s estimeze efectele acestei variaii asupra variabilelor dependente msurate n scal metric. Numele de analiz a variaiei s-ar putea s conduc la impresia greit c aceste tehnici s-ar putea folosi pentru testarea diferenelor ntre dispersiile factorilor, nu ntre mediile acestora, aa cum se ntmpl de fapt. Printre cele mai cunoscute metode cu ajutorul crora se poate realiza analiza multivariat a variaiei se pot meniona: proiectrile factoriale, ptratele latine, ptratele greco-latine. Indiferent de metoda folosit pentru analiza variaiei, datele trebuie s ndeplineasc anumite cerine. n primul rnd, se presupune c datele culese provin de la grupuri experimentale a cror constituire din rndul unor populaii statistice alctuite conform repartiiei normale s-a fcut dup principii aleatoare. Mai precis, trebuie depuse eforturi pentru ca att selecia unitilor experimentale ct i aplicarea tratamentelor experimentale s aib la baz selecia aleatoare. n al doilea rnd, se face presupunerea c setul de date utilizate pentru a calcula variaia aleatoare (eroarea experimental) prezint aceleai posibiliti de a fi afectate de variaia aleatoare ntruct are o abatere standard (i deci o variaie) constant. A treia presupunere consider c variaia aleatoare este independent de la o observaie la alta. n al patrulea rnd, se presupune c efectele diferitelor surse ale variaiei (efectele factorilor experimentali, efectele de interaciune ntre factori i eroarea experimental) sunt aditive i nu multiplicative. Dac acest lucru nu ar fi adevrat, tehnicile utilizate pentru descompunerea variaiei totale n componentele ei nu ar mai fi valide. 1

n al cincilea rnd, categoriile variabilelor independente se presupune c sunt fixe. Exist ns i modele de analiz aplicabile unor definiri aleatoare a categoriilor (de regul construite ca subeantioane definite aleator).

n sfrit, Cea mai important cerin este ca factorii s fie exprimai n form discret, nu n cea continu.

Analiza variaiei
Analiza variaiei (ANOVA) i analiza covariaiei (ANCOVA) sunt folosite pentru a examina diferenele dintre valorile medii ale variabilei dependente sub efectul unor variabile independente controlate, dup izolarea efectului unor variabile independente necontrolate. n esen, ANOVA este folosit pentru a testa diferenele dintre mediile a dou sau mai multe grupuri (populaii). Mai precis, analiza variaiei testeaz ipoteza nul conform creia nu exist diferene ntre medii (altfel spus, toate mediile ar fi egale ntre ele). n forma cea mai simpl, analiza variaiei necesit o variabil dependent msurat pe o scal metric (interval sau proporional) i una sau mai multe variabile independente msurate pe o scal nemetric (nominal sau ordinal). Aceste variabile independente de tip categorial sunt denumite, de obicei, factori. Modul n care nivelurile (categoriile) factorilor acioneaz asupra variabilei dependente poart denumirea de tratament 1 . Procedurile de analiz a variaiei au la baz acelai principiu dar se difereniaz (i, ca urmare primesc denumirea corespunztoare) prin numrul de factori i numrul de variabile dependente analizate simultan n model. Vom distinge, pe de o parte, situaiile n care este analizat o singur variabil dependent, iar n funcie de numrul de factori putem realiza analiza variaiei cu un factor (one-way analysis of variance) sau analiza variaiei cu nfactori (n-way analysis of variance). Situaiile n care sunt mai multe variabile dependente i mai muli factori analizai simultan sunt cunoscute sub denumirea de analizei multivariat a variaiei (MANOVA). n situaia n care setul de variabile independente conine att variabile nemetrice (categoriale) ct i metrice, tehnica poart denumirea de analiz a covariatiei (ANCOVA). Rolul acestei forme a analizei variaiei este de a izola influena unor variabile independente (metrice) asupra variabilelor dependente pentru a putea evalua efectul factorilor.
1

Malhotra N.K. - Marketing Research: An Applied Orientation, Prentice Hali, EngleWood Cliffs, 1993, p. 522

Aplicaii n marketing ale analizei variaiei


Analiza variaiei este utilizat n mod deosebit n experimentele de marketing, atunci cnd se evalueaz influena unor variabile independente asupra altora, tratate ca dependente. Printre cele mai cunoscute utilizate n acest context se numr proiectrile factoriale, ptratele latine, ptratele greco-latine etc. Mult mai frecvent ns cercettorii urmresc s analizeze, n studii pe care le realizeaz, diferenele dintre valorile medii ale unei variabile independente pe care le ia la nivelul mai multor categorii ale uneia sau mai multor variabile independente (factori) pentru a putea concluziona dac exist sau nu diferene ntre grupurile respective. Mai precis, analiza variaiei poate furniza rspunsuri la ntrebri precum: exist diferene n privina duratei totale lunare a convorbirilor telefonice ntre persoanele din diferite regiuni ale rii sau pe categorii de educaie i venit? care sunt diferenele n privina inteniilor de cumprare la diferite niveluri ale preurilor unui produs? percepiile privind diversitatea ofertei (categorii), interaciunea cu vnztorii (da/nu) i modul n care au fost rezolvate plngerile (categorii) i pun amprenta asupra satisfaciei clienilor? consumul de cafea este influenat de vrst (categorii) i educaie (categorii)?

Indicatori i noiuni asociate analizei variaiei


Prezentm mai jos situaia analizei variaiei cu un factor. Indicatorii rmn valabili i pentru celelalte forme ale analizei variaiei. Variaia dintre grupuri (between variation): notat, de obicei cu SSX (sau SSntregrupuri)

reprezint variaia variabilei dependente corespunztoare variaiei mediei pe

categoriile variabilei independente. Ea reprezint partea din suma ptratelor aferent variabilei independente; Variaia din interiorul grupurilor (within variation) notat, de obicei cu SSE (sau SSin-interior sau SSeroare) reprezint variaia variabilei dependente datorat variaiei n

interiorul fiecrei categorii a variabilei independente. Aceast variaie nu este generat de variabila independente; Variaia total (total variation): notat, de obicei cu SST (sau SStotal) reprezint variaia variabilei dependente corespunztoare variaiei mediei pe categoriile variabilei independente. Ea reprezint partea din suma ptratelor abaterilor variabilei dependente aferent variabilei independente; Media ptrat (mean square): este suma ptratelor mprit la numrul gradelor de libertate; testul eta (TI2, eta2): msoar efectul variabilei independente asupra celei dependente i arat proporia explicat de prima n variabilitatea celei de a doua. Ia valori ntre 0 i 1; testul F (F statistic): verific ipoteza nul (H0) c dispersiile categoriilor variabilei independente pentru variabila dependent sunt egale; se calculeaz ca raport ntre media ptratelor aferent variabilei independente i media ptratelor aferente erorii.

Etapele realizrii analizei variaiei cu un singur factor


Analiza variaiei poate fi mprit n trei pai mari: identificarea variabilelor, efectuarea calculelor i interpretarea rezultatelor. Astfel: Identificarea variabilelor: n aceast etap trebuie inut cont de cerina acestui tip de analiz ca variabila dependent s fie metric iar cea independent s fie nemetric (categorial -msurat pe scal nominal sau ordinal). Descompunerea variaiei totale: n aceast etap este examinat variabilitatea variaiei din eantion (variabila independent) i pe baza acestei variabiliti se stabilete dac exist motive de a considera c mediile categoriilor populaiei difer ntre ele. Variaia total a variabilei dependente (SST) este format din variaia explicat de variabila independent (SSX sau SSntre-grupuri) i variaia rezidual (SSeroare sau SSin-intenor) SST = SSntre-grupuri + SSin-intenor sau SST = SSX + SSE unde: 4

SST = ( yi y ) 2
i =1

SS X = ( y j y ) 2
j =1

SS E = ( yij yi ) 2
j =1 i =1

unde: yi - valoarea i a variabilei dependente


y j - media variabilei dependente pentru categoria j a variabilei independente

y - media la nivelul ntregului eantion yij - valoarea i a variabilei dependente corespunztoare categoriei j a variabilei independente Msurarea efectelor: n aceast etap este determinat efectul factorului asupra variabilei dependente date de SSX. Pentru msurarea acestui efect se folosete testul eta 2 , calculat n modul urmtor:
SS X SST

2 =

Eta2 ia valori ntre 0 i 1. O valoarea apropiat de 0 indic faptul c nu exist diferene ntre medii n timp ce o valoarea apropiat de 1 arat o variabilitate ntre grupuri. Testarea semnificaiei statistice: se realizeaz cu ajutorul testului F prin verificarea ipotezei nul (H0) confom creia dispersiile variabilei dependente n cazul fiecrui grup (categorie) a variabilei independente sunt egale. Indicatorul testului F se calculeaz ca raport ntre variaia pus pe seama variabilei independente i ajustat cu numrul gradelor de libertate aferente (SSx/(k-1)) i variaia corespondent erorii ajustat i ea cu numrul gradelor de libertate diferen (SSE/(n-k)). Interpretarea testului F poate fi fcut absolut, prin compararea cu valorile tabelate sau prin prisma nivelului de semnificaie asociat. Un nivel de semnificaie sub 0,05 (aferent unei probabiliti de peste 95%) permite respingerea ipotezei nule a egalitii dispersiilor.

Neter J., Wasserman W., Kutner M. - Applied Linear Statistical Models, Irwin, Homewood, 2nd edition , 1985

Interpretarea rezultatelor: n situaia n care ipoteza nul a egalitii mediilor grupurilor a fost acceptat, variabila independent nu are un efect semnificativ asupra variabilei dependente. n caz contrar, prin neacceptarea ipotezei nule se poate concluziona c grupurile difer ntre ele din punct de vedere al caracteristicii studiate (variabila dependent) i c variabila independent exercit un efect semnificativ asupra celei dependente. Mergnd mai departe, o comparare a mediilor la nivelul grupurilor va da informaii legate de natura efectului variabilei independente.

Analiza variaiei cu n-factori


Acest tip de analiz se aplic n situaia n care exist o variabil dependent i mai muli (n) factori (variabile independente). Faptul c exist o aciune simultan a mai multor factori aduce n discuie efectul generat de fiecare dintre factori i cel produs de interaciunile dintre ei. Procedura de aplicare a analizei variaiei cu n-factori este similar cu cea n care avem un singur factor, dar modul de descompunere a variaiei este unul care trebuie s in seama de toi factorii implicai (i de interaciunile dintre ei). Pentru modelul cel mai simplu, cu 2 factori (X1 i X2) variaia total se calculeaz astfel: SST = SSX1 + SSX2 + SSX1X2 + SSE Un efect mai puternic al variabilei X1 va fi reflectat printr-o diferen mai mare ntre medii la nivelul categoriilor acestei variabile i sum a ptratelor SSX1 mai mare, la fel n cazul celeilalte variabile independente. Pe de alt parte, cu ct exist o interaciune mai mare ntre factorii X1 i X2 cu att contribuia comun la explicarea variaiei (ca rezultat al acestei interaciuni) va fi mai mare (relaia funcioneaz i n sens invers, artnd c o o valoare mic a SSX1X2 arat o independen ntre cei doi factori (din acest punct de vedere). Testul F va ajuta, de data aceasta, la calcularea nu numai a efectului principal al fiecrui factor, ci va fi calculat cte un indicator att pentru evaluarea efectului interaciunii ct i pentru a testa semnificaia statistic a ntregului model, deci efectul global al tuturor tratamentelor (factori, individual + interaciunea dintre ele). Valorile calculate alte testului Fisher (Fc) sunt comparate cu cele din tabelele statistice Ft asociate acestui test (ultimul pe 6

baza nivelului de semnificaie i numrului gradelor de libertate). Dac valorile calculate sunt mai mici dect cele tabelare (teoretice), atunci factorul respectiv nu are influen semnificativ asupra procesului analizat; dac valorile calculate sunt mai mari dect cele tabelare (teoretice), atunci factorul respectiv are o influen important asupra procesului.

Analiza covariaiei
De multe ori atunci cnd se analizeaz efectul exercitat de variabilele independente controlate asupra valorilor medii ale unei variabile dependente apare necesitatea de a ine cont i izola influena altor variabile independente. Aceasta se rezolv prin utilizarea analizei covariaiei care include n model, pe lng factorii msurai pe scale nemetrice i cel puin o variabil independent de tip metric, denumit covariant Utilizarea acestui are rolul de a elimina variaiile externe exercitate asupra variabilei dependente. La fel ca i n celelalte cazuri, semnificaia statistic a efectelor variabilelor covariante este testat cu ajutorul testului F. Analiza covariaiei este util atunci cnd ntre variabilele covariante i variabila dependent exist o relaie liniar i cnd acestea nu sunt corelate cu factorii 3 . Analiza covariatiei poate fi utilizata cu o singur alternant, cu mai multe alternante, ca i prin tehnicile multivariate ANOVA.

Specificitatea analizei multivariate a variaiei


Similar cu ANOVA, analiza multivariat a variaiei (MANOVA) include n model cel puin dou variabile dependente metrice i analizeaz efectele asupra acestora luate simultan. Obiectivul MANOVA este, la fel ca i pentru ANOVA, examinarea i testarea diferenelor dintre medii, dar n acest caz calculele sunt fcute pe baza vectorilor mediilor variabilelor dependente multiple. Analiza multivariat a variaiei se justific atunci cnd variabilele dependente sunt corelate ntre ele, n caz contrar fiind mult mai potrivit procedura ANOVA pentru fiecare dintre variabilele dependente luate n considerare.

Wildt A. R., Ahtola O. T., Analysis of Covariance; Beverly Hills, CA, Sage, 1978, p. 48-50.

MANOVA compar grupurile i explic diferenele dintre grupuri. Pentru aceasta MANOVA creeaz un nou rezumat al variabilelor dependente, care este o combinaie liniar a fiecrei variabile dependente iniiale. MANOVA poate fi folosit ntr-un sens, dou sensuri i cu un nivel ridicat de proiectare (cu multiple variabile independente), ca i n analizei covariaiei (controlnd variabilele suplimentare).

S-ar putea să vă placă și