Sunteți pe pagina 1din 11

1.

MODELUL LINIAR GENERAL UNIVARIAT


1.1.Concepte generale

Modelul liniar general univariat este o versiune a modelului liniar general adesea folosit pentru a
pune n aplicare dou proceduri statistice de lung durat: Anova i Ancova. Toate acestea
prezint situaia n care exist o variabil dependent i una sau mai multe variabile
independente.

Analiza variaiei Anova este folosit pentru a descoperi principalele efecte i interaciuni ale
variabilelor independente categoriale, numite i factori, asupra unei variabile dependente.
Implementarea analizei variaiei n modelul liniar general sprijin, de asemenea, utilizarea
variabilelor categoriale ca i variabile dependente. Un efect principal ar fi cel direct al unei
variabile independente asupra variabilei dependente. Un efect de interciune este efectul comun a
dou sau mai multe variabile independente asupra variabilei dependente. ntruct modelele de
regresie nu se ocup de interaciuni dect dac sunt adugai termeni de interaciune
crossproduct, Anova are aceste efecte ncorporate. n cazul n care exist mai multe variabile
dependente, modelul liniar general multivariat implementeaz analiza multipl a variaiei
Manova i, inclusiv, o variant care sprijin folosirea variabilelor de control ca i covariate,
Mancova.

Statistica cheie n analiza variaiei este reprezentat de testul F, un test al diferenei mediei de
grup, care testeaz dac media n cadrul grupurilor de valori formate ale variabilei independente
(sau combinaiile de valori pentru mai multe variabile independente) difer i nu este la
ntmplare. n cazul n care aceasta nu difer semnificativ, se deduce faptul c variabila sau
variabilele independente nu au niciun efect asupra variabilei dependente. n caz contrar cnd
exist legtur n general ntre variabila dependente i cele independente, se folosesc mai multe
teste de comparaie a semnificativitii pentru a putea vedea care din variabilele independente
creeaz o interaciune puternic. Dac datele implic msuri repetate ale aceleiai variabile,
testul F se calculeaz diferit fa de obinuitul Between-Groups, dar logica inferenei este
acceai.

Este de reinut faptul c analiza variaiei testeaz ipoteza nul c mediile grupurilor nu difer. Nu
este un test de diferene n variaii ci, mai degrab, unul care presupune omogenitatea relativ a
varianelor. Astfel, unele ipoteze-cheie ale analizei variaiei ar fi c grupurile formate de
variabila independent sau variabilele indpendente sunt relativ egale ca i mrime i au variaii
similare asupra variabilei dependente (omogenitatea varianelor). n modelul de regresie, Anova
este o procedur parametric ce presupune normalitatea variabilelor multiple, adic o distribuie
normal pentru fiecare categorie de valoare a variabilei sau variabilelor independente.

Analiza covariaiei Ancova este folosit pentru a testa principalele efecte i interaciuni ale
variabilelor categoriale asupra unei variabile dependente continue, controlnd efectele altor
variabile continue selectate care covariaz cu variabila dependent. Variabila de control se
numete covariat. Pot exista mai multe covariate. De asemenea, se pot efectua comparaii
planificate sau post-hoc pentru a vedea care dintre valorile unui factor contribuie cel mai mult la
explicarea variabilei dependente. Ancova folosete regresia buit-in utiliznd covariatele pentru a
previziona variabila dependent, apoi face o analiz a variaiei Anova asupra reziduurilor
(variabilele previzionate-variabila dependent actual) pentru a vedea dac factorii sunt n
continuare semnificativi n raport cu variabila dependent dup ce variaia covariatelor a fost
eliminat. Numrul maxim de covariate care poate fi procesat n SPSS este 10. Ancova este
folosit n trei scopuri:

n modele cvasi-experimentale pentru a elimina efectele variabilelor care modific relaia


variabilelor categoriale independente asupra variabilei dependente;
n modele experimentale pentru a controla factorii care nu pot fi aleatori dar care pot fi
msurai pe o scal interval. Deoarece randomizarea n principiu controleaz toate
variabilele nemsurabile, adugarea covariatelor unui model este rar sau deloc necesar
n cercetarea experimental. Dac se adaug o covariat i este necorelat cu variabila
independent, este dificil de interpretat deoarece este deja controlat prin randomizare. n
cazul n care covariata este corelat cu variabila independent, atunci includerea acesteia
va conduce cercettorul spre a subestima efectul dimensiunii variabilelor independente;
n modele de regresie pentru a potrivi regresiile n cazul n care exist variabile
independente att categoriale ct i de tip interval. (Acest ultim scop a devenit deplasat
prin regresia logistic i alte metode.)

Toate acestea au scopul de a reduce termenul de eroare din model. Ca i alte proceduri de
control, Ancova poate fi vzzut ca o form de analiz what if, ntrebndu-ne ce s-ar ntmpla
dac toate cazurile ar marca n mod egal numrul de covariate, astfel nct efectul factorilor
asupra covariatelor s poat fi izolat. Ancova poate fi utilizat n toate modelele Anova i aplic
aceleai ipoteze.

CAPITOLUL 2. MODELUL LINIAR GENERAL MULTIVARIAT

2.1. Concepte generale

Modelul general liniar multivariat furnizeaz analiza de regresie i analiza variaiei pentru mai
multe variabile dependente i unul sau mai muli factori. Variabilele de tip factor divid populaia
n grupuri. Cu ajutorul acestui model se pot testa ipoteze cu privire la efectele variabilelor
independente asupra variaiei mediilor de grup ale unei distribuii comune a variabilelor
dependente. Se pot investiga att interaciunile dintre factori, ct i efectele factorilor individuali.
n plus, pot fi incluse efectele covariatelor i interaciunile acestora cu factorii. n analiza de
regresie, variabilele independente sau predictorii sunt specificate ca i covariate.

Se pot testa att modele echilibrate, ct i neechilibrate. Un model este echilibrat dac fiecare
celul din acesta conine acelai numr de cazuri. Aceste matrici sunt numite SSCP (sume de
ptrate i produse secundare). n cazul n care apare mai mult de o variabil dependent, analiza
multivariat a variaiei cu ajutorul urmei Pillai, testului lambda Wilks, urmei Hotelling i a celui
mai mare criteriu de rdcin cu aproximare a statisticii F, furnizeaz la fel de bine ca i analiza
variaiei univariat teste pentru fiecare variabil dependent. n plus fa de ipotezele de
testare, procedura general liniar multivariat ofer estimri ale parametrilor.

Utilizate n mod obinuit, contrastele a priori sunt disponibile pentru a efectua testarea
ipotezelor. n plus, dup testul de semnificaie global F, se pot utiliza teste post hoc pentru a
evalua diferenele dintre mediile specificate. Estimaiile medii marginale ofer estimri ale
valorilor medii previzionate pentru celulele din model i graficele profil sau graficele de
interaciune permit vizualizarea cu uurin a unor relaii ale variabilelor din model. Cele mai
multe teste de comparaie post hoc sunt efectuate pentru fiecare variabil separat.

Reziduurile, valorile prezise, distana Cook i valorile leverage(levier) pot fi salvate ca noi
variabile n baza de date pentru verificarea ipotezelor. De asemenea, sunt disponibile matricile
reziduurilor SSCP care este o matrice ptratic a sumelor de ptrate i a produselor secundare
ale rezidurilor, o matrice de covarian rezidual care este mprit n funcie de gradele de
libertate ale reziduurilor i care este forma standardizat a matricii de covarian rezidual.
Msura WLS permite specificarea unei variabile folosite pentru a da diferite observaii la
msura celor mai mici ptrate (WLS), probabil pentru a compensa diferitele precizii de
msurare.

De exemplu, un productor de materiale plastice msoar trei proprieti ale unei folii de
plastic: rezistena la rupere, luciul si opacitatea. Dou rate de extrudare i dou cantiti diferite
de aditiv sunt ncercate iar cele trei proprietti sunt msurate n conformitate cu fiecare
combinaie a vitezei de extrudare i a cantitii de aditiv. Productorul constat c rata de
extrudare i cantitatea de aditiv produce individual rezultate semnificative doar c
interaciunea dintre cei doi factori nu este semnificativ.

Metode: Tipul I, Tipul II, Tipul III i Tipul IV al sumelor ptratelor pot fi folosite pentru a evalua
diferite ipoteze.

Statistici: Testele de rang post hoc i comparaii multiple: least significant difference,
Bonferroni, Sidak, Scheffe, Ryan-Einot-Gabriel-Welsch multiple F, Ryan-Einot-Gabriel-Welsch
multiple range, Student-Newman-Keuls, Tukey's honestly significant difference, Tukey's b,
Duncan, Hochberg's GT2, Gabriel, Waller Duncan t test, Dunnett (one-sided and two-sided),
Tamhane's T2, Dunnett's T3, Games-Howell i Dunnett's C.

Statistici descriptive: mediile observate, deviaiile standard i counts pentru toate variabilele
dependente din toate celulele; testul de omogenitate a variaiei Levene, testul omogenitii
matricilor de covarian a variabilelor dependente M Box i testul de sfericitate Bartlett.

Grafice: Spread vs level, residual i profile.

Date: Variabilele dependente ar trebui s fie cantitative. Factorii sunt variabile categoriale i pot
avea valori numerice sau string. Covariatele sunt variabile cantitative i sunt legate de variabila
dependent.
Ipoteze: Pentru variabilele dependente, baza de date este reprezentat de un eantion aleator de
vectori dintr-o populaie normal cu variabile multiple; n populaie, matricile de varian-
covarian sunt la fel pentru toate celulele. Analiza de varian este robust la abaterile de la
normalitate cu toate c datele trebuie s fie simetrice. Pentru a verifica ipotezele, se pot utiliza
testele de omogenitate a varianelor inclusiv M Box i graficele spread vs level. De asemenea, se
pot examina i reziduurile cu graficele acestora.

Proceduri conexe: Se utilizeaz procedura Explore pentru a examina datele nainte de a face
analiza variaiei. Pentru o singur variabil dependent se utilizeaz procedura general liniar
univariat. Dac se msoar aceleai variabile dependente de mai multe ori pentru fiecare
subiect, se utilizeaz General Linear Model Repeated Measures.

2.2. Specificarea modelului general liniar multivariat

Un model factorial conine toate efectele principale ale factorilor, toate efectele principale ale
covariatelor precum i toate interaciunile dintre factori. Modelul nu conine interaciuni ntre
covariate. Se selecteaza opiunea Custom pentru a specifica doar un subset de interaciuni sau
pentru a specifica interaciunile dintre factori i covariate. Trebuie indicai toi termenii care
urmeaz s fie inclui n model. Modelul depinde de natura datelor. Dup selectarea opiunii
Custom se pot selecta principalele efecte i interaciuni care prezint interes n analiz.

Pentru modelele echilibrate i neechilibrate fr valori lips se utilizeaz cel mai frecvent tip de
sum a ptratelor i anume Tipul III. Constanta este inclus n model de obicei. n cazul n care
se poate presupune c datele trec prin origine, se poate exclude constanta.

2.2.1. Construirea termenilor

Pentru factorii selectai i covariate:

Interaciunea: creeaz termenul de interaciune la cel mai nalt nivel al tuturor variabilelor
selectate. Acest lucru este implicit.
Efectele principale: creeaz un termen de efecte principale pentru fiecare variabil
selectat. All 2-way: creeaz toate posibilele interaciuni cu dou direcii ale variabilelor
selectate. All 3-way: creeaz toate posibilele interaciuni cu trei direcii ale variabilelor
selectate. All 4-way: creeaz toate posibilele interaciuni cu patru direcii ale variabilelor
selectate. All 5-way: creeaz toate posibilele interaciuni cu cinci direcii ale variabilelor
selectate.

2.2.2. Suma ptratelor

Pentru model se poate alege un tip de sume de ptrate. Tipul III este cel mai frecvent utilizat
i implicit.

Tipul I: Aceast metod este cunoscut ca i descompunerea ierarhic a metodei sumei


ptratelor. Fiecare termen este ajustat n funcie de termenul pe care l precede n model.
Tipul I este utilizat n mod obinuit pentru:

Un model echilibrat ANOVA n care orice efecte principale sunt specificate nainte de
orice efecte de interaciune de prim ordin, orice efecte de interaciune de prim ordin sunt
specificate nainte de orice efecte de interaciune de ordinul doi i aa mai departe.
Un model de regresie polinomial n care orice termeni de ordin inferior sunt specificai
nainte de orice termeni de ordin superior.
Un model pur cuibrit n care primul efect specificat este cuibrit n al doilea efect
specificat, al doilea n al treilea i aa mai departe.

Tipul II: Aceast metod calculeaz sumele ptratelor ale unui efect n modelul ajustat pentru
toate celelalte efecte adecvate. Un efect adecvat este unul care corespunde tuturor efectelor care
nu conin efectul examinat. Metoda de Tip II este frecvent utilizat pentru:

Un model ANOVA echilibrat;


Orice model care are doar efectele principale ale factorului;
Orice model de regresie;
Un model pur cuibrit.

Tipul III: Aceast metod calculeaz sumele ptrate ale unui efect n proiectarea ca sume de
ptrate, ajustat pentru orice alte efecte care nu conin efectul i ortogonal (dac este cazul)
oricror efecte care conin efectul. Tipul III are un avantaj major n care sumele ptrate sunt
invariabile n raport cu frecvenele din celule atta timp ct forma general a estimabilitii
rmne constant. Prin urmare, acest tip de sume de ptrate este adesea considerat util pentru un
model neechilibrat fr celule lips. ntr-un model factorial fr nicio celul lips, aceast
metod este echivalent cu tehnica sumei ptratelor ponderat Yates. Tipul III este frecvent
utilizat pentru:

Orice modele enumerate la Tipul I i Tipul II;


Orice model echilibrat sau neechilibrat fr celule lips.

Tipul IV: Aceast metod este fcut pentru o situaie n care exist celule lips. Pentru orice
efect F din model, dac F nu este coninut n niciun alt efect, atunci Tipul IV=Tipul III=Tipul II.
Atunci cnd statistica F este coninut n alte efecte, Tipul IV distribuie constraste ntre
parametrii F la toate efectele de nivel superior echitabil. Tipul IV se utilizeaz frecvent pentru:

Orice modele enumerate la Tipul I i Tipul II;


Orice model echilibrat sau neechilibrat cu celule lips.

2.2.3. Contrastele n modelul general liniar multivariat

Contrastele sunt folosite pentru a testa dac nivelurile de efect sunt semnificativ diferite unul de
cellalt. Se poate specifica un contrast pentru fiecare factor din model. Constrastele reprezint
combinaii liniare ale parametrilor.

Testarea ipotezelor se bazeaz pe ipoteza nul LBM=0 unde L este matricea coeficienilor de
contrast, M este matricea de identitate care are dimensiunea egal cu numrul de variabile
dependente, iar B este vectorul parametru. Cnd este specificat un contrast, o matrice L este
creat astfel nct coloanele care corespund factorului sunt potrivite cu contrastul. Coloanele
rmase sunt ajustate astfel nct matricea L s fie estimabil. n plus fa de testul univariat care
utilizeaz statisticile F i cele de tip Bonferroni, intervalele de ncredere simultane bazate pe
distribuia Student t pentru diferenele de contrast din cadrul variabilelor dependente, testele
multivariate folosesc i urma Pillai, lambda Wilks, urma Hotelling i cele mai mari criterii de
rdcin ale lui Roy.
Contrastele disponibile sunt deviaia, simpl, diferena Helmert i cele polinomiale. Pentru
contrastele deviaiei i constrastele simple se poate alege categoria de referin s fie ultima sau
prima.

Tipuri de contraste:

Deviaie: compar media fiecrui nivel cu excepia unei categorii de referin, la media
tuturor nivelurilor. Nivelurile factorului pot fi n orice ordine.
Simple: compar media fiecrui nivel cu media unui anumit nivel. Acest tip de contrast
este util atunci cnd exist un grup de control. Se poate alege prima sau ultima categorie
de referin.
Diferen: compar media fiecrui nivel cu excepia primului, la media nivelurilor
anterioare. Uneori sunt numite contraste Helmert.
Helmert: compar media fiecrui nivel al factorului cu excepia ultimului la media
nivelurilor ulterioare.
Repetate: compar media fiecrui nivel cu excepia ultimului la media nivelului urmtor.
Polinomiale: compar efectele liniare, efectul ptratic, efectul cubic i aa mai departe.
Primul grad de libertate conine efectul liniar n toate categoriile; al doilea grad de
libertate; efectul ptrat; i aa mai departe. Aceste contraste sunt adesea folosite pentru a
estima tendinele polinomiale.

2.2.4. Graficele Profile

Graficele profile sunt utile pentru compararea mediilor marginale din model. Un grafic profile
este un grafic linie n care fiecare punct indic media marginal estimat a unei variabile
dependente ajustat pentru orice covariat la un nivel al unui factor. Nivelurile celui de-al doilea
factor pot fi folosite pentru a face linii separate. Fiecare nivel al unui al treilea factor poate fi
folosit pentru a face un grafic separat. Toi factorii sunt disponibili pentru grafice. Graficele
profil sunt create pentru fiecare variabil dependent.

Un grafic profil al unui factor arat dac mediile marginale estimate sunt n cretere sau n
scdere ntre niveluri. Pentru doi sau mai muli factori, liniile paralele arat c nu exist nicio
interaciune ntre factori ceea ce nseamn c se pot investiga nivelurile doar pentru un singur
factor. Liniile care nu sunt paralele indic o interaciune.

Dup ce un grafic este specificat prin selectarea factorilor de pe axa orizontal i opional factorii
de pe linii separate, iar n cazul graficelor separate, graficul trebuie s fie adugat la lista
graficelor.

2.2.5. Testele de comparaie multiple Post Hoc

Odat ce s-a stabilit c exist diferene ntre medii, testele post hoc i comparaiile ntre mai
multe perechi pot determina ceea ce nseamn c sunt diferite. Comparaiile sunt realizate pe
valori neajustate. Testele post hoc sunt efectuate pentru fiecare variabil dependent separat.

Testele de diferen semnificativ Bonferroni i Tukey sunt utilizate n mod obinuit n


comparaii multiple. Testul Bonferroni bazat pe statistica Student, regleaz nivelul de smnificaie
observat din cauza faptului c sunt fcute comparaii multiple. Testul t a lui Sidak ajusteaz, de
asemenea, nivelul de semnificaie i prevede limite mai stricte dect testul Bonferroni. Testul de
diferen semnificativ Tukey folosete gama de statistici standardizate pentru a face toate
comparaiile ntre grupuri i rata erorii a perechilor de experimente la rata erorii de colectare
pentru toate perechile comparate. La testarea unui numr mare de perechi de medii, testarea
semnificativ de diferen Tukey este mai puternic dect testul Bonferroni. Pentru un numr
mic de perechi, testul Bonferroni este mult mai puternic.

2.3. Opiunile modelului general liniar multivariat

2.3.1. Save

Exist posibilitatea de a salva valorile previzionate de model, reziduurile i msurile aferente ca


noi variabile n editorul de date.

Valori previzionate: Valorile pentru care modelul face previziuni pentru fiecare caz n parte:

Nestandardizat: valoarea previzionat de model pentru fiecare variabil dependent;


Ponderat: disponibil numai n cazul n care o variabil WLS a fost selectat anterior;
Eroare standard: o estimare a abaterii stadard de la medie a variabilei dependente pentru
cazurile n care au aceleai valori ale variabilelor independente.

2.3.2. Afiare

Se selecteaz Descriptive statistics pentru a produce medii observate, abateri standard i se


calculeaz pentru toate variabilele dependente. Estimrile efectelor de marire confer o
valoare parial eta-ptrat pentru fiecare efect i pentru fiecare parametru estimat. Statistica
eta-ptrat descrie proporia de variabiliate total atribuit unui factor. Se selecteaz Observed
power pentru a obine puterea testului atunci cnd ipoteza alternativ este setat pe baza
valorii observate. Se selecteaz Parameter estimates pentru a produce estimri ale
parametrilor, erori standard, teste t, intervale de ncredere i puterea observat pentru fiecare
test. Se pot afia ipoteza i eroarea matricii SSCP i reziduurile aceteia plus testul de
sfericitate a matricei de covarian rezidual a lui Bartlett.

2.3.3. Teste de omogenitate

Furnizeaz testul Levene al omogenitii varianei pentru fiecare variabil dependent n


toate combinaiile de nivel ale factorilor between-subjects, numai pentru factorii between-
subjects. De asemenea, testele de omogenitate includ testul M Box al omogenitii matricilor
de covarian a variabilelor dependente n toate combinaiile de nivel ale factorilor between-
subjects. Opiunile Spread vs level i ale graficului reziduurilor sunt utile pentru verificarea
ipotezelor cu privire la date. Aceast opiune este dezactivat n cazul n care nu exist
factori. Se selecteaz graficele reziduurilor pentru a produce grafice ale reziduurilor
observate, previzionate i standardizate pentru fiecare variabil dependent. Aceste grafice
sunt utile pentru investigarea ipotezei de varian egal. Se selecteaz Lack of fit test pentru
a verifica dac relaia dintre variabila dependent i variabilele independente poate fi
descris n mod adecvat n model. Funcia general estimat permite construirea ipotezelor
de testare personalizate. Rndurile oricrei matrici contrast a coeficienilor reprezint
combinaii liniare ale funciei generale estimate.

2.3.4. Nivelul de semnificaie


Se dorete reglarea nivelului de semnificaie utilizat n testele posthoc i nivelul de ncredere
utilizat pentru construirea intervalelor de ncredere. Valoarea specificat este, de asemenea,
folosit pentru a calcula puterea observat pentru test. Atunci cnd se specific un nivel de
semnificaie, nivelul asociat intervalelor de ncredere este afiat n fereastra de dialog.