Documente Academic
Documente Profesional
Documente Cultură
Modelul liniar general univariat este o versiune a modelului liniar general adesea folosit pentru a
pune n aplicare dou proceduri statistice de lung durat: Anova i Ancova. Toate acestea
prezint situaia n care exist o variabil dependent i una sau mai multe variabile
independente.
Analiza variaiei Anova este folosit pentru a descoperi principalele efecte i interaciuni ale
variabilelor independente categoriale, numite i factori, asupra unei variabile dependente.
Implementarea analizei variaiei n modelul liniar general sprijin, de asemenea, utilizarea
variabilelor categoriale ca i variabile dependente. Un efect principal ar fi cel direct al unei
variabile independente asupra variabilei dependente. Un efect de interciune este efectul comun a
dou sau mai multe variabile independente asupra variabilei dependente. ntruct modelele de
regresie nu se ocup de interaciuni dect dac sunt adugai termeni de interaciune
crossproduct, Anova are aceste efecte ncorporate. n cazul n care exist mai multe variabile
dependente, modelul liniar general multivariat implementeaz analiza multipl a variaiei
Manova i, inclusiv, o variant care sprijin folosirea variabilelor de control ca i covariate,
Mancova.
Statistica cheie n analiza variaiei este reprezentat de testul F, un test al diferenei mediei de
grup, care testeaz dac media n cadrul grupurilor de valori formate ale variabilei independente
(sau combinaiile de valori pentru mai multe variabile independente) difer i nu este la
ntmplare. n cazul n care aceasta nu difer semnificativ, se deduce faptul c variabila sau
variabilele independente nu au niciun efect asupra variabilei dependente. n caz contrar cnd
exist legtur n general ntre variabila dependente i cele independente, se folosesc mai multe
teste de comparaie a semnificativitii pentru a putea vedea care din variabilele independente
creeaz o interaciune puternic. Dac datele implic msuri repetate ale aceleiai variabile,
testul F se calculeaz diferit fa de obinuitul Between-Groups, dar logica inferenei este
acceai.
Este de reinut faptul c analiza variaiei testeaz ipoteza nul c mediile grupurilor nu difer. Nu
este un test de diferene n variaii ci, mai degrab, unul care presupune omogenitatea relativ a
varianelor. Astfel, unele ipoteze-cheie ale analizei variaiei ar fi c grupurile formate de
variabila independent sau variabilele indpendente sunt relativ egale ca i mrime i au variaii
similare asupra variabilei dependente (omogenitatea varianelor). n modelul de regresie, Anova
este o procedur parametric ce presupune normalitatea variabilelor multiple, adic o distribuie
normal pentru fiecare categorie de valoare a variabilei sau variabilelor independente.
Analiza covariaiei Ancova este folosit pentru a testa principalele efecte i interaciuni ale
variabilelor categoriale asupra unei variabile dependente continue, controlnd efectele altor
variabile continue selectate care covariaz cu variabila dependent. Variabila de control se
numete covariat. Pot exista mai multe covariate. De asemenea, se pot efectua comparaii
planificate sau post-hoc pentru a vedea care dintre valorile unui factor contribuie cel mai mult la
explicarea variabilei dependente. Ancova folosete regresia buit-in utiliznd covariatele pentru a
previziona variabila dependent, apoi face o analiz a variaiei Anova asupra reziduurilor
(variabilele previzionate-variabila dependent actual) pentru a vedea dac factorii sunt n
continuare semnificativi n raport cu variabila dependent dup ce variaia covariatelor a fost
eliminat. Numrul maxim de covariate care poate fi procesat n SPSS este 10. Ancova este
folosit n trei scopuri:
Toate acestea au scopul de a reduce termenul de eroare din model. Ca i alte proceduri de
control, Ancova poate fi vzzut ca o form de analiz what if, ntrebndu-ne ce s-ar ntmpla
dac toate cazurile ar marca n mod egal numrul de covariate, astfel nct efectul factorilor
asupra covariatelor s poat fi izolat. Ancova poate fi utilizat n toate modelele Anova i aplic
aceleai ipoteze.
Modelul general liniar multivariat furnizeaz analiza de regresie i analiza variaiei pentru mai
multe variabile dependente i unul sau mai muli factori. Variabilele de tip factor divid populaia
n grupuri. Cu ajutorul acestui model se pot testa ipoteze cu privire la efectele variabilelor
independente asupra variaiei mediilor de grup ale unei distribuii comune a variabilelor
dependente. Se pot investiga att interaciunile dintre factori, ct i efectele factorilor individuali.
n plus, pot fi incluse efectele covariatelor i interaciunile acestora cu factorii. n analiza de
regresie, variabilele independente sau predictorii sunt specificate ca i covariate.
Se pot testa att modele echilibrate, ct i neechilibrate. Un model este echilibrat dac fiecare
celul din acesta conine acelai numr de cazuri. Aceste matrici sunt numite SSCP (sume de
ptrate i produse secundare). n cazul n care apare mai mult de o variabil dependent, analiza
multivariat a variaiei cu ajutorul urmei Pillai, testului lambda Wilks, urmei Hotelling i a celui
mai mare criteriu de rdcin cu aproximare a statisticii F, furnizeaz la fel de bine ca i analiza
variaiei univariat teste pentru fiecare variabil dependent. n plus fa de ipotezele de
testare, procedura general liniar multivariat ofer estimri ale parametrilor.
Utilizate n mod obinuit, contrastele a priori sunt disponibile pentru a efectua testarea
ipotezelor. n plus, dup testul de semnificaie global F, se pot utiliza teste post hoc pentru a
evalua diferenele dintre mediile specificate. Estimaiile medii marginale ofer estimri ale
valorilor medii previzionate pentru celulele din model i graficele profil sau graficele de
interaciune permit vizualizarea cu uurin a unor relaii ale variabilelor din model. Cele mai
multe teste de comparaie post hoc sunt efectuate pentru fiecare variabil separat.
Reziduurile, valorile prezise, distana Cook i valorile leverage(levier) pot fi salvate ca noi
variabile n baza de date pentru verificarea ipotezelor. De asemenea, sunt disponibile matricile
reziduurilor SSCP care este o matrice ptratic a sumelor de ptrate i a produselor secundare
ale rezidurilor, o matrice de covarian rezidual care este mprit n funcie de gradele de
libertate ale reziduurilor i care este forma standardizat a matricii de covarian rezidual.
Msura WLS permite specificarea unei variabile folosite pentru a da diferite observaii la
msura celor mai mici ptrate (WLS), probabil pentru a compensa diferitele precizii de
msurare.
De exemplu, un productor de materiale plastice msoar trei proprieti ale unei folii de
plastic: rezistena la rupere, luciul si opacitatea. Dou rate de extrudare i dou cantiti diferite
de aditiv sunt ncercate iar cele trei proprietti sunt msurate n conformitate cu fiecare
combinaie a vitezei de extrudare i a cantitii de aditiv. Productorul constat c rata de
extrudare i cantitatea de aditiv produce individual rezultate semnificative doar c
interaciunea dintre cei doi factori nu este semnificativ.
Metode: Tipul I, Tipul II, Tipul III i Tipul IV al sumelor ptratelor pot fi folosite pentru a evalua
diferite ipoteze.
Statistici: Testele de rang post hoc i comparaii multiple: least significant difference,
Bonferroni, Sidak, Scheffe, Ryan-Einot-Gabriel-Welsch multiple F, Ryan-Einot-Gabriel-Welsch
multiple range, Student-Newman-Keuls, Tukey's honestly significant difference, Tukey's b,
Duncan, Hochberg's GT2, Gabriel, Waller Duncan t test, Dunnett (one-sided and two-sided),
Tamhane's T2, Dunnett's T3, Games-Howell i Dunnett's C.
Statistici descriptive: mediile observate, deviaiile standard i counts pentru toate variabilele
dependente din toate celulele; testul de omogenitate a variaiei Levene, testul omogenitii
matricilor de covarian a variabilelor dependente M Box i testul de sfericitate Bartlett.
Date: Variabilele dependente ar trebui s fie cantitative. Factorii sunt variabile categoriale i pot
avea valori numerice sau string. Covariatele sunt variabile cantitative i sunt legate de variabila
dependent.
Ipoteze: Pentru variabilele dependente, baza de date este reprezentat de un eantion aleator de
vectori dintr-o populaie normal cu variabile multiple; n populaie, matricile de varian-
covarian sunt la fel pentru toate celulele. Analiza de varian este robust la abaterile de la
normalitate cu toate c datele trebuie s fie simetrice. Pentru a verifica ipotezele, se pot utiliza
testele de omogenitate a varianelor inclusiv M Box i graficele spread vs level. De asemenea, se
pot examina i reziduurile cu graficele acestora.
Proceduri conexe: Se utilizeaz procedura Explore pentru a examina datele nainte de a face
analiza variaiei. Pentru o singur variabil dependent se utilizeaz procedura general liniar
univariat. Dac se msoar aceleai variabile dependente de mai multe ori pentru fiecare
subiect, se utilizeaz General Linear Model Repeated Measures.
Un model factorial conine toate efectele principale ale factorilor, toate efectele principale ale
covariatelor precum i toate interaciunile dintre factori. Modelul nu conine interaciuni ntre
covariate. Se selecteaza opiunea Custom pentru a specifica doar un subset de interaciuni sau
pentru a specifica interaciunile dintre factori i covariate. Trebuie indicai toi termenii care
urmeaz s fie inclui n model. Modelul depinde de natura datelor. Dup selectarea opiunii
Custom se pot selecta principalele efecte i interaciuni care prezint interes n analiz.
Pentru modelele echilibrate i neechilibrate fr valori lips se utilizeaz cel mai frecvent tip de
sum a ptratelor i anume Tipul III. Constanta este inclus n model de obicei. n cazul n care
se poate presupune c datele trec prin origine, se poate exclude constanta.
Interaciunea: creeaz termenul de interaciune la cel mai nalt nivel al tuturor variabilelor
selectate. Acest lucru este implicit.
Efectele principale: creeaz un termen de efecte principale pentru fiecare variabil
selectat. All 2-way: creeaz toate posibilele interaciuni cu dou direcii ale variabilelor
selectate. All 3-way: creeaz toate posibilele interaciuni cu trei direcii ale variabilelor
selectate. All 4-way: creeaz toate posibilele interaciuni cu patru direcii ale variabilelor
selectate. All 5-way: creeaz toate posibilele interaciuni cu cinci direcii ale variabilelor
selectate.
Pentru model se poate alege un tip de sume de ptrate. Tipul III este cel mai frecvent utilizat
i implicit.
Un model echilibrat ANOVA n care orice efecte principale sunt specificate nainte de
orice efecte de interaciune de prim ordin, orice efecte de interaciune de prim ordin sunt
specificate nainte de orice efecte de interaciune de ordinul doi i aa mai departe.
Un model de regresie polinomial n care orice termeni de ordin inferior sunt specificai
nainte de orice termeni de ordin superior.
Un model pur cuibrit n care primul efect specificat este cuibrit n al doilea efect
specificat, al doilea n al treilea i aa mai departe.
Tipul II: Aceast metod calculeaz sumele ptratelor ale unui efect n modelul ajustat pentru
toate celelalte efecte adecvate. Un efect adecvat este unul care corespunde tuturor efectelor care
nu conin efectul examinat. Metoda de Tip II este frecvent utilizat pentru:
Tipul III: Aceast metod calculeaz sumele ptrate ale unui efect n proiectarea ca sume de
ptrate, ajustat pentru orice alte efecte care nu conin efectul i ortogonal (dac este cazul)
oricror efecte care conin efectul. Tipul III are un avantaj major n care sumele ptrate sunt
invariabile n raport cu frecvenele din celule atta timp ct forma general a estimabilitii
rmne constant. Prin urmare, acest tip de sume de ptrate este adesea considerat util pentru un
model neechilibrat fr celule lips. ntr-un model factorial fr nicio celul lips, aceast
metod este echivalent cu tehnica sumei ptratelor ponderat Yates. Tipul III este frecvent
utilizat pentru:
Tipul IV: Aceast metod este fcut pentru o situaie n care exist celule lips. Pentru orice
efect F din model, dac F nu este coninut n niciun alt efect, atunci Tipul IV=Tipul III=Tipul II.
Atunci cnd statistica F este coninut n alte efecte, Tipul IV distribuie constraste ntre
parametrii F la toate efectele de nivel superior echitabil. Tipul IV se utilizeaz frecvent pentru:
Contrastele sunt folosite pentru a testa dac nivelurile de efect sunt semnificativ diferite unul de
cellalt. Se poate specifica un contrast pentru fiecare factor din model. Constrastele reprezint
combinaii liniare ale parametrilor.
Testarea ipotezelor se bazeaz pe ipoteza nul LBM=0 unde L este matricea coeficienilor de
contrast, M este matricea de identitate care are dimensiunea egal cu numrul de variabile
dependente, iar B este vectorul parametru. Cnd este specificat un contrast, o matrice L este
creat astfel nct coloanele care corespund factorului sunt potrivite cu contrastul. Coloanele
rmase sunt ajustate astfel nct matricea L s fie estimabil. n plus fa de testul univariat care
utilizeaz statisticile F i cele de tip Bonferroni, intervalele de ncredere simultane bazate pe
distribuia Student t pentru diferenele de contrast din cadrul variabilelor dependente, testele
multivariate folosesc i urma Pillai, lambda Wilks, urma Hotelling i cele mai mari criterii de
rdcin ale lui Roy.
Contrastele disponibile sunt deviaia, simpl, diferena Helmert i cele polinomiale. Pentru
contrastele deviaiei i constrastele simple se poate alege categoria de referin s fie ultima sau
prima.
Tipuri de contraste:
Deviaie: compar media fiecrui nivel cu excepia unei categorii de referin, la media
tuturor nivelurilor. Nivelurile factorului pot fi n orice ordine.
Simple: compar media fiecrui nivel cu media unui anumit nivel. Acest tip de contrast
este util atunci cnd exist un grup de control. Se poate alege prima sau ultima categorie
de referin.
Diferen: compar media fiecrui nivel cu excepia primului, la media nivelurilor
anterioare. Uneori sunt numite contraste Helmert.
Helmert: compar media fiecrui nivel al factorului cu excepia ultimului la media
nivelurilor ulterioare.
Repetate: compar media fiecrui nivel cu excepia ultimului la media nivelului urmtor.
Polinomiale: compar efectele liniare, efectul ptratic, efectul cubic i aa mai departe.
Primul grad de libertate conine efectul liniar n toate categoriile; al doilea grad de
libertate; efectul ptrat; i aa mai departe. Aceste contraste sunt adesea folosite pentru a
estima tendinele polinomiale.
Graficele profile sunt utile pentru compararea mediilor marginale din model. Un grafic profile
este un grafic linie n care fiecare punct indic media marginal estimat a unei variabile
dependente ajustat pentru orice covariat la un nivel al unui factor. Nivelurile celui de-al doilea
factor pot fi folosite pentru a face linii separate. Fiecare nivel al unui al treilea factor poate fi
folosit pentru a face un grafic separat. Toi factorii sunt disponibili pentru grafice. Graficele
profil sunt create pentru fiecare variabil dependent.
Un grafic profil al unui factor arat dac mediile marginale estimate sunt n cretere sau n
scdere ntre niveluri. Pentru doi sau mai muli factori, liniile paralele arat c nu exist nicio
interaciune ntre factori ceea ce nseamn c se pot investiga nivelurile doar pentru un singur
factor. Liniile care nu sunt paralele indic o interaciune.
Dup ce un grafic este specificat prin selectarea factorilor de pe axa orizontal i opional factorii
de pe linii separate, iar n cazul graficelor separate, graficul trebuie s fie adugat la lista
graficelor.
Odat ce s-a stabilit c exist diferene ntre medii, testele post hoc i comparaiile ntre mai
multe perechi pot determina ceea ce nseamn c sunt diferite. Comparaiile sunt realizate pe
valori neajustate. Testele post hoc sunt efectuate pentru fiecare variabil dependent separat.
2.3.1. Save
Valori previzionate: Valorile pentru care modelul face previziuni pentru fiecare caz n parte:
2.3.2. Afiare