Documente Academic
Documente Profesional
Documente Cultură
SNSPA statistica
Analiza de varianta
• ANOVA factoriala
Se bazează pe un raționament similar analizei unifactoriale:
ANOVA= evaluarea diferenței dintre medii prin analiza împrăștierii lor. Acest lucru se realizează prin
descompunerea variabilității totale a variabilei independente într-o variablitatea indusă de valorile factorului
și o variabilitate indusă de hazard
Varianța totală
Datorata
interactiunii
ANOVA FACTORIALA
General Linear Model – Univariate
Model Full factorial
Post Hoc Bonferoni
Test de omogenitate a variantei
Testul lui Levene al egalitatii variantelor. P
valoare a lui p mai mica de 5% indica o
dispersie inegala in subgrupuri.
ANOVA FACTORIALA
Eroarea de
predicție
Regresia liniară
Model de predicție multivariată
• Ecuația de regresie devine:
Y’= a + b1*X1 + b2*X2 + b3*X3……
Y’= variabila prezisă / a=originea dreptei sau punctul de intercepție / b= panta liniei de
regresie
X 1= variabila predictor 1
X 2= variabila predictor 2
X 3= variabila predictor 3
Regresia liniară
• Condiții:
Variabila dependentă – criteriul
- Trebuie să fie măsurată pe o scală interval raport
- Respectarea condiției de normalitate
Variabila independenta – predictorii
- De preferat variabile măsurate la nivel interval
- Trebuie sa fie ortogonale: sa nu coreleze între ele, variabilele independente cu o corelație mai mare de
0,10 ridică probleme…scade precizia predicției
Erorile nu corelează cu variabilele independente nu corelează între ele.
Regresia liniară
• O măsură specifică pentru coliniaritate este VIF (variation inflation factor) care trebuie să fie mai mic decât
10. Valori peste 10 indică o situați de multicoliniaritate
• Toleranta – o altă măsură specifică colinearității (0 – 1). Pt valori mai mici de 0.10 indică colinearitate
Rualarea în SPSS
• Analyze/Regression/Liniar
Din meniul STATISTICS alegem:
Estimates – coeficienții de regresie
Durbin Watson - pentru valorile reziduale: ne oferă informații cu privire la condiția de independență a
erorilor Valoare ideală situată în intervalul 1 - 3
Model fit – valoarea lui R și R2
Regresia liniară
Din meniul SAVE:
Unstandardized – valorile prezise pe baza modelului de predicție
Adjusted – valorile prezise pentru fiecare caz, dacă acel caz ar fi exclus din analiză, util pentru evidențierea
cazurilor cu influență excesivă asupra predicției
Mahalanobis – cât de mult diferă un caz de media tuturor cazurilor
nu ar trebui să depășească 25 pt N=500, 15 pt N=100 și 11 pt N=30
D al lui Cook – cât de mult s-ar modifica valoarea reziduală totală dacă acel caz ar fi eliminat
Nu ar trebui să aibă valori mai mari de 1
Standardized DFIT (sdf1) – schimbarea valorilor standardizate dacă acel caz ar fi exclus
Este exprimat în valori z – val 0 = cazul nu are nico influență asupra valorilor reziduale totale
Regresia liniară
Interpretare
Model Summaryb
a. Predictors: (Constant), iq
b. Dependent Variable: perf_sc
R- corelația
R Square- proporția variației valorilor prezise
Adjusted R Square – Corecția lui R2 în funcție de numărul de predictori și de numărul de subiecți
Standard error of the Estimeate - indică acuratețea modelului de predicție
Dubrbin Watson oferă informații cu privire la condiția de independență a erorilor ideal in intervalul 1 - 3
Regresia liniară
ANOVAa
Total 748.900 9