Sunteți pe pagina 1din 4

Rgresia liniară simplă

:
Scop: Utilizând corelaţia Pearson se vizează descrierea relaţiei dintre VI (predictor
notată cu X) şi VD (criteriu notată cu Y)
Putem prezice, cu ajutorul unei ecuaţii de regresie, scorul la criteriu cunoscând
scorul la predictor.
Prin regresie putem determina procentul din varianţa criteriului explicar de
varianţa predicrorului (R2)
Ecuaţia de regresie: Y = a + bX
„a” este interceptul (punctul de intersecţie dintre dr. de regresie şi axa OY)
„b” este panta (arată cu cât creşte Y când X se modifică cu o unitate)
Când rxy este negativă valoarea lui b este negativă, iar dreapta este descrescătoare
Când rxy este pozitivă valoarea lui b estepozitivă, iar dreapta este crescătoare

10.00

8.00

8.00
6.00
Y
Y

4.00 6.00

2.00
4.00

5 10 15 20 25 30 35

2.00

5 10 15 20 25 30 35

X X

Condiţii de aplicare
1. VI şi VD să fie cantitative şi normal
distribuite
2. Relaţia dintre VI şi VD să fie liniară
3. Erorile să fie normal distribuite
4. Cazurile influente şi cele extreme să fie evitate
2

Variables Entered/Removed(b)

Variables Variables
Model Entered Removed Method
1 inteligenta
. Enter
muzicala(a)
a All requested variables entered.
b Dependent Variable: rezultate examen

Tabelul prezină modelul de regresie: VI, VD introdusein analiză


Model Summaryb

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .808a .654 .651 .97656
a. Predictors: (Constant), inteligenta muzicala
b. Dependent Variable: rezultate examen

R coeficientul de corelaţie Pearson dintr X şi Y ne spune cât de bine se


grupează datele în jurul liniei de regresie
R2 coficientul de determinare 65% din varianţa lui Y este explicată de
varianţa lui X
65% din notele la examen sunt explicate de inteligenţa muzicală sau
inteligenţa muzicală influenţează în proporţie de 60% notele la examen.
R2 ajustat este influenţat de nr. de VI şi de volumul eşantionului şi are în
vedere cea mai bună linie de regresie care este obţinută folosind datele
din eşantion.
Eroarea standard de estimare indică acurateaţea estimării realizată cu
datele din eşantion.
ANOVAb

Model Sum of Squares df Mean Square F Sig.


1 Regression 208.786 1 208.786 218.930 .000a
Residual 110.625 116 .954
Total 319.411 117
a Predictors: (Constant), inteligenta muzicala
b Dependent Variable: rezultate examen
3

F indică dacă linia de regresie este semnificaţiv diferită de 0, dacă


predicţia realizată este mai bună decât cea bazată pe întâmplare.
Dacă b este 0 atunci linia de regresie este orizontală
F este folosit pentru a testa ipoteza nulă conform căreia b este 0.
Cum valoarea este F=218, 93 şi (p=0.0001) atunci respingem ipoteza de
nul şi considerăm că VI ne ajută să explicăm varianţă VD.
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 1.322 .360 3.670 .000
inteligenta
.216 .015 .808 14.796 .000
muzicala
a. Dependent Variable: rezultate examen

Se prezentă coeficientul de regrese nestandardizat B, constanta de regresie, precum


şi coeficientul de regresie standardizat β, care în cazul regresiei liniare simple este
coeficientul de corelaţie dintre VD şi VI
B = 0,216; a = 1,322, β= 0,808
Y=a+B*X=1,322+0,216*X
Dacă X=30 atunci Y=1,322+0,216*30=7,8

Testul „t” pentru B verifică semnificaţia pantei, echivalent în acest caz cu


semnificaţia corelaţiei dintre VD şi VI (corelaţia este semnificativ diferită de zero)
Testu „t” pentru constantă testează semnificaţia diferenţei constantei faţă de zero

Residuals Statisticsa

Minimum Maximum Mean Std. Deviation N


Predicted Value 3.2677 8.8886 6.4831 1.33585 118
Std. Predicted Value -2.407 1.801 .000 1.000 118
Standard Error of
.090 .235 .123 .033 118
Predicted Value
Adjusted Predicted Value 3.2534 8.8907 6.4834 1.33579 118
Residual -2.83911 2.87232 .00000 .97237 118
Std. Residual -2.907 2.941 .000 .996 118
Stud. Residual -2.954 2.954 .000 1.004 118
Deleted Residual -2.93125 2.89737 -.00033 .98770 118
Stud. Deleted Residual -3.059 3.059 -.002 1.015 118
Mahal. Distance .000 5.794 .992 1.125 118
Cook's Distance .000 .142 .008 .015 118
Centered Leverage Value .000 .050 .008 .010 118
a. Dependent Variable: rezultate examen
4

Condiţia 3 (Erorile să fie normal distribuite)se verifică prin inspectarea histogramei


Condiţia 4 (evitarea cazurile influente şi a celor extreme) se verifică prin inspectarea
tabelului Residuals statitics
Dacă mai mult de 1% dintre valorile reziduale standardizate (Std. Residual şi Stud.
Residual) se află în afara intervalului (-3, 3) atunci ecuaţia de regresie nu este
stabilă. În cazul nostru valorile max. şi min. nu depăşesc acest interval, deci nu
avem cazuri extreme
Pentru cazurile influenta vom urmări valoarea maximă a Distanţei lui Cook. Dacă
această valoarea este mai mică decât 1 atunci nu există cazuri influente.

Histogram

Dependent Variable: rezultate examen

25

20
Frequency

15

10

Mean = 4.79E-16
Std. Dev. = 0.996
0 N = 118
-3 -2 -1 0 1 2 3

Regression Standardized Residual

S-ar putea să vă placă și