Sunteți pe pagina 1din 4

REGRESIE LINIARĂ , CORELAȚIE

Deschideți fișierul: Regresie Liniara Corelatie.xlsx

Problema 1
În prima foaie de calcul găsiți datele referitoare la scorul obținut la testul de
matematică, respectiv orele de studiu alocate de fiecare student pentru acest
examen.
Realizați grafic dreapta de regresie, calculați panta și termenul liber, calculați
coeficienții de corelație și de determinare, aplicați testul de ipoteză asupra
modelului liniar de regresie.
Descrieți rezultatele obținute.

Rezolvare
Pentru reprezentarea grafică alegem tipul XY (scatter) singurul potrivit
pentru regresie. Amintim că acest tip acceptă valori numerice atât pe ordonată
cât și pe abscisă.
Alegem forma scatter with only markers.
Din opțiuni alegem Layout+Trendline+More trendline
options+Display equation on chart + Display R-squared
value on chart.
Graficul obținut este prezentat mai jos:
Analizăm modelul liniar de regresie – teste de ipoteză.
Alegem din modulul Data Analysis opţiunea Regression.

Obținem raportul final:


SUMMARY OUTPUT
Regression Statistics
Multiple R 0.933605
R Square 0.871619
Adjusted R Square 0.864486
Standard Error 49.71784
Observations 20
Iată cu roșu sunt marcate valorile deja calculate prin grafic.

Verificăm modelul matematic – este într-adevăr panta diferită de 0 ?


Nivelul de semnificație prin testul Student, cât și prin analiza ANOVA arată
p=1.86837E-09, ceea ce este mult mai mic ca 0.05 – conchidem că modelul este
util și panta este diferită de 0.
Panta are valoarea punctuală 25.3264, cu intervalul de confidență

[20.5132574, 30.139].
Cu alte cuvinte, ne așteptăm cu încredere de 95% să avem panta reală fără eroare
(din populație, nu din eșantion) mai mare ca 20.513, respectiv mai mică ca
31.139.

Interpretarea punctuală: Timpul de studiu este măsurat în ore – astfel,


pentru fiecare oră de studiu studentul își mărește nota la test cu 25.32 puncte.
Relația este de tip direct proporțional – cu cât învățăm mai multe ore, cu atât
nota va fi mai mare – era și de așteptat !

Panta este pozitivă – și corelația este pozitivă (proprietate cunoscută):

R= 0.9336055.
Coeficientul de determinare:

R2=R^2=0.9336055^2=0.8716.
Coeficientul de determinare variază între 0 și 1 (fiind valoarea coeficientului de
corelație la pătrat). Poate fi interpretat procentual: 87.16% din variația scorului la
test depinde de orele de studiu. Este un procent mare care confirmă, de fapt,
realitatea (necesitatea învățării!).

În final, presupunem că avem un student ce a învățat 14.4 ore. Care este scorul
așteptat (prognosticat) prin modelul matematic liniar?
x1 = 14.4 ore
f(x1) = 25.32646778*x1 + 353.1648795 încât obținem:
f(14.4)=717.86

Problema 2
În foaia de calcul Question2 aveți coloanele de studiu: Absorbtion time, Age.
Verificați dacă timpul de absorbție depinde de vârstă.
Dacă găsiți relație atunci tratamentul va trebui să fie dedicat pe grupe de vârstă.
Reprezentați grafic dreapta de regresie.
Interpretați și comentați rezultatele.

Problema 3
Folosiți foaia de calcul Question3.
Determinați dacă avem relație între TAS și greutatea la naștere.
Reprezentați grafic dreapta de regresie.
Depinde TAS și de zilele de la naștere ?
Încercați o analiză de regresie multiplă.
Interpretați și comentați rezultatele.

S-ar putea să vă placă și