Sunteți pe pagina 1din 3

Student: Luncasu Cristian Ioan

Laborator 3 – Corelația și regresia liniară

Pentru 20 de zone ale unui oraș se cunosc următoarele date:


• Gradul de motorizare – numărul mediu de autoturisme/gospodărie
• Numărul de gospodării
• Numărul de persoane angajate
• Numărul deplasărilor zilnice generate din fiecare zonă.
Să se analizeze nivelul de corelație care există între aceste variabile și dacă există
o regresie liniară între numărul deplasărilor zilnice și celelalte variabile.

Rezolvare:

Correlation Matrix
Correlation Matrix

Numar
Numar
Grad motorizare Numar gospodarii deplasari
angajati
zilnice

Grad Pearson's

motorizare r
p-value —

Numar Pearson's
0.023 —
gospodarii r
p-value 0.924 —

Numar Pearson's
0.026 0.995 *** —
angajati r
p-value 0.912 < .001 —

Numar
Pearson's
deplasari 0.006 0.997 *** 0.999 *** —
r
zilnice
p-value 0.981 < .001 < .001 —

Note. * p < .05, ** p < .01, *** p < .001


Nivelurile de corelatie intre cele 4 variabile:

- Numarul de deplasari nu coreleaza cu gradul de motorizare (0.006<0.05 limita) dar


are o corelatie pozitiva cu celelalte doua variabile , numarul de gospodarii
(0.997>0.05) si numarul de angajati (0.999>0.05).
- Numarul de angajati coreleaza foarte slab cu gradul de motorizare (0.026<0.05 limita)
dar coreleaza pozitiv cu numarul gospodariilor (0.995>0.05).
- Numarul gospodariilor ca si numarul de angajati coreleaza foarte slab cu gradul de
motorizare (0.023<0.05).

Model cu 3 factori:

Linear Regression

Model Fit Measures

Overall Model Test

Model R R² F df1 df2 p

1 0.999 0.999 4685 3 16 < .001

Model Coefficients - Numar deplasari zilnice

Predictor Estimate SE t p

Intercept 334.380 158.234 2.11 0.051


Numar angajati 1.343 0.155 8.68 < .001
Numar gospodarii 0.785 0.253 3.10 0.007
Grad motorizare -284.158 120.981 -2.35 0.032

- Deoarece R =0.999 care este aproape 1, ne arata ca este un model foarte bun si este
semnificativ statistic.
- Pentru gradul de motorizare valoarea cu care va intra in model este -284,158 iar p-ul
este <0.05 (p=0.032) si atunci variabila in model ar putea fi semnificativa.
- Numarul de gospodarii intra in model cu valoarea 0.785 iar p-ul este <0.05 (p=0.007)
, deci este un estimator semnificativ.
- Numarul angajatilor intra in model cu varoalea 1.343 iar p-ul<.001, deci este un
estimator semnificativ.

2
Model cu 2 factori (fara gradul de motorizare):

Linear Regression

Model Fit Measures

Overall Model Test

Model R R² F df1 df2 p

1 0.999 0.998 5550 2 17 < .001

Model Coefficients - Numar deplasari zilnice

Predictor Estimate SE t p

Intercept -14.509 61.352 -0.236 0.816


Numar angajati 1.329 0.174 7.639 < .001
Numar gospodarii 0.806 0.284 2.834 0.011

- La fel ca si modelul cu 3 factori R =0.999 care este aproape 1, ne arata ca este un


model foarte bun si este semnificativ statistic.
- Numarul de gospodarii intra in model cu valoarea 0.806 iar p-ul este <0.05 (p=0.011),
deci este un estimator semnificativ.
- Numarul angajatilor intra in model cu varoalea 1.329 iar p-ul <.001, deci este un
estimator semnificativ

Ambele modele si cel cu 2 factori si cel cu 3 factori sunt semnificative statistic.

S-ar putea să vă placă și