Sunteți pe pagina 1din 4

Lector univ.dr.

Ana-Maria CAZAN
Anul universitar 2013-2014,
Aplicații computerizate ale datelor

Regresia liniară simpla

Sursa bibliografică:

Cazan, A.M. (2014). Statistică psihologică. Noțiuni teoretice, exemple și aplicații. Brașov: Editura
Universității Transilvania din Brașov.

- Variabila ale cărei valori dorim să le prezicem, se numește criteriu


- Variabila ale cărei valori le utilizăm pentru a prezice valorile criteriului, se numește predictor.
- Regresia pleacă de la premisa unei corelații puternice între predictor și criteriu.
- Măsura în care norul de puncte descrie o relație liniară între variabile poate fi ilustrată prin trasarea
unei drepte prin acest nor de puncte care conturează patternul norului de puncte și care se numește
linie de regresie.
- În cazul regresiei liniare simple este vorba de o distribuţie bivariată, în care există un singur
predictor (variabila independentă) şi un singur criteriu (variabila dependentă).
- Regresia multiliniară sau multiplă presupune mai multe surse de variaţie, ecuaţia de regresie
include mai mulţi factori ce intervin cu ponderi diferite în predicţia criteriului.

 Regula predicției liniare (Ecuația de regresie) reprezintă formula pentru a face predicții sau
formula pentru a prezice scorul unei persoane, predicția criteriului pornind de la unul sau mai mulți
predictori.

Scorul prezis al unei persoane este egal cu constanta regresiei plus rezultatul înmulțirii coeficientului
de regresie cu scorul persoanei la variabila predictor.

Y = scor prezis, variabila dependentă, criteriul;


X = scor obținut de persoană la variabila predictor, variabila independentă, predictor;
a = constanta (un număr fix care se adaugă predicției);

1
b = coeficientul nestandardizat de regresie (număr multiplicat cu scorul persoanei obținut la variabila
predictor, ca parte a regulii de predicție liniară).

- a se mai numește intercept, adică punctul de intersecţie al liniei de regresie cu ordonata (axa
OY);
- b indică panta liniei de regresie; deoarece el este dat de valoarea tangentei unghiului teta (θ) -
acesta indică cu cât creşte Y atunci când X creşte cu o unitate; panta este ascendentă pentru
corelaţiile pozitive şi descendentă pentru cele negative.

 Regresia liniară multiplă


Regresia liniară multiplă presupune folosirea mai multor predictori. In acest caz, ecuația de regresie
este următoarea:
Y = B0 + B1·X1 + B2·X2 + ... + Bn·Xn

 Condiţii de aplicare pentru regresia liniară simplă şi multiplă


1) Variabila dependentă (VD) și variabila independentă (VI) să fie variabile cantitative normal
distribuite.
2) Relaţia dintre VD şi VI să fie liniară (scatterplot - matrix).
3) Erorile (reziduurile) să fie normal distribuite (histogramă sau Kolmogorov-Smirnov).
4) Evitarea multicoliniarităţii (corelaţii mari 0,50 – 0,60 între oricare două VI).
5) Evitare cazurilor extreme şi a cazurilor influente (inspectarea tabelului Residuals statitics).
6) Evitarea homoscedasticităţii : reziduurile vor avea aceeaşi varianţă pentru fiecare nivel al
variabilelor predictor (VI).

Folosirea SPSS pentru calculul regresiei liniare simple


 Analyse – Regression – Linear

2
Figura 2. Calculul regresiei liniare simple (Pasul 1)

 Introduceți variabila dependentă (variabila criteriu) în câmpul Dependent și variabila


independentă în câmpul Independent.
 Dacă doriți să obțineți informații descriptive despre variabile, selectați Statistics – Descriptives.
 OK.

Figura 3. Calculul regresiei liniare simple (Pasul 2)


3
 Outputul obținut va conține mai multe tabele:
o Primul tabel arată variabilele din modelul de predicție.
o Al doilea tabel, Model Summary, oferă coeficientul de corelație dintre variabila dependentă și
variabila independentă (R – coeficientul de corelație multiplă, pentru regresia multiliniară),
coeficientul de determinare (R2) care arată procentul de variație al variabilei criteriu explicat de
variabila predictor.
o Al treilea tabel, ANOVA, testul F arată în ce măsură există diferențe semnificative statistic între
estimările oferite pe baza ecuației de regresie implicate în comparație cu estimările bazate pe
valoarea mediei (Sava, 2004). Pentru un model eficient, F este semnificativ statistic.
o Al patrulea tabel, Coefficients, conține coeficienții standardizați și nestandardizați de regresie și
valoarea constantei. Testul t de pe ultima coloană arată dacă fiecare coeficient de regresie este
semnificativ diferit de 0. Pragul de semnificație mai mic de 0,05 arată că predictorul ales este
un predictor semnificativ.

Figura 4. Coeficienții de regresie

S-ar putea să vă placă și