Sunteți pe pagina 1din 2

Introducere in STATISTICA si PROBABILITATI

rezumat

Curs introductiv n
STATISTIC i PROBABILITI

Capitolul 5: Regresie liniara


Textul original:
Elementary Statistics, Johnson/Kuby ITP Publishers ISBN 0534356761
B. Burt Gerstman, StatPrimer: Statistics for Public Health Practice.
www.sjsu.edu/faculty/gerstman/StatPrimer
Traducere si adaptare: dr. Camelia F. Voinea
Versiune-rezumat 1.5, 2009-2010

Contents:
5.1 Modele sau ecuatii de predictie
5.2 Metoda celor mai mici patrate
5.3 Cum se fac predictiile ?

5.1 Modele sau ecuatii de predictie


Ca si in cazul corelatiei, regresia este utilizata pentru a analiza relatia dintre doua variabile continui.
Totusi, regresia este mai potrivita pentru studiul dependentelor functionale intre factori. Termenul
dependenta functionala implica faptul ca X [partial] determina nivelul lui Y.

Analiza regresiei gaseste ecuatia liniei care descrie cel mai bine relatia dintre doua variabile. Una
dintre utilizarile acestei ecuatii: sa facem predictii.

Modelul de regresie

Ne amintim de la algebra ca o linie este identificata prin panta sa (slope) adica unghiul dintre linia ce
descrie modificarea lui Y pe unitatea X, si intersectia (intercept), adica punctul unde linia se
incruciseaza cu axa Y). Regresia descrie relatia dintre X si Y cu doar o linie. Fie
ŷ reprezinta valoarea prognozata pentru y,
a reprezinta intersectia liniei care aproximeaza cel mai bine, si
b reprezinta panta acestei linii.

Astfel, modelul de regresie se descrie cu:

yˆ  a  bx

Cum identificam linia care aproximeaza cel mai bine? Daca toate punctele corespunzatoare datelor ar
cadea pe o astfel de linie, identifcarea pantei si a intersectiei ar fi simple.

5.2 Metoda celor mai mici patrate


Ecuatia liniei care aproximeaza cel mai bine datele: ŷ  b0  b1 x

Pagina 1
Introducere in STATISTICA si PROBABILITATI
rezumat

Valoarea prezisa: ŷ
Criteriul celor mai mici patrate: gasiti constantele b0 (panta) si b1 (intersectia cu axa Y) astfel incat
suma:

  y  ŷ     y   b0  b1 x   = 0
2 2

sa fie cat mai mica posibil, unde b0 si b1 satisfac criteriul celor mai mici patrate:

b1 
  x  x  y  y   SS ( xy )
 x  x
2
SS ( x )

b0 
 y  b   x  y   b
1
 x
1
n

Valori prognozate si observate ale lui y:

5.3 Cum se fac predictiile ?


1. Scopul principal pentru care se obtine o ecuatie de regresie este de a putea face predictii.
2. Pentru a valoare data a lui x, putem prezice valoarea lui y, ŷ . Modelul de regresie poate fi utilizat
pentru a prognoza valoarea lui y la un nivel dat al lui x. Ecuatia de regresie ar trebui utilizata pentru a
face predictii numai despre populatia din care a fost extras esantionul.

Inferenta asupra pantei


Panta pentru esantion difera de cea pentru populatie si vom utiliza simboluri diferite pentru fiecare: b
reprezinta panta calculata in esantion, iar  reprezinta panta calculata in populatie.

Este posibil sa gasim o panta pozitiva in esantion (b > 0) cand de fapt avem o panta negativa in
populatie ( < 0), si invers. Utilizam tehnicile standard de estimare si testarea ipotezelor pentru a face
inferente despre valoarea lui .

Pagina 2

S-ar putea să vă placă și