Sunteți pe pagina 1din 5

Econometria

Funcia de regresie a populaiei (PRF) versus funcia de regresie a eantionului (SRF)


Analiza regresional n mare parte e legat de estimarea i predicia valorii medii a variabilei dependente, pe baza unor valori cunoscute sau fixe ale variabilei explicative Pentru a nelege acest lucru, vom precauta datele prezentate n tabelul 2.1. Datele din tabel se refer la o populaie total de 60 de familii ntr-o comunitate ipotetic pentru care avem venitul sptmnal (X) i cheltuielile de consum pe sptmn (Y), ambele variabile fiind exprimate n $. Aceste 60 de familii sunt mprite n 10 grupe de venituri (de la $80 la $260) iar cheltuielile pe sptmn pentru fiecare familie din diverse grupe sunt prezentate n tabel.

Exist o variaie considerabil a cheltuielilor de consum n fiecare grup de venituri. Acest lucru poate fi vzut n Figura 2.1. Totui imaginea de ansamblu ne demonstreaz c, n ciuda variabilitii cheltuielilor de consum n cadrul fiecrei grupe de venituri, n medie, creterea cheltuielilor de consum pe sptmn, are loc odat cu creterea veniturilor

Figura 2.1

Pentru a vedea acest lucru n mod clar, n Tabelul 2.1 am calculat valoarea medie a cheltuielilor de consum pe sptmn corespunztoare fiecrei din cele 10 nivele a veniturilor. Astfel, corespunztor nivelului venitului de $80, cheltuielile medii de consum sunt de $65, n timp ce corespunztor unui nivel al venitului de $200, cheltuielile medii sunt de $137. n total avem 10 valori medii pentru cele 10 subpopulaii ale variabilei Y. Noi numim aceste valori valori medii condiionate, deoarece acestea depind de valorile date ale variabilei X. Simbolic, le notm prin E(Y|Xi)
1

Econometria

Punctele negre din figura 2.1 indic valorile medii condiionate ale variabilei Y pentru diverse valori ale variabilei X. Dac unim aceste medii condiionate vom obine aa numita linia de regresie a populaiei sau, mai general, curba de regresia a populaiei. Adjectivul "populaie" vine de la faptul c ne confruntm n acest exemplu cu ntreaga populaie de 60 de familii. Desigur, n realitate, o populaie poate avea mult mai multe familii.

Figura 2.2 Linia de regresie a populaiei

n figura de mai sus se observ c pentru fiecare valoare X (n exemplu datnivelul venitului), exist o subpopulaie de valori Y (cheltuielile de consum pe sptmn), care sunt distribuite n jurul valorii medii (condiionate) ale acestor valori Y. Pentru simplitate, vom presupune c aceste valori Y sunt distribuite simetric n jurul valorilor medii (condiionate). i linia de regresie (sau curba) trece prin aceste valori medie (condiionate).

Conceptul de funcie de regresie a populaiei (PRF)


Din discuia precedent i figurile 2.1 i 2.2, este clar c fiecare medie condiionat E(Y|Xi) este o funcie de Xi, unde Xi este o valoare dat a variabilei X. Simbolic vom nota: E(Y|Xi) = f(Xi) (1.1) unde f(Xi) este o funcie a variabilei explicative X. n exemplul nostru, E(Y|Xi) este o funcie liniar. Ecuaia (1.1) este cunoscut ca funcia de regresie a populaiei (PRF) Acesta prevede c valoarea ateptat a distribuiei variabilei Y este funcional legat de Xi. n termeni mai simpli, aceast regresie ne spune cum reacioneaz valoarea medie a variabilei Y odat cu variaia variabilei X. Ce form funcional are funcia f(Xi)? E o ntrebare important, deoarece, n situaii reale, nu avem ntreaga populaie disponibil pentru examinare. Forma funcional a PRF prin urmare, e o ntrebare empiric, dei teoria n anumite cazuri poate avea ceva de spus. De exemplu, un economist ar putea postula c cheltuielile de consum sunt liniar dependente de venituri. Prin urmare, ca o prim aproximare sau o ipoteza de lucru, putem presupune c PRF notata prin E(Y|Xi) este o funcie liniar a Xi, de tipul: E(Y|Xi) = 0 + 1Xi (1.2)

Econometria

n care 0 i 1 sunt parametrii necunoscui dar fici, denumii coeficienii de regresie; 0 termenul liber iar 1 pant dreptei. Ecuaia (1.2) n sine este cunoscut ca funcia de regresie liniar a populaiei sau modelul de regresie liniar al populaiei. n analiza de regresie interesul nostru este de a estima funcia de regresia a populaiei PRF din relaia (1.2), altfel zis a estima valorile necunoscute 0 i 1 pe baza unor valori observate ale variabilelor Y i X.

Specificarea stohastic a PRF


Din figura 2.1 se observ c, pe msur ce crete venitul familiei, cheltuielile medii de consum de asemenea cresc. Dar ce se poate spune despre cheltuielile de consum ale unei familii individuale n corespundere cu nivelul su fix al venitului? Din tabelul 2.1 i figura 2.1 este evident c cheltuielile de consum ale unei familii individuale nu neaprat cresc pe msur ce crete nivelul venitului. Observm c pentru un nivel dat al veniturilor Xi, cheltuielile de consum ale unei familii individuale sunt grupate n jurul consumului mediu, altfel spus n jurul mediei condiionate E(Y|Xi). Prin urmare, putem exprima devierea valorii individuale Yi (cheltuieli de consum individuale) de la valoarea medie astfel: ui = Yi E(Y|Xi) sau Yi = E(Y|Xi) + ui (1.3)

unde abaterea ui este o variabil aleatoare neobservabil lund valori pozitive sau negative. Din punct de vedere tehnic, ui este cunoscut sub numele de termen de perturbaie sau eroare stohastic. Cum putem interpreta ecuaia (1.3)? Putem spune c cheltuielile individuale ale unei familii n parte, innd cont de nivelul veniturilor sale, poate fi exprimat ca sum a dou componente: (1) E(Y|Xi), care sunt pur i simplu cheltuielile medii de consum ale tuturor familiilor cu acelai nivel al veniturilor. Aceast component este cunoscut ca component sistematic, sau determinist, i (2) ui, care este componenta aleatoare sau nonsistematic. Dac E(Y|Xi) este o funcie liniar, ecuaia. (1.3) poate fi scris ca: Yi = E(Y|Xi) + ui Yi= 0 + 1Xi +ui (1.4)

Conceptul de funcie de regresie a eantionului (SRF)


Vom pretinde c populaia din tabelul 2.1 nu ne este cunoscut, i unica informaie de care dispunem sunt datele unui eantion de valori Y alese la ntmplare pentru valorile fixe ale veniturilor X, rezultatele fiind prezentate n tabelul 2.4. Spre deosebire de Tabelul 2.1, acum avem doar o singur valoare Y corespunztoare valorii fixe a venitului X. Fiecare Y din tabelul 2.4 este ales n mod aleator din irul de valori Y corespunztor nivelului fixat a variabilei Xi din populaia expus n tabelul 2.1. ntrebarea este: putem noi oare estima PRF pe baza datelor din eantion? Cu siguran nu vom putea estima PRF "cu foarte mare acuratee", din cauza fluctuaiilor de eantionare. Pentru a vedea acest lucru, s presupunem c vom extrage un alt eantion aleatoriu din populaia din tabelul 2.1, iar rezultatele fiind prezentate n tabelul 2.5. Construind corelograma n baza datelor din tabelele 2.4 i 2.5 obinem figura 2.3

Econometria

Figura 2.3 Liniile de regresie a celor dou eantioane

Sunt trasate dou linii de regresie astfel nct fiecare s ajusteze cit mai bine norul de puncte corespunztor: SRF1 se bazeaz pe datele primului eantion, iar SRF2 este construit n baza datelor eantionului al doilea. Care din cele dou linii de regresie reprezint "adevrata" linia de regresie a populaiei? Dac vom evita tentaia de a privi figura 2.1, pe care este prezentat PRF, nu exist nici mod prin care am spune absolut sigur care din liniile de regresie prezentate n Figura 2.4 reprezint adevrata linia (sau curba) de regresie a populaiei. Liniile de regresie din Figura 2.3 sunt cunoscute ca liniile de regresie a eantioanelor . Se presupune ca ele reprezint linia de regresie a populaiei, dar din cauza fluctuaiilor de eantionare ele sunt doar aproximri bune ale adevratei curbe PRF. n general, am putea obine N linii de regresie pentru fiecare din cele N eantioane extrase aliator i fiecare SRF nu va fi la fel. Acum, analog cu PRF putem dezvolta conceptul de funcie de regresie a eantionului (SRF) pentru a reprezenta linia de regresie a eantionului. Ca analogie a relaiei (1.2) funcia de regresia a eantionului poate fi redat prin relaia: = b +b X Y (1.5) i 0 1 i unde:
Y i

se citeste ca Y-ajustat fiind un estimator a E(Y|Xi) b0 un estimator al lui 0 b1 un estimator al lui 1

Econometria

i la fel cum am exprimat PRF n dou forme echivalente, (1.2) i (1.4), putem exprima SRF n forma sa stocastic prin relaia de mai jos: Yi = b0 + b1Xi +ei (1.6)

unde ei este termenul rezidual sau simplu reziduu i este un estimator a termenului aliator ui Pentru a rezuma, obiectivul nostru primordial n analiza de regresie este de a estima PRF Yi= 0 + 1Xi +ui (1.4) pe baza SRF Yi = b0 + b1Xi +ei (1.6) deoarece de cele mai multe ori analiza noastr se bazeaz pe o singur prob extras dintr-o populaie. ntrebarea critic este: admind c SRF, este o aproximare a PRF, putem concepe o regul sau o metoda care va face aceast aproximaie pe cit de "aproape" posibil? Cu alte cuvinte, cum ar trebui s fie construit SRF astfel nct b 0 sa fie pe cit de "aproape" posibil de adevratul 0, iar b1 pe cit de "aproape" posibil de adevratul 1, chiar dac nu vom ti niciodat adevratele valori ale lui 0 i 1?

S-ar putea să vă placă și