Sunteți pe pagina 1din 6

CAPITOLUL V.

MODELAREA SI SIMULAREA PRIN REGRESIA


LINIARĂ

5.1. MODEL ECONOMETRIC DE VARIABILĂ


Enunţul problemei: La nivel de tara se cere să se calculeze ecutia de regresie pentru o perioada de n ani
la cultura de grau. Datele sunt înscrise în tabelul 5.1.

Tabel nr 5.1 Producţiile medii la hectar la cultura de grau la nivel de tara realizate în ultimii ani:
Nr crt Anul f(t) Realizat Nr crt Anul f(t) Realizat
(kg/ha) (kg/ha)
1 1991 2541 14 2004 3403
2 1992 2195 15 2005 2965
3 1993 2329 16 2006 2746
4 1994 2544 17 2007 1541
5 1995 3090 18 2008 3403
6 1996 1765 19 2009 2421
7 1997 2971 20 2010 2688
8 1998 2566 21 2011 3663
9 1999 2752 22 2012 2652
10 2000 2286 23 2013 3468
11 2001 3038 24 2014 3590
12 2002 1923 25 2015 3780
13 2003 1428 26 2016 3944

Rezolvarea problemei. Formularea cea mai generala


a problemei de aproximare cere ca, pornind de la o functie
f(x) definită pe un anumit domeniu, să se determine o alta
functie F(x), avand o forma cât mai simpla, care să aproximeze
cât mai bine functia f(x) pe intregul domeniu de definiție.
Metoda de aproximare prin interpolare determină aproximativ
functia F(x) , impunand conditia ca f(x) să fie cât mai
apropiată de nodurile de interpolare.

In felul acesta, curba asociata functiei F(x) este ”forțată” să


urmeze o traiectorie impusă de poziția nodurilor de interpolare.
Acest criteriu este însa prea putin eficient in cazul unui numar mare de noduri de interpolare,
deoarece determinarea coeficientilor polinomului de aproximare necesita un volum mare de calcul
In aceste situatie este convenabilă aplicarea unei metode care să determine cea mai "buna"
funcție care sa minimizeze abaterea medie patratica între f(x) si F(x) în toate punctele în care se
cunoaste valoarea functiei originare.
Aproximarea dupa criteriul celor mai mici patrate determină o funcție F(x) care nu mai trece
prin punctele de definiție, ci printre ele, astfel încat suma patratelor abaterilor între functiile F(x) si
f(x) în aceste puncte să fie minimă.
Pentru formalizarea acestui criteriu, se consideră funcția sub formă tabelară, avand n masuratori
(x1, x2, x3, ,xn) afectate de erori inerente și se urmarește determinarea unei funcții de aproximare
F(x), astfel definită încât suma patratelor abaterilor în punctele de definiție să fie minima:
∑(xn-Xn)2 Minim
In funcție de tipul funcției de aproximare F(x) pot fi aplicate mai multe tipuri de regresie:
polinomială, exponentială, logaritmică, hiperbolică, etc..
Unul din principalele capitole ale statisticii are în vedere posibilitatea de a face predictii. Desi
nu se gasesc relatii perfecte în lumea reala, prin intermediul regresiei se pot face predictii ale unei
variabile, în functie de valoarea alteia.
Predictia este procesul de estimare a valorii unei variabile cunoscând valoarea unei alte
variabile.
În continuare, ne vom referi doar la situatia regresiei liniare (relatia dintre cele doua variabile
poate fi descrisa printr-o dreapta în cadrul norului de puncte).
Regresia se leaga foarte mult de conceptul de corelatie. O asociere puternica între doua elemente
conduce la cresterea preciziei predictiei unei variabile pe seama alteia.
Daca am avea o corelatie perfecta (+1 sau –1) estimarea ar fi extrem de precisa.
Distanţa tipică dintre linie şi toate punctele („eroarea standard”) indică dacă analiza regresiei a captat o
relaţie puternică sau slabă. Per ansamblu, cu cât o linie este mai aproape de punctele de date, cu atât
relaţia este mai puternică.
Analiza regresiei stabileşte o corelaţie dintre fenomene. Însă, după cum se spune, corelaţia nu este
cauza.
Chiar şi o linie care aproape atinge punctele de date, este posibil să nu ofere multe detalii despre
cauzalitate.
Aşadar este încă nevoie de o gândire precisă şi de studii atente pentru a localiza în lume relaţii cauză-
efect semnificative. Însă la minimum, analiza regresiei ajută la stabilirea existenţei conexiunilor care
necesită o investigarea mai atentă.

Procesul de modelare prin regresie presupune doi pasi. Primul se refera la determinarea ecuatiei de
regresie, iar cel de-al doilea consta în utilizarea acestei ecuatii în a predictive (simularea modelului).
Forma generala prin care se exprima o ecuatie de regresie este:

F(x)= a+bx
Unde: F(x) este rezultatul estimat;
a : este interceptul (locul pe ordonata unde dreapta de regresie se intersecteaza cu OY, valoarea
lui F(x) pentru x=0);
b : este panta de regresie (ne arata cu cât se modifica Y atunci când X creste (scade) cu o unitate;
x : este variabila criteriu (cunoscuta).
Calcularea coeficientilor de regresie a, respectiv b conduce la realizarea primului pas din procesul
regresiei.
5.2. EXEMPLU DE MODEL REZOLVAT DE MODEL ECONOMETRIC DE VARIABILĂ

5.2.1. Calcularea coeficienților modelului econometric liniar de o variabilă


Se cere sa calculeze un model prin regresie liniara pentru o serie de date ( 5 ) , funcție de timp (t)
și să se simuleze acest model.
Dacă polinomul de aproximare are gradul p=1, aplicarea criteriului celor mai mici patrate conduce la
regresia liniara: F(t)= a+bx, în care F(t) este variabilă dependentă (producția medie) și x, variabila
independentă(timpul)
Sistemul de ecuații liniare necesar pentru calcularae coeficienților a și b, este următorul:
na +b∑x =∑f(x)
a∑x +b∑x^2=∑f(x)*x
sau prin inlocuirea datelor din tabelul 5.2:
5a+15b=12465
15a+55b=40578
Tabel nr. 5.2. Valorile necesare calcului lui a si b
Anii( X) f(x) x= X-2001 x2 f(x)*x
2002 1923 1 1 1923
2003 1428 2 4 2856
2004 3403 3 9 10209
2005 2965 4 16 11860
2006 2746 5 25 13730

∑f(x)= ∑x= ∑x2= ∑f(x)*x=


12465 15 55 40578

De unde se obtin valorile lui a si b, respectiv:


12465 15 12465*55-
a= 40578 55 = 15*40578 = 76905 = 1538,1
5 15 5*55-15*15 50
15 55

5 12465 5*40578- =
b= 15 40578 = 15*12465 = 15915 318,3
50 50 50
Se obtine ecuatia de regresie liniara, care reprezintă modelul calculat pentru seria de date f(x) din tabel 5.3.
F(x)kg/ha = 1538,1+318,3x
Se dau valori lui x in limita domeniului (timpului) studiat ( in cazul nostru 1,2,3,4,5), respectiv perioada
2002-2006
Exemplu : F(1, respectiv 2002)= 1538,1 + 318,3*1 = 1856,4 kg/ha
F(5, respectiv 2006)= 1538,1 + 318,3*5 = 3129,6 kg/ha
Datele se inscriu in tabelul 5.3.
Tabel Nr. 5.3.

Anii(X) 2002 2003 2004 2005 2006 2007


x= X-2001 1 2 3 4 5 6
f(x)(kg/ha) 1923 1428 3403 2965 2746 X
F(x)(kg/ha) 1856,4 2174,7 2493 2811,3 3129,6 3447,9

5.2.2. Simularea modelului funcție de variabila independentă (timpul)


Simularea presupune calcularea productiei medii pentru anul următor1.
Acesta se face prin extrapolare2, respectiv calcularea, unei valori, în afara intervalului pentru care a fost
calculat modelul.
Putem simula prin acest model, productia medie pentru anul 2007, respectiv x=6
Se obtine: F(6), (respectiv 2007)= 1538,1 + 318,3*6 = 3447,9 kg/ha.
Din tabelul 3.1. constatam ca productia medie obtinuta in 2007 a fost de 1852kg/ha, ceea ce
înseamnă o diferența de 1595,9 kg/ha. ( 3447,9-1852)

5.2.3. Calculul limitelor de încredere pentru o anumită probabilitate


Vom calcula in continuare intervalul de încredere în care se află producția extrapolată prin model.
Pentru aceasta se calculeaza abaterea medie patratica a regresiei liniare si se inlocuieste in expresia:
x +/- sx *tp , în care
x = producţia medie aproximata pe perioada analizată
sx = abaterea medie pătratică a regresiei liniare;
tp = valoare tabelară în funcţie de gradele de libertate şI de risc ( probabilitate de transgresiune);

Tabelul nr. 5.4. Valorile necesare calcului abaterii medii patratice a regresiei liniare

Anii( X) f(x) F(x) F(x)-x (F(x)-x)2


2002 1923 1856,4 -636,6 405260
2003 1428 2174,7 -318,3 101315
2004 3403 2493 0 0
2005 2965 2811,3 318,3 101315
2006 2746 3129,6 636,6 405260
Sume 12465 12465 1013149
Media 2493 2493

abaterea medie pătratică sx:

( sx) = S(x-x)2 = 225,07 kg/ha


n(n-1)

1
Modelul în care variabila independent este timpul, partă si de numirea de model de tendință
2
Metodă de determinare aproximativă a unei funcții continue pentru valori situate în afara unui interval de valori
cunoscute; extrapolație (Dex, https://dexonline.ro/definitie/extrapolare)
Tabel 5.5. Limite de încredere ( GL=5-1=4 valorile tp sunt : t10%= 2,13 ; t 20%=1,5; t40%=0,9 )
Limita
superioara Limita inferioara
(+/- și
p=90%=>r=10%3 2493 ) 2,13 225,07 2972,4 kg/ha 2013,6 kg/ha
(+/- și
p=80%=>r=20% 2493 ) 1,5 225,07 2830,61 kg/ha 2155,4 kg/ha
(+/- și
p=60%=>r=40% 2493 ) 0,9 225,07 2695,56 kg/ha 2290,4 kg/ha

5.2.4. Reprezentarea grafică a modelului

5.2.5. Interpretarea modelului


Semnificația modelului se face prin coeficientul de variație R2 care ne arată care este proporția din
creșterea sau descreșterea fenomenului modelat de 100%, ce se datorește variabilei independente ( în
cazul nostru acesta variabilă este timpul).
Producția medie este un factor complex, inluențată de mulți factori ( condiții climatice, epoca de
semănat, cantitatea de îngrășăminte aplicate și alții).
În exemplul calculat R2= 0,39, de unde rezultă că din 100%, variabila timp explică 39% din
creșterea producției. Restul de 61% se datorează altor factori care nu au fost luați în calcul.
Atașat coeficientului de determinație este coeficientul de regresie, notat cu r4, și care reprezintă
radical din R2.
În cazul nostru r= radical din 0,39 = 0,6245
În cazul Limitelor de învredere se calculeaza aplitudinea dintre limita inferioara si limita superioara
Astfel pentru probabilitatea de 90% amplitudinea este de:
2972,4kg/ha-2013,6kg/ha=958,8kg/ha
Cantitatea de 958,8kg/ha, reprezintă 38,45% din media de 2943kg/ha.
Bibliografie:

3
Probabilitea(%)+ Riscul (numit în statistică și probabilitate de transgresiune)(%)=100%
4
Valorile lui r sunt cuprinse între 1 și 0, și ne arată intensitatea legăturii dintre două fenomene. Daca r=1, legătura este
perfectă, iar dacă este o, înseamnă că nu există legătură.
1.Lucrarea nr. 7 — Regresia liniară simplă, https://profs.info.uaic.ro/~val/statistica/StatWork_7.pdf
2.Tanasoiu Ovidiu, Cap 2.Modele econometrice cu o singură ecuație și cu ecuații multiple. Biblioteca digitală, ASE,
https://www.google.ro/search?q=Tanasoiu+ASE%2C+Cap+2.Modele+econometrice+cu+o+singur%C4%83+ecua%C8%9Bie

S-ar putea să vă placă și