Sunteți pe pagina 1din 42

MODELARE MATEMATICĂ ÎN ACTIVITĂŢILE COMERCIALE

BIBLIOGRAFIE
1. Introducere în econometrie – D. Jula, 2003.
2. Statistică şi econometrie – T. Andrei, 2003.
3. Econometrics – Franco Peracchi, 2000.
4. Econometric analysis (fifth edition) – 2003.
5. Modele şi metode econometrice – 2007.
6. Business Statistics- D. F. Groebner, P.W. Shannon, P.C. Fry, K.D. Smith, 2005.
7. Matematică pentru modelare economică – T. Dosescu, 2011.

SURSE DE DATE
1. www.insnn.ro
2. www.bnro.ro
3. www.insr.ro
4. Anuarul statistic
5. gasmi@cict.fr
6. www.aw.com/stock_watson (Introduction to Econometrics, 2003, Stock J., Watson
M., Ed. Addison Wesley, Boston)

SUBIECTE DE EXAMEN
1. Proiect (cel mult nota 8)
2. Subiect de teorie (pt. notele 9 -10)

CURSUL 1
PREZENTARE GENERALĂ

Modelarea matematică în domeniul comerţului utilizează metodele şi modelele din


econometrie pe care o prezint în continuare.
Econometria este o disciplină care valorifică cunoştinţe şi metode furnizate de
discipline economice ( cum ar fi : economia politică, microeconomie, macroeconomie, teoria
firmei, etc.), discipline matematice ( cum ar fi: algebra liniară, analiza matematică, teoria
probabilităţilor, statistica matematică, simularea numerică, teoria măsurii, etc. ) şi
informatică, în vederea abordării complexe a problemelor ce apar în economia reală.
Denumirea de econometrie provine din combinarea cuvintelor greceşti oikonomia- economie
şi metron – măsură.
Econometria are ca obiectiv principal construirea unei categorii speciale de modele
economico-matematice, numite modele econometrice, ce modelează legăturile economice
care există în cadrul unui proces economic, între un grup de variabile predeterminate, numite
exogene sau independente şi un alt grup de variabile determinate, numite endogene sau
dependente şi care utilizează cel puţin o variabilă aleatoare şi|sau un proces stochastic.
Modelele econometrice astfel construite trebuie să modeleze cât mai adecvat fenomenele şi
procesele economice şi să permită, în urma testărilor şi analizei economice, luarea unor
decizii fundamentate ştiinţific.
Exemplu. În anul 1936, economistul american John Keynes ( 1883- 1946 ) a postulat
în lucrarea sa „The General Theory of Employment, Interest and Money” („Teoria generală a
folosirii mâinii de lucru, a dobânzii şi a banilor”, traducerea în limba română a apărut la
Editura Ştiinţifică, 1970), că între nivelul venitului şi cheltuielile de consum,
corespunzătoare venitului, există o legătură funcţională de tip determinist, având forma:
, unde este o funcţie, care poate fi şi liniară. Keynes a considerat în particular, o
formă liniară a modelului , unde coeficienţii îndeplinesc condiţiile: şi
, numite azi condiţiile lui Keynes. În abordarea econometrică a legăturii dintre cei doi
indicatori, se constată că acest model determinist al lui Keynes este inadecvat realităţii,
deoarece modelul nu captează influenţele cu caracter aleator sau stochastic, pe care o are
asupra consumului un şir de factori, cum ar fi : nivelul de educaţie, obiceiurile, condiţiile
economico-sociale ş.a. Din acest motiv, modelul lui Keynes trebuie completat cu cel puţin o
componentă aleatoare, notată prin e. Astfel modelul liniar poate avea forma: ,
dacă se ţine seama de factorul aleator în mod aditiv.
Deoarece fenomenele şi procesele economice nu se pot reproduce în laborator, pentru
a se efectua experienţe, modelele econometrice sunt criticabile, ca de altfel orice model, fiind
construite pe o bază de date lacunară, chiar săracă şi uneori subiectivă. Un remediu al acestei
situaţii îl constituie experienţele pe calculator ale modelelor econometrice, care utilizează
limbaje specializate, ca de exemplu GAUSS, EVIEWS, EXCEL.
Datele pe baza cărora se construiesc modelele econometrice se împart în două
categorii:
a) datele statistice, obţinute în urma înregistrării rezultatelor fenomenelor sau proceselor
economice, aşa cum au avut loc în realitate;
b) datele şi informaţiile apriori, care au un caracter subiectiv, fiind o cuantificare a
experienţei umane anterioare.
Prelucrarea şi utilizarea datelor statistice se face în cadrul teoriei selecţiei din Statistica
Matematică, iar utilizarea datelor şi informaţiilor apriori se face în cadrul bayesian, construit
pe baza teoremei lui Bayes din teoria probabilităţilor.
Structura cea mai generală a unui model econometric este:
1) grupul de ipoteze ( supoziţii ), cu caracter simplificator, teoria economică, şi
baza de date utilizată în construirea modelului economic;
2) modelul matematic al modelului economic, care este un obiect matematic ce
poate fi o ecuaţie sau un grup de ecuaţii, cu cel puţin o componentă aleatoare,
alcătuită din variabile aleatoare multidimensionale şi|sau procese stochastice.
Principalele tipuri de modele econometrice clasice sunt:
a) modele de regresie liniară;
b) modele econometrice cu ecuaţii (liniare) simultane;
c) serii de timp ( serii cronologice);
d) modele econometrice neliniare.
După construirea modelului econometric se trece la evaluarea performanţelor
modelului, utilizându-se metodele statisticii matematice, iar în final, pe baza modelului
validat, se construiesc predicţii privind evoluţia ulterioară a fenomenului sau procesului
economic modelat, specificându-se limitele probabiliste ale acestor predicţii.
Este posibil, ca pentru acelaşi fenomen sau proces economic să se construiască mai
multe modele econometrice diferite, efort care este justificat în măsura în care se sporeşte
gradul de adecvare al modelelor la realitatea modelată şi se obţin predicţii, care devin realitate
într-o proporţie din ce în ce mai mare.

MODEL, MODELARE, MODEL ECONOMETRIC


În ceea ce priveşte termenii de model şi modelare (comunicare prezentată la a XI-a
Conferinţă Internaţională de Cibernetică Economică, 22-24 Aprilie 2004), utilizăm
următoarele definiţii ale lui S. Marcus. Considerând un obiect sau un fenomen , supus
cercetării, se numeşte model al lui , un alt obiect , astfel încât:
1) există o analogie între şi , în sensul că îndeplineşte o funcţie iconică sau
una euristică în raport cu ;
2) obiectul poate fi investigat prin cel puţin o metodă care nu este compatibilă cu
natura lui , fapt care presupune o anumită eterogenitate a lui în raport cu ;
3) există cel puţin o metodă de tipul afirmat la 2), în raport cu care investigarea lui
conduce la concluzii nebanale;
4) concluziile relative la au o anumită relevanţă în raport cu ;
Se numeşte modelare procesul de construire a modelului, continuat cu studierea
modelului în vederea obţinerii de informaţii asupra obiectului sau procesului modelat.
Aceste definiţii oferă posibilitatea de a clasifica imensa varietate de modele. Astfel,
modelarea ( respectiv modelul ) poate fi:
1) materială ( material ), în cazul lui de natură materială, sau
2) ideală ( ideal ), în cazul contrar.
După natura analogiei dintre şi există o:
a) modelare similară, dacă analogia constă în natura fizică comună şi în identitatea
formelor geometrice, iar deosebirea constă în dimensiuni, în viteza proceselor etc.;
b) modelare analogică, dacă corespondenţa dintre şi se bazează pe aspecte
funcţionale şi nu materiale.
Dintre modelările analogice, una dintre cele mai fertile, având în vedere multiplele
aplicaţii, s-a dovedit a fi modelarea matematică, al cărei prim rezultat este un model
matematic. Un model ideal se numeşte matematic, dacă este un obiect matematic sau o
construcţie matematică. De regulă, obţinerea unui model matematic presupune, pe lângă o
formalizare utilizând limbajul matematic şi o exprimare cât mai fidelă a aspectelor funcţionale
ale obiectului sau procesului modelat, cu ajutorul gândirii matematice şi al rezultatelor
teoretice cunoscute. Printre instrumentele clasice utilizate în modelarea matematică se află:
axiomele, definiţiile, teoremele etc. Ca exemple de modele matematice se pot cita: geometria
euclidiană, structurile algebrice, câmpul de probabilitate, integrala Riemann, integrala
Lebesque, logica bivalentă etc.
O altă importantă categorie de modelări analogice este cea a modelării economice, al
cărei prim rezultat este un model economic. Un model ideal B se numeşte economic, dacă
este un obiect sau o construcţie obţinută pe baza unor ipoteze şi teorii economice, manevrate
de o gândire economică. Un exemplu de model economic îl reprezintă piaţa competitivă sau
piaţa perfectă.

Observaţii.
a. Este posibil ca rezultatele unei categorii de modelare să formeze obiectul unui alt tip
de modelare. În acest sens, se poate vorbi de o combinare a două sau mai multe tipuri de
modelare. În cadrul unei astfel de combinări, tipurile de modelare se influenţează reciproc.
b. Este justificată sau chiar recomandată o astfel de combinare a tipurilor de modelare,
atunci când, în final, se obţin noi rezultate semnificative faţă de cele obţinute prin categoriile
de modelare particulare ce sunt combinate.
Un exemplu important de combinare a două categorii de modelare îl constituie
combinarea modelării economice cu cea matematică care se numeşte modelare economico-
matematică.
Prin modelare economico-matematică a unui fenomen se înţelege o modelare
care cuprinde trei etape:
1) modelarea economică a lui , al cărui prim rezultat este un model economic
. În această etapă, o gândire economică utilizează teorii şi ipoteze economice cu caracter
simplificator spre a micşora complexitatea lui A , realizând modelul economic , astfel
încât să fie posibilă etapa 2;
2) modelarea matematică a lui , al cărui prim rezultat este un model matematic
al lui A' . În această etapă, pe baza rezultatelor modelării economice, o gândire
matematică utilizează limbajul matematic, diverse instrumente şi teorii matematice spre a
realiza modelul matematic B al lui .
3) din investigarea modelului B şi din lanţul de analogii a lui cu şi a lui
cu se obţin informaţii noi asupra lui .
Rezultatul prim al modelării economico-matematice, , se numeşte model
economico-matematic.
Trebuie remarcat că de multe ori, etapa modelării economice nu este evidenţiată sau
pur şi simplu trece neobservată. Acest lucru poate favoriza eşecul unor modelări economico-
matematice.
Un gen special de modelare economico-matematică îl constituie modelarea
econometrică, al cărei prim rezultat este modelul econometric. Un model economico-
matematic se numeşte model econometric, dacă are cel puţin o componentă aleatoare.
Prin modelare econometrică se înţelege o modelare economico-matematică cu
următoarele caracteristici:
a. Etapa de modelare economică are ca obiect un micromediu economic, cum ar fi o
firmă, un segment de populaţie, un proces de producţie, sau un macromediu economic, cum
ar fi mediul economic al unei ţări sau grup de state, sau chiar economia mondială. Rezultatul
modelării economice este , modelul economic.
În această etapă, în cazul unui micromediu economic, adesea se apelează şi la diverse
ipoteze cu care se operează în prima etapă a modelării microeconomice pentru obţinerea lui
. De exemplu, se presupune că în mediul economic modelat acţionează legile globale care
acţionează într-o economie de piaţă, cum ar fi legea limitării resurselor, legea
randamentelor marginale descrescânde, legile cererii. De asemenea, mediul economic este
influenţat de comportamentul agenţilor economici, despre care se face ipoteza
comportamentului raţional [ 8 ] ?, de tipul competiţiei de piaţă, despre care ipoteza cea mai
convenabilă este cea a competiţiei perfecte, de existenţa echilibrului ( existence equilibrum )
care se traduce prin faptul că cererea este egală cu oferta, ambele evaluate la acelaşi preţ.
În cazul unui macromediu economic se apelează la diverse ipoteze cu care se operează
în prima etapă a modelării macroeconomice. De exemplu, ipotezele lui Keynes sau structura
contabilă a economiei unei ţări.
Observaţie. Dimensiunea mediului economic modelat poate să influenţeze amploarea
procesului de modelare şi instrumentele matematice utilizate în etapa modelării matematice,
dar nu esenţa sa. Astfel, în cazul unui macromediu se pot utiliza ca instrument matematic
sistemele Leontiev sau balanţa intrări-ieşiri ( input-ouput ), dar care nu sunt adecvate în cazul
unui micromediu.
b. Etapa de modelare matematică a lui ce produce modelul econometric are
la bază o gândire specifică, numită gândire econometrică, fiind rezultatul unui fenomen
sinergetic, ce se bazează pe gândirea economică, cu deosebire cea keynesiană şi dezvoltări
ale ei, pe gândirea statistică, în special cea a prelucrării şi a analizei datelor empirice,
precum şi a inferenţei statistico-matematice, pe gândirea probabilistă, în special cea a
proceselor stohastice, pe gândirea algoritmică şi cea informatică, care au permis, pe de o
parte, apariţia simulării numerice şi efectuarea de experienţe artificiale pe calculator, iar
pe de altă parte, o manevrare rapidă a unui volum de informaţie din ce în ce mai mare.
Gândirea econometrică consideră că variabilele economice, în realitate, au un caracter
aleator prin excelenţă, ceea ce implică în cadrul modelării econometrice considerarea lor ca
variabile aleatoare sau ca procese stochastice. De asemenea, datorită imposibilităţii luării în
calcul a tuturor factorilor care influenţează un proces economic, se consideră în cadrul unui
model econometric o variabilă - eroare aleatoare, unidimensională sau multidimensonală care
poate fi chiar un proces stohastic.
Ca urmare, modelul econometric are cel puţin o componentă aleatoare, al cărei rol
este acela de a compensa tratarea eronată a variabilelor economice ca fiind de natură
deterministă, precum şi de a ţine seama de erorile de măsurare sau cuantificare, de efectul
acelor variabile economice de care modelarea economică nu a reuşit să ţină seama şi de
influenţa unor factori total necunoscuţi, numiţi şocuri.
Valorile observate ale indicatorilor economici sunt generate de structura economică a
procesului modelat, ceea ce face ca, pe de o parte, acestea să conţină informaţii esenţiale
asupra procesului economic care le-a generat, iar pe de altă parte, să existe posibilităţi limitate
de a controla aceşti indicatori şi de a izola relaţiile dintre aceştia în vederea captării lor în
cadrul modelării econometrice. Printre ideile esenţiale ale gândirii econometrice, de care
trebuie să se ţină seama în modelarea econometrică, este cea care susţine feedback-ul ce
există între variabilele economice şi cea care consideră că efectele economice sunt rezultatul
unui sistem de relaţii, care în general, sunt stochastice, dinamice şi simultane. [J. Marshack,
1950 ]
Gândirea econometrică pare a fi o unealtă mai fină şi mai puternică, capabilă de a
opera asupra realităţii economice cu un grad sporit de precizie şi profunzime, să descifreze
informaţii, ascunse altor tipuri de gândire, pe care, graţie unor tehnici econometrice, să le
poată utiliza în captarea realităţii în cadrul modelelor econometrice.

O calitate esenţială a unui model econometric constă în posibilitatea de a


se efectua experienţe pe calculator utilizând acel model, suplinind astfel
incapacitatea de experimenta direct pe fenomenul-obiect .

MODELE CLASICE DE REGRESIE LINIARĂ

MODELUL I DE REGRESIE LINIARĂ


(Modelul liniar unifactorial)

Termenul de regresie a fost introdus de către statisticianul englez Francis Galton, într-
un memoriu scris în anul 1886, pentru a desemna legătura specială care există între înălţimea
taţilor şi înălţimea fiilor, ce exprimă tendinţa spre înălţimea medie.
În limba română, cuvântul ˝regresie˝ are şi semnificaţia de mişcare sau evoluţie în sens
contrar celui normal sau firesc.
În econometrie, termenul de regresie desemnează orice legătură sau dependenţă dintre
o variabilă dependentă şi una sau mai multe variabile independente, numite factori sau
regresori, dintre care cel puţin una este aleatoare. Regresia care exprimă o dependenţă liniară
se numeşte regresie liniară. Din această cauză modelele econometrice liniare sunt denumite
modele de regresie liniară.
Se consideră o populaţie statistică, a cărei caracteristică studiată este o variabilă
aleatoare teoretică X cu o repartiţie teoretică specificată, având media finită m şi dispersia
finită şi nenulă, astfel încât m şi sunt parametrii, eventual necunoscuţi.
Din această populaţie se extrage, la întâmplare, o selecţie repetată de
volum ; valorile de selecţie , , au o dublă interpretare: pe de o parte
sunt considerate drept valori numerice reale ale selecţiei, iar pe de altă parte sunt considerate
drept variabile aleatoare independente, având aceeaşi repartiţie cu cea a variabilei aleatoare
X , ceea ce implică:
şi .

Observaţie. Ipoteza că variabilele aleatoare de selecţie au aceeaşi


repartiţie cu X nu implică independenţa lor.
Modelul I de regresie liniară este rezultatul modelării econometrice a evoluţiei lui X şi
este construit pe baza selecţiei şi a următoarelor ipoteze explicite:
IPOTEZA 0. Fiecare valoare de selecţie este alcătuită din media sa m şi o
componentă aleatoare inobservabilă , , adică are loc:
(1) = , .
Consecinţe.
1) , ;

2) , ;

3) , .

Demonstraţie. 1) .

2)

3) .

IPOTEZA 1. sunt variabile aleatoare independente, identic


repartizate(i.i.d.).
Consecinţă. , .
Pentru a se obţine modelul I de regresie liniară se explicitează sistemul (1), astfel:
(2) .

Se fac notaţiile:
şi este numit vectorul de selecţie;

şi este numit vectorul aleator al erorilor, care este


inobservabil.
Cu aceste notaţii sistemul (2) se scrie:
(3)
care reprezintă modelul I de regresie liniară.

___________________NOŢIUNI SUPLIMENTARE [ N.S.] _______________________


Vectori aleatori
Fie câmpul ( borelian ) de probabilitate şi fie n variabile aleatoare
.
Definiţie. Se numeşte vector aleator n-dimensional şi se notează prin X, sistemul
ordonat , unde şi

Definiţie. Fie vectorul aleator n-dimensional X = .


a) Se numeşte media lui X şi se notează prin vectorul
coloană de forma:

, dacă există finit,

.
b) Se numeşte matricea de covarianţă a lui X şi se notează prin
matricea pătratică de ordinul n:
= .

________________________________________________________________________
În modelul I de regresie liniară este un vector aleator n - dimensional şi depinde
de , rezultă că este un vector aleator n- dimensional.
Propoziţie. Au loc următoarele proprietăţi:
1)

2) ;
3) ;
4) .
Ex. Aplicatia 1 din Excel.

CURSUL II

MODELUL I I DE REGRESIE LINIARĂ

Prezentare generală

Se consideră o populaţie statistică, a cărei caracteristică cercetată este o variabilă


aleatoare , cu o repartiţie teoretică specificată, având media finită şi dispersia finită şi
nevidă ; şi sunt parametrii, eventual necunoscuţi.
Se presupune că valorile lui sunt influenţate liniar de un factor cunoscut, care este
modelat de o variabilă vectorială nonaleatoare ( deterministă ), notată prin , unde
.
În aceste condiţii, din această populaţie se extrage la întâmplare o selecţie repetată
de volum .
Pentru a se modela econometric legătura dintre şi pe baza acestei selecţii, se
utilizează, pe lângă ipotezele 0 şi 1 de la modelul I şi ipoteza următoare:
IPOTEZA 2. Influenţa liniară a variabilei vectoriale deterministe asupra lui
se traduce la nivelul valorilor de selecţie prin relaţia:

unde este numit parametrul de interceptare şi este numit parametrul de înclinare


( pantă ), ambii necunoscuţi.
În baza ipotezei 0 se poate scrie:

unde este componenta aleatoare inobservabilă,


Observaţie. Consecinţele ipotezelor 0 şi 1, de la modelul I, rămân valabile, adică:
1) , ; 2) , ; 3) , .

În plus este adevărată şi proprietatea 4) .


Din relaţiile (1) şi (2) se obţine următorul sistem:

Se fac următoarele notaţii:

; , unde şi

; ; .
Cu aceste notaţii sistemul (3) se prelucrează astfel:

Rezultă că:

care este modelul II de regresie liniară, în care este vectorul aleator de selecţie sau
vectorul efectelor, este numit vectorul parametrilor locali şi este necunoscut, este
numit vectorul factor sau regresor sau vectorul variabilelor de control (comportament ) şi
este cunoscut, este numită matricea cadru şi este cunoscută, iar este vectorul aleator al
erorilor şi este necunoscut.
Observaţii. 1) este un vector observabil, pe când şi sunt vectori
inobservabili.
2) este considerat variabila dependentă a modelului, iar matricea este
considerată variabila independentă, care determină pe
3) exprimă eroare modelului II, datorată faptului că modelul nu poate capta toate
influenţele care le suportă .
4) Acest model II, mai întâi va permite estimarea parametrilor necunoscuţi şi apoi,
elaborarea de predicţii asupra valorilor lui
Propoziţie. Fie modelul II de regresie liniară . Atunci au loc:
a) b)
Demonstraţie. a) .
b) .
Exemplu. În baza teoriei economice, legătura dintre venitul şi consumul unei familii
se poate modela econometric prin ecuaţia vectorială:
unde este vectorul consumului, este

matricea cadru cu şi este vectorul

venitului; ; este vectorul aleator al erorilor.

Deoarece fiecare componentă a lui este alcătuită din două părţi:


a) combinaţia liniară , care exprimă dependenţa liniară a
consumului de venit, aşa cum a postulat şi J. Keynes,
b) eroarea inobservabilă , care reprezintă componenta aleatore a
modelului,
şi se consideră satisfăcute ipotezele 0,1 şi 2, ecuaţia (*) este un exemplu de model II.
Comentariu. În ipoteza că şi , au repartiţii normale, rezultă că
densitatea de repartiţie condiţionată este normală cu media

şi dispersia , iar graficul ei este centrat faţă de dreapta reprezentată de


medie şi are forma:

Fig. 1

Estimarea parametrilor locali


Fie modelul II de regresie liniară şi se consideră următoarea:
Problemă. Să se estimeze vectorul parametrilor locali , în ipoteza că este
parametru cunoscut, determinându-se cel mai „bun” estimator (cea mai „bună” estimaţie) al
vectorului , notată prin , unde estimează pe , iar estimează pe .
Rezolvarea acestei probleme se face cu metoda celor mai mici pătrate ( M.M.P.).
Conform acestei metode, estimaţia a lui se determină din condiţia ca suma
pătratelor erorilor să fie minimă, adică:

Mai întâi, se prelucrează astfel:

Deoarece

rezultă:

_____________________[N.S.]______________________________________________
a) Reguli de derivare în raport cu un vector.

1) şi C nu depinde de ;

2) , unde şi , iar nu depinde de .

Caz particular. Dacă ( A simetrică ), atunci :

3) , unde , şi este o matrice simetrică , care nu depinde

de .
b) Matrice pozitiv definită.
Definiţie. Fie simetrică. este pozitiv definită, dacă 0,

pentru orice .

Proprietate. Dacă este pozitiv definită, atunci are loc:


şi 0.
Condiţia necesară pentru a determina minimul lui S este:

(*)

În continuare se va utiliza următoarea ipoteză:


IPOTEZA 3. are rangul 2.
Consecinţă. este o matrice pozitiv definită.
Demonstraţie. Deoarece , rezultă că cele două coloane ale lui sunt
liniar independente. Observăm că şi este o matrice simetrică. Fie vectorul

nenul şi considerăm produsul , fiind o sumă de pătrate. Dacă


produsul ar fi chiar 0, atunci ar trebuie ca , adică există o combinaţie liniară a
coloanelor lui egală cu vectorul nul şi deci coloanele lui sunt liniar dependente, ceea
ce contrazice concluzia de mai sus. Rezultă că şi este o matrice pozitiv
definită.
În acest caz se poate scrie:

, deoarece şi .

Prin urmare este soluţia ecuaţiei:


.
Deoarece există în baza consecinţei, rezultă că este dat de relaţia:

.
Deoarece

care este pozitiv definită, condiţia ( *) devine şi suficientă, în baza acestei consecinţe.
Prin urmare este soluţia optimă a problemei.

Proprietăţi statistice ale lui b

Ştim că este estimatorul (estimaţia) lui , obţinută cu

M.M.P. şi b = . Cu notaţia , rezultă că ,


adică este o funcţie liniară de valorile de selecţie şi deci este un vector aleator
bidimensional, pentru care are sens media şi matricea de covarianţă.
Propoziţie. Sunt adevărate afirmaţile:
1) 2)
Demonstraţie.
1)

2) . Pe de altă parte:
-

. Înlocuind se obţine:

deoarece .

Consecinţă. este o estimaţie nedeplasată a lui .

Observaţie. .

..............................................................................................................................
CURSUL III

PREDICŢIA CU AJUTORUL MODELULUI II DE REGRESIE LINIARĂ

Se consideră modelul II de regresie liniară:


,
valabil în ipotezele 0, 1 şi 2, unde este vectorul aleator de selecţie sau vectorul

efectelor, este matricea cadru cunoscută, cu

este vectorul variabilelor de control, este vectorul

parametrilor locali necunoscuţi, iar este vectorul aleator n-dimensional al erorilor cu

şi = .

Utilizând şi ipoteza 3, cu metoda celor mai mici pătrate s-a determinat estimaţia

a lui , în care este estimaţia lui , iar este estimaţia lui în

sensul celor mai mici pătrate.


Problemă. Să se construiască predicţii, pe baza modelului II de regresie liniară şi a

estimaţiei lui , privind efectul în viitor al factorului asupra variabilei aleatoare

teoretice , cunoscând efectul concretizat prin valorile de selecţie .

Dacă legătura dintre şi , stabilită de ipoteza 2 este exactă, atunci se pot

face predicţii asupra lui pentru o valoare dată a lui .

Astfel, fie o valoare „viitoare” a lui şi fie valoarea „viitoare” a lui ,

corespunzătoare lui . Atunci, conform ipotezei 2 are loc: , unde

este eroarea aleatoare inobservabilă „ viitoare ”, corespunzătoare lui .

DEFINIŢIE. Se numeşte ecuaţia de predicţie pentru valoarea viitoare ,

corespunzătoare lui , următoarea ecuaţie:

unde se numeşte predictorul lui , iar se numeşte eroarea de predicţie

pentru .

Observaţie. Formal, se poate scrie ecuaţia de predicţie pentru , corespunzătoare lui

, obţinându-se:

unde se numeşte predictorul lui , corespunzătoare lui .

PROPOZIŢIE. Eroarea de predicţie are următoarele proprietăţi statistice:

1. .

2. .

Demonstraţie. 1. = +

+ . Conform consecinţei ipotezei 0 are loc şi se poate scrie:


, ţinându-se

seama şi de faptul că

2. =

- = =

Db1   x 02
2
 
Db 2   M  02  2 x 02 covb1 , b2   2 covb1 ,  0   2 x02 covb2 ,  0  =

= , deoarece conform ipotezei 1, iar

covb1 ,  0   covb2 ,  0   0 , deoarece şi sunt variabile aleatoare independente de

, având în vedere faptul că este o eroare viitoare, pe când şi s-au determinat pe

baza unor informaţii din trecut.

Consecinţă. este o estimaţie nedeplasată a lui .

În acest fel s-a dat răspuns la problema pusă.

Se poate pune şi următoarea problemă.

Problemă. Să se stabilească legătura statistică între şi .

Mai întâi, se consideră media de selecţie şi se face următoarea prelucrare:

Termenul reprezintă abaterea lui faţă de media de selecţie, .

 not 
Termenul Yi  Yi   i se numeşte componenta eroare sau eroarea predictorului faţă

de . Termenul este numit componenta explicativă şi reprezintă abaterea

predictorului faţă de media de selecţie, .

Ridicând la pătrat relaţia (*) şi apoi însumând după indicele se obţine:


=

= ,

deoarece = 0, a cărei demonstraţie este laborioasă şi utilizează faptul că

în ecuaţia de predicţie , coeficienţii se determină cu metoda celor mai

mici pătrate.(W.H.Green-“ECONOMETRICS ANALYSIS”).

 Y 
n
2
Relaţia = se poate împărţi cu i Y
i 1

0, obţinându-se :

Se face notaţia: . Coeficientul se numeşte coeficientul de adecvare

( determinare ) şi exprimă gradul de adecvare al modelului II de regresie liniară faţă de


legătura reală dintre şi . Adecvarea este dată de relaţia dintre şi , în
sensul unei „ bune” aproximări a lui prin ; dacă este apropiat de 1,
atunci există o strânsă legătură între şi , iar modelul II de regresie liniară este
adecvat.

Formula lui se poate prelucra astfel : .

Se face notaţia: . este vectorul aleator n-dimensional al


erorilor predictorilor. Cu această notaţie formula lui capătă forma următoare:
,

adică gradul de adecvare depinde de ponderea momentului iniţial de ordinul doi al erorilor
predictorilor, în dispersia de selecţie.

_______________________________ N.S. ____________________________________

Funcţii de producţie

Prin funcţie de producţie se înţelege expresia matematică (analitică) a legăturii dintre


factorii de producţie, care se combină într-un proces de producţie şi rezultatele ce se obţin.
Fie cantitatea dintr-un produs, obţinută într-un anumit proces de producţie, prin
utilizarea cantităţilor şi respectiv din factori de producţie. Atunci
forma generală a funcţiei de producţie corespunzătoare acestui proces de producţie este :
.

În teoria generală a funcţiilor de producţie se lucrează cu următoarele trei ipoteze.

IPOTEZA de DIVIZIBILITATE. Un factor de producţie sau un bun (marfă)


este divizibil, adică se pot considera în cantităţi oricât de mici.
Exemple: energia electrică, forţa fizică, făina, uleiul, banii, timpul, etc..

IPOTEZA de ADAPTABILITATE. Un factor de producţie este adaptabil, adică


i se poate asocia o cantitate mai mică sau mai mare dintr-un alt factor.
Exemple. Pământul este un factor de producţie adaptabil, în sensul că pe o anumită
suprafaţă dată pot lucra un număr mai mic sau mai mare de lucrători agricoli. Timpul,
capitalul, munca sunt factori de producţie adaptabili.

IPOTEZA de SUBSTITUIRE. Un factor de producţie este substituibil, adică o


cantitate din acest factor se poate înlocui cu o cantitate determinată dintr-un alt factor,
fără ca volumul producţiei să se modifice.
Exemple. Pământul se poate substitui cu munca, timpul cu banii, munca cu banii.

Observaţie. Ipoteza de substituire poate funcţiona numai după ce sunt adevărate


primele două ipoteze.

Se consideră funcţia de producţie , în care se admite că toţi


factorii de producţie implicaţi verifică cele trei ipoteze. În aceste condiţii se pot defini
următoarele noţiuni.
Se numeşte productivitatea medie (aparentă) a factorului de producţie şi se
notează prin , următorul raport:
.
Se numeşte productivitatea marginală a factorului de producţie şi se notează prin
, derivata parţială a funcţiei de producţie în raport cu , adică:
.
Asupra productivităţilor marginale se fac, de regulă, următoarele ipoteze:

, 0 şi ( ipoteza randamentelor

descrescătoare ).

Se numeşte izocoantă totalitatea combinaţiilor factorilor de producţie care permit


obţinerea aceluiaşi volum al producţiei.
Din punct de vedere geometric, izocoanta este locul geometric al tuturor punctelor de
pe graficul funcţiei de producţie, care au aceeaşi valoare a coordonatei ce reprezintă volumul
producţiei.

Funcţia de variabile reale este omogenă de gradul k, dacă


îndeplineşte condiţia:
, .
Fie funcţia de producţie . Se spune că randamentul de scară (
de dimensiune) al procesului de producţie, modelat de această funcţie de producţie, este
constant, dacă are gradul de omogenitate .În acest caz, de exemplu dublarea
cantităţilor utilizate din cei factori, implică dublarea lui .
Dacă avem , atunci randamentul de scară este crescător, iar dacă avem ,
atunci randamentul de scară este descrescător.

Caz particular. Funcţia Cobb-Douglas


În 1928, C.W.Cobb şi P.H.Douglas au construit următoarea funcţie de producţie:
,
unde primul factor de producţie reprezintă volumul capitalului, iar al doilea factor de
producţie reprezintă cantitatea de muncă. Parametrii sunt strict pozitivi.
Productivităţile marginale ale celor doi factori de producţie sunt:
0 şi 0.
Pentru un volum oarecare al producţiei se poate determina forma izocoantelor
astfel:

Deoarece , rezultă că izocuantele sunt funcţii (curbe) strict

descrescătoare. Deoarece , izocuantele sunt funcţii (curbe) convexe.


Gradul de omogenitate al funcţiei se determină astfel:
.
Atunci randamentul de scară depinde de suma .Astfel:
1) Dacă >1, randamentul de scară este crescător;
2) Dacă <1, randamentul de scară este descrescător;
3) Dacă =1, randamentul de scară este constant; în acest caz se poate scrie
>0 şi funcţia de producţie capătă forma:
, unde .
O estimaţie a lui

Estimarea parametrului cu metoda celor mai mici pătrate s-a făcut în ipoteza că
parametrul este cunoscut.
În cele mai multe cazuri din realitatea economică, de exemplu în cazul estimării
parametrilor din funcţia de consum sau de cerere, precum şi în cazul funcţiilor de producţie,
parametrul de scală este necunoscut.
Dacă este necunoscut se pune problema estimării lui. Pentru aceasta se pleacă de
la erorile aleatoare . Deşi acestea sunt inobservabile, totuşi se constată că au o
legătură cu , ţinând seama că D i2   , . Pe de altă parte, este calculabil şi
pare a fi o estimaţie naturală a lui , mai ales că , la fel cu
.
Aceasta sugerează la a considera drept estimaţie a lui chiar dispersia erorilor
predictorilor, notată prin a cărei formulă este:

sau .

Informaţii privind calităţile statistice ale lui sunt date de următoarea afirmaţie:
PROPOZIŢIE. este o estimaţie deplasată a lui .
Observaţii. 1. O estimaţie nedeplasată a lui , notată prin are următoare
formă:
sau = .

2. În cazul necunoscut se poate da şi o estimaţie a matricei de covariaţă pentru


, notată prin , care are următoarea formă:

= .
........................................................................................................
CURS 4

MODELUL III DE REGRESIE LINIARĂ

Prezentarea generală a modelului III

Deoarece în practica economică o caracteristică a unei populaţii statistice poate fi


influenţată de mai mulţi factori simultan, apare ca necesară construirea unei generalizări
multidimensionale a modelului II de regresie liniară, care se va numi modelul III de regresie
liniară şi care este capabil să capteze informaţia conţinută în mai multe date statistice
referitoare la procesele economice modelate.
Exemple de astfel de factori sau variabile economice: producţia, preţul, capitalul, forţa de
muncă angajată, costul de producţie, etc..
O situaţie care exemplifică necesitatea construirii unui model de regresie liniară
multidimensional, apare atunci când se studiază consumul lunar pe cap de locuitor dintr-un
produs alimentar, notat prin P, în funcţie de preţul lunar al lui P, de preţul lunar al produselor
care pot să substituie sau să „ concureze” produsul P şi de veniturile lunare pe cap de locuitor.
Prin produse substituibile sau substitute se înţeleg acele produse ale căror coeficienţi de
elasticitate încrucişată sunt strict pozitivi.
Fie cererea din bunul şi să presupunem că ea este o funcţie de preţurile a
bunuri , care are forma generală .
Definiţie. Se numeşte elasticitatea încrucişată a cererii bunului în raport cu
bunul şi se notează prin , ponderea variaţiei relative a consumului din bunul , din
variaţia relativă a preţului bunului , adică:

Caz particular. Dacă , atunci , elasticitatea directă a cererii bunului .


Definiţie. Bunurile şi se numesc substituibile, dacă şi .
Exemple de produse substituibile sau concurente: stiloul este concurat de pix şi de
creion; uleiul este concurat de unt şi margarină, carnea de porc este concurată de cea de
pasăre, de peşte, de soia şi de cea de vacă, salamul este concurat de parizer, de cârnaţi şi de
ruladă, etc..
Dacă în acest studiu se decide ignorarea altor variabile economice, ce pot condiţiona
nivelul consumului lunar pe cap de locuitor, simplificând astfel realitatea economică pentru a
putea fi construit modelul de regresie, atunci este necesar să se stabilească dacă variabilele
explicative luate în considerare, condiţionează în realitate consumul lunar pe cap de locuitor
al produsului P şi în caz afirmativ, să se cuantifice efectul pe care îl are orice modificare a
nivelului fiecărei variabile explicative.
Rezolvarea acestor probleme necesită informaţii care ar putea fi obţinute construind
experimente, care, însă au nevoie de un nou cadru teoretic, ce va fi oferit de următoarea
generalizare multidimensională.

Se consideră o populaţie statistică, a cărei caracteristică studiată este o variabilă


aleatoare teoretică , care este influenţată de factori cunoscuţi, care sunt variabile
vectoriale, notate prin .
Din populaţia statistică se extrage, la întâmplare, o selecţie repetată , de
volum , referitoare la variabila aleatoare teoretică .
În aceste condiţii, se fac următoarele ipoteze, cu scopul de a construi un model mai
general decât modelul II de regresie liniară.
IPOTEZA 0. Fiecare valoare de selecţie este alcătuită din media sa ,
numită componentă sistematică ( deterministă ) sau semnal şi o componentă aleatoare
inobservabilă , numită eroare sau zgomot, .
În baza acestei ipoteze se poate scrie:
, .
IPOTEZA 1. Influenţa variabilelor vectoriale , asupra lui este
liniară şi este descrisă de relaţia următoare:
,

unde sunt numite variabile de control sau explicative, iar


sunt numiţi parametrii locali şi care deşi sunt necunoscuţi, se presupun
constanţi în raport cu selecţia.
Ţinându-se seama în relaţia (1) de ipoteza 1 se obţine:
.
Se fac următoarele notaţii:
unde şi
, şi
,
cu ajutorul cărora sistemul (2) se scrie:

şi reprezintă modelul III de regresie liniară, în care:


este vectorul aleator de selecţie sau vectorul efectelor, observabil şi ale cărui
componente au o densitate de repartiţie condiţionată de forma
;
este numită matricea cadru, este numit vectorul parametrilor locali şi este
necunoscut, iar este vectorul aleator al erorilor inobservabile.
Observaţie. Vectorul diferă de la o selecţie la alta, pe când este aceeaşi
indiferent de selecţia efectuată; aceasta este justificarea pentru denumirea de matrice cadru
a lui şi pentru faptul că are o repartiţie condiţionată de .
Referitor la coloanele matricei se face următoarea ipoteză.
IPOTEZA 2. Coloanele matricei formează un sistem liniar
independent în şi .
Consecinţa 1. .
Demonstraţie.
Consecinţa 2. este o matrice nesingulară.
Demonstraţie. Deoarece , rezultă că cele coloane ale lui sunt
liniar independente. Fie vectorul nenul şi considerăm produsul
, fiind o sumă de pătrate. Dacă produsul ar fi chiar 0, atunci ar trebui
ca , adică coloanele lui sunt liniar dependente, ceea ce contrazice concluzia de
mai sus. Rezultă că este o matrice simetrică pozitiv definită şi deci .

IPOTEZA 3. .

Comentariu. Conform ipotezei, matricea nu conţine nici o informaţie referitoare


la media erorilor.

---------------[ N.S. ]------------------------------------------------------------------------------------


Repartiţii condiţionate, medii condiţionate
Fie un câmp borelian de probabilitate şi vectorul aleator bidimensional
, unde:

şi .
Atunci:

Au sens următoarele definiţii ale densităţilor de repartiţie condiţionate:


şi .
Cu ajutorul densităţilor de repartiţie condiţionată se pot defini mediile condiţionate, în
felul următor:
şi .
Teorema mediei iterate. Este adevărată următoarea relaţie:
,
unde este media unei funcţii de variabila aleatoare .
Demonstraţie. Fie o funcţie şi funcţia compusă , care este o
variabilă aleatoare cu repartiţia:
.

Prin definiţie media lui se notează prin şi este dată de relaţia:


(*) .
Partea dreaptă a egalităţii, utilizând relaţia (*), devine:

Consecinţa 3. .
Demonstraţie. Are loc:
.
Consecinţa 4. .
Demonstraţie. Are loc:
.
IPOTEZA 4. .
Comentariu. Această relaţie se poate explicita astfel:

Consecinţa 5. .
Demonstraţie. Are loc:
.
Comentariu. În baza consecinţei 5, rezultă că . În acest
caz se spune că erorile sunt homoscedastice. Deasemeni, deoarece
pentru , erorile sunt necorelate. Uneori, erorile care sunt homoscedastice şi necorelate
se numesc erori sferice.
Alături de cele 5 ipoteze se consideră frecvent şi următoarea ipoteză.

IPOTEZA 5. Matricea are toate elementele constante şi cunoscute.

În cele ce urmează se vor considera toate cele 6 ipoteze.

Exemple.
a) Se face un studiu pe o perioadă de 36 luni, privind consumul lunar pe cap de
locuitor al unui produs P, în funcţie de preţul lunar al lui P, de preţul lunar al unui produs P1
concurent al lui P şi de veniturile lunare pe cap de locuitor.

Pentru a modela legătura dintre cei 3 indicatori statistici se fac următoarele


notaţii:
unde
şi ;
şi ,
este vectorul consumului lunar;
este matricea cadru cunoscută ale cărei coloane sunt:
vectorul care conţine preţurile lunare ale lui P
vectorul care conţine preţurile lunare ale lui P1
vectorul care conţine veniturile lunare;
este vectorul parametrilor locali;
este vectorul erorilor.
Cu aceste notaţii se obţine, presupunând că cele 5 ipoteze sunt adevărate,
următorul model III de regresie liniară:
.
b) Se consideră dependenţa consumului mediu lunar de calorii de indicile
preţurilor de consum şi de câştigul salarial mediu lunar net pe o perioadă de 24 luni.

Pentru a se modela această dependenţă se fac următoarele notaţii:


unde
şi ;
şi ,
este vectorul consumului mediu lunar de calorii;
este matricea cadru cunoscută ale cărei coloane sunt:
vectorul care conţine indicele preţurile de consum
vectorul care conţine câştigul salarial mediu lunar net;
este vectorul parametrilor locali;
este vectorul erorilor.
Cu aceste notaţii se obţine, presupunând că cele 6 ipoteze sunt adevărate,
următorul model III de regresie liniară:
.
c) Un studiu econometric privind rata inflaţiei, consideră dependenţa acesteia
de deficitul bugetar, de masa monetară şi de venitul mediu trimestrial pe o periodă de 7 ani.
Pentru a se modela această dependenţă se fac următoarele notaţii:
unde
şi ;
şi ,
este vectorul ratei inflaţiei pe trimestre,
este matricea cadru cunoscută ale cărei coloane sunt:
este vectorul deficitului bugetar pe trimestre,
este vectorul masei monetare pe trimestre,
este vectorul venitului mediu trimestrial,
este vectorul parametrilor locali,
este vectorul erorilor.
Presupunând cele 6 ipoteze îndeplinite în cazul acestui studiu econometric, cu aceste
notaţii se obţine următorul model:
,
care este un exemplu de model III de regresie liniară.
Considerarea vectorului erorilor în cadrul modelului este justificată de
faptul că, în acest studiu au fost ignoraţi şi alţi factori care influenţează rata inflaţiei, cum ar
fi: politicile guvernamentale, fiscalitatea, nivelul importurilor, cursul de schimb al leului, etc..

O analiză critică a modelului III de regresie liniară

Modelul III de regresie liniară a fost construit pe baza celor 6 ipoteze, care
îngustează aplicabilitatea lui şi pun sub semnul întrebării relevanţa rezultatelor care se pot
obţine cu acest model. Aceasta justifică enunţarea următoarelor observaţii critice.
O1. Ipoteza 1 determină caracterul liniar al modelului în raport cu parametrii
necunoscuţi , deşi modelul poate să nu fie liniar în raport cu variabilele de control
. Astfel există şi cazuri în care legăturile dintre parametrii sunt neliniare,
ceea ce pune în discuţie adecvarea modelului III; totuşi, în anumite cazuri de neliniaritate se
poate vorbi de o liniaritate în logaritmi. Pentru a exemplifica, să presupunem că valorile de
selecţie sunt de forma:

.
Deoarece se poate logaritma în baza e relaţia (*) şi se obţine:
.
Utilizând notaţiile:
unde şi
, şi ,
se obţine modelul econometric: , care este de tipul III.
O2. Ipotezele 3 şi 4 referitoare la erorile aleatore, implică faptul că ele sunt
variabile aleatoare necorelate, cu aceeeaşi medie şi dispersie, ceea ce în realitatea economică
nu este întotdeauna adevărat.
O3. Ipoteza 5 postulează că matricea are toate elementele constante în
raport cu selecţiile repetate. Acest lucru ar fi sigur adevărat, numai în cazul experimentelor
de laborator, unde experimentatorul are controlul asupra variabilelor şi poate să observe în
mod repetat efectele depinzând de aceste variabile de control, care au o valoare fixată.
În general, într-o cercetare a unui fenomen economic, variabilele de control ale
ecuaţiilor modelului econometric, adesea sunt generate ca variabile dependente de alte ecuaţii
de natură stochastică şi astfel ele nu vor avea nici aceeaşi valoare, eventual fixată, pentru
selecţii repetate şi nici valorile pe care le doreşte cercetătorul; în acest caz vectorul este
condiţionat de variabilele de control, care sunt de natură stochastică , ceea ce face ca matricea
să nu fie constantă în raport cu selecţiile repetate.
O4. Modelul III de regresie liniară ar trebui să ţină seama de mulţimea tuturor
factorilor care influenţează în realitate caracteristica cercetată . În situaţiile economice
reale, rar sau niciodată, nu se ştie exact mulţimea tuturor factorilor şi ca urmare, anumiţi
factori relevanţi pot fi excluşi din model, iar factori străini să fie consideraţi în model.
O5. Despre valorile de selecţie , ce alcătuiesc vectorul , se
presupune implicit că nu sunt afectate de erori de măsurare; în realitate puţine legături
economice sunt ferite de „şocuri” aleatoare şi sunt neafectate de erori de măsurare.
O6. Despre valorile parametrilor locali se acceptă neexplicit
ipoteza că sunt constante, invariabile în timp şi nu depind de unitatea de măsură. În economie,
sistemele cu care se lucrează nu sunt întotdeauna staţionare, ceea ce face ca această ipoteză
să nu fie, uneori, în concordanţă cu realitatea economică.
O7. În general, modelele econometrice sunt construite pe baza unor ipoteze,
care simplifică realitatea economică ( afirmaţia este valabilă şi în cazul altor tipuri de
modele ). În particular, modelul III de regresie liniară poate, să nu fie suficient de adecvat faţă
de un proces economic modelat, deşi a fost construit pe baza datelor de selecţie, rezultate în
urma procesului economic şi nu ar fi surprinzător dacă modelul nu acoperă întreaga realitate
economică modelată.
În concluzie, această analiză critică are drept scop conştientizarea caracterului
simplificator al ipotezelor, care se află la baza construirii modelului III de regresie liniară,
necesitatea de a încerca şi de a realiza, în aplicaţii, concordanţa şi adecvarea modelului cu
realitatea economică modelată.
Trebuie subliniat (nu trebuie uitat) că slăbiciunile semnalate ale modelului III
pot avea consecinţe destul de grave, la nivelul performanţei modelului.
..............................................................................................................................
CURS 5

Estimarea parametrilor modelului III de regresie liniară

Fie modelul III de regresie liniară:


.
Are loc următoare proprietate:
PROPOZIŢIE.
Demonstraţie. deoarece .
Observaţie. Deoarece şi , se poate spune că, în medie,
modelul III de regresie liniară este corect.
Problemă. Să se estimeze parametrii necunoscuţi şi din modelul III de
regresie liniară, pe baza vectorului de selecţie .

a) Estimarea vectorului
În acest caz se va utiliza metoda celor mai mici pătrate (MMP). Conform metodei,
pentru a se determina estimaţia lui , mai întâi, se calculează , suma pătratelor
erorilor, unde:
.
Prelucrarea lui se face astfel:
,
sau
,
deoarece .

___________________[N.S.] Optimizarea funcţiilor vectoriale ____________________


Fie o funcţie vectorială cu valori reale şi se consideră problema:
(*) .
DEFINIŢIE. Vectorul este soluţie a problemei (*), dacă:
1) satisface condiţia necesară:
;
2) satisface condiţia suficientă:

este o matrice pozitiv definită, şi atunci este un punct de minim, respectiv o matrice
negativ definită, şi atunci este un punct de maxim, unde este hessianul lui , o
matrice funcţională pătratică.
Reguli de calcul
1) Dacă , x, a  R n , atunci :

2) Dacă , , atunci :

şi ;

3) Dacă , , atunci :

şi .
Caz particular. este matrice simetrică. Atunci formulele devin:
şi .

Fie soluţia optimă a problemei:


.
Atunci verifică condiţia necesară:
,
adică:
.
Deoarece este nesingulară, în baza consecinţei 2 de la ipoteza 2, rezultă că:
.
Vectorul se numeşte estimatorul (estimaţia) în sensul celor mai mici pătrate al
vectorului parametrilor locali .
Observaţii. 1) este un vector aleator, deoarece depinde de vectorul aleator ;
2) este o funcţie liniară de . Într-adevăr, dacă se face notaţia:

se obţine .
Câteva proprietăţi statistice ale lui sunt stabilite de următoarele afirmaţii.
PROPOZIŢIE. este o estimaţie nedeplastă a lui .
Demonstraţie. Are loc:
.
Observaţii. 1) Dacă se fac selecţii repetate, atunci în medie reprezintă adevărata
valoare a lui .
2) Pentru o anumită selecţie efectuată ( valoare a lui ) estimatorul poate avea o
valoare corespunzătoare, estimaţia lui , diferită de valoarea adevărată a lui , atât ca
semn cât şi ca mărime.

Componenetele lui pot să difere de la o selecţie la alta, deoarece este un vector


aleator şi atunci este util să se cunoască precizia estimării punctuale, evaluând împrăştierea
faţă de medie a valorilor lui . Aceste informaţii sunt date de matricea de covarianţă a lui
b , notată prin  b .
PROPOZIŢIE. Are loc: .
Demonstraţie. Are loc:

şi se poate scrie
=
= ,
în baza consecinţei 5 de la ipoteza 4.
Observaţie. Deoarece este o matrice cunoscută, în baza ipotezei 5, rezultă că
este o matrice cunoscută, iar dacă există o estimaţiea lui , atunci se poate
construi o estimaţie a lui  b pentru b determinat pe baza unei selecţii.

Se consideră LN, clasa tuturor estimatorilor (estimaţiilor) liniari şi nedeplasaţi ai lui


.
LN

Atunci o estimaţie oarecare din această clasă, notată prin , are forma , unde
şi este o matrice care nu depinde de sau de alţi parametrii necunoscuţi; un
element particular al acestei clase este determinat specificând matricea B . De exemplu, b
face parte din această clasă deoarece el este determinat de matricea , care este un caz
particular de matrice .
_______________________[N.S] Matrice pozitiv sau negativ semidefinită___________
DEFINIŢIE. Fie o matrice simetrică. se numeşte pozitiv (negativ)
semidefinită, dacă :
.
PROPOZIŢIE. Fie . Atunci este o matrice pozitiv
semidefinită.
Demonstraţie. Deoarece , rezultă că este simetrică. Fie .
Atunci şi este o matrice pozitiv semidefinită.

În clasa LN estimatorul a lui are o calitate deosebită, pusă în evidenţă de


următoarea teoremă.
Fie , şi doi estimaţii liniare şi nedeplasate ale lui , ale căror
matrice de covarianţă sunt şi respectiv .
DEFINIŢIE. Estimaţia este mai „bună” decât estimaţia , dacă matricea
este pozitiv semidefinită sau matricea este negativ semidefinită.
TEOREMA GAUSS-MARKOV. Estimţia este cea mai bună estimaţie din clasa
LN a lui .
Demonstraţie. Fie cu .
Ideea. Se demonstrează că matricea este pozitiv semidefinită.
Mai întâi, se consideră matricea:
.
Rezultă că:
şi =
.
Pe de altă parte, este o estimaţie nedeplasată, dacă şi numai dacă .
Atunci:

.
Prin urmare: . Atunci matricea de
covarianţă a lui devine:

.
Deoarece şi se obţine:
.
În concluzie , care este o matrice pozitiv semidefinită şi deci este
cea mai bună estimaţie liniară şi nedeplasată.

b) Estimarea parametrului

Deoarece suma nu conţine pe , nu poate fi utilizată pentru estimarea


lui .
În baza consecinţei 5 de la ipoteza 4 are loc . Atunci se

poate scrie: .

Se fac următoarele notaţii:



Y  X  b şi .
PROPOZIŢIE. Are loc: .
Demonstraţie. .
Consecinţă. Y este o estimaţie pentru MY  , iar

este o estimaţie a lui .

Într-adevăr, este o estimaţie a lui şi rezultă că este o estimaţie a lui ,


adică Y este o estimaţie a lui MY  , iar în baza propoziţiei de mai sus, rezultă că

este o
estimaţie nedeplasată a lui MY  .
Pe de altă parte, deoarece Y este o estimaţie a lui MY  , rezultă că

este o

estimaţie a lui , adică  este o estimaţie a lui .

Din definiţia lui rezultă:


sau .
DEFINIŢIE. Relaţia:

se numeşte ecuaţia de predicţie, corespunzătoare modelului III de regresie liniară.

Se pot face următoarele prelucrări:


=
 
= In  X X T X 
1

XT Y .
Fie . Cu această notaţie se obţine:

  B .

____________________[N.S.] Matrice idempotentă____________________________


DEFINIŢIE. Matricea pătratică se numeşte idempotentă, dacă
.
PROPRIETATE. Dacă este simetrică şi idempotentă, atunci are toate
valorile proprii egale cu zero sau cu 1.

PROPOZIŢIE. Matricea este simetrică şi idempotentă.


Demonstraţie. Deoarece:
,
rezultă că este simetrică.
Deoarece:
-
- ,
rezultă că este idempotentă.
Consecinţă. are toate valorile proprii egale cu zero sau cu 1.
Pentru a estima parametrul se va utiliza funcţionala pătratică:

în locul lui . Pe de altă parte, se poate exprima în funcţie de , astfel:


= ,
adică este o funcţională pătratică în componentele lui .
Natura lui este pusă în evidenţă de următoarea afirmaţie.
Observaţie. este o variabilă aleatoare unidimensională.
_________________[N.S.] Urma unei matrice __________________________________
DEFINIŢIE. Se numeşte urma matricei şi se notează prin
, numărul complex:

Caz particular. Dacă , atunci .


PROPOZIŢIE. Sunt adevărate următoarele proprietăţi:
1) .
2) .
Observaţie. Proprietatea 2 este adevărată şi în condiţii mai generale, în care cele 3
matrice nu sunt toate de acelaşi tip, dar există cele 3 produse.
3)
4) .
5) şi inversabilă, rezultă .
6) şi .
PROPOZIŢIE. Sunt adevărate proprietăţile:
1) .
2) .

3) M S    n  k  .
2

 
Demonstraţie. 1) Rezultă din faptul că .
2) .
3)
= , deoarece şi sunt operatori liniari permutabili. Pe de altă parte, are loc:

= , în baza observaţiei de mai sus.


În concluzie: .

Se face notaţia: . Legătura dintre şi este stabilită de


următoarea afirmaţie.
PROPOZIŢIE. .

Demonstraţie. .

Consecinţă.  2 este un estimator nedeplasat al lui  2 .

O altă formă a lui  2 este dată de următoarea afirmaţie.

PROPOZIŢIE. .
Demonstraţie. Se poate scrie:


= YT YT X X T X 1
XT  I n 
 X XTX 
1
XT Y 
.
Cu ajutorul estimaţiei a lui se poate construi o estimaţie a matricei de
covarianţă , notată prin , de forma:

 
 1
b   X T X , 2

ale cărei elemente de pe diagonala principală sunt estimaţii ale dispersiilor elementelor lui ,
iar celelalte elemente sunt estimaţii ale covarianţelor dintre elementele vectorului .
....................................................................................................

CURS 6

EXPERIMENT ALEATOR UTILIZÂND MODELUL III


DE REGRESIE LINIARĂ

Se consideră modelul III de regresie liniară, pentru a fi supus un experiment aleator pe


calculator, utilizând limbajul Gauss.
Fie ecauţia modelului III:
Y  Xm   ,
unde este vectorul de selecţie ( al observaţiilor sau efectelor ), vectorul
parametrilor locali este

, iar este vectorul aleator al erorilor inobservabile, cu

şi .
În acest caz, cel care face experimentul joacă rolul naturii şi prin urmare cunoaşte
vectorul parametrilor locali şi parametrul . Pe baza unei matrice cadru cunoscute
şi utilizând un generator de numere pseudoaleatoare se produc selecţii repetate, care formează
valorile lui .
Conform rezultatelor teoretice cunoscute, se determină estimatorul a lui , în
sensul celor mai mici pătrate, pentru ( fixat ) selecţii repetate şi pentru dat.
__________________[N.S.] Generatori de numere pseudoaleatoare _________________

DEFINIŢIE. Se numeşte şir de numere aleatoare un şir de variabile aleatoare


independente, cu aceeaşi repartiţie, astfel încât termenii nu se repetă.
DEFINIŢIE. Se numeşte şir de numere pseudoaleatoare un şir de variabile
aleatoare qusi-independente, cu aceaşi repartiţie, ai cărui termeni se repetă de la un
rang suficient de mare.
DEFINIŢIE. Se numeşte generator de numere pseudoaleatoare, un procedeu
aritmetic recurent de producere a unui şir , utilizând o relaţie de recurenţă de
forma:
.
Un exemplu de generator este generatorul congruenţial liniar, notat prin
X 0 , a, c, M  , care produce un şir X n nN de numere pseudoaleatoare, utilizând relaţia
de recurenţă:
,
unde X 0 este numărul iniţial ( sămânţa-seed ) de la care porneşte generatorul, a este un
factor de multiplicare, este numărul în raport cu care se calculează clasele de
c
resturi, iar este o constantă.
Observaţie. Dacă , atunci se obţine generatorul congruenţial liniar
multiplicativ, iar dacă se obţine generatorul congruenţial mixt.
În Gauss există implementat un generator congruenţial liniar cu următorii parametrii:
X 0 este valoarea ceasului sau este setat, utilizând comanda rndseed;
;
;
.
DEFINIŢIE. Se numeşte perioada şirului  X n nN de numere pseudoaleatoare şi
se notează prin  , numărul natural cu proprietatea:
X n    X n , n  N .
Observaţie. Are loc:   M .
DEFINIŢIE. Şirul de numere pseudoaleatoare are perioada maximă,
dacă .
Se pune problema construirii unui generator de şiruri pseudoaleatoare cu perioadă
maximă. Condiţii suficiente, pentru ca un generator congruenţial liniar să producă un şir cu
perioada maximă, sunt date de următoarea afirmaţie.
TEOREMĂ. Generatorul produce un şir cu perioada maximă,
dacă:
1) ;
2) este un multiplu de divizor prim al lui ,
3) este divizibil cu 4, dacă este divizibil cu 4.
Utilizând un generator de numere pseudoaleatoare cu o repartiţie uniformă continuă pe
, având media 0 şi dispersia , se generează selecţii de volum asupra lui .
Apoi, se calculează vectorul , ce reprezintă partea sistematică şi se produc selecţii de
volum asupra lui , utilizând ecuaţia Y  Xm   .
În final, se compară valorile vectorului cu valorile lui .
Aplicaţie numerică.(ex1gr69) şi
are această formă:

O APLICAŢIE A MODELULUI III


DE REGRESIE LINIARĂ
Să se construiască modelul econometric al procesului de producţie al cărnii de pasăre,
desfăşurat într-un interval de 15 săptămâni, timp în care un pui ieşit din ou se transformă într-
un exemplar matur, apt pentru a fi comercializat.
În acest scop trebuie tabelată greutatea medie a unui lot de exemplare şi consumul
mediu corespunzător de nutreţuri în intervalul de 15 săptămâni.
Fie greutatea medie stabilită pentru un lot de exemplare la sfârşitul săptămânii
şi fie consumul cumulat mediu de nutreţuri până la momentul .
Atunci funcţia de producţie care modelează acest proces de producţie, ignorând în
această fază erorile, are forma:
.
Pentru a se stabili forma analitică a funcţiei trebuie să se ţină seama de faptul că o
creştere cu o unitate a consumului de nutreţuri produce o creştere din ce în ce mai mică a
greutăţii unui pui. Această caracteristică a procesului de producţie exprimă o relaţie
crescătoare între şi , dar cu rata de creştere descrescătoare. Ca urmare, graficul lui
este o parte din graficul unei funcţii polinomiale de gradul 2, cu coeficientul dominant strict
negativ, ( 0 ), de forma:

Yt
greutate

Consum Xt2

consum X2t

Prin urmare funcţia are următoarea formă analitică:


,
unde 0 şi 0, deoarece productivitatea marginală este pozitivă şi descrescătoare.
În acest demers nu s-a ţinut seama, de toţi factorii care influenţează procesul de
producţie. Ca urmare trebuie ca în relaţia (*) să fie inclus şi un termen „ eroare”, notat prin
, astfel că forma finală a lui este:
, .
Pentru a se construi modelul econometric se fac următoarele notaţii:
unde şi
, şi
.
Cu aceste notaţii, modelul econometric al procesului de producţie pentru carnea de
pasăre are forma:
Y  Xm   .
Acest model este liniar în parametrii locali , dar nu este liniar în variabila
de control .
Exemplu numeric. Se consideră procesul de producţie al cărnii de pasăre, care este
echivalat cu un experiment pe o durată de 15 săptămâni ce generează următoarele date:

a) Să se scrie modelul econometric adecvat procesului de producţie.


b) Să se estimeze parametrii modelului econometric.
c) Să se determine funcţia de producţie estimată.
d) Să se determine greutatea medie optimă de vânzare a unui exemplar matur.

Indicaţie. c) .

d) Se utilizează relaţia:

, unde este preţul unitar al nutreţului, iar este preţul

de vânzare al unui exemplar.

Predictibilitatea modelului III de regresie liniară


În cazul multor decizii privind probleme economice reale este justificat accentul
pus pe estimarea parametrilor modelului III de regresie liniară utilizat. Totuşi, există şi
cazuri în care se acordă o mare atenţie capacităţii de predictibilitate ( previziune ) a
modelului construit, privind vectorul efectelor , în funcţie de numărul diferit al
variabilelor de control ( explicative ) luate în considerare.
Pentru a aborda chestiunea predictibilităţii cu modelul III de regresie liniară se
consideră ecuaţia modelului:
Y  Xm  
şi se pune problema alegerii unei funcţii de predicţie, care să minimizeze pătratul erorilor de
predicţie.
În acest scop se fac următoarele notaţii:
este vectorul format cu valorile viitoare ale efectelor, care sunt considerate

ca fiind valorile unei selecţii viitoare de volum ;

este matricea cunoscută formată cu valorile viitoare ale variabilelor de


control;
Cu aceste notaţii, modelul III de regresie liniară corespunzător lui şi are
forma:
,

unde este vectorul aleator al erorilor viitoare, cu media şi matricea de

covarianţă , independent de .

Deoarece este estimaţia în sensul celor mai mici pătrate a lui ,


funcţia de predictibilitate pentru este dată de următoarea relaţie:

unde este o estimaţie nedeplastă a lui , deoarece .


Această funcţie de predictibilitate are la bază următoarea ipoteză.
IPOTEZA S. Procesul de selecţie are aceleaşi caracteristici pentru şi pentru Y0
.

Presupunând adevărată această ipoteză are sens diferenţa , numită eroarea de

predicţie, care este un vector aleator şi are următoarea proprietate.



PROPOZIŢIE. Y 0 este o estimaţie nedeplasată a lui .
Demonstraţie. Se poate scrie:

. Rezultă

 
că: M Y 0   MY0  şi deci Y 0 este o estimaţie nedeplasată a lui

.
 
Alte informaţii privind eroarea de predicţie sunt furnizate de matricea de covarianţă

, care se calculează astfel:

+ , deoarece şi sunt variabile aleatoare independente.

Interpretarea acestui rezultat este următoarea: abaterea erorii de predicţie de la media


sa are 2 componente; prima este datorată erorii care se face prin estimarea paremetrului şi
cea de a doua este datorată erorii .
? ....În unele situaţii interesează mai mult media vectorului Y0 , decât vectorul însuşi.

În acest caz, ştiind că şi Y 0 este o estimaţie nedeplasată a lui , se

poate calcula matricea de covarianţă a vectorului aleator , obţinându-se:

   
T


 
 
 M  Y 0  X 0 m  Y 0  X 0 m    M X 0 b  X 0 m X 0 b  X 0 m  
T

Y0  X 0m
   

= , deoarece .

Rezultă că eroarea, care se face estimând prin Y 0 , depinde de alegerea matricei

, care conţine valorile viitoare ale variabilelor de control.

Influenţa creşterii numărului de parametrii


în cadrul modelului III de regresie liniară
În modelul I de regresie liniară se utilizează un singur parametru, în funcţie de care se
calculează media vectorului aleator , în timp ce în modelul III de regresie liniară se
utilizează parametrii, iar în matricea X sunt coloane, dintre care k  1 coloane
conţin valorile variabilelor de control, ce se utilizează în calculul mediei lui .
Deoarece modelul III utilizează k  1 parametrii în plus faţă de modelul I şi
corespunzător lor matricea X are în plus coloane, trebuie stabilită proporţia din totalul
variabilităţii lui , datorată considerării în plus a celor vectori coloană din X ,
corespunzători variabilelor de control.
Pentru aceasta se consideră ecuaţia de predicţie corespunzătoare modelului III de
regresie liniară, care utilizează estimaţia , în sensul celor mai mici pătrate, a lui şi are
forma:
,

unde şi , iar este o estimaţie a lui , care are drept componente erorile
neexplicate şi este numit vectorul erorilor neexplicate.
Relaţia (1) se poate scrie şi astfel:
,

unde reprezintă partea, din variabilitatea lui Y , explicată prin includerea variabilelor de
control în modelul III de regresie liniară.
O măsură a variabilităţii lui Y se obţine considerând suma pătratelor componentelor
lui Y , dată de produsul Y T Y şi care se prelucrează astfel:

Se ştie că   B , unde B  I n  X X T X 1 X T  M n R  . Atunci are loc:


 not

.
Utilizând aceste rezultate în produsul se obţine:

sau
.
În baza relaţiei (2), rezultă că suma pătratelor componentelor lui este alcătuită din
două părţi:
a) partea care depinde de variabilele de control;
b) partea care depinde de erorile neexplicate.
...............................................................................................................

S-ar putea să vă placă și