Sunteți pe pagina 1din 112

INTRODUCERE IN

ECONOMETRIE.
PREZENTAREA
GENERALA A
MODELELOR
ECONOMETRICE

Stefan.Ionescu@profesor.rau.ro
BIBLIOGRAFIE

http://www.biblioteca-digitala.ase.ro/biblioteca
Tudorel Andrei, Regis Econometrie,
Bourbonnais Ed. Economica,
Bucureşti 2008
Eugen Stefan Pecican Econometria pentru… economisti
Stelian, Stancu, Tudorel Andrei, Introducere in Econometrie
Andreea iacob, Erika Tusa utilizand EViews,
Ed. Enciclopedica,
Bucuresti 2010
Rodica Gogonea, Marian Zaharia Econometrie cu aplicaţii în
comerţ – Turism – Servicii,
Ed. Universitară, 2008
BIBLIOGRAFIE IN LIMBA ENGLEZA

Greene, H. W. Econometric Analysis, New York,


Macmillan Publishing Company,
2000.
Kennedy, P. A Guide to Econometrics , The
MIT Press: Cambridge, MA 1992.
Wooldridge, J.M. Introductory Econometrics,
South-Western: Ohio 2003.
Baltagi, Badi H. Econometrics, Spriger, 2008.
INTRODUCERE IN ECONOMETRIE.
PREZENTAREA GENERALA A MODELELOR
ECONOMETRICE:

1. Econometrie - definiţii,
- concepte specifice,
- tipologia modelelor
econometrice
ELEMENTE DE TEORIA
PROBABILITĂŢILOR:
2. Variabile aleatoare vectoriale,
caracteristici numerice (matricea de
covarianţă, coeficientul de corelaţie)

Repartiţii fundamentale: Binomială,


Normală, Student, Fisher, Hi-pătrat
ELEMENTE DE
STATISTICĂ MATEMATICĂ:
3. Statistică descriptivă, repartiţii de
selecţie şi elemente de inferenţă
statistică
4. Elemente de teoria selecţiei
5. Elemente de teoria estimaţiei –
estimaţii punctuale şi intervale de
încredere
6. Verificarea ipotezelor statistice: teste
pentru dispersii şi pentru medii F-Test,
z-Test, t-Test)
ELEMENTE DE ECONOMETRIE

7. Modelul econometric unifactorial -


modelul clasic de regresie liniară simplă
8. Regresie liniară multiplă
9. Serii temporale
FINAL

10. TEST pentru verificarea


cunostintelor
11. Rezultatele testului. Recapitulare
pentru examen
SEMINAR

Prezentarea utilizării diferitelor


instrumente informatice pentru a ilustra
exemple de analiză econometrică:

 Excel

 Eviews

 SPSS

 STATISTICA
SISTEMUL DE NOTARE

 TESTFINAL – 50%
 SEMINAR – 50% compus din:
• 20% participare activa la seminar
• 30% prezentarea unui proiect

Precizari:
- La testul final pot participa studentii care au o
prezenta de peste 70% la seminarii/cursuri si
care au obtinut minim nota 5 la seminar
- Studentii care in urma testului final au obtinut
media generala minim 8, sunt absolviti de
prezenta la examenul din sesiune.
CE TREBUIE SA STIM INAINTE DE A INCEPE
STUDIUL ECONOMETRIEI?

 Elemente de economie politica


 Matematica la nivelul clasei a XII-a
 Notiuni de statistica matematica
 Cunostinte de logica
ESTE ECONOMETRIA UTILA?

 Econometria foloseste o serie de instrumente ce


sunt utilizate in contabilitate, finante,
marketing, management, stiinte sociale, istorie,
stiinte politice, sociologie
 Pot sa gandesc ca un economist! (cost de
oportunitate, cerere, oferta, comportament
macroeconomic, tranzactii internationale)
 Drumul de la “student economist” la “economist
practician” trece prin econometrie
LA SFARSITUL SEMESTRULUI VETI PUTEA:

 Sa folositi metode pentru estimarea efectelor


cauzale folosind seturi de date observaționale;
 Sa folositi diferite instrumente pentru predictare,
folosind serii de timp
 Sa va focusati pe aplicatii – teoria va fi folosita
doar pentru a intelege metodele folosite
 Sa evaluati analizele econometrice facute de altii-
adica veti putea citi/intelege lucrari economice,
analize empirice din alte cursuri
 Sa construiti modele econometrice pentru
problemele economice care va intereseaza
DEFINITIILE ECONOMETRIEI

 OIKONOMIE = economie
 METRON = masurare

 Economia studiaza ”ce fel de” si “de ce”


exista legaturi intre variabilele economice
 Econometria presupune masurarea
acestor legaturi si folosirea lor pentru
predictii
DEFINITIILE ECONOMETRIEI

 Econometria este o unificare a:


 Statisticii
 Matematicii

 Teoriei Economice
DE CE NU ESTE ECONOMETRIA DOAR
STATISTICA?

 Se foloseste multa statistica, dar statistica


este folosita în principal de științele
naturale.
 Colectare, procesare, prezentare a datelor
 In general,problemele de interes pentru
econometricieni sunt diferite:
 Corelatia seriala
 Date eronate, in feluri extrem de diferite fata

de cum le intalnim in alte stiinte


 Lipsa capacității de a face experimente

controlate.
DE CE NU ESTE ECONOMETRIA DOAR
MATEMATICA?

 Intr-adevar, matematica este folosita


intens, mai ales in partea teoretica a
econometriei, totusi ea este folosita doar
ca instrument!
 Spre deosebire de matematicile aplicate in
economie, econometria testeaza empiric
rezultatele obtinute
DE CE NU ESTE ECONOMETRIA DOAR
TEORIE ECONOMICA?

 Econometria este construita pe baza teoriei


economice
 Intotdeauna incepem analiza printr-un model
economic
 Totusi, economia nu ne spune cum sa aranjam
valorile numerice – ipotezele economice sunt mai
ales calitative
RAGNAR FRISCH – ECONOMETRICA (1933)

 “Experienţa a arătat că fiecare din


următoarele puncte de vedere, al statisticii,
al teoriei economice şi al matematicii, este
o condiţie necesară, dar nu şi suficientă,
pentru o înţelegere efectivă a realităţilor
cantitative din economia modernă;
unificarea lor este aceea care asigură
eficienţa. Econometria este tocmai această
unificare”.
TEORIE – APLICATIE

 Econometria teoretica dezvolta metode


 Econometria aplicata foloseste metodele

 Delimitarea nu poate fi facuta perfect


 Cei care dezvolta metodele trebuie sa analizeze ce se
intampla cand metodele sunt aplicate incorect. Ei
trebuie sa cunoasca problemele de care se lovesc
practicienii
 Cei care aplica metodele vor intalni relativ des
probleme care nu au aparut pana la acel moment si
vor adapta “din mers” metodele existente sau vor
dezvolta altele noi.
DESPRE CE ESTE ECONOMETRIA?

Consumul = f (venit)
 Cererea pentru un bun individual, de
exemplu cererea pentru automobilele Dacia:
𝑄 𝑐 = f(𝑃, 𝑃 𝑠 , 𝑃𝑐 , 𝑉)
 𝑄 𝑐 = Cantitatea de automobile Dacia cerute de piata
 𝑃= Pretul automobilelor Dacia

 𝑃 = Pretul masinilor care pot fi considerate concurenti


𝑠

directi, de exemplu: Chevrolet Aveo


 𝑃 = Pretul elementelor complementare, de exemplu
𝑐

pretul benzinei
 V= Nivelul venitului mediu
EXEMPLUL RATEI DE REFERINTA
TIPURI DE PROBLEME LA CARE SE RASPUNDE
UNEI INTREBARI “CAT DE MULT?”

 Consiliul local doreste sa afle cu cat va scadea


criminalitatea daca se vor cheltui 1 milion de
euro pentru cresterea numarului de politisti
comunitari
 Proprietarul unui fast-food vrea sa stie cata
publicitate sa cumpere si doreste estimarea
relatiei dintre reclama si vanzari
 O universitate trebuie sa estimeze cu cat va
scadea numarul studentilor daca vor creste taxa
de studii si daca veniturile vor creste sau vor
scade
TIPURI DE PROBLEME LA CARE SE RASPUNDE
UNEI INTREBARI “CAT DE MULT?”

 Un dezvoltator imobiliar trebuie sa predicteze cu cat


va creste populatia si venitul acesteia in zona de sud
a capitalei pe un orizont de 5 ani, astfel incat
investitia intr-un mall si un centru de fitness sa fie
profitabila
 O persoana trebuie sa decida unde isi va plasa
economiile. Cat va pune la banca, cat va pune intr-
un fond de investitii? Decizia depinde de predictii
privind rata inflatiei, cresterea economica, ratele
dobanzilor, etc.
 RATB trebuie sa decida cum cresterea pretului
calatoriei va afecta numarul calatorilor si efectul
asupra veniturilor.
CUM SE RASPUNDE LA ACESTE INTREBARI?

 Factorii de decizie se bazeaza pe informatii


obtinute din cercetari economice empirice
 Economistul foloseste teoria economica si
logica pentru a construi relatii intre variabile
 Valorile variabilelor sunt culese iar apoi,
modelele econometrice sunt folosite pentru
estimarea parametrilor si pentru efectuarea
predictiilor
CINE SUNT FACTORII DE DECIZIE?

 BNR are o intreaga “armata” de economisti


specializati in analiza econometrica
 CEO-ul unei companii poate angaja consultanti
specialisti in econometrie pentru a efectua
predictii despre vanzari.
 O persoana fizica poate apela la un broker care la
randul lui se bazeaza pe predictiile econometrice
facute de economistii din compania mama

* Sursa raspunsurilor pentru intrebarile “cat de


mult” ar trebui sa aiba in spate un economist care
foloseste metode econometrice!
MODELUL ECONOMETRIC

 Teoria economica nu poate predicta comportamentul


unui individ anume ci mai degraba, comportamentul
mediu, sau cel mai probabil al mai multor indivizi.
 Studiind vanzarile Dacia pe diverse piete, vom vedea
ca valoarea reala va fi o suma intre partea predictata
si o componenta aleatoare, nepredictibila, numita
eroare aleatoare: e
𝑄𝑐 = f 𝑃, 𝑃 𝑠 , 𝑃𝑐 , 𝑉 + 𝑒
unde e cuantifica toti factorii pe care nu i-am
luat in calcul pentru acest model,
reflectand totodata si incertitudinea din
activitatea economica
MODELUL ECONOMETRIC

 Asa cum am presupus ca cererea este o functie


liniara de pret, vom extinde aceasta presupunere
pentru celelalte variabile:
𝑄𝑐 = 𝛽1 + 𝛽2 𝑃 + 𝛽3 𝑃 𝑠 + 𝛽4 𝑃𝑐 + 𝛽5 𝑉 + 𝑒

unde coeficientii 𝛽1 , 𝛽2 , 𝛽3, 𝛽4 , 𝛽5 sunt


parametri necunoscuti ai modelului

 Indiferent de modelul econometric, vom avea o


parte sistematica si o valoare aleatoare (zgomot)
MODELUL ECONOMETRIC

 Efectul “fluture”
 Alegerea variabilelor care exercita cea mai mare
influenta. Cate variabile alegem?
 Ce determina orbita lunii?

 Ce determina cererea totala de automobile?

 Pret vs. Marketing


MODELUL ECONOMETRIC

 Modelul econometric reprezinta baza pentru


inferenta statistica;
 Folosind un model econometric si un esantion de
date, realizam inferenta ce priveste lumea reala;
 Modelele econometrice pot da raspunsuri cu
privire la:
 Estimarea parametrilor
 Predictarea rezultatelor economice
 Testarea ipotezelor economice (alegerea variantei
optime)
CLASIFICARE MODELELOR ECONOMETRICE

 Dupa sectorul economic pe care il modeleaza


 Modele microeconomice
 Modele macroeconomice

 Dupa numarul variabilelor de influenta


 Modele unifactoriale
 Modele multifactoriale

 Dupa tipul functiei f


 Modele liniare
 Modele neliniare

 Dupa gradul de detaliere in raport cu factorul timp


 Modele sincrone
 Modele dinamice
LIMITELE MODELULUI ECONOMETRIC

 Exprima doar coordonatele principale ale


procesului economic analizat;
 Relatiile dintre variabile au adeseori o forma
simplificata
 O zona reziduala ramane in afara cunoasterii

 Principalele surse de erori (comportamentul


uman, clima) nu sunt cuantificate in general
 Econometria se refera cu precadere la relatii de
cauzalitate si la evolutia in timp (se neglijeaza
alte aspecte cuantificabile: programarea
activitatilor, obtinerea de valori optime)
TIPURI DE DATE PRIMARE
IN FUNCTIE DE MODUL IN CARE SUNT OBTINUTE

 Date experimentale – experimente de tip controlat


 Izolarea fenomenelor si proceselor studiate
 Eliminarea influentelor externe care nu reprezinta
interes pentru analiza
 “date de laborator”

 Date non-experimentale – date observationale


 Observarea fenomenelor si proceselor in miscarea lor
naturala, libera
 Nu se exercita niciun control asupra fenomenelor si
proceselor investigate
 Observare pasiva, constatare
 Specific domeniului economico social
TIPURI DE DATE PRIMARE
DIN PUNCT DE VEDERE CRONOLOGIC

 Date de tip profil (de tip secventa/sectiune)


 “taieturi informationale”
 Masuratori de natura statica efectuate la acelasi
moment de timp
 Nu incorporeaza influenta timpului

 Date de tip serii de timp (serii cronologice)


 Masuratori efectuate la anumite intervale de timp
 Pot fi de tip interval sau de tip moment
 Date de tip panel
 Masuratori efectuate atat de-a lungul unitatilor
individuale cat si de-a lungul timpului
 Taieturi informationale mixte
SURSE DE DATE

 Institutul national de statistica


 www.insse.ro
 Resources for Economists
 www.rfe.org
 US Census Bureau
 www.fedstats.gov
 EconEdLink
 www.econedlink.org/datalink
 Economagic
 www.economagic.com
REPARTITII ASIMETRICE
SKEWNESS

 Skewness - indicator folosit in analiza distributiei


unei serii de date pentru a indica deviatia distributiei
empirice in raport cu o distributie simetrica in jurul
mediei.

Interpretare:
 Skewness > 0 - distributia este inclinata spre stanga,
avand mai multe valori extreme spre dreapta.
 Skewness < 0 - distributia este inclinata spre dreapta,
avand mai multe valori extreme spre stanga.
 Skewness = 0 - media = mediana, distributia este
simetrica in jurul mediei.
SKEWNESS
KURTOSIS

 Kurtosis - indicator folosit in analiza distributiei unei serii


de date pentru a indica gradul de aplatizare sau de ascutire
a unei distributii.
Interpretare:

 Kurtosis > 3 - distributie leptokurtica, mai ascutita decat o


distibutie normala; avand mai multe valori concentrate in
jurul mediei si cozi mai groase ceeea ce inseamna
probabilitati ridicate pentru valorile extreme.
 Kurtosis < 3 - distributie platikurtica, mai plata decat o
distibutie normal avand valori dispersate pe un interval
mai mare in jurul mediei. Probabilitatea pentru valori
extreme este mai mica decat in cazul unei distributii
normale.
 Kurtosis = 3 - distributie mezokurtica - exemplu distributia
normala.
SALARII
DISPERSIA GENERALA A COLECTIVITATII IN
FUNCTIE DE DISPERSIILE PARTIALE

𝑛𝑎 𝜎𝑥2ҧ𝑎 + 𝑛𝑏 𝜎𝑥2ҧ𝑏 𝑛𝑎 𝑥ҧ𝑎 − 𝑥ҧ 2 + 𝑛𝑏 𝑥ҧ𝑏 − 𝑥ҧ 2


𝜎𝑥2ҧ = +
𝑛𝑎 + 𝑛𝑏 𝑛𝑎 + 𝑛 𝑏
 Sintetizeaza imprastierea tuturor
valorilor individuale din colectivitatea
generala cauzata atat de influenta
factorilor aleatori, care actioneaza in
interiorul subcolectivitatilor, cat si
influenta factorului sistematic in functie
de care s-a structurat colectivitatea
generala
MEDIA DISPERSIILOR PARTIALE

2 2
2
𝑛𝑎 𝜎𝑥ҧ𝑎 + 𝑛𝑏 𝜎𝑥ҧ𝑏
𝜎ത𝑥ҧ =
𝑛𝑎 + 𝑛𝑏
- Sintetizeaza variatia (imprastierea
din interiorul subcolectivitatilor;
- Se datoreaza factorilor specifici,
aleatori.
DISPERSIA DINTRE GRUPE
2 2
2 𝑛 𝑥ҧ
𝑎 𝑎 − 𝑥ҧ + 𝑛𝑏 𝑥ҧ𝑏 − 𝑥ҧ
𝛿𝑥ҧ =
𝑛𝑎 + 𝑛𝑏
- Dispersia mediilor partiale de la media
generala.
- Sintetizeaza influenta factorului
sistematic, de structurare a colectivitatii,
asupra imprastierii generale a valorilor
individuale.
- Sintetizeaza variatia dintre
subcolectivitatile in care s-a structurat
colectivitatea generala
GRAD DE DETERMINATIE

2
2
𝛿𝑥ҧ
𝑅 = 2
𝜎𝑥ҧ
- Exprima masura in care variatia
caracteristicii urmarite depinde de factorul
sistematic dupa care s-a structurat
colectivitatea
GRAD DE NEDETERMINARE

2
2
𝜎ത𝑥ҧ 2
𝐾 = 2 =1− 𝑅
𝜎𝑥ҧ

- Exprima masura in care variatia


caracteristicii urmarite este
dependenta de variatia factorilor care
actioneaza in interiorul
subcolectivitatilor
DISPERSIA (VARIANȚA) 0 ≤ 𝜎𝑥2ҧ < ∞

2
𝑥1 − 𝑥ҧ 𝑛1 + 𝑥2 − 𝑥ҧ 2 𝑛2 + ⋯ + 𝑥𝑚 − 𝑥ҧ 2
𝑛𝑚
𝜎𝑥2ҧ =
𝑛1 + 𝑛2 + ⋯ + 𝑛𝑚 − 1
σ𝑖=𝑚
𝑖=1 𝑥𝑖 − 𝑥ҧ 2 𝑛𝑖
=
σ𝑖=𝑚
𝑖=1 𝑛𝑖 − 1

𝑥𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖 𝑥𝑖 − 𝑥ҧ 𝑥𝑖 − 𝑥ҧ 2 𝑥𝑖 − 𝑥ҧ 2𝑛
𝑖

𝑖=𝑚 𝑖=𝑚
2𝑛
෍ 𝑛𝑖 ෍ 𝑥𝑖 − 𝑥ҧ 𝑖
𝑖=1 𝑖=1
ABATEREA MEDIE PATRATICA
(STANDARD DEVIATION)

σ𝑖=𝑚
𝑖=1 𝑥𝑖 − 𝑥ҧ 2𝑛
𝑖
𝜎𝑥ҧ = 𝜎𝑥2ҧ = 𝑖=𝑚
σ𝑖=1 𝑛𝑖 − 1

0 ≤ 𝜎𝑥ҧ < ∞
 Aceeasi unitate de masura cu media
 Marime nescalata

 Cum se interpreteaza? Cum se fac comparatii?


EXEMPLU VARIATIE / ST.DEV.

Seria de date 𝑥ҧ 𝜎𝑥2ҧ 𝜎𝑥ҧ

3,5,4,4,5,3,4,5 4 0,25 0,5

2,5,5,5,3,5,4,5,4 4 0,1249 1,18


ABATEREA MEDIE PATRATICA
(STANDARD DEVIATION)
COEFICIENTUL DE OMOGENITATE

𝜎𝑥ҧ
𝑣𝑥ҧ = ∙ 100%
𝑥ҧ
- cel mai sintetic indicator al
imprastierii;
- Cuprins in inervalul 0%-100%
- <30%-35% colectivitate omogena
- >35% colectivitate eterogena
COEFICIENTUL DE OMOGENITATE

Seria de 𝑥ҧ 𝜎𝑥2ҧ 𝜎𝑥ҧ v


date
3,5,4,4,5,3,4, 4 0,25 0,5 12,5%
5
2,5,5,5,3,5,4, 4 0,1249 1,18 29,5%
5,4
COVARIANTA
𝑛
1
𝜎𝑥𝑦 = ෍ 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
𝑛−1
𝑖=1
𝑛
1
𝜎𝑥𝑥 = ෍ 𝑥𝑖 − 𝑥ҧ 𝑥𝑖 − 𝑥ҧ
𝑛−1
𝑖=1
 Este o masura a variatiei simultane a doua variabile

 Cu cat variatiile celor doua variabile in jurul mediilor


sunt mai apropiate ca magnitudine, covarianta este
mai mare.
 Variatie rpoportionala sau de sens contrar.
COEFICIENTUL DE CORELATIE PEARSON
𝜎𝑥𝑦
𝑟𝑥𝑦 = =
𝜎𝑥 𝜎𝑦
1
σ 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
= 𝑛 − 1
σ𝑖=𝑛
𝑖=1 𝑥𝑖 − 𝑥ҧ
2 σ 𝑖=𝑛
𝑖=1 𝑦𝑖 − 𝑦
ത 2

𝑛−1 𝑛−1
MEDII CALCULATE
 Exemplu
Sute de produse noi sunt lansate în fiecare an. Dintr-o varietate
de motive, multe dintre acestea nu reuşesc să cucerească piaţa.
De aceea, produsele care ajung în stagiul final de lansare pe piaţă
sunt evaluate de specialiştii în marketing, care doresc să facă
predicţii asupra succesului produselor (cu alte cuvinte, cât de bine
se vor vinde). Evident, informaţii complete şi sigure nu se pot
obţine şi atunci specialiştii vor dori să tragă concluzii valide, pe
baza datelor disponibile din cercetări parţiale. Să presupunem că
un lanţ de magazine doreşte să vândă un nou produs lansat pe
piaţă şi speră să aibă succes. După o analiză financiară,
specialiştii determină că, dacă mai mult de 10% dintre potenţialii
cumpărători vor cumpăra produsul, lanţul de magazine va obţine
profit. Un eşantion aleator de clienţi potenţiali este selectat şi
persoanele sunt întrebate dacă ar cumpăra produsul. Procedeul
de eşantionare şi de culegere a datelor este cunoscut, din
capitolele precedente, iar parametrul reprezintă proporţia
clienţilor care ar cumpăra produsul. Testarea ipotezei statistice se
referă, atunci, la a determina dacă proporţia cumpărătorilor este
mai mare de 10%.
TESTAREA IPOTEZELOR STATISTICE

Populatie statistica Sondaj Esantion

PARAMETRU estimat pe baza esantionului


(ESTIMATOR)

Parametrul estimat poate caracteriza intreaga


colectivitate?
IPOTEZA STATISTICA

 este ipoteza care se face cu privire la


parametrul unei repartiţii sau la
legea de repartiţie pe care o urmează
anumite variabile aleatoare.
 nu este neapărat adevărată. Ea
poate fi corectă sau greşită.
 Ipoteza statistică ce urmează a fi
testată se numeşte ipoteză nulă şi
este notată, uzual, H0
IPOTEZA STATISTICA

 Ipoteza statistică ce urmează a fi testată se


numeşte ipoteză nulă şi este notată, uzual,
H0
 Respingerea ipotezei nule care este testată
implică acceptarea unei alte ipoteze. Această
altă ipoteză este numită ipoteză
alternativă, notată H1
 Cele două ipoteze reprezintă teorii, mutual
exclusive şi exhaustive, asupra valorii
parametrului populaţiei sau legii de
repartiţie.
TESTAREA

 Procedeul de verificare a unei ipoteze


statistice se numeşte test sau criteriu de
semnificaţie.
 Există patru componente principale ale
unui test privind o ipoteză:
 ipoteza nulă;

 ipoteza alternativă;

 testul statistic;

 regiunea critică (de


respingere).
H0 - IPOTEZA NULĂ

 1)Se identifică ipoteza statistică


specială despre parametrul popu-
laţiei sau legea de repartiţie (H0).

- o singură valoare a
parametrului populaţiei;
- ceea ce este acceptat până se
dovedeşte a fi fals.
H1 - IPOTEZA ALTERNATIVA
 H1,ce reprezintă o teorie care contrazice ipoteza
nulă. Ea va fi acceptată doar când există
suficiente dovezi, evidenţe, pentru a se
stabili că este adevărată.

 poate căpăta trei forme


- dacă parametrul este diferit (mai mare
sau mai mic) decât valoarea specificată în
ipoteza nulă;
- dacă parametrul este mai mare decât
valoarea specificată în ipoteza nulă;
- dacă parametrul este mai mic decât
valoarea specificată în ipoteza nulă;
TESTUL STATISTIC

 Secalculează indicatorii statistici în


eşantion, utilizaţi pentru a accepta
sau a respinge ipoteza nulă şi se
determină testul statistic ce va fi
utilizat drept criteriu de acceptare
sau de respingere a ipotezei nule.
RC REGIUNEA CRITICA

 Regiunea critică reprezintă valorile numerice ale


testului statistic pentru care ipoteza nulă va fi
respinsă.
 Dacă punctul definit de vectorul de sondaj
x1,x2,…,xn cade în regiunea critică Rc, ipoteza H0 se
respinge,
 dacă punctul cade în afara regiunii critice Rc,
ipoteza H0 se acceptă.
 Regiunea critică este delimitată de valoarea
critică, C – punctul de tăietură în stabilirea
acesteia.
 Exemplu
 Pragul de semnificaţie ales de o firmă ce fabrică
îngheţată, interesată în greutatea medie a cutiilor
de îngheţată va putea fi diferit de pragul de
semnificaţie ales de o companie farmaceutică,
interesată de cantitatea medie a unui ingredient
activ dintr-un tip de medicament. Evident, costul
în prima situaţie prezentată este mult mai mic,
comparativ cu costul asociat în cazul producerii
unei erori de genul I pentru compania farma-
ceutică: o cantitate prea mică de ingredient activ
poate face medicamentul ineficient; o cantitate
prea mare de ingredient activ poate cauza efecte
secundare, dăunătoare sau poate avea, chiar,
efecte letale.
NIVELUL DE INCREDERE
 Nivelul de încredere al unui test statistic este (1-α), iar
în expresie procentuală, (1-α)100 reprezintă
probabilitatea de garantare a rezultatelor.

 Legătura dintre probabilităţile α şi β


Α ŞI Β CÂND VOLUMUL EŞANTIONULUI N'
>N
NORMALITATE/ VALOAREA TESTULUI

 vom face principalele presupuneri


despre populaţia sau populaţiile
ce sunt eşantionate (normalitate
etc.).
 Se calculează apoi testul statistic şi
se determină valoarea sa numerică,
pe baza datelor din eşantion.
CONCLUZIILE: IPOTEZA NULĂ ESTE FIE
ACCEPTATĂ, FIE RESPINSĂ

 dacă valoarea numerică a testului


statistic cade în regiunea critică
(Rc), respingem ipoteza nulă şi
concluzionăm că ipoteza alternativă
este adevărată. Vom şti că această
decizie este incorectă doar în 100 α %
din cazuri;
 dacă valoarea numerică a testului
nu cade în regiunea critică (Rc),
se acceptă ipoteza nulă H0.
testarea egalităţii parametrului
„media colectivităţii generale”, μ cu
valoarea μ0):

H0: μ = μ0,
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)
şi acest test este un test bilateral;
 ii)să testăm ipoteza nulă μ = μ0, cu
alternativa media μ este mai mare
decât μ0.
 H0: μ = μ0,
 H1: μ > μ0,
 care este un test unilateral
dreapta;
 iii)să testăm ipoteza nulă μ = μ0, cu
alternativa media μ este mai mică
decât μ0.
 H0: μ = μ0,
 H1: μ < μ0,
 care este un test unilateral
stânga.
REGIUNEA CRITICĂ PENTRU:
A) TEST BILATERAL;
B) TEST UNILATERAL DREAPTA;
C) TEST UNILATERAL STÂNGA
COMPARAREA MEDIEI A DOUA ESANTIOANE

𝑥1ҧ − 𝑥ҧ2
𝑧𝑐 =
2 2
𝜎1 𝜎2
+
𝑛1 𝑛2
 Esantioanele sunt de volum mare n>30
 Variabilele au tendinte de normalitate
COMPARAREA PROPORTIEI ESANTIONULUI CU
PROPORTIA COLECTIVITATII GENERALE

𝑝 − 𝑝0
𝑧𝑐 =
𝑝(1 − 𝑝)
𝑛
 Distributia repartizarii proportiilor trebuie sa fie
o distributie dihotomica ale carei caracteristici
sunt modelate in general prin variabile
repartizate binomial
 Distributia binomiala este normala daca: 𝑛 ∙ 𝑝 ≥
5, 𝑛(1 − 𝑝) ≥ 5, unde p reprezinta proportia
esantionului
 Testul t

 Înafaceri, multe decizii trebuie luate


pe baza unor informaţii foarte limi-
tate, adică pe baza datelor provenite
din eşantioane mici (de volum
redus, n≤30). În aceste situaţii,
efectul imediat este acela că forma
distribuţiei de eşantionare a mediei
depinde, acum, de forma populaţiei
generale din care a fost extras
eşantionul.
 Testul t

 Distribuţia de eşantionare a lui va fi


normală (sau aproximativ normală), în
cazul eşantioanelor de volum redus, doar
dacă colectivitatea generală este
distribuită normal (sau aproximativ
normal).
 Pe de altă parte, dacă nu se cunoaşte
dispersia din colectivitatea generală ( ),
atunci dispersia eşantionului ( ), poate să
nu ofere o aproximare foarte bună a lui
(în cazul eşantioanelor mici).
TESTAREA IPOTEZEI PRIVIND DISPERSIA
UNEI POPULAŢII
TESTAREA IPOTEZEI PRIVIND DISPERSIA
UNEI POPULAŢII

suma pătratelor diferenţelor ( x  x )


i
2
(care este, de fapt, egală cu n  s 2 sau (n 1)  s 2 pentru
eşantioane mici), împărţită la dispersia colectivităţii generale, are o distribuţie hi-pătrat (  2 )
(dacă populaţia eşantionată este normal distribuită)

- trebuie precizat că valoarea lui χ 2 pentru care aria de sub curbă (situată la dreapta ei)

este egală cu α, se notează χ 2α . Nu putem folosi notaţia   2 pentru a reprezenta punctul la


care aria din stânga este α, deoarece statistica  2 este întotdeauna mai mare decât zero. Dar
 2  reprezintă punctul pentru care aria de sub curbă situată la stânga lui este α.
1
TESTAREA IPOTEZEI PRIVIND DISPERSIA
UNEI POPULAŢII
Pentru următoarele date privind cererea unui produs (selectate dintr-o colectivitate
normal distribuită), să se testeze (pentru o probabilitate de 95%), ipotezele:
H 0 :  2  100 ,

H1 :  2  100 .

Datele sunt: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66.
TESTAREA IPOTEZEI PRIVIND RAPORTUL
DINTRE DOUĂ DISPERSII

 Am văzut că testarea ipotezei privind


dispersia poate fi utilizată pentru a trage
concluzii privitoare la consistenţa unor
procese economice ori privitoare la
riscurile asociate. În acest subcapitol vom
compara două dispersii, ceea ce ne va
permite să comparăm consistenţa a două
procese sau riscurile a două portofolii de
investiţii etc.
TESTAREA IPOTEZEI PRIVIND RAPORTUL
DINTRE DOUĂ DISPERSII

Statisticienii testează, adesea, egalitatea dintre două dispersii înainte de a decide ce


procedeu să folosească în verificarea ipotezei privind diferenţa dintre două medii.
Vom compara dispersiile a două populaţii, determinând raportul dintre ele. În consecinţă,
parametrul ce ne interesează este  12 /  22 . Dacă dispersia eşantionului este (aşa cum am văzut)
un estimator nedeplasat şi consistent al dispersiei colectivităţii generale, să notăm că raportul
s 12 / s 22 este estimator punctual al raportului de dispersii  12 /  22 .
TESTAREA IPOTEZEI PRIVIND RAPORTUL
DINTRE DOUĂ DISPERSII

Distribuţia de eşantionare a raportului s12 / s 22 este o distribuţie F, dacă eşantioanele au fost


extrase independent din populaţii normal distribuite.

Se cunoaşte că raportul dintre două variabile hi-pătrat independente împărţite la gradele lor
de libertate are o distribuţie Fisher (distribuţie F). Gradele de libertate ale distribuţiei F sunt
identice cu gradele de libertate ale celor două distribuţii hi-pătrat. Atunci:
TESTAREA IPOTEZEI PRIVIND RAPORTUL
DINTRE DOUĂ DISPERSII

(n1  1) s12 /  12 (n2  1) s 22 /  22 s12 /  12


F :  2 , cu (n1 1) şi (n2 1) grade de libertate.
(n1  1) (n2  1) s 2 /  22

Valoarea lui F pentru care aria de sub curbă (situată la dreapta ei) este α, se notează Fα (cu
gradele de libertate gl1 şi gl2, unde gl1 = n1 –1 şi gl2 = n2 –1).
Ipotezele statistice:
- pentru test bilateral
H 0 :  12 /  22  1

H 0 :  12 /  22  1

- pentru test unilateral dreapta


H 0 :  12 /  22  1

H 0 :  12 /  22  1

- pentru test unilateral stânga


H 0 :  12 /  22  1

H 0 :  12 /  22  1
Regiunea critică este dată de:
- pentru test bilateral:
F  F / 2,n1 1,n2 1 sau F  F1 / 2,n 1,n 1
1 2

- pentru test unilateral dreapta:


F  F ,n1 1,n2 1

- pentru test unilateral stânga:


F  F1 ,n 1,n 1
1 2
Un analist doreşte să compare împrăştierea veniturilor pe familie, pentru colectivitatea
turiştilor ce preferă turismul litoral, cu împrăştierea veniturilor, pentru colectivitatea turiştilor ce
preferă turismul balnear. Presupunând că distribuţiile veniturilor (mil. lei), în cele două
colectivităţi sunt aproximativ normale au fost selectate două eşantioane, de volum 60 şi 50 de
persoane, iar abaterile medii pătratice (mil. lei) sunt: s1  2,84 şi s2  1,86 . Se utilizează o
probabilitate de garantare a rezultatelor de 95%.
Exemplu: Doza de sedativ şi timpul de adormire
Se consideră un set de date imaginare, în care 10 subiecţi umani primesc o doză
de sedativ. Atât timpul de adormire cât şi doza în miligrame sunt înregistrate. Scopul
studiului este de a cuantifica efectele sedativului, mai precis de a cuantifica efectul dozei
de sedativ asupra timpului de adormire. Datele sunt:
Subiect Doză Timp Subiect Doză Timp
1 10 50 6 20 45
2 10 60 7 25 30
3 15 45 8 25 40
4 15 50 9 30 35
5 20 38 10 30 25
Eroarea
Coeficientul de
SUMMARY OUTPUT standard determinaţie, R2

Regression Statistics
Multiple R 0,896708
R Square 0,804086 Termenul liber şi
Adjusted R Square 0,779597 Indică validitatea
coeficientul de
modelului
Standard Error 4,877884 regresie
Observations 10

ANOVA
df SS MS F Significance F
Regression 1 781,25 781,25 32,83425 0,000439
Residual 8 190,35 23,79375
Total 9 971,6

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 66,8 4,627567 14,43523 5,19E-07 56,12881 77,47119 56,12881 77,47119
X Variable 1 -1,25 0,218146 -5,73012 0,000439 -1,75304 -0,74696 -1,75304 -0,74696

RESIDUAL OUTPUT

Observation Predicted Y Residuals


1 54,3 -4,3
2 54,3 5,7
3 48,05 -3,05
4 48,05 1,95
5 41,8 -3,8
6 41,8 3,2
7 35,55 -5,55
8 35,55 4,45
9 29,3 5,7
10 29,3 -4,3
 Coeficientul b1 ne indică modificarea lui y la modificarea cu o unitate a lui x;
 Termenul liber b0 este punctul în care dreapta de regresie intersectează axa OY, adesea
acesta nu are semnificație economică;
 Eroarea standard: este bine să fie cât mai apropiată de 0, dacă ar fi 0, ar însemna că
toate punctele observate se află pe dreapta de regresie;
 Coeficientul de determinaţie: ne indică în ce măsură modelul liniar de regresie explică
dependența dintre variabile.

Modelul se scrie:
timp=66,8-1,25* doza
timp=66,8-1,25* doza
având următoarea interpretare:
- creşterea dozei de sedativ cu un miligram
reduce timpul de adormire cu 1.25
minute.
- Modelul este valid din punct de vedere
statistic, Significance F=0,000439 < 0,05,
coeficient de determinaţie R2=80,40%,
ceea ce înseamnă că doza de sedativ
explică într-o proporţie de aproximativ
80% timpul de adormire, restul fiind
determinat de alţi factori.
Aplicatia 1
Intr-un atelier se asambleaza componente electrice. In ultimele 9 zile, muncitorul de
la masa 1 a avut o medie de 9 rebuturi pe zi cu o abatere standard 𝑠1 = 2. Muncitorul de
la masa 2 a avut in medie 8.5 rebuturi pe zi, cu o abatere standard 𝑠2 = 1.5 pe aceeasi
perioada. Se presupune ca rebuturile produse de cei doi muncitori reprezinta variabile
aleatoare normale.
a) La un nivel de semnificatie α=0.05 se poate trage concluzia ca exista o variatie
mai mare in numarul de rebuturi zilnice produse de muncitorul de la masa 1?
b) Dar pentru un interval de incredere de 99%, se poate spune ca exista o diferenta
semnificativa intre numarul de rebuturi scoase de cei 2 muncitori?
Aplicatia 2
A fost realizat un nou sistem radar pentru aeroporturi. Se stie ca un criteriu foarte
important este acuratetea cu care sistemul radar citeste distantele in spatiu. O performanta
standard este ca dispersia in aprecierea distantelor trebuie sa fie de cel mult 15dm2.
a) Sistemul se testeaza de 30 ori. La un prag de semnificatie de α=0.05, care este
valoarea limita a dispersiei sistemului radar, pentru care sistemul radar ar putea
fi achizitionat?
b) Se presupune ca s-a testat noul sistem radar de 20 ori de la o inaltime cunoscuta
deasupra pamantului si s-a gasit o dispersie de 16dm2. La un prag de semnificatie
de α=0.10, sa se testeze ipoteza ca sistemul radar satisface criteriul de
performanta considerat.
2
𝑖=𝑛
𝑖=1
𝑦 − 𝑦
𝑅= 𝑅 2 =
𝑖 𝑖

𝑖=𝑛 2
𝑛 𝑖=1
𝑦 − 𝑦
𝑖
R=0 nu exista leg.
𝑅 ∈ (0 ; 0.2] leg.foarte slaba
𝑅 ∈ (0.2 ; 0.5] leg.slaba
𝑅 ∈ (0.5 ; 0.75] leg.medie
𝑅 ∈ 0.75 ; 0.95 leg.puternica
𝑅 ∈ 0.95 ; 1 leg.f.puternica
R=1 leg.determinista
1
𝜎𝑥𝑦 𝑛 − 1 𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
𝑟𝑥𝑦 = =
𝜎𝑥 𝜎𝑦 𝑖=𝑛
𝑥𝑖 − 𝑥
2 𝑖=𝑛
𝑖=1
𝑦 − 𝑦
2
𝑖=1 𝑖

𝑛 − 1 𝑛 − 1
- Coeficientul b1 = 0.10977 arată că
preţul mediu al unei locuinţe creşte
în medie cu 0.10977(1000$) =
109.77$ pentru fiecare picior pătrat
adiţional.
- Interpretarea termenului liber
(intercept) nu are sens economic în
acest exemplu, nicio casă neavând
suprafaţă 0.
- Coeficientul de determinaţie este de
58,082%, modelul fiind valid (F
significance=0,01039<0,05).
GIGO-
Garbage In, Garbage Out:
un set de date de intrare
în orice model
econometric prost nu
poate genera rezultate
bune!
b1 s b1
H0: β1 = 0 Din output-ul Excel :
H1: β1  0 Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039

b1  β1 0.10977  0
t   3.32938
s b1 0.03297
Test Statistic: t = 3.329
s b1
H0: β1 = 0 Din output-ul Excel : b1 t
H1: β1  0 Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
d.f. = 10-2 = 8 Square Feet 0.10977 0.03297 3.32938 0.01039
t8,.025 = 2.3060
Decizie:
/2=.025 /2=.025 Resping H0
Concluzie:
Există suficiente dovezi că suprafaţa afectează
Resping Nu resping H0 Resping
H0 -tn-2,α/2 tn-2,α/2 H0 preţul locuinţelor!
0
-2.3060 2.3060 3.329

S-ar putea să vă placă și