Sunteți pe pagina 1din 20

Curs 1: Econometria

1.1. Ce este econometria?


1.2. Metodologia econometriei
1.3. Recapitularea unor noţiuni de statistică descriptivă şi inferenţială

1.1. Ce este econometria?


Simplu spus, econometria înseamnă măsurătoare economică.

Ragnar Anton Kittil Frisch


primul câştigător al premiului Nobel în economie 1969

Goldberg1 defineşte econometria ca fiind ştiinţa în care uneltele teoriilor economice,


matematice şi statistice sunt aplicate pentru analizarea unor fenomene economice.

Samuelson, Koopmans şi Stone2 spun că econometria constă în aplicarea statisticii în


datele economice pentru a adapta modelele empirice la modele construite cu ajutorul
economiilor matematice cu scopul de a obţine rezultate numerice.

Paul Anthony Samuelson Tjalling C.Koopmans John Richard Nicholas Stone


premiul Nobel în economie în 1970 premiul Nobel în economie în 1975 premiul Nobel în economie în 1984

1
Goldberg, A.S., Econometric Theory, Wiley, New-York, 1964, p. 1.
2
Samuelson, P.A., Koopmans, T.C., Stone, J.R.N., Report of the Evaluative Committee for Econometrica,
Econometrica, 22(2), 1954, pg. 141-146.

1
În fapt, econometria, se bazează pe dezvoltarea metodelor statistice pentru estimarea
legăturilor între variabilele economice, pentru testarea teoriilor economice şi pentru
evaluarea şi implementarea politicilor economice.
Econometria implică:
1. Economii matematice: exprimarea teoriilor și ideilor economice în formă
matematică;
2. Statistică economică: colectarea și procesarea datelor;
3. Inferențe statistice: utilizarea informaţiilor obţinute pe un eşantion în testarea unor
ipoteze asupra populaţiei.

Una dintre cele mai importante aplicaţii ale econometriei constă în previzionarea unor
indicatori macroeconomici cum ar fi rata dobânzii, rata inflaţiei, PIB.

1.2. Metodologia econometriei


1. Formularea ipotezelor;
2. Colectarea datelor;
3. Specificarea modelului matematic;
4. Specificarea modelului statistic sau econometric;
5. Estimarea parametrilor modelului ales;
6. Găsirea celui mai bun model;
7. Testarea ipotezelor ce derivă din model;
8. Estimări şi previziuni pe baza modelului.

În fapt econometria a apărut ca instrument de testare a unor ipoteze formulate pornind de


la anumite situaţii întâlnite în practica economică.

Spre exemplu pornim cu următoarea întrebare:

? Influenţează condiţiile economice dorinţa oamenilor de a muncii?

Pentru a răspunde la această întrebare considerăm două variabile şi anume rata


şomajului (RS) şi rata forţei de muncă (RFM).

1.2.1. Formularea ipotezelor


În teoriile economice asupra pieţei muncii există două ipoteze asupra efectului condiţiilor
economice asupra dorinţei oamenilor de a muncii şi anume:
1. ipoteza „discouraged-worker” care spune că atunci când condiţiile economice
se înrăutăţesc mulţi şomerii renunţă la speranţa de a-şi mai găsi un loc de
muncă;
2. ipoteza „added-worker” care spune că în condiţii economice înrautăţite mulţi
dintre cei apţi de muncă, dar care nu activează pe piaţa muncii (mame cu
copii), decid să intre pe piaţa muncii în condiţiile în care celălalt membru al
familiei îşi pierde slujba. Chiar dacă slujba este slab remunerată, câştigurile
vor acoperi o parte din pierderile suferite prin concedierea celulilalt membru
al familiei.

2
Este evident că dacă efectul „added-worker” este dominant, RFM va creşte chiar în
condiţiile unei RS ridicate. Invers, dacă efectul „discouraged-worker” este dominant
atunci RFM va scădea.
Se pune întrebarea cum aflăm acest lucru? Care evident este o întrebare empirică.

1.2.2. Colectarea datelor

Avem nevoie de informaţii cantitative despre cele două variabile.

Anul RFM (%) RS (%) COM* ($)


1980 63.8 7.1 7.78
1981 63.9 7.6 7.69
1982 64.0 9.7 7.68
1983 64.0 9.6 7.79
1984 64.4 7.5 7.80
1985 64.8 7.2 7.77
1986 65.3 7.0 7.81
1987 65.6 6.2 7.73
1988 65.9 5.5 7.69
1989 66.5 5.3 7.64
1990 66.5 5.6 7.52
1991 66.2 6.8 7.45
1992 66.4 7.5 7.41
1993 66.3 6.9 7.39
1994 66.6 6.1 7.40
1995 66.6 5.6 7.40
1996 66.8 5.4 7.43

*COM – câştigul mediu orar

1.2.3. Specificarea modelului matematic

Pentru a vedea cum se comportă RFM în raport cu RS vom reprezenta grafic datele:

67

66
RFM (y)

65

64

63
5 6 7 8 9 10
RS (x)

3
Din grafic reiese că între RFM şi RS există o relaţie inversă. Aceasta poate sugera
spre exemplu că efectul „discouraged-worker” este mai puternic decât efectul „added-
worker”.

Ca o primă aproximare putem scrie relaţia dintre RFM şi RS astfel:

RFM=B0 + B1*RS (1)

B0, B1 se numesc parametrii modelului matematic.

B1 ne arată cu cât se modifică RFM atunci când RS se modifică cu o unitate. B1 poate fi


pozitiv caz în care în exemplul nostru efectul „added-worker” domină efectul
„discouraged-worker” sau poate fi negativ caz în care efectul „discouraged-worker”
este mai puternic decât efectul „added-worker”. Gaficul sugerează, în cazul exemplului
nostru, că B1<0.

1.2.4. Specificarea modelului statistic sau econometric

Modelul liniar de mai sus nu este foarte „iubit” de statisticieni pentru că acest model
sugerează că unei valori a lui RS îi corespunde o unică valoare a lui RFM. În practică
aceste cazuri sunt rareori întâlnite de cele mai multe ori relaţiile între diferite variabile
economice sunt inexacte sau statistice adică sunt adevărate cu o anumită probabilitate.

Reiese clar din reprezentarea grafică că nu toate punctele se află pe aceeaşi dreaptă. De
ce se întâmplă aşa? Pentru că între valorile observate (cele din tabel) şi cele calculate
(cele de pe dreapta definită de ecuaţia (1)) există anumite diferenţe, diferenţe cunoscute
sub numele de erori aleatoare. Din punct de vedere practic aceste erori aleatoare
reprezintă alţi factori(aleatori) care pot influenţa RFM.
În aceste condiţii modelul econometric va fi:

RFM=B0 + B1*RS + u (2)

Modelul (2) este cunoscut sub numele de model regresional liniar care în forma sa
generală arată astfel:

Y=B0 + B1*X + u (3)

unde:
Y – variabila dependentă (explicată, output);
X – variabila independentă (explicativă, input).

Se observă că relaţia (2) derivă din relaţia (1) ceea ce demonstrează complementaritatea
matematicilor economice şi a econometriei.

4
Observaţie
În ecuaţia (2) am stabilit că RFM este variabila dependentă, iar RS este variabila
independentă. Se pune întrebarea: sunt cele două variabile relaţionate cauzal? Este RS
cauza şi RFM efectul? Cu alte cuvinte implică regresia cauzalitate?

Kendall şi Stuart3 notează că o relaţie statistică, oricât de puternică şi sugestivă nu poate


stabili o relaţie cauzală. Ideea de cauzalitate trebuie să vină din afara statisticii.

Conform acestei teorii, în cazul exemplului nostru, teoria economică trebuie să


stabilească relaţia de tip cauză-efect, dacă există, între cele două variabile. Dacă
cauzalitatea nu poate fi stabilită, atunci ecuaţia (2) o vom numi relaţie predictivă, adică
ştiind RS putem previziona RFM.

1.2.5. Estimarea parametrilor modelului econometric

Metoda care stă la baza estimării parametrilor modelului regresional se numeşte metoda
celor mai mici pătrate pe baza căreia obţinem că:

RFM = 69.9355 – 0.6458*RS (4)

Observaţie: RFM ne reaminteşte că (4) este o estimare a ecuaţiei (2).

Această relaţie ne arată că dacă RS creşte cu o unitate, RFM scade în medie cu 0.64
puncte procentuale.

1.2.6. Alegerea celui mai bun model

Cât de bun, cât de adecvat, este modelul definit de ecuaţia (4)? Este adevărat că o
persoană va decide să intre pe piaţa muncii luând în considerare condiţiile de pe
această piaţă măsurate prin rata şomajului?

Este evident că există şi alţi factori care vor influenţa decizia cum ar fi spre exemplu
câştigul mediu orar (COM).

Dacă vom lua în considerare şi această variabilă atunci vom ajunge la următorul model:

RFM= B0 + B1*RS + B2*COM + u (5)

Ecuaţia (5) este un exemplu de model regresional multiplu în care intervin două
variabile explicative.

Parametrii modelului, aşa cum vom vedea mai târziu, se determină prin metoda celor
mai mici pătrate.
În acest caz vom avea:
3
Kendall, M.G., Stuart, A., The Advanced Theory of Statistics, Charles Griffin Publishers, New-York,
1961.

5
RFM= 97.9 – 0.446*RS – 3.86*COM (6)

Această relaţie ne arată următoarele:


 dacă COM este constatat atunci RFM se modifică cu 0.446 puncte
procentuale la modificări cu o unitate ale RS;
 dacă RS este constatat atunci RFM se modifică cu 3.86 puncte
procentuale la modificări cu o unitate ale COM.

Care model trebuie ales?

1.2.7. Testarea ipotezelor ce derivă din model

Având acum un model determinat vrem să aflăm dacă acesta are sens din punct de vedere
economic.

De exemplu ipoteza „discouraged-worker” postulează o relaţie inversă între RFM şi


RS. Reiese această ipoteză din rezultatele obţinute de noi?
Rezultatele obţinute de noi sunt în conformitate cu această ipoteză deoarece coeficientul
estimat corespunzător lui RS este negativ.

Ce este de reţinut aici este faptul că în cazul analizei regresionale s-ar putea să fim
interesaţi nu numai de estimarea parametrilor modelului ci şi de testarea unor ipoteze
sugerate de teoria economică.

1.2.8. Estimări şi predicţii

Se pune natural următoarea întrebare: O dată trecuţi prin toate etapele de mai sus şi
având la dispoziţie cel mai bun model regresional, ce putem face cu acesta?

Răspunsul este cât se poate de evident. Îl vom folosi pentru a estima sau previziona
RFM corespunzătoare unor valori ale RS şi COM înregistrate spre exemplu în anul
1997. Comparând valorile obţinute cu cele reale, publicate de guvern, se vor observa
diferenţa numite şi erori de predicţie. Evident că scopul nostru va fi ca aceste erori să fie
cât mai mici. Dacă acest lucru este întotdeauna posibil vom vedea ceva mai târziu.

6
1.3. Recapitularea unor noţiuni de statistică descriptivă şi
inferenţială
Ne propunem în această secţiune să facem un repertoar al celor mai importante noţiuni de
statistică descriptivă şi inferenţială, noţiuni ce vor fi folosite de-a lungul cursului de econometrie.
Pentru detalii sunteţi rugaţi să consultaţi:
Server/Profiles/Chifu/Statistica_aplicata

1.3.1. Elemente de statistică descriptivă


 Date, elemente, populaţie, eşantion, variabile, serii statistice

 Statistica – ştiinţa colectării, analizării, prezentării şi interpretării datelor.


 date statistice
Clasificarea datelor statistice

Date calitative
etichete sau nume utilizate pentru
identificarea unui atribut al fiecărui
element. Pot fi numerice sau non-numerice
Date
statistice
Date cantitative
arată cantitatea fiind întotdeauna date
numerice

 elemente (unităţi) statistice – entităţi în funcţie de care sunt colectate datele.


 populaţie statistică – ansamblul tuturor elementelor
 eşantion – subansamblul unei populaţii
 variabilă statistică – caracteristică comună a unităţilor unei populaţii
Clasificarea variabilelor statistice

Variabile calitative
sunt formate din date
calitative

Variabile Discrete
iau doar anumite
statistice
valori dintr-un
Variabile cantitative interval
sunt formate din date
cantitative
Continue
iau orice valoare
dintr-un interval

7
Clasificarea II
 Variabile atributive – exprimă o însuşire esenţială a elementelor;
 Variabile de timp – exprimă timpul în care au luat fiinţă elementele (data de
expirare a unui produs);
 Variabile de spaţiu – exprimă spaţiul în care există unităţile (localizarea punctelor
de distribuţie a presei).

 Seria statistică – grupare de valori rezultată ca urmare a analizării unei populaţii în


raport cu una sau mai multe variabile.

Clasificare
1. după numărul variabilelor de la baza seriei:
 Serii statistice unidimensionale – au la bază o singură variabilă;
 Serii statistice multidimensionale – au la bază două sau mai multe variabile.
2. după tipul variabilelor de la baza seriei:
 Serii calitative – au la bază variabile calitative;
 Serii cantitative – au la bază variabile cantitative.
3. după natura variabilelor de la baza seriei:
 Serii atributive – au la bază variabile atributive;
 Serii cronologice (de timp) – au la bază variabile de timp;
 Serii teritoriale (de spaţiu) – au la bază variabile de spaţiu;
4. o clasificare generală a seriilor statistice ar fi următoarea:
 Serii de repartiţie – redau distribuţia populaţiei în raport cu una sau mai multe
variabile;
 Serii de variaţie – redau variaţia unei mărimi în timp, spaţiu sau de la o categorie la
alta.

 Parametrii tendinţei centrale şi de structură

Cazul discret
Valoarea medie (, x )

μ=
∑ xk N k =
N
∑ xk f k
 populaţie ,

x=
∑ x k nk = x f
n
∑ k k
 eşantion

Valoarea mediană (Me)


Modalitatea de calcul a valorii mediane în cazul discret implică următoarele etape:
N
r Me=
 Determinarea rangului valorii mediane: 2 ;
r x r +1
 Dacă Me   atunci Me = [ Me ] , unde [rMe] reprezintă partea
întreagă a rangului medianei;
x r + x rMe +1
Me

 Dacă
r Me   atunci Me = 2 .

Valoarea modală este acea valoare a unei variabile pentru care s-a înregistrat cea mai mare frecvenţă

8
Quartilele
Aşa cum am văzut împart populaţia în 4 părţi egale ceea ce implică faptul că vom avea de calculat
p=3 valori. Modalitatea de calcul nu diferă foarte mult de cea din cazul medianei. Astfel vom avea
următoarele etape:
p
r Q = ⋅N
 Determinarea rangului quartilei: p 4 ;
rQ x
 Dacă p   atunci Qp = [ rq ] +1 p , unde [rQp] reprezintă partea întreagă
a rangului quartilei;
x r + x r q +1
qp p

rQ 2
 Dacă p   atunci Qp = .

Cazul datelor grupate pe intervale de variaţie

Clasa Frecvenţa Frecvenţa


absolută relativă
[xo , x1] N1 f1
(x1 , x2] N2 f2
... ... ...
(xk-1, xk] Nk fk
... ... ...
(xr-1, xr] Nr fr

Valoarea medie (, x )


În cazul datelor grupate pe intervale de variaţie modalitatea de calcul a valorii medii este
următoarea:

∑ x 'k N k x k −1 + x k
μ=
N
= ∑ x 'k f k x 'k =
2
 În cazul populaţiei: , unde , este centrul
clasei k (mijlocul intervalului de variaţie).
∑ x'k nk ' '
x k −1 + x k
x= =∑ x k f k xk =
 În cazul eşantionului n , unde 2 este centrul
clasei k (mijlocul intervalului de variaţie)

Valoarea mediană (Me)


N
r Me=
 Determinarea rangului valorii mediane: 2 ;
 Determinarea intervalului valorii mediane – se calculează frecvenţele cumulate până la acea
frecvenţă care adăugată conduce la depăşirea rangului valorii mediane, cu alte cuvinte dacă
N1+...+Nk ≥ rMe, atunci Me(xk-1 , xk] interval căruia îi corespunde frecvenţa Nk;
r Me−N ( x k−1 )
⋅( x k−x k −1 )
Nk N ( x k−1 )
 Calcularea expresiei x = , unde este frecvenţa
cumulată până la intervalul median;
 Calcularea valorii mediane: Me = xk-1 + x.

9
Valoarea modală (Mo)
 Determinarea intervalului valorii modale - acel interval pentru care s-au înregistrat cele mai
multe unităţi statistice;
Δ1
⋅ x −x
 Mo = xk-1 +
Δ1 + Δ2 ( k k −1 ) , unde 1 este diferenţa dintre frecvenţa intervalului
modal şi frecvenţa intervalul precedent, iar 2 este diferenţa dintre frecvenţa intervalului modal
şi frecvenţa intervalul următor.

Quartilele
p
rq = N
 Determinarea rangului quartilei: p m
, p= ; 1,m−1
 Determinarea intervalului quartilei – se calculează frecvenţele cumulate până la acea frecvenţă
rq
care adăugată conduce la depăşirea rangului quartilei, cu alte cuvinte dacă N 1+...+Nk ≥ p ,
atunci qp (xk-1 , xk];
r q −N ( x k−1)
p
¿ ( x k −x k−1 )
Nk N x
( k−1)
 Calcularea expresiei x = , unde este frecvenţa
cumulată până la intervalul quartilei, iar lk este lungimea intervalului quartilei;

 Calcularea valorii quartile: qp = xk-1 + x, p= 1,m−1 .

 Parametrii variaţiei

Dispersia (σ2, s2). Abaterea medie pătratică (σ, s).

Dispersia
 Populaţie
 Caz discret

2
∑ ( x k −μ )2
 date negrupate
σx = N ;

2
∑ ( x k −μ )2 N k
 date grupate
σ
x = N .
 Caz continuu (date grupate pe intervale de variaţie):
2

2
∑ ( x 'k −μ ) Nk
σx = N ,
x +x
x 'k = k −1 k
unde 2 este centrul clasei k (mijlocul intervalului de variaţie).
 Eşantion
 Caz discret

10
∑ ( x k −x )2
2
 date negrupate
sx = n−1 ;
∑ ( x k −x )2 nk
2
 date grupate x = s n−1 .
 Caz continuu (date grupate pe intervale de variaţie):
2

2
∑ ( x 'k −x ) n k
sx = n−1 ,
'
x k −1 + x k
xk =
unde 2 este centrul clasei k (mijlocul intervalului de variaţie), iar nk
este frecvenţa clasei în eşantion.

Abaterea medie pătratică – măsoară gradul de reprezentativitate al valorii medii, dând măsura gradului
de împrăştiere a valorilor variabilei în jurul valorii medii.

 Populaţie: σx = √σ 2x ;

 Eşantion: sx = √s 2x .

Coeficientul de variaţie al lui Pearson


σx
×100
 Populaţie: Vx = μ ;
sx
×100
 Eşantion: Vx = x .

Coeficientul de corelaţie liniară


n ∑ x i y i− ∑ x i ∑ y i
2 2
rxy = √ n ∑ x −( ∑ x ) √ n ∑ y −( ∑ y )
2
i i
2
i i
Valorile coeficientului de corelaţie sunt cuprinse între -1 şi 1. Astfel:
 dacă r[0;0,3]  legătură liniară pozitivă (directă) slabă;
 dacă r(0,3;0,7]  legătură liniară pozitivă (directă) de intensitate medie;
 dacă r (0,7;1]  legătură liniară pozitivă (directă)
puternică;
 dacă r[-0,3;0]  legătură liniară negativă (inversă)
slabă;
 dacă r[-0,7; -0,3)  legătură liniară negativă (inversă) de intensitate medie;
 dacă r [-1; -0,7)  legătură liniară negativă (inversă)
puternică.

11
1.3.2. Elemente de statistică inferenţială

 Estimarea parametrilor

 Estimarea punctuală a parametrilor

 Estimatorul punctual al valorii medii  a populaţiei este media de eşantion

x=
∑ xi
n .
2
 Estimatorul punctual al dispersiei populaţiei
σx este dispersia de eşantion
2
∑ ( x i −x )
s 2x=
n−1 .
 Estimatorul punctual al abaterii medii pătratice a populaţiei σ x este abaterea medie pătratică de
eşantion
2
sx =
s √
x .

 Estimatorul punctual al erorii standard a mediei


σx este
sx unde:
sx
sx 
n în cazul populaţiei infinite;

 Estimatorul punctual al proporţiei populaţiei p este proporţia la nivel de eşantion p .

 Estimarea parametrilor prin intervale de încredere

 Intervalul (1,2) se numeşte interval de încredere pentru parametrul necunoscut  dacă P(1 
 2)= 1–, unde (1–) se numeşte coeficient (nivel) de încredere iar  se numeşte coeficient
(nivel) de semnificaţie.

^
 Dacă λ este un estimator punctual al parametrului necunoscut  atunci intervalul de încredere
pentru parametrul  va avea forma:

 (eroarea de eşantion)

 Interval de încredere pentru valoarea medie


x  (eroarea de eşantion)

 Cazul eşantioanelor de volum mare (n30)

 Dacă se cunoaşte dispersia populaţiei atunci:




  x  z 2 x  x 
n
 Dacă nu se cunoaşte dispersia populaţiei atunci:

12
sx
  x  z  sx 
 2sx n
Nivel de Nivel de z
semnificaţie încredere P(0 z   2 z 2
 1– )
0,1 0,90 0,45 1,65
0,05 0,95 0,475 1,96
0,01 0,99 0,495 2,58

 Cazul eşantioanelor de volum mic (n 30)


sx
μ∈ ( x±tα /2 ;( n−1 ) gl s x ) s x=
, √n
 Interval de încredere pentru estimarea diferenţei a două valori medii

 Cazul eşantioanelor independente


o Eşantioane independente de volum mare (n1 30, n2 30)
2 2
σ σ
μ1 −μ 2 ∈ ( x1 −x 2 ±z α /2 σ x − x
, 1 2 ) .
Dacă nu se cunosc dispersiile populaţiilor atunci acestea se înlocuiesc cu estimatorii lor punctuali
1 2

σ x −x = 1 + 2
n 1 n2

s 12 , s 22 , σ x −x
şi anume dispersiile de eşantion iar 1 2 se înlocuieşte cu estimatorul său punctual
2 2
s s
s x −x =
1 2 √ 1
+
n1 n2
2

. Astfel în acest caz intervalul va avea următoarea formă:


μ1 −μ 2 ∈ ( x1 −x 2 ±z α /2 s x )
1−x 2 .

o Cazul eşantioanelor de volum mic (n1 30, n2 30)



 1   2  x1  x 2  t 2; gl s x
1  x2
 ,

s
1

1  n1  1 s 12   n 2  1 s 22
sx s 
2
1  x2
n1 n 2
,
 n1  n 2  2  .

 Cazul eşantioanelor perechi

μd ∈ ( d±z α /2 s d )
, d=x1 – x2,

d=
∑ di i i
 Valoarea medie: n ,
d i=x 1 −x 2
∑ ( d i−d )2
s 2d =
 Dispersia: n−1 ;

13
 Abaterea medie pătratică
s d = √ s2d ;
sd
s d=
 Eroarea standard √n .

 Verificarea ipotezelor statistice

 Teste de semnificaţie

Fie  un parametru necunoscut al unei populaţii. O ipoteză formulată asupra acestui parametru se
va numi ipoteză nulă Ho.
Ho: =o
O altă ipoteză ce se formulează este ipoteza alternativă H1 ce poate avea următoarea formă:
H1: ≠o – test bilateral;
H1: o – test unilateral la dreapta;
H1: o – test unilateral la stânga.

Etapele derulării unui test de semnificaţie

1. Formularea ipotezei nule şi a ipotezei alternative

Test bilateral Teste unilaterale


Ho: =o Ho: =o Ho: =o
H1: ≠o H1: o H1:  o

2. Determinarea nivelului de semnificaţie  - probabilitatea comiterii unei erori prin


respingerea ipotezei nule datorită erorii de eşantionare, în cazul în care aceasta este de fapt
adevărată;
3. Colectarea datelor la nivel de eşantion, alegerea şi calcularea statisticii test ce va fi folosită
pentru a decide acceptarea sau respingerea ipotezei nule;
4. Determinarea valorilor critice ale statisticii;
5. Luarea deciziei.

Figura 12.2.1. Zonele de respingere şi de acceptare ale ipotezei nule


Test bilateral

14
Zonă de respingere Zonă de respingere

Zonă de acceptare

valoarea critică valoarea critică

15
Test unilateral la dreapta

Zonă de respingere

Zonă de acceptare

valoarea critică

Test unilateral la stânga

Zonă de respingere

Zonă de acceptare

valoarea critică

Verificarea ipotezelor asupra valorii medii 


Test bilateral Test unilateral
Formularea ipotezelor Formularea ipotezelor
Ho: =o; H1: ≠o Ho: =o; H1: o
Ho: =o; H1: o
Determinarea nivelului de semnificaţie  Determinarea nivelului de semnificaţie 
Colectarea datelor la nivel de eşantion, Colectarea datelor la nivel de eşantion, alegerea şi
alegerea şi calcularea statisticii: calcularea statisticii:
x−μ o x−μ o x−μ o x−μ o
a. z=
σx sau z=
sx a. z=
σx sau z=
sx
x−μ o x−μ o
b. t= x s b. t=
s
x
Determinarea valorilor critice Determinarea valorilor critice

a.
±z α /2 a.
zα a. -

±t α /2; (n−1 ) gl t α ; (n−1) gl t α ; (n−1) gl
b. b. b. -
Luarea deciziei Luarea deciziei
Dacă valorile calculate Dacă valorile calculate
Dacă valorile calculate ale statisticilor se află sunt mai mici decât cele sunt mai mari decât cele
între valorile critice atunci ipoteza nulă nu critice ipoteza nulă nu critice ipoteza nulă nu
poate fi respinsă în caz contrar aceasta se poate fi respinsă. poate fi respinsă.
respinge

16
Verificarea ipotezelor asupra diferenţei valorilor medii 1-2
Eşantioane independente
Test bilateral Test unilateral
Formularea ipotezelor Formularea ipotezelor
Ho: 1-2=0; H1: 1-2≠0 Ho: 1-2=0; H1: 1-2 0
Ho: 1-2=0; H1: 1-20
Determinarea nivelului de semnificaţie  Determinarea nivelului de semnificaţie 
Colectarea datelor la nivel de eşantion, Colectarea datelor la nivel de eşantion, alegerea şi
alegerea şi calcularea statisticii calcularea statisticii
 n130, n230  n130, n230
( x1 −x 2 ) −( μ1−μ2 ) ( x1 −x 2 ) −( μ1 −μ2 )
s x −x s x −x
z= 1 2 , z= 1 2 ,
2 2 2 2
s s s s


s x −x =
1

n130, n230 (
2 √ +
n1 n2
1

σ 21 =σ 22=σ 2
2

) 
s x −x =

n130, n230 (
1 2
√ +
n1 n2
σ 21 =σ 22=σ 2 )
1 2

( x1 −x 2 ) −( μ1−μ2 ) ( x1 −x 2 ) −( μ1−μ2 )
s x −x s x −x
t= 1 2 t= 1 2

1 1 1 1
s x1−x 2=s
2
√ +
n1 n2 ,
2
( n1 −1 ) s 1 + ( n2−1 ) s 2
s x1−x 2=s
2
√ +
n1 n2 ,
2
( n1 −1 ) s 1 + ( n2−1 ) s 2
2 2
s = s =
( n1 + n2−2 ) ( n1 + n2−2 )
Determinarea valorilor critice Determinarea valorilor critice
±z α /2  n130, n230  z sau - z
 n130, n230 
±t α /2;( n +n −2 ) gl t α ;( n +n −2 ) gl
 n130, n230  1 2  n130, n230  1 2 sau
−t α ;( n +n −2 ) gl
1 2
Luarea deciziei Luarea deciziei
Dacă valorile Dacă valorile calculate
Dacă valorile calculate ale statisticilor se află calculate sunt mai sunt mai mari decât cele
între valorile critice atunci ipoteza nulă se mici decât cele critice critice ipoteza nulă se
acceptă în caz contrar aceasta se respinge ipoteza nulă se acceptă.
acceptă.
Eşantioane perechi
Test bilateral Test unilateral
Formularea ipotezelor Formularea ipotezelor
Ho: d=0; H1: d ≠0 Ho: d=0; H1: d0
Ho: d=0; H1: d0
Determinarea nivelului de semnificaţie  Determinarea nivelului de semnificaţie 
Colectarea datelor la nivel de eşantion, Colectarea datelor la nivel de eşantion, alegerea şi
alegerea şi calcularea statisticii calcularea statisticii
 n30  n30

17
d−μd sd d−μd sd
sd= sd=
z=
sd , √n z=
sd , √n

 n30  n30
d−μd sd d−μd sd
sd= sd=
t= d s , √n t= d s , √n
Determinarea valorilor critice Determinarea valorilor critice
±z α /2  n30  z sau - z
 n30 
±t α /2;( n−1 ) gl t α ;( n−1 ) gl α ;( n−1 ) gl −t
 n30   n30  sau
Luarea deciziei Luarea deciziei
Dacă valorile Dacă valorile calculate
Dacă valorile calculate ale statisticilor se află calculate sunt mai sunt mai mari decât cele
între valorile critice atunci ipoteza nulă se mici decât cele critice critice ipoteza nulă se
acceptă în caz contrar aceasta se respinge ipoteza nulă se acceptă.
acceptă.

 Analiza varianţei (ANOVA)

Etapele unei analize de tip ANOVA


1. Formularea ipotezelor;
Ho: 1=2=...=k;
H1: nu toate mediile sunt egale.
2. Stabilirea nivelului de semnificaţie ;
3. Calculul elementelor necesare determinării valorii statisticii test

3.1. Calculul mediei şi dispersiei fiecărui eşantion


x i , s 2i ,i=1,k ;

3.2. Calculul valorii medii totale x ;


k
∑ ni ( x i −x ) 2
s 2b = i=1
3.3. Calcul varianţei între grupuri k −1 ;
k k
∑ ( ni −1 ) s 2i ∑ ( ni −1 ) s 2i
i=1
i=1
2
3.4. Calculul varianţei în grupuri
sw = ( n1 +. . .+ nk )−k = n−k

Tabelul ANOVA

Tabelul ANOVA este un tabel în care se trec toate elementele calculate la punctul acesta având
următoarea structură:
Sursa Suma pătratelor Grade de libertate Media sumelor pătratelor
Între grupuri SSB k–1 s 2b =SSB/ ( k−1 )
În grupuri SSW n–k s 2w =SSW / ( n−k )
Total SST=SSB+SSW n–1

18
4. Calcularea statisticii test F;
SSB
( k −1 )
s 2b
SSW
F = ( n−k ) =
s 2w
.
5. Determinarea valorilor critice F; (k-1, n-k)gl;
6. Luarea deciziei: dacă F F; (k-1, n-k)gl ipoteza nulă se respinge în caz contrar aceasta acceptându-
se.

Distribuţia Student t

Grade de libertate t0.100 t0.050 t0.025 t0.010 t0.005


1 3.078 6.314 12.706 31.821 63.657
2 1.886 2.920 4.303 6.965 9.925
3 1.638 2.353 3.182 4.541 5.841
4 1.533 2.132 2.776 3.747 4.604
5 1.476 2.015 2.571 3.365 4.032
6 1.440 1.943 2.447 3.143 3.707
7 1.415 1.895 2.365 2.998 3.499
8 1.397 1.860 2.306 2.896 3.355
9 1.383 1.833 2.262 2.821 3.250
10 1.372 1.812 2.228 2.764 3.169
11 1.363 1.796 2.201 2.718 3.106
12 1.356 1.782 2.179 2.681 3.055
13 1.350 1.771 2.160 2.650 3.012
14 1.345 1.761 2.145 2.624 2.977
15 1.341 1.753 2.131 2.602 2.947
16 1.337 1.746 2.120 2.583 2.921
17 1.333 1.740 2.110 2.567 2.898
18 1.330 1.734 2.101 2.552 2.878
19 1.328 1.729 2.093 2.539 2.861
20 1.325 1.725 2.086 2.528 2.845
21 1.323 1.721 2.080 2.518 2.831
22 1.321 1.717 2.074 2.508 2.819
23 1.319 1.714 2.069 2.500 2.808
24 1.318 1.711 2.064 2.492 2.797
25 1.316 1.708 2.060 2.485 2.787
26 1.315 1.706 2.056 2.479 2.779
27 1.314 1.703 2.052 2.473 2.771
28 1.313 1.701 2.048 2.467 2.763
29 1.311 1.699 2.045 2.462 2.756
30 1.310 1.697 2.042 2.457 2.750
40 1.303 1.684 2.021 2.423 2.704
60 1.296 1.671 2.000 2.390 2.660
120 1.289 1.658 1.980 2.358 2.617

19
Distribuţia Fischer pentru un nivel de semnificaţie de 5% (α=0,5)

k-1
n-k Grade de libertate ale numărătorului
1 2 3 4 5 6 8 12 24 
1 161.4 199.5 215. 224.6 230. 234.0 239.0 244.0 249.0 254.3
7 2
2 18.51 19.00 19.1 19.25 19.3 19.33 19.37 19.41 19.45 19.50
6 0
3 10.13 9.55 9.28 9.12 9.01 8.94 8.84 8.74 8.64 8.53
4 7.71 6.94 6.59 6.39 6.26 6.16 6.04 5.91 5.77 5.63
5 6.61 5.79 5.41 5.19 5.05 4.95 4.82 4.68 4.53 4.36
6 5.99 5.14 4.76 4.53 4.39 4.28 4.15 4.00 3.84 3.67
7 5.59 4.74 4.35 4.12 3.97 3.87 3.73 3.57 3.41 3.24
8 5.32 4.46 4.07 3.84 3.69 3.58 3.44 3.28 3.12 2.93
9 5.12 4.26 3.68 3.63 3.48 3.37 3.23 3.07 2.90 2.71
Grade de libertate ale numitorului

10 4.96 4.10 3.71 3.48 3.33 3.22 3.07 2.91 2.74 2.54
11 4.84 3.98 3.59 3.36 3.20 3.09 2.95 2.79 2.61 2.40
12 4.75 3.88 3.49 3.26 3.11 3.00 2.85 2.69 2.50 2.30
13 4.67 3.80 3.41 3.18 3.02 2.92 2.77 2.60 2.42 2.21
14 4.60 3.74 3.34 3.11 2.96 2.85 2.70 2.53 2.35 2.13
15 4.54 3.68 3.29 3.06 2.90 2.79 2.64 2.48 2.29 2.07
16 4.49 3.63 3.24 3.01 2.85 2.74 2.59 2.42 2.24 2.01
17 4.45 3.59 3.20 2.96 2.81 2.70 2.55 2.38 2.19 1.96
18 4.41 3.55 3.16 2.93 2.77 2.66 2.51 2.34 2.15 1.92
19 4.38 3.52 3.13 2.90 2.74 2.63 2.48 2.31 2.11 1.88
20 4.35 3.49 3.10 2.87 2.71 2.60 2.45 2.28 2.08 1.84
21 4.32 3.47 3.07 2.84 2.68 2.57 2.42 2.25 2.05 1.81
22 4.30 3.44 3.05 2.82 2.66 2.55 2.40 2.23 2.03 1.78
23 4.28 3.42 3.03 2.80 2.64 2.53 2.38 2.20 2.00 1.76
24 4.26 3.40 3.01 2.78 2.62 2.51 2.36 2.18 1.98 1.73
25 4.24 3.38 2.99 2.76 2.60 2.49 2.34 2.16 1.96 1.71
26 4.22 3.37 2.98 2.74 2.59 2.47 2.32 2.15 1.95 1.69
27 4.21 3.35 2.96 2.73 2.57 2.46 2.30 2.13 1.93 1.67
28 4.20 3.34 2.95 2.71 2.56 2.44 2.29 2.12 1.91 1.65
29 4.18 3.33 2.93 2.70 2.54 2.43 2.28 2.10 1.90 1.64
30 4.17 3.32 2.92 2.69 2.53 2.42 2.27 2.09 1.89 1.62
40 4.08 3.28 2.84 2.61 2.45 2.34 2.18 2.00 1.79 1.51

20

S-ar putea să vă placă și