Sunteți pe pagina 1din 15

Curs 2.

Recapitularea unor noiuni de statistic descriptiv i inferenial


Ne propunem n aceast seciune s facem un repertoar al celor mai importante
noiuni de statistic descriptiv i inferenial, noiuni ce vor fi folosite de-a lungul
cursului de econometrie.
Pentru detalii suntei rugai s consultai:
Server/Profiles/Chifu/Statistica_aplicata

2.1. Elemente de statistic descriptiv


Date, elemente, populaie, eantion, variabile, serii statistice

Statistica tiina colectrii, analizrii, prezentrii i interpretrii datelor.


date statistice
Clasificarea datelor statistice
Date calitative
etichete sau nume utilizate pentru
identificarea unui atribut al fiecrui element.
Pot fi numerice sau non-numerice

Date
statistice
Date cantitative
arat cantitatea fiind ntotdeauna date
numerice

elemente (uniti) statistice entiti n funcie de care sunt colectate datele.


populaie statistic ansamblul tuturor elementelor
eantion subansamblul unei populaii
variabil statistic caracteristic comun a unitilor unei populaii

Clasificarea variabilelor statistice


Variabile calitative
sunt formate din date
calitative

Variabile
statistice
Variabile cantitative
sunt formate din date
cantitative

Discrete
iau doar anumite
valori dintr-un
interval

Continue
iau orice valoare
dintr-un interval

Clasificarea II
Variabile atributive exprim o nsuire esenial a elementelor;
Variabile de timp exprim timpul n care au luat fiin elementele
(data de expirare a unui produs);
Variabile de spaiu exprim spaiul n care exist unitile
(localizarea punctelor de distribuie a presei).

Seria statistic grupare de valori rezultat ca urmare a analizrii unei


populaii n raport cu una sau mai multe variabile.

Clasificare
1. dup numrul variabilelor de la baza seriei:
Serii statistice unidimensionale au la baz o singur variabil;
Serii statistice multidimensionale au la baz dou sau mai multe
variabile.
2. dup tipul variabilelor de la baza seriei:
Serii calitative au la baz variabile calitative;
Serii cantitative au la baz variabile cantitative.
3. dup natura variabilelor de la baza seriei:
Serii atributive au la baz variabile atributive;
Serii cronologice (de timp) au la baz variabile de timp;
Serii teritoriale (de spaiu) au la baz variabile de spaiu;
4. o clasificare general a seriilor statistice ar fi urmtoarea:
Serii de repartiie redau distribuia populaiei n raport cu una sau
mai multe variabile;
Serii de variaie redau variaia unei mrimi n timp, spaiu sau de la
o categorie la alta.

Parametrii tendinei centrale i de structur


Cazul discret
Valoarea medie (, x )
populaie
eantion

xk N k

N
x k nk
n

xk f k ,
xk f k

Valoarea median (Me)


Modalitatea de calcul a valorii mediane n cazul discret implic urmtoarele etape:
N
Determinarea rangului valorii mediane: rMe ;
2
Dac rMe atunci Me = xrMe 1 , unde [rMe] reprezint partea
ntreag a rangului medianei;
xr xrMe 1
Dac rMe atunci Me = Me
.
2
Valoarea modal este acea valoare a unei variabile pentru care s-a nregistrat cea mai
mare frecven
Quartilele
Aa cum am vzut mpart populaia n 4 pri egale ceea ce implic faptul c vom
avea de calculat p=3 valori. Modalitatea de calcul nu difer foarte mult de cea din cazul
medianei. Astfel vom avea urmtoarele etape:
Determinarea rangului quartilei: rQ p
Dac rQ p atunci Qp = xrq

1 ,

p
N
4

unde [rQp] reprezint partea

ntreag a rangului quartilei;


xrq x rq 1
p
p
Dac rQ p atunci Qp =
.
2
Cazul datelor grupate pe intervale de variaie
Clasa
[xo , x1]
(x1 , x2]
...
(xk-1, xk]
...
(xr-1, xr]

Frecvena absolut Frecvena relativ


N1
f1
N2
f2
...
...
Nk
fk
...
...
Nr
fr

Valoarea medie (, x )
n cazul datelor grupate pe intervale de variaie modalitatea de calcul a valorii
medii este urmtoarea:

n cazul populaiei:

xk N k

x k f k , unde xk

xk 1 xk
, este centrul
2

N
clasei k (mijlocul intervalului de variaie).
xk nk x f , unde x xk 1 xk este centrul
n cazul eantionului x
k k
k
n
2
clasei k (mijlocul intervalului de variaie)

Valoarea median (Me)

Determinarea rangului valorii mediane:

Determinarea intervalului valorii mediane se calculeaz frecvenele cumulate


pn la acea frecven care adugat conduce la depirea rangului valorii
mediane, cu alte cuvinte dac N1+...+Nk rMe, atunci Me(xk-1 , xk] interval
cruia i corespunde frecvena Nk;
r N xk 1
xk xk 1 , unde N xk 1 este
Calcularea expresiei x = Me
Nk
frecvena cumulat pn la intervalul median;
Calcularea valorii mediane: Me = xk-1 + x.

Valoarea modal (Mo)

Determinarea intervalului valorii modale - acel interval pentru care s-au


nregistrat cele mai multe uniti statistice;

Mo = xk-1 +

1 2

xk xk 1 , unde 1 este diferena dintre frecvena

intervalului modal i frecvena intervalul precedent, iar 2 este diferena dintre


frecvena intervalului modal i frecvena intervalul urmtor.
Quartilele

p
N , p= 1,m 1 ;
m
Determinarea intervalului quartilei se calculeaz frecvenele cumulate pn la
acea frecven care adugat conduce la depirea rangului quartilei, cu alte
cuvinte dac N1+...+Nk rq p , atunci qp (xk-1 , xk];

Calcularea expresiei x =

Determinarea rangului quartilei: rq p

rq p N xk 1

xk xk 1 , unde N xk 1 este
Nk
frecvena cumulat pn la intervalul quartilei, iar lk este lungimea intervalului
quartilei;
Calcularea valorii quartile: qp = xk-1 + x, p= 1, m 1 .

Parametrii variaiei
Dispersia (2, s2). Abaterea medie ptratic (, s).
Dispersia

Populaie

Caz discret

xk

date

negrupate x2 =

Caz continuu (date grupate pe intervale de variaie):

xk
=

x2
unde xk

N
2
2 xk N k
date grupate x =
.
N

variaie).
Eantion

Caz discret

Nk

xk 1 xk
este centrul clasei k (mijlocul intervalului de
2

xk x

date negrupate

s x2 =

n 1

xk x nk .
2

date grupate

s x2 =

n 1

Caz continuu (date grupate pe intervale de variaie):

xk x nk ,
2

s x2 =

n 1

xk 1 xk
este centrul clasei k (mijlocul intervalului de
2
variaie), iar nk este frecvena clasei n eantion.
unde xk

Abaterea medie ptratic msoar gradul de reprezentativitate al valorii medii, dnd


msura gradului de mprtiere a valorilor variabilei n jurul valorii medii.
Populaie: x = x2 ;
Eantion: sx = s x2 .
Coeficientul de variaie al lui Pearson

Populaie: Vx = x 100 ;

s
Eantion: Vx = x 100 .
x
Coeficientul de corelaie liniar
5

rxy =

n x i y i x i y i

n x i2 x i

n y i2 y i

Valorile coeficientului de corelaie sunt cuprinse ntre -1 i 1. Astfel:


dac r[0;0,3] legtur liniar pozitiv (direct) slab;
dac r(0,3;0,7] legtur liniar pozitiv (direct) de
intensitate medie;
dac r (0,7;1] legtur liniar pozitiv (direct)
puternic;
dac r[-0,3;0] legtur liniar negativ (invers)
slab;
dac r[-0,7; -0,3) legtur liniar negativ (invers) de
intensitate medie;
dac r [-1; -0,7) legtur liniar negativ (invers)
puternic.

2.2. Elemente de statistic inferenial


Estimarea parametrilor

Estimarea punctual a parametrilor


Estimatorul punctual al valorii medii a populaiei este media de eantion

xi .
n

Estimatorul punctual al dispersiei populaiei x2 este dispersia de eantion

xi x

2
x

n 1

Estimatorul punctual al abaterii medii ptratice a populaiei x este abaterea


medie ptratic de eantion
sx= s x2 .
Estimatorul punctual al erorii standard a mediei x este s x unde:

sx

sx
n cazul populaiei infinite;
n

Estimatorul punctual al proporiei populaiei p este proporia la nivel de eantion

p.

Estimarea parametrilor prin intervale de ncredere


Intervalul (1,2) se numete interval de ncredere pentru parametrul necunoscut
dac P(1 2)= 1, unde (1) se numete coeficient (nivel) de ncredere
iar se numete coeficient (nivel) de semnificaie.
Dac este un estimator punctual al parametrului necunoscut atunci intervalul
de ncredere pentru parametrul va avea forma:
(eroarea de eantion)

Interval de ncredere pentru valoarea medie


x (eroarea de eantion)
Cazul eantioanelor de volum mare (n30)
Dac se cunoate dispersia populaiei atunci:

x z 2 x

Dac nu se cunoate dispersia populaiei atunci:

x z 2 s x

sx

sx
n

Nivel de semnificaie Nivel de ncredere P(0 z z ) z


2
2
1

0,1
0,90
0,45
1,65
0,05
0,95
0,475
1,96
0,01
0,99
0,495
2,58

Cazul eantioanelor de volum mic (n 30)

x t 2;n1gl s x , s x

sx
n

Interval de ncredere pentru estimarea diferenei a dou valori medii


Cazul eantioanelor independente
o Eantioane independente de volum mare (n1 30, n2 30)

1 2 x1 x2 z 2 x1 x2 , x1 x2

12
n1

22
n2

Dac nu se cunosc dispersiile populaiilor atunci acestea se nlocuiesc cu


estimatorii lor punctuali i anume dispersiile de eantion s12 , s 22 , iar x x se nlocuiete
1

cu estimatorul su punctual s x

1 x2

urmtoarea form:

2
1

2
2

s
s

. Astfel n acest caz intervalul va avea


n1 n 2

1 2 x1 x2 z 2 s x1 x2 .
o Cazul eantioanelor de volum mic (n1 30, n2 30)
1 2 x1 x 2 t 2; gl s x x ,

sx

1 x2

n 1s12 n 2 1s 22
1
1
, s2 1
.

n1 n 2 2
n1 n2

Cazul eantioanelor perechi

d d z 2 sd , d=x1 x2,

Valoarea medie: d

di , d

d d
i

x1i x2i

Dispersia: sd2

n 1

Abaterea medie ptratic s d


Eroarea standard s d

s d2 ;

sd
.
n

Verificarea ipotezelor statistice

Teste de semnificaie

Fie un parametru necunoscut al unei populaii. O ipotez formulat asupra


acestui parametru se va numi ipotez nul Ho.
Ho: =o
O alt ipotez ce se formuleaz este ipoteza alternativ H1 ce poate avea
urmtoarea form:
H1: o test bilateral;
H1: o test unilateral la dreapta;
H1: o test unilateral la stnga.
Etapele derulrii unui test de semnificaie
1. Formularea ipotezei nule i a ipotezei alternative
Test bilateral
Ho: =o
H1: o

Teste unilaterale
Ho: =o
Ho: =o
H1: o
H1: o

2. Determinarea nivelului de semnificaie - probabilitatea comiterii unei erori


prin respingerea ipotezei nule datorit erorii de eantionare, n cazul n care
aceasta este de fapt adevrat;
3. Colectarea datelor la nivel de eantion, alegerea i calcularea statisticii test
ce va fi folosit pentru a decide acceptarea sau respingerea ipotezei nule;
4. Determinarea valorilor critice ale statisticii;
5. Luarea deciziei.

Figura 12.2.1.

Zonele de respingere i de acceptare ale ipotezei nule


9

Test bilateral

Zon de
respingere

Zon de
respingere
Zon de
acceptare

valoarea critic

valoarea critic

Test unilateral la dreapta

Zon de
respingere
Zon de
acceptare

valoarea critic
Test unilateral la stnga

Zon de
respingere
Zon de
acceptare

valoarea critic

10

Verificarea ipotezelor asupra valorii medii


Test bilateral
Test unilateral
Formularea ipotezelor
Formularea ipotezelor
Ho: =o; H1: o
Ho: =o; H1: o
Ho: =o; H1: o
Determinarea nivelului de semnificaie
Determinarea nivelului de semnificaie

Colectarea datelor la nivel de eantion,


alegerea i calcularea statisticii:
x o
x o
a. z=
sau z=
x
sx

Colectarea datelor la nivel de eantion,


alegerea i calcularea statisticii:
x o
x o
a. z=
sau z=
x
sx

x o
sx

b. t=

b. t=

Determinarea valorilor critice


a. z 2
b. t 2;n 1gl
Luarea deciziei
Dac valorile calculate ale statisticilor
se afl ntre valorile critice atunci
ipoteza nul nu poate fi respins n caz
contrar aceasta se respinge

x o
sx

Determinarea valorilor critice


a. z
a. - z
b. t ;n 1gl
b. - t ;n 1gl
Luarea deciziei
Dac valorile
Dac valorile
calculate sunt mai
calculate sunt mai
mici dect cele critice mari dect cele
ipoteza nul nu poate critice ipoteza nul
fi respins.
nu poate fi respins.

Verificarea ipotezelor asupra diferenei valorilor medii 1-2


Eantioane independente
Test bilateral
Test unilateral
Formularea ipotezelor
Formularea ipotezelor
Ho: 1-2=0; H1: 1-20
Ho: 1-2=0; H1: 1-2 0
Ho: 1-2=0; H1: 1-20
Determinarea nivelului de semnificaie
Determinarea nivelului de semnificaie

Colectarea datelor la nivel de eantion,


alegerea i calcularea statisticii
n130, n230
z=

x x
1

sx

Colectarea datelor la nivel de eantion,


alegerea i calcularea statisticii
n130, n230
z=

1 x2

sx

1 x2

s12

n1

s 22

x x
1

sx

1 x2

n2

n130, n230 ( 12 22 2 )
t=

x 2 1 2
,
sx x

s12 s 22

n1 n 2

n130, n230 ( 12 22 2 )
t=

sx

1 x2

x x
1

sx

1 x2

11

sx

1 x2

s2

1
1

,
n1 n 2

sx

1 x2

n1 1s12 n2 1s22
n1 n2 2

s2

1
1

,
n1 n 2

n1 1s12 n2 1s22
n1 n2 2

Determinarea valorilor critice


n130, n230 z 2

Determinarea valorilor critice


n130, n230 z sau - z

n130, n230 t

n130, n230 t ;( n1 n2 2 ) gl sau

2 ;( n1 n2 2 ) gl

t ;( n1 n2 2 ) gl

Luarea deciziei

Luarea deciziei
Dac valorile
Dac valorile
Dac valorile calculate ale statisticilor
calculate sunt mai
calculate sunt mai
se afl ntre valorile critice atunci
mici dect cele
mari dect cele critice
ipoteza nul se accept n caz contrar
critice ipoteza nul ipoteza nul se
aceasta se respinge
se accept.
accept.
Eantioane perechi
Test bilateral
Test unilateral
Formularea ipotezelor
Formularea ipotezelor
Ho: d=0; H1: d 0
Ho: d=0; H1: d0
Ho: d=0; H1: d0
Determinarea nivelului de semnificaie
Determinarea nivelului de semnificaie

Colectarea datelor la nivel de eantion,


alegerea i calcularea statisticii
n30
d d
s
z=
, sd d
sd
n

Colectarea datelor la nivel de eantion,


alegerea i calcularea statisticii
n30
d d
s
z=
, sd d
sd
n

n30

n30

d d
s
, sd d
sd
n
Determinarea valorilor critice
n30 z 2

d d
s
, sd d
sd
n
Determinarea valorilor critice
n30 z sau - z

n30 t 2;( n 1 ) gl
Luarea deciziei

n30 t ;( n 1 ) gl sau t ;( n 1 ) gl
Luarea deciziei
Dac valorile
Dac valorile
calculate sunt mai
calculate sunt mai
mici dect cele
mari dect cele critice
critice ipoteza nul ipoteza nul se
se accept.
accept.

t=

Dac valorile calculate ale statisticilor


se afl ntre valorile critice atunci
ipoteza nul se accept n caz contrar
aceasta se respinge

t=

Analiza varianei (ANOVA)

Etapele unei analize de tip ANOVA


12

Formularea ipotezelor;
Ho: 1=2=...=k;
H1: nu toate mediile sunt egale.
2. Stabilirea nivelului de semnificaie ;
3. Calculul elementelor necesare determinrii valorii statisticii test
3.1. Calculul mediei i dispersiei fiecrui eantion xi ,si2 ,i 1,k ;
1.

3.2. Calculul valorii medii totale x ;


k

3.3. Calcul varianei ntre grupuri sb2

ni xi x
i 1

k 1

;
k

3.4. Calculul varianei n grupuri s w2 =

ni 1si2

ni 1si2
i 1

n1 ... nk k

= i 1

nk

Tabelul ANOVA
Tabelul ANOVA este un tabel n care se trec toate elementele calculate la punctul
acesta avnd urmtoarea structur:
Suma ptratelor

Grade de libertate

ntre grupuri

SSB

k1

n grupuri

SSW

nk

Sursa

SST=SSB+SSW
4. Calcularea statisticii test F;

F=
5.
6.

SSW

k 1 = sb2
n k

sb2 SSB k 1

s w2 SSW n k

n1

Total

SSB

Media sumelor ptratelor

s w2

Determinarea valorilor critice F; (k-1, n-k)gl;


Luarea deciziei: dac F F; (k-1, n-k)gl ipoteza nul se respinge n caz contrar
aceasta acceptndu-se.

13

Distribuia Student t
Grade de libertate

t0.100

t0.050

t0.025

t0.010

t0.005

1
2
3
4
5
6
7
8
9
10

3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372

6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812

12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228

31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764

63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169

11
12
13
14
15
16
17
18
19
20

1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325

1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725

2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086

2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528

3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845

21
22
23
24
25
26
27
28
29
30

1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310

1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697

2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042

2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457

2.831
2.819
2.808
2.797
2.787
2.779
2.771
2.763
2.756
2.750

40

1.303

1.684

2.021

2.423

2.704

60

1.296

1.671

2.000

2.390

2.660

120

1.289

1.658

1.980

2.358

2.617

14

Distribuia Fischer pentru un nivel de semnificaie de 5% (=0,5)


k-1
n-k

Grade de libertate ale numitorului

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40

Grade de libertate ale numrtorului


1

12

24

161.4
18.51
10.13
7.71
6.61
5.99
5.59
5.32
5.12
4.96
4.84
4.75
4.67
4.60
4.54
4.49
4.45
4.41
4.38
4.35
4.32
4.30
4.28
4.26
4.24
4.22
4.21
4.20
4.18
4.17
4.08

199.5
19.00
9.55
6.94
5.79
5.14
4.74
4.46
4.26
4.10
3.98
3.88
3.80
3.74
3.68
3.63
3.59
3.55
3.52
3.49
3.47
3.44
3.42
3.40
3.38
3.37
3.35
3.34
3.33
3.32
3.28

215.7
19.16
9.28
6.59
5.41
4.76
4.35
4.07
3.68
3.71
3.59
3.49
3.41
3.34
3.29
3.24
3.20
3.16
3.13
3.10
3.07
3.05
3.03
3.01
2.99
2.98
2.96
2.95
2.93
2.92
2.84

224.6
19.25
9.12
6.39
5.19
4.53
4.12
3.84
3.63
3.48
3.36
3.26
3.18
3.11
3.06
3.01
2.96
2.93
2.90
2.87
2.84
2.82
2.80
2.78
2.76
2.74
2.73
2.71
2.70
2.69
2.61

230.2
19.30
9.01
6.26
5.05
4.39
3.97
3.69
3.48
3.33
3.20
3.11
3.02
2.96
2.90
2.85
2.81
2.77
2.74
2.71
2.68
2.66
2.64
2.62
2.60
2.59
2.57
2.56
2.54
2.53
2.45

234.0
19.33
8.94
6.16
4.95
4.28
3.87
3.58
3.37
3.22
3.09
3.00
2.92
2.85
2.79
2.74
2.70
2.66
2.63
2.60
2.57
2.55
2.53
2.51
2.49
2.47
2.46
2.44
2.43
2.42
2.34

239.0
19.37
8.84
6.04
4.82
4.15
3.73
3.44
3.23
3.07
2.95
2.85
2.77
2.70
2.64
2.59
2.55
2.51
2.48
2.45
2.42
2.40
2.38
2.36
2.34
2.32
2.30
2.29
2.28
2.27
2.18

244.0
19.41
8.74
5.91
4.68
4.00
3.57
3.28
3.07
2.91
2.79
2.69
2.60
2.53
2.48
2.42
2.38
2.34
2.31
2.28
2.25
2.23
2.20
2.18
2.16
2.15
2.13
2.12
2.10
2.09
2.00

249.0
19.45
8.64
5.77
4.53
3.84
3.41
3.12
2.90
2.74
2.61
2.50
2.42
2.35
2.29
2.24
2.19
2.15
2.11
2.08
2.05
2.03
2.00
1.98
1.96
1.95
1.93
1.91
1.90
1.89
1.79

254.3
19.50
8.53
5.63
4.36
3.67
3.24
2.93
2.71
2.54
2.40
2.30
2.21
2.13
2.07
2.01
1.96
1.92
1.88
1.84
1.81
1.78
1.76
1.73
1.71
1.69
1.67
1.65
1.64
1.62
1.51

15

S-ar putea să vă placă și