Sunteți pe pagina 1din 27

STATISTIC PENTRU MANAGEMENT

Prof.Constantin Mitrut ASE Bucuresti


Email mitrut.constantin@gmail.com
cmitrut@ase.ro
Evaluare:
Proiect,teste,activ.sem. 40%
Examen final 60%
CE SUNT DATELE ?
Date informatii inregistrate sistematic ( numere, cuvinte,
etichete, cod ) impreuna cu contextul
Datele sunt inutile fara context
Context :
- Cine a fost masurat
- Ce a fost masurat
- Unde au fost culese datele
- Cind au fost culese datele
- De ce s-a realizat cercetarea
- Ce date au fost culese
Problema datelor
Adecvare
Comparabilitate
Omogenitate
Valori extreme
Erori de masurare
Erori de reprezentativitate
Influenta agregarii
Masurarea in statistica
Scala nominala
Scala ordinala
Scala de interval
Scala de raport
Date tipuri si surse
Tipuri de date :
Cross Sectional (Transversale)
Panel
Serii de timp
Surse de date : INSE, BNR, Cercetari special
organizate
Acuratetea datelor : erori de masurare; erori
de reprezentativitate; influenta agregarii
etc.

Tipuri de date Cross Sectional
Datele Cross-sectional reprezinta un esantion
aleator.
Fiecare observatie este un nou individ, firma,
etc. cu informatii la un anumit moment de
timp.
Daca datele nu sunt un esantion aleator avem
o problema de selectie.

Structura datelor - Cross Sectional
Date cross-sectional referitoare salariu si alte caracteristici
individuale
Obs. salariu educ expe
r
Gen(F=
1)
Statut(Casatorit=
1)

1 3.1 11 2 1 0
2 3.4 12 22 0 1
3 3.0 11 2 0 0
4 6.0 8 44 1 1
4 5.3 12 7 0 1
. . . . . .
. . . . . .
. . . . . .
1000 11.5 13 5 0 0
Tipuri de date Panel Data

Sunt selectate aleator date cross sections la
diferite perioade de timp.

Putem urmari acelasi esantion in timp sunt
numite panel data or longitudinal data.
Date Panel Ex.
Preturi la case pentru 2 ani :
Obs. Year Hprice Propta
x
sqrft Rooms
1 2000 85,550 42 1600 5
2 2000 67,300 36 1440 4
3 2000 134,00
0
38 2000 6

1000 2000 243,60
0
41 2600 8
1001 2003 65,000 16 1250 3
1002 2003 182,40
0
20 1540 6

2000 2003 97,500 16 1100 4
Panel Data
Panel data pentru 2 ani pentru studiul criminalitatii urbane:
Obs. Oras Anul Crime Populatie RS Politisti
1 1 2000 5 350,000 8.7 440
2 1 2001 8 359,200 7.2 471
3 2 2000 2 64,300 5.4 75
4 2 2001 1 65,100 5.5 75
5 3 2000 10 260,700 9.6 286
6 3 2001 6 245,000 9.8 286

400 200 2000 25 543,00 4.3 520
400 200 2001 32 546,200 5.2 493
Tipuri de date Serii de timp

Seria de timp prezinta date pentru fiecare
perioada de timp.
Nu reprezinta un esantion aleator.
Trendul si sezonalitatea sunt importante .
.
Serii de timp -Ex.
Obs. Anul RI PIB RS Rata
Cons.
1 1971 3.1 42.1 4.1 30.5
2 1972 3.12 43.4 3.9 32.1
3 1973 3.5 40.8 4.4 31.8
4 1974 3.8 42.9 5.0 32.0
5 1975 4.1 45.5 4.8 33.2
6 1976 5.0 46.7 5.2 34.3
7 1977 5.2 48.9 5.1 35.6

30 2000 11.1 146.7 8.5 120.4
DESCRIEREA DATELOR


Tendinta centrala
Imprastierea datelor
Asimetrie
Aplatizare ( boltire)
Indicatori Statistici
Beta
Mean 0,97106
Standard Error 0,005335
Median 0,97
Mode 0,91
Standard Deviation 0,240319
Sample Variance 0,057753
Kurtosis -0,07283
Skewness -0,07146
Range 1,53
Minimum 0,23
Maximum 1,76
Sum 1970,28
Count 2029
INDICATORI DESCRIPTIVI
Mean


Sample Variance

1
n
i
i
X
X
n
=
=

2
2
1
( )
1
n
i
i
X X
s
n
=

INDICATORI DESCRIPTIVI
Standard Deviation



Standard Error
2
1
( )
1
n
i
i
X X
s
n
=

s
SE
n
=
INDICATORI DESCRIPTIVI
Median
Mode
INDICATORI DESCRIPTIVI
Kurtosis



Skewness
4
1
2
4
( )
3
( 1)
n
i
i
X X
n s

3
1
1
3
( )
( 1)
n
i
i
X X
n s

Positively skewed
Negatively skewed
Numarul de clase modale
histograma unimodala
Clasa modala
histograma bimodala
Clasa modala Clasa modala
Histograma simetrica ( Bell shaped )


N
u
m
b
e
r

o
f

p
e
r
s
o
n
s
+1o 1o 2o 3o +2o +3o
95.4%
99.7%
68.3%
BOX PLOTS
Expenses
1000
2000
3000
4000
5000
6000
7000
8000
9000
Q
3
Third quartile
Q
2
Median
Q
1
First quartile
IQR = Q
3
- Q
1
Whisker
Whisker
Outer Fence
Inner Fence
Inner Fence
Outer Fence
Q
3
+ 1.5 IQR
Q
3
+ 3 IQR
Q
1
- 1.5 IQR
Q
1
- 3 IQR
Valori extreme
Valori extreme

S-ar putea să vă placă și