Sunteți pe pagina 1din 8

MA Curs 1 Statistic

1
STATISTIC

Statistica se ocup cu colectarea, prelucrarea i interpretarea datelor.


-

Statistica descriptiv - culegerea i nregistrarea datelor asupra unui fenomen

Statistica matematic gruparea, analizarea i interpretarea datelor n vederea elaborrii


unor previziuni privind evoluia viitoare a fenomenului.

Aplicaii.
-

Fizic, inginerie, biologie, psihologie, economie, sociologie

Monitorizarea proceselor industriale

Teoria fiabilitii

Risc i prognoz

Definiii.
-

populaie statistic = orice mulime care formeaz obiectul unei analize statistice (mulimea
studenilor dintr-o serie , populaia unei ri sau a unui ora, o mulime de piese).

volumul populaiei statistice = numrul elementelor mulimii.

unitate statistic = un element din populaie ( un student, un locuitor, o pies)

caracteristic = o trstur comun tuturor unitilor unei populaii care ne intereseaz n


cadrul analizei statistice ( nota la un examen , vrsta , diametrul piesei, nr ore de funcionare ).

selecie = alegerea la ntmplare a unor uniti statistice dintr-o populaie statistic i cercetarea
lor din punct de vedere al caracteristicii. Selecia poate fi cu sau fr ntoarcere.

volumul seleciei = numrul elementelor seleciei

Analiza se poate face dup una sau mai multe caracteristici (ex: gruparea unor indivizi dup vrst i
dup venit). O caracteristic poate fi

cantitativ, dac se poate msura

calitativ, n caz contrar (mult, puin, bun,ru)

variabila statistic = valoarea numeric a unei caracteristici cantitative. Ea poate fi


- discret dac ia un numr finit de valori sau
- continu dac poate lua orice valoare dintr-un interval.

Selecia poate fi total (n cazul unui recensmnt) sau parial. n practic, pentru a studia o
anumit caracteristic a unei populaii statistice nu se examineaz toat populaia, ci numai un numr
finit de uniti statistice. Se presupune c rezultatele obinute sunt caracteristice pentru toat populaia.
Metodele de a alege un eantion reprezentativ nu fac obiectul acestui curs.
Tipuri de probleme practice
1. Se verific 200 de microcircuite dintr-un lot mai mare. Se gsesc 3 defecte. Putem afirma cu
probabilitate 95% c 99% dintre microcircuite sunt bune?
2. O firm produce un tip de piese. Probabilitatea s se produc o defectare n timpul primelor
1000 de ore de funcionare este 0,02. Prin aplicarea unei tehnologii mbuntite s-au produs 20

MA Curs 1 Statistic

de piese care au fost urmrite timp de 1000 de ore i s-a notat numrul defectrilor. Putem
spune c se produc piese mai fiabile? Cu ce probabilitate?
Pentru a rezolva probleme practice procedm n modul urmtor:
-

stabilim populaia statistic;

stabilim caracteristica (caracteristicile) : cantitativ sau calitativ;

realizm o selecie de volum n, adic studiem n uniti statistice i obinem un ir de valori

x1 , x 2 ,..., x n ;
-

analizm aceste valori: le reprezentm grafic, calculm indicatori statistici;

modelm fenomenul fizic printr-unul teoretic: pe baza observaiilor statistica matematic ofer
metode pentru a stabili care variabil aleatoare teoretic X se poate asocia fenomenului studiat.
Aceast variabil aleatoare (sau repartiie) teoretic are o lege de repartiie (dat de repartiia
probabilitilor sau de densitatea de repartiie) ce depinde de unul sau mai muli parametrii;

statistica matematic ofer metode pentru a estima (a aproxima) parametrii i pentru a verifica
ipotezele fcute;

interpretm rezultatele, eventual realizm predicii.

1. Elemente de statistica descriptiv


Gruparea datelor
Presupunem c n urma a n observaii independente realizate n condiii identice s-a obinut un ir de
valori. Acestea se ordoneaz i se aeaz ntr-un tablou.
Exemplul 1. S presupunem c s-a msurat o mrime fizic pentru 20 de piese alese la ntmplare
dintr-o mulime mai mare i s-a obinut urmtorul ir statistic simplu 33 32 35 34 37 35 36 37 34 36
33 37 33 35 36

33. Se observ c unele valori se repet, deci putem alctui

35 35 34 37

urmtorul tablou:

X
nr apariii

32
1

33
4

34
3

35
5

36
3

37
4

Reprezentarea variabilelor statistice discrete

Printr-un tablou
X

x1

x2

xk

Frecvene absolute

Frecvene relative

1
n

2
n

k
n

MA Curs 1 Statistic

Frecvene absolute
cumulate
Frecvene relative
cumulate

1 2

1 2 ... k

1
n

1 2

n
n

1 2

... k
n
n
n

n care x j , j 1, k sunt valorile distincte , n este volumul seleciei , j este frecvena absolut a
valorii x j , adic numrul de apariii, n 1 2 ... k , iar j / n este frecvena relativ.

Prin bastoane

Observaie.

x
X : 1
p1

x2
p2

x1

1
n

Tabelul

x2
2
n

xk

x1

... x k
k
...
n

este

asemntor

cu

variabil

aleatoare

... x k
.
... p k

Indicatori statistici
1. Media de selecie

not

Pentru variabil statistic discret X

1 k
x j j , k este numrul valorilor distincte
n j1

2. Mediana - mparte irul ordonat n dou pri egale ca numr.


Pentru variabil statistic discret
dac n 2p 1 atunci Me x p1 ( valoarea din mijloc)
-

dac n 2p atunci Me

x p x p 1
2

3. Modul

pentru o variabil statistic discret este valoarea cu frecven maxim;

4. Amplitudinea absolut a unei serii statistice este A x max x min .


5. Dispersia

DX

1 k
1 k 2
2

j
x j j X 2 , unde k este numrul valorilor distincte.
j
n j1
n j1

6. Abaterea medie ptratic (indic gradul de mprtiere a valorilor n jurul mediei)

MA Curs 1 Statistic

7. Coeficientul de variaie V

.
X

Exemplul 1. Relum exemplul de la pagina 1. S se reprezinte datele ntr-un tablou i s se calculeze


indicatorii statistici.
Rezolvare.
X
Frecvene
absolute
Frecvene
relative

32

33

34

35

36

37

20

1
20

4
20

3
20

5
20

3
20

4
20

13

16

20

1
20

5
20

8
20

13
20

16
20

Frecvene
absolute
cumulate
Frecvene
relative
cumulate

X ( 32 33 34 35 36 37 )
N

20 20 20 20 20 20
1

35

36

0.2
N
0.1

32

33

34

37

Media este X

32 1 33 4 34 3 35 5 36 3 37 4 697

34,85
20
20

Mediana Me

x k x k 1
n
, unde k 10 . Considernd irul ordonat al valorilor avem
2
2

x 10 35 , x 11 35 Me 35 .
-

Amplitudinea absolut este A 42 32 10 .

Dispersia este

MA Curs 1 Statistic

32 2 1 33 2 4 34 2 3 ... 37 2 4
D
X 2 2,328
20
-

Abaterea medie ptratic D 1,526

coeficientul de variaie V

0,043
X

Pentru a calcula indicatorii statistici cu programul Mathcad


Metoda 1. Introducem vectorul Z ce conine toate valorile:
Z ( 32 33 33 33 33 34 34 34 35 35 35 35 35 36 36 36 37 37 37 37 )
este mean ( Z) 34.85

media
dispersia
abaterea

mediana

este median( Z) 35

var ( Z) 2.328
stdev ( Z) 1.526

medie patratica

32.5
33.5

histogram( 5 Z) 34.5
35.5

36.5

1 3.322 log( 20) 5.322

8
3

4
4

Metoda 2.

32
33

34
X
35
36

37

media este
dispersia este

4
20

20
5
20

3
20
4

20
1

20

m mean ( X N )

m 34.85
2

mean X N m 2.327

abaterea medie patratica este 2.327 1.525

Dac numrul datelor e foarte mare se realizeaz o grupare pe intervale. Se consider cea mai
mic i cea mai mare valoare ce determin un interval x 1 , x k 1 ce se mparte ntr-un numr de
subintervale x 1 , x 2 , x 2 , x 3 ,, x k , x k 1 . Lungimile intervalelor se pot calcula cu formula lui
Sturges

MA Curs 1 Statistic

x max x min
1 3,322 lg n

numrul intervalelor fiind 1 3,322 lg n .


Observaie. Dac avem un ir mare de date pe care dorim s le grupm n intervale cu ajutorul
programului Mathcad folosim funcia histogram(n,X), n care n este numrul intervalelor, iar X este
vectorul ce conine datele. Funcia returneaz o matrice n care prima coloan reprezint mijloacele
intervalelor, iar a doua coloan frecvenele absolute corespunztoare fiecrui interval.
Reprezentarea variabilelor statistice continue

Printr-un tablou

x1 , x 2

x 2 , x 3

x k , x k 1

Frecvene absolute

Frecvene relative

1
n

2
n

k
n

1 2

1 2 ... k

1
n

1 2

n
n

1 2

... k
n
n
n

Frecvene absolute
cumulate
Frecvene relative
cumulate

Prin histogram: lum pe axa orizontal segmente de lungimi egale ce reprezint amplitudinea
claselor i construim pe aceste segmente dreptunghiuri cu nlimi proporionale cu frecvenele
absolute sau relative. Dac din mijlocul fiecrui segment de pe axa orizontal

ridicm

segmente proporionale cu frecvenele i unim printr-o linie poligonal aceste puncte obinem
poligonul frecvenelor.

Indicatori statistici
1. Media de selecie

MA Curs 1 Statistic

7
not

Pentru variabil statistic continu X

1 k *
x j j , unde k este numrul intervalelor, iar x *j

n j1

sunt mijloacele intervalelor.


2. Modul - pentru o variabil statistic continu este o valoare din intervalul cu frecven maxim
3. Amplitudinea absolut a unei serii statistice este A x max x min .
4. Dispersia

Pentru variabil aleatoare continu DX

2
1 k *
1 k * 2
x

x j j X 2 , unde k

j
j
n j1
n j1

este numrul intervalelor, iar x *j sunt mijloacele intervalelor.


5. Abaterea medie ptratic (indic gradul de mprtiere a valorilor n jurul mediei)

D
6. Coeficientul de variaie V

.
X

Exemplul 2. Relum exemplul de la pagina 1. S se mpart datele n intervale, s se reprezinte grafic i


s se calculeze indicatorii statistici.
Rezolvare.

Numrul

intervalelor

este

1 3,322 log( 20) 5

iar

lungimea

37 32
1 . Reprezentm datele ntr-un tabel
1 3.322 log( 20)
X

Frecvene
absolute
Frecvene
relative

[32,33)

[33,34)

[34,35)

[35,36)

[36,37]

1
20

4
20

3
20

5
20

7
20

13

20

1
20

5
20

8
20

13
20

32,5

33,5

34,5

35,5

36,5

Frecvene
absolute
cumulate
Frecvene
relative
cumulate

x *j

unui

interval

MA Curs 1 Statistic

Histograma
8
7

[32,33)

frecvente

[33,34)

[34,35)

[35,36)

[36,37)

1
0

33

34

[32,33)
[33,34)
[34,35)
[35,36)
[36,37)

35

36

37

1
4
3
5
7

valori

Pentru calculul indicatorilor statistici alctuim urmtorul tabel:

intervale

x *j

[32,33)
[33,34)
[34,35)
[35,36)
[36,37]

32.5
33.5
34.5
35.5
36.5

x *j j

*
j

X j

1
4
3
5
7
20

32.5
134
103.5
177.5
255.5
703

7.0225
10.89
1.2675
0.6125
12.7575
32.55

media
dispersia

35.15
1.628

abaterea

1 5 *
703
x j j
35,15 , unde x *j sunt mijloacele intervalelor

20 j1
20

Media de selecie este X

dispersia D

abaterea medie ptratic D 1,276

coeficientul de variaie V

1.276

2
1 5 *
32,55
xj X j
1,628

20 j1
20

0,036 .
X

Se observ c rezultatele difer uor n cele dou cazuri. Calculele se pot face n Excel sau
Mathcad.

S-ar putea să vă placă și