Sunteți pe pagina 1din 8

MA Curs 1 Statistică 1

STATISTICĂ

Statistica se ocupă cu colectarea, prelucrarea şi interpretarea datelor.


- Statistica descriptivă - culegerea şi înregistrarea datelor asupra unui fenomen
- Statistica matematică – gruparea, analizarea şi interpretarea datelor în vederea elaborării
unor previziuni privind evoluţia viitoare a fenomenului.
Modelele statistice se bazează pe teoria probabilităţilor.
Aplicații.
- Fizică, inginerie, biologie, psihologie, economie, sociologie
- Monitorizarea proceselor industriale
- Teoria fiabilității
- Risc și prognoză
Definiţii.
- populaţie statistică = orice mulţime care formează obiectul unei analize statistice (o mulţime
de piese, creditorii unei bănci).
- volumul populaţiei statistice = numărul elementelor mulţimii.
- unitate statistică = un element din populaţie ( un student, un locuitor, o piesă)
- caracteristică = o trăsătură comună tuturor unităţilor unei populaţii care ne interesează în
cadrul analizei statistice ( o marime fizică - rezistenţă, diametru, etc, nr ore de funcţionare ).
- selecţie = alegerea la întâmplare a unor unităţi statistice dintr-o populaţie statistică şi cercetarea
lor din punct de vedere al caracteristicii.
- volumul selecției = numărul elementelor selecției
Analiza se poate face după una sau mai multe caracteristici (ex: gruparea unor indivizi după vârstă şi
după venit). O caracteristică poate fi
o cantitativă, dacă se poate măsura
o calitativă, în caz contrar (mult, puţin, bun,rău)
- variabila statistică = valoarea numerică a unei caracteristici cantitative. Ea poate fi
- discretă dacă ia un număr finit de valori sau
- continuă dacă poate lua orice valoare dintr-un interval.
Selecția poate fi totală (în cazul unui recensământ) sau parțială.
Pentru a rezolva probleme practice:
- stabilim populaţia statistică;
- stabilim caracteristica (caracteristicile): cantitativă sau calitativă;
- realizăm o selecţie de volum n, adică studiem n unităţi statistice și obţinem un şir de valori
x1 , x 2 ,..., x n ;
- analizăm aceste valori: le reprezentăm grafic, calculăm indicatori statistici;
MA Curs 1 Statistică 2

- modelăm fenomenul fizic printr-unul teoretic: se asociază fenomenului studiat o variabilă


aleatoare teoretică X. Această variabilă aleatoare (sau repartiţie) teoretică are o lege de
repartiţie (dată de repartiţia probabilităţilor sau de densitatea de repartiţie) ce depinde de unul
sau mai mulţi parametrii;
- statistica matematică oferă metode pentru a estima (a aproxima) parametrii şi pentru a verifica
ipotezele făcute;
- interpretăm rezultatele, eventual realizăm predicții.

1. Elemente de statistică descriptivă


Gruparea datelor
Presupunem că în urma a n observaţii independente realizate în condiţii identice s-a obţinut un şir de
valori. Acestea se ordonează şi se aşează într-un tablou.
Exemplul 1. Să presupunem că s-a măsurat o mărime fizică pentru 20 de piese alese la întâmplare
dintr-o mulţime mai mare şi s-a obţinut următorul şir statistic simplu 33 32 35 34 37 35 36 37 34 36
33 37 33 35 36 35 35 34 37 33. Se observă că unele valori se repetă, deci putem alcătui
următorul tablou:

X 32 33 34 35 36 37
nr apariţii 1 4 3 5 3 4

Reprezentarea variabilelor statistice discrete


 Printr-un tablou

X x1 x2 … xk
Frecvenţe absolute 1 2 … k
1 2 k
Frecvenţe relative …
n n n
Frecvenţe absolute
1 1   2 … 1   2  ...   k
cumulate
Frecvenţe relative 1 1  2 1  2 
 …   ...  k
cumulate n n n n n n

în care x j , j  1, k sunt valorile distincte , n este volumul selecţiei ,  j este frecvenţa absolută a

valorii x j , adică numărul de apariţii, n  1   2  ...   k , iar  j / n este frecvenţa relativă.

 Prin bastoane
MA Curs 1 Statistică 3

1

O x1 xk x

 x1 x2 ... x k 
Observaţie. Tabelul  2 k  este asemănător cu o variabilă aleatoare
 1 ... 
n n n 

x x2 ... x k 
X :  1 .
 p1 p2 ... p k 
Indicatori statistici
1. Media de selecţie
not 1 k
 Pentru variabilă statistică discretă X   x j j , k este numărul valorilor distincte
n j1
2. Mediana - împarte şirul ordonat în două părţi egale ca număr.
 Pentru variabilă statistică discretă
– dacă n  2p  1 atunci Me  x p1 ( valoarea din mijloc)

x p  x p 1
- dacă n  2p atunci Me 
2
3. Modul
 pentru o variabilă statistică discretă este valoarea cu frecvenţă maximă;
4. Amplitudinea absolută a unei serii statistice este A  x max  x min .

5. Dispersia DX  
1 k
 x j  X 2
 j 
1 k 2
 x j  j  X 2 , unde k este numărul valorilor distincte.
n j1 n j1

6. Abaterea medie pătratică (indică gradul de împrăştiere a valorilor în jurul mediei)   D



7. Coeficientul de variaţie V  .
X
Exemplul 1. Reluăm exemplul de la pagina 1. Să se reprezinte datele într-un tablou şi să se calculeze
indicatorii statistici.
Rezolvare.

X 32 33 34 35 36 37
MA Curs 1 Statistică 4

Frecvenţe
1 4 3 5 3 4 20
absolute
Frecvenţe 1 4 3 5 3 4
1
relative 20 20 20 20 20 20
Frecvenţe
absolute 1 5 8 13 16 20
cumulate
Frecvenţe
1 5 8 13 16
relative 1
20 20 20 20 20
cumulate

X  ( 32 33 34 35 36 37 )

N   
1 4 3 5 3 4

 20 20 20 20 20 20 

0.2
N
0.1

32 33 34 35 36 37
X

32  1  33  4  34  3  35  5  36  3  37  4 697
- Media este X    34,85
20 20
x k  x k 1 n
- Mediana Me  , unde k   10 . Considerând şirul ordonat al valorilor avem
2 2
x 10  35 , x 11  35  Me 35 .
- Amplitudinea absolută este A  37  32  5 .
- Dispersia este

32 2  1  33 2  4  34 2  3  ...  37 2  4
D  X 2  2,328
20
- Abaterea medie pătratică   D  1,526


- coeficientul de variaţie V   0,043
X
MA Curs 1 Statistică 5

Pentru a calcula indicatorii statistici cu programul Mathcad introducem vectorul Z ce conține toate
valorile:

Z  ( 32 33 33 33 33 34 34 34 35 35 35 35 35 36 36 36 37 37 37 37 )
media este mean ( Z)  34.85 mediana este median( Z)  35

dispersia var ( Z)  2.328


abaterea medie patratica stdev ( Z)  1.526
 32.5 1
 33.5 4

 
1  3.322 log( 20)  5.322 histogram( 5 Z)   34.5 8
 35.5 3
 
 36.5 4

y 3

1
32 33 34 35 36 37
x

Dacă numărul datelor e foarte mare se realizează o grupare pe intervale.


Se consideră x1 , x k 1 = x min , x max  ce se împarte într-un număr de subintervale x1 , x 2  ,
x 2 , x 3  ,…, x k , x k 1  . Lungimile intervalelor se pot calcula cu formula lui Sturges
x max  x min

1  3,322 lg n
număr intervale = 1  3,322 lg n .
Observație. Dacă avem un șir mare de date pe care dorim să le grupăm în intervale cu ajutorul
programului Mathcad folosim funcția histogram(n,X), în care n este numărul intervalelor, iar X este
vectorul ce conține datele. Funcția returnează o matrice în care prima coloană reprezintă mijloacele
intervalelor, iar a doua coloană frecvențele absolute corespunzătoare fiecărui interval.
Reprezentarea variabilelor statistice continue
 Printr-un tablou

X x1 , x 2  x 2 , x 3  … x k , x k 1 
Frecvenţe absolute 1 2 … k
1 2 k
Frecvenţe relative …
n n n
MA Curs 1 Statistică 6

Frecvenţe absolute
1 1   2 … 1   2  ...   k
cumulate
Frecvenţe relative 1 1  2 1  2 
 …   ...  k
cumulate n n n n n n

 Prin histogramă: luăm pe axa orizontală segmente de lungimi egale ce reprezintă amplitudinea
claselor şi construim pe aceste segmente dreptunghiuri cu înălţimi proporţionale cu frecvenţele
absolute sau relative. Dacă din mijlocul fiecărui segment de pe axa orizontală ridicăm
segmente proporţionale cu frecvenţele şi unim printr-o linie poligonală aceste puncte obţinem
poligonul frecvenţelor.

Indicatori statistici
1. Media de selecţie
not 1 k *
 Pentru variabilă statistică continuă X  
n j1
x j  j , unde k este numărul intervalelor, iar x *j

sunt mijloacele intervalelor.


2. Modul - pentru o variabilă statistică continuă este o valoare din intervalul cu frecvenţă maximă
3. Amplitudinea absolută a unei serii statistice este A  x max  x min .

4. Dispersia

 Pentru variabilă aleatoare continuă DX  


1 k *

n j1
x j  X 
2
 j  
n j1
 
1 k * 2
x j  j  X 2 , unde k

este numărul intervalelor, iar x *j sunt mijloacele intervalelor.

5. Abaterea medie pătratică (indică gradul de împrăştiere a valorilor în jurul mediei)

 D

6. Coeficientul de variaţie V  .
X
Exemplul 2. Reluăm exemplul de la pagina 1. Să se împartă datele în intervale, să se reprezinte grafic şi
să se calculeze indicatorii statistici.
Rezolvare. Nr intervale = 1  3,322  lg( 20)  5 ,
MA Curs 1 Statistică 7

37  32
Lungimea unui interval    1.
1  3.322  lg( 20)
Reprezentăm datele într-un tabel

X [32,33) [33,34) [34,35) [35,36) [36,37]


Frecvenţe
1 4 3 5 7
absolute
Frecvenţe 1 4 3 5 7
relative 20 20 20 20 20
Frecvenţe
absolute 1 5 8 13 20
cumulate
Frecvenţe
1 5 8 13
relative 1 8
20 20 20 20
cumulate 7
6
x *j 32,5 33,5 34,5 35,5 36,5

frecvente
5
4
3
2
1
0
33
[32,33)
[33,34)
[34,35)
[35,36)
[36,37)
MA Curs 1 Statistică 8

Pentru calculul indicatorilor statistici alcătuim următorul tabel:


mijloc interval frecventa
intervale x *
j j x *j  j x *
j 
2
 X j
[32,33) 32.5 1 32.5 7.0225
[33,34) 33.5 4 134 10.89
[34,35) 34.5 3 103.5 1.2675
[35,36) 35.5 5 177.5 0.6125
[36,37] 36.5 7 255.5 12.7575
Suma 20 703 32.55

media 35.15 abaterea 1.276


dispersia 1.628

1 5 * 703
- Media de selecţie este X  
20 j1
x j j 
20
 35,15 , unde x *j sunt mijloacele intervalelor

- Dispersia D 
1 5 *

20 j1
 2

xj  X j 
32,55
20
 1,628

- Abaterea medie pătratică   D  1,276


- Coeficientul de variaţie V   0,036 .
X
Se observă că rezultatele diferă uşor în cele două cazuri.

S-ar putea să vă placă și