Sunteți pe pagina 1din 30

Bazele Statisticii

Curs 2

anul universitar 2023-2024


Prof. univ. dr. Mariana HATMANU

1
1
2. Analiza unei distribuţii (serii) statistice
unidimensionale
STRUCTURĂ CURS
INTRODUCERE
2.1. Variabile numerice (cantitative)
A) cu variație discretă
A1. prezentarea seriei (distribuției) statistice (frecvenţe absolute
şi relative; frecvente cumulate)
A2. analiza seriei folosind indicatori ai statisticii descriptive:
A2.1. indicatori ai tendinței centrale (mărimi medii)
A2.2. indicatori ai dispersiei
A2.3. indicatori ai formei
A3. analiza seriei folosind metode grafice
B) cu variație continuă
2.2. Variabile nenumerice (calitative) 2
2. Analiza unei distribuţii (serii)
statistice unidimensionale
Introducere
Sistematizarea datelor statistice
- Reprezintă prima fază a prelucrării statistice și
vizează obținerea de distribuții statistice
- Se realizează prin:
- Centralizarea - totalizarea unităților statistice sau a
valorilor unei caracteristici la nivelul grupelor tipice sau al
populației observate
- Gruparea statistică – o centralizare pe grupe a
unităților unei populații (gruparea după o variabilă
nominală = clasificare) 3
2. Analiza unei distribuţii (serii)
statistice unidimensionale
Gruparea datelor statistice după o variabilă
numerică se poate face:
- pe variante (cazul variabilei discrete)
- pe intervale de variație (cazul variabilei continue)

Gruparea datelor statistice pe variante.


Ex. Pentru 20 de familii s-a înregistrat numărul de copii: 1, 2, 3, 0, 3, 0,
1, 4, 1, 3, 3, 2, 5, 2, 4, 3, 5, 3, 8, 2. Să se realizeze sistematizarea
datelor.

4
2. Analiza unei distribuţii (serii)
statistice unidimensionale
Gruparea datelor statistice pe intervale de variație.
- Se poate realiza pe intervale de mărime egală sau diferită. În
continuare, vom trata numai cazul grupării datelor pe intervale
egale de variație.
Pași de urmat:
1. Se determină amplitudinea de variație a caracteristii, A  xmax  xmin
2. Se stabilește numărul de grupe, k
A
3. Se determină mărimea intervalului de grupare, h 
k
4. Se formează intervalele de grupare

5
2. Analiza unei distribuţii (serii)
statistice unidimensionale
Exemplu. (Gruparea datelor statistice privind valoarea facturilor
emise zilnic pentru un eșantion de 50 de magazine)

6
2. Analiza unei distribuţii (serii)
statistice unidimensionale
2.1. Variabile numerice (cantitative)

A. Variabilă discretă
A1. Prezentarea seriei (distribuţiei) statistice
- seria simplă X:(xi), cu i=1,m, este seria cu frecvente egale
- seria cu frecvenţe diferite X:  xi  , când n1≠n2≠ … ≠ni.
n 
 i
Frecvenţe absolute şi relative……
Ex. Distribuţia studenţilor din anul I, FEAA, după nota obţinută la examenul
de Microeconomie, în sesiunea ianuarie 2024 – date convenţionale
(slide 10) 7
• Frecvenţe absolute cumulate crescător (Ni  ) sau
descrescător (Ni  )
- exprimă numărul de unităţi statistice cumulate “până la”
sau “peste” nivelul considerat al caracteristicii, adică
valori ≤ xi, respectiv ≥ xi.

i
N i  N i 1   ni   nh
h 1

m
N i  N i 1   ni   nh
h i

8
• Frecvenţe relative cumulate crescător (Fi  )
sau descrescător (Fi  )

- exprimă ponderea unităţilor statistice cumulate “până


la” sau “peste” nivelul considerat al caracteristicii, adică
valori ≤ xi, respectiv ≥ xi.

9
Prezentarea distribuţiilor statistice univariate, cazul variabilei numerice
cu variaţie discretă (I)
I. Prezentarea tabelară
Distribuţia studenţilor din anul I, FEAA, după nota obţinută la examenul de
Microeconomie, în sesiunea ianuarie 2024 – date convenţionale
xi ni fi Ni Fi Ni Fi
1 2 3 4 5 6 7
4 5 0,05 5 0,05 100 1
5 15 0,15 20 0,20 95 0,95
6 20 0,20 40 0,40 80 0,80
7 30 0,30 70 0,70 60 0,60
8 15 0,15 85 0,85 30 0,30
9 10 0,10 95 0,95 15 0,15
10 5 0,05 100 1 5 0,05
Total 100 1 - - - -
10
A2. Analiza seriei statistice folosind
indicatori ai statisticii descriptive
Presupune calculul indicatorilor statisticii
descriptive, cunoscuţi şi sub denumirea de
caracteristici numerice ale unei distribuţii.

A2.1. Indicatori ai tendinţei centrale (mărimi


medii)
A2.2. Indicatori ai dispersiei
A2.3. Indicatori ai formei

11
A2.1. Indicatori ai tendinţei centrale
(mărimi medii)
Definire:
- mediile sunt acele valori în jurul cărora se
repartizează unităţile unei populaţii.
- cele mai importante mărimi medii (mărimi medii
fundamentale) sunt media aritmetică, modul şi
mediana.
- După modul de obținere, mărimile medii pot fi:
- mărimi medii de poziție (modul, mediana)
- mărimi medii de calcul (media aritmetică, m.
geometrică, m. armonică) 12
A2.1. Indicatori ai tendinţei centrale
(mărimi medii)

a. Media aritmetică ( x )
- Media aritmetică este valoarea pe care am observa-o dacă
unităţile statistice ar înregistra aceleaşi valori ale variabilei
(dacă nu ar exista variaţii ale valorilor înregistrate de
unităţile statistice).

13
A2.1. Indicatori ai tendinţei centrale
(mărimi medii)
 Media simplă:  xi
i
x
n
 Media ponderată:

 x i  ni
i sau x   xi  f i
x i
 ni
i
Observaţie:
Media aritmetică este sensibilă la prezenţa valorilor
extreme (outliers).
14
A2.1. Indicatori ai tendinţei centrale
(mărimi medii)
Cele mai importante proprietăţi ale mediei aritmetice:
1. Media unei distribuţii este o valoare internă:
xmin ≤ x ≤ xmax.

2. Media este o mărime normală: suma abaterilor valorilor


individuale ale unei variabile X de la media lor este egală cu
zero.

15
A2.1. Indicatori ai tendinţei centrale
(mărimi medii)
b. Modul (Mo)
 este valoarea variabilei cea mai frecvent observată într-o
distribuţie, adică valoarea xi care corespunde frecvenţei
maxime (nimax).
 Ex. Eșantionul de 20 familii distribuit după variabila nr de
copii
Rezultat și interpretare

Observaţii:
 o distribuţie poate avea una, două sau mai multe valori
modale (serii unimodale, bimodale sau plurimodale, șamd)

16
A2.1. Indicatori ai tendinţei centrale
(mărimi medii)
c. Mediana (Me)
- este acea valoare a variabilei unei serii ordonate, crescător sau
descrescător, până la care şi peste care sunt distribuite în
număr egal unităţile colectivităţii: jumătate din unităţi au
valori mai mici decât mediana, iar jumătate au valori mai
mari decât mediana.

17
A2.1. Indicatori ai tendinţei centrale
(mărimi medii)
Aflarea medianei se face diferit în funcţie de tipul seriei:
1. Serii simple:
- număr impar de termeni. Exemplu.
1. Se ordonează teremenii seriei
2. Se determină locul medianei în sir (unitatea mediană), astfel:
- n<100 – U Me  n  1
2
n
- n>=100 - U Me 
2

- Ex. Se consideră șirul de valori: 5, 10, 25, 20, 35 (u.m.)


- Rezultat și Interpretare...........
18
1. Serii simple:
- număr par de termeni. Exemplu.
Me este media aritmetică simplă a celor doi termeni centrali ai
seriei
Ex. Se consideră șirul de valori: 5, 10, 25, 20 (u.m.).

n 1 5
U Me
   2,5
2 2

Interpretare...........

19
2. Serii cu frecvenţe diferite
Pași de urmat:
- se calculează unitatea mediană (UMe).
- se calculează frecvențele absolute cumulate crescător N i 
- se află prima valoare N i  U Me
- valoarea xi corespunzătoare acesteia este Me.

Observaţie:
- mediana nu este influenţată de valorile extreme.

20
d. Quartilele
- sunt valori ale variabilei care împart volumul eşantionului în
4 părţi egale.
- mod de calcul ( Q1, Q2, Q3).
1
Determinarea unităților quartilice, pt n<100, U  (n  1)
Q1

4
3
U Q3
 (n  1)
4
e. Decilele (D1, D9)
- sunt valori ale variabilei care împart volumul eşantionului în 10
părţi egale.
1 9
U D1  (n  1) U D9  (n  1)
10 10
21
Quartile și decile. Exemplu
Distribuția unui eșantion de xi ni fi Ni↓
muncitori după timpul necesar 15 25 0,125 25
realizării unei lucrări este 45 50 0,250 75
prezentată în tabelul alăturat. Se
75 60 0,300 135
cere să se calculeze quartilele și
105 45 0,225 180
decilele.
135 15 0,075 195
165 5 0,025 200
TOTAL 200 1 -

22
Quartile și decile. Exemplu

23
h. Reprezentarea diagramei “box-plot” sau
“box-and-whiskers”

 Forma diagramei (extrem outliers, outliers, xmin, Q1, Q2, Q3,


xmax);

24
Diagrama box-plot

.Avantaje:
1. permite aprecierea nivelului mediu (Me) și al împrăștierii

Figura 1.
Distribuția unui
eșantion de
muncitori după
timpul necesar
realizării unei
lucrări

25
Diagrama box-plot
Avantaje:
1. permite aprecierea asimetriei unei distribuţiei;

.
asimetrică la dreapta

Distribuție asimetrică la stânga

simetrică

26
Avantaje: 2. - facilitează compararea mai multor distribuţii
(prin reprezentarea simultană a diagramelor).

27
Avantaje: 3. - permite identificarea valorilor extreme
(analiza influenței lor asupra rezultatelor statistice).

28
Indicatori ai statisticii descriptive in Excel

File / Options/ Add-Ins/Analysis ToolPak


Go
Analysis ToolPak-VBA
OK

Data/Data Analysis/Descriptive Statistics

29
Indicatorii statisticii descriptive în Excel

30

S-ar putea să vă placă și