Sunteți pe pagina 1din 40

STATISTICĂ

LAB 2
Prof.dr.ing., dr. marketing Angela Repanovici

BDPS _LAB 2_2023 1


EXCURSIE
????

ECAB_Curs1_2023 2
REZUMATUL STATISTIC
Mărimile medii:

• mărimi medii ale tendinţei centrale


• mărimi de poziţie (structură)

Indicatorii variaţiei

Caracterizarea formei de distribuţie

• indicatorii asimetriei
• indicatorii concentrării

Indicatorii unei caracteristici alternative

Indicatorii unei colectivităţi împărţită în grupe

• analiza dispersională

BDPS _LAB 2_2023 3


Frecvențe
O noțiune întâlnită foarte des in
statistică

Frecvența absolută: câți indivizi


din populație au aceeași
caracteristică

Frecvența relativă: raportarea


frecvențelor absolute la totalul
populației

Frecvențe cumulate: câți indivizi


se află până la o anumită valoare

BDPS _LAB 2_2023 4


Mărimile medii ale tendinţei centrale

Media Media Media


aritmetică pătratică geometrică

Media Media
armonică cronologică
BDPS _LAB 2_2023 5
Media
aritmetică

BDPS _LAB 2_2023 6


Media
aritmetică
(cont.)

BDPS _LAB 2_2023 7


Media
pătratică

BDPS _LAB 2_2023 8


Media
geometrică

BDPS _LAB 2_2023 9


Media
armonică

BDPS _LAB 2_2023 10


Datele culese experimental urmează
a fi analizate conform metodelor
statistice.
Reprezentarea
datelor Datele se culeg în general dintr-o
populaţie statistică sau colectivitate
statistice statistică.

Elementele populaţiei sunt unităţi


statistice sau indivizi.

La un anumit moment ne interesează


11 o trăsătură comună a indivizilor,
numită variabilă sau caracteristică.

BDPS _LAB 2_2023


Reprezentarea
datelor • Variabilele pot fi cantitative (şi se exprimă
numeric prin valoarea măsurată sau dedusă
statistice experimental) sau calitative (atributive). Acestea
din urmă se pot exprima prin aprecieri ca mic,
mare, mijlociu şi li se pot echivala valori
numerice.

12
BDPS _LAB 2_2023
Variabilele cantitative pot fi împărţite în continuare
în variabile discrete şi continue.
Reprezentarea • Un exemplu de variabilă discretă ar fi numărul
datelor de nou născuţi pe zi la o anumită maternitate. Un
statistice exemplu de variabilă continuă este înălţimea
persoanelor.
• În general informaţiile ce se culeg sunt numai de
la o parte din indivizi, nu din întreaga populaţie.
Aceasta este o cercetare selectivă. Aceşti indivizi
formează eşantionul sau selecţia de lucru.

13
BDPS _LAB 2_2023
Vârsta Frecvenţa Frecvenţa Frecvenţa absolută Frecvenţa
FRECVENŢE absolută (ai) relativă (fi) cumulată (Ai) relativă
cumulată (Fi)
0–5 15 0,138 15 0,138
5 – 10 17 0,157 32 0,295
10 – 15 20 0,185 52 0,48
15 – 20 16 0,148 68 0,628
20 – 25 19 0,175 87 0,803
25 – 30 21 0,194 108 1
Suma 108 1

Numărul indivizilor ce aparţin unui anumit interval (sau clasă) formează


frecvenţa absolută notată a1, a2, …am (m numărul de clase ce este de obicei
mai mic ca n numărul de indivizi).
Avem relaţia: m
, unde :
 aj = n
j =1
aj – frecvenţa absolută a clasei j.
m – numărul de clase.
n – numărul de indivizi.

aj m m
aj n
fj =
n  fj =  n = n =1
j =1 j =1

BDPS _LAB 2_2023 14


HISTOGRAMA

25 140
Frecventa 25 Frecventa
120 129
absoluta 20 cumulata
20 100 114
19
15 18 96
17 80
15 15 77
10 60
40 52
5 15 32
20
0 0
0-5 5-10 10-15 15-20 20-25 25-30 30-35 0-5 5-10 10-15 15-20 20-25 25-30 30-35

Interval varsta Interval varsta

f(a)
Densitatea de probabilitate
Este reprezentarea sub formă
Suprafaţa totală are dimensiunea grafică a unor dreptunghiuri cu înălţimea
Element de
proporţională cu frecvenţa, iar cu baza
1 (probabilitatea evenimentului
probabilitate sigur este 1)
egală cu dimensiunea intervalului de
Da grupare.
Există histograme a frecvenţelor
absolute, relative şi cumulate.
a1 a2
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 a

BDPS _LAB 2_2023 15


Indicatori statistici
În studiul distribuţiei de frecvenţe a caracteristicii unei populaţii se observă o
tendinţă de variaţie cu două aspecte: 1 – de localizare (de poziţie)
2 – de împrăştiere (de variaţie).
Analiza cantitativă care să permită evaluări şi comparaţii din punct de vedere al
localizării sau al împrăştierii datelor se poate efectua numai cu ajutorul indicatorilor
statistici. Aceştia exprimă numeric, pe baza valorilor de studiu fie localizarea fie
variaţia datelor. n

x1 + x 2 + ... + xn
 xi Mediana Me = xk +1 = x n +1
i =1
x= =
Media aritmetică n n 2
xk + xk +1 xn / 2 + x(n + 2 ) / 2
n
Me = =
M G = n x1  x 2  x3...  xn = n  xi 2 2
Media geometrică i =1
1 n Modul
MH = = n
1 1 1 1 Fie şirul format din
Media armonică +
x1 x 2
+ ... +
xn  xi elementele x1, x2, x3, … ,xn.
i =1
n Valoarea xi corespunzătoare
n
frecvenţei celei mai mari
 xi 2 poartă numele de modul.
i =1
Media pătratică MP = = x2
n
Valoarea centrală
X max + X min
Xc =
BDPS _LAB 2_2023 2 16
Proprietăţile caracteristicilor de localizare
•Mediile aritmetică şi pătratică sunt influenţate de valorile mari ale şirului.
•Mediile geometrică şi armonică sunt mai puternic influenţate de valorile mici ale şirului.
•Mediana nu este influenţată de valorile extreme.
•Valoarea centrată nu depinde de toate valorile şirului de date ci numai de cele extreme.
•Relaţie existentă între medii: M H  M G  X  M P
•Cel mai des indicator de localizare folosit este media aritmetică.

2 - Indicatori de variaţie
Aceştia reprezintă o evaluare numerică a împrăştierii datelor. n
(x1 − x )
2
+ ( x 2 − x ) + ..... + ( xn − x )
2 2  (xi − x )2
i =1
2 = =
Dispersia n n
n
Abaterea pătratică medie  (xi − x )2
i =1
D[ x] =  =
n
Amplitudinea
Este definită ca diferenţa valorilor extreme şi se notează cu W sau A (în majoritatea
cazurilor).
W = A = Xmax - Xmin

BDPS _LAB 2_2023 17


Intervalul intercuartilic
Distributia de frecventa

Cuartilele împart datele în 4 12

clase de frecvenţe egale cu 10

25%. Astfel sunt necesare 3 8


6
valori Q1, Q2, Q3 ce 4
reprezintă cuartilele. 2
Presupunem că avem o 0
Q1 Q2 Q3
distribuţie a frecvenţelor parametrul x
parametrului x (discret)
conform graficului.

BDPS _LAB 2_2023 18


Coeficientul de variaţie
Abaterea pătratică medie se interpretează prim compararea cu media valorilor
de studiat. Dacă avem o medie de 100 şi o abatere pătratică standard , atunci
avem mici variaţii, dar dacă avem aceeaşi abatere la o medie de 10, atunci
variaţia este foarte mare. În concluzie se defineşte coeficientul de variaţie:


Cx =
x

BDPS _LAB 2_2023 19


Asimetrie - Skewness
Asimetrie dreapta Asimetrie la stânga

Mo M(x) M(x) Mo

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 1 4 7 10 13 16 19 22 25 28 31 34 37 40

1 – Dacă Sk>0 , avem asimetrie pozitivă sau la dreapta.


2 – Dacă Sk<0 , avem asimetrie negativă sau la stânga.
3 – Dacă Sk=0 , avem simetrie (distribuţia normală are asimetria 0).
În general o distribuţie ce are valoarea Sk diferită de 0 cu mai mult de un punct
, denotă o diferenţă semnificativă faţă de distribuţia normală.

Bimodală Multimodală
Unimodală

BDPS _LAB 2_2023 20


Boltirea (Excesul, Kurtosis)

Repartiţie aplatizată
Repartiţie
Repartiţie ascuţită sau platicurtică
saumezocurtică
medie sau leptocurtică
22 2  =33 3

111 333 555 777 999 11


11 13
11 13 15
13 15 17
15 17 19 21
17 19 21 23
23 25
25 27
25 27 29
27 29 31
29 31 33
31 33 35
33 3535 37
37 39
37 3939

Avem următoarele modalităţi de caracterizare a distribuţiilor:


Mezocurtică  2 = 3 ,  2 = 0
Leptocurtică  2  3 ,  2  0

Platicurtică  2  3 ,  2  0
BDPS _LAB 2_2023 21
Graficul de tip Box-and-Whiskers
Este o metodă ce prezintă compact forma distribuţiei unui set de date.
Se foloseşte cu succes în compararea şi determinarea simetriei
repartiţiei determinate de un lot de date (box – cutie, whiskers –
mustăţi).

Variabila
1
studiata

3
4

Lot 1 Lot 2 Lot 3

BDPS _LAB 2_2023 22


Indicatori statistici
Pentru realizarea graficului se
calculează anumiţi indicatori
statistici ce reprezintă cele 5 1

limite.
Mediana este valoarea din 2
cadrul şirului ordonat care se
află la jumătatea acestuia. 3

Aceasta împarte setul de 4

date in două grupe egale şi


este reprezentată în grafic de 5

linia notată cu valoarea 3.

BDPS _LAB 2_2023 23


Indicatori statistici
Limitele 2 respectiv 4 reprezintă valorile
cuartilelor. Acestea împart distribuţia de
frecvenţă în patru părţi egale. Astfel în total 1

sunt 3 ca număr. Cuartila a doua este chiar


mediana. Diferenţa dintre cuartila 3 şi 1
reprezintă intervalul intercuartilic. Acesta
2
defineşte lungimea a 50% din setul de date.
3

Extremele 1 respectiv 5 sunt determinate de 4

- cuantile. De obicei se alege . Astfel nivelul 5


din grafic va prezenta cuantila pentru care 5

10% din date sunt sub această valoare, iar


nivelul 1 din grafic va reprezenta valoarea
pentru care 90% din date sunt sub acesta.

BDPS _LAB 2_2023 24


Indicatori statistici

Graficul este relevant prin faptul că scoate în 1


evidenţă nivelul de simetrie al distribuţiei.
Dacă distribuţia nu este simetrică mediana nu
se va afla la mijlocul dreptunghiului (în cele 2

mai multe cazuri). Mai mult laturile din afara


3
dreptunghiului nu vor fi de dimensiuni egale.
4

5
Această simetrie este bine de a fi verificată
deoarece dacă setul de date este provenit
dintr-o distribuţie normală (Gauss Laplace)
atunci proprietăţi şi metode statistice specifice
pot fi utilizate în analiza datelor.

BDPS _LAB 2_2023 25


VARIABILE ALEATOARE

Este cunoscut faptul că în cadrul unui


experiment oricâte precauţii s-ar lua
Variabila aleatoare este o noţiune
pentru a controla diferiţi factori,
fundamentală din domeniul statisticii,
rezultatele obţinute vor prezenta o
reprezentând acea mărime de interes ce
anumită variabilitate. Această
poate lua în cadrul realizării
variabilitate este cuprinsă în aproape
experimentului o valoare oarecare
toate domeniile de lucru, obligându-ne să
necunoscută aprioric.
lucrăm cu intervale ale parametrilor de
studiu în loc de valori fixe.

BDPS _LAB 2_2023 26


Repartiţia Normală (Gauss-Laplace)

f(x) Densitatea de probabilitate

Suprafaţa totală are dimensiunea 1


Element de (probabilitatea evenimentului sigur
probabilitate este 1) − ( x −  )2
1
f ( x) = e 2 2
  2 
Dx

x  (−  , +  )
1 3 5 7 9 11 13a1 15a2 17 19 21 23 25 27 29 31 33 35 37 39 x
Funcţia de repartiţie

20
1
15

F(a)
10

0
Se notează simbolic N(, ) , sau N(x, , ). 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45
BDPS _LAB 2_2023 a 27
1.2
F(x)
20
f(x)
1 1
15
0.8 1
0,682
0.6* 2 *  10
0,5
0.4
0,954 5
0.2
0,997
0 0
−3  −2  −  + +2  +3  
Funcţia densitate de probabilitate Funcţia de probabilitate
Proprietăţile repartiţiei normale

1. Distribuţia admite un singur maxim fiind astfel unimodală. Maximul se atinge în


1
punctul x= şi are valoarea f (  ) = (în acest punct derivata este zero
 * 2 *
df/dx=0).
2. Este simetrică în raport cu dreapta x=. În orice repartiţie normală mediana şi
modul coincid cu media aritmetică. Datorită simetriei suprafaţa cuprinsă între
curba densităţii de probabilitate şi axa xx’ pe intervalul (− ,  ) este egală cu cea
din intervalul ( ,+ ) şi are valoarea 1/2. Evident suprafa’a total[ are valoarea 1
reprezentând probabilitatea evenimentului sigur.
Suprafaţa cuprinsă între dreptele x=- , x=+ , x=0 şi curba densităţii de
probabilitate este egală cu 0,682. Conform calculelor şi reprezentării grafice
majoritatea cazurilor în proporţie de peste 95% se află în intervalul (-2 , +2 )
BDPS _LAB 2_2023 28
1. Punctele de pe abscisă de valoare + respectiv de valoare - sunt puncte de
inflexiune. În acestea curba densităţii de probabilitate îşi modifică convexitatea.
d 2 f ( x)
Astfel derivata a doua este zero. = 0.
d 2x x =  
În punctele x →  şi x → − funcţia f(x) tinde la zero.
Are formă de clopot de unde şi denumirea de clopotul lui Gauss.
2. Asimetria şi aplatisarea pentru o repartiţie normală au valoarea 0. De asemenea
momentele centrate de ordin impar sunt nule pentru o astfel de repartiţie
(diferenţele între xi şi medie îşi păstrează semnul).
3. Modificarea mediei duce la o translare a curbei pe direcţia axei xx’. Iată un
exemplu realizat în graficul următor.

Avem relaţia între medii: 1   2   3


Dispersiile sunt egale:  1 =  2 =  3 = 

Densităţile de probabilitate pentru medii diferite dar Densităţile de probabilitate pentru medii egale dar
aceleaşi dispersii dispersii diferite
f(x) f(x)
1.00E+00
1
1.2
8.00E-01
1 2
0.8 6.00E-01

0.6 4.00E-01
3

0.4 2.00E-01
0.2
1 2 3 0.00E+00
0

BDPS _LAB 2_2023 29


BDPS _LAB 2_2023 30
BDPS _LAB 2_2023 31
BDPS _LAB 2_2023

32
DATA ANALYSING TOOLS

BDPS _LAB 2_2023 33


DATA ANALYSES

BDPS _LAB 2_2023 34


DATA ANALYSES

BDPS _LAB 2_2023 35


EXCEL DATA ANALYSES

BDPS _LAB 2_2023 36


DATA ANALYSES

BDPS _LAB 2_2023 37


Excel Statistica descriptivă

BDPS _LAB 2_2023 38


Data Analyses – Descriptive Statistics
Skew- înclinarea, Kurtos- boltirea

BDPS _LAB 2_2023 39


LAB 2 STATISTICA DESCRIPTIVĂ
• Urmăriți tutorialul și rezolvați Problema 1.

BDPS _LAB 2_2023 40

S-ar putea să vă placă și