Sunteți pe pagina 1din 236

SEMINAR

BAZELE
STATISTICII
S E M I N AR 3
ANALIZA UNEI SERII STATISTICE UNIDIMENSIONALE

1. Prezentarea seriei: serii simple și serii cu frecvențe diferite


2. Frecvențe absolute și relative cumulate
3. Mărimi medii
RECAPITULARE SEMINAR 2

X – variabila
xi – valorile variabilei X
ni – frecventa absoluta (numarul de unitati statistice)
n - volumul esantionului
PREZENTAREA SERIEI:
SERII SIMPLE ȘI SERII CU FRECVENȚE DIFERITE

O serie statistică este reprezentată de termenii (xi ,ni) sau (xi ,fi), cu i=1,m.
FRECVENŢE ABSOLUTE CUMULATE CRESCĂTOR (𝑁𝑖 )
SAU DESCRESCĂTOR (𝑁𝑖 )

 exprimă numărul de unităţi statistice cumulate “până la” ( ) sau “peste” ( ) nivelul considerat al
caracteristicii, adică valori ≤ xi, respectiv ≥ xi.

i Unde:
N i = N i −1  + ni =  n h 𝑛𝑖 - efectivul corespunzator modalitatii i
h =1 n – efectivul total
𝑁𝑖 - efectivul cumulat până la” sau “peste”modalitatea i

m
N i = N i +1  + ni =  nh
h =i
FRECVENŢE RELATIVE CUMULATE CRESCĂTOR
(𝐹𝑖 ) SAU DESCRESCĂTOR (𝐹𝑖 )

 exprimă ponderea unităţilor statistice cumulate “până la” sau “peste” nivelul considerat al
caracteristicii, adică valori ≤ xi, respectiv ≥ xi.
ANALIZA SERIEI FOLOSIND METODE NUMERICE

 Presupune calculul indicatorilor statisticii descriptive, cunoscuţi şi sub denumirea


de caracteristici numerice ale unei distribuţii.

Indicatori ai tendinţei centrale (mărimi medii)

Definire:
- mediile sunt acele valori în jurul cărora se repartizează unităţile unei populaţii.
- cele mai importante mărimi medii sunt media aritmetică, modul şi mediana .
- Media aritmetică este valoarea pe care am observa-o dacă unităţile statistice ar
înregistra aceleaşi valori ale variabilei (dacă nu ar exista variaţii ale valorilor
înregistrate de unităţile statistice).

MEDIA ARITMETICĂ ( 𝑥)ҧ


Mod de calcul în cazul seriilor simple şi seriilor cu frecvenţe diferite (variabilă
discretă).
 xi
 Media simplă: x= i
n

 xi  ni
 Media ponderată: x =
i
sau x =  xi  f i
 ni i
i

Observaţii:
- de cele mai multe ori, valoarea mediei nu coincide cu niciuna din valorile individuale din care s-a calculat
(s-a extras esenţialul din grup);
- media aritmetică este sensibilă la prezenţa valorilor extreme (outliers);
▪ Media unei distribuţii este o valoare internă:
xmin≤ 𝑥ҧ ≤xmax.

▪ Media este o mărime normală: suma abaterilor valorilor individuale ale unei
variabile X de la media lor este egală cu zero.

PROPRIETĂŢI ALE MEDIEI ARITMETICE


Se consideră vânzările unor firme prezentate astfel: 10, 8, 9, 7, 7 (mil. lei).

σ i xi 10+8+9+7+7
x= = = 𝟖. 𝟐 𝒎𝒊𝒍 𝒍𝒆𝒊
n 5

Interpretare: Vanzarile medii au fost de 8.2 mil lei.


 este valoarea variabilei cea mai frecvent observată într-o distribuţie, adică valoarea xi
care corespunde frecvenţei maxime (nimax).

Observaţii:

 modul poate fi aflat doar în cazul seriilor cu frecvenţe diferite.

 o distribuţie poate avea una, două sau mai multe valori modale (serii unimodale,
bimodale sau plurimodale).

Interpretare: Cele mai multe unităţi înregistrează valoarea modală.

MODUL (MO)
Se consideră vânzările unor firme prezentate astfel: 10, 8, 9, 7, 7 (mil. lei).

ni max = 2 => pentru xi = 7 => Mo = 7

Interpretare: Cele mai multe firme au inregistrat vanzari de 7 mil lei.


▪ este acea valoare a variabilei unei serii ordonate, crescător sau descrescător, până
la care şi peste care sunt distribuite în număr egal unităţile colectivităţii:
jumătate din unităţi au valori mai mici decât mediana, iar jumătate au valori mai
mari decât mediana.

▪ corespunde locului unităţii mediane calculate astfel:


n+1
U Me
=
2

MEDIANA (ME)
AFLAREA MEDIANEI SE FACE DIFERIT ÎN
1. Serii simple:
FUNCŢIE DE TIPUL SERIEI:
- număr impar de termeni - atunci mediana este egală cu termenul central al seriei
ordonate crescător sau descrescător
- număr par de termeni - atunci mediana este egală cu media aritmetică simplă a celor
2 termeni centrali ai seriei ordonate crescător sau descrescător.

 Pentru un şir de date ordinale format din număr par de termeni, mediana este egală cu una din cele două
variante din centrul seriei dacă aceste variante sunt egale, iar dacă variantele nu sunt egale mediana ia 2 valori
deoarece nu se poate face media lor

2. Serii cu frecvenţe diferite


- se calculează unitatea mediană (UMe).
- se calculează 𝑁𝑖
se află prima valoare N i  U
Me
-
- valoarea xi corespunzătoare acesteia este Me.
Observaţie:
- mediana nu este influenţată de valorile extreme.
Se consideră vânzările unor firme prezentate astfel: 10, 8, 9, 7, 7 (mil. lei).

Se ordoneaza crescator seria: 7, 7, 8, 9, 10 => Me= 8

Interpretare: Jumatate (50%) din numarul total de firme au realizat vanzari de cel mult 8 milioane lei,
iar cealalta jumatate (50%) au realizat vanzari de cel putin 8 milioane lei.
Exemplu:
Se cunoaşte următorul set de valori ale unei caracteristici: 5 7 4 9 12 3 10

Interpretare

Exemplu:
Fie următorul set de valori: 3 1 5 7 9 4

Interpretare
Arată forma unei distribuţii:

1. atunci când cele 3 medii sunt egale, distribuţia este simetrică.


2. atunci când media este mărimea medie cea mai mare,
distribuţia este asimetrică la dreapta (asimetrie pozitivă).
3. atunci când media este mărimea medie cea mai mică,
distribuţia este asimetrică la stânga (asimetrie negativă).

RELAŢII ÎNTRE CELE TREI MĂRIMI MEDII


Serie simpla (cu frecvente egale):

a) Repartitia notelor studentilor: 3, 4, 5, 6, 8, 10


Intrebare: de care ori apare fiecare valoare xi a variabilei X?

b) Repartitia notelor studentilor: 6, 6, 7, 7, 9, 9


Intrebare: de care ori apare fiecare valoare xi a variabilei X?

APLICATII
Serie cu frecvente diferite:

Repartitia notelor studentilor: 5, 6, 6, 7, 7, 7, 8, 8, 8, 8


- Definiti variabila.
- Definiti unitatea statistica.
- Care este volumul esantionului?

xi ni fi
5 1 1/10
6 2 2/10
7 3 3/10
8 4 4/10
Total n =10 1

APLICATII
Se înregistrează cheltuielile anuale (mii lei) realizate de 3 familii pentru produsul A:

Familia 1: 1, 3, 7, 6, 9.
Familia 2: 1, 3, 7, 3, 5, 3, 7.
Familia 3: 1, 3, 1, 7, 7, 3.

Să se precizeze frecvențele absolute în cazul celor 3 serii.

APLICATII
Distribuția unui eșantion de angajați ai firmei X in functie de numărul de mijloace carti impumutate de pe
Bookster:
xi 1 2 3 4

ni 5 75 27 3

 Se cere să se afle:

a) să se precizeze frecvențele absolute simple;


b) să se calculeze frecvențele absolute cumulate crescător și descrescător;
c) să se calculeze frecvențele relative simple;
d) să se calculeze frecvențele relative cumulate crescător și descrescător;
e) să se interpreteze toate frecvențele pentru i = 3 (x3);

APLICATII
1 2 3 4 5 6 7

Ni ↓ -
ni Ni ↑ -
crescator
decrescator fi Fi ↑ (%)
frecve Fi ↓ (%)
frecvențel
xi nțele frecvențele frecvențele frecvențele relative
e frecvențele relative
absolut absolute relative cumulate
absolute cumulate crescător
e cumulate simple decrescător
cumulate
simple decrescător
crescător

110 4.5% 4.5% 100%


1 5 5
(5+75+27+3) (5/110)*100 (5/110)*100 ((5+75+27+3)/110)*100

80 105 68.2% 72.7% 95.5%


2 75
(5+75) (75+27+3) (75/110)*100 ((5+75)/110)*100 ((75+27+3)/110)*100
107 30 24.5% 97.3% 27.3%
3 27
(5+75+27) (27+3) (27/110)*100 ((5+75+27)/110)*100 ((27+3)/110)*100
110 2.7% 100% 2.7%
4 3 3
(5+75+27+3) (3/110)*100 ((5+75+27+3)/110)*100 (3/110)*100

TOTAL 110 - - 100% - -


Distribuția numărului de copii pentru familiile dintr-un bloc se prezintă astfel:

Nr. copii(xi) 0 1 2 3 4

Nr. familii (ni) 10 15 30 3 2

Se cere să se afle:
a) numărul de familii care au cel mult 3 copii;
b) numărul de familii care au cel puțin 2 copii;
c) ponderea familiilor care au cel puțin 2 copii;
d) ponderea familiilor care au cel mult 1 copil;
e) ponderea familiilor care au 2 copii.

APLICATII
 Se consideră seria: 2, 5, 6, 7, 8, 1000. Să se precizeze mărimea medie cea mai
reprezentativă. Explicați.
 Sa se calculeze mediana seriei:
xi 1 2 3 4

ni 5 75 27 3

APLICATII
1. Distribuția numărului de copii pentru familiile dintr-un bloc se prezintă astfel:
Nr. copii 0 1 2 3 4

Nr. familii 10 15 30 3 2

Se cere să se afle cele 3 mărimi medii fundamentale și să se aprecieze relația dintre acestea.

2. Un auditor bancar a selectat 10 conturi şi a înregistrat sumele existente în fiecare dintre


aceste conturi. Sumele sunt date în Euro: 150,175, 195, 200,235,240,250,256,275,294
Se cere: să se calculeze media, mediana şi modul.

TEMA
SEMINAR
BAZELE
STATISTICII
S E M I N AR 4
Analiza unei serii statistice univariate. Cazul unei variabile cantitative discrete

1. Mărimi medii:

- media aritmetică, modul, mediana.


- Quartile
- Decile

2. Indicatori ai dispersiei
- varianta (𝑠 2),
- abaterea standard (s)
- coeficientul de variatie (v)

3. Indicatori ai formei
- Asimetrie (Skewness)
- Boltire (Kurtosis)
RECAPITULARE SEMINAR 3
Media aritmetica (ഥ
𝒙) Modul (𝑴𝒐 )

este valoarea variabilei cea mai frecvent


observată într-o distribuţie, adică valoarea xi
care corespunde frecvenţei maxime (nimax).

Unitatea mediană (UMe).

n+1
U Me
=
2
Mediana (𝑴𝒆 )

este acea valoare a variabilei unei serii ordonate, crescător sau


descrescător, până la care şi peste care sunt distribuite în număr egal
unităţile colectivităţii:
QUARTILE & DECILE

indică poziția unei valori în raport cu întregul set de date


Quartilele
- sunt valori ale variabilei care împart volumul eşantionului în 4 părţi egale.

Interpretare:
• Prima cuartilă, Q1, este valoarea pentru care 25% dintre observații sunt mai mici, iar 75% sunt mai mari
• Q2 este același cu mediana (50% sunt mai mici, 50% sunt mai mari)
• 25% dintre observații sunt mai mari decât a treia quartila (Q3)
- Prima quartilă (Q1) este definită ca numărul
mijlociu dintre cel mai mic număr (minimum)
și mediana setului de date. Este, de
asemenea, cunoscut sub numele de quartila
inferioară sau a 25-a, deoarece 25% din
date sunt sub acest punct.

- A doua quartilă (Q2) este mediana unui set


de date; astfel 50% din date se află sub
acest punct.

- A treia quartilă (Q3) este valoarea medie


dintre mediană și cea mai mare valoare
(maximum) a setului de date. Este cunoscut
sub numele de quartila superioară sau a 75-
a, deoarece 75% din date se află sub acest
punct.
Mod de calcul 1

Poziția primei quartila : 𝑸𝟏 = 0.25 (n + 1 )

Poziția celei de-a doua quartile (𝑀𝑒 ) : 𝑸𝟐 = 0.50 (n + 1 )

Poziția celei de-a treia quartila : 𝑸𝟑 = 0.75 (n + 1 )

unde n este numărul de valori observate


Exemplu : 11 12 13 16 16 17 18 21 22

n=9 𝑄1 𝑄2 𝑄3

𝑄1 = 0.25 (9 + 1 ) = 2.5 pozitia – 𝑄1 = 12.5

𝑄2 = 0.50 (9 + 1 ) = 5 pozitia - 𝑄2 = 16

𝑄3 = 0.75 (n + 1 ) = 7.5 pozitia - 𝑄3 = 17


Mod de calcul 𝟐

𝒏+𝟏
𝑸𝟏 : 𝑼 𝑸 𝟏 =
𝟒

.
.
𝟑(𝒏+𝟏)
𝑸𝟑 : 𝑼 𝑸 𝟑 =
𝟒

Unde 𝑈 𝑄1..2…3 - reprezinta unitatile quartilice


Decile
Reprezinta valori ale caracteristicii(variabilei) care impart volumul colectivitatii in 10 parti egale

Mod de calcul

𝒏+𝟏
𝑫𝟏 : 𝑼𝑫𝟏 =
𝟏𝟎

𝟐(𝒏+𝟏)
𝑫𝟐 : 𝑼𝑫𝟐 =
𝟏𝟎
.
.
𝑫𝟓 =Me = 𝑸𝟐
.
.
𝟗(𝒏+𝟏)
𝑫𝟗 : 𝑼𝑫𝟗 =
𝟏𝟎

Unde 𝑼𝑫𝟏…𝟗 - reprezinta unitati decilice


Indicatori ai dispersiei (variaţiei)

Definire:
- dispersia exprimă gradul de variaţie a valorilor individuale ale unei variabile faţă de nivelul
mediu.

- aprecierea fenomenului de dispersie al unei distribuţii permite identificarea gradului de


reprezentativitate a mediei unei distribuţii.
Indicatori sintetici ai dispersiei:
 xi − x  x i − x  ni
d= i
d= i
 ni
1. Abaterea medie liniară n sau i

- arată cu cât variază, în medie, valorile 𝑥𝑖 ale variabilei faţă de nivelul mediu al distribuţiei, în sens
pozitiv şi negativ
- se exprimă în aceeaşi unitate de măsură cu cea a variabilei.

 ( xi − x )  ( x i − x )  ni
2 2

2. Varianţa s2 = i
sau s2 = i
n  ni
i

- Varianţa este întotdeauna pozitivă, nu are unitate de măsură şi nu se interpretează.


- Prin ridicarea la pătrat a abaterilor valorilor 𝑥𝑖 faţă de medie creşte “influenţa” valorilor extreme
asupra nivelului varianţei.
3. Abaterea standard (s) (deviaţia standard)

◼ arată cu cât variază, în medie, valorile xi ale variabilei faţă de nivelul mediu al distribuţiei, în sens pozitiv şi
negativ.
◼ se exprimă în aceeaşi unitate de măsură cu cea a variabilei.

Exemplu:
45
Salarii (mii lei) : 3; 7; 8 ; 12; 15 𝑥ҧ = 5
= 9 mii lei

σ𝑖(𝑥𝑖 − 𝑥)ҧ 2(3−9)2 +(7−9)2 +(8−9)2 +(12−9)2 +(15−9)2


s= 𝑛
= 5
Interpretare:
36+4+1+9+36 86 Salariatii obtin un salariu care variaza (se
= = = 5 = 17.2 = 4.147 mii lei abate), in medie, de la salariul mediu (9 mii
5
lei) cu ± 4.15 mii lei (in sens pozitiv si in sens
negativ)
4. Coeficientul de variaţie (v)
s
v =  100
x
➢ se exprimă în procente.

➢ v>50% - arată o distribuţie eterogenă, care se caracterizează printr-o variaţie


mare a valorilor xi faţă de nivelul mediu şi o medie nereprezentativă.

➢ v<50% - arată o distribuţie omogenă, care se caracterizează printr-o variaţie


mică a valorilor xi faţă de nivelul mediu şi o medie reprezentativă.

➢ este sensibil faţă de valoarea mediei: cu cât media este mai apropiată de zero,
cu atât coeficientul de variaţie este mai dificil de folosit (tinde spre infinit).
Exemplu:
Eșantionul 1: Eșantionul 2:
𝑣1 si 𝑣2 au valori < 50% :
𝑥1 = 25 𝑎𝑛𝑖 𝑥2 = 50 𝑎𝑛𝑖 ambele distributii sunt
s1= 2 ani s2= 2 ani omogene, se caracterizeaza
prin dispersie mica, iar mediile
𝑠1 2 sunt representative.
𝑣1 = * 100 = * 100 = 8%
𝑥1 25
𝑠2 2
𝑣2 = * 100 = * 100 = 4%
𝑥2 50
5. Amplitudinea intervalului interquartilic
IQ=Q3-Q1
- cuprinde 50% din volumul eşantionului.

În mod sintetic, cele mai importante caracteristici numerice ale unei distribuţii
pot fi “cuplate” astfel:
❑ media - abaterea standard (valoare absolută) - coeficientul de variaţie
(valoare relativă)
❑ mediana - intervalul interquartilic (valoare absolută).
Indicatori ai formei

1. Asimetria (Skewness):
- reprezintă o deviere de la forma simetrică a unei distribuţii.

Asimetria poate fi apreciată:


- pe cale grafică: curba frecvenţelor, diagrama box-plot.
- pe cale numerică: - prin calculul coeficientului de asimetrie Fisher (Skewness):
3
1 =
s3

𝜇3 este momentul centrat de ordin 3


Distributie asimetrica Distributie simetrica Distributie asimetrica
la dreapta (pozitiva) – distributie normala la stanga (negativa)

γ > 0 – asimetrie la dreapta γ =0 – distributie simetrica γ < 0 – asimetrie la stanga


2. Boltirea (Kurtosis)

- este definită prin compararea distribuţiei empirice cu distribuţia


normală din punctul de vedere al variaţiei variabilei X şi a frecvenţei ni.

Boltirea poate fi apreciată:

– pe cale grafică: curba frecvenţelor


4 4
- numeric: prin calculul coeficientului de boltire Fisher (kurtosis):  2 = −3= −3
 22 s 4

𝜇2 este momentul centrat de ordin 2

𝜇4 este momentul centrat de ordin 4


γ2 > 0 – distributie leptocurtica
γ2 = 0 – distributie platicurtica
γ2 < 0 – distributie mezocurtica (normala)
APLICATII

1. Se înregistrează vânzările unor firme în anul 2019 (mil. lei): 13, 11, 10, 12, 18, 17, 17.
Se cere să afle valoarea quartilei 3.
2. Se înregistrează salariile lunare pentru un eșantion de persoane și se obțin următoarele
rezultate:

Salarii (mii lei) Nr. angajați


2 10
3 20
4 30
6 5
7 2
TOTAL 67

Să se afle valorile quartilei 1, quartilei 3 și decilei 9.


3. Se înregistrează salariile lunare pentru un eșantion de persoane și se obțin
următoarele rezultate: 3, 6, 9, 7, 13 (mii lei).

Să se aprecieze :
a) Tipul distributiei statistice.
b) Omogenitatea distribuției.
4. Distribuția numărului de copii pentru familiile dintr-un bloc se prezintă astfel:

Nr. copii 0 1 2 3 4
Nr. familii 10 15 30 3 2

Se cere să se aprecieze reprezentativitatea mediei.


5. Se cunosc următoarele rezultate privind vârsta:
Eșantionul 1: Eșantionul 2:

𝑥1 = 35 𝑎𝑛𝑖 𝑥2 = 80 𝑎𝑛𝑖
s1= 2 ani s2= 2 ani

Să se aprecieze reprezentativitatea mediilor și omogenitatea distribuțiilor.


6. Se cunosc următoarele rezultate privind vârsta:

Eșantionul 1: Eșantionul 2:

𝑥1 = 25 𝑎𝑛𝑖 𝑥2 = 50 𝑎𝑛𝑖
s1= 2 ani s2= 27 ani

Să se aprecieze reprezentativitatea mediilor și omogenitatea distribuțiilor.


7. În urma prelucrării datelor privind salariul lunar obținut (mii lei) pe un eșantion de
salariați, s-au obținut următoarele rezultate:
Column1
Se cere să aprecieze:
a) reprezentativitatea mediei;
Mean 4.53
b) asimetria și boltirea.
Median 4.00
Mode 4.00
Standard Deviation 1.46
Sample Variance 2.12
Kurtosis -0.45
Skewness 0.32
Range 5.00
Minimum 2.00
Maximum 7.00
Sum 68.00
Count 15.00
Tema
8.. În urma prelucrării datelor privind salariul lunar obținut (mii lei) pe un eșantion de
salariați, s-au obținut următoarele rezultate:
Statistics
Se cere:
salariu
a) să se interpreteze valorile quartilelor N Valid 25
b) să se aprecieze forma distribuției. Missing 0
Mean 3.7600
Median 3.0000
Mode 3.00
Std. Deviation 1.56205
Variance 2.440
Skewness .719
Kurtosis -.378
Range 5.00
Minimum 2.00
Maximum 7.00
Percentiles 25 2.5000
50 3.0000
75 5.0000
1. Media aritmetica, ca indicator fundamental al tendintei centrale:
a) reprezinta valoarea care modifica nivelul totalizator al seriei;
b) se foloseste cel mai frecvent si reprezinta suma valorilor raportata la numarul lor;
c) se calculeaza adunand valorile existente;
d) nu poate determina numarul de unitati din colectivitate.

2. Media aritmetica reprezinta:


a) valoarea pe care ar purta-o fiecare unitate statistica daca distributia ar fi eterogena;
b) valoarea pe care ar purta-o fiecare unitate statistica daca distributia ar fi omogena;
3. 25% din salariatii unei inteprinderii au un salariu de cel mult 4
milioane lei. Aceasta valoare reprezinta:
a) quartila unu;
b) mediana;
c) quartila trei.

4. 75% din salariatii unei intreprinderii au un salariu de cel mult 7


milioane lei. Aceasta valoare reprezinta:
a) quartila unu;
b) mediana;
c) quartila trei.
5. 50% din salariatii unei intreprinderii au un salariu de cel mult 5 milioane lei. Aceasta
valoare reprezinta:
a) quartila unu;
b) mediana;
c) quartila trei.

6. Intr-o repartitie normala valoarea fata de care 75% din valorile individuale sunt mai mici
iar 25% din valorile individuale sunt mai mari este:
a. cuartila a doua;
b. cuartila a treia;
c. cuartila intai;
d. valoarea modala.
7. Daca dorim sa obtinem un indicator al tendintei centrale pentru date masurate pe
orice scala, vom determina:
a) media aritmetica;
b) modul;

8. Daca dorim sa obtinem un indicator al tendintei centrale care sa nu fie afectat de


valorile extreme, sa poata fi calculat pentru date masurate pe orice scala (cu
exceptia celei nominale) si sa aiba o singura valoarea, vom calcula:
a) media aritmetica
b) modul;
c) mediana.
9. Quartilele sunt marimi de pozitie care impart colectivitatea in:
a. n-1 parti egale;
b. 4 parti egale;
c. 5 parti egale;

10. O distributie este platicurtica atunci cand:


a) γ2 = 0
b) γ2 >0
c) γ2 < 0
SEMINAR
BAZELE
STATISTICII
S E M I N AR 5
Analiza unei serii statistice univariate. Cazul unei variabile cantitative discrete

1. Mărimi medii:

- media aritmetică, modul, mediana.


- Quartile
- Decile
2. Indicatori ai dispersiei
- varianta (𝑠 2),
- abaterea standard (s)
- coeficientul de variatie (v)
- amplitudinea intervalului interquartilic
- abaterea medie liniară

3. Indicatori ai formei
- Asimetrie (Skewness)
- Boltire (Kurtosis)
RECAPITULARE SEMINAR 4
Quartile Varianţa
𝒏+𝟏 Abaterea medie liniară
𝑸𝟏 : 𝑼𝑸𝟏 =
 ( x i − x )  ni
2
 xi − x
𝟒
 ( xi − x )
2
 x i − x  ni
d= i s2 = i s2 = i
d= i
 ni n  ni
Decile n i i
𝒏+𝟏
𝑼𝑫𝟏 =
𝟏𝟎

Abaterea standard (s) (deviaţia standard) Coeficientul de variaţie (v)

s
v =  100
x

Amplitudinea intervalului interquartilic IQ=Q3-Q1


Indicatori ai formei

Asimetria (Skewness): Boltirea (Kurtosis)

3 4 4
1 = 2 = −3= −3
s 3  22 s 4

γ > 0 – asimetrie la dreapta


γ2 > 0 – distributie leptocurtica

γ =0 – distributie simetrica γ2 = 0 – distributie platicurtica


γ2 < 0 – distributie mezocurtica (normala)
γ < 0 – asimetrie la stanga
Analiza unei serii univariate după o variabilă cantitativă discretă. Reprezentare grafică.

a. Poligonul frecvenţelor:
- construirea acestuia presupune găsirea locului geometric al
punctelor Ai de coordonate (xi,ni) sau (xi,fi) şi unirea acestora prin
segmente de dreaptă.
- aproximează forma unei distribuţii.
Figura 1. Distribuția elevilor de la un liceu după nota
obținută la un examen, în martie 2016
b. Curba frecvenţelor:

• presupune ajustarea printr-o linie curbă, continuă a poligonului frecvenţelor.

• aproximează mai bine forma de distribuţie a colectivităţii după variabila considerată.


𝒙𝒊 𝒏𝒊
0 6

1 18

2 23

3 20

4 14

5 6

6 2

7 1

Total 90
c. Diagrama “box-plot” sau “box-and-whiskers” (“cutie şi mustăţi”)

Diagrama bloxpot este un instrument deosebit de util pentru studiul distribuţiei variabilelor
continue, şi mai ales pentru detectarea rapidă a outlierilor unei serii de date (valori extreme sau
aberante).

Forma diagramei (xmin, D1, Q1, Q2, Q3, xmax,, D9);

Avantaje:

• permite identificarea punctelor extreme;

• permite aprecierea nivelului mediu (Me), dispersiei şi asimetriei unei distribuţiei;

• facilitează compararea mai multor distribuţii (prin reprezentarea simultană a diagramelor).


https://chart-studio.plotly.com/~ColleenYoung/138.embed
Poziţia medianei în interiorul cutiei, precum şi a cutiei între “mustăţi”, ne aduc informaţii

importante privitoare la simetria distribuţiei. Astfel:


1. dacă distribuţia este asimetrică la
dreapta (predomină scorurile mari),
cutia va fi apropiată de “mustaţa”
inferioară, iar mediana va fi şi ea
situată în partea inferioară a cutiei
(aproape de prima quartilă)
2. dacă distribuţia este
(aproximativ) simetrică,
diagrama va fi de
asemenea simetrică, cu alte
cuvinte cutia se va situa la
mijlocul distanţei dintre
“mustăţi”, iar mediana la

mijocul cutiei
3. dacă distribuţia este asimetrică la
stânga (predomină scorurile micii),
cutia este apropiată de mustaţa
superioară, iar mediana de latura
superioară a cutiei (a treia quartilă).
Asimetrie la dreapta
Asimetrie la stanga
Analiza unei serii univariate după o variabilă cantitativă continuă:

1. Prezentarea seriei statistice

- gruparea unităţilor statistice este realizată pe intervale de variaţie.

Observaţie:

- Gruparea pe intervale de variaţie duce la pierderea unei părţi a informaţiei iniţiale.

2. Prelucrarea seriei statistice folosind metode grafice

a. Histograma

b. Poligonul frecvenţelor

c. Curba frecvenţelor
a. Histograma
3. Indicatori ai statisticii descriptive

- se calculează în mod identic, prin “discretizarea” variabilei (calculul


mijlocului intervalelor de variaţie).
Analiza unei serii univariate
1. Variabilă cantitativă
A. Variabilă discretă
B. Variabilă continuă

2. Variabilă calitativă

I. Tipuri de variabile
A. Variabile nominale
B. Variabile ordinale
A) Variabile nominale

• Pentru a reprezenta structura pe categorii la nivelul unui eşantion se calculează


frecvenţe relative;

• Reprezentarea frecvenţelor unui eşantion se realizează folosind diagramele:


dreptunghiul şi cercul de structură (Bar Chart sau Pie Chart).

• Indicatori specifici: frecvenţe relative, modul.


masc

33,3%

fem

66,7%

Exemplu
B) Variabile ordinale

• Reprezentarea frecvenţelor unui eşantion se realizează folosind diagramele:


Bar Chart sau Pie Chart

• Indicatori specifici: frecvenţe relative, modul şi quartilele.


Aplicatii

1. În urma prelucrării datelor privind notele obținute de un grup de studenți obținut, s-au obținut următoarele rezultate:
Statistics
Se cere să se aprecieze: note
a) reprezentativitatea mediei; N Valid 71
Missing
Interpretare: Coeficientul de variatie este mai mic de 50%, deci media este reprezentativa. 0
b) să se aprecieze forma distribuției; Mean 7.34
Asimetria: Skewness = 0.268 Median 7.00
Mode 8
Seria analizata este asimetrica la dreapta (pozitiva).
Std. 1.253
Deviation
Boltirea: Kurtosis = -0.523
Variance 1.570
Seria analizata este mezocurtica.
Skewness .268
c) să se interpreteze valorile quartilelor; Kurtosis -.523
Q1: 25% dintre studenti au obtinut cel mult nota 6, iar 75% dintre studenti au obtinut cel putin 6. Percentil 25 6.00
es 50 7.00
Q2: 50% dintre studenti au obtinut cel mult nota 7, iar 50% dintre studenti au obtinut cel putin 7. 75 8.00

Q3: 75% dintre studenti au obtinut cel mult nota 8, iar 25% dintre studenti au obtinut cel putin 8.
2. Se consideră distribuția familiilor după numărul de membri prezentată astfel:

Să se reprezinte poligonul și curba frecvențelor folosind frecvențele absolute.

Număr Număr
membri (xi) familii (ni)

2 4
3 11
4 10
5 2
6 1
TOTAL n=28
Interpretare: Se observă că distribuția eșantionului de familii după numărul de membri prezintă o asimetrie
la dreapta. Aceasta arată că se înregistrează frecvențe mai mari pentru valorile mici ale variabilei (este o
distribuție în care predomină familiile cu un număr mic de copii).
3. Pentru distribuția numarului de someri din Romania la nivelul anului 2013, s-au inregistrat următoarele
rezultate:
Se cere:
a) să se precizeze forma distribuției.
b) să se interpreteze valoarea quartilei trei.
𝑄3 = 47000
c) să se interpreteze amplitudinea intervalului interquartilic. 𝑄1 = 28000
Rezolvare:
a) Diagrama Boxplot ne prezintă, la fel ca histograma, o distribuție ce prezintă o asimetrie pozitivă, cu abatere
spre dreapta.
b) Quartila 3 are valoarea de 47000 șomeri, ceea ce înseamnă că, 75% din valorile numarului de someri
înregistrate se poziționează sub valoarea de 47000 șomeri, iar 25% peste această valoare.
c) Amplitudinea intervalului interquartilic - cuprinde 50% din volumul eşantionului.
IQ=Q3-Q1 = 47000-28000 = 19000
4. Se consideră distribuția PIB/locuitor (euro) în țările Uniunii Europene, în anul 2018, în funcție de momentul
aderării (Grupa_1 - formată din țările care erau înainte de extinderea spre Europa Centrală și de Est (fără
Luxembourg); Grupa_2 - formată din țările care au aderat în anul 2004; Grupa_3 - formată din țările care au aderat
în anii 2007 și 2013) . Reprezentarea grafică a acestor distribuții este prezentată în figura de mai jos:

Se cere să se caracterizeze cele trei grupe de țări


(comparând nivelurile medii și dispersia).

Rezolvare:
Tarile din Vest au dispersia cea mai mare fata
de restul tarilor, iar tarile care au aderat
dupa 2007 au dispersia cea mai mica.
5. Se consideră distribuţia numarului de minute alocate de fiecare student zilnic pentru pregatirea
seminarului bazele statisticii, prezentată în tabelul de mai jos:

Să se calculeze numărul mediu de minute.


Număr Număr
minute studenti
(xi-1,xi+1) (ni)

20-30 2
30-40 4
40-50 11
50-60 8
60-70 3
TOTAL 28
6. Pentru distribuția persoanelor după gen (masculin și feminin) prezentată în tabelul de mai jos, să se afle
valoarea modului.
Genul persoanei Număr persoane Pondere persoane
(xi) (ni) (fi)

Masculin 25 22.7%
Rezolvare:
Feminin 85 77.3%
𝑛𝑖 𝑚𝑎𝑥 = 85
TOTAL n=110 100%

Aflarea modului presupune identificarea categoriei care corespunde frecvenței celei mai mari.
Frecvența absolută cea mai mare este 85, iar frecvența relativă cea mai mare este 77.3%.
Categoria asociată acesteia este genul feminin. Modul este reprezentat de această categorie (feminin).

Interpretare: În eșantionul observat, cele mai multe persoane (85 persoane sau 77.3%) sunt de genul feminin.
7. Reprezentarea grafică a unei serii de studenți pe sexe este realizată în figura de mai jos:

Să se interpreteze valoarea modului.

Rezolvare:
Interpretare:
Modul este reprezentat de categoria “Masculin”.
8. Pentru distribuția persoanelor după nivelul de studii absolvite, prezentată în tabelul de mai jos, să se afle valoarea
mediană și quartila 3.

Nivel studii Număr


(xi) persoane (ni)

Studii liceale 23

Studii universitare 16

Studii post-universitare 17

Doctorat 3
TOTAL n = 59
9. Pentru distribuţia studenţilor unei serii după nota obţinută la un test se cunosc următoarele rezultate: D1=
2,5, Q1 = 4, Me=6,5, Q3 = 7, D9=8. Să se construiască diagrama box-plot. Să se calculeze şi să se interpreteze
amplitudinea intervalului interquartilic.
10. Pentru un eșantion de salariați, se înregistrează salariul lunar (mii lei) la 1 ianuarie 2017 și se obțin
următoarele rezultate:
Column1
Mean 2.76
Standard Error 0.301552
Median 2
Se cere: Mode 2
a) Să se aprecieze reprezentativitatea mediei. Standard Deviation 1.507758
b) Să se aprecieze forma distribuției Sample Variance 2.273333
(asimetria și boltirea). Kurtosis -0.77295
Skewness 0.523621
Range 5
Minimum 1
Maximum 6
Sum 69
Count 25
1. Graficul a carui reprezentare se utilizeaza: valoarea minima, quartile 1, mediana, quartile 3 si
valoarea maxima
maxima se numeste:
a) Poligonul frecventelor
b) Poligonul frecventelor cumulate
c) Diagrama Box-Plot

2. Diagrama Box-Plot este:


a) O diagrama asemantoare ogivei
b) O distributie de frecventa
c) Acelasi lucru cu poligonul frecventelor
d) O reprezentare grafica pe baza indicatoriilor medii de pozitie
3. O serie prezinta o asimetrie de dreapta daca
a) 𝑥ҧ < 𝑀𝑒 <𝑀𝑜
b) 𝑥ҧ > 𝑀𝑒 >𝑀𝑜
c) 𝑥ҧ = 𝑀𝑒 =𝑀𝑜
d) Toti termenii seriei sunt egali intre ei
SEMINAR
BAZELE
STATISTICII
S E M I N AR 6
Analiza unei serii bidimensionale

1. Prezentarea seriei

 O serie bidimensională prezintă variaţia unităţilor unui eşantion după două


variabile de grupare în mod simultan:

- variabilele Xi cu valorile xi , i = 1, m şi Yj cu valorile y j , j = 1, p

Efectivele (unităţile) eşantionului care poartă simultan valoarea xi şi valoarea


𝑦𝑗 sunt 𝑛𝑖𝑗 .

Distribuţia bivariată este definită de:

(xi , y j , nij ), i = 1, m, j = 1, p
Variaţii pe coloană – variaţii după i, intrucât nivelul j este constant, este acelasi

Variaţii pe linii – variaţii după j, intrucât nivelul i este acelaşi

Variabila X are m niveluri de variatie

Variabila Y are p niveluri de variatie


Nivelurile de variaţie ale variabilei X sunt pe randuri – cele 5 categorii ale personalului sanitar (farmacisti,
medici (exclusiv stomatologi), personal sanitar auxiliar, personal sanitar mediu, stomatologi).

Nivelurile de variatie ale variabilei Y sunt pe coloane – cele 6 judete ale Regiunii Nord Est (Bacau, Botosani,
Iasi, Neamt, Suceava, Vaslui).
Avem un total de 48179 persoane care activeaza in domeniul sanitar, care pot fi impartite in 6 grupuri in
functie de judetul din care face parte, sau in 5 grupuri, in functie categoria personalului din care face parte.

Numarul de distributii conditionate este: m+p=5+6=11 distribuții condiționate.


2. Tipuri de variabile
- o variabilă numerică şi o variabilă nenumerică;
- ambele variabile numerice;
- ambele variabile nenumerice.

3. Distribuţia după o variabilă cantitativă şi o variabilă


calitativă
În cadrul unei distribuţii bidimensionale se disting:
a). Două distribuţii marginale
 Distribuţia marginală în X: X : (xi , ni• ) , i = 1,..., m
p
ni • =  nij
j =1
 Distribuţia marginală în Y:
( )
Y : y j , n• j , j = 1,..., p
m
n• j =  nij
i =1

Observație:

 Convenim să notăm variabila numerică cu X și


variabila nenumerică cu Y. Prin urmare, există m valori
ale variabilei numerice și p valori ale variabilei
nenumerice.
b) Distribuţii condiţionate (m+p distribuţii)

 Distribuţia condiţionată a variabilei X în funcţie de de valorile variabilei Y

- este definită pentru fiecare valoare yj

(X / Y = y j ) : (xi, nij ), i = 1,..., m si j valoare fixă


 Distribuţia condiţionată a variabilei Y în functie de valorile variabilei X
- este definită pentru fiecare valoare xi

(Y / X = xi ) : (y j , nij ), j = 1,..., p şi i valoare fixă


4. Frecvenţe absolute
 Frecvenţe absolute marginale - sunt efectivele grupurilor create de
X sau Y
ni. şi n.j

 Frecvenţe absolute parţiale: nij


5. Frecvenţe relative
 Frecvenţe relative marginale

 ni • n• j
f i• = ; f• j =
n•• n••

 Frecvenţe relative parţiale:

nij
f ij =
n ••
 Frecvenţe relative condiţionate

nij
fi / j = j valoare fixa,i = 1,..., m
n• j

nij
f j /i = i valoare fixa, j = 1,..., p
ni•
6. Medii condiţionate (pe grupe)

Dacă X este variabila numerică, atunci media variabilei X pe


grupe este: m
 xi  nij m
i =1
xj = , cu n• j =  nij , j = 1, p
n• j i =1

7. Media pe total:
p
 x j  n• j
j =1
x= p
.
 n• j
j =1
8. Varianţa general
- masoara, la nivelul populatiei, diferentele dintre indivizi, negrupati

s =s +s
2
X
2
xj
2

a) Varianţe între grupe (varianţe intergrupe)


- masoara, la nivel general, diferentele dintre indivizii din grupe diferite

p
 ( x j − x )  n• j
2
j =1
s x2 j = p
 n• j
j =1
b) Media varianţelor de grupă (varianţa intra-grupe)
- masoara, la nivel general, diferentele dintre indivizii de acelasi fel (din acelasi
grup)
unde s 2j sunt varianţe condiţionate (varianţe de grupă).
s 2
j  n• j
Acestea măsoară variaţia în cadrul unei grupe
s =
2 j

n
j
•j
(intragrupă).

Se calculează astfel:

 ( xi − x j )  nij 2 pentru Y = yj

s 2j = i =1
n• j
Măsurarea gradului de influenţă a factorului de grupare și a factorilor aleatori

 Plecând de la regula de adunare a varianțelor se pot


calcula:

a) Coeficientul influenţei factorului de grupare


2
s xj
k1 = 2
100
s X

b) Coeficientul influenţei factorilor întâmplători

2
s
k2 = 2 100
sX
 k1+k2=100%

Interpretare
Dacă k1>k2, atunci factorul de grupare explică mai mult din variaţia variabilei studiate decât
factorii întâmplători.
Se considera distributia unui esantion de 1000 de cititori ai Bibliotecii Centrale Universitare Mihai Eminescu din Iasi
dupa numarul de carti citite intr-o luna, X, si categoria de varsta, Y. Datele sunt prezentate in tabelul de mai jos.

APLICATII
 Se cere:
1. Puneți în evidență distribuția marginală a variabilei X și distribuția marginală a variabilei Y.
2. Puneți în evidență distribuțiile condiționate. Câte distribuții condiționate sunt?
3. Să se calculeze și să se interpreteze frecvențele relative parțiale.
4. Să se calculeze și să se interpreteze frecvențele relative marginale.
5. Să se calculeze și să se interpreteze frecvențele relative condiționate.
6. Să se calculeze și să se interpreteze mediile și varianțele condiționate (mediile și variantele pe grupe).
7. Să se calculeze și să se interpreteze media pe total.
8. Să se calculeze media varianțelor de grupă (varianța intra-grupe).
9. Să se calculeze varianța între grupe sau varianța mediilor de grupă (varianța intergrupe).
10. Să se calculeze varianța generala.
11. Să se calculeze coeficientul de influență a factorului de grupare și coeficientul de influență a factorilor
aleatori/întâmplători.
1. Să se calculeze media varianțelor de grupă (varianța intra-grupe).
2. Să se calculeze varianța între grupe sau varianța mediilor de grupă (varianța intergrupe).
3. Să se calculeze varianța generala.
4. Să se calculeze coeficientul de influență a factorului de grupare și coeficientul de influență a
factorilor aleatori/întâmplători.

TEMA
SEMINAR
BAZELE
STATISTICII
S E M I N AR 7 -
R E C AP I T U L AR E
CONCEPTE FUNDAMENTALE DIN STATISTICĂ

 populaţie,
 eşantion,
 unitate statistică,
 variabile statistice şi tipuri de variabile,
 indicatori statistici,
 indici statistici
POPULAŢIA STATISTICĂ

➢ pentru a fi bine definită, o populaţie statistică trebuie să aibă


precizată omogenitatea elementelor sale componente din punct
de vedere calitativ, de timp şi de spaţiu.

Exemplu: Studenţii cu vârsta de peste 25 de ani de la FEAA Iaşi, la 01


octombrie 2021

➢ volumul unei populaţii se notează cu N


EŞANTIONUL

 Reprezintă un sub-ansamblu de unităţi ale unei populaţii extras


din populaţia statistică după anumite procedee.
 Volumul eşantionului se notează cu n

Exemplu: Studenţii de la specializarea EAI, cu vârsta de peste 20 de


ani de la FEAA Iaşi, la 01 octombrie 2021
UNITĂŢILE STATISTICE

➢ sunt elementele componente ale unei populaţii statistice.

Exemplu:
- Un student de peste 30 ani
VARIABILA STATISTICĂ

 reprezintă însuşirea, trăsătura esenţială purtată de unităţile statistice


ale unei populaţii.
 se notează cu X.
 Valorile (variantele) variabilei se notează cu xi, cu i=1,m.
TIPURI DE VARIABILE STATISTICE
a) după modul de exprimare

1. Variabile numerice (cantitative):

❖ variabile ale cărei valori se exprimă prin cifre, numere.

Exemplu: vârsta, înălțimea, salariul, greutatea, etc.

❖ variabile discrete: variabile ale cărei valori se exprimă prin numere întregi (fără
subdiviziuni zecimale).

Exemplu: numărul de persoane, numărul de copii/familie, numărul de țări, numărul


de camere, etc

❖ variabile continue: sunt variabile care pot lua o infinitate de valori într-un interval.

Exemplu: PIB/loc., salariul, venitul, înălțimea, etc.


TIPURI DE VARIABILE STATISTICE
2. Variabile nenumerice (calitative):

❖ sunt variabile ale cărei valori se exprimă prin cuvinte.

Exemplu: nivelul de studii, sexul persoanei, etc.

❖ variabile nominale: sunt variabile pentru care între valorile acesteia nu există o
ierarhie.

Exemplu: sexul persoanei: 1- masculin, 2 – feminin

Caz particular: variabile alternative (dichotomice, dummy) sunt variabilele care


au 2 valori cărora li se acordă codurile 0 (Nu) și 1 (Da).

Exemplu: Produsul poate fi 1 – bun sau 0 - rău


TIPURI DE VARIABILE STATISTICE

❖ variabile ordinale: există o ierarhie între categoriile acesteia.

Exemplu: nivelul de studii, preferința pentru un produs cu valorile

Foarte rău Rău Nici rău, nici bun Bun Foarte bun

1 2 3 4 5
SCALE DE MĂSURARE
❖ Definire:

Scala este un continuum de cifre sau de simboluri, plasate ierarhic, de la inferior


la superior.

❖ Tipuri de scale

1. Variabile calitative

a. Scala nominală presupune acordarea de numere (coduri) fiecărei categorii


a unei populaţii (doi indivizi care aparţin unor categorii distincte au valori
diferite).

✓ este caracteristică variabilelor nominale


Exemplu: Sexul persoanei – 1 M, 2 F
SCALE DE MĂSURARE

b. Scala ordinală presupune ca atribuirea de coduri numerice pentru fiecare


categorie să se realizeze în ordine descrescătoare, după importanţa lor.

✓ este caracteristică variabilelor ordinale.

Exemplu: Preferința pentru un produs


SCALE DE MĂSURARE

2. Variabile cantitative

a. Scala interval are ca proprietăţi identitatea, ordinea şi faptul că intervalul


între numere are un sens.
❖ se poate, astfel, compara diferenţa dintre două valori ale aceleiaşi variabile.

Exemplu:
- măsurarea temperaturii în sistemul Celsius şi în sistemul Fahrenheit: diferenţa
dintre două temperaturi are un sens.
SCALE DE MĂSURARE

b. Scala raport

❖ are aceleaşi proprietăţi ca scala interval şi, în plus, posedă un zero absolut
(considerat punct de referinţă).
❖ diferenţa şi raportul dintre două valori au un sens.

Exemplu: PIB., salariul, vârsta, etc.


PREZENTAREA SERIEI:
SERII SIMPLE ȘI SERII CU FRECVENȚE DIFERITE

O serie statistică este reprezentată de termenii (xi ,ni) sau (xi ,fi), cu i=1,m.
FRECVENŢE ABSOLUTE CUMULATE CRESCĂTOR (𝑁𝑖 )
SAU DESCRESCĂTOR (𝑁𝑖 )

 exprimă numărul de unităţi statistice cumulate “până la” ( ) sau “peste” ( ) nivelul considerat al
caracteristicii, adică valori ≤ xi, respectiv ≥ xi.

i Unde:
N i = N i −1  + ni =  n h 𝑛𝑖 - efectivul corespunzator modalitatii i
h =1 n – efectivul total
𝑁𝑖 - efectivul cumulat până la” sau “peste”modalitatea i

m
N i = N i +1  + ni =  nh
h =i
Analiza unei serii statistice univariate. Cazul unei variabile cantitative discrete

1. Mărimi medii:

- media aritmetică, modul, mediana.


- Quartile
- Decile
2. Indicatori ai dispersiei
- varianta (𝑠 2),
- abaterea standard (s)
- coeficientul de variatie (v)
- amplitudinea intervalului interquartilic
- abaterea medie liniară

3. Indicatori ai formei
- Asimetrie (Skewness)
- Boltire (Kurtosis)
Mod de calcul în cazul seriilor simple şi seriilor cu frecvenţe diferite (variabilă
discretă).
 xi
 Media simplă: x= i
n

 xi  ni
 Media ponderată: x =
i
sau x =  xi  f i
 ni i
i

Observaţii:
- de cele mai multe ori, valoarea mediei nu coincide cu niciuna din valorile individuale din care s-a calculat
(s-a extras esenţialul din grup);
- media aritmetică este sensibilă la prezenţa valorilor extreme (outliers);
 este valoarea variabilei cea mai frecvent observată într-o distribuţie, adică valoarea xi
care corespunde frecvenţei maxime (nimax).

Observaţii:

 modul poate fi aflat doar în cazul seriilor cu frecvenţe diferite.

 o distribuţie poate avea una, două sau mai multe valori modale (serii unimodale,
bimodale sau plurimodale).

Interpretare: Cele mai multe unităţi înregistrează valoarea modală.

MODUL (MO)
▪ este acea valoare a variabilei unei serii ordonate, crescător sau descrescător, până
la care şi peste care sunt distribuite în număr egal unităţile colectivităţii:
jumătate din unităţi au valori mai mici decât mediana, iar jumătate au valori mai
mari decât mediana.

▪ corespunde locului unităţii mediane calculate astfel:


n+1
U Me
=
2

MEDIANA (ME)
AFLAREA MEDIANEI SE FACE DIFERIT ÎN
1. Serii simple:
FUNCŢIE DE TIPUL SERIEI:
- număr impar de termeni - atunci mediana este egală cu termenul central al seriei
ordonate crescător sau descrescător
- număr par de termeni - atunci mediana este egală cu media aritmetică simplă a celor
2 termeni centrali ai seriei ordonate crescător sau descrescător.

 Pentru un şir de date ordinale format din număr par de termeni, mediana este egală cu una din cele două
variante din centrul seriei dacă aceste variante sunt egale, iar dacă variantele nu sunt egale mediana ia 2 valori
deoarece nu se poate face media lor

2. Serii cu frecvenţe diferite


- se calculează unitatea mediană (UMe).
- se calculează 𝑁𝑖
se află prima valoare N i  U
Me
-
- valoarea xi corespunzătoare acesteia este Me.
Observaţie:
- mediana nu este influenţată de valorile extreme.
Quartile Abaterea medie liniară Varianţa
𝒏+𝟏
𝑸𝟏 : 𝑼𝑸𝟏 =
𝟒

 xi − x  x i − x  ni  ( xi − x )
2
 ( x i − x )  ni
2

Decile d= i d= i
s2 = i
s2 = i
𝒏+𝟏  ni n  ni
𝑼𝑫𝟏 = n i i
𝟏𝟎

Abaterea standard (s) (deviaţia standard) Coeficientul de variaţie (v)

s
v =  100
x

Amplitudinea intervalului interquartilic IQ=Q3-Q1


Indicatori ai formei

Asimetria (Skewness): Boltirea (Kurtosis)

3 4 4
1 = 2 = −3= −3
s 3  22 s 4

γ > 0 – asimetrie la dreapta


γ2 > 0 – distributie leptocurtica

γ =0 – distributie simetrica γ2 = 0 – distributie platicurtica


γ2 < 0 – distributie mezocurtica (normala)
γ < 0 – asimetrie la stanga
Analiza unei serii univariate după o variabilă cantitativă discretă. Reprezentare grafică.

a. Poligonul frecvenţelor:
- construirea acestuia presupune găsirea locului
geometric al punctelor Ai de coordonate (xi,ni) sau
(xi,fi) şi unirea acestora prin segmente de dreaptă.
- aproximează forma unei distribuţii.
Figura 1. Distribuția elevilor de la un liceu după nota
obținută la un examen, în martie 2016
b. Curba frecvenţelor:

• presupune ajustarea printr-o linie curbă, continuă a poligonului frecvenţelor.

• aproximează mai bine forma de distribuţie a colectivităţii după variabila considerată.


𝒙𝒊 𝒏𝒊
0 6

1 18

2 23

3 20

4 14

5 6

6 2

7 1

Total 90
c. Diagrama “box-plot” sau “box-and-whiskers” (“cutie şi mustăţi”).

Diagrama bloxpot este un instrument deosebit de util pentru studiul distribuţiei variabilelor
continue, şi mai ales pentru detectarea rapidă a outlierilor unei serii de date (valori extreme sau
aberante).

Forma diagramei (xmin, D1, Q1, Q2, Q3, xmax,, D9);

Avantaje:

• permite identificarea punctelor extreme;

• permite aprecierea nivelului mediu (Me), dispersiei şi asimetriei unei distribuţiei;

• facilitează compararea mai multor distribuţii (prin reprezentarea simultană a diagramelor).


https://chart-studio.plotly.com/~ColleenYoung/138.embed
Asimetrie la dreapta
Asimetrie la stanga
Analiza unei serii univariate după o variabilă cantitativă continuă:

1. Prezentarea seriei statistice

- gruparea unităţilor statistice este realizată pe intervale de variaţie.

Observaţie:

- Gruparea pe intervale de variaţie duce la pierderea unei părţi a informaţiei iniţiale.

2. Prelucrarea seriei statistice folosind metode grafice

a. Histograma

b. b. Poligonul frecvenţelor

c. c. Curba frecvenţelor
a. Histograma
3. Indicatori ai statisticii descriptive

- se calculează în mod identic, prin “discretizarea” variabilei (calculul


mijlocului intervalelor de variaţie).
Analiza unei serii univariate
2.1. Variabilă cantitativă
A. Variabilă discretă
B. Variabilă continuă

2.2. Variabilă calitativă

I. Tipuri de variabile
A. Variabile nominale
B. Variabile ordinale
A) Variabile nominale

• Pentru a reprezenta structura pe categorii la nivelul unui eşantion se


calculează frecvenţe relative;

• Reprezentarea frecvenţelor unui eşantion se realizează folosind


diagramele: dreptunghiul şi cercul de structură (Bar Chart sau Pie Chart).

• Indicatori specifici: frecvenţe relative, modul.


B) Variabile ordinale

• Reprezentarea frecvenţelor unui eşantion se realizează folosind diagramele:


Bar Chart sau Pie Chart

• Indicatori specifici: frecvenţe relative, modul şi quartilele.


Analiza unei serii bidimensionale

1. Prezentarea seriei

 O serie bidimensională prezintă variaţia unităţilor unui eşantion după două


variabile de grupare în mod simultan:

- variabilele Xi cu valorile xi , i = 1, m şi Yj cu valorile y j , j = 1, p

Efectivele (unităţile) eşantionului care poartă simultan valoarea xi şi valoarea


𝑦𝑗 sunt 𝑛𝑖𝑗 .

Distribuţia bivariată este definită de:

(xi , y j , nij ), i = 1, m, j = 1, p
Variaţii pe coloană – variaţii după i, intrucât nivelul j este constant, este acelasi

Variaţii pe linii – variaţii după j, intrucât nivelul i este acelaşi

Variabila X are m niveluri de variatie

Variabila Y are p niveluri de variatie


2. Tipuri de variabile
- o variabilă numerică şi o variabilă nenumerică;
- ambele variabile numerice;
- ambele variabile nenumerice.

3. Distribuţia după o variabilă cantitativă şi o variabilă


calitativă
În cadrul unei distribuţii bidimensionale se disting:
a). Două distribuţii marginale
 Distribuţia marginală în X: X : (xi , ni• ) , i = 1,..., m
p
ni • =  nij
j =1
 Distribuţia marginală în Y:
( )
Y : y j , n• j , j = 1,..., p
m
n• j =  nij
i =1

Observație:

 Convenim să notăm variabila numerică cu X și


variabila nenumerică cu Y. Prin urmare, există m valori
ale variabilei numerice și p valori ale variabilei
nenumerice.
b) Distribuţii condiţionate (m+p distribuţii)

 Distribuţia condiţionată a variabilei X în funcţie de de valorile variabilei Y

- este definită pentru fiecare valoare yj

(X / Y = y j ) : (xi, nij ), i = 1,..., m si j valoare fixă


 Distribuţia condiţionată a variabilei Y în functie de valorile variabilei X
- este definită pentru fiecare valoare xi

(Y / X = xi ) : (y j , nij ), j = 1,..., p şi i valoare fixă


4. Frecvenţe absolute
 Frecvenţe absolute marginale - sunt efectivele grupurilor create de
X sau Y
ni. şi n.j

 Frecvenţe absolute parţiale: nij.


5. Frecvenţe relative
 Frecvenţe relative marginale

 ni • n• j
f i• = ; f• j =
n•• n••

 Frecvenţe relative parţiale:

nij
f ij =
n ••
 Frecvenţe relative condiţionate

nij
fi / j = j valoare fixa,i = 1,..., m
n• j

nij
f j /i = i valoare fixa, j = 1,..., p
ni•
6. Medii condiţionate (pe grupe)

Dacă X este variabila numerică, atunci media variabilei X pe


grupe este: m
 xi  nij m
i =1
xj = , cu n• j =  nij , j = 1, p
n• j i =1

7. Media pe total:
p
 x j  n• j
j =1
x= p
.
 n• j
j =1
8. Varianţa general
- masoara, la nivelul populatiei, diferentele dintre indivizi, negrupati

s =s +s
2
X
2
xj
2

a) Varianţe între grupe (varianţe intergrupe)


- masoara, la nivel general, diferentele dintre indivizii din grupe diferite

p
 ( x j − x )  n• j
2
j =1
s x2 j = p
 n• j
j =1
b) Media varianţelor de grupă (varianţa intra-grupe)
- masoara, la nivel general, diferentele dintre indivizii de acelasi fel (din acelasi
grup)
unde s 2j sunt varianţe condiţionate (varianţe de grupă).
s 2
j  n• j
Acestea măsoară variaţia în cadrul unei grupe
s =
2 j

n
j
•j
(intragrupă).

Se calculează astfel:

 ( xi − x j )  nij 2 pentru Y = yj

s 2j = i =1
n• j
Măsurarea gradului de influenţă a factorului de grupare și a factorilor aleatori

 Plecând de la regula de adunare a varianțelor se pot


calcula:

a) Coeficientul influenţei factorului de grupare


2
s xj
k1 = 2
100
s X

b) Coeficientul influenţei factorilor întâmplători

2
s
k2 = 2 100
sX
 k1+k2=100%

Interpretare
Dacă k1>k2, atunci factorul de grupare explică mai mult din variaţia variabilei studiate decât
factorii întâmplători.
1. Un eşantion de angajaţi ai unei firme a răspuns la câteva întrebări cu caracter personal şi
profesional. Precizaţi natura următoarelor variabile:

 numărul de animale al familiei


 locul naşterii
 vârsta în ani împliniţi
 nivelul ultimei diplome de studii obţinută (liceu, facultate, master, doctorat, post-doctorat)
 tipul de maşină deţinut: autohton sau de import
 distanţa, în km, de acasă până la locul de muncă
 poziţia ierarhică ocupată în firmă (funcţionar, middle management, top management)
 poziţia privind politica firmei de a reduce salariile în locul reducerii personalului existent
(acord total, acord, indiferent, dezacord, dezacord total).

APLICATII
2. Distributia notelor obtinute de un grup de studenti la examenul bazele statisticii se prezinta astfel:

Nota obtinuta 6 7 8 9 10

Număr studenti 4 8 12 14 5

 Să se precizeze volumul esantionului, unitatea statistică, variabila și tipul variabilei. Sa se


identifice și să se interpreteze media, mediana și modul.

APLICATII
3. Distributia unui esantion de angajati in functie de salarial obtinut, se prezinta astfel:

a. Sa se caracterizeze distributia.

b. Media obtinuta este semnificativa?

APLICATII
4. In anul 2021, pentru un esantion de familii, media venitului pe gospodarie era de 4000
lei, mediana de 4500, iar modul de 4300. Sa sa precizeze forma distributiei.

APLICATII
5. Se considera distributia unui esantion de studenti in functie de numarul de ore de
voluntariat realizat la un camin de copii saptamanal.

Numarul de ore de Număr studenti


voluntariat (xi) (ni)

2 10

3 19

4 80

5 25

6 10

Total 144

APLICATII
5.
Se cere sa se determine:
a. Cati studenti fac 3 ore de voluntariat saptamanal?
b. Cati studenti face cel mult 4 ore de voluntariat saptamanal?
c. Cat % dintre studenti fac cel putin 4 ore de voluntariat saptamanal?
d. Cat % dintre studenti fac maxim 5 ore de de voluntariat saptamanal?
e. Cat % dintre studenti fac 6 ore de de voluntariat saptamanal?
f. Cati studenti fac minim 3 ore de voluntariat saptamanal?
g. Media esantionului este reprezentativa? Dar populatia, este omogena?

APLICATII
6. O variabila ia urmatoarele valori: 14, 5, 8, 2, 12.

Sa se identifice si sa se intrepreteze media, mediana si abatarea standard.

APLICATII
7. In urma analizei statistice privind salariul per familie (exprimat in mii lei), s-a obtinut
urmatoarea diagrama Box-plot.

Sa se interpreteze acest rezultat.

APLICATII
8. Pentru doua serii de studenti s-au reprezentat grafic distributiile notelor obtinute la un test. Sa se precizeze sensul
asimetriei. Sa se specifice care serie a obtinut note mai mari.

NOTA_1

NOTA_2

APLICATII 3 4 5 6 7 8 9 10 11
9. Se considera distribuţia unui eşantion firme din judetul Iasi, observate după valoarea
profitului acestora (milioane lei). Datele sunt prezentate in tabelul urmator.

Sa se calculeze si sa se interpreteze media aritmetica.

Profitul Număr firme


[xi-1,xi+1) (ni)

20-30 10
30-40 20
40-50 40
50-60 35
60-70 7
Total 112

APLICATII
10. Se considera distribuţia unui eşantion de masini, observate după pretul acestora (mii
euro). Sa se interpreteze indicatorii prezentati in tabelul de mai jos.
Statistics

N Valid 155
Missing 2
Mean 27.39
Median 22.79
Mode 12.64
Std. Deviation 14.35
Variance 205.97
Skewness 1.76
Kurtosis 3.63
Percentil 25 17.89
es
APLICATII 50
75
22.79
31.96
11. Reprezentarea grafică a unei populatii pe medii de rezidenta este realizată în figura
de mai jos:

Să se interpreteze valoarea modului.

APLICATII
12. Pentru un esantion de angajati, distribuiti dupa variabila educatie (in ani) si pozitia in
firma, s-au obtinut urmaoarele rezultate:

Junior Middle Senior

Media 24 20 36

Varianta 64 16 36

Numar angajati 526 46 92

APLICATII
12.

a. Să se precizeze variabila X și variabila Y;

b. Să se determine care din cele trei grupe de persoane este mai


omogenă în raport cu nivelul de educație;

c. Factorul de grupare influentează semnificativ variația variabilei


numerice?

APLICATII
13. Selectați indicatorii statistici:

a) numărul populației Republicii Moldova la 1 ianuarie 2015 a constituit 3555,2 mii persoane;

b) indicele volumului producției industriale a Republicii Moldova în anul 2014 este 107,3%;

c) măsurarea veniturilor disponibile ale populației se efectuează în valuta națională – lei;

d) nivelul prețului de cost se calculează prin împărțirea sumei totale a cheltuielilor la


cantitatea totală a producției fabricate.
14. Media este reprezentativă pentru o colectivitate doar dacă:

a) este exprimată în procente;

b) este calculată din mărimi omogene, cu grad redus de variaţie;

c) este rezultatul sistematizării datelor statistice;

d) exprimă dispersarea tuturor nivelurilor individuale ale unei caracteristici faţă de nivelul
lor mediu.
15. Populația unei țări reprezintă:

a) totalitatea persoanelor (bărbați, femei, copii, pensionari) care locuiesc pe un


anumit teritoriu;

b) forță de muncă pe piața muncii;

c) potențial esențial în desfășurarea procesului de producție;

d) consumatorul rezultatului de producere în țară;

e) obiectul de studiu al demografiei.


16. Indicatorul, ce reprezintă valoarea cel mai frecvent întâlnită în cadrul
colectivităţii statistice analizate, este:

a) media aritmetică;

b) modulul (dominanta);

c) dispersia;

d) mediana.
17. Valoarea unei serii statistice ordonate crescător sau descrescător, care împarte
seria în două părţi egale, reprezintă:

a) abaterea liniară;

b) modulul (dominanta);

c) mediana;

d) media geometrică.
18. O distributie unidimensionala se prezinta sub forma:
a. X, Y:{𝑥𝑖 , 𝑦𝑗 , 𝑛𝑖𝑗 }, i=1, 𝑚 si j=1, 𝑝
𝑥1 … … … 𝑥𝑖 … … . 𝑥𝑚
b. X: 𝑛 … … . . 𝑛 … … . 𝑛 , i=1, 𝑚
1 𝑖 𝑚

c. X: (𝑥𝑖 ) i=1, 𝑛
19. . O distributie biidimensionala se prezinta sub forma:
a. X, Y:{𝑥𝑖 , 𝑦𝑗 , 𝑛𝑖𝑗 }, i=1, 𝑚 si j=1, 𝑝
b. X: (𝑥𝑖 ) i=1, 𝑛
𝑥1 … … … 𝑥𝑖 … … . 𝑥𝑚
c. X: 𝑛 … … . . 𝑛𝑖 … … . 𝑛𝑚 , i=1, 𝑚
1
SEMINAR
BAZELE
STATISTICII
S E M I N AR 8
PROBABILITĂŢI ŞI DISTRIBUŢII TEORETICE

 1. Probabilităţi

 2. Variabile aleatoare

 3. Distribuţii teoretice
1. PROBABILITĂŢI

Plan empiric vs Plan teoretic

- Planul empiric
O variabilă statistică X: (𝑥𝑖 ) cu frecvenţele 𝑛𝑖 sau 𝑓𝑖 formează o distribuţie statistică

xi-1-xi ni fi Fi
0-10 10 0.125 0.125
10-20 20 0.250 0.375 𝑥ҧ = 23.13
20-30 30 0.375 0.750
𝑠 2 = 115.23
30-40 15 0.188 0.938
40-50 5 0.062 1.000
Total 80 1.000 -
- Planul teoretic

X – variabila aleatoare

𝑝𝑖 - probabilitatea de apariţie

σ𝑖 𝑝𝑖 = 1 (100%)

O variabilă aleatoare şi probabilitatea de apariţie corespunzătoare formează


o distribuţie teoretică.
1. Probabilităţi

a. Definiţia clasică a probabilităţii (Bernoulli şi Laplace)

Probabilitatea ca un eveniment să se realizeze reprezintă raportul dintre numărul de


evenimente elementare favorabile şi numărul evenimentelor egal posibile.
m
p=
n
unde m este numărul cazurilor favorabile şi n este numărul cazurilor posibile, unde
, ceea ce implică 0  p  1

dacă p=0, evenimentul este imposibil,

dacă p=1, evenimentul este cert sau sigur.


Exemplu

În cazul aruncării zarului, să se afle probabilitatea de apariţie a fiecărei feţe și să se


prezinte distribuția de probabilitate corespunzătoare.
xi pi

1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
Total ∑ pi =1.0

Caracteristicile distribuției de probabilitate: 𝜇 și 𝜎 2.


Media: µ = M(X) = E(X) – speranța matematică
Varianța: σ 2= V(X)
2. VARIABILE ALEATOARE

Definire

Variabila aleatoare X este o funcţie care asociază fiecărui eveniment elementar un


număr real, xi, iar probabilitatea ca variabila X să ia o anumită valoare este pi.

Variabila aleatoare discretă este definită prin:


 xi 
X :  
 pi 
Variabilele aleatoare continue sunt definite cu ajutorul unei funcţii f(x), funcţie
densitate de repartiţie, care are următoarele proprietăţi:

() x  R, f ( x)  0
+

 f ( x)  dx = 1
−

Media şi varianţa unei variabile aleatoare:

 = M( X )

 2 =V( X )
DISTRIBUŢIA UNEI VARIABILE ALEATOARE

Distribuţia sau legea de probabilitate a unei variabile aleatoare este dată prin funcţia
sa de probabilitate P(X).

Pe baza funcţiei de probabilitate, se determină funcţia sa de repartiţie definită prin


relaţia:

F ( x) = P( X  x), () x  R
Funcţia de repartiţie are următoarele proprietăţi:

() x  R, 0  F ( x)  1

() a,b  R, a  b, F(a)  F(b)

lim F ( x ) = 1
x → +

lim F ( x) = 0
x → −
DISTRIBUTII UTILIZATE IN STATISTICA

a) Distribuţia normală (generalizată)

Notaţie: X ~ N (μ , 𝜎 2 )

Funcţia densitate de repartiţie este:

( x −  )2
1 −
f(x)= e 2 2
 2
b) Distribuţia normală standard Z

O variabilă X poate fi transformată într-o variabilă Z după relaţia:

𝑥𝑖 − μ
𝑧𝑖 =
σ

Notaţie: X ~ N (μ , 𝜎 2 ) → Z ~ N (0,1)

Valorile Z şi valorile funcţiei Laplace sunt tabelate


Distributia normala standard sau distributia z.

Este o distributie normala de medie 0 si varianta/abatere standard 1.

Orice distributie normala poate fi standardizata prin conversia valorilor sale in scoruri z.

Scorurile z ne arata la cate abateri standard fata de medie se afla fiecare valoare.

Convertirea unei distributii normale intr-o distributie z ne permite calculul probabilitatii


ca o anumite valoare sa „se intample”.
Tabela Z:

Z 0.00 0.01 0.02 0.03

0.0

0.1

0.2

0 z
Transformarea unei distributii statistice intr-o distributie teoretica si interpretarea acesteia in termeni
probabilistici presupune:
- Calculul mediei si abaterii standard a seriei observate;
- Calculul valorilor variabilei normale centrate reduse Z corespunzatoare valorilor xi;
Xi − μ
zi =
σ
- Se citeste din tabela Laplace, probabilitatea corespunzatoare P(Z < zi), adica probabilitatea ca o unitate
colectiva sa aiba o valoare X inferioara valorii xi considerate. Tabela indica valoarea suprafetei cuprinsa
intre curba, axa Ox si ordonatele in x=0 si xi=zi.
Distributia normala vs distributia normala standard

Toate distribuțiile normale, la fel ca distribuția normală standard, sunt unimodale și distribuite simetric cu o
curbă în formă de clopot. Cu toate acestea, o distribuție normală poate lua orice valoare ca medie și
deviație standard. În distribuția normală standard, media și deviația standard sunt întotdeauna fixate.

Fiecare distribuție normală este o versiune a distribuției normale standard care a fost întinsă sau stoarsă și
deplasată orizontal la dreapta sau la stânga.

Media determină unde este centrată curba. Creșterea mediei deplasează curba spre dreapta, în timp ce
scăderea mișcă curba spre stânga.
Abaterea standard întinde sau micsoreaza curba. O abatere standard mică are ca rezultat o curbă îngustă, în
timp ce o abatere standard mare duce la o curbă largă.
Standardizarea unei distribuții normale

Când standardizați o distribuție normală, media devine 0 și deviația standard devine 1. Acest lucru vă
permite să calculați cu ușurință probabilitatea apariției anumitor valori în distribuția dvs. sau să
comparați seturi de date cu diferite mijloace și abateri standard.

În timp ce punctele de date sunt denumite x într-o distribuție normală, ele sunt numite scoruri z sau z în
distribuția z. Un scor z este un scor standard care vă arată la câte deviații standard se află la distanță de
media unei valori individuale (x):

1. Un scor z pozitiv înseamnă că valoarea dvs. x este mai mare decât media.

2. Un scor z negativ înseamnă că valoarea dvs. x este mai mică decât media.

3. Un scor z de zero înseamnă că valoarea dvs. x este egală cu media.


Conversia unei distribuții normale în distribuția normală standard vă permite să:

Comparați scorurile pe diferite distribuții cu diferite mijloace și abateri standard.

Normalizați scorurile pentru luarea deciziilor statistice (de exemplu, notarea pe o curbă).

Găsiți probabilitatea observațiilor într-o distribuție care cade peste sau sub o anumită valoare.

Găsiți probabilitatea ca o medie a eșantionului să difere semnificativ de o medie a populației cunoscută.


Cum se calculează un scor z
Pentru a standardiza o valoare dintr-o distribuție normală, convertiți valoarea individuală într-un scor z:

1. Scădeți media din valoarea dvs. individuală.


2. Împărțiți diferența de abaterea standard.
Utilizarea distribuției normală standard pentru a găsi probabilitatea

Distribuția normală standard este o distribuție a probabilității, astfel încât aria de sub curba dintre două puncte
vă indică probabilitatea ca variabilele să ia un interval de valori. Suprafața totală sub curbă este de 1 sau
100%.

Fiecare scor z are o valoare p asociată care vă indică probabilitatea apariției tuturor valorilor sub sau peste
acel scor z. Aceasta este zona de sub curba stângă sau dreaptă a scorului z.
Proprietăţile funcţiei lui Laplace, Φ(z)

▪ Φ(zi)=P(0<Z<zi)

▪ Φ(0) = 0

▪ Φ(-zi) = - Φ(zi)

▪ Dacă z1< z2, atunci P( z1  Z  z2 ) = ( z2 ) − ( z1 )


1
▪ P(Z>zi)=1-P(Z<zi)= −  ( zi )
2
Pe baza funcţiei lui Laplace, se poate determina, de exemplu, probabilitatea
ca variabila aleatoare normală standard să ia valori într-un interval simetric de
tipul (- 𝑧𝑖 ; 𝑧𝑖 ; ). Această probabilitate este:

P( − zi  Z  zi ) = F ( zi ) − F ( − zi ) =  ( zi ) −  ( − zi ) = 2 ( zi )
Observație:

Tabela Z se folosește:

-pentru a afla o probabilitate care corespunde unei valori date a lui Z (de
exemplu, P(Z>zi)).

-pentru a afla valoarea lui Z care corespunde unei anumite probabilități.


c) Distribuţia chi-pătrat

O variabilă aleatoare repartizată după o lege chi-pătrat este


simbolizată  ( n , ) .
2
d) Distribuţia Student
O variabilă aleatoare repartizată după o lege Student, simbolizată t(υ), unde υ reprezintă
numărul de grade de libertate, parametrul acestei distribuţii.

e) Distribuţia Snedecor-Fisher
O variabilă aleatoare repartizată după o lege Snedecor-Fisher, simbolizată F (1 , 2 ) .
• unde υ1 şi υ2 reprezintă grade de libertate, parametrii repartiţiei Snedecor-Fisher.
APLICATII

1) Pentru o populație de studenți se cunosc următoarele rezultate privind punctajul obținut la un


test: 𝑋~𝑁(79, 9). Să se afle:

a) proporția studenților care au luat un punctaj mai mare decât 82.


b) proporția studenților care au luat un punctaj mai mic decât 84.
c) proporția studenților care au luat un punctaj mai mic decât 72.
d) proporția studenților care au luat un punctaj cuprins între 72 și 84.
0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
2) Pentru o variabilă 𝑋~𝑁(23,13; 115,23), să se afle 𝑃(𝑋 < 30).

3) Pentru o variabilă 𝑋~𝑁(𝜇, 𝜎 2 ), să se afle 𝑃(𝜇 − 𝜎 < 𝑋 < 𝜇 + 𝜎).

4) Să se afle 𝑃(−1 < 𝑍 < 2).

5) Să se afle valorile lui Z astfel încât 𝑃 −𝑧 < 𝑍 < +𝑧 = 0,95.

S-ar putea să vă placă și