Sunteți pe pagina 1din 25

Statistica

Metoda utilizată în cercetarea statistică presupune parcurgerea unor etape, vezi fig. 4.1:

1. Identificarea și descrierea clară și concisă a problemei studiate.


2. Identificarea, cel puțin cu titlu de încercare, a factorilor importanţi care
afectează această problemă sau, care poate juca un rol în soluție sale.

Identificarea și Identificarea
descrierea clară a principalilor factori
problemei studiate de influență
Stabilirea volumului
Prelevarea datelor
de eșantionaj și a
de eșantionaj:
metodei de
𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛
Delimitarea populației prelevare
și a caracteristicii
/caracteristicilor
statistice

Estimarea punctuală Sintetizarea și Verificarea


a parametrilor Adoptarea unui omogenității
structurarea
modelului model statistic statistice
informației obținute

Testrea Reprezentarea Calculul


concordanței datelor de principalilor
eșantionaj indicatori statistici

Verificarea carac- Eliminarea


terului aleator valorilor aberante
Inferențe statistice
privind parametrii și
indicatorii statistici

Figura 4.1: Etapele unei cercetări statistice


3. Delimitarea populației și identificarea caracteristicii /caracteristicilor
statistice de studiat.
4. Stabilirea volumului de eșantion și a metodei de prelevare a datelor de
eșantionaj.
5. Formarea eșantionului și obținerea datelor de eșantionaj
6. Verificarea omogenității statistice. Această etapă presupune verificarea
caracterului aleatoriu și eliminarea valorilor aberante
7. Sintetizarea și structurarea informației obținute folosind instrumentele
statisticii descriptive: reprezentarea datelor de eșantionaj și calculul
74
principalilor indicatori statistici.
8. În funcție de rezultatele obținute în etapa precedentă se propune un
model statistic pentru problemă folosind cunoștințele științifice sau
tehnice ale fenomenului studiat. De asemenea, în această etapă trebuie
indicate orice limitări sau ipotezele modelului utilizat.
9. Urmează o etapă de decizie statistică cu privire la posibilitatea utilizării în
continuare a modelului statistic ales și pentru a confirma că soluţia
propusă a problemei este fezabilă. Dacă decizia nu este corespunzătoare,
urmează o etapă de rafinare a modelului pe baza de date observate pentru
a confirma că soluţia propusă a problemei este eficientă și efectivă.
10. Cercetarea statistică se încheie cu realizarea inferențelor statistice privind
parametrii și indicatorii statistici ai fenomenului analizat, precum și cu
concluzii sau recomandări bazate pe soluția problemei.

Ipoteză statistică – orice ipoteză care se face cu privire la parametrii, tipul repartiţiei unor
variabile aleatorii sau o supoziţie despre modelele probabiliste din care sunt extrase datele
analizate.
Test statistic – procedura de verificare a unei ipoteze statistice, respectiv, procedura al cărei
obiect este de a decide respingerea sau acceptarea unei ipoteze statistice.
Decizia adoptată rezultă din valoarea uneia sau mai multor statistici, adecvate, calculate pe baza
valorilor de eşantionaj. Valoarea statisticii fiind supusă variaţiilor aleatorii, există riscul de a lua o
decizie eronată.

Se cunosc două forme de ipoteze statistice:


 Ipoteza nulă, H0 – ipoteza statistică iniţială asupra repartiţiei populaţiei
studiate, care trebuie respinsă, sau acceptată pe baza rezultatului unui test.
 Ipoteza alternativă, H1 – ipoteza statistică ce se opune ipotezei nule, H0.
Nivelul de semnificaţie (al unui test) – valoarea , ce limitează probabilitatea de respingere a unei
ipoteze nule, când ea este adevărată.
Eroare de genul întâi – eroarea comisă când se decide respingerea ipotezei nule, atunci când
ipoteza nulă este adevărată.
Riscul de genul întâi – probabilitatea , de a comite eroarea de genul întâi:
𝛼 = 𝑃𝑟(respinge 𝐻0|𝐻0 este adevărată)
Eroare de genul al doilea – eroarea comisă când se decide să nu se respingă ipoteza nulă, atunci
când ipoteza nulă este falsă.
Riscul de genul al doilea – probabilitatea , de a comite eroarea de genul al doilea:
𝛽 = 𝑃𝑟(acceptă 𝐻0|𝐻0 este falsă)
Regula de decizie se exprimă, de obicei printr-o inegalitate de forma:

„𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡ă  𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑟𝑖𝑡𝑖𝑐ă”


sau

75
„𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡ă  𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑟𝑖𝑡𝑖𝑐ă”

Valori estimate
𝑯𝟎 𝑯𝟎
Valori reale adevărată falsă

𝑯𝟎 Decizie corectă; Eroare de tip I


adevărată Probabilitatea = 1 −  Probabilitatea = 
𝑯𝟎 Eroare de tip II Decizie corectă;
falsă Probabilitatea =  Probabilitatea = 1 − 

Din punct de vedere practic, pentru a verifica o anumită ipoteză statistică, este necesar a fi
parcurse următoarele etape:

Stabilirea ipotezelor:
𝑯𝟎 şi 𝑯𝟏

Stabilirea nivelului de
semnificaţie: 

Se determină regula de
decizie – 𝑺:

𝒇𝑺|𝒏 (𝒙)

Colectarea datelor de
eşantionaj, 𝒏, şi
specificarea statisticii:
𝒇𝑺|𝒏 (𝒙)

Decizia statistică:
 Acceptă 𝑯𝟎 ,
sau
 Acceptă 𝑯𝟏 .

76
Aplicația 2 – Teste de eliminare a valorilor aberante

TESTUL GRUBBS – SMIRNOV

Valorile susceptibile de a fi considerate aberante sunt:

𝑥𝑚𝑖𝑛 = 𝑥(1) ș𝑖 𝑥𝑚𝑎𝑥 = 𝑥(𝑛)

Etapele de rezolvare:

1. Se prelevează valorile de eşantionaj:


𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 , unde 𝑖 ∈ ̅̅̅̅̅
1, 𝑛 ;

prin observarea unui eșantion de volum 𝑛;

2. Se determină valoarea minimă, respectiv maximă de eşantionaj:


𝑥𝑚𝑖𝑛 = 𝑥(1) ;

𝑥𝑚𝑎𝑥 = 𝑥(𝑛) ;

3. Se calculează media de eșantionaj a datelor experimentale:


𝑛
1
𝑚 = ∙ ∑ 𝑥𝑖
𝑛
𝑖=1

4. Se calculează abaterea medie de eșantionaj a datelor experimentale:


𝑛
1
𝑠= ∙ ∑(𝑥𝑖 − 𝑚)2
𝑛−1
𝑖=1

5. Se determină statistica de decizie pentru valoarea 𝑥𝑚𝑖𝑛 :


𝑚 − 𝑥𝑚𝑖𝑛
𝐺𝑚𝑖𝑛 =
𝑠
6. Se determină statistica de decizie pentru valoarea 𝑥𝑚𝑎𝑥
𝑥𝑚𝑎𝑥 − 𝑚
𝐺𝑚𝑎𝑥 =
𝑠
7. Luarea deciziei:
 Dacă: 𝐺𝑚𝑖𝑛/𝑚𝑎𝑥 > 𝜉𝑛,1−𝛼 , atunci 𝑥𝑚𝑖𝑛 sau 𝑥𝑚𝑎𝑥 sunt valori aberante și se înlătură dintre datele
de eșantionaj;
 Dacă: 𝐺𝑚𝑖𝑛/𝑚𝑎𝑥 ≤ 𝜉𝑛,1−𝛼 , atunci 𝑥𝑚𝑖𝑛 sau 𝑥𝑚𝑎𝑥 nu pot fi considerate valori aberante și deci
păstrează;
În relațiile anterioare s-au notat:
 1 − 𝛼, reprezintă nivelul de încredere;
 𝛼, reprezintă nivelul de semnificație;
 𝜉𝑛,1−𝛼 , reprezintă valorile constantei de acceptare și se aleg conform tabelului alăturat.

88
Tabelul 1 Valorile constantei de acceptare ale testului Grubbs - Smirnov

𝝃𝒏,𝟏−𝜶 𝝃𝒏,𝟏−𝜶
n n
𝜶 = 𝟎. 𝟎𝟓 𝜶 = 𝟎. 𝟎𝟐𝟓 𝜶 = 𝟎. 𝟎𝟓 𝜶 = 𝟎. 𝟎𝟐𝟓
3 1.153 1.154 22 2.603 2.758
4 1.463 1.481 23 2.624 2.780
5 1.671 1.715 24 2.644 2.802
6 1.822 1.887 25 2.663 2.822
7 1.938 2.020 30 2.745 2.908
8 2.032 2.127 35 2.812 2.978
9 2.110 2.215 40 2.868 3.036
10 2.176 2.290 45 2.915 3.085
11 2.234 2.355 50 2.957 3.128
12 2.285 2.412 55 2.994 3.166
13 2.331 2.462 60 3.027 3.200
14 2.372 2.507 65 3.057 3.230
15 2.409 2.548 70 3.084 3.258
16 2.443 2.586 75 3.109 3.283
17 2.475 2.620 80 3.132 3.306
18 2.504 2.652 85 3.153 3.328
19 2.531 2.681 90 3.173 3.348
20 2.557 2.708 95 3.192 3.366
21 2.580 2.734 100 3.210 3.384

89
Aplicația 3 – Calculul și construcția histogramei și a funcției
empirice de repartiție

a. Se prelevează minim 35 de piese consecutive


 Eşantionul prelevat este de minim 35 de valori (de preferinţă 60).
b. Se construiește histograma datelor se eşantionaj:
I. Se prelevează valorile de eșantionaj:
𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛
prin observarea unui eşantion de volum n;
II. Se formează şirul statisticilor de ordine:
𝑥(1) ≤ 𝑥(2) ≤ 𝑥(3) ≤ ⋯ ≤ 𝑥(𝑖) ≤ ⋯ 𝑥(𝑛) ,
unde 𝑖 ∈ ̅̅̅̅̅
1, 𝑛 ;
III. Se determină valoarea minimă, respectiv maximă de eşantionaj:
𝑥𝑚𝑖𝑛 = 𝑥(1) ;
𝑥𝑚𝑎𝑥 = 𝑥(𝑛) ;
IV. Se calculează amplitudinea de eşantionaj, R:
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 𝑥(𝑛) − 𝑥(1)
V. Se calculează numărul de clase, k:
Se determină cu relaţia empirică (relaţia lui Sturges):
10
𝑘 =1+ ∙ 𝑙𝑜𝑔10 (𝑛),
3
sau cu relaţia:
𝑘 = √𝑛.
În general se recomandă ca numărul de clase să fie 612.
În relaţiile anterioare s-a notat prin […] partea întreagă a valorii.
VI. Calculul mărimii clasei, amplitudinii clasei, w:
𝑅
𝑤=
𝑘
VII. Calculul limitelor claselor, marginilor claselor, 𝑦𝑖 :
𝑦1 = 𝑥(1) ;
𝑦2 = 𝑥(1) + 𝑤;
𝑦3 = 𝑥(1) + 2 ∙ 𝑤;
…………………..….
𝑦𝑗 = 𝑥(1) + (𝑗 − 1) ∙ 𝑤;
……………………...
𝑦𝑘+1 = 𝑥(1) + 𝑘 ∙ 𝑤;

92
𝑦1 𝑦2 … 𝑦𝑗 𝑦𝑗+1 … 𝑦𝑘+1

𝑥𝑚𝑖𝑛 = 𝑥(1) 𝑥𝑚𝑎𝑥 = 𝑥(𝑛)

w w w

VIII. Calculul valorilor centrale ale claselor, 𝑦𝑖′ :


𝑦𝑖 + 𝑦𝑖+1
𝑦𝑖′ =
2
IX. Determinarea frecvenţei absolute, 𝑁𝑗 :
Numărul de realizări (apariţii) ale unui tip dat de evenimente, sau numărul de observaţii
care aparţin unei clase :
𝑘

∑ 𝑁𝑗 = 𝑛
𝑗=1

X. Determinarea frecvenţei absolute cumulate, 𝑁𝑗′ :


𝑗

𝑁𝑗′ = ∑ 𝑁𝑘
𝑘=1

XI. Determinarea frecvenţei relative, 𝑓𝑗 :


𝑁𝑗
𝑓𝑗 =
𝑛
şi
𝑘

∑ 𝑓𝑗 = 1
𝑗=1

XII. Determinarea frecvenţei relative cumulate, 𝑓𝑗 :


𝑗

𝑓𝑗′ = ∑ 𝑓𝑘
𝑘=1

XIII. Determinarea repartiţiei de frecvenţe:


Relația empirică între valorile unei caracteristici și frecvențele absolute sau relative ale
acestora. Repartiția de frecvențe poate fi reprezentată grafic sub formă de histogramă
sau poligon al frecvențelor cumulate.
XIV. Histograma:
Reprezentarea grafică a repartiției de frecvențe a unei caracteristici cantitative, constând
dintr-un ansamblu de dreptunghiuri alăturate, fiecare având baza egală cu mărimea clasei şi
aria proporțională cu frecvența clasei.

93
𝑁𝑗 𝑓𝑗

𝑋
𝑦1 = 𝑥(1)  𝑦𝑗 𝑦𝑗+1  𝑦𝑘+1 = 𝑥(𝑛)

XV. Poligonul frecvențelor cumulate:


Linia poligonală obținută prin unirea punctelor care au ca abscise limitele superioare ale
claselor și au ca ordonate frecvențele absolute sau relative cumulate.

𝑁𝑗′ 𝑓𝑗′
𝑛/1

𝑋
𝑦1 = 𝑥(1)  𝑦𝑗 𝑦𝑗+1  𝑦𝑘+1 = 𝑥(𝑛)

XVI. Calculul parametrilor statistici: 𝑚, 𝑠 2 , 𝑠, 𝑀𝑒, 𝑀𝑜


𝑛
1
𝑚 = ∙ ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛
2
1
𝑠 = ∙ ∑(𝑥𝑖 − 𝑚)2
𝑛−1
𝑖=1

𝑠 = √𝑠 2
𝑥(𝑛+1) 𝑝𝑒𝑛𝑡𝑟𝑢 𝑛 = 𝑖𝑚𝑝𝑎𝑟
2
𝑀𝑒 = {𝑥(𝑛) + 𝑥(𝑛+1)
2 2
𝑝𝑒𝑛𝑡𝑟𝑢 𝑛 = 𝑝𝑎𝑟
2
𝑀0 = valoarea centrală a clasei cu frecvența maximă

94
c. Calculul probabilităților utilizând funcția empirică de repartiție:

𝑁𝑗 𝑓𝑗

𝑋
𝑦1 = 𝑥(1)  𝑦𝑥 𝑦𝑥+1  𝑦𝑘+1 = 𝑥(𝑛)

𝑥 − 𝑦𝑖
𝑃𝑟(𝑋 ≤ 𝑥) = ∑ 𝑓𝑖 + ∙ 𝑓𝑗
𝑤
𝑖<𝑥
𝑥 − 𝑦𝑥
𝑃𝑟(𝑋 > 𝑥) = 1 − ∑ 𝑓𝑖 − ∙ 𝑓𝑥
𝑤
𝑖<𝑥

95
APLICAȚIA 4 - TESTE DE CONCORDANŢĂ

TESTUL KOLMOGOROV-SMIRNOV

Se testează ipoteza nulă:


𝐻0 : 𝑥 ∈ 𝐹(𝑥),
cu alternativa:
𝐻1 : 𝑥 ∉ 𝐹(𝑥).
Etape:
I. Se prelevează valorile de eşantionaj:
𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛
prin observarea unui eşantion de volum 𝒏;
II. Se formează şirul statisticilor de ordine:
𝑥(1) ≤ 𝑥(2) ≤ 𝑥(3) ≤ ⋯ ≤ 𝑥(𝑖) ≤ ⋯ 𝑥(𝑛) ,
unde 𝑖 ∈ ̅̅̅̅̅
1, 𝑛 ;
III. Pentru fiecare valoare, din şirul statisticilor de, x(i), se calculează probabilităţile
observate:
𝑖
 𝑄 + (𝑥(𝑖) ) = 𝑛;
𝑖−1
 𝑄 − (𝑥(𝑖) ) = ,
𝑛
pentru 𝑖 ∈ ̅̅̅̅̅
1, 𝑛.
IV. Se calculează valorile teoretice ale probabilităţilor corespunzătoare valorilor observate:
𝑥(𝑖)
𝐹(𝑥(𝑖) ) = ∫ 𝑓(𝑢) ∙ 𝑑𝑢
−∞

Repartiţia
Repartiţia normală Repartiţia Weibull
exponenţială
𝑥(𝑖)
1 1 𝑢−𝜇 2 𝑥(𝑖) 𝛽
𝐹(𝑥(𝑖) ) = ∫ 𝑒
− ∙(
2 𝜎
)
∙ 𝑑𝑢 𝐹(𝑥(𝑖) ) = 1 − 𝑒 −𝜆∙𝑥(𝑖) 𝐹(𝑥(𝑖) ) = 1 − 𝑒
−(
𝜂
)
√2 ∙ 𝜋 ∙ 𝜎
−∞

Repartiţia log-normală
𝑥(𝑖)
1 1 −1∙(𝑢−𝜇)2
𝐹(𝑥(𝑖) ) = ∫ 𝑒 2 𝜎 ∙ 𝑑𝑢
√2 ∙ 𝜋 ∙ 𝜎 𝑢
−∞

102
V. Se calculează şirul diferenţelor absolute dintre repartiţiile empirice ale valorilor
experimentale şi repartiţia teoretică:
+
 𝐷𝑖+ = |𝐹(𝑥(𝑖) ) − 𝑄 (𝑥(𝑖) )|;


 𝐷𝑖− = |𝐹(𝑥(𝑖) ) − 𝑄 (𝑥(𝑖) )|,

pentru 𝑖 ∈ ̅̅̅̅̅
1, 𝑛.

𝑖
𝑄 + (𝑥(𝑖) ) =
𝑛

𝑖−1
𝑄 − (𝑥(𝑖) ) =
𝑛

VI. Se determină valoarea absolută maximă, Dmax, a diferenţelor dintre repartiţia empirică
a valorilor experimentale şi repartiţia teoretică:
+
 𝐷𝑚𝑎𝑥 = max{𝐷𝑖+ };
̅̅̅̅̅
𝑖∈1,𝑛


 𝐷𝑚𝑎𝑥 = max{𝐷𝑖− }
̅̅̅̅̅
𝑖∈1,𝑛

 𝐷𝑚𝑎𝑥 = 𝑚𝑎𝑥{𝐷+ −
𝑖 , 𝐷𝑖 },

Valoarea Dmax constituie statistica testului Kolmogorov-Smirnov şi reprezintă


măsura discrepanţei dintre cele două repartiţii.
VII. Decizia statistică - dacă este îndeplinită condiţia:
Dmax  Dn, ,
Se acceptă ipoteza nulă, pentru un nivel de încredere ales (1-), adică, datele
experimentale pot fi modelate prin intermediul repartiţiei statistice alese.

Valoarea Dn, se alege din tabelul alăturat, în funcţie de:

 N – volumul eşantionului utilizat;


  - nivelul de semnificaţie ales.

103
Valorile critice ale testului Kolmogorov-Smirnov

Volumul Nivelul de semnificaţie pentru statistica 𝑫 = 𝐦𝐚𝐱|𝑭(𝒙) − 𝑸(𝑿)|


̅̅̅̅̅
𝒊∈𝟏,𝒏
eşantionului,
n 0.20 0.15 0.10 0.05 0.01
4 0.300 0.319 0.352 0.381 0.417
5 0.285 0.299 0.315 0.337 0.405
6 0.265 0.277 0.294 0.319 0.364
7 0.247 0.258 0.276 0.300 0.348
8 0.233 0.244 0.261 0.285 0.331
9 0.223 0.233 0.249 0.271 0.311
10 0.215 0.224 0.239 0.258 0.294
11 0.206 0.217 0.230 0.249 0.284
12 0.199 0.212 0.223 0.242 0.275
13 0.190 0.202 0.214 0.234 0.268
14 0.183 0.194 0.207 0.227 0261
15 0.177 0.187 0.201 0.220 0.257
16 0.1763 0.182 0.195 0.213 0.250
17 0.169 0.177 0.189 0.206 0.245
18 0.166 0.173 0.184 0.200 0.239
19 0.163 0.169 0.179 0.195 0.235
20 0.160 0.166 0.174 0.190 0.231
25 0.149 0.153 0.165 0.180 0.203
30 0.131 0.136 0.144 0.161 0.187

𝟎. 𝟕𝟑𝟔 𝟎. 𝟕𝟔𝟖 𝟎. 𝟖𝟎𝟓 𝟎. 𝟖𝟖𝟎 𝟏. 𝟎𝟑𝟏


n>30
√𝒏 √𝒏 √𝒏 √𝒏 √𝒏

104
APLICAȚIA 5 - Estimarea parametrilor repartiției normale

A. Metoda celor mai mici pătrate

Ca și în cazul metodelor grafice de estimare, metoda celor mai mici pătrate se bazează pe
liniarizarea convenabilă a funcției de repartiție a modelului statistic.
Această metodă constă în determinarea parametrilor unei drepte, vezi fig. 1:
𝑦 =𝐴+𝐵∙𝑥 (11.1)
ce trece printre punctele care conțin observațiile statistice, astfel încât suma pătratelor abaterilor
existente între dreapta astfel trasată și mulțimea punctelor, 𝜀𝑖 , să fie minimă (Principiul Gauss-
Legendre):
𝑛 𝑛
𝜺=∑ 𝜀𝑖2 = ∑ (𝐴 + 𝐵 ∙ 𝑥𝑖 − 𝑦𝑖 )2 = 𝑚𝑖𝑛. (11.2)
𝑖=1 𝑖=1

Punând condiția de minim relației (11.7), se obține:


𝑛 ∙ ∑𝑛𝑖=1 𝑥𝑖 ∙ 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 ∙ ∑𝑛𝑖=1 𝑦𝑖
𝐴̂ =
𝑛 ∙ ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2
. (11.3)
𝑛 ∙ ∑𝑛𝑖=1 𝑦𝑖 ∙ ∑𝑛𝑖=1 𝑥𝑖2 − ∑𝑛𝑖=1 𝑥𝑖 ∙ ∑𝑛𝑖=1 𝑥𝑖 ∙ 𝑦𝑖
𝐵̂ =
{ 𝑛 ∙ ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2

y
yn
Pn(xn,yn)
i

Pi1(xi,yi)
Pn-1(xn-1,yn-1)
yi
𝑡𝑔𝛼 = 𝐴

Pi2(xi,A+Bxi)
P2(x2,y2)
y2
P3(x3,y3
𝑦 = 𝐴 + 𝐵 𝑥
)
y1
P1(x1,y1)
B

0 x1 x2  xi  xn x

Fig. 1 Utilizarea principiului celor mai mici pătrate în cazul regresiei liniare

Liniarizarea modelului repartiției normale se poate realiza pornind de la egalitatea:

107
𝑥−𝜇
𝐹(𝑥) = Φ ( ),
𝜎
prin inversarea funcției integrale Laplace:
𝑥 𝜇
Φ−1 [𝐹(𝑥)] = − . (11.4)
𝜎 𝜎
Ecuația (11.4) reprezintă ecuația unei drepte, (11.1), dacă considerăm următoarele relații de
echivalență:
𝑦 = Φ−1 [𝐹(𝑥)]
𝜇
𝐴=−
𝜎 . (11.5)
1
{𝐵 = 𝜎
Ultimele două relații din sistemul (11.5) ne furnizează și regulile pentru trasarea rețelei de
probabilitate normală:
1
𝜎̂ =
{ 𝐵̂ .
𝜇̂ = −𝐴̂ ∙ 𝜎̂

B. Metoda momentelor

Pe baza unui eșantion de volum 𝑛, prelevat dintr-o populație normal repartizată:


𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 ,
estimațiile prin metoda momentelor se obțin prin aplicarea principiului acestei metode:
𝜇=𝑚
{𝜇 = 𝑚 , (11.6)
2 2
adică egalarea primelor două momente teoretice cu cele de eșantionaj.
Dar:
𝜎 2 = 𝜇2 − 𝜇 2
𝑠 2 = 𝑚2 − 𝑚 2 ,
iar ecuațiile (11.6), devin:
𝜇=𝑚
{ 2 , (11.7)
𝜎 = 𝑠2
și expresiile estimațiilor punctuale prin metoda momentelor, sunt:
𝑛
1
𝜇̂ = ∙ ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛 , (11.8)
1
𝜎̂ 2 = ∙ ∑(𝑥𝑖 − 𝜇̂ )2
{ 𝑛 − 1
𝑖=1

108
C. Metoda verosimilității maxime

Aceasta metodă a fost dezvoltată de R.A. Fisher, care a introdus conceptul de funcție de
verosimilitate pentru un eșantion de 𝑛 observații independente:
𝑛

ℒ(𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 , 𝚯) = ∏ 𝑓(𝑥𝑖 , 𝚯). (11.9)


𝑖=1

Pentru comoditatea calcului se obișnuiește a se lucra cu logaritmul funcției de verosimilitate:


𝑙𝑛[ℒ(𝑥𝑖 , 𝚯)] = 𝑙𝑛𝑓(𝑥1 , 𝚯) + 𝑙𝑛𝑓(𝑥2 , 𝚯) + ⋯ + 𝑙𝑛𝑓(𝑥𝑛 , 𝚯). (11.10)
Estimațiile de verosimilitate maximă reprezintă, deci, soluțiile următorului sistem de ecuații
normale:
𝜕𝑙𝑛[ℒ(𝑥𝑖 , 𝚯)] 1 𝜕𝑙𝑛𝑓(𝑥1 , 𝚯) 1 𝜕𝑙𝑛𝑓(𝑥𝑛 , 𝚯)
= ∙ + ⋯+ ∙ ,
𝜕𝜃𝑗 𝑓(𝑥1 , 𝚯) 𝜕𝜃𝑗 𝑓(𝑥𝑛 , 𝚯) 𝜕𝑓(𝑥𝑛 , 𝚯) (11.11)
𝑖 = ̅̅̅̅̅
1, 𝑛 și 𝑗 = ̅̅̅̅̅
1, 𝑞.
Pe baza unui eșantion de volum 𝑛, prelevat dintr-o populație normal repartizată:
𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 ,
funcția de verosimilitate, sau densitatea de probabilitate a datelor de eșantionaj, este:
𝑛

ℒ(𝑥𝑖 , μ, σ) = ∏ 𝑓(𝑥𝑖 , μ, σ) =
𝑖=1
1 1 𝑥1 −𝜇 2 1 1 𝑥𝑖 −𝜇 2 1 1 𝑥𝑛 −𝜇 2
𝑒 −2∙( )
𝑒 −2∙( )
𝑒 −2∙( ) (11.12)
= 𝜎 ⋯ 𝜎 ⋯ 𝜎 =
𝜎 ∙ √2 ∙ 𝜋 𝜎 ∙ √2 ∙ 𝜋 𝜎 ∙ √2 ∙ 𝜋
1 −
1
∙∑𝑛 (𝑥 −𝜇)2
= 𝑛∙𝑒 2∙𝜎2 𝑖=1 𝑖
(2 ∙ 𝜋 ∙ 𝜎 2 ) 2
Logaritmul funcției de verosimilitate, 𝑙𝑛ℒ(𝑥𝑖 , μ, σ), se obține logaritmând ecuația (11.12):
𝑛
𝑛 1
𝑙𝑛ℒ(𝑥𝑖 , μ, σ) = − ∙ 𝑙𝑛(2 ∙ 𝜋 ∙ 𝜎 2 ) − ∙ ∑(𝑥𝑖 − 𝜇)2 .
2 2 ∙ 𝜎2
𝑖=1
Estimațiile punctuale de verosimilitate maximă se obțin din condiția de maxim a ecuației
anterioare:
𝑛
𝜕𝑙𝑛ℒ(𝑥𝑖 , μ, σ) 1
= − 2 ∙ ∑(𝑥𝑖 − 𝜇) = 0
𝜕𝜇 𝜎
𝑖=1
𝑛
𝜕𝑙𝑛ℒ(𝑥𝑖 , μ, σ) 𝑛 1
2)
= − 2
+ 4
∙ ∑(𝑥𝑖 − 𝜇)2 = 0
{ 𝜕(𝜎 2 ∙ 𝜎 2 ∙ 𝜎
𝑖=1
Rezolvând acest sistem de ecuații, obținem:

109
𝑛
1
𝜇̂ = ∙ ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛 , (11.13)
1
𝜎̂ 2 = ∙ ∑(𝑥𝑖 − 𝜇̂ )2
{ 𝑛
𝑖=1

Ecuațiile (11.13) reprezintă estimațiile punctuale, de verosimilitate maximă, a parametrilor


repartiției normale.

D. Intervale de încredere pentru medie

Cazul 2 – valoarea dispersiei este necunoscută, dar este estimată, 𝑠̂ 2 , pe baza unui eșantion de
volum mare.
Considerăm un eșantion de volum 𝑛, prelevat dintr-o populație normal repartizată:
𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 ,
cu valoarea parametrului 𝜎, necunoscută.
Dacă volumul de eșantion este mare (𝑛 ≥ 30), atunci variabila aleatorie:
𝑋̅ − 𝜇
~𝒩(𝑧, 0,1), (11.14)
𝑠⁄√𝑛
unde:
𝑛
2
1
𝑠 = ∙ ∑(𝑥𝑖 − 𝜇̂ )2 .
𝑛−1
𝑖=1

Intervalul de încredere, [𝜇𝐿 , 𝜇𝑈 ] ce conține valoarea adevărată a parametrului 𝜇, cu o


probabilitate (1 − 𝛼), reprezintă soluția ecuației:
𝑃𝑟(𝜇𝐿 ≤ 𝜇 ≤ 𝜇𝑈 ) = 1 − 𝛼. (11.15)
Deci, pe baza relației (11.14), ecuația (11.15), devine:
𝑋̅ − 𝜇
𝑃𝑟 (𝑧𝛼 ≤ ≤ 𝑧1−𝛼 ) = 1 − 𝛼.
2 𝑠⁄√𝑛 2

Prelucrând ecuația anterioară, rezultă:


𝑃𝑟 (𝑥̅ + 𝑧𝛼 ∙ 𝑠⁄√𝑛 ≤ 𝜇 ≤ 𝑥̅ − 𝑧1−𝛼 ∙ 𝑠⁄√𝑛) = 1 − 𝛼,
2 2
dar:
−𝑧𝛼 = 𝑧1−𝛼
2 2
și intervalul de încredere, [𝜇𝐿 , 𝜇𝑈 ], bilateral simetric, ce conține valoarea adevărată a
parametrului 𝜇, cu o probabilitate (1 − 𝛼), este:

[𝑥̅ + 𝑧𝛼 ∙ 𝑠⁄√𝑛 ≤ 𝜇 ≤ 𝑥̅ − 𝑧𝛼 ∙ 𝑠⁄√𝑛]. (11.16)


2 2

110
E. Intervale de încredere pentru dispersie și abaterea standard

Considerăm un eșantion de volum 𝑛, prelevat dintr-o populație normal repartizată:


𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 ,
cu parametrii 𝜇 și 𝜎 necunoscuți, atunci variabila aleatorie:

2
(𝑛 − 1) ∙ 𝑠 2
𝜒 = , (11.17)
𝜎2
este repartizată hi-pătrat cu 𝜈 = (𝑛 − 1) grade de libertate.
Intervalul de încredere, [𝜎𝐿2 , 𝜎𝑈2 ] ce conține valoarea adevărată a parametrului 𝜎 2 , cu o
probabilitate (1 − 𝛼), reprezintă soluția ecuației:
𝑃𝑟(𝜎𝐿2 ≤ 𝜎 2 ≤ 𝜎𝑈2 ) = 1 − 𝛼. (11.18)
Deci, pe baza relației (12.17), ecuația (12.18), devine:
2
(𝑛 − 1) ∙ 𝑠 2 2
𝑃𝑟 (𝜒𝛼,𝑛−1 ≤ 2
≤ 𝜒1− 𝛼 ) = 1 − 𝛼.
2 𝜎 2
,𝑛−1

Prelucrând ecuația anterioară, rezultă:


(𝑛 − 1) ∙ 𝑠 2 2
(𝑛 − 1) ∙ 𝑠 2
𝑃𝑟 ( 2 ≤𝜎 ≤ ) = 1 − 𝛼,
𝜒 𝛼 𝜒𝛼2
1− 2 ,𝑛−1 2 ,𝑛−1

și intervalul de încredere, [𝜎𝐿2 , 𝜎𝑈2 ], bilateral simetric, ce conține valoarea adevărată a


parametrului 𝜎 2 , cu o probabilitate (1 − 𝛼), este:

(𝑛 − 1) ∙ 𝑠 2 (𝑛 − 1) ∙ 𝑠 2
[ ≤ 𝜎2 ≤ ]. (11.19)
𝜒2 𝛼 𝜒𝛼2
1− 2 ,𝑛−1 2 ,𝑛−1
Rezultă:
intervalul de încredere, [𝜎𝐿 , 𝜎𝑈 ], bilateral simetric, ce conține valoarea adevărată a
parametrului 𝜎, cu o probabilitate (1 − 𝛼), este:

(𝑛 − 1) ∙ 𝑠 2 (𝑛 − 1) ∙ 𝑠 2
[√ ≤𝜎≤√ ]. (11.20)
𝜒2 𝛼 𝜒𝛼2
1− 2 ,𝑛−1 2 ,𝑛−1

111
Anexa I Funcții Excel 2010 (2013)

Tabelul I.1 Funcții statistice

Funcția EXCEL: Valoarea returnată


 Sort : Sortează, valorile marcate, în ordine crescătoare sau
descrescătoare

 Implicit, calculează suma valorilor marcate. Funcția poate


fi utilizată și ca alternativă pentru funcțiile: AVERAGE,
COUNT, MAX și MIN.
 𝑰𝑭(𝒆𝒙𝒑. 𝒄𝒐𝒏𝒅, 𝒆𝒙𝒑𝟏, 𝒆𝒙𝒑𝟐)  Dacă 𝑒𝑥𝑝. 𝑐𝑜𝑛𝑑 este adevărată, atunci funcția 𝐼𝐹
returnează valoarea expresiei 𝑒𝑥𝑝1.
 Dacă 𝑒𝑥𝑝. 𝑐𝑜𝑛𝑑 este falsă, atunci funcția 𝐼𝐹 returnează
valoarea expresiei 𝑒𝑥𝑝2.
 𝑨𝑩𝑺(… ) Returnează valoarea absolută (modulul) a argumentului.
 𝑨𝑽𝑬𝑹𝑨𝑮𝑬(… ) Calculează media aritmetică (𝑚) a valorilor marcate:
𝑛
1
𝑚 = ∙ ∑ 𝑥𝑖
𝑛
𝑖=1

 𝑩𝑰𝑵𝑶𝑴. 𝑫𝑰𝑺𝑻(𝒌, 𝒏, 𝒑, 𝒄) Calculează valoarea funcției de repartiție binomiale cu


următorii parametri: 𝑘 succese din 𝑛 extrageri binomiale
având probabilitatea de succes 𝑝 și 𝑐 = 1 sau 𝑐 = ”True”:
𝑘

𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑘) = ∑ 𝐶𝑛𝑘 ∙ 𝑝𝑘 ∙ (1 − 𝑝)𝑛−𝑘 .


𝑥=0
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
de probabilitate a repartiției binomiale pentru 𝑘 succese din
𝑛 extrageri binomiale având probabilitatea de succes 𝑝:
𝑃𝑟(𝑋 = 𝑘) = 𝐶𝑛𝑘 ∙ 𝑝𝑘 ∙ (1 − 𝑝)𝑛−𝑘 .
 𝑩𝑰𝑵𝑶𝑴. 𝑰𝑵𝑽(𝒏, 𝜶, 𝒑) Returnează cuantila, 𝑥𝛼 , a repartiției binomiale de
parametri 𝑛 și 𝑝, corespunzătoare unei probabilități 𝛼.
Aceasta reprezintă cel mai mic întreg pentru care este
valabilă inegalitatea:
𝑥𝑝
𝑛!
∑ ∙ 𝑝𝑘 ∙ (1 − 𝑝)𝑛−𝑘 ≥ 𝛼.
(𝑛
𝑘! ∙ − 𝑘)!
𝑘=0

 𝑪𝑯𝑰𝑺𝑸. 𝑫𝑰𝑺𝑻(𝒙, , 𝒄) Calculează valoarea funcției de repartiție hi-pătrat, având


numărul gradelor de libertate,  și 𝑐 = 1 sau 𝑐 = "True":

115
Tabelul I.1 (continuare) Funcții statistice

Funcția EXCEL: Valoarea returnată


𝑥 𝜈−2
𝑢 2 1
𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥) = ∫ 𝜈 ∙ 𝑒 −2∙𝑢 ∙ 𝑑𝑢.
𝜈
0 22 ∙ Γ (2)
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
densitate de probabilitate a repartiției hi-pătrat, având
numărul gradelor de libertate, :
𝜈−2
𝑥 2 1
𝑓(𝑥) = 𝜈 ∙ 𝑒 −2∙𝑥 .
𝜈
22 ∙ Γ (2)

 𝑪𝑯𝑰𝑺𝑸. 𝑰𝑵𝑽(𝜶, ) 2
Returnează cuantilele repartiției hi-pătrat, 𝜒𝛼,𝜈 , având
numărul gradelor de libertate, , corespunzătoare unei
probabilități 𝛼, ca soluție a ecuației:
2
𝜒𝛼,𝜈 𝜈−2
𝑢 2 1
∫ 𝜈 ∙ 𝑒 −2∙𝑢 ∙ 𝑑𝑢 = 𝛼
𝜈
0 22 ∙ Γ (2)

 𝑪𝑶𝑴𝑩𝑰𝑵(𝒏, 𝒌) Calculează valoarea:


𝑛!
𝐶𝑛𝑘 = .
𝑘! ∙ (𝑛 − 𝑘)!
 𝑪𝑶𝑵𝑭𝑰𝑫𝑬𝑵𝑪𝑬. 𝑵𝑶𝑹𝑴(𝜶, 𝒔, 𝒏) Returnează valoarea:
sau forma: 𝑧𝛼 ∙ 𝑠⁄√𝑛,
2
𝑪𝑶𝑵𝑭𝑰𝑫𝑬𝑵𝑪𝑬(𝜶, 𝒔, 𝒏), ce permite calculul intervalului de încredere (1 − 𝛼)% a
existentă la variantele anterioare de valorii medii de eșantionaj pentru un eșantion de volum 𝑛,
Excel. având abaterea standard 𝑠, utilizând cuantilele repartiției
normale, 𝑧𝛼⁄2 .
 𝑪𝑶𝑵𝑭𝑰𝑫𝑬𝑵𝑪𝑬. 𝑻(𝜶, 𝒔, 𝒏) Returnează valoarea:
𝑡1−𝛼,𝑛−1 ∙ 𝑠⁄√𝑛,
2
ce permite calculul intervalului de încredere (1 − 𝛼)% a
valorii medii de eșantionaj pentru un eșantion de volum 𝑛,
având abaterea standard 𝑠, utilizând cuantilele repartiției
Student, 𝑡1−𝛼⁄2,𝑛−1 .
 𝑪𝑶𝑼𝑵𝑻(… ) Returnează numărul de celule ce conțin informații din
domeniul marcat.
 𝑪𝑶𝑼𝑵𝑻𝑰𝑭(𝒅𝒐𝒎, ”𝒆𝒙𝒑”) Returnează numărul de celule ce conțin informații de tipul
“𝑒𝑥𝑝” din domeniul marcat (𝑑𝑜𝑚).
 𝑪𝑶𝑹𝑹𝑬𝑳(𝒙𝒊 , 𝒚𝒊 ) Returnează valoarea coeficientului de corelație calculat pe
baza a două mulțimi de numere, 𝑥𝑖 și 𝑦𝑖 :
∑𝑖(𝑥𝑖 − 𝑥̅ ) ∙ (𝑦𝑖 − 𝑦̅)
𝜌(𝑋, 𝑌) =
√∑𝑖(𝑥𝑖 − 𝑥̅ )2 ∙ ∑𝑖(𝑦𝑖 − 𝑦̅)2 ∙

116
Tabelul I.1 (continuare) Funcții statistice

Funcția EXCEL: Valoarea returnată


 𝑪𝑶𝑽𝑨𝑹𝑰𝑨𝑵𝑪𝑬. 𝑷(𝒙𝒊 , 𝒚𝒊 ) Returnează valoarea covarianței populației calculată pe
baza a două mulțimi de numere, 𝑥𝑖 și 𝑦𝑖 :
∑𝑁𝑖=1(𝑥𝑖 − 𝑥̅ ) ∙ (𝑦𝑖 − 𝑦
̅)
𝐶𝑜𝑣(𝑋, 𝑌) = .
𝑁
 𝑪𝑶𝑽𝑨𝑹𝑰𝑨𝑵𝑪𝑬. 𝑺(𝒙𝒊 , 𝒚𝒊 ) Returnează valoarea de eșantionaj a covarianței calculată
pe baza a două mulțimi de numere, 𝑥𝑖 și 𝑦𝑖 :
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ ) ∙ (𝑦𝑖 − 𝑦̅)
𝐶𝑜𝑣(𝑋, 𝑌) = .
𝑛−1
 𝑭𝑨𝑪𝑻(𝒏, ) Calculează valoarea:
𝑛!.
 𝑭𝑹𝑬𝑸𝑼𝑬𝑵𝑪𝒀(𝒗. 𝒆𝒔, 𝒍𝒊𝒎. 𝒄𝒍) Funcția determină frecvențele absolute ale unui șir de valori
de eșantionaj (v.es) organizate în 𝑘 clase având limitele
superioare lim.cl.
Pentru a determina frecvențele absolute comanda este:
[𝐶𝑡𝑟𝑙] + [𝑆ℎ𝑖𝑓𝑡] + [𝐸𝑛𝑡𝑒𝑟].
 𝑭. 𝑫𝑰𝑺𝑻(𝒙, 𝝂𝟏 , 𝝂𝟐 , 𝒄) Calculează valoarea funcției de repartiție Fisher-
sau forma: Snedecor, având numărul gradelor de libertate 1 și 2,
precum și 𝑐 = 1 sau 𝑐 = "True":
𝑭𝑫𝑰𝑺𝑻(𝒙, 𝝂𝟏 , 𝝂𝟐 ),
𝐹(𝑓) = 𝑃𝑟(𝐹 ≤ 𝑓) =
existentă la variantele anterioare de
𝜈 +𝜈 𝜈1 𝜈2 𝑓 𝜈1
Excel. Γ ( 1 2 2 ) ∙ 𝜈1 2 ∙ 𝜈2 2 𝑢 2 −1
= 𝜈 𝜈 ∙∫ 𝜈1 +𝜈2 ∙ 𝑑𝑢
Γ ( 21 ) ∙ Γ ( 22 ) 0 (𝜈2 + 𝜈1 ∙ 𝑢) 2

Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției


densitate de probabilitate a repartiției 𝐹, având 1 și 2
grade de libertate:
𝜈 +𝜈 𝜈1 𝜈2 𝜈1
Γ ( 1 2 2 ) ∙ 𝜈1 2 ∙ 𝜈2 2 𝑓 2 −1
𝑓(𝑓) = 𝜈 𝜈 ∙ 𝜈1 +𝜈2 .
Γ ( 21 ) ∙ Γ ( 22 ) (𝜈2 + 𝜈1 ∙ 𝑓) 2

 𝑭. 𝑰𝑵𝑽(𝜶, 𝝂𝟏 , 𝝂𝟐 ) Returnează cuantilele repartiției Fisher-Snedecor, 𝑓𝛼,𝜈1 ,𝜈2 ,


sau forma: având 1 și 2 grade de libertate, corespunzătoare unei
probabilități 𝛼, ca soluție a ecuației:
𝑭𝑰𝑵𝑽(𝜶, 𝝂𝟏 , 𝝂𝟐 ), 𝜈1 𝜈2 𝑓𝛼,𝜈1,𝜈2
𝜈 +𝜈 𝜈1
existentă la variantele anterioare de Γ ( 1 2 2 ) ∙ 𝜈1 2 ∙ 𝜈2 2 𝑢 2 −1
Excel. 𝜈 𝜈 ∙ ∫ 𝜈1 +𝜈2 ∙ 𝑑𝑢 =
Γ ( 21 ) ∙ Γ ( 22 ) 0 (𝜈2 + 𝜈1 ∙ 𝑢) 2

=𝛼
 𝑮𝑨𝑴𝑴𝑨(𝒙) Returnează valorile funcției integrale gama:

Γ(𝑥) = ∫ 𝑡 𝑥−1 ∙ 𝑒 −𝑡 ∙ 𝑑𝑡
0

117
Tabelul I.1 (continuare) Funcții statistice

Funcția EXCEL: Valoarea returnată


 𝑯𝑰𝑷𝑬𝑹𝑮𝑬𝑶𝑴. 𝑫𝑰𝑺𝑻(𝒌, 𝒏, 𝒂, 𝑵, 𝒄) Calculează valoarea funcției de repartiție hipergeometrice
cu următorii parametri: 𝑘 succese din 𝑛 extrageri binomiale
fără revenire, dintr-o populație de volum N, în care există
𝑎 indivizi a căror extragere este considerată succes și 𝑐 =
1 sau 𝑐 = ”True”:
𝑘
𝐶𝑡𝑎 ∙ 𝐶𝑛−𝑡
𝑁−𝑎
𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑘) = ∑ 𝑛 .
𝑡=0
𝐶𝑁
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
de probabilitate a repartiției hipergeometrice:
𝐶𝑘𝑎 ∙ 𝐶𝑛−𝑘
𝑁−𝑎
𝑃𝑟(𝑋 = 𝑘) = 𝑛 .
𝐶𝑁
 𝑰𝑵𝑻𝑬𝑹𝑪𝑬𝑷𝑻(𝒙𝒊 , 𝒚𝒊 ) Determină parametrul 𝐴 al dreprei de regresie:
𝑦 =𝐴+𝐵∙𝑥
trasate printre norul de puncte având coordonatele
(𝑥𝑖 , 𝑦𝑖 ), 𝑖 = ̅̅̅̅̅
1, 𝑛:
∑𝑖 𝑦𝑖 ∙ ∑𝑖 𝑥𝑖2 − ∑𝑖 𝑥𝑖 ∙ ∑𝑖 𝑥𝑖 ∙ 𝑦𝑖
𝐴= .
𝑛 ∙ ∑𝑖 𝑥𝑖2 − (∑𝑖 𝑥𝑖 )2

 𝑲𝑼𝑹𝑻(… ) Returnează valoarea coeficientului de boltire, 𝐺4 , al


valorilor indicate ca argument, utilizând expresia de calcul:
𝑛 ∙ (𝑛 + 1)
𝐺4 = ∙
(𝑛 − 1) ∙ (𝑛 − 2) ∙ (𝑛 − 3)
𝑛
𝑥𝑖 − 𝑚 4 3 ∙ (𝑛 − 1)2
∙ ∑( ) − .
𝑠 (𝑛 − 2) ∙ (𝑛 − 3)
𝑖=1
 𝑳𝑶𝑮𝑵𝑶𝑹𝑴. 𝑫𝑰𝑺𝑻(𝒙, 𝝁, 𝝈, 𝒄) Calculează valoarea funcției de repartiție log-normale,
având parametrii 𝜇 și 𝜎, pentru valoarea 𝑥 a variabilei
aleatorii și 𝑐 = 1 sau 𝑐 = ”True”:
𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥) =
𝑥
1 1 1 𝑙𝑛𝑢−𝜇 2
= ∫ ∙ 𝑒 −2∙( 𝜎 ) ∙ 𝑑𝑢
𝜎 ∙ √2 ∙ 𝜋 𝑥
0
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
densitate de probabilitate a repartiției log-normale pentru
valoarea 𝑥 a variabilei aleatorii:
1 1 −1∙(𝑙𝑛𝑥−𝜇)2
𝑓(𝑥) = ∙
∙𝑒 2 𝜎 .
𝜎 ∙ √2 ∙ 𝜋 𝑥
 𝑳𝑶𝑮𝑵𝑶𝑹𝑴. 𝑰𝑵𝑽(𝜶, 𝝁, 𝝈) Returnează cuantilele repartiției log-normale, 𝑥𝛼,𝜇,𝜎 , de
parametri 𝜇 și 𝜎, corespunzătoare unei probabilități 𝛼.
Acestea reprezintă soluția ecuației:

118
Tabelul I.1 (continuare) Funcții statistice

Funcția EXCEL: Valoarea returnată


𝑥𝛼,𝜇,𝜎
1 1 −1∙(𝑙𝑛𝑢−𝜇)2
∫ ∙𝑒 2 𝜎 ∙ 𝑑𝑢 = 𝛼.
𝜎 ∙ √2 ∙ 𝜋 𝑥
0
 𝑴𝑨𝑿(… ) Returnează valoarea maximă a valorilor din domeniul
indicat ca argument al funcției.
 𝑴𝑬𝑫𝑰𝑨𝑵(… ) Returnează valoarea medianei de eșantionaj pe baza
valorilor indicate ca argument al funcției.
 𝑴𝑰𝑵(… ) Returnează valoarea minimă a valorilor din domeniul
indicat ca argument al funcției.

 𝑵𝑶𝑹𝑵. 𝑫𝑰𝑺𝑻(𝒙, 𝝁, 𝝈, 𝒄) Calculează valoarea funcției de repartiție normale, având


media 𝜇 și abaterea medie pătratică 𝜎, pentru valoarea 𝑥 a
sau forma:
variabilei aleatorii și 𝑐 = 1 sau 𝑐 = ”True”:
𝑵𝑶𝑹𝑴𝑫𝑰𝑺𝑻(𝒙, 𝝁, 𝝈, , 𝒄), 𝑥
1 1 𝑢−𝜇 2
existentă la variantele anterioare de 𝐹(𝑥) = ∫ 𝑒 −2∙( 𝜎
)
∙ 𝑑𝑢.
Excel. 𝜎 ∙ √2 ∙ 𝜋
−∞
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
densitate de probabilitate a repartiției normale, având
media 𝜇 și abaterea medie pătratică 𝜎, pentru valoarea 𝑥 a
variabilei aleatorii:
1 1 𝑥−𝜇 2
𝑒 2 𝜎 ) .
− ∙(
𝑓(𝑥) =
𝜎 ∙ √2 ∙ 𝜋
 𝑵𝑶𝑹𝑴. 𝑺. 𝑫𝑰𝑺𝑻(𝒛, 𝒄) Calculează valoarea funcției de repartiție normale normate,
având media 𝜇 = 0 și abaterea medie pătratică 𝜎 = 1,
sau forma:
pentru valoarea 𝑧 a variabilei aleatorii și 𝑐 = 1 sau 𝑐 =
𝑵𝑶𝑹𝑴𝑺𝑫𝑰𝑺𝑻(𝒛, 𝒄), ”True”:
𝑧
existentă la variantele anterioare de 1 −
𝑢2
Excel. 𝐹(𝑧) = ∫𝑒 2 ∙ 𝑑𝑢.
√2 ∙ 𝜋
−∞
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
densitate de probabilitate a repartiției normale, având
media 𝜇 = 0 și abaterea medie pătratică 𝜎 = 1, pentru
valoarea 𝑧 a variabilei aleatorii:
1 𝑧2
𝑓(𝑧) = ∙ 𝑒− 2 .
√2 ∙ 𝜋
 𝑵𝑶𝑹𝑴. 𝑰𝑵𝑽(𝜶, 𝝁, 𝝈) Calculează cuantila repartiției normale, având media 𝜇 și
abaterea medie pătratică 𝜎, pentru o valoare 𝛼 a
sau forma:
probabilității.
𝑵𝑶𝑹𝑴𝑰𝑵𝑽(𝜶, 𝝁, 𝝈), Acestea, 𝑥𝛼,𝜇,𝜎 , reprezintă soluția ecuației:
existentă la variantele anterioare de 𝑥𝛼,𝜇,𝜎
1 1 𝑢−𝜇 2
Excel. − ∙( )
∫ 𝑒 2 𝜎 ∙ 𝑑𝑢 = 𝛼
𝜎 ∙ √2 ∙ 𝜋
−∞

119
Tabelul I.1 (continuare) Funcții statistice

Funcția EXCEL: Valoarea returnată


 𝑵𝑶𝑹𝑴. 𝑺. 𝑰𝑵𝑽(𝜶) Calculează cuantila repartiției normale normate, având
media 𝜇 = 0 și abaterea medie pătratică 𝜎 = 1 pentru o
sau forma:
valoare 𝛼 a probabilității.
𝑵𝑶𝑹𝑴𝑺𝑫𝑰𝑺𝑻(𝜶), Acestea, 𝑧𝛼 , reprezintă soluția ecuației:
existentă la variantele anterioare de 𝑧𝛼
Excel. 1 𝑢2
∫ 𝑒 − 2 ∙ 𝑑𝑢 = 𝛼.
√2 ∙ 𝜋
−∞

 𝑷𝑬𝑹𝑴𝑼𝑻(𝒏, 𝒌) Calculează valoarea:


𝑛!
𝐴𝑘𝑛 = .
(𝑛 − 𝑘)!
 𝑷𝑶𝑰𝑺𝑺𝑶𝑵. 𝑫𝑰𝑺𝑻(𝒙, , 𝒄) Calculează valoarea funcției de repartiție Poisson, având
sau forma: parametrul 𝜆, pentru valoarea 𝑥 a variabilei aleatorii și 𝑐 =
1 sau 𝑐 = "True":
𝑷𝑶𝑰𝑺𝑺𝑶𝑵(𝒙, , 𝒄), 𝑥
existentă la variantele anterioare de 𝑒 −𝜆 ∙ 𝜆𝑥
𝐹(𝑥) = ∑ .
Excel. 𝑥!
𝑘=0
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
de probabilitate a repartiției Poisson, având parametrul 𝜆,
pentru valoarea 𝑥 a variabilei aleatorii:
𝑒−𝜆 ∙ 𝜆𝑥
𝑃𝑟(𝑋 = 𝑘) =
𝑥!
 𝑹𝑶𝑼𝑵𝑫(𝒗𝒂𝒍, 𝒏𝒓_𝒛𝒆𝒄) Rotunjește val la nr_zec, zecimale.

 𝑹𝑶𝑼𝑵𝑫𝑫𝑶𝑾𝑵(𝒗𝒂𝒍, 𝒏𝒓_𝒛𝒆𝒄) Rotunjește în minus val la nr_zec, zecimale.

 𝑹𝑶𝑼𝑵𝑫𝑼𝑷(𝒗𝒂𝒍, 𝒏𝒓_𝒛𝒆𝒄) Rotunjește cu plus val la nr_zec, zecimale.

 𝑺𝑳𝑶𝑷𝑬(𝒙𝒊 , 𝒚𝒊 ) Determină parametrul 𝐵 al dreprei de regresie:


𝑦 =𝐴+𝐵∙𝑥
trasate printre norul de puncte având coordonatele
(𝑥𝑖 , 𝑦𝑖 ), 𝑖 = ̅̅̅̅̅
1, 𝑛:
𝑛 ∙ ∑𝑖 𝑥𝑖 ∙ 𝑦𝑖 − ∑𝑖 𝑥𝑖 ∙ ∑𝑖 𝑦𝑖
𝐴= .
𝑛 ∙ ∑𝑖 𝑥𝑖2 − (∑𝑖 𝑥𝑖 )2

 𝑺𝑲𝑬𝑾(…) Returnează valoarea coeficientului de asimetrie, 𝐺3 , de


eșantionaj pe baza unor valori indicate ca argument al
funcției:
𝑛
𝑛 𝑥𝑖 − 𝑚 3
𝐺3 = ∙ ∑( )
(𝑛 − 1) ∙ (𝑛 − 2) 𝑠
𝑖=1

 𝑺𝑲𝑬𝑾. 𝑷(… ) Returnează valoarea coeficientului de asimetrie, 𝑔3 , al


populației pe baza unor valori indicate ca argument al
funcției:

120
Tabelul I.1 (continuare) Funcții statistice

Funcția EXCEL: Valoarea returnată

1 ∑𝑁𝑖=1(𝑥𝑖 − 𝑥̅ )
3
𝑔3 = ∙ .
𝑁 𝑠3
 𝑺𝑻𝑫𝑬𝑽. 𝑷(… ) Calculează abaterea medie pătratică a populației (𝜎) a
sau forma: valorilor indicate, 𝑥𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑛:

𝑺𝑻𝑫𝑬𝑽𝑷(… ), 𝑛
1
existentă la variantele anterioare de 𝜎 = √ ∙ ∑(𝑥𝑖 − 𝑚)2 ,
𝑛
Excel. 𝑖=1

unde 𝑚, reprezintă valoarea medie a datelor.


 𝑺𝑻𝑫𝑬𝑽. 𝑺(… ) Calculează abaterea medie pătratică de eșantionaj (𝑠) a
sau forma: valorilor indicate, 𝑥𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑛:

𝑺𝑻𝑫𝑬𝑽(… ), 𝑛
1
existentă la variantele anterioare de 𝑠=√ ∙ ∑(𝑥𝑖 − 𝑚)2 ,
𝑛−1
Excel. 𝑖=1

unde 𝑚, reprezintă valoarea medie de eșantionaj.


 𝑻. 𝑫𝑰𝑺𝑻(𝒙, , 𝒄) Calculează valoarea funcției de repartiție Student t, având
sau forma: numărul gradelor de libertate  și 𝑐 = 1 sau 𝑐 = "True":
𝑻𝑫𝑰𝑺𝑻(𝒙, , 𝒄), 𝜈+1 𝑡 𝜈+1
− 2
Γ( 2 ) 𝑢2
existentă la variantele anterioare de 𝐹(𝑡) = 𝜈 ∙ ∫ ( + 1) ∙ 𝑑𝑢.
Excel. √𝜋 ∙ 𝜈 ∙ Γ (2) −∞ 𝜈
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
densitate de probabilitate a repartiției Student t, având
numărul gradelor de libertate :
𝜈+1 𝜈+1
− 2
Γ( 2 ) 𝑡2
𝑓(𝑡) = 𝜈 ∙ ( 𝜈 + 1) .
√𝜋 ∙ 𝜈 ∙ Γ (2)

 𝑻. 𝑰𝑵𝑽(𝜶, ) Returnează cuantilele repartiției Student, 𝑡𝛼,𝜈 , având 


sau forma: grade de libertate, corespunzătoare unei probabilități 𝛼, ca
𝑻𝑰𝑵𝑽(𝒙, ), soluție a ecuației:
existentă la variantele anterioare de 𝜈+1 𝑡𝛼,𝜈

𝜈+1
Excel. Γ( 2 ) 𝑢2 2
𝜈 ∙ ∫ ( + 1) ∙ 𝑑𝑢 = 𝛼
√𝜋 ∙ 𝜈 ∙ Γ (2) −∞ 𝜈
 𝑽𝑨𝑹. 𝑷(… ) Calculează dispersia de populației (𝜎 2 ) a valorilor indicate,
sau forma: 𝑥𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑛:
𝑛
𝑺𝑻𝑫𝑬𝑽𝑷(… ), 1
existentă la variantele anterioare de 𝜎 = ∙ ∑(𝑥𝑖 − 𝑚)2 ,
2
𝑛
Excel. 𝑖=1
unde 𝑚, reprezintă valoarea medie.
 𝑽𝑨𝑹. 𝑺(… ) Calculează dispersia de eșantionaj (𝑠 2 ) a valorilor indicate,
sau forma: 𝑥𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑛:

121
Tabelul I.1 (continuare) Funcții statistice

Funcția EXCEL: Valoarea returnată


𝑛
 𝑺𝑻𝑫𝑬𝑽(… ), 1
2
existentă la variantele anterioare de 𝑠 = ∙ ∑(𝑥𝑖 − 𝑚)2 ,
𝑛−1
Excel. 𝑖=1
unde 𝑚, reprezintă media de eșantionaj.
 𝑷𝑬𝑹𝑪𝑬𝑵𝑻𝑰𝑳𝑬. 𝑬𝑿𝑪(𝒙𝒊 , 𝒒) Returnează cuantila 𝑥𝑞 a unui șir de valori 𝑥𝑖 , 0 < 𝑞 < 1.

 𝑸𝑼𝑨𝑹𝑻𝑰𝑳𝑬. 𝑬𝑿𝑪(𝒙𝒊 , 𝒑) Returnează quartilele 𝑥𝑞 = 𝑥0.25 , 𝑥0.50𝑞 , 𝑥0.75 ale unui șir
de valori 𝑥𝑖 , pentru valorile parametrului 𝑝 egale cu 1,2,3
Data  Data Analysis Returnează valorile frecvențelor absolute de eșantionaj
și/sau a frecvențelor relative cumulate
 Histogram
Datele de Limitele superioare ale
eșantionaj claselor, mai puțin cea a
ultimei clase

Celula unde
vor fi
returnate
frecvențele

Data  Data Analysis Returnează parametrii statistici de eșantionaj


Datele de
 Descriptive statistics
eșantionaj

Celula unde
vor fi
returnate
frecvențele

122

S-ar putea să vă placă și