Documente Academic
Documente Profesional
Documente Cultură
Metoda utilizată în cercetarea statistică presupune parcurgerea unor etape, vezi fig. 4.1:
Identificarea și Identificarea
descrierea clară a principalilor factori
problemei studiate de influență
Stabilirea volumului
Prelevarea datelor
de eșantionaj și a
de eșantionaj:
metodei de
𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛
Delimitarea populației prelevare
și a caracteristicii
/caracteristicilor
statistice
Ipoteză statistică – orice ipoteză care se face cu privire la parametrii, tipul repartiţiei unor
variabile aleatorii sau o supoziţie despre modelele probabiliste din care sunt extrase datele
analizate.
Test statistic – procedura de verificare a unei ipoteze statistice, respectiv, procedura al cărei
obiect este de a decide respingerea sau acceptarea unei ipoteze statistice.
Decizia adoptată rezultă din valoarea uneia sau mai multor statistici, adecvate, calculate pe baza
valorilor de eşantionaj. Valoarea statisticii fiind supusă variaţiilor aleatorii, există riscul de a lua o
decizie eronată.
75
„𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡ă 𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑟𝑖𝑡𝑖𝑐ă”
Valori estimate
𝑯𝟎 𝑯𝟎
Valori reale adevărată falsă
Din punct de vedere practic, pentru a verifica o anumită ipoteză statistică, este necesar a fi
parcurse următoarele etape:
Stabilirea ipotezelor:
𝑯𝟎 şi 𝑯𝟏
Stabilirea nivelului de
semnificaţie:
Se determină regula de
decizie – 𝑺:
𝒇𝑺|𝒏 (𝒙)
Colectarea datelor de
eşantionaj, 𝒏, şi
specificarea statisticii:
𝒇𝑺|𝒏 (𝒙)
Decizia statistică:
Acceptă 𝑯𝟎 ,
sau
Acceptă 𝑯𝟏 .
76
Aplicația 2 – Teste de eliminare a valorilor aberante
Etapele de rezolvare:
𝑥𝑚𝑎𝑥 = 𝑥(𝑛) ;
88
Tabelul 1 Valorile constantei de acceptare ale testului Grubbs - Smirnov
𝝃𝒏,𝟏−𝜶 𝝃𝒏,𝟏−𝜶
n n
𝜶 = 𝟎. 𝟎𝟓 𝜶 = 𝟎. 𝟎𝟐𝟓 𝜶 = 𝟎. 𝟎𝟓 𝜶 = 𝟎. 𝟎𝟐𝟓
3 1.153 1.154 22 2.603 2.758
4 1.463 1.481 23 2.624 2.780
5 1.671 1.715 24 2.644 2.802
6 1.822 1.887 25 2.663 2.822
7 1.938 2.020 30 2.745 2.908
8 2.032 2.127 35 2.812 2.978
9 2.110 2.215 40 2.868 3.036
10 2.176 2.290 45 2.915 3.085
11 2.234 2.355 50 2.957 3.128
12 2.285 2.412 55 2.994 3.166
13 2.331 2.462 60 3.027 3.200
14 2.372 2.507 65 3.057 3.230
15 2.409 2.548 70 3.084 3.258
16 2.443 2.586 75 3.109 3.283
17 2.475 2.620 80 3.132 3.306
18 2.504 2.652 85 3.153 3.328
19 2.531 2.681 90 3.173 3.348
20 2.557 2.708 95 3.192 3.366
21 2.580 2.734 100 3.210 3.384
89
Aplicația 3 – Calculul și construcția histogramei și a funcției
empirice de repartiție
92
𝑦1 𝑦2 … 𝑦𝑗 𝑦𝑗+1 … 𝑦𝑘+1
w w w
∑ 𝑁𝑗 = 𝑛
𝑗=1
𝑁𝑗′ = ∑ 𝑁𝑘
𝑘=1
∑ 𝑓𝑗 = 1
𝑗=1
𝑓𝑗′ = ∑ 𝑓𝑘
𝑘=1
93
𝑁𝑗 𝑓𝑗
𝑋
𝑦1 = 𝑥(1) 𝑦𝑗 𝑦𝑗+1 𝑦𝑘+1 = 𝑥(𝑛)
𝑁𝑗′ 𝑓𝑗′
𝑛/1
𝑋
𝑦1 = 𝑥(1) 𝑦𝑗 𝑦𝑗+1 𝑦𝑘+1 = 𝑥(𝑛)
𝑠 = √𝑠 2
𝑥(𝑛+1) 𝑝𝑒𝑛𝑡𝑟𝑢 𝑛 = 𝑖𝑚𝑝𝑎𝑟
2
𝑀𝑒 = {𝑥(𝑛) + 𝑥(𝑛+1)
2 2
𝑝𝑒𝑛𝑡𝑟𝑢 𝑛 = 𝑝𝑎𝑟
2
𝑀0 = valoarea centrală a clasei cu frecvența maximă
94
c. Calculul probabilităților utilizând funcția empirică de repartiție:
𝑁𝑗 𝑓𝑗
𝑋
𝑦1 = 𝑥(1) 𝑦𝑥 𝑦𝑥+1 𝑦𝑘+1 = 𝑥(𝑛)
𝑥 − 𝑦𝑖
𝑃𝑟(𝑋 ≤ 𝑥) = ∑ 𝑓𝑖 + ∙ 𝑓𝑗
𝑤
𝑖<𝑥
𝑥 − 𝑦𝑥
𝑃𝑟(𝑋 > 𝑥) = 1 − ∑ 𝑓𝑖 − ∙ 𝑓𝑥
𝑤
𝑖<𝑥
95
APLICAȚIA 4 - TESTE DE CONCORDANŢĂ
TESTUL KOLMOGOROV-SMIRNOV
Repartiţia
Repartiţia normală Repartiţia Weibull
exponenţială
𝑥(𝑖)
1 1 𝑢−𝜇 2 𝑥(𝑖) 𝛽
𝐹(𝑥(𝑖) ) = ∫ 𝑒
− ∙(
2 𝜎
)
∙ 𝑑𝑢 𝐹(𝑥(𝑖) ) = 1 − 𝑒 −𝜆∙𝑥(𝑖) 𝐹(𝑥(𝑖) ) = 1 − 𝑒
−(
𝜂
)
√2 ∙ 𝜋 ∙ 𝜎
−∞
Repartiţia log-normală
𝑥(𝑖)
1 1 −1∙(𝑢−𝜇)2
𝐹(𝑥(𝑖) ) = ∫ 𝑒 2 𝜎 ∙ 𝑑𝑢
√2 ∙ 𝜋 ∙ 𝜎 𝑢
−∞
102
V. Se calculează şirul diferenţelor absolute dintre repartiţiile empirice ale valorilor
experimentale şi repartiţia teoretică:
+
𝐷𝑖+ = |𝐹(𝑥(𝑖) ) − 𝑄 (𝑥(𝑖) )|;
−
𝐷𝑖− = |𝐹(𝑥(𝑖) ) − 𝑄 (𝑥(𝑖) )|,
pentru 𝑖 ∈ ̅̅̅̅̅
1, 𝑛.
𝑖
𝑄 + (𝑥(𝑖) ) =
𝑛
𝑖−1
𝑄 − (𝑥(𝑖) ) =
𝑛
VI. Se determină valoarea absolută maximă, Dmax, a diferenţelor dintre repartiţia empirică
a valorilor experimentale şi repartiţia teoretică:
+
𝐷𝑚𝑎𝑥 = max{𝐷𝑖+ };
̅̅̅̅̅
𝑖∈1,𝑛
−
𝐷𝑚𝑎𝑥 = max{𝐷𝑖− }
̅̅̅̅̅
𝑖∈1,𝑛
𝐷𝑚𝑎𝑥 = 𝑚𝑎𝑥{𝐷+ −
𝑖 , 𝐷𝑖 },
103
Valorile critice ale testului Kolmogorov-Smirnov
104
APLICAȚIA 5 - Estimarea parametrilor repartiției normale
Ca și în cazul metodelor grafice de estimare, metoda celor mai mici pătrate se bazează pe
liniarizarea convenabilă a funcției de repartiție a modelului statistic.
Această metodă constă în determinarea parametrilor unei drepte, vezi fig. 1:
𝑦 =𝐴+𝐵∙𝑥 (11.1)
ce trece printre punctele care conțin observațiile statistice, astfel încât suma pătratelor abaterilor
existente între dreapta astfel trasată și mulțimea punctelor, 𝜀𝑖 , să fie minimă (Principiul Gauss-
Legendre):
𝑛 𝑛
𝜺=∑ 𝜀𝑖2 = ∑ (𝐴 + 𝐵 ∙ 𝑥𝑖 − 𝑦𝑖 )2 = 𝑚𝑖𝑛. (11.2)
𝑖=1 𝑖=1
y
yn
Pn(xn,yn)
i
Pi1(xi,yi)
Pn-1(xn-1,yn-1)
yi
𝑡𝑔𝛼 = 𝐴
Pi2(xi,A+Bxi)
P2(x2,y2)
y2
P3(x3,y3
𝑦 = 𝐴 + 𝐵 𝑥
)
y1
P1(x1,y1)
B
0 x1 x2 xi xn x
Fig. 1 Utilizarea principiului celor mai mici pătrate în cazul regresiei liniare
107
𝑥−𝜇
𝐹(𝑥) = Φ ( ),
𝜎
prin inversarea funcției integrale Laplace:
𝑥 𝜇
Φ−1 [𝐹(𝑥)] = − . (11.4)
𝜎 𝜎
Ecuația (11.4) reprezintă ecuația unei drepte, (11.1), dacă considerăm următoarele relații de
echivalență:
𝑦 = Φ−1 [𝐹(𝑥)]
𝜇
𝐴=−
𝜎 . (11.5)
1
{𝐵 = 𝜎
Ultimele două relații din sistemul (11.5) ne furnizează și regulile pentru trasarea rețelei de
probabilitate normală:
1
𝜎̂ =
{ 𝐵̂ .
𝜇̂ = −𝐴̂ ∙ 𝜎̂
B. Metoda momentelor
108
C. Metoda verosimilității maxime
Aceasta metodă a fost dezvoltată de R.A. Fisher, care a introdus conceptul de funcție de
verosimilitate pentru un eșantion de 𝑛 observații independente:
𝑛
ℒ(𝑥𝑖 , μ, σ) = ∏ 𝑓(𝑥𝑖 , μ, σ) =
𝑖=1
1 1 𝑥1 −𝜇 2 1 1 𝑥𝑖 −𝜇 2 1 1 𝑥𝑛 −𝜇 2
𝑒 −2∙( )
𝑒 −2∙( )
𝑒 −2∙( ) (11.12)
= 𝜎 ⋯ 𝜎 ⋯ 𝜎 =
𝜎 ∙ √2 ∙ 𝜋 𝜎 ∙ √2 ∙ 𝜋 𝜎 ∙ √2 ∙ 𝜋
1 −
1
∙∑𝑛 (𝑥 −𝜇)2
= 𝑛∙𝑒 2∙𝜎2 𝑖=1 𝑖
(2 ∙ 𝜋 ∙ 𝜎 2 ) 2
Logaritmul funcției de verosimilitate, 𝑙𝑛ℒ(𝑥𝑖 , μ, σ), se obține logaritmând ecuația (11.12):
𝑛
𝑛 1
𝑙𝑛ℒ(𝑥𝑖 , μ, σ) = − ∙ 𝑙𝑛(2 ∙ 𝜋 ∙ 𝜎 2 ) − ∙ ∑(𝑥𝑖 − 𝜇)2 .
2 2 ∙ 𝜎2
𝑖=1
Estimațiile punctuale de verosimilitate maximă se obțin din condiția de maxim a ecuației
anterioare:
𝑛
𝜕𝑙𝑛ℒ(𝑥𝑖 , μ, σ) 1
= − 2 ∙ ∑(𝑥𝑖 − 𝜇) = 0
𝜕𝜇 𝜎
𝑖=1
𝑛
𝜕𝑙𝑛ℒ(𝑥𝑖 , μ, σ) 𝑛 1
2)
= − 2
+ 4
∙ ∑(𝑥𝑖 − 𝜇)2 = 0
{ 𝜕(𝜎 2 ∙ 𝜎 2 ∙ 𝜎
𝑖=1
Rezolvând acest sistem de ecuații, obținem:
109
𝑛
1
𝜇̂ = ∙ ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛 , (11.13)
1
𝜎̂ 2 = ∙ ∑(𝑥𝑖 − 𝜇̂ )2
{ 𝑛
𝑖=1
Cazul 2 – valoarea dispersiei este necunoscută, dar este estimată, 𝑠̂ 2 , pe baza unui eșantion de
volum mare.
Considerăm un eșantion de volum 𝑛, prelevat dintr-o populație normal repartizată:
𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 ,
cu valoarea parametrului 𝜎, necunoscută.
Dacă volumul de eșantion este mare (𝑛 ≥ 30), atunci variabila aleatorie:
𝑋̅ − 𝜇
~𝒩(𝑧, 0,1), (11.14)
𝑠⁄√𝑛
unde:
𝑛
2
1
𝑠 = ∙ ∑(𝑥𝑖 − 𝜇̂ )2 .
𝑛−1
𝑖=1
110
E. Intervale de încredere pentru dispersie și abaterea standard
2
(𝑛 − 1) ∙ 𝑠 2
𝜒 = , (11.17)
𝜎2
este repartizată hi-pătrat cu 𝜈 = (𝑛 − 1) grade de libertate.
Intervalul de încredere, [𝜎𝐿2 , 𝜎𝑈2 ] ce conține valoarea adevărată a parametrului 𝜎 2 , cu o
probabilitate (1 − 𝛼), reprezintă soluția ecuației:
𝑃𝑟(𝜎𝐿2 ≤ 𝜎 2 ≤ 𝜎𝑈2 ) = 1 − 𝛼. (11.18)
Deci, pe baza relației (12.17), ecuația (12.18), devine:
2
(𝑛 − 1) ∙ 𝑠 2 2
𝑃𝑟 (𝜒𝛼,𝑛−1 ≤ 2
≤ 𝜒1− 𝛼 ) = 1 − 𝛼.
2 𝜎 2
,𝑛−1
(𝑛 − 1) ∙ 𝑠 2 (𝑛 − 1) ∙ 𝑠 2
[ ≤ 𝜎2 ≤ ]. (11.19)
𝜒2 𝛼 𝜒𝛼2
1− 2 ,𝑛−1 2 ,𝑛−1
Rezultă:
intervalul de încredere, [𝜎𝐿 , 𝜎𝑈 ], bilateral simetric, ce conține valoarea adevărată a
parametrului 𝜎, cu o probabilitate (1 − 𝛼), este:
(𝑛 − 1) ∙ 𝑠 2 (𝑛 − 1) ∙ 𝑠 2
[√ ≤𝜎≤√ ]. (11.20)
𝜒2 𝛼 𝜒𝛼2
1− 2 ,𝑛−1 2 ,𝑛−1
111
Anexa I Funcții Excel 2010 (2013)
115
Tabelul I.1 (continuare) Funcții statistice
𝑪𝑯𝑰𝑺𝑸. 𝑰𝑵𝑽(𝜶, ) 2
Returnează cuantilele repartiției hi-pătrat, 𝜒𝛼,𝜈 , având
numărul gradelor de libertate, , corespunzătoare unei
probabilități 𝛼, ca soluție a ecuației:
2
𝜒𝛼,𝜈 𝜈−2
𝑢 2 1
∫ 𝜈 ∙ 𝑒 −2∙𝑢 ∙ 𝑑𝑢 = 𝛼
𝜈
0 22 ∙ Γ (2)
116
Tabelul I.1 (continuare) Funcții statistice
=𝛼
𝑮𝑨𝑴𝑴𝑨(𝒙) Returnează valorile funcției integrale gama:
∞
Γ(𝑥) = ∫ 𝑡 𝑥−1 ∙ 𝑒 −𝑡 ∙ 𝑑𝑡
0
117
Tabelul I.1 (continuare) Funcții statistice
118
Tabelul I.1 (continuare) Funcții statistice
119
Tabelul I.1 (continuare) Funcții statistice
120
Tabelul I.1 (continuare) Funcții statistice
1 ∑𝑁𝑖=1(𝑥𝑖 − 𝑥̅ )
3
𝑔3 = ∙ .
𝑁 𝑠3
𝑺𝑻𝑫𝑬𝑽. 𝑷(… ) Calculează abaterea medie pătratică a populației (𝜎) a
sau forma: valorilor indicate, 𝑥𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑛:
𝑺𝑻𝑫𝑬𝑽𝑷(… ), 𝑛
1
existentă la variantele anterioare de 𝜎 = √ ∙ ∑(𝑥𝑖 − 𝑚)2 ,
𝑛
Excel. 𝑖=1
𝑺𝑻𝑫𝑬𝑽(… ), 𝑛
1
existentă la variantele anterioare de 𝑠=√ ∙ ∑(𝑥𝑖 − 𝑚)2 ,
𝑛−1
Excel. 𝑖=1
121
Tabelul I.1 (continuare) Funcții statistice
𝑸𝑼𝑨𝑹𝑻𝑰𝑳𝑬. 𝑬𝑿𝑪(𝒙𝒊 , 𝒑) Returnează quartilele 𝑥𝑞 = 𝑥0.25 , 𝑥0.50𝑞 , 𝑥0.75 ale unui șir
de valori 𝑥𝑖 , pentru valorile parametrului 𝑝 egale cu 1,2,3
Data Data Analysis Returnează valorile frecvențelor absolute de eșantionaj
și/sau a frecvențelor relative cumulate
Histogram
Datele de Limitele superioare ale
eșantionaj claselor, mai puțin cea a
ultimei clase
Celula unde
vor fi
returnate
frecvențele
Celula unde
vor fi
returnate
frecvențele
122