Documente Academic
Documente Profesional
Documente Cultură
Statistic matematic
1. Teoria seleciei
Statistica matematic se definete ca fiind tiina care se ocup cu colectarea,
prezentarea, clasificarea, analiza i interpretarea cantitativ a datelor furnizate de
experien, prin aplicarea teoriei probabilitilor. Rolul statisticii matematice este de
determina informaii ct mai precise asupra repartiiei fenomenului aleator de mas
cercetat, n scopul obinerii unor previziuni asupra desfurrii viitoare a acestuia.
Populaia statistic sau colectivitatea statistic este o mulime finit sau infinit
C de elemente cercetat din punct de vedere a uneia sau mai multor proprieti
(caracteristici statistice). Un element al acestei populaii (individ din colectivitate:
persoan, obiect, fapt, fenomen, etc.) se numete unitate statistic, iar numrul
acestor uniti (indivizii acestei colectiviti), dac este finit, se va numi volumul
populaiei (colectivitii).
O colectivitate este omogen dac este constituit din elemente care sunt
susceptibile de a avea sau de a nu avea caracteristica studiat, cu o aceeai pondere.
nelese ca proprietate comun a tuturor unitilor statistice, caracteristicile
statistice pot fi:
- caracteristici cantitative sau variabile, dac pot fi msurate (cuantificate printr-un
numr),
- caracteristici calitative sau atribute, dac nu pot fi cuantificate printr-un numr
(msurate), ci prin aprecieri de tipul bun, foarte bun, mult, puin.
Valoarea numeric a unei caracteristici cantitative, care se variaz (n general)
aleator de la o unitate statistic la alta, constituie o variabil statistic X (ce ia
pentru fiecare unitate statistic o valoare numeric).
Statistica matematic dispune de metode de organizare i prelucrare a
nregistrrilor datelor experimentale avnd ca scop s ncadreze fenomenul studiat n
una din clasele de fenomene care presupun o anumit lege teoretic i s determine
cel mai bine parametrii acestei legi. Aadar, problema central a statisticii matematice
este stabilirea legii de probabilitate pe care o urmeaz caracteristica (variabila
aleatoare) X . Din punct de vedere al teoriei probabilitilor, unei caracteristici a unei
colectiviti C i se asociaz o variabil aleatoare teoretic, ale crei valori
caracteristici numerice se vor numi caracteristici teoretice (media teoretic, dispersia
teoretic, .a.m.d.).
Dup cum variabila aleatoare este de tip discret, respectiv de tip continuu vom
avea caracteristici de tip discret (ex.: numrul copiilor dintr-o familie, numrul de
becuri care se ard dup 1000 de ore de ntrebuinare) i caracteristici de tip continuu
(ex.: rezistena la rupere a unui fir de mtase, timpii de defectare a unui numr fixat
de piese.
Cercetarea unitilor din populaia C se poate efectua printr-o observare total
sau parial.
Cercetarea total (care se face de exemplu sub form de recensmnt) este o
operaie complex, care de cele mai multe ori privete mai multe caracteristici ale
unitilor, pentru a realiza o analiz multilateral. Practic, o cercetare total se
recomand atunci cnd volumul populaiei C nu este prea mare, pentru a evita
cheltuieli ce pot depi avantajele concluziilor trase.
Cercetarea parial (selectiv) se efectueaz asupra unei submulimi
(subpopulaii) S C . Submulimea S a populaiei statistice (colectivitii) cercetate
C se numete selecie (eantion sau sondaj), numrul indivizilor ce intr n selecie se
numete volumul seleciei (eantionului sau sondajului). Un eantion format din cel
mult 30 de uniti statistice poart denumirea de eantion mic, altfel eantionul este
considerat ca fiind unul mare.
De exemplu, dac este solicitat opinia unei popula ii ntr-o problem oarecare
este dificil s fie consultat ntreaga populaie i se recurge la extragerea unui
eantion (operaie de sondaj).
n cazul cnd operaia de selecie (sondaj) se efectueaz dintr-o populaie
omogen, ea se numete operaie de selecie (sondaj) simpl.
n cazul cnd populaia C nu este omogen din punct de vedere al caracteristicii
(proprietii) cercetate, dar poate fi mprit n subpopulaii Ci, fiecare n parte
omogen, ca nite straturi ale populaiei C, se va efectua aa numita operaie de
selecie (sondaj) stratificat. De exemplu, dac un anumit tip de piese sunt produse
ntr-o secie de producie, dar de diferite strunguri, se recomand ca selec ia s se
efectueze pentru fiecare strung n parte.
Un eantion ale crui uniti au fost alese la ntmplare se numete eantion
reprezentativ (aleator). Extragerea unui eantion reprezentativ se realizeaz astfel
nct elementele s aib anse egale de a fi extrase. n multe situa ii se folosesc
numere aleatoare. Astfel, dac pentru o list a populaiei iniiale de volum N : x1, x2, .
. . , xN , se aleg n numere aleatoare (dintr-un tabel de asemenea numere): k1, k2, . . . ,
x , x ,..., xkn
kn ntre 1 i N , atunci un eantion aleator de volum n este: k1 k2
. De exemplu,
dac din 10000 de piese se aleg 100 n vederea controlului de calitate, se spune c
volumul colectivitii este N 10000 , iar volumul eantionului este n 100 .
Prin sondaj, se obine un ir de valori ale variabilei aleatoare statistice X.
O operaie de selecie se numete repetat sau sondaj cu revenire (nonexhaustiv), dac dup examinarea individului (unitii de sondaj), acesta este
reintrodus n colectivitate (acesta putnd s apar din nou n procesul de construcie al
eantionului S), n caz contrar, adic dac individul (unitatea de sondaj) examinat nu
se reintroduce n colectivitate, vom spune c operaie de selecie este nerepetat sau
sondaj fr revenire (exhaustiv).
Efectuarea sondajului fr revenire are ca schem probabilistic urna bilei
nerevenite). Aplicarea seleciei nerepetate nu are sens dect n cazul cnd volumul
populaiei C este finit, iar valorile de selecie astfel obinute sunt dependente.
Dac volumul colectivitii C este mult mai mare dect volumul seleciei,
deosebirea ntre cele dou feluri de selecie este foarte mic i atunci selecia
nerepetat poate fi considerat ca fiind selecie repetat. In cele ce urmeaz, se vor
considera numai selecii repetate.
Efectuarea sondajului cu revenire (seleciei repetate) are ca schem probabilistic
urna lui Bernoulli (urna bilei revenite). Sondajele astfel efectuate sunt echiprobabile,
iar valorile de selecie astfel obinute sunt independente.
Valorile eantionului aleator de volum n : x1 , x 2 ,..., xn , dac nu sunt toate diferite
ntre ele se ordoneaz i dup o renotare, se trec valorile distincte obinute
menionnd pentru fiecare valoare numrul de ori n care s-a obinut valoarea
respectiv. Se numesc date de selecie relative la caracteristica X , valorile distincte
obinute pentru caracteristica X privind indivizii care intr n selecie. Fie c n urma
unei selecii de volum n , efectuat dintr-o colectivitate, la indivizii creia se
urmrete caracteristica X, s-au obinut rezultatele distincte (datele de selecie) x1 , x 2
,..., xk , unde k n . n general aceste date se ordoneaz (de obicei cresctor) adic se
presupune c x1 x2 ... xk (se mai numesc serie statistic).
Observaii: 1. Deoarece aceste valori difer n general de la o selecie la alta, iar
seleciile sunt alegeri ntmpltoare, datele de selecie x1 , x 2 ,..., xk se pot considera
i ca valori ale unor variabile aleatoare, respectiv X 1 , X 2 ,..., X k , care se vor numi
variabile de selecie.
2. Dac selecia este repetat, atunci variabilele de selecie X 1 , X 2 ,..., X k sunt
variabile aleatoare independente i urmeaz fiecare aceeai lege de probabilitate cu
variabila aleatoare X , adic sunt identic repartizate cu X.
x , i 1, k
Frecvena absolut a unei valori i
a unei caracteristici este numrul ni
care reprezint numrul de uniti statistice ale populaiei statistice care corespund
valorii xi a variabilei statistice X.
n cazul variabilelor discrete rezultatele sunt prezentate sub forma unui tablou de
forma:
(11.1)
X
n
x1
n1
x2
n2
...
...
xk
nk
n ni
i 1
unde volumul seleciei
.
Frecvena absolut cumulat cresctor este suma frecvenelor absolute
j
n
i 1
, jk.
i 1
relative este egal cu 1: i 1
.
Frecvena relativ cumulat cresctor este suma frecvenelor relative
j
f1 f 2 ... f k
i 1
fi
1 j
ni
n i 1 , j k .
(11.2)
i 100
procente corespunztoare valorii xi , definit prin i 100 fi . Evident, i 1
.
2. Distribuia (repartiia) empiric a unei caracteristici variaz de la o selec ie la
alta.
x ,n
x,f
de coordonate i i sau i i , i 1, k , prin segmente de dreapt. El sugereaz
forma reprezentarea grafic a repartiiei probabilistice (teoretice) a caracteristicii.
Altfel, datele statistice se mai pot reprezenta sub forma unor batoane. Se unesc
punctele de pe axa Ox :
xi , 0
x ,n
x,f
punctele de coordonate i i sau i i , i 1, k . i aceste segmente (batoane) El
sugereaz forma reprezentarea grafic a repartiiei probabilistice (teoretice) a
caracteristicii (variabilei aleatoare).
Exemplu: Ca rezultat a unui sondaj de s-au obinut numerele:
3, 2, 1, 3, 5, 3, 2 (7 numere). S se scrie tablourile frecvenelor absolute i a
celor relative, apoi s se reprezinte grafic poligoanele acestor frecvene i tot acestea
prin batoane.
Rezolvare: Valorile distincte a acestui sondaj (de volum n 7 ) se scriu n
ordine cresctoare: x1 3 (cu frecvena absolut n1 3 ), x2 1 (cu frecvena
absolut n2 1 ), x3 2 (cu frecvena absolut n3 2 ), x4 5 (cu frecvena
absolut n4 1 ). Suma acestor frecvene absolute este egal cu volumul sondajului:
n1 n2 n3 n4 7 . Frecvenele relative sunt cele de mai sus, mpr ite la n 7 :
n
n1 3
n
1
2
n
1
, f 2 2 , f3 3 , f 4 4
n 7
n 7
n 7
n 7 . Suma acestor frecvene relative
este evident, egal cu 1: f1 f 2 f3 f 4 1 . Tablourile acestor frecvene sunt:
Ex. Tab. 11.1
Valorile
-3
-1
+2.
+5
Frecvenele
absolute
3
1
2
1
f1
Valorile
Frecvenele
relative
-3
3
7
-1
1
7
+2.
2
7
Ex. Tab.11.2
+5
1
7
Fig.11.1
iar cel al frecvenelor relative (se deosebete de primul doar prin mrimea unit ii
(scalei) pe axa ordonatelor Oy ) este:
Fig.11.1'
Graficul cu batoanele corespunztoare frecvenelor absolute este:
Fig.11.2
iar cele ale frecvenelor relative:
Fig.11.2'
[t0,t1)
n1
[t1,t2)
n2
(11.3)
[tk-1,tk)
nk
...
...
unde ni este numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti) i se
k
n ni
i 1
ni
, i 1, k
n
Frecvena relativ corespunztoare ntervalului [ti-1 , ti) este
i
reprezint numrul valorilor variabilei statistice aflate n intervalul [ti-1 , ti) mprit la
volumul seleciei.
Analog se introduc i celelalte noiuni de frecven absolut cumulat, frecven
relativ cumulat.
fi
f1 f 2 ... f k
unde, de regul,
(clasa) [ti 1 , ti ).
xi
ti 1 ti
,
2
iar f i este frecvena datelor de selecie din intervalul
lg n
r 1 log 2 n 1 1 3,322 lg n
lg 2
(11.5)
Se numete pasul de histogram numrul
M m
h
r
(11.6)
funcia Fn : ,
Fn ( x)
numarul _ valorilor _ x j x
n
kx
n
(11.8)
(kx este deci numrul de observaii n care au aprut valori ale variabilei aleatoare
(caracteristicii) X, mai mici dect x dat)
Exemplu: Funcia de repartiie de selecie pentru distribuia empiric de
selecie
1 2 3 4
X :
35 29 36 9
este dat prin
daca x 1,
0,
0,35, daca 1 x 2,
F100
( x ) 0,55, daca 2 x 3,
0,91, daca 3 x 4,
daca x 4.
1,
F ( x) p X x
ca
mai
sus
funcia
0 : p F ( x) Fn 0
de
repartiie
empiric
Fn
Atunci
Zn
Demonstraia folosete inegalitatea lui Cebev pentru variabila
x x
1 n
Yi
n i 1 , unde Yi este
Y1 , Y2 ,..., Yn
sunt
F ( x) .
Dac pentru variabilele discrete rezultatele sunt prezentate sub forma unui
tablou de forma (11.1), atunci media (aritmetic) de selecie (sperana matematic)
este:
1 k
x ni xi
n i 1
,
(11.9)
unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia
k
considerat i
n
i 1
xi
ti 1 ti
2
(valoarea din mijloc a
t t
1 r
ni i 1 i
n i 1
2 ,
unde r este numrul intervalelor, dat de (11.5).
x
(11.9')
Proprieti: 1. Media aritmetic este cuprins ntre cea mai mic i cea mai
mare valoare a repartiiei statistice:
xmin x xmax .
2. Au loc relaiile: x a x a i ax ax , a .
Pentru datele negrupate (variabil discret) moda seleciei sau dominanta este
valoarea observat xi care are frecvena ni maxim.
Pentru datele grupate moda este orice valoare din clasa cu cel mai mare numr
de observaii. Deci moda seleciei este subgrupa (intervalul modal Ik ) ce corespunde
dreptunghiului cel mai nalt al histogramei (pentru care nk este maxim).
Dac mai multe subgrupe (valori) sunt la fel de nalte i deta ate de celelalte, se
spune c selecia este plurimodal.
Mediana unei selecii este valoarea xme care mparte irul ordonat de date n
dou pri egale: numrul de valori xi xme este egal cu numrul de valori xi xme .
Mai exact, dac irul are 2k + 1 uniti, atunci mediana coincide cu unitatea de ordin
k + 1, dac irul are 2k uniti, mediana este media aritmetic a unitilor de ordin k i
k+1, dac exist mai multe asemenea valori pentru xme , atunci ele formeaz un
interval i mediana este prin definiie mijlocul acestui interval.
Exemplu: Pentru irul de date: 2,5; 3,7; 1,4; 0,2; 5,4; 8,9; 4,2 irul ordonat
este 0,2; 1,4; 2,5; 3,7; 4,2; 5,4; 8,9. Deci 2k + 1 = 7, de unde k = 3 i unitatea de
ordin k +1 = 4 este 3,7 care este mediana.
Observaie: Dac xme x atunci repartiia este simetric.
Amplitudinea statistic este diferena dintre cea mai mare valoare M xmax i
cea mai mic valoare m xmin a repartiiei statistice:
A M m xmax xmin
(11.10)
n cazul variabilelor aleatoare continue, amplitudinea este diferen a dintre
limita superioar a ultimului interval i limita inferioar a primului.
Dispersia statistic (de selecie) empiric se definete prin:
2
2
1 k
xi x ni
n i 1
(11.11)
pentru datele negrupate (variabile discrete), unde ni reprezint frecvena absolut de
k
n
i 1
xi
i x este media
ti 1 ti
2
(valoarea din mijloc a
1 r t t
i 1 i x ni
n i 1
2
(11.11')
De multe ori, este mai avantajos, a folosi drept dispersie statistic, mrimea
numit dispersie de selecie modificat (variana):
s2
k
1
xi x
n 1 i 1
ni
(11.12)
t t
xi i 1 i
2
pentru datele negrupate , iar pentru cele grupate xi se nlocuiete cu
(valoarea din mijloc a intervalului [ti 1 , ti ) , iar numrul intervalelor (pentru care se
efectueaz sumarea) este r dat de (11.5).
s
2
(11.13)
s s2
respectiv
(11.14)
s
x
(11.15)
v
1
3 .
(11.16)
pentru datele negrupate (variabile discrete) , iar pentru cele grupate xi se nlocuiete
t t
xi i 1 i
2
cu
(valoarea din mijloc a intervalului [ti 1 , ti ) , iar numrul intervalelor
(pentru care se efectueaz sumarea) este r dat de (11.5).
Momentul statistic (de selecie) empiric iniial de ordin l se definete prin:
1 k
ml ni xi l
n i 1
,
(11.17)
unde ni reprezint frecvena absolut de apariie a valorii xi a variabilei n selecia
k
considerat i
n
i 1
xi
ti 1 ti
2
(valoarea din mijloc a
m0 1
m1 x
i 1
1 , 1 0 i 2 .
Observaii: 1. Evident 0
2. Momentele centrate sunt invariante la o translaie a valorilor reparti iei
statistice.
Asimetria (skewness) poligonului frecvenelor este caracterizat de coeficientul
statistic de asimetrie, definit prin:
as
(11.19)
x x ).
Dac as 0 atunci se spune c repartiia este simetric ( me
Boltirea sau aplatizarea (kurtosis) poligonului frecvenelor este caracterizat de
coeficientul statistic de boltire (Pearson), definit prin:
(11.20)
(11.20')
n
Definiia 1.14. Dac avem funcia h : , numim funcie de selecie sau
N (m,
).
n
normal N (m, ) , atunci media de selecie X urmeaz legea normal
Observaia 1.17. Dac se consider caracteristica X care urmeaz legea
normal N (m, ) , atunci statistica dat prin
Z
X m
n
de unde rezult ca statistica Z urmeaz legea normal N (0,1).
'
''
Observaia 1.18. Dac avem caracteristicile independente X i X , care
'
'
''
''
urmeaz fiecare legea normal, respectiv N (m , ) i N (m , ) , atunci statistica
X
Z
'
''
m m ,
'
''
'
'
n'
n ''
'
''
'
unde X i X sunt mediile de selecie date respectiv prin variabilele de selecie X 1 ,
'
''
X 2' ,..., X n ' i X 1'' , X 2'' ,..., X n '' relative la caracteristicile X ' i X '' , urmeaz legea
normal N (0,1).
1 n
1 n
k X i X ,
k xi x
n i 1
n i 1
iar valoarea numeric
.
o numim valoarea momentului centrat de selecie de ordin k
Observaia 1.22. Dac se consider caracteristica X care urmeaz legea
normal N (m, ) , atunci statisticile
X m
2
n
H 2 22 ,
n 1 i
2
urmeaz respectiv legea Student cu n 1 grade de libertate i legea cu n 1 grade
de libertate.
De asemenea, considernd funcia de selecie
1 n
Xk X ,
n 1
k 1
numit dispersie de selecie, se obine c
2
X m
2
n 1
2
H
.
n i
2
X
35 29 36 9
este dat prin
daca x 1,
0,
0,35, daca 1 x 2,
1,
daca x 4.
Teorema 1.26 (Glivenko). Dac se consider caracteristica X ce are funcia
de repartiie teoretic F i fie funcia de repartiie de selecie F n , atunci
P lim sup F n (c) F ( x ) 0 1.
n x
atunci
lim P n d n x K x
n
e 2k
2 2
pentru x 0.
*
*
p
pentru orice numr 0, adic ( X 1 , X 2 , , X n ) , iar valoarea
*
*
numeric ( x1 , x 2 , , x n ) se numete estimaie consistent pentru parametrul
.
(ii)
lim D 2 * 0,
n
*
*
iar valoare numeric ( x1 , x 2 , , x n ) se numete estimaie absolut corect
pentru parametrul .
*
Definiia 2.5. Numim distorsiunea (deplasarea) estimatorului al
*
*
parametrului , diferena M ( ) , iar dac distorsiunea este nul estimatorul se
numete nedeplasat.
*
*
Proprietatea 2.6. Dac ( X 1 , X 2 , , X n ) este un estimator absolut
corect pentru parametrul , atunci estimatorul este consistent.
*
Demonstraie. Avnd n vedere c M ( ) , inegalitatea lui Cebev pentru
*
variabila aleatoare este
P * 1
D 2 (* )
,
*
pentru 0.
lim D 2 * 0,
Dar n
i trecnd la limit n inegalitatea lui Cebev se obine
*
lim P 1,
*
n
pentru orice 0, deci este un estimator consistent pentru
parametrul .
1 n k 1 n
1 n
1 n
n
X i M X ik M X k k k k ,
n i 1
n i 1
n
n i 1
n i 1
M ( k ) M
respectiv
1 n
1
X ik 2
n
i 1
n
D 2 ( k ) D 2
1
n2
D 2 X ik
i 1
D2 X k
i 1
nD 2 ( X ) D 2 ( X )
,
n
n2
1 n
2 X k X ,
n k 1
este funcie de estimaie corect pentru momentul centrat teoretic de orinul doi
2 D 2 ( X ), adic pentru dispersia teoretic.
S se arate c
n 1
n 1 2
2
D ( X ) D 2 ( X ),
n
n
cnd n ,
M ( 2 )
respectiv
D 2 ( 2 )
n 1 2
n3
n 1 n 2 2 0,
2
n3
pentru n ,
2
1 n
Xk X ,
n 1 k 1
aceasta este funcie de estimaie absolut corect pentru dispersia teoretic
D2 ( X ) 2.
2
n
2 .
n 1
Prin urmare, se obine
n
n
n n 1 2
2
M 2
D ( X ) D 2 ( X ),
n 1
n 1 n
n 1
M ( ) M
respectiv
2
D 2 ( ) D 2
2
n
n
2
2
D 2 0,
n 1 n 1
cnd n ,
*
Observaia 2.11 (Inegalitatea Rao-Cramer). Estimatorul absolut corect al
parametrului satisface inegalitatea
1
D 2 (* )
.
I n ( )
*
Definiia 2.12. Estimatorul , absolut corect pentru parametrul necunoscut
1
D 2 (* )
,
I n () iar raportul
, se numete eficient, dac
e(* )
I n1 ( )
D 2 (2 )
*
se numete eficiena estimatorului .
1 n
Xk
n k 1
este funcie de estimaie absolut
,
p
p 1 p p (1 p )
ln f ( X ; p) 2
X p 2
M X 2 2 pX p 2
M
M
2
p
p 2 1 p
p(1 p)
M X 2 2 pM ( X ) p 2 p 2 p 2 p 2
1
,
2
2
2
2
p 1 p
p 1 p
p 1 p
n
I n ( p)
.
p
1
p
deci
Pe de alt parte, se poate scrie
1 n
1 n
D 2 ( X ) p 1 p
D2 ( X ) D2 X k 2 D2 X k
.
n
n
n i 1 n i 1
2
1
Prin urmare se obine c D ( X ) I n ( p), deci X este estimator eficient pentru
parametrul p.
f ( x; 1 , 2 , , s ) de
probabilitate, ce o caracterizeaz i care depinde de parametrii necunoscui 1 , 2 , ...,
Fie X
s.
V ( x1 , x2 , , xn ; 1 , 2 , , s ) f ( xk ; 1 , 2 , , s )
k 1
1
f ( x; m, )
e
2
Se tie c M ( X ) m i ( X ) , iar
Pentru a scrie sistemul de verosimilitate maxim, avem c
ln f ( x; m, ) ln 2 ln
( x m) 2
2 2
( x m) 2
,
2 2
de unde
ln f ( x; m, ) x m
,
m
2
ln f ( x; m, )
1 ( x m) 2
.
m
m
2
k 1
k 1
2
n
n
ln V ln f ( X k ; m, ) 1 ( X k m) 0,
3
k 1
k 1
sau
k 1
k 1
m 0
2
( X k m) 2 0,
1 n
1 n
X k X , *
Xk X
n k 1
n k 1
pentru parametrii m i .
m*
2 ,
f ( x; a, b)
1
x a 1e b ,
a
(a )b
0,
daca x 0,
daca x 0,
x a 1e x dx.
0
unde este funcia Euler de spea a doua, adic
In cazul de fa este vorba de doi parametri, deci sistemul de ecuaii este
format din dou ecuaii, anume 1 1 i 2 2 .
1
k x f ( x; a, b)dx
x a k 1e b dx.
a
(a )b 0
1
( a )b a
a k 1 t
bt e bdt
0
bk
t a k 1e t dt
(a ) 0
b
b k (a k 1)( a k 2) a(a )
(a k )
,
(a )
( a )
k
k
deci k b (a k 1)( a k 2) a. Rezult astfel sistemul
1 n
1
xk 1 ab
n k 1
n
2 1 x 2 ba 2 (a 1),
k 2
n k 1
2 1
a
, b
,
2
1
2 1
*
X Xk,
n k 1
n
unde
urmeaz legea normal N (0,1), prin urmare o lege de probabilitate cunoscut ce nu
depinde de parametrul necunoscut m M ( X ). Rezult c putem determina intervalul
numeric ( z1 , z2 ), astfel nct
P ( z1 Z z2 ) 1 ,
t2
1
2
( x)
e
dt
(
z
)
(
z
)
,
0
2
1
adic
unde
este funcia lui Laplace i care
este tabelat n Anexa I.
Desigur c intervalul numeric ( z1 , z2 ) nu este n mod unic determinat.
Intervalul de ncredere de lungime minim pentru fixat se obine cnd este simetric
z2 z ,
1
z
z
.
1 In acest caz
2 va fi dat prin relaia
fa de origine, adic 2
1
z z 1 ,
z
.
1
1
1
2
2
2
2
adic
Cnd se folosete funcia lui Laplace definit prin
t2
1
( x)
e 2 dt ,
z
atunci
ordin
1
2
z 1
1
2
2
se determin din relaia
i reprezint de fapt cuantila de
2.
P z
1
2
sau
X m
1
2
1 ,
P X
z m X
z 1 .
n 1 2
n 1 2
Prin urmare, intervalul de ncredere pentru media teoretic m este (m1 , m2 ), unde
iar
m1 m1 ( X 1 , X 2, , X n ) X
z ,
n 1 2
m2 m2 ( X 1 , X 2, , X n ) X
z ,
n 1 2
1 n
Xk.
n k 1
X m
n ,
X m X m
2
n
n 1
unde
2
1 n
1 n
X Xk
Xk X .
n k 1
n 1 k 1
i
Pe baza observaiei 1.22, avem c statistica T urmeaz legea Student cu n 1 grade
(t1 , t2 ) t
,t
n 1,1
n 1,1
2
2
m 1
m 1
x
2 2
t
2
1
Fm ( x)
dt ,
m
m
m
x ,
2
m
este funcia de repartiie a legii Student cu
grade de libertate i care este tabelat,
pentru anumite valori, n Anexa II.
Fn 1 t
.
t2 t
1
,
n
1
,
1
n 1,1
2
t
t
,
2
2
1
2 se determin ca
Prin urmare
Odat determinat intervalul (t1 , t2 ) , putem scrie
P t
n 1,1
2
X m
n 1,1
sau
1 .
P X t
m X t
n 1,1
n 1,1
n
n
2
2
Astfel s-a obinut intervalul de ncredere (m1 , m2 ) pentru media teoretic m , unde
m1 X t
n 1,1
, m2 X t
.
1
,
1
n
n
2
''
''
'
''
pentru populaia C i respectiv X ce urmeaz legea normal N (m , ) pentru
''
populaia C .
Vom determina un interval de ncredere, cu probabilitatea de ncredere 1 ,
'
''
pentru diferena m m .
Pentru aceasta se consider dou selecii independente relative la cele dou
'
'
''
X n' '
X
X
1
2
populaii, cu variabilele de selecie corespunztoare
,
,...,
i respectiv X 1 ,
''
X 2'' ,..., X n ' ' .
X X m m ,
Z
'
''
'
''
'
'
''
n'
n
n'
X X
'
'
k
n'
X X k'' ,
''
( z1 , z2 ) z , z ,
1
1
2
2
k 1
k 1
z
z 1 ,
2
2
1
1
2
2
'
'
'
''
n
n
'
''
'
''
'
'
'
'
'
''
P X X z
1 .
n'
n''
n'
n ''
1
1
2
2
'
''
Aceast relaie ne d intervalul de ncredere pentru diferena m m a mediilor celor
dou populaii.
'
''
b) Abaterile standard necunoscute. In acest caz, se consider
statistica
X ' X '' m' m''
n ' n '' 2
,
1 1
'2
'' 2
'
''
(n 1) (n 1)
n ' n ''
2
''
'
'
1 n
' X k X
n k 1
''
'2
'' 2
sunt
''
1 n
'' X k X .
n k 1
i
'
''
Statistica T urmeaz legea Student cu n n n 2 grade de libertate.
In continuare, ca la exemplul 2.22, pentru o probabilitate de ncredere 1 ,
(t1 , t2 ) t , t ,
n ,1
n ,1
2
2 astfel ca P (t1 T t 2 ) 1 , adic
se determin intervalul
'2
'2
X X m m
n n 2
1 .
n ,1
1 1
'2
''2
'
''
2
(n 1) (n 1)
n ' n ''
'
''
Astfel se obine intervalul de ncredere pentru diferena m m
'
P t
n ,1
'
''
''
X X t
unde
S2
'
n ,1
2
'
'
''
''
S, X X t
n ,1
2
S ,
1 1
''
'
(n ' 1) (n '' 1) 'n '' n
n n 2
'2
''
''2
( X k X )2 X X k
H
n 1 k 1
n k 1
2
, unde
,
.
h12 h
Fn 1 (h12 )
n 1,
2
2 , respectiv
Anume,
se determin din relaia
h22 h
Fn 1 (h22 ) 1
n 1,1
2 se determin din relaia
2 , unde Fm (x ) este funcia de
2
repartiie pentru legea cu m grade de libertate, adic
2
Fm ( x)
1
m
2
t 2 e 2 dt , x 0
m
2 ( ) 0
2
care este tabelat n Anexa III.
2
2
Odat determinat intervalul ( h1 , h2 ) , putem scrie c
2
(n 1)
P( h
h22 ) 1
2
,
2
1
sau
2
(n 1)
(n 1)
P(
2
) 1
2
h2
h12
.
2
2
Prin urmare, s-a obinut intervalul de ncredere ( 1 , 2 ) pentru parametrul , unde
n
2
2
1
1 1 ( X 1 , X 2 , , X n ) 2
(X k X )2
h
k 1
n 1,1
2
,
n
2
2
1
2 2 ( X 1 , X 2 , , X n ) 2 ( X k X ) 2
h k 1
n 1,
2
.
Observaia 2.25. Cu notaiile de la exemplul precedent, intervalul de
1 n
X Xk
n k 1
n , unde
,
pe baza Observaiei 1.17, avem c statistica Z urmeaz legea normal N (0,1) . Prin
( z
u m0
U (u1 , u 2 , u n ) R
( z , z )
1
1
2
2
unde
1
uk
n k 1 .
n acest fel am obinut c
P (( X 1 , X 2 , , X n ) U H 0 )
u m0
P
z , z H0
1
1
2
2
P Z z , z H 0
1
1
2
2
,z
Prin urmare, am determinat regiunea critic U, astfel nct s fie satisfcut relaia
P(( X 1 , X 2 , , X n ) U H 0 )
.
Folosind regiunea critic U, vom respinge ipoteza nul H 0 : m m0 , dac
z
x m0
( z , z )
1
1
2
2
( x1 , x 2 , , x n ) U , adic dac
n
x m0
z
( z , z )
1
1
2
2
( x1 , x 2 , , x n ) U , adic
n
.
i o admitem dac
D2 (X ) .
Observaia 3.12. (Etapele aplicrii testului Z).
1o Se dau: ; x1 , x 2 , x n ; m m0 ; ;
z
2o Se determin
1
2
( z
1
2
1
2
astfel nct
;
x m0
z
1 n
x xk
n k 1 ;
n , unde
30 Se calculeaz
z z
1
H 0 este admis, n caz contrar ipoteza
0
2 , ipoteza
4 Concluzii: dac
este respins.
Observaia 3.13. Deoarece ipoteza alternativ este H 1 : m m0 , testul
prezentat este testul Z bilateral. Dac ipoteza alternativ este H 1 : m m0 , se obine
n mod analog testul Z unilateral stnga, respectiv pentru ipoteza alterantiv
H 1 : m m0 , se obine testul Z unilateral dreapta.
,
z
)
z
1 , unde 1 este determinat astfel nct
2
statistica Z devine
,
iar regiunea critic U se modific n mod corespunztor, adic
u m0
U (u1 , u 2 , u n ) R n
z1 )
.
3.2. Testul T (Student)
X m
X m
2
n 1 , unde, dup cum se tie
Construim statistica
2
1 n
1 n
n
X Xk
( X k X )2
2
n k 1
n 1 k 1
n 1 , care, conform Observaiei 1.22,
,
urmeaz legea Student cu n-1 grade de libertate.
Prin urmare, pentru nivelul de semnificaie (0,1) dat, se poate determina
(t
intervalul numeric
n 1,1
P ( t
t
Anume,
n 1,1
2
,t
n1,1
n 1,1
astfel nct
T t
) 1
n 1,1
Fn 1 t
1
2
n 1,1 2
se determin astfel ca
, unde
m 1
m 1
t
2 2
x
2
1
Fm (t )
dx, t R
m
m
m
2
,
U (u1 , u 2 , u n ) R
u m0
u
n
n 1,1
2
2
1 n
1 n
u
(u k u ) 2
k
u
n
n
1
k 1
k 1
unde
, respectiv
.
Observaia 3.14 (Etapele aplicrii testului T).
1o Se dau: ; x1 , x 2 , x n ; m m0 ;
t
1
F
t
n
1
,
1
n 1,1
2
2
2 astfel nct
2o Se determin
;
x m0
t
2
1 n
1 n
x xk
( x k x) 2
n k 1 ,
n 1 k 1
n , unde
30 Se calculeaz
;
t t
n 1,1
0
2 , ipoteza H 0 : m m 0 este admis, n caz
4 Concluzii: dac
contrar ipoteza este respins.
Prin urmare, dac volumul n al seleciei este mare (n 30) , se poate utiliza
testul Z pentru verificarea ipotezei nule H 0 : m m0 , prin utilizarea statisticii T n loc
de statistica Z. Toate rezultatele de la testul Z rmn, aadar, adevrate n acest caz.
3.3. Teste pentru compararea a dou medii
Se consider dou populaii independente C ' i C ' ' cercetate din punct de
vedere al aceleiai caracteristici. Aceast caracteristic este X ' pentru C ' i urmeaz
legea normal N ( m' , ' ) i respectiv X ' ' pentru C ' ' i urmeaz legea normal
N ( m' ' , ' ' ) .
Relativ la mediile teoretice ale celor dou caracteristici independente se face
ipoteza nul H 0 : m' m' ' cu alternativa H 1 : m' m' ' .
1 n'
n'
'
X
X k '2 1 ( X k ' X ' )2
n' k 1
n'1 k 1
,
,
'
''
''2
''
1 n ''
1 n ''
''
''
X
( X k X )2
k
n' ' k 1
n' '1 k 1
,
,
X
Z
'
X m'm' '
''
n'
n' '
consider statistica
, care urmeaz legea normal N (0,1) . Se
aplic prin urmare testul Z pentru compararea celor dou medii teoretice.
Pentru nivelul de semnificaie (0,1) dat se determin intervalul numeric
( z , z )
P( z Z z ) 1
1
1
1
1
2
2
2
2 , astfel nct
. Stabilirea acestui interval se
1
( z )
1
2
2
obine din relaia
, unde (x) este funcia lui Laplace i care este
tabelat n Anexa I.
n acest caz, etapele aplicarii testului sunt:
'
'
'
''
''
''
; x1 , x 2 , , x n ' ; x1 , x 2 , , xn '' ;
1o Se dau:
( z
2o Se determin
1
2
astfel nct
'
z
30 Se calculeaz
x x
1
2
''
'
''
1 n' '
1 n '' ''
'2 ' '2
x xk
x xk
n' k 1
n' ' k 1
n'
n' ' , unde
, i
;
z z
40 Concluzii: dac
ipoteza este respins.
1
2
2
2
2
2
2
b). Testul T (dac dispersiile ' i ' ' sunt necunoscute i ' ' ' ).
Se consider statistica
'
X m'm' '
''
Fn t 1
P ( t T t ) 1
n ,1
n ,1
2
2
n ,1 2
2
2
. Pentru aceasta se folosete relaia
,
unde Fn (x) este funcia de repartiie de la legea Student cu n grade de libertate i care
este tabelat, pentru anumite argumente, n Anexa II.
Etapele aplicarii testului sunt:
'
'
'
''
''
''
; x1 , x 2 , , x n ' ; x1 , x 2 , , xn '' ; n n' n' '2 ;
1o Se dau:
Fn t 1
t
n ,1
2
n ,1 2
2 astfel nct
2o Se determin
;
'
x x
''
n' k 1
n' n' ' , unde
,
30 Se calculeaz
'2
' 2
''
'' 2
''
1 n'
1 n '' ''
1 n ''
'
''
(
x
x
)
x
( xk x ) 2
k
k
n'1 k 1
n' ' k 1
n' '1 k 1
,
,
;
t t
n ,1
2 , ipoteza m' m' ' este admis, n caz contrar
40 Concluzii: dac
ipoteza este respins.
2
2
c) Testul T (dac dispersiile ' i ' ' sunt necunoscute i diferite). Se va
considera statistica
X
T
'
''
m'm' '
n'
n' '
,
care urmeaz legea Student cu n grade de libertate. Numrul n al gradelor de libertate
'2 '2 ' '2
1
c2
(1 c) 2
.
n' '1 , unde
se calculeaz cu formula n n'1
S-a ajuns la testul T, care pentru nivelul de semnificaie (0,1) dat,
( t
conduce la intervalul numeric
n ,1
,t
n ,1
)
, astfel nct
P( t
n ,1
T t
n ,1
) 1
.
1
2
Fn t
n ,1 2
Pentru aceasta se folosete relaia
, unde Fn (x) este funcia de
repartiie de la legea Student cu n grade de libertate i care este tabelat, pentru
anumite argumente, n Anexa II.
Etapele aplicrii testului sunt:
'
'
'
''
''
''
; x1 , x 2 , , x n ' ; x1 , x 2 , , x n '' ;
1o Se dau:
2o Se calculeaz
'2
'
'
1 n' '
1 n'
'
x xk
( xk x ) 2
n' k 1
n'1 k 1
,
,
'' 2
''
1 n '' ''
1 n ''
''
xk
( xk x ) 2
n' ' k 1
n' '1 k 1
,
,
2
2
2
' ' ''
n' n'
n' '
de unde
;
1
c2
(1 c) 2
n' '1 ;
30 Se determin n astfel nct n n'1
''
t
4o Se determin
n ,1
2
Fn t
n ,1
2
astfel nct
'
x x
''
n'
n' ' ;
50 Se calculeaz
t t
n ,1
0
2 , atunci ipoteza m' m' ' este admis, n caz
6 Concluzii: dac
contrar ipoteza este respins.
2
3.4. Testul (hi-ptrat) pentru dispersie
1
H 2
Statistica
grade de libertate.
2
(n 1)
( X k x)
2
2
k 1
, urmeaz legea cu n 1
n
Fn 1 h 2
Fn 1 h 2 1
2
2
n 1, 2
n 1,1 2
i
,
2
unde Fm (x ) este funcia de repartiie pentru legea cu m grade de libertate, adic
1
Fm ( x)
m
2
t 2 e 2 dt , x 0
0
III.
(h 2
n 1,
2
, h2
n 1,1
1 n
U (u1 , u 2 , u n ) R n 2 (u k u ) 2 (h 2 , h 2 )
n 1,
n 1,1
0 k 1
2
2
,
n
1
u uk
n k 1 .
unde
2
Observaia 3.16 (Etapele aplicrii testului ).
1o Se dau: ; x1 , x 2 , x n ; 0 ; ;
(h 2
, h2
)
n 1,1
2
2o Se determin intervalul
astfel nct
Fn 1 h 2
Fn 1 h 2 1
2
2
n 1, 2
n 1,1 2
i
;
n 1,
h2
30 Se calculeaz
1
02
( x k x) 2
k 1
h 2 (h 2
0
4 Concluzii: dac
contrar este respins.
n 1,
, h2
, unde
n 1,1
1 n
xk
n k 1 ;
X
)
X
Xk
k
n'1 k 1
n' k 1
,
,
'' 2
''
1 n ''
1 n ''
''
''
(
X
X
)
X
Xk
k
n' '1 k 1
n
'
'
k 1
,
,
2
2
' ''
F 2
' ' ' 2 , urmeaz legea Snedecor-Fisher cu m n'1 i
avem c statistica
n n' '1 grade de libertate. Prin urmare, statistica F are funcia de repartiie, pentru
x 0 , dat prin
mn
m
m n
x n 1
2
m 2
m 2 2
Fm,n ( x )
t 1 n t dt
n m n 0
2 2
.
(
0
,
1
)
Pentru un nivel de semnificaie
fixat se poate determina intervalul
(f
numeric
m ,n ,
'' 2
,f
m , n ,1
, astfel nct
P( f F f
m,n,
m , n ,1
) 1
.
Fm,n f
Fm,n f
1
2
2
m,n, 2
m,n ,1 2
i
.
f m ,n,
F ( x)
f n ,m ,1
Deoarece are loc relaia
, tabelele pentru funcia m,n
sunt,
1
IV) i pentru
.
F
1
Dac
, intervalul numeric pentru F este dat prin
1
1
(f , f
,
)
m,n,
m , n ,1
f
f
2
2
n ,m,1 2 n ,m, 2 .
Observaia 3.17 (Etapele aplicrii testului F).
'
'
'
''
''
''
; m n'1; n n' '1; x1 , x 2 , , x n ' ; x1 , x 2 , , xn '' ; ;
1o Se dau:
(f , f
)
m,n,
m , n ,1
o
2
2
2 Se determin intervalul
astfel nct
Fm,n f
Fm,n f
1
m,n,
m
,
n
,
1
2
2
2
i
;
'2
' ' 2 , unde
30 Se calculeaz
'2
'
'
1 n'
1 n' '
'
( xk x ) 2 x x k
n'1 k 1
n' k 1
,
,
n ''
n ''
2
''
''
''
1
1
''
''
( xk x ) 2 x xk
n' '1 k 1
n' ' k 1
,
.
f ( f
0
4 Concluzii: dac
n caz contrar este respins.
m,n,
,f
m , n ,1
2
2
, atunci ipoteza ' ' ' este admis,
2
3.6. Testul de concordan
Fie caracteristica X, care are funcia de repartiie teoretic F. Ipoteza statistic
nul ce o facem relativ la caracteristica X este
H 0 : F F0 ( x; 1 , 2 , s ) ,
x1 , x 2 , x n
f
f
f
2
N
1
. Pentru clasa
, dat de intervalul ai 1 , ai avem c
'
xi
p i P (ai 1 X ai | F F0 ) F ( ai ; 1 , 2 , , s ) F (ai 1 , 1 , 2 , , s )
.
n acest fel ipoteza nul H 0 , fcut asupra funciei de repartiie, se poate rescrie n
i , i 1, N
H 0 : pi p
, cu ipoteza alternativ H 1 : H 0 fals.
N
h
2
Valoarea numeric
f i np i 2
np i
1o Se consider: , x1 , x 2 , x n , F F0 ( x; 1 , 2 , s ) ;
fi
i 1, N
3 Se determin distribuia empiric de selecie
;
o
4 Se calculeaz probabilitile
p i P (ai 1 X ai | F F0 ) F0 (ai ; 1 , 2 , , s ) F0 (ai 1 , 1 , 2 , , s )
i 1, N ;
50 Se calculeaz
hk2,1 ( k N s 1)
N
60 Se calculeaz
h2
f i np i
np i
i 1
h h
70 Concluzii: dac
contrar ipoteza este respins.
2
2
k ,1
astfel nct
Fk ( hk2,1 ) 1
K ( x) (1) k e 2 k
2 2
P d n 1 1
P n d n x1 1
n
Astfel, avem
sau
.
d
Aadar, dac valoarea calculat a lui n pentru datele de selecie, satisface
n d n x1 , vom admite ipoteza nul, n caz contrar o respingem.
inegalitatea
Observaia 3.20 (Etapele aplicrii testului Kolmogorov).
x'
X i
f
1o Se consider: , distribuia empiric de selecie i i 1, N , funcia de
repartiie F0 , ( n f 1 f 2 f N ) ;
4o Concluzii: dac
ipoteza este respins.
i 1, N
n d n x1
'
, unde
xi
ai 1 ai
2
;
Se cere:
a) distribuiile empirice de selecie pentru fiecare din caracteristicile X i Y,
b) mediile de selecie, momentele centrate de selecie de ordinul al doilea i
dispersiile de selecie pentru caracteristicile X i Y,
c) funciile de repartiie de selecie pentru X i Y.
Soluie. a) Se observ c datele de selecie pentru caracteristica X au numai N
= 6 valori distincte, deci distribuia empiric de selecie pentru X este
1 2 3 4 5 6
X
4 6 4 3 1 2 .
Pentru caracteristica Y toate datele de selecie sunt distincte. Aadar, distribuia
empiric de selecie a lui Y este un tablou n care pe o linie sunt trecute toate aceste
valori (eventual ordonate cresctor), iar pe linia a doua se trec frecvenele acestor
valori, care sunt toate egale cu 1. Vom face o grupare a datelor de selecie
corespunztoare caracteristicii Y. Anume, prima clas cuprinde cheltuielile lunare de
la 80-89 mii lei, etc. Dup efectuarea acestei grupri, distribuia empiric de selecie a
lui Y devine
75 85 95 105 115 125
Y
6
3
1 .
2 4 4
b) Mediile de selecie pentru cele dou caracteristici sunt respectiv
1 20
1
57
x
xk
(4 1 6 2 4 3 3 4 1 5 2 6)
2,85
20 k 1
20
20
,
1 20
1
y k 1955 97,75
20 k 1
20
mii lei.
Dac se folosesc datele grupate pentru caracteristica Y se obine
'
1
1
y
( 2 75 4 85 4 95 6 105 3 115 1 125)
1970 98,5
20
20
mii lei y .
y
x
)
k
( xk 2,85) 2
20 k 1
20 k 1
,
' 2
1 20
1 20
(
y
y
)
k
( y k 98,5) 2
20 k 1
20 k 1
.
Pentru simplificarea calculelor, se poate folosi formula
1 n
2 ( X ) ( xk a) 2 ( x a) 2
n k 1
,
2 (Y )
unde a este o constant real convenabil aleas. Anume, dac pentru caracteristica X
vom alege a = 3, atunci
1 20
2(X )
( xk 3) 2 (2,85 3) 2
20 k 1
1
(4 2 2 6 12 4 0 2 3 12 1 2 2 2 3 2 ) 0,15 2
20
1
(2 30 2 4 20 2 4 10 2 6 0 2 3 10 2 1 20 2 ) 6,5 2
20
1
(Y )
'
1 20
20
20 182,5
( yk y ) 2
2 (Y )
192,105
19 k 1
19
19
.
2
( X ) ( X ) 2,45 1,57
i respectiv
, daca 1 x 2,
20
10
, daca 2 x 3,
20
14
F 20 ( x)
, daca 3 x 4,
20
17
20 , daca 4 x 5,
18 , daca 5 x 6,
20
1, daca x 6,
pentru caracteristica X i
0, daca y 75,
2
, daca 75 y 85,
20
6
, daca 85 y 95,
20
10
F 20 ( y )
, daca 95 y 105,
20
16
20 , daca 105 y 115,
1, daca y 125,
pentru caracteristica Y.
4.2. La un control de calitate se verific diametrul pieselor prelucrate de un
strung. Pentru realizarea acestui control s-a considerat o selecie de 18 piese i s-a
obinut c diametrul X al pieselor are urmtoarele dimensiuni (n cm):
Diametrul (n cm)
Numr de piese
3,98
4
3,99
3
4,00
5
4,01
3
4,02
3
S se determine:
a) o estimaie absolut corect pentru diametrul mediu al pieselor realizate,
b) o estimaie corect i una absolut corect pentru dispersia diametrelor fa
de diametrul mediu.
Soluie. a) Distribuia empiric de selecie a caracteristicii X este
3,98 3,99 4,00 4,01 4,02
X
3
5
3
3 .
4
1 n
xk
n k 1
este o estimaie absolut corect
1
(4 3,98 3 3,99 5 4,00 3 4,01 3 4,02)
18
1
71,98 3,9989
18
.
2
b) Deoarece un estimator corect al dispersiei teoretice D ( X ) este momentul
1 n
2 (X k X )2
n k 1
centrat de selecie de ordinul doi, adic
, rezult c o estimaie
D2 (X )
este o funcie de estimaie absolut corect pentru parametrul
Soluie. Vom arta c sunt satisfcute cele dou condiii din definiia funciei
de estimaie absolut corecte, adic
M(V) =
i lim D2 (V) = 0
n primul rnd avem c:
1 n
1 n
1
M
(
X
m
)
M( X m)
nM ( X m )
M ( X m ).
k
n 2 k 1
n 2 k 1
n 2
2
Deoarece caracteristica X urmeaz legea normal N(m, ) avem c
M(V)
M( X m)
x m p( x)dx
1
2
x me
( x m)2
2 2
dx
xm
u
M( X m)
u e
u2
2
du
ue
2
0
u2
2
du
u2
2
( e 2
Dac
se face schimbarea de variabil
i se ine seama de faptul c funcia de integrat
obinut, dup aceea, este funcie par, rezult c :
2
2
Prin urmare, obinem c M(V)= = , deci prima condiie este satisfcut.
D 2 X m
1 2 n 2
n 2
2
D (V ) (
) D X m 2 D X m
nD X m
n 2 k 1
2n
2n k 1
2 2
Pentru verificarea celeilalte condiii putem scrie succesiv:
2
lim D 2 (V ) 0.
de unde n
4.4. Se consider caracteristica X ce urmeaz legea binomial, adic are
distribuia teoretic
P(m, k )
k 0, m
ln f ( x; p) x m x
p
p lp
Aadar, ecuaia verosimilitii maxime este
Xk m Xk
p
1 p
k 1
1 n
X Xk
n k 1
unde
.Ecuaia
1 p X mp p X 0;
nX
mn
nX
0
p 1 p 1 p
verosimilitii
0,
adic
maxime
se
mai
scrie
D 2 p *
1 2
1
D X 2 2
2
m
m n
1
1
D X m n D X m n
2
k 1
k 1
nD 2 X
D 2 X mpq pq
2
m2n
m n mn
pq
0,
n mn
lim D 2 ( p * ) lim
n
c) Cantitatea de
informaie relativ la parametrul p se poate calcula dup cum urmeaz
p (1 p)
,
mn
1
D 2 ( p*)
I ( p ) Pe de alt parte, am vzut c
D 2 ( p*)
prin urmare,
are
loc egalitatea deci estimatorul p* este estimator eficient pentru parametrul p.
4.5. Relativ la populaia C se cerceteaz caracteristica X privind media
teoretic M(X)=m. tiind c dispersia teoretic a caracteristicii X este D2(X)=0,35,
s se stabileasc un intreval de ncredere pentru media teoretic m cu probabilitatea
de incredere 1 - = 0,95 , utiliznd distribuia empiric de selecie
22,7 22,8 22,9 23,0 23,1 23,2 23,3 23,4
1
3
7
4
6
7
5
2
Soluie. Deoarece volumul seleciei este n=35 > 30, putem considera c
statistica
Z
D2 X
X m
n
unde
urmeaz legea normal N(0,1). Aadar, intervalul de ncredere pentru media teoretic
m se obine din relaia
X m
P z
z
1
1
2
2
1,
sau
P X
z m X
z
n 1 2
n 1 2
unde
z
1
2
astfel determinat inct
1
2
1,96 1 .0,475
2
1
x 1 22,7 3 22,8 7 22,9 4 23 6 23,1 7 23,2 5 23,3 2 23,4 23,077
35
iar din Anexa I, pentru se gsete
z
De asemenea, avem c
D2 (X )
0,35
0,01 0,1
35
1
2
;X
1
2
2
5
3
5
4
2
1
D2 X
Soluie. Deoarece abaterea standard este necunoscut, se consider statistica
X m
;
X t
;
X
n 1,1
n 1,1
n
n
2
2
n 1,1
determin
De asemenea, folosind datele de selecie, obinem valoarea x a mediei de
selecie X , anume:
1
1 2,7 2 2,8 5 2,9 3 3,1 2 3,3 3,032
x
22
i valoarea abaterii standard de selecie
2
1 7
0,587728
f k xk x
0,167
21 k 1
21
X t
n 1,1
2
2,518 0,167
2,518 0,167
;X t
3,032
;3,032
2,942;3,122
1
,
1
n
n
22
22
,
n'
n' ' z legea normal N(0,1). Astfel,
care urmea
intervalul de ncredere pentru diferena m-m este:
2
2
2
2
X ' X ' ' z ' ' ' ; X ' X ' ' z ' ' ' ,
1
1
n'
n' '
n'
n' '
2
2
1
z
0,49
z
1
1
2
2
2 se determin astfel ca
unde
Folosind Anexa I,
z 2,3
1
2
obinem
3.
Z X ' X ' ' m'm' ' /
0,44.
n'
n' '
100 150
300
Astfel,
De asemenea, avem c
1
1
n'
n' '
n'
n' '
2
2
X ' X '' t
n ,1
2
n ,1
2
n
'
n' ' (( n'1) ' 2 n' '1 ' ' 2 ,
S
n' n' '2
1 , Fn
F
t
n
n 1,1
2
n ,1 2
2 se determin astfel inct
iar
fiind funcia de repartiie a
legii Student cu n grade de libertate, tabelat in Anexa II
t
' '2
2
1 6
x' ' k x' ' 14,951
5 k 1
1 1
t
De asemenea, din Anexa II, pentru 1 - = 0,95 i n = 11, obtinem
astfel c intervalul de ncredere pentru m m va fi
n ,1
n ,1
2
2
n 1,1
2,201
2
2
2
dispersia D X i pentru abaterea standard D X , cu probabilitatea de
ncredere 0,95.
X
,
X
k
Xk
n 1 k 1
n k 1
2
n 1 2 n 1 2
; 2
2
h
hn 1,1
n 1,
2
2
iar pentru
n 1 n 1
;
h
hn 1,1
n 1,
h2
unde
n 1,1
h2
i
n 1,
1 11
xk x
10 k 1
Aadar,
10 0,017 10 0,017
;
0,008;0,052 ,
20,5
3,25
respectiv
intervalele
de
10 0,017 10 0,017
0,089; ,0228
;
20,5
3,25
X
4 6 12 10 8 .
Soluie. Deoarece n=40>30 i abaterea standard =3 este conoscut, vom
folosi testul Z pentru verificarea ipotezei nule
H0 : m= M(X)=16, cu ipoteza alternativ H1 : m 16
z0,995
Z X m /
n.
numeric (-2,58;2,58), pentru statistica notat prin
Calculm succesiv:
1 n
1
4 11 6 13 12 15 10 17 8 20 15,8
x xk
n k 1
40
z xm /
3
0,2 40
15,8 16 /
0,422
3
n
40
( X m) /
n , care urmeaz legea Student cu
urmare, intervalul pentru statistica T=
n-1=14 grade de libertate, este (-2,145; 2,145).
Calculm n continuare succesisv:
1 n
1
x x k 1146 76,4;
n k 1
15
1 n
( xk x ) 116,686;
n 1 k 1
t ( x m) /
10,80;
10,80 3,6 15
(76,4 80) /
1,291.
10,80
n
15
990
995
ml)
f k
x k (n
985
990
1000 100
5
11
995
100
0
101
0
100
5
101
0
ml)
f k
1 2 0,495.
1
2
2
astfel nct
Anume, se obine c z0,995 = 2,58,
care ne d intervalul (-2,58; 2,58) pentru statistica :
2 2
Z X X m m
.
n
n
Se calculeaz succesiv:
z
z 0,995 ,
1 n
1
x k
(7 990 9 995 5 1010) 999,375;
n k 1
40
1 n
1
x k (5 985 5 990 4 1010) 997,424;
n k 1
33
z x x /
2 2 999,375 997,424
1,951
1,109
n
n
36 56,25
2,60461
40
33
.
4.13. Se cerceteaz dou loturi de ulei pentru automobile, din punct de vedere
al vscozitii, obinndu-se datele de selecie
x k
f k
10,2
7
3
10,3
2
1
x k
10,2
6
2
f k
10,2
7
1
10,2
9
1
10,3
0
1
10,3
1
3
Fn
n 1
n' n n ,
1 n'
1
x' k
n' k 1
8 (3 10,27+22,28++110,32)=10,285;
x''
1 n ''
1
x' ' k
n' ' k 1
8 (2 10,26+22,27++310,31)=10,289;
1 n'
( x' k x' ) 2
n'1 k 1
3,14310-4;
1 n ''
( x' ' k x'' ) 2
n' '1 k 1
4,98310-4;
'
''
x' x''
( n'1) '' (n' '1) ' ''
2
4 10 1
= 56.882
1 1
10,285 10,289
(22,001 34,881) 10
14
1 1
8 8
56 0,397
2
1
1 1
1
1 1 2 1
1
h2
n 1,
2
;h2
n 1,1
2
de libertate.
nivelul
de
semnificatie
=0,05,
se
determin
intervalul
(n 1) 2
de asemenea
h112 ;0,975
(3,82;21,9).
Se calculeaz succesiv
x
1 n
1
xk
n k 1
12 [1(-0,5)+2(-0,4)++11,5]=0,4167;
1 n
( x k x) 2
n 1 k 1
0,518;
(n 1) 2
h2=
11 0,518
= 0,5 =11,396
4.15 Dou strunguri produc acelasi tip de piese. Caracteristica cercetat este
diametrul acestor piese.Se consider dou selecii de volume n=7 si n=9, relative la
diametrele pieselor produse de cele dou strunguri. Datele de selecie sunt prezentate
prin distribuiile empirice de selecie:
4
2
1
X '
i respectiv
4
2
2
1
X ' '
'
2
Statistica ce se consider n acest caz este F= '
''
' ' 2 , care urmeaza legea
h6,8;0,975
1
f 8,6;0,975
1
5,60
(0,18;4,65).
Se calculeaz, apoi, succesiv:
x'
1 n'
1
x' k
n' k 1
7 (13,4+43,6+23,8)=3,629;
x''
1 n ''
1
x' ' k
n' ' k 1
9 (13,5+43,6+23,7+23,8)=3,656;
1 n'
( x' k x' ) 2
n'1 k 1
0,01905;
1 n ''
( x' ' k x'' ) 2
n' '1 k 1
0,01028;
'
''
'
2
f= ' =1,85.
Avnd in vedere c f=1,85(0,18;4,65), rezult c ipoteza facut, privind
egalitatea dispersiilor , este admis.
4.16. Se cerceteaz capacitatea fiolelor farmaceutice de 100 ml, care provin
de la dou fabrici. n acest scop, se consider cte o selectie pentru dou loturi de
fiole provenite respectiv de la cele dou fabrici. Seleciile obinute au distribuiile
empirice de selecie
100 101 102 103 104 105 106 107 108 109
1
2
3
4
5
4
1
3
1
1
X '
respectiv, pentru X:110, 101, 112, 120, 117, 105, 109, 111, 118, 113, 106, 108, 115,
113, 112, 100, 116, 112, 114, 112.
a) Folosind nivelul de semnificaie =0,02, s se compare dispersiile celor
dou caracteristici;
1 n'
1
x' k
n' k 1
25 (1100+1101+2102++1109)=104,76;
x''
1 n ''
x' ' k
n' ' k 1
111,2;
1 n'
( x' k x' ) 2
n'1 k 1
5,19;
1 n ''
( x' ' k x'' ) 2
n' '1 k 1
27,537.
'
''
''
2
2
'
''
2
Deoarece < , se consider statistica F= ' '
'
' 2 , care urmeaz legea
'' 2 27,537
2
avem c f= ' = 5,19 =5,31.
Pe de alt parte, pentru =0,002, avem din Anexa IV, c
fm,n;1-/2=
f 19, 24;0, 99
=2,76;
1
fm,n;/2=
f 19, 24;0, 01
f 24,19;0,99
1
2,92
=0,34.
care urmeaza legea Student cu n grade de libertate, unde n se calculeaz din relaia
2
1
c2
(1 c) 2
' '' 2
n
n n'1
n' '1 , cu c n'
n
Astfel , pentru determinarea lui n, avem succesiv
5,19
25
0,131
5,19 27,537
1 0,1312 (1 0,131) 2
20
24
19
c= 25
si n
=0,0404604,
de unde n=25.
Folosind Anexa II, se obine c t25;0,99=2,485, prin urmare intervalul pentru
statistica T este (-2,485;2,485).
Pe de alt parte ,avem c
t
x' x''
2
104,76 111,2
6,44
' ' '2
5,11.
''
1,26
n'
n = 0,2076 1,3768
2
media teoretic m=M(X) i abaterea standard teoretic = D ( X ) , folosind metoda
1
m xk x
n k 1
,
1 n
( x k x) 2 2
n k 1
.
14
17
17
18
16
13
10
8 ,
11
de unde calculm
1 n
1
m x xk
n k 1
24 (111,625+141,625++82,125)=1,82;
1 n
2
( x k x) 2
n k 1
=0,129.
N
( f i npi ) 2
np
i
a) Se consider valoarea numeric h2= i 1
, unde N este numrul
claselor (N=9 in cazul de fa), fi este frecvena clasei i , iar pi este dat prin pi =
a x
a x
i 1
n=124
2
h =2,4743
Valorile funciei lui Laplace se iau din Anexa I i se are n vedere c (-x) = -(x).
De asenemea facem observaia c :
a x
a x
p1 ( 1
) ( 0
) (1,32) () 0,4066 0,5 0,0934
n d n x1
, unde
d n max max | Fn (ai ) F (a i ) | .
i 1, N
Aici Fn (x) este funcia de repartiie de selecie, iar F(x) este funcia de repartiie
pentru legea normal N( x , ).
Calculele pentru determinarea lui dn sunt aranjate in tabelul urmtor:
dn=0,044
n d n 124 0,0441 0,491 1,36
Deoarece
, acceptm ipoteza c X
x
,
10
k 1
( X
)0
,
de unde se obine estimatorul de verosimilitate maxim pentru parametrul , anume
1
1
n
1
X
Xk
n k 1
. Prin urmare, estimaia de verosimilitate maxim pentru este
k 1
1
X .
X
de unde obinem:
1 n
1
xk
(13 15 10 45 ... 7 240) 94,5,
n k 1
50
1
0,0106.
x
astfel c
( f i np i ) 2
h
n
k 1
a) Se consider valoarea numeric
, N fiind numrul
p F (ai , ) F (a i 1 , ).
claselor (aici N = 7), fi este frecvena clasei [ai-1, aI), iar i
Valoarea numeric h2 este valoarea unei variabile aleatoare H2, care urmeaz legea X2
cu k = N- s 1 grade de libertate , s fiind numrul parametrilor estimai , n cazul de
fa s = 1 deci k = 7 1- 1 = 5.
h2
F (h 2 ) 1 ,
Se determin k ;1 din Anexa III , astfel nct k k ;1
adic
2
2
F5 (h5;0,95 ) 0,95.
h
11,07
Se obine astfel c 5;0,95
.
2
n=50
h=3,083
p 1 F (a1 , ) F (a 0 , ) 1 e x 0 0,2739.
rezult
se
accept
ipoteza
b) Din Anexa V se determin x1+ = x0,95 astfel nct s aib loc K ( x1 ) 0,95
, obinndu-se x0,95=1,36.
n d n x1 ,
Ipoteza exponenialitii lui X este acceptat dac
unde
d n max | Fn (ai ) F (a i ; ) |, Fn ( x)
i 1, N
fiind funcia de repartiie de selecie.
Calculul pentru determinarea lui dn se efectueaz n tabelul urmtor :
dn=0,0592
4
2
4
2
1
2
Se cere:
a) media de selectie, momentul centrat de selectie de ordinul doi si dispersia
de selectie;
b) funcia de repartiie de selecie.
X
Rspunsuri. a)
0 ,daca x 39 ,50,
2
,daca 39 ,25 x 39 ,50 ,
15
6 ,daca 39 ,50 x 39 ,75
15
8
,daca 39 ,75 x 40 ,00 ,
F15 ( x) 15
12
15 ,daca 40 ,00 x 40 ,25,
14
,daca 40,25 x 40 ,50,
15
1,daca x 40 ,50
b)
5.2. n urma unei selecii de volum n=100, privind caracteristica X, s-au obinut
urmtoarele date de selecie :
xi
fi
10,
5
10
10,5
5
12
10,6 10,6
5
16
25
10,7 10,8
18
Se cere:
a) o estimaie absolut corect pentru media teoretic m=M(X),
0;
Rspunsuri. a) = X ; b) M( )= , D2( )= n
1
2
n
I
(
n
c) I( )= , D ( )=
x
z ;x
z
n 1 2
n 1 2
=(10,61;10,75).
2
1
1 1
1
1 1 2 1
1
Folosind probabilitatea de ncredere 0,95 s se determine intervalul de ncredere
pentru valoarea medie teoreric m=M(X).
X
Rspunsuri t11,1-/2=2,201,
t ;x
t
n 11,1 2
n 11,1 2
m
=(0,0405;0,8745).
5.7. Caracteristicile X si X relative la dou populaii independente, urmeaz fiecare
legea normal, respectiv N(m,) i N(m,), unde =0,005 i =0,0045. Relativ la
aceste caracteristici s-au obinut urmtoarele date selecie:
X : 0,240, 0,240, 0,235, 0,25, 0, 235;
X : 0,220, 0,225, 0,220, 0,225, 0,235.
Folosind probabilitatea de ncredere 0,98, s se determine intervalul de ncredere
pentru diferena m-m.
( x' x ' ' ) z
Rspuns. z1-/2=2,33, m-m
1
n'
n' '
n'
n' '
2
=(-0,0866;0,1166).
5.8. Cu datele problemei precedente, dar == necunoscut, s se determine
intervalul de ncredere pentru diferena m-m.
Rspuns t8;1-/22,896,
1 1
n
'
n' ' (( n'1) ' 2 (n' '1) ' ' 2
s
n' n' '2
=0,0045,
( x' x '' ) st ; ( x ' x'' ) st )
8;1
8;1
2
2 =(0,002;0,028).
m-m(
5.9. Caracteristica X urmeaz legea normal N(m,). Se consider o selecie
repetat de volum n=15 relativ la X cu datele de selecie :
23,1, 22,8, 22,9, 23,0, 22,7, 22,9, 23,2, 22,9, 23,3, 23,2, 23,0, 22,9, 23,1, 23,2, 22,9.
D2 (X )
6,57 h 2 23,68
n 1,1
2
Rspuns.
,
,
(n 1) 2 (n 1) 2
;
2
h2
hn 1,1
n 1,
2
2
=(0,017;0,062),
2
2 ( 0,017; 0,062 ) (0,13;0,25).
5.10. Caracteristica X reprezint media obinut de un student care a promovat
anul I de studii. S se verifice, cu nivelul de semnificaie =0,05, ipoteza c media
h2
n 1,
2
2
teoretic m=M(X)=7,25, dac se consider c = D ( X ) =1,5, i s-a fcut un sondaj
media
5-5,99
6-6,99
frecv.
77,99
6
8-8,99 9-10
7
x m0
401,403,398,98,400,5,399,396,401,5,400,5,398,5.
x m0
Raspuns tn-1,1-/2=2,262 , t=
admis.
16
19
14 ,
8
14
10
7
11
6
X '
x' x''
xk
fk
fk
t25,1-/2=2,787,
x' x''
(n'1) '' 2 (n' '1) '' ' 2
n' n n =-0,953(-2,787;2,787),
3
5
1 ,
2
X
s se verifice ipoteza nul
(n 1) 2
2
0
h=
7,3(-2,16;20,5), ipoteza 2=0,003 este admis.
5.15. Se cerceteaz aceeai caracteristic pentru dou populaii independente,
care este respectiv X pentru prima populaie i X pentru a doua, fiecare urmnd
legea normal N(m, ) i N(m, ). Se consider seleciile de volum n= 10 i n=
12, care ne dau distribuiile empirice de selecie.
1,7 1,8 1,85 1,9 2
,
4
1 1
2 2
2
4
2 2 1
1
X '
X ' '
Raspuns.
9 ,11,
2
4,63,
9 ,11,
2
1
f
0,193
9 ,11,1
2
'2
0,782 (0,193;4,63),
' '2
ipoteza 2 = 2 este admis.
5.16. Pentru a cerceta dac durata de ardere a dou loturi de becuri este
aceeai
s-a luat cte un eantion de 20 de becuri din fiecare lot, care au fost
1210, 970,
1100,
1030.
1170,
990,
1180,
1130,
1140,
1110,
1090,
1100,
1130,
1030,
Raspunsuri: a)
f
19,19,1
2
3,44
19,19,
1
f
0,30,
19,19,1
2
'2
1,41 (0,3;3,44)
' '2
, ipoteza = este admis.
t
b)
t
38,1,1
2,03
Se cere :
18
22
21
19
m x 49,91, 2 1,48
5
3,1
2
7,81 2,5142 h 2
i 1
( f i n p i )
pi
(0,3)
[3,6)
[6,9)
29
41
62
[9,12
)
23
[12,15
)
22
[15,18
)
23
a) h24;1-/2=9,48<60,4985=h2= i 1
b)
nd n
( f i n p i )
pi
, ipoteza exponenialitii este respins.