Sunteți pe pagina 1din 25

Capitolul 4

Esti m area param etri Io r

Iegilor de reparti{ie

1.
1.1

Introducere in statistici
Obiectul statisticii

Metodele de analizd. a rezultatelor experinrentelor qi de definire, pornind de la acestea, a probabilitafii evenimlntelor gi a caracteristicilor variabilelor aleatoare constituie obiectul statisticii rnaiematice, un capitol larg al teoriei moderne a probabilitdlilor.

Pe

experimentale a unei anumite mlrimi, aparc intotdeauna problema preciziei determindrii sale. Astfel. in cazul nostru, intrebdrile care se pun

parcursul unei

mdsurdri

oarecare

sau

determindri

- cu ce precizie oblinem noi probabilitatea unui eveniment inlocuind-o cu frecvenla acestui eveniment? - cdte experimente trebuie sd se fac6 pentru a obline probabilitatea unui eveniment cu o precizie datd? Toate aceste intrebdri trebuie sd obfind un rdspuns, pentru ca sd gtim ce credit sd acorddm datelor obtinute ca urmare a unui-experiment, calculelor bazate pe aceste date, qi iacd putem avea incredere in ele pe parcursul activitdlii noastre practice. Frecvenfa unui eveniment este aleatoare indiferent de numdrul de experimente, din cauza caracterului aleator al rezultatelor experimentelor particulare. De exemplu, dacd noi trebuie sd determindm frecvenla aceluiagi eveniment, vom obline valori diferite ale frecvenfei acestui eveniment. Caracterul aleator al rezultatelor experimentelor particulare
105

sunt urmdtoarele:

Estimarea parametrilor legilor de repafti{ie

face ca frecvenla sd poat6 sd difere notabil de probabilitatea unui eveniment. Astfel, determindnd probabilitatea necunoscuti a unui eveniment, cu ajutorul frecvenlei acestui eveniment pe parcursul unui numdr mare de experimente, nu putem sd indicdm limitele erorii comise qi sd garantdm cd aceastd eroare nu va ieqi din anumite limite. Caracterul aleator alrentltatelor experimentelor, face ca el sd nu poatd avea garar$ia completd cd eroarea nu iese din anumite limite date. De aceea, in statistica matematicd se vorbeqte de obicei, nu de valori apropiate de mdrimile necunoscute, ci de estimdrile lor convenabile. De aceea vom numi carqcteristici statistice toate mdrimile care trebuie sE fie estimate (probabilit{ile evenimentelor, caracteristicile numerice gi distribuliile variabilelor aleatoare). Valorile caracteristicilor statistice, calculate pornind delarentltatele experimentelor, le vom numi
estimdrile lor.

Dupd ce am estimat caracteristicile statistice, plecdnd de la rezultatele experimentelor, este normal a pune intrebarea: in ce m6surd concordd cu datele experimentale, ipoteza prin care caracteristica necunoscutd are valoarea pe care noi am gdsit-o prin procesul de estimare? Apare astfel a doua clasd de probleme a statisticii matematice, problema de verificare a ipotezelor. Astfel, principalele probleme ale statisticii matematice sunt: - elaborarea metodelor de calcul a estimdrilor gi studiul preciziei cu care acestea aproximeazd caracteristicile estimate; - elaborarea metodelor de verificare a ipotezelor.

1.2

Forme de convergen$ in probabilitate

DatoritS caracterului aleator aI rezultatelor experimentelor nu se poate vorbi de convergenld in sensul obignuit al termenului. De aceea devine necesard introducerea noilor nofiuni de convergenld gi de limit6, diferite de acelea care sunt in general adoptate in analiza matematicd
elementard.

Defini.tie: 1) qirul de variabile aleatoare {Sn} este convergent tn


medie

pdtraticd (convergentd m.p.) cdtre variabila aleatoare S dacS:

Ml S" - S lt -+ 0, cAnd n ->

oo.

(4.1)

106

Estimarea parametrilor legilor de repartitie

2) girul de variabile aleatoare {Sn} este convergent tn probabilitale (convergentd P.) cdtre variabila aleatoare S dacd, pentru oricee)0,avem:
P ( lS"

- Sl > e ) -+ 0, c6nd n -+ oo.

(4.2)

3) qirul de variabile aleatoare {Sn}este convergent qproape sigur (convergentd S.) c5tre variabila aleatoare S dac6:
P (Sn

+ S):1.

(4.3)

Aceste definilii se referd la fel de bine at6t la variabile aleatoare scalare cdt qi la variabilele vectoriale de dimensiuni finite.

1.3

Inegalitatea lui Cebigev

Este clar - in mod intuitiv - cd orice serie convergentd (m.p.) converge 9i (P.) cdtre aceiaqi limitd. Pentru a demonstra aceastd afirmalie, stabilim mai intdi o inegalitate importantd in teoria probabilitSlilor. Propozi{ie Fie o variabild aleatoare X, atunci pentru orice

e>0gip>0avemrelalia:
P(xl> r) < Demonstralie
Astfel, pentru orice
e
I

-Mlxlp.

(4.4)

> 0, p ) 0 avem:

e(xl> e)= Jr(')a"

l*lt'

JlxlPr(x)ox = e'lxl>e

<

(4.s)

=+j.l'r(x)dx=irl*lo
Aici, in prima qi in a doua integrali, inegalitatea ce figureazd sub semnul integralei semnificd faptul cd domeniul de integrare este ansamblul tuturor valorilor "x" care verificd aceastd inegalitate. Aceastd inegalitate este de obicei numitd inegalitatea lui Cebiqev. in momentul aplicdrii practice a acestei inegalitSli, numdrul p > 0 este
ales astfel ca: MIXIP <
"o.
107

Estimarea parametrilor legilor de repaftilie

Aplicdnd inegalitatea @.$ la variabila aleatoare


oblinem pentru

p:2:

X:

Sn

S,

P(ls" -sl
Observalii:

>, )< -f vrp, - sl'.

(4.6)

- din convergenla (m.p.) rezultd, convergenla (P.); - orice qir de variabile aleatoare {Sn} care converge (S.) c6tre limita S, converge qi (P.) cdtre limita S; - o serie de variabile aleatoare poate fi convergentd (P.), dar nu neapdrat convergentd qi (m.p.) sau (S.). Ea poate fi convergentd (S.) dar nu neapdrat convergentd qi (m.p). Mullimea de serii convergente (m.p.), ca gi mullimea de serii convergente (S.) sunt submullimi ale seriilor convergente (P.) qi aceste doud submullimi au o interseclie nenuld. Convergenja in probabilitate, convergenla tn medie pdtraticd gi convergenla aproape sigurd reprezintE formele particulare probabiliste de convergen!6.

1)

probabilitate (distribuf ia Cauchy) urmitoare


fn

Fie {S"} un $ir de variabile


(t) = n l+ n2s2

aleatoare cu
:

ln =1,2,...)
a qirului.

Verificali convergenla in probabilitate $tiind c6:

p(s"l. r)=

Jr,(s)as =

ln? dt 2 | - -, = -arctg (ne)-+ 1, cdnd n -) oo, n :^l+t'


Tc
-llc

Atunci P (ls"l > s) + 0, pentru orice e > 0. De aceea,girul {Sn}converge in (P.) cdtre 0. Totuqi, se poate demonstra cd pentru orice valoare n, MlSnl'z : oo, astfel inc6t girul {Sn} nu converge (m.p.) cdtre 0. 2) Fie Sn o variabilS aleatoare care poate lua dou6 valori 0 gi I cu probabilitdfile 1 - (lln), respectiv 1/n, astfel incdt pentru orice valori rr1, fr2,.. ., q viri&bilele aleatoare Sn1,. . . .,Snk sunt independente.
108

Estimarea parametrilor legilor de repaftitie

Seria {Sn}converge (P.) cdtre 0 deoarece pentru orice e, 0 < e


avem:

1,

P(ls"ltr
0<e<1, avem:

)=P(S,,

-t)=l+o n

pentru n -)oo
e,

Totuqi, acest gir nu converge (P.S.) cdtre 0. intr-adevdr pentru orice

P(lsn'l< e,vm > tr )< p(lS,"l< r,vm,n < m < N )=


N

J],r(t-

o) =

n-l n

N-2N-l_n-l

Rezult6, in virtutea caracterului arbitrar al lui N, cd pentru orice "n", probabilitatea P( lS'l< e, V m > n) este inferioard oricdrui numdr pozitiv oricdt de mic. Aceasta semnificd faptul cd probabilitatea de convergenfd a girului {S'}este egal6 cu 0, altfel spus cd {S"} nu converge (S.) cdtre 0. Remarcdm ci seria {Sn}, in acest caz, converge (m.p.) cdtre 0,
deoarece:
Mlsnl'z

Iln-+O,

c6.nd

n-)

oo.

Avem astfel wr exemplu de qir de variabile aleatoare convergentA G) qi


m.p.). dar non con 3) Fie Sn un qir de variabile aleatoare poate lua doud valori posibile 0 qi "n", cu probabilitdlile 1-(l/n)'? , respectiv 1/n2. Seria {Sn}converge (P.) cdtre 0, fiind dat cd pentru orice 0 < $i orice "n" suficient de mare avem:

P(lsrl

- r ):

P(sn

- n)= +

n-

-0

pentru n ->

oo.

$irul {S"}converge qi (S.) cStre 0, deoarece:

P(s-l ) a, pentrucelputinunm ) n; <

fn(s.

= m)=

=I

co1

1n-n ITI-

-)'

'= -+ 0. oentru n -+ oo

109

Estimarea parametrilor legilor de reparti{ie

gi, in consecinfd, P(lS- < sl, V, m > n) -) 1, cdnd + oo, aceasta demonstreazd convergenla girului {Sn}cdtre 0, cu probabilitatea 1, adicd convergenla (S.). Totuqi, girul {S"} nu converge (m.p.) cdtre 0, deoarece Mls"l'z: 1 pentru orice "n". 2.
2.1

Estimarea caracteristici lor statistice


Estimdri

Se considerd de obicei in statistica matematicd numai variabile aleatoare reale. Aceasta nu limiteazd generalitatea rezultatelor, deoarece orice variabild aleatoare complexd poate fi consideratd ca un vector aleator bidimensional cu coordonate reale. De aceea considerdm peste tot, in acest capitol variabilele aleatoare, prin acestea infelegdndu-se funcliile variabilelor aleatoare, ca variabile reale. Rezultatele experimentelor sunt considerate variabile aleatoare. De aceea vom nota rezultatele experimentelor qi toate funcfiile oblinute cu ajutorul rezultatelor experimentale prin majuscule. in momentul aplicdrii practice a formulelor obfinute, se convine sd se inlocuiascd in aceste formule toate variabilele aleatoare prin valorile 1or, oblinute ca urmare a experimentelor efectuate. Definilie: - orice funclie obfinuta cu ajutorul rezultatelor experimentelor, care nu depinde de caracteristicile statistice necunoscute, se numeqte statisticd. - se numeste estimare a caracteristicii statistice 0, o statisticd a cdrei rcalizare, obfinutd cu ajutorul experimentelor, este adoptatd ca o valoare reald necunoscutd a parunetrului 0. Este clar cd o

statisticd oarecare nu poate sd serveascd ca estimare pentru o caracteristicd statisticl dat6. Cum rezultatele experimentelor sunt
aleatoare, orice statis ticd rcpr ezintd o variabild aleato are.

Pentru ca o statisticd sd poatd servi ca estimare a unei caracteristici statistice dat60, trebuie ca distribulia acestei statistici sd fie concentratd suficient de aproape de valoarea necunoscutd 0, astfel ca probabilitatea abateri acestei statistici de 0 sd fie suficient de redusd. in acest caz, o aplicare sistematicd repetatd a acestei statistici, in scopul estimdrii caracteristicii date, va permite obJinerea, in medie, a unei precizii suficiente de aproximare. Se poate observa cd mdrind numdrul de

ll0

Estimarea parametrilor Iegilor de repaftilie

experimente, precizia rezultatelor estimdrii se mdreqte. Aceasta conduce la definifiile urmdtoare relative estimdrilor. Definifie: o estimare @ a caracteristicii statistice 0 este numitd consistentd dacd ea converge in probabilitate cdtre 0, cdnd numdrul experimentelor "n" creqte spre infinit. Propozilie Pentru ca estimarea caracteristicii 0 si fie consistentd este suficient ca media sa sA tindd cdtre 0 gi ca dispersia sa sd tindd cdtre 0, cAnd num6ru1 "n" de experimente cregte cdtre infinit. Defini{ie: - estimarea @ a caracteristicii statistice 0 este Jdrd deplasare dacd media sa M@ este egald cu 0 pentru orice numdr dat "n" de experimente. - estimarea @ a caracteristicii statistice 0 este deplasatd dacd media sa M@ nu este egald cu 0 .

l;,-T,'.tJ"::J#:;i L'i#"'Tt"8; ^"r;::y;:tXY.?.;,1 modulului pdtratului abaterii estimdrii fala de caracteristica estimatd (eroare medie patratica) 5 : Ml@_Ol'z. ln cazul unei estimdri ftrd
S

".

"

deplasare @, eroarea medie

pitratic[

coordonatelor estimdrii @, in cazul unei caracteristici vectoriale 0. Mulfimea numerelor 6, corespunzdnd tuturor estimdrilor @ a caracteristicii date 0 pentru un numdr dat de "n" experimente, posedd, ca orice mullime de numere nenegative, o limitd inferioard exactd:

cazul unei caracteristici scalare,

qi suma dispersiilor

6 reprezinti dispersia estimdrii @, in

6o = i6f rvtlo

el2

(4.7)

Este normal sd fie fiilizate estimdrile care au eroarea medie pdtraticd 6 egal6 cu 66 sau apropiatd de 60. Se dovedegte util in numeroase cazuri, pentru a gdsi astfel de estimdri, sd se utilizeze noliunea de statisticd suficient[. Defini(ie: statistica S (scalard sau vectoriald) este suficientd, pentru caracteristica 0, dacd pentru orice altd statisticd S', cunoagterea

valorilor acestei statistici nu aduce nici


referitor la 0, fa!d, de aceea conlinutd in S.

informalie suplimentarl

llt

Estimarea parametrilor legilor de repartilie

2.2

Intervale gi domenii de incredere

Caracterul aleator al experimentelor face imposibild gdsirea valorilor limitd pentru care putem afirma cu o precizie absolutd cd eroarea de estimare (adicd abaterea estimdrii de la caracteristica de estimat ) rdmdne in limite admisibile. Tocmai de aceea se pune problema ca, plecdnd de la rezultatele experimentelor, sd se determine limitele admisibile pentru eroarea de estimare, de la care aceasta nu se abate
decAt cu o probabilitate datd, (estimare

prin interval de incredere).

Adoptdnd frecvenla P a unui eveniment in calitate de estimare a probabilitdlii sale "p", ar fi de dorit sd stabilim, plecdnd de la rezultatele aceloraqi experimente, o anumitd limitd a abaterilor posibile ale estimirii P fatd de "p" astfel incdt modulul erorii lP - pl sd rdmdnd inferior acestei valori cu o probabilitate datd a. Aceast5 limita va fi de asemenea aleatoare in virtutea caracterului aleator a rezultatelor experimentelor. Astfel, trebuie sd se giseascd, plecdnd de la rezultatele experimentelor, un interval aleator (adicd un interval ale cdrui extremitdli sunt aleatoare) care cu o probabilitate datd u, sd confind valoarea necunoscutd a probabilitalii "p".

Defini{ie: - intervalul aleator determinat in totalitate prin rezultatele experimentelor qi care nu depinde de caracteristici necunoscute, care conline cu o probabilitate dat[ o caracteristica statisticd scalard necunoscutd 0, se numeqte interval de tncredere pentru aceastd
caracteristic6. - probabilitatea a se numegte coeficient de incredere qi cantitatea 1-o, se numegte nivel de semnifica[ie al abaterii estimdrii. Limitele intervalului de incredere se numesc limite de incredere. Generulizarea noliunii de interval de incredere in cazul unei caracteristici vectoriale 0 conduce la noJiunea de domeniu de incredere. Defini{ie: se numeqte domeniu (interval) de tncredere pentru o caracteristicd vectoriald 0, corespunzdnd coeficientului de incredere o,, orice domeniu aleator intreg determinat prin rezultatele experimentelor gi

nedepinzdnd de caracteristicile necunoscute, probabilitate o, valoarea necunoscuti 0. tt2

care confine, cu

Estimarea parametrilor legilor de repaftitie

Este evident c6" domeniul de incredere este definit prin coeficientul de incredere o, intr-un mod neunivoc. Existd o mullime
infinitd de domenii de incredere corespunzAnd unei singure gi aceeagi valoari o. Se incearcd de obicei sd se defrneascd domeniile de incredere
av6nd dimensiunile minime pentru o probabilitate datd a.

2.3 Metodele de determinare a domeniilor de incredere Pentru

a determina intervalele qi domeniile de incredere

se

utllizeazd" de obicei trei metode principale. o Prima metodd o

Metoda este utilizatd.

in

bazatd" pe cdutarea legii de reparti[ie a raportului parametrului 0 Si acest parametru, Cunoscdnd aceastd distribufie, se poate gdsi:

cazul unui parametru scalar 0 qi ea este dintre estimarea @ a

- probabilitateaapartenenlei raportului @/0 la orice interval;

- invers, plecdnd de la o probabilitate datd. o, se gdsegte intervalul pentru care probabilitatea ca raportul @/0 sd-i apa{in6,, sd fie egalS cu o. Orice interval de acest gen va fi un interval de incredere pentru parametrul 0. Se incearcd de obicei sd se oblind un interval de incredere simetric in raport cu estimarea. Aceasta nu este totuqi intotdeauna posibil. In anumite caztxi,limita de incredere inferioard, este negativS, ceea ce nu are sens. De aceea intervalul de incredere pentru un parametru pozitiv 0 este definit prin formula: max{ o,(t

-roF }. e < (t + "oF.

(4.8)

ro

)1,

Cdnd eoelO, 1], acest interval este simetric in raport cu @. Cdnd aceastd simetrie nu existd. Inegalitatea (4.8) este verificatd dac6:

l@ l+eo

(4.e)
e

max{o,

(1

- uo )}
0,

Formula (4.8) definegte un interval de incredere pentru


corespunzdnd coeficientului de incredere a, dacd eo verificd ecuafia:

P( r .9. e,, e
[1+

max {0,1-Ea}

,t

-):o.
)

(4.10)

113

Estimarea parametrilor legilor de repartilie

A doua metodd o

Metoda constd in faptul cd" pentru fiecare valoare posibild a parametrului necunoscut 0 se alege un domeniu conlindnd pe 0, astfel tncdt probabilitatea ca estimarea @ sd aparlind acestui domeniu sd fie
egald cu a.In cazul general, acest domeniu depinde de 0 qi bineinleles de o. Din acest motiv il notdm Da(O). Putem scrie atunci:

P(@eno(e);=6p.

(4.11)

Se determind apoi pentru fiecare valoare fixd a estimdrii @, o mullime de valori a parametrului 0 pentru care @eDc,(O). Aceastd mullime notatd cu:

a*(@): {e:@eDo(e)}

(4.r2)

depinde in cazul general de @ qi de o, . Este evident cd OeAo(@), dacd gi numai dacS @eDo,(0) pentru acest 0. Intr-adevdr, dacd pentru o valoare datd, a lui 0, estimarea @ ia o valoare 0eDu(0), atunci prin definifia domeniului Ao(0), valoarea datd, lui 0 aparJine lui Ao(0):

ee{e:@eDo(e)}=1"(e).
Invers, dacd, estimarea @

(4.13)

0, astfel inc6t pentru 0e {0: @eDo(O)}, atunci 0e Do(O). Avem, in consecin!6, orice 0:
valoare
e( e e n" (o) )= p(o e no (e))=

a luat o

a.

(4.r4)

Aceastd egalitate aratd. c6. domeniul Du(@) reprezintd un interval de incredere pentru parametrul 0, corespunz6nd coefrcientului de incredere
0,.

Dificultatea principald in aplicarea practicd a metodelor expuse este gdsirea distribuliilor pentru estimatorilor. In determinarea estimdrilor caracteristicilor statistice qi a domeniilor de incredere, plecdnd de la rezultatele experimentelor, se considerd de obicei cd experimentele sunt
independente.

tt4

Estimarea parametrilor Iegilor de repartilie

A treia metodd o Metoda este bazatd pe gdsirea unei funclii scalare g(@,S,0) dependentd de estimarea @, de o altd statisticd S qi de parametrului
o

necunoscut 0, avdnd proprietdlile urmdtoare: 1) pentru orice valori "s" ale statisticii S qi pentru orice valoare 0 inegalitatea <p(@,S,O) ( c, c > 0, determind cdnd "c" creqte, o familie monotoni crescdtoare de domenii de incredere D(s,0,c)

2) <p(0,s,0) : 0 pentru orice s, 0, gi 0 : 0, iar <p(0,s,0) > 0 pentru orice 0, s,0 qi 0*0 gi, in consecinfd, punctul 0:0 aparJine domeniului D(s, 0, c) pentru orice valori c > 0, s, 0; 3) distribufia variabilei aleatoare T : tp(@,S,O) nu depinde de 0. Cunosc6nd distribufia variabilei T : <p(@,S,0) se poate determina o valoare tu) 0, astfel incAt va fi verificatd inegalitatea g(@,S,0) ( acu o probabilitate o:

{ 0 : q(0, s, 0) <c};

e(rp(o,s,e).ro)=o.

(4.1s)

Aceastd formuld determind un domeniu aleator <p(@,S,O) < eo cdruia valoarea necunoscutd a parametrului 0 ii aparfine cu o probabilitate o, adicd domeniului de incredere a lui 0 corespunzdtor coeficientului de incredere a . Este dificil sd se reprezinte domeniile de incredere multidimensionale. Motiv pentru care se pune problema de a gdsi intervalele de incredere I1(@), ... ,I.(@) pentru coordonatele 01,...,0. & parametrului vectorial e, astfel incdt intervalele corespunzdtoare sd cuprindd simultan toate valorile 0r,...,0. cu o probabilitate o datd. Introducem evenimentele Ar: {0telr(@)} (k: 1,....,r) $i notdm domeniul format de intervalele I1(@), ...,I.(@) in spafiu cu "r" dimensiuni prin I(@). Atunci:

r(e

=,(6)):'[!,^-)

='-'[!I-) ='-*r,r(x*)

G)6)

Rezultd cd, pentru rezolvarca problemei puse, este suficient sd gdsim intervalele de incredere h(@),...,I.(@) pentru coordonatele vectorului 0, corespunzdnd nivelului de incredere 1-(1-cl)/r. in acest caz,

ll5

Estimarea parametrilor legilor de repaftilie

rezultatele experimentelor precedente. Presupunem in plus cd probabilitdlile evenimentelor observate qi distribuliile variabilelor
aleatoare observate nu se modificd de la un experiment la altul. Astfel, in cele ce urrrreaz[. se va considera cd rezultatele aleatoare ale diferitelor experimente sunt evenimente independente qi cd variabilele aleatoare posedd aceleagi probabilitdJi gi aceleagi distribu{ii pe parcursul

probabilitatea ca valorile 01,...,0. sd aparfind intervalului cdutat nu va fi inferioard lui o. De fapt in numeroase cazui, ea poate fi superioard lui o. Dificultatea principald in aplicarea practicd a metodelor expuse este gdsirea distribufiilor pentru estimafii. tn dete.-ioarea estimdrilor caracteristicilor statistice qi a domeniilor lor de incredere, plecdnd de la rezultatele experimentelor, se considerd de obicei cd experimentele sunt independente. Conform acestei defini1ii, estimdm cd experimentele sunt independente dacd probabilitatea oricdrui eveniment gi distribulia oricdrei variabile aleatoare, pe parcursul fiecdrui experiment, nu depinde de

experimentelor. Gdsirea estimdrilor pentru caracteristicile statistice se numegte de obicei estimare punctuald qi gdsirea intervalelor de incredere se numegte estimare de interval .

3.

Frecven{a ca estimare a probabilitefli

3.1 Consistenfi t Fie "p" probabilitatea necunoscutd a evenimentului

care ne

intereseaz[ gi P frecven]a de aparilie a acestui eveniment pe parcursul a "n" experimente, consideratd ca o variabilS aleatoare, fiind o func{ie a rezultatelor aleatoare a experimentelor. Se studiazd frecvenfa qi P ca o estimare a probabilitdlii evenimentului A. Fie Xr realizarea evenimentului A in cadrul experimentului de ordin "k". Aceastd variabild are doul valori posibile 0 qi 1, ale c[ror probabilitdfi sunt respectiv egale cu e: I - p $i p. Media MXp qi dispersia DXl sunt definite:

DXt :

MXt:0'q * l'P: P' (0 - p)'.q + (1 - p)2.p: p2 q+ q2 p :

pq

(4.r7)

ll6

Astfel, toate variabilele aleatoare X1,...,Xn au aceeagi medie qi pe dispersie, respectiv egale cu "p" 9i "pq". Frecvenla evenimentului A parcursul a "n" experimente este:

P=

1i"u
t ri--r

(4.18)

Media gi dispersia estimatorului sunt:

Mp=Ii*u=!1np;=p, n nk=t
$1

(4.1e)

DP=+ioto'- ={(npq)=T n
ntEt nL

(4.20)

Obserua(ie; media frecvenlei evenimentului este egald cu probabilitatea sa qi cd iispersia frecvenlei tinde cdtre 0 c6nd numdrul experimentelor "n" cregte ta inn*t. in consecinla, frecvenla unui eveniment converge in medie pdtraticd (m.p) cdtre probabilitatea sa, cAnd n-> oo . Dar rezultd din (P). convergenld in medie pdtraticd (.tt.p) qi convergenla in probabilitate Arif.t, frecvenla unui eveniment converge tn probabilitate (P) cdtre probabtiitatea acestui eveniment cdnd numdrul experimentelor cre$te cdtre infinit.

3.2

Intervale de incredere

Pentru a gdsi intervalele de incredere pentru probabilitate se utilizeazdde obicei a doua metodd. Pentru fiecare valoare a probabilitdlii pe(0,1) se defineqte un interval:

D"(p):
p(t

(ao(p),

b"(p))

(4.2r)

ale cdrui extremitSli sunt determinate plecdnd de la condiliile:

. u*b))= r(",,(p))= 1-+,


(4.22)
=

t(p

b* (p)= I - F(b" (p)) < | tt7

-+,

Estimarea parametrilor legilor de repartilie

unde F este funclia de repartilie a frecvenfei, adicd funclia de repartilie a distributiei binomiale :

F(")=
Vom avea afunci:

.Io.*o*o'--r[*

+)

(4.23)

p(p. D"b))= P(uob)= P. b"b))=


= p(p Deci:

. u"b))*p(""b)<

p)> 1 -(1 - u t 2) +1 -(1 - a t2) = s.

Pp e Do

b)]- "

(4.24)

Semnele > aici gi < in (4.22) in loc de egal provin din faptul c6, prin caracterul discret al frecvenlei. egalitalile exacte in regula generald nu sunt accesibile. Pentru a determina inten'alul de incredere , 'I /^\ { ur ^ A" [p)= {R : u" (p) < P < b" (p) } este suficient sd se gdseascd limitele sale rezolvdnd inegalitalile:

a.$)< P, P.u"(p).

(4.2s)

in locul acestora se utilizeazd de obicei urmdtoarea construclie grafrcd: - se determinA a"@) $i bo$) pentru fiecare pe(0,1); - se construiesc in sistemul de coordonate (p, p)' curbele p
ao(I))

qi 0

bo(I)) (fig. a.1)

Aceste curbe definesc pentru fiecare valoare a lui "p" pe dreapta verticala corespondentd un interval Do(p) : [ao(p), bo(p)]. Este evident
cd invers, pentru fiecare valoare

p a frecvenlei F
:

aceste curbe determind

pe dreapta orizontald corespondentd un interval

A" 6)=

{p'p .

lao (p),bo(p)) ],
,^
\

reprezentilnd realizarea intervalului de incredere A" \P/, corespunzdnd unei realizdri date p a frecvenlei P (ng. +.t).
118

Estimarea parametrilor legilor de repartilie

p = b"(p)

0:

u*(p)

Fig.4.1 Limitele intervalului de incredere (legea binomiald).

in

virtutea caracterului discret al frecvenlei, curbele p: bu(p) sunt curbe de tip scard cu:

aa(P) qi

- o indllime pe fiecare scari egal6 cu 1/n; - o ld1ime pe fiecare scard egald cu lungimea intervalului
in scard se

corespunzdnd valorilor "p" pentru care ao@) respectiv b"(p) conservd o valoare constantd pdnd la varialia urmdtoare printr-un salt de lungime 1ln.

Totugi din ralionamente de simplitate, curbele


inlocuiesc de obicei prin curbe continue.

Determinarea aproximativi a intervalelor de incredere rtn't de experimente este mare (practic cdnd CAnd numdrul n> 100), determinarea intervalelor de incredere pentru "p" se simplificd considerabil. Distribulia binomiald, pentru un numdr "n" suficient de
mare de experimente, diferd pufin de distribulia normal6. Aceasta permite pentru valori mai mari ale lui "n", sb se utilizeze funclia de repartilie normald in loc de funclia binomiald exactd in determinarea aproximativd a intervalelor de incredere pentru probabilitate.

3.3

ll9

Estimarea este distribuitd normal, oblinem in virtutea simetriei distribu{iei normale gi a formulelor (4.19) qi (4.20) relatiile: Presupundnd cd frecvenla

u"(p) = p -

rcr

J;q|",

b*(p) = p * tcr Jw1",

(4.26)

unde eo este definit prin ecuafia:

t[|, - nl . "o,f]

= 2o(eo ) = cr'

(4.27)

Rad5cina eo a ecualiei (4.27) este determinatd practic cu ajutorul tabelului 1 (ANEXA). Cum to nu depinde de "p", curbele 0 = u"(p) qi elipsd porliune acest caz reprezintd 0=

b"(p)

in

de

n(p-p)2 =r3p(1-p) cu centrul in punctul p

dreptele verticale p 0 si p I (frg. 4'2)' Limitele de incredere Pt, Pz se calculeazd in acest caz u$or plecdnd de la ecualia elipsei pe ca.re o rezolvdm in raport de "p":

: 0 :112, tangentd la

p
1

0,8 0,6 0,4

u=7
/,, // //

0,2

,/t=":t 0,2 0,4 0,6 0,8

1p

Fig.4.2 Limitele intervalului de incredere (legea normald).

120

L1)LZ--

i'*"7 lz" rd 1 | I I -, I+e'"ln l+e'"ln


cd, abaterea

a-^

(4.28)

4n2

Formula (4.20) aratd,

medie pdtraticd a frecvenlei este

invers proporlionald cu Jn. Deci, precizia estimfii probabilitdlii creqte cu numdrul de experimente proporlional cu Jn .

Ex
a 100 de experimente, evenimentul A a fost tealizat de 68 de ori. Astfel frecvenla F a evenimentului A a luat valoarea 0,68. Gfsili : intervalul de incredere pentru probabilitatea p P(A) corespunzdnd unui : coeficient de incredere o 0,95. Cum numdrul de experimente "n" este mare, in acest caz) Se poate considera cd frecvenla P este distribuita aproximativ normal 9i se aplicd metoda aproximativd. Conform cu (4.27) gdsim, plecdnd de la tabelul 1

p"

prt*t*t

(ANEXA) al funcliei Laplace o(u), valoarea so a argumentului "u" pentru care funclia este egal6 cu ul2:0,415' Oblinem eo: 1,96' Gdsim atunci, dupd formub @.28) pl =0,583, p2x0,763 : Astfel, intervalul de incredere pentru probabilitatea p P(A),
.

: 0,95, este in acest caz corespunzdnd coeficientului de incredere o, intervalul (0,583; 0,163). Acest interval reprezintdtealizarea intervalului : aleator (Pr, Pz) care conline, cu o probabilitate 0 0,95, probabilitatea necunoscutd p : P(A).
4.

Estimarea mediei 9i disPersiei unei variabile aleatoare


Estimarea mediei
a mediei unei variabile aleatoare X, valorilor sale experimentale Xt,....',)G (sau

4.1

este media aritmeticd a media de egantionare X):

I o estimare naturald tvx

MX=X=!
t2l

n k=1

i"u

(4.2e)

valorile experimentale Xr,...,Xn sunt variabile aleatoare reale.


Media qi dispersia estimatorului

sunt date de expresiile:

MX=1 ltvxo, DX --:- Iknn, t p=l n- p,q=l


unde

1nln

(4.30)

knn:rncr$*[.

in

cazul. particular

al variabilelor necorelate Xr,...,X", aceasti

ultimd formuld devine:

DX:i
1

o- p:l

IDo,

(4.3r)

(p:1, . . ., n). in catut in care variabilele Xr,...)G nu sunt corelate qi posedd aceleagi medii gi respectiv aceleagi dispersii lvD( qi DX, formulele
unde

Do:

kpp

oblinute ne dau expresiile:

MX = !(n .tvD() =

nnzn

r\D(,

DX =

4f"

.DX) =

+.

g.32)

Rezultd cd media de eqantionare a unei variabile aleatoare converge (m.p) cdtre media sa aritmeticd cdnd n-+ co. De asemenea, rczultddin convergenla (m.p) qi convergenla (P.). Astfel, media de eSantionare a unei variabile aleatoare ale cdrei momente de prim ordin Si de ordin secund sunt finite converge (P.) cdtre media sa cdnd numdrul "n" de experimente cregte nedefinit' ln virtutea teoremei lui Cebiqev qi a primei formule (4.32) media de eSantionare reprezintd o estimare consistentdfird deplasare a mediei une i v ariab il e al e ato ar e.

4.2

Estimarea disPersiei X

t o estimare naturald nx u dispersiei unei variabile aleatoare


este dispersia de egantionare

DX

t22

DX=Dx:rik* n
k=t

-x)t.

(4.33)

1) Pentru a calcula media gi dispersia acestei estim5ri, linand cont de faptul c6 MXp MX = MX, reprezentdm relafia (4.33) sub forma:

DX =

r:kl ixfl .,'koll / :[ik?f 'l nli=t" -zxo k=l nfi'N -xof
=

:likf nfi' -k'f

ss4)

Vom avea atunci:

urx=:i*k?l -Dx= \ / =:Io"o n;r n?l \ r/ -rk-'f


=lnpx-DX=n-lDX
Astfel am obfinut: (4.3s)

rrrrnx=t-1DX.
n

(4.36)

Aceastd formuld aratd cd dispersia de eqantionare este o estimare deplasatb a dispersiei DX , deplasare fiind egald cu (-D)Un). Pentru a calcula dispersia estimdrii, DXgdsim mai intdi 2)
momentul sdu ordin doi

M(DD2. Avand in vedere faptul

c5:

^ . (rx)2
Avem atunci:

=+l

Iftflr | -:(x'IIF?I.f*',I r-Lr.=r k=l '


nH

.1

[l

, ^n1'

)l

tr Ir / -\? /

e37)

123

Estimarea parametrilor legilor de

repaL
/

'l LtIkl =t

l-

n,

r.

12 tr r \,{

| :i*kfll.I'kflf'kif
k=t
k+l

=
(a.38)

=nV4 + n(n

-t\r3;
kfl

'[k' I >k I] = ;*.]1i"fl

=#f-i'kl .)'ktl*klr]
'kof
=

^="

e3s)

i'[:"*]-

="o[p,-k I .,]'klr'kl I] :
-t)tti =-------------;-n'
pa + 3(n
a
.

(4.40)

nnde pz : DX qi p+ desemneazd. al doilea, respectiv al patrulea moment central al variabilei X. Obfinem dupd cdteva transformdri elementare:

^ vrlDx;2

. :=|1"'o n 'tl * ^'l r [ 6-t)p'|.+[1,0

n-

n-

"l g.4r) *:('-t)pjJ

Putem gdsi atunci dispersia estim[rii

iX:

nox

rrrpx)2 -

(tot)t

-p7 _zl',0 -zp|) *pq _pq :n-""-*


Pentru

-3rr7

(4.42)

a stabili aceste formule, am utilizat


Formulele (4.36) qi

independenla rezultatelor

experimentelor X1,.. .,Xn.

$.a\
nnX

aratd

cd MDX -> DX, DDX -+ 0,

cdnd

n-+

co. Astfel estimarea

converge (m.p) cdtre DX. Rezultd 9i

124

Estimarea parametrilor legilor de

cd estimarea

ODX converge (P.) cdtre DX, adicd se verificb proprietatea de consistenld a estimAdi DDX. Itl Pentru a obline o estimare ftr6 deplasare consistentd a dispersiei DX, este suficient, cum aratd (4.36), sd inmullim estimarea DX "" r/(n-l). ObJinem astfel estimarea:
_ I n n Dx=-'l-pa=-"-pl l(xr-x,f. n-lfr' n-1 n-l n I tl , _\? @.43)

in virtutea relaliei (4.42) dispersia

acestei estimdri este definitS prin

formula:

., r o\ ^) 2\P+ -2Pi ) ttq -3ttl v4 - v; :-----=-=-:* ^ = n .-----i ODX n(n - 1)' (n - 1)' (n - 1)' --!.

9.44\

cazul particular al unei distribulii normale a unei variabile aleatoare X, am ardtat cd It+: 3(tt)'(conform 3'38), qi formula (4.44) se pune sub forma:

in

_zDx2 DDX _2v7 = -!-Z- =

;-

n-1

n-1

(4.4s)

estimdri, calcul5m eroafea Pentru a putea compara cele ^doui medie pdtraticd a estimfii deplasate DX a dispersiei DX in cazul unei distribulii normale a lui X. in acest caz, ttebuie lindnd cont de faptul cd V+:3p], oblinem cu ajutorul relaJiilor (4-36) qi@.a\ relalia: rur(nx

- DXf

[t(o* - DX)' + upx =filox' .

(4.46)

Rezultd cd estimarea deplasatd este mai precisd decdt estimarea fird deplasare, qtiind cA (2n-l)l{ < 2l n < 2l (n-l).

125

4.3

Intervalele de incredere pentru medie

Problema determindrii intervalelor de incredere pentru medie, considerAnd un numdr arbitrar "n" de experimente, este rezolvatd pentru cazul distribuliei normale a variabilei aleatoare X. Dacd dispersia DX este cunoscutd, atunci este foarte simplu sd gdsim intervalul de incredere pentru medie. Pentru aceasta este suficient de remarcat cd media aritmeticd X, fiind o funclie lineard de variabile aleatoare normal distribuite, este distribuitd normal. Observdm c6:

r['o-

MXl

.'",F)

= 2o(eo) = o

(4.47)

Dup6 ce s-a determinat eo din condilia q(eo) : alZ, oblinem intervalul de incredere pentru MX, corespunzdnd nivelului de incredere u,, sub forma:

X-uortr<t\D(<X+eo

(4.48)

Estimarea mediei pentru o valoare cunoscutd a dispersiei se poate realiza daca se pune problema mdsurdrii unei variabile cu ajutorul unui instrument la care se cunoaqte precizia. in acest caz, media rezultatelor mdsurate este egal6 cu suma variabilei de mdsurat qi a erorii sistematice a instrumentului, iar dispersia este egal6 cu precizia cunoscutd a erorii

instrumentului.

eqantion de 10 pachete svrfi:297;300;295;297;300;310; 300; 300 - SI se calcvleze greutatea medie a eqantionului qi dispersia sa; - Sd se gdseasc[ o estimare fdrd deplasare a dispersiei.

1)

O maqina automatS umple pachete. GreutSlile in grame la un

295;310;

Dupd ce s-au aranjat greutdlile in ordine crescdtoare, efectuam o schimbare de origine x6: 300, astfel u1: xi - x0: Xi - 300. Avem:
I
X;

ui:xi-300
-5

"?
25 25 9

I
2
a

295 295
297
t26

-5
-3

4
5

6
8

297 300 300 300


300 310

-J 0 0 0
0
10 10

9 0 0 0
0

9
10

310

100 100

Total

20-16:4

268

Media egantionului este:

Lui ^ i1:)=0,4etX=Xo U= 10 10
Dispersia egantionului este
:

10 E-

*U=300,49.

DX = a

lo ) ==) 268 l)' i,"; - \0,4)2 =26,8- 0,16 =26,64 lo 1o;l ' - =-:-1
Dx

O estimare a dispersiei eqantionului este:

t DX ={26,64 =29,48. =n-l 9

{Xr, x2,...., xn}o serie statisticd care urmeazd distributia Gauss cu abaterea medie pdtraticd o: 0,31 gi medie necunoscutd "m". Se ia un egantion de mdrime n : 100, media valorilor acestui eqantion este x : 5,2. 56 se gSseascd un interval conlindnd pe "m" cu coeficient de
Fie X
incredere de 95/o (o

0.95).

Dacd se ia un interval de incredere de 2@(eo), conform distribuliei Gauss, avem:

r[x

-,-,F ( m ( x+ eo,tr) : 2@(eo) = o

: 0,475' valoarea Deoarece 2<D(eo) : a:0,95 , rezultd tD(t") corespunzdtoare lui ro, conform tabelului funcfie Laplace, este eo: 1,95 x2. Avemdeci cu un coeficient de incredere de 95 Vo:
127

*-rrff(m(x*2tr8,
,
deci
5,13

< m35,26 cuo

probabilitate de 95%o. nupa u" control zilnrc pe un eqantion de 900 de bile, efectuat la iegirea unei linii de fabricalie pentru bile de ofel, reiese cd greutatea lor urmeazd.o legea iui Gauss de medie X :62,33mg qi abatere o:6,54mg. - Sd se estimeze dispersia teoreticd a producliei zilnice; - Sd se estimeze greutatea medie zilnicd printr-un interval de incredere simetric de nivel 95%. - Care trebuie sd fie mdrimea egantionului pentru a situa greutatea medie zilntcda producliei in intervalul simetric de 4 mg cu o siguranld de 95oh. - Dacd se doreqte situarea greutdfii medii a producliei zilnice, cu acelaqi nivel de incredere, intr-un interval simetric de doud ori mai mic, care trebuie sd fie eqantionul pe care se lucteazd? - Se dispune de un lot de10 bile ale cdror greutali sunt respectiv in mg: 70; 6l; 69 67; 60; 63; 63; 66; 64;73, se poate considera acest lot ca extras la intdmplare din produclia zilncd a uzinei cu un nivel de incredere de 95%? 1. CunoscAnd media qi dispersia eqantionului o, conform (4.33)
avem:

ln DX

'- DX. =n-l


V899

6X

/Foo : .,1--;o = 6,54' ^l=

Vn-l

"

= 6,543 . Laplace

2. Pentru nivelul de incredere 95o/o, tabelul funcliei


fwnizeazl,
deci:

eo: 1,96x2 (vezi


l- J ( rl# -

exerciliul 2). Intervalul de incredere este

62,33

( 62,33 +riffi
128

l-^z
,

61,893m< 62,76

Estimarea parametrilor legilor de

3. Se doreqte sd se situeze greutatea medie zlIrucd

intr-un interval simetric de 4mg cu o siguranld de 95Yo, adicS:

t-l==

lX-ro /-;x+ecr *]=[-L!n

4,m+ 4],

reztltdxo*: 4, deci

2.6,54

n=1i.

4. Mdrimea egantionului variazd invers proporlional cu Jn. Pentru a reduce mdrimea inten'alului de doua od, trebuie sd se
inmulfeascd mdrimea egantionului cu 4' 5. Dacd X este media unui egantion al cu o probabilitate de 95% avem:

"6

popula!ii

X-2 -<X <X+l 1vn -. rin

62,33-r#=i=

62.33+tffi

6. Valoarea X', care este aici de 65.6. este conlinutd in intervalul de incredere. Acest lot poate deci s[ fie considelat ca extras la int6mplare din produc\ia zi\ntcd a uzinei.

5. 5.1

Verificarea ipotezelor pentru parametrii Iegilor de rePartifie


Problemele de verificare a ipotezelor

Problema construcliei domeniilor de incredere pentru parametrii distribuliilor apare ca o problemd de verificare a ipotezelor relativ la acegti parametri. Este evident cd nu poate fi avansatd nici o afirmalie privire la parametrii distribuliei, plecdnd de la rezultatele "*uttA-cu experimentelor. Nu se pot formula decdt supozill pe care le numim ipoteze. Problema verificdrii ipotezelor constd in a stabili dacd ipoteza adoptati corrtrazice sau nu datele experimentale .

t29

S-ar putea să vă placă și