Documente Academic
Documente Profesional
Documente Cultură
FACULTATEA DE TIINE
PROGRAMUL DE STUDIU: MATEMATIC DIDACTIC
FORMA DE NVMNT: CU FRCVEN
TESTAREA IPOTEZELOR
STATISTICE
COORDONATOR TIINIFIC
Lector. Univ. Dr. Cta Adriana
ABSOLVENT
MOCAI ALEXANDRA
ORADEA
2015
CUPRINS
INTRODUCERE............................................................................................................3
CAPITOLUL 1. CMP DE PROBABILITATE............................................................5
1.1.
Evenimente aleatoare........................................................................................5
1.2.
Definiia probabilitii......................................................................................7
1.3.
Probabilitate condiionat...............................................................................10
1.4.
2.4.
Funcia de repartiie........................................................................................25
H 0: m=m0 , cnd
H 0: m=m0 , cnd
este cunoscut..................56
este necunoscut..................61
INTRODUCERE
Un test statistic const n obinerea unei deducii bazat pe o selecie din populaie
prin testarea unei anumite ipoteze (rezultat din experiena anterioar). De cele mai multe ori
aceast ipotez este o afirmaie referitoare la valoarea parametrului necunoscut al densitii
populaiei.
Testarea unei ipoteze statistice este procedeul prin care folosind informaia dintr-o
selecie a populaiei se ajunge la o decizie asupra ipotezei n cauz. Dac informaia dat de
selecie este consistent cu ipoteza, atunci se accept ipoteza, iar n caz contrar aceasta este
respins.
Lucrarea de fa este structurat n patru capitole, fiecare dintre acestea avnd
importana lui.
Primul capitol este dedicat expunerii cunotinelor fundamentale din teoria
probabilitilor prezentndu-se noiunile de cmp de probabilitate, evenimente aleatoare,
definiia probabilitii, probabilitatea condiionat, formulele de calcul al probabilitii,
scheme probabilistic clasice, formula probabilitii totale i formula lui Bayes.
n cadrul celui de-al doilea capitol este prezentat noiunea de variabil aleatoare. Se
expun n continuare repartiiile clasice discrete, iar n paragraful aferent acestor repartiii se
studiaz repartiia binomial, repartiia hipergeometric, repartiia geometric, repartiia
Poisson. La sfritul capitolului se introduce noiunea de funcie de repartiie a unei
variabilei aleatoare.
Cel de-al treilea capitol este dedicat studiului mrimilor caracteristice ale variabilelor
aleatoare insistnd asupra noiunilor de moment iniial al unei variabilei aleatoare, momente
centrate i absolute ale variabilei aleatoare, valoarea medie i dispersia unei variabile
aleatoare cu repartiie normal, funcia caracteristic a repartiiei normale. Capitolul se
ncheie cu prezentarea teoremei limit central pentru un ir de variabile aleatoare
independente.
Capitolul patru sintetizeaz aspecte referitoare la noiunile teoretice ale seleciei i
verificarea ipotezelor statistice. Se abordeaz noiunea de selecie, caracteristicile de selecie,
selecii din populaii normale, tipuri de ipoteze, riscuri, puterea unui test, ipoteze compuse,
testul raportului de verosimilitate, teste referitoare la parametrii repartiiei normale.
Materialul prezentat n capitolele lucrrii creeaz suportul teoretic pentru elaborarea
unei aplicaii practice expus n ultimul paragraf. Contribuia original a lucrrii const n
3
prezentarea unui studiu de caz concretizat ntr-o problem de decizie n contextul formulrii
diverselor cupluri de ipoteze. Aceasta este o problem de estimare a parametrilor repartiiei
normale i de testare a ipotezelor. Prin eantionarea populaiei considerate se vor lua anumite
decizii. Cum decidem dac rezultatele observrii unui eantion sunt n dezacord cu ipoteza,
cnd trebuie respins ipoteza i cnd nu, care este probabilitatea de a lua o decizie
nepotrivit, ce funcie de valori de selecie folosim n procesul de decizie, sunt ntrebri la
care se ncearc s se rspund prin acest studiu de caz n contextul aplicrii teoriei statistice
i a testrii ipotezelor.
Materialul bibliografic indicat s-a parcurs i sintetizat, de asemenea, ntr-o manier
proprie.
Lucrarea de disertaie se ncheie cu o bibliografie bine selectat, aceasta cuprinznd
10 titluri de lucrri i cri utilizate pe parcursul elaborrii acestui material.
Evenimente aleatoare
Noiunile primare ale teoriei probabilitii sunt cele de eveniment ataat unui
jocurile de noroc;
observarea numrului de apeluri telefonice recepionate de o central telefonic
Astfel de experimente sunt aleatoare, iar orie rezultat al unei experiene aleatoare se
numete eveniment. Probabilitatea lui este un numr care reprezint ansa de realizare a
evenimentului.
Definiia 1.1
Evenimentul ce se produce cnd se cunosc unul din evenimentele A sau B se numete
eveniment a lui A sau B i se noteaz cu
A B .
A C ).
Definiia 1.2
Dac realizarea evenimentului A implic realizarea evenimentului B, se spune c A l
implic pe B i se scrie
sunt echivalente, deci
A B . Dac
A B
A=B .
Definiia 1.3
Dou evenimente A i B se numesc incompatibile dac nu se pot realiza simultan,
adic
Fie
A K , A K ;
A B K , A , B K .
Propoziia 1.1
Dac mulimea K este corp de evenimente, atunci au loc afirmaiile:
1. K , K ;
2. dac A 1 , A 2 , An K , atunci i=1 n A i K , i=1 n A i K ;
3. dac A , B K , atunci AB K .
Demonstraie: 1. Mulimea K fiind nevid, exist cel puin un eveniment
Din axiomele corpului rezult c
A K
A A K . Rezult c K
A K .
=
K .
2. Se arat prin inducie matematic, folosind axioma 2 a Definiiei
1.4., c i=1 n A i=K . Din definiia corpului avem
A i K , i=1, n i i=1 n A i K . Dar
i=1
, atunci
i=1 n A i= n A i
i=1
n A i = i=1 n A i K .
3. Se folosete proprietatea demonstrat la punctul 2 pentru c
AB=A B .
este o
A K , A K ;
i 1 Ai K , ( A i )i 1 N K .
Datorit formulelor lui De Morgan rezult c operaiile cu membrii ai corpului
borelian K, fcute n orice ordine i manier, au ca rezultat tot un membru al acestei familii
pentru orice mulime numrabil de indici I.
Se extind astfel rezultate Prop. 1.1. i se poate spune c familia K este, n acest sens,
nchis fa de aceste operaii.
Definiia 1.6
este o mulime
Definiia 1.7
Cuplul ( , ) se numete cmp borelian de evenimente dac
este o mulime
Definiia probabilitii
Noiunea de probabilitate a fost introdus ca o msur a mulimilor de evenimente din
este o
mulime finit sau infinit numrabil, atunci desemnarea se poate face pentru toate
submulimile ei.
Vom presupune mai nti c spaiul este numrabil.
Definiia 1.8
Se numete probabilitate pe cmpul de evenimente ( , ) funcia
P: R
P ( A ) 0, A K
P ( )=1
P ( A B )=P ( A ) + P ( B ) ,dac A B=
Definiia 1.9
Un cmp de evenimente ( , K) nzestrat cu o probabilitate P se numete cmp de
probabilitate ( , K , P ).
7
Propoziia 1.2
Fie ( , K , P ) un cmp de probabilitate. Atunci:
)=1P ( A ) , A K
1. P ( A
2. P ( )=0
3. Dac A B , atunci P( A) P( B)
4. 0 P( A) 1, A K
5. P ( BA )=P ( B )P( A B)
6. P ( BA )=P ( B )P ( A ) , dac A B
7. P ( A B )=P ( A ) + P ( B )P ( A B ) , dac A B
Demonstraia 1. Se folosesc relaiile
atunci, din axiomele 2 i 3 c
1.
2.
A A=
i A A=
, A K . Rezult,
)=1 .
P ( A )+ P ( A
B=B =B ( A A
(1.1)
i
) =
(B A )( B A
(1.2)
Punnd condiia
(1.3)
(1.4)
P ( A ) 0, A K
P ( )=1
P ( i I A i )= P ( Ai ) , ( Ai )i I K , A i A j= ,i j .
i I
1.
2.
3.
A i=
pentru
i> n .
un ir descendent
P ( A n ) n P ( n N A n ) .
Teorema 1.2
A
Fie ( , K , P) un cmp borelian de probabilitate i ( n)n N
un ir ascendent
P ( A n ) n P ( n N A n ) .
2. Definiia clasic
Se consider c mulimea conine un numr finit de evenimente elementare
i , 1 i n , care au aceeai ans de realizare
p . Atunci din
=i=1 n i
se gsete c
n
P ( )= P ( i) =np=1,
i=1
deci
p=1/n
A=i=1 m i , m n
atunci se obine c
m card ( A)
P ( A )= =
n card ()
(1.5)
Se obine astfel:
Definiia 1.12
Se numete probabilitatea unui eveniment A raportul dintre numrul evenimentelor
egal probabile favorabile producerii lui A i numrul total de evenimente egal probabile.
Evident, probabilitatea definit clasic satisface axiomele din definiia (1.8).
Definiia clasic are, ns, anumite inconveniente:
a) se poate aplica doar cnd evenimentele elementare au aceeai ans de realizare;
b) nu poate fi utilizat cnd exist un numr infinit de evenimente elementare;
c) nu se poate aplica unei largi categorii de evenimente crora nu li se poate determina
numrul cazurilor favorabile.
3. Definiia statistic
Se consider un experiment n care se urmrete apariia unui eveniment A. Frecvena
absolut a evenimentului A este numrul m de realizri ale lui. Atunci cnd au loc n
probe, frecvena relativ de realizare a lui A este raportul m/n . La un numr mare de
repetri ale acestei experiene, frecvena relativ se va stabiliza, oscilnd n jurul acestui
numr, care va fi probabilitatea lui A.
1.3.
Probabilitate condiionat
Definiia 1.13
Fie ( , K , P) un cmp de probabilitate i fie A i B dou evenimente dependente
P ( A B)
.
P( A)
(1.6)
Se poate arta cu uurin c definiia dat are sens deoarece raportul (1.6) verific
axiomele probabilitii:
1.
P( B A) 0
pentru c
P( A)>0 i
P ( A B ) 0, A , B K ;
10
2.
P [ ( B C ) A ] P [( B A ) ( C A ) ]
=
=
P( A)
P(A)
P ( B A ) + P(C A)
=P ( B| A ) + P(CA ), dac B C= .
P( A)
P ( | A )=
P( B A) folosete informaie
(1.8)
P ( A|B )=P( A)
i aceleai relaii nu pot avea loc dect dac este ndeplinit condiia (1.8).
1.4.
A 1 , A 2 , An
sunt evenimente
P ( n Ai ) = P( A i )
(1.9)
i=1
Propoziia 1.5
Fie ( , K , P) un cmp de probabilitate. Dac
dependente din K cu proprietatea c
i=1
atunci
P ( n Ai ) 0
11
A 1 , A 2 , An
sunt evenimente
i=1
A n i=1
(
)
P n Ai =P( A1 ) P( A2 A 1) P (A 3 A1 A2 ) P ( n1 A i )
(1.10)
A 1 , A 2 , An
evenimente din K.
Atunci
i =1
n
(1.11)
P ( n Ai ) P ( Ai ) (n1)
i=1
A 1 , A 2 , An
sunt evenimente
(1.12)
P ( n Ai ) = P( A i)
i=1
A 1 , A 2 , An
A
din K compatibile dou cte dou ( i A j= ,i j ) , atunci
12
sunt evenimente
i=1
P ( A i A j ) +
n
P ( n Ai ) = P ( Ai )
i=1
i=1
i=1
n
(1.13)
P ( Ai A j A k )+(1)n1 P ( n Ai )
i=1
probabilistice dac se poate face o analogie ntre modurile de desfurare ale experimentelor
din aplicaii i cele din schemele clasice. De aceea este deosebit de important de a reine
condiiile n care are loc fiecare din experimentele ce ilustreaz schemele clasice.
O urn conine bile albe i negre identice ca mrime pentru care se tie c
q=1 p sunt probabilitile de a extrage o bil alb, respectiv, o bil neagr. Se fac n
extrageri punndu-se bila extras n urn. Se cere probabilitatea de a obine k
nk
bile albe i
Xn, k .
A i A k A k1 A n
unde evenimentul de a extrage o bil neagr este, evident, contrarul celui de a scoate o bil
alb. Din modul de desfurare a experienei se vede c evenimentele sunt independente (nu
are importan rezultatul unei extrageri pentru extragerea urmtoare) i probabilitatea cu care
se scoate o bil alb (sau neagr) este aceeai pentru orice prob pentru c, componena urnei
13
rmne tot timpul aceeai. Atunci evenimentul scris va avea probabilitatea calculat dup
pk qnk
bile albe i
(1.14)
Din cauza formulei (1.14), schema bilei revenite se mai numete schema binomial
sau schema lui Bernoulli.
Exemplu
Se arunc un zar de 14 ori. Care este probabilitatea ca de 5 ori s apar faa cu un
numr de cel puin 4 puncte?
Rezolvare:
O fa cu cel puin 4 puncte apare la o aruncare cu probabilitatea
p=4/6
i rmne
constant ori de cte ori se efectueaz experiena, ceea ce este echivalent cu schema
binomial n care componena urnei este aceeai dup fiecare extragere. n aceste condiii
probabilitatea cerut este
P ( X 14,5 )=C
5
14
2
3
1 9
.
3
( )( )
k
C ba Cn
b
(1.15)
Exemplu
14
C nN
Xn, k
va fi determinat prin
ntr-un lot de 100 de piese exist 10 piese rebut. Se verific 25 de piese. Care este
probabilitatea de a gsi 3 piese rebut?
Rezolvare:
Verificarea se face, n general, extrgnd piese din lot fr a le mai pune napoi.
Atunci probabilitatea se va determina dup formula (1.15), adic
X
P( 25,3)=
C310 C 22
90
C25
100
( pi +qi =1) , pentru fiecare urn U i ,i=1,2, n . Extrgnd cte o bil din fiecare urn,
se cere probabilitatea de a avea k
bile albe i nk
bile negre.
Q (t )= ( p i t+qi )
(1.16)
i=1
Se observ pentru
pi= p , i=1,2, n
n care coeficientul lui t k este dat de formula (1.14) din schema binomial. Astfel schema
lui Poisson este o generalizare a schemei lui Bernoulli.
Exemplu
n trei loturi de produse exist rebuturi n procent de 3%, 5%, respectiv, 2%. Dac din
fiecare lot se extrage cte un produs, care este probabilitatea de a obine 2 rebuturi?
Rezolvare
Corespunztor fiecrui lot avem:
q 2=0,95 ;
p1=0,03 ; q1 =0,97 ;
p2=0,05 ;
p3=0,02 ; q3 =0,97 .
Pentru ca din cele 3 produse extrase, 2 s fie rebut, se va alege din polinomul
Q (t )=( p 1 t+ q1 ) ( p2 t+q 2 ) ( p3 t+q 3)
Coeficientul lui t 2 , adic
P ( X 3,2 ) =p 1 p2 q3 + p1 p 3 q 2+ p 2 p3 q1 .
15
1.6.
A 1 , A 2 , An dintr-un corp
P ( B ) = P( Ai ) P(B Ai )
(1.17)
i=1
Demonstraia formulei rezult din modul n care se poate exprima orice eveniment
B
P ( B ) =
i=1
Dac pentru termenul general a sumei se folosete exprimarea (1.7), se gsete relaia
(1.17).
Formula probabilitii totale (1.17) precum i formula lui Bayes, care urmeaz, sunt
folosite atunci cnd se cunosc probabilitile
n modul urmtor: un eveniment B
cauze
16
s se realizeze
condiionat de fiecare din cauzele posibile. Atunci probabilitatea lui total este calculat din
probabilitile diferitelor circumstane i probabilitile condiionate corespunztoare.
n aceleai condiii se determin probabilitatea oricrui eveniment al sistemului
complet condiionat de realizarea lui B , adic, tiind c efectul B
s-a realizat, el s fi
K . Atunci
P( Ak B)
P( A k ) P (BA k )
P(B)
(1.18)
pentru orice k =1,2,.. n .
Demonstraia rezult uor din definiia probabilitii condiionate (1.6) din care avem
c
P ( B A k )=P ( B|A k ) P ( A k )=P( A k B) P (B)
De aici se scoate
P( Ak B) ;i se deduce (1.18).
Ak
pe
A
P( k ) este o probabilitate a priori,
A
P( k B) este o probabilitate a posteriori din cauza
A k . Este recunoscut
17
Exemplu
n trei secii ale unei fabricaii se asambleaz un anumit tip de lamp electrornic. Se
tie c n prima secie lucreaz 12 muncitori, n a doua 15 i n a treia 13 i c procentul de
rebut al fiecrei secii este 2%, 3%, respectiv 1%. Se alege la ntmplare un produs din
depozit. Se cere:
a) probabilitatea ca produsul s fie defect;
b) probabilitatea ca produsul defect ales s provin de la secia a doua.
Rezolvare:
Se noteaz cu
=0,54
b) P ( A 2B )=
40 100 0,025
P ( A 1 )=
18
x i cu
A i ,i N ,
A i K , i I N
verific
condiiile:
Ai A j= , i j I
P ( i I A )= P ( A i )=1
i I
Definiia 2.1
Se numete variabil aleatoare (v.a.) discret o funcie
X =x( ) , definit pe
(2.2)
(2.3)
atunci orice variabil aleatoare discret se prezint sub forma unui tabel, numit i tabel de
xi R
19
X:
p 0, i I
xi
,i I , i
pi
Pi=1
()
(2.4)
i I
p=P ( A )=1 .
().
X: a
1
tabelul de distribuie
pi ,i I
p i 0,i I
P i=1
cu proprietile
se numete distribuia de probabilitate a
i I
X ( )=x i pentru
i Y ( )= y j pentru B j , j J N , unde
{ Ai } i { B j } sunt
(2.5)
x 1 , x 2 , , x n , avem
P ( X 1=x 1 , X 2=x 2 , X n =x n )=
P ( X 1=x 1 ) P ( X 2 =x2 ) P ( X n =x n ) .
Aceast formul poate fi, la rndul ei, generalizat prin nlocuirea valorilor
mulimea oarecare S i ,i=1,2, n .
Propoziia 2.1
20
x i cu
X 1 , X 2 , X n
(2.6)
(2.7)
X + k ,k X ,|X|, X ,
1
,( X 0) sunt, de asemenea, variabile aleatoare.
X
Propoziia 2.3
Fie X i Y dou variabile aleatoare definite pe sisteme complete de evenimente
z ij=g (x i , y j ) cu probabilitile
Cij = { X ( ) =xi , Y ( )= y i }= Ai B j ,i I , j J
(2.8)
21
{ B j } j J
n experiena descris n schema bilei revenite sau a lui Bernoulli (capitolul 1, 1.5.1)se
deduce c probabilitatea de a extrage k bile albe i n-k bile negre, punnd napoi bila extras,
este dat de formula (1.14) pe care o vom nota
bk ( n , p )=P ( X =k )=C kn p k qnk ,
(2.9)
p , q 0, p+q=1 .
X Bi (n , p) . Ea va
k
k =0,1, n
k nk ,
p , k 0, p+q=1
C p q
k
n
(2.10)
b k ( n , p ) =( p+q)n=1
k=0
( )
k
a
(2.11)
Se demonstreaz simplu c probabilitile din (2.11) determin un tabel de distribuie
(condiiile din (2.6)).
2.2.3. Repartiia geometric
22
k
k1 , k =1,2, , p , q 0, p+q=1
pq
(2.12)
Condiiile (2.4) sunt respectate deoarece se obine seria geometric de raie subunitar
q,deci
1
=1
p q k1= p 1q
k=1
(2.13)
distribuie
( )
k
X:
k , k=0,1,2, , >0
k!
(2.14)
k=0
k=0
pk ( )=e
k k
=e e =1
k!
unde s-a folosit dezvoltarea n serie Taylor a funciei e . Astfel (2.14) este un tabel de
distribuie.
n continuare se studiaz legtura dintre repartiiile binomial i Poisson, considernd
comportamentul lor la limit, pentru a ajunge la un mod simplificat de a demonstra teorema
lui Poisson.
23
p= pn =
bk ( n ) =Ckn
n
1
n
nk
( )( )
(2.15)
n
=e
n
( )
lim b0 ( n )= lim 1
(2.16)
=
1
n
b k ( n ) k +1 n
( )
nk
1
k +1 n ( n )
b k+1 (n)
=
b k (n) k +1
lim b (n)
k +1 n k
lim b1 ( n )= lim b0 ( n )= e = p 1( )
1 n
n
2
lim b2 ( n )= lim b1 ( n )=
=p 2 ( )
2 n
n
1 2e
...............................................................................................
k
lim bk ( n )= lim bk1 ( n )=
= pk ( )
k n
n
1 2 k e
S-a demonstrat, aadar, teorema lui Poisson n forma ei cea mai simpl, i anume:
( n )= p ()
lim bk n ,
lim n p n=lim n =
(2.17)
(2.18)
24
pk ( )
X =X () definit
xR
mulimea
(2.19)
X =X ()
{ X () x } K
(2.20)
{ X () x } K
(2.21)
sau
sau
{ X ()> x } K , x R
(2.22)
Pentru a defini operaiile cu variabil aleatoare n general sunt necesare rezultatele
date de:
25
Propoziia 2.5
Dac X i Y sunt variabile aleatoare, atunci:
{ X ( )< Y () } K
(2.23)
X ( ) Y K
(2.24)
X ()=Y K
(2.25)
Propoziia 2.6
Dac X i Y sunt variabile aleatoare, atunci X-Y, X+Y, X Y ,
X
, dac Y 0 ,
Y
{ X ( )Y ()< x } ={ X ( ) <Y ( )+ x } .
Aceast mulime este un eveniment din K deoarece X i Y sunt variabile aleatoare i
are loc relaia (2.23). deci X-Y este variabila aleatoare.
Scriind X+Y=X - (-Y), rezult c X+Y este, la rndul ei, variabil aleatoare.
Egalitatea
X Y =
1
{( X +Y )2( XY )2 }
4
Demonstreaz c
X
Y
X Y
X
1
=X
Y
Y
rezult c i
pentru cazul general de variabile aleatoare, dac mulimile S 1 , Sn sunt convenabil alese,
adic sunt boreliene. Atunci independena variabilelor aleatoare X 1 , X 2 , X n are loc dac
i numai dac este adevrat relaia (2.7).
2.4. Funcia de repartiie
Definiia 2.5
Fie X o variabil. Se numete funcie de repartiie a variabilei aleatoare X funcia
+
F : R R
dat de
26
F ( x )=P ( X < x ) , x X
(2.26)
(2.27)
(2.28)
(2.29)
(2.30)
P ( a X b ) =F ( b ) F ( a ) + P( X=b)
(2.31)
Se observ c
A B
D= { X ( )=b } .
A . Atunci se poate
i c { a X ()< b }=B A=B
scrie
P ( a X < b )=P ( B A )=
P ( B ) P ( A )=F ( b )F(a) , care reprezint relaia (2.28)
Propoziia 2.9
Funcia de repartiie a oricrei variabile aleatoare este o funcie nedescresctoare,
continu la stnga i astfel nct
lim F ( x )=F ( )=0, lim F ( x )=F ( + )=1
n +
(2.32)
Propoziia 2.10
Orice funcie F(x) nedescresctoare, continu la stnga, astfel ca
F ( )=0, F ( + )=1 este o funcie de repartiie a unei variabile aleatoare definit pe un
cmp borelian de probabilitate convenabil ales.
Propoziia 2.11
Dac X este o variabil aleatoare i F(x) este funcia ei de repartiie, atunci
P ( X=x )=F ( x +0 )F ( x ) , x R
unde s-a notat cu
(2.33)
x 1 x2 x n
p1 p2 p n
i se construiete funcia ei de repartiie folosind proprietile enunate n Proprietile (2.26) (2.28) se obine astfel:
F ( x )=
0,
p1,
p 1+ p 2 ,
k1
pi
i=1
.
1,
x x1
x 1 <x x 2
x 2 <x x 3
xk 1 <x x k
.
x >x n
(2.34)
P ( X=x 1 )= p 1 .
-dac
x 1< x x 3 , atunci
P ( X < x )=
P [ ( x x1 ) ( x 1 < X < x 2 ) ( x2 < X< x3 ) ]=
P ( x x1 ) + P ( x 1< X x 2 ) + P ( x 2< X < x 3 )=
P ( X=x 1 ) + P ( X =x 2) =
p1+ p 2 ,
x k1< x < x k , atunci
i, n general, dac
P ( X < x )=
pi
i=1
iar pentru
x> xn
avem
P ( X < x )= pi=1 .
i=1
Forma (2.34) a funciei de repartiie este dat n cazul unei variabile aleatoare,
discrete cu un numr finit de valori. Dac X ia o mulime numrabil infinit de valori, deci
are tabelul de distribuie
X:
Cu
pn 0 i
n N
x1
p1
x2 xn
; n N ,
p 2 pn
(2.35)
xn <x
integrabil f : R R , astfel ca
29
F ( x )= f ( u ) du
(2.36)
X .
Din relaia (2.36) rezult c f ( x ) este densitate de probabilitate dac i numai dac
verific condiiile
x
f ( x ) >0, f ( x ) dx=1
(2.37)
Consecine:
1. Folosind consecinele din analiza matematic se deduce din formula (2.36) c, dac f
F :
f ( x )=F ' (x )
este
(2.38)
i acum
'
F ( x ) = lim
x 0
F ( x+ x ) F ( x )
P( x X x + x)
= lim
x
x
x 0
,
aceast relaie va conduce la
P ( x X x + x )=f ( x ) x +0( x )
X
este proporional cu f ( x ) i cu x , 0( x)
2. n cazul variabilei aleatoare continue, funcia de repartiie este o funcie continu, deci
probabilitatea (2.32) ca variabil aleatoare s ia o anumit valoare este 0, limitele laterale ale
lui F n orice punct fiind egale.
3. Rezult din consecina doi c relaiile (2.28) (2.31) vor avea n membrul doi
F ( b )F( a) .
4. Dac aceleai relaii (2.28) (2.31) se exprim cu ajutorul densitii de repartiie, atunci
avem
P ( a X < b )=
F ( b )F ( a ) =
b
f ( x ) dx f ( x ) dx= f ( x ) dx
x
(2.39)
5. Dac A este o reuniune de intervale nu neaprat disjuncte i care pot fi chiar infinite, atunci
avem
P ( X A )= f ( x ) dx
A
30
(2.40)
Fie
X .
Definiia 2.8
Numrul m e =Q(1/2) se numete mediana variabilei aleatoare
F ( x ) este funcia de repartiie a lui
Dac
X .
medianei devin:
F [ Q(1/2) ] 1/2, F [ Q(1 /2) ] 1/ 2 .
n afar de =1/2 care conduce la determinarea medianei, pentru valorile
particulare =1/4
X .
f ( x ) dx =
sau
x
f ( x ) dx =1
Q ( )
f ( x ) dx= f ( x ) dx=
x
me
1
2
Definiia 2.9
Orice punct de maxim local al densitii de probabilitate f ( x ) se numete punct
modal (mod).
Dup numrul punctelor modale, repartiiile vor fi unimodale, bimodale, n general
multimodale.
Dac variabila aleatoare
mai probabil.
31
are valorile
probabilitile
x i este cea
pentru care
pi1 p i pi+1 , i=1,2 n .
2.4.3.Exemple clasice de variabile aleatoare continue
2.4.3.1. Repartiia uniform
Fie [ a , b ]
1
, x [ a ,b ]
f ( x )= ba
0, nrest
Se spune c variabila aleatoare
(2.41)
atunci funcia ei de
repartiie este
0, x <a
xa
F ( x )=
,a xb
ba
1, x >b
Exprimarea ce se obine din formula (2.36) astfel:
-
F ( x )=0
x
F ( x )= f ( u ) du+ f ( u ) du=
x
dac
1
xa
d u=
ba
ba
x> b avem
x
1
du=1
ba
i se noteaz cu
1 xm
, x R ;m R ; >0
(
1
f ( x )=
e2
2
(2.42)
x m
(2.43)
i se obine
x
f ( x ) dx= 21 e
x
x
t
2
dt =
1
2 =1
2
2 .
, x R
1
f ( x )=
e2
2
(2.44)
Un rol important n analiza acestei repartiii l are funcia care se numete funcia
Laplace i se definete ca fiind
x
1
( z )=
e
2 x
t
2
(2.45)
dt , zR
f ( x ) dx= ( z ) (z )=2 ( z )1
(2.46)
f ( x ) admite derivate de orice ordin i orice derivat este egal cu produsul dintre
33
x tinde la . Din
urmtoarele rezultate:
Propoziia 2.12
X N (m , ) ,
, x R
( xm
)
(2.47)
F ( x )= ( x)
(2.48)
Demonstraie: se particularizeaz m=0, =1 n (2.48)
Propoziia 2.13
Funcia Laplace are proprietatea
(z ) =1 (z)
Demonstraie: n (z )
z
1
(z ) =
e
2 +x
+x
1
e
2 z
z
u
2
u
2
du=
du=
z
(2.49)
1
1
e 2 du
e 2 du=
2 x
2 x
1 ( z )
Observaie
34
Dac
N (m , ) , atunci
am
(
( bm
)
)
(2.50)
1
( z )=
et dt , z 0
0
2
(2.51)
f ( x )=2 ( x )
1
xm
F ( x )= +
2
1
F ( x )= + ( x)
2
(z ) = ( z) .
Formula (2.50) rmne la fel pentru ambele definiii ale funciei Laplace.
Propoziia 2.15
Fie
i fie
este
( 1)( y)
1
g ( y )=f ( ( y ) )
(2.52)
Propoziia 2.16
Dac
Z=
Xm
are o distribuie
N (0,1) .
Xm
, deci 1 ( z )=z +m . Atunci
35
(1) ( z )
g ( z )=f
care are densitatea de probabilitate a unei variabile aleatoare
N (0,1) .
2.4.3.4.Repartiia exponenial
Se spune c variabila aleatoare a crei densitate de probabilitate este
x
f ( x )= e , x 0 >0
0, x <0
(2.53)
Propoziia 2.17
Dac
, atunci funcia
ei de repartiie este
F ( x )=1ex , x 0
2.4.3.3.Repartiia gamma, beta
Dac variabila aleatoare
(2.54)
2
are densitate de probabilitate
1
x p 1 ex x >0, p>0
f ( x )= ( p)
0, x 0
se spune c are repartiia gamma de parametru p. Vom nota acest lucru prin
Variabila aleatoare
(2.55)
X ( p) .
1
x r 1 (1x ) 1 x [ 0,1 ]
f ( x ) = ( 1 , 2)
0, n rest , 1 , 2> 0
Variabila aleatoare
cu densitate de probabilitate
36
(2.56)
n
1
2
x
2
2a
x e x> 0,
n
f ( x )= 2 2 a n (n/2)
0, x 0, n N , a>0
se spune c are repartiie
(2.57)
Pearson).
Se demonstreaz c (2.57) este densitate de probabilitate fcnd substituia
x
=t
2 a2
.
2.4.3.5.Repartiia Student
Variabila aleatoare
1
f ( x )=
n +1
2
, x R , n N
(2.58)
37
x i cu probabilitile
(3.1)
i I
M ( x )= xf ( x ) dx
(3.2)
(3.3)
X .
se
calculeaz prin
M r ( x ) = xir pi
(3.4)
i I
M r ( x ) = x r f ( x ) dx , r N
(3.5)
medie. Se observ c pentru r=1 momentul iniial este chiar valoarea medie.
Deoarece momentele iniiale se definesc cu ajutorul valorii medii se iau n considerare
proprietile ei. n demonstraiile acestora se va considera c variabilele aleatoare sunt
discrete, dar, evident, proprietile sunt valabile pentru orice tip de variabil aleatoare.
Propoziia 3.1
Valoarea medie a unei variabile aleatoare constante este constant
38
M ( C )=C ,C R
Demonstraie: avem
(3.6)
X =C , deci { / X (=C) } = i
Deci
M ( X )=C 1=C
Propoziia 3.2
X
Dac
M ( CX )=CM ( X ) ,C R
(3.7)
Demonstraie: Avem:
M ( CX )= (C x i) p i=CM ( X) .
i I
Propoziia 3.3
Fie
Atunci exist
i Y
M (X ) i
M (Y ) .
M (X +Y ) i
M ( X + Y )=M ( X ) +M (Y )
(3.8)
g ( X ,Y )=X +Y
P ( C ij )=P( A i)
j J
j J C ij =B j ,
P ( C ij ) =P(B j )
i I
. Atunci:
( x i+ y i) P ( C ij) = x i P ( Cij ) + y i P ( C ij )= x i ( P ( C ij )) + y j ( P ( C ij ) )= x i P (
j J
i I j J
i I j J
i I
j J
JJ
i I
i I
M ( X + Y )=
i I
(3.8).
Corolar 3.1
Fie
M (x k ) exist
( )
i=1
Ck Xk =
C k M ( X k ) , C k R , k=1, n
(3.9)
Propoziia 3.4
Dac
M (Y )
i Y
M (X ) i
(3.10)
valoarea
r
[ X M ( X )] (dac exist) i este dat de expresia
r ( X ) =M ([ XM ( X ) ]) , r N
r
(3.11)
Definiia 3.4
Se numete moment absolut de ordin r
valoarea
| X|
M ( r ), r N .
Dintre momentele centrate ale unei variabile aleatoare cel mai important este
momentul de ordin 2.
Definiia 3.5
Momentul centrat de ordin 2 se numete dispersia sau variana variabilei aleatoare
X
i se noteaz cu
2 ( X )=D ( X )= 2 ( X )=M ([ X M ( X )
iar
D (X )= ( X )
])
(3.12)
greu de calculat. Aadar s-a introdus radicalul dispersiei variabilei aleatoare, care este o
msur a abaterii medii a variabilei aleatoare de la media ei.
Cu ct ( X) este mai mic, cu att valorile variabilei aleatoare sunt mai apropiate
de
M (X ) i se spune c populaia este mai centrat sau mai concentrat n jurul valorii
medii.
Considernd acum variabila aleatoare
notaia m=M ( X ) pentru simplificarea scrierii, momentele centrate i cele absolute se pot
calcula dup cum urmeaz
r
r ( X ) = ( x im) p i , r N
i I
40
|X|
r
M ( r )= |x i| , r N
(3.13)
i I
r ( X ) = ( xm )r f ( x ) dx , r N
x
|X|
x
(3.14)
M ( r )= |x| f ( x ) dx , r N
x
X =C . Atunci
D (C )=0
(3.15)
Demonstraie: dac
M ( X )=C
i deci
D ( X )=M ( CC )=0
X
Reciproc, fie
x i ,i N
pentru care
X ( )=x i pentru
D ( X )=0 . Atunci
( xi M ( X ))2 P( X=x i)
i I
Cum
Se noteaz
mulimea indicilor
pentru care
x jM ( X ) 0 i
x iM ( X )=0 i cu
P ( X=x i ) =0 .
Rezult c
x i=M ( X )=constant , i I 1
i
P ( X constant )=P ( X =x j , j J 2) =0
adic
P ( X=constant )=1P ( X constant ) =1
aadar, cu probabilitatea 1, variabila aleatoare
Observaie
41
este constant.
I1
D ( X )=0
este constant.
n concluzie, ntr-un cmp de probabilitate finit dispersia unei variabile aleatoare este
nul dac i numai dac variabila aleatoare este constant.
Propoziia 3.6
X
Fie
(3.16)
D ( X )=M 2 ( X )M ( X )
Demonstraie: folosind proprietile valorii medii, avem
D ( X )=M ([ X M ( X ) ] )=
2
M [ X 22 X M ( X ) + M 2 ( X ) ]=
2
M ( X 2 )2 [ M ( X )2+ M ( X ) ] =
M 2 ( X ) [ M ( X ) ]
Propoziia 3.7
X
Dac
o constant, atunci
(3.17)
Atunci
n
( )
i=1
C i X i = C21 D ( X i ) ,C i R , i=1,n
i=1
( [ C X ] ) M ( [ C X ] )=
C 2i X 2i + Ci C j X i X j [ M ( Ci X i ) ] =
[
]
i,j
42
(3.18)
X
X
M ( i X j ) [ C 2i M ( X i ) ]
Ci C j
M ( i 2)+2
C 2i
M ( j), i , j 1,n
M
CiC j
2
Dar variabilele aleatoare
deduce c
D ( C i X i ) =
X
X
M ( i)
Ci
[ 2 ) =
M ( i 2) M
C 2i
X
X
2
M ( i )( M (i)2 ]=
C 2i
C 2i D( X i)
43
Propoziia 3.9
X N (m , ) , atunci
Dac
M ( X )=m , D ( X ) = 2
(3.19)
se obine
x
1 xm
(
1
M ( X )= xf ( x ) dx=
x e2
2
x
y
dx=
1 (
m+y ) e 2 dy=
2
x
m
2
e 2 dy+
y e 2 dy=m
2 x
x
doua este 0 (se integreaz o funcie impar pe un interval ce se poate considera simetric fa
de origine).
Se calculeaz apoi dispersia cu ajutorul definiiei ei de moment centrat de ordin doi
D ( X )= ( xM ( X ) ) f ( x ) dx=
1 xm
2
( xm ) e
dx =
1
2
2
2 y 2 e 2 dy=
y 2 e 2 dy
2 x
2 x
n aceast ultim integral se face substituia
gamma
1
t 2 dt=
x
2 2
(
)
D X=
2 0
2
3
2 2 1 1
=
= 2
2 2 2 2 2
()
()
44
y 2 /2=t
i se obine o integral
densitate de probabilitate.
Fie
dat de
X ( t )=M (eitX )
(3.20)
X.
|e itX|=cos2 tX +sin2 tX =1
variabil aleatoare
pentru t
real, i de
caracteristic fa de toate celelalte mrimi caracteristice ale unei variabile aleatoare, mrimi
care uneori nu exist deoarece seriile asociate sau integralele generalizate nu sunt
convergente.
Modul de calcul al funciei caracteristice va ine seama de de tipul variabilei
aleatoare, astfel: dac
X:
xk
,k I N
pk
()
iar dac
it x k
pk ,
(3.21)
X ( t )= e itx f ( x ) dx
x
Repartiia normal
N (m , )
1 xm
1
2(
f ( x )=
e
2
x
, x R , >0
1 xm
(
1
X ( t )=
e itx e 2
2 x
) dt
45
(3.22)
xm
= y i se obine
Se face substituia
x
1
X ( t )=
e it itm e 2 dy=
2 x
e
1 2
( y 2ity )
2
dy =
itm
2 x
2
itm
t
2
1
( yit )
2
dy
deci
2
itm
X ( t )=e
Dac
t
2
X ( t )=e
t
2
M ( X i )=mk
i dispersiile
D ( X k ) = 2k , k N finite.
Se definete irul de variabile aleatoare ( Y n )n
prin
Y n= X k , n N
k =1
pentru care
n
k=1
k=1
M (Y n)= M ( X k ) = mk =m(n )
Y
n
D( n)= D ( X k )= k = k (n )
k=1
k=1
Y n m (n)
n
Fn ( x ) .
46
(3.23)
Fie
x
1
F ( x )=
e 2 dt
(3.24)
funcia de repartiie
X n are funcia
Fn (x )n F ( x ) ,
M ( X k )=m i dispersiile
repartiia
N (0,1) .
Corolar 3.1
Fie ( X n ) n un ir de variabile aleatoare independente repartizate binomial i fie
n
Y n= X k . Atunci
k =1
P ( a<Y n <b )
anp
( bnp
)
(
npq
npq )
47
(3.25)
48
alese la ntmplare, iar volumul seleciei este numrul acestor elemente [3].
Operaia de prelevare la ntmplare a elementelor n selecie se numete sondaj.
Se noteaz elementele seleciei extrase din populaia caracterizat de variabila
aleatoare
prin
={X1, X2 , Xn} .
X
Fie ( 1 , X n) o selecie de volum n extras dintr-o populaie caracterizat de
Definiia 4.2
Se numete funcie de selecie expresia
0, x x 1
F ( x )= k , x k < x x1
n
1, x > x 1
49
(4.1)
Fie
P ( X i <x )=F ( x )c , 1 i n
x , F n ( x) este frecvena relativ a unui
P Fn ( x ) =
k
nk
k k
C n [ F ( x ) ] [ 1F (x) ] , 0 k n
n
(4.2)
Se enun altfel:
Teorema 4.1
Funcia de repartiie de selecie
1
k
n1
aleatoare care ia valorile 0, , ,
n
n
n
cu probabilitile (1.2).
Se deduce de aici c
n
M [ F n (x) ] =
k=0
k
nk
k k
C n [ F ( x) ] [ 1F ( x) ] =F ( x)
n
(4.3)
Teorema 4.2
Pentru fiecare
xR
(4.4)
F( x ) .
50
Fn (x ) i funcia de
Fie
Definiia 4.2
Variabilele aleatoare definite de relaiile
n
1
r
m = Xi , r N
n k=1
X
n
1
r =
n i=1
(4.5)
(4.6)
X1
X : 1
n
X 2 , X n
1
1
,
n
n
(4.7)
Atunci
mr=M ( X r )
(4.8)
r =M [ ( X M ( X ) ) ] ,r N
r
(4.9)
Cazuri particulare
n
m r=M ( X )=
1
X = X
n i =1 i
(4.10)
i
n
r =D ( X ) =
vor fi media de selecie
2
1
X i X ) =S 2
(
n i=1
(4.11)
i dispersia de selecie S 2 .
Teorema 4.4
Valorile medii ale momentelor iniiale de selecie sunt egale cu momentele de acelai
ordin ale variabilei aleatoare teoretice X.
51
M ( mr )=
1
M ( X ri ) =M r ( X)
n i=1
(4.12)
n particular
)=m=M ( X)
M(X
(4.13)
Teorema 4.5
Dispersia momentelor iniiale de selecie este egal cu
1
[ m m2r ]= 1n [ M 2 r ( X )M 2r (X )] , r N
n 2r
D ( mr ) =
(4.14)
[ M ( X )M ( X )] =
2
r
i
r
i
D ( mr )=
n2 i=1
1
[ M ( X )M 2r ( X )]
n 2r
n particular
D ( X )=
1
[ M ( X ) M 2( X )]= 1n D( X)
n 2
(4.15)
Teorema 4.6
Dispersia de selecie S 2 are valoarea medie
M ( S 2) =
n1
D (X)
n
(4.16)
i dispersia
D ( S 2 )=
n1
( n1 ) 4( n3 ) D 2( X ) ]
3 [
n
( X X ) = 1 [ ( X i m )( X m ) ] =
2
i=1
S 2=
n
n i =1
)
m) ( X im) + ( Xm
( X i m ) n ( X
2
i=1
n i=1
52
(4.17)
2
1
)
S = ( X im )2 ( Xm
n i=1
2
M ( X i )=m
Atunci, cum
)=m
M(X
(4.18)
2
2
) ] =
M [ ( X im) ] M [ ( Xm
n
1
M ( S )=
n i=1
2
)=
D ( X i )D ( X
n
n i=1
1
n1
D ( X ) D ( X )=
D( X )
n
n
4.3. Selecii din populaii normale
X
Fie ( 1 , X n) o selecie extras dintr-o populaie caracterizat de variabila
m i , X N ( m , ) .
Teorema 4.7
X
X N ( m, ) i ( 1 , X n) este o selecie dintr-o populaie caracterizat
Dac
X N (m , ) .
n
i repartizate
obine
x
( nt )=
n
x ( i )=
j=1
1
t
i m 2
n
n 2
=e
itm
t
2n
j=1
X N (m , ) .
n
Xm
N (0,1)
(4.19)
Teorema 4.8
Fie dou populaii independente caracterizate de variabilele aleatoare teoretice
{ X '1 , .. X 'n }
X 1 N ( m1 , 1 ) ; X 2 N ( m2 , 2 ) i fie
X 1 X 2 N m1 m2 , 1 + 2
n1 n 2
(4.20)
X 1 N m 1 ,
, X 2 N m 1 , 2
n1
n2
X 1 i
Variabilele aleatoare
)
X 2 fiind independente, rezult c i
it m1
2
1
t
2n1
it m2
2
2
t
2 n2
t2
it ( 1m2 ) + 2
n 1 n1
X 1 X 2(m 1m2)
21 22
+
n1 n2
(4.21)
Teorema 4.9
54
N (0,1)
X 1 i
X 2
X
Fie ( 1 , X n) o selecie dintr-o populaie caracterizat de variabila aleatoare
Teorema 4.10
X
Dac ( 1 , X n) este o selecie dintr-o populaie caracterizat de
X N ( m, ) ,
n S2 2
x n1
2
(4.22)
Corolar 4.3
Dispersia de selecie are media i dispersia de date
M ( S 2) =
n1 2 ( 2 ) 2(n1) 4
,D S =
n
n2
(4.23)
Demonstraie: din Teorema 3.4 avem c U x2n1 . Se tie c pentru o variabil
aleatoare repartizat
M (U )=
n
M ( S 2) =n1
2
i
2
D (U ) =
n ( 2)
D S =2(n1)
4
X N ( m, ) .
X m
Sn1
S
n1
(4.24)
Demonstraie: din Corolarul 4.1 i Teorema 4.9 se poate exprima variabila aleatoare
(4.24) astfel
T=
Xm
1
Z
=
2
U
nS
1
2
n
n1
n1
Teorema 4.12
X
Dac ( 1 , X n) este o selecie extras dintr-o populaie caracterizat de
nS
2
U M (U )
Z=
=
D(U ) 2(n1)
(4.25)
are o repartiie N(0,1), unde variabila aleatoare U are expresia (4.22).
Teorema 4.13
Variabila aleatoare (4.24) are repartiie N(0,1) pentru n .
Teorema 4.14
Fie variabila aleatoare
{ X '1 , X 'n }
1
{ X ''1 , X 'n' }
2
X 1 N ( m1 , 1 ) ; i X 2 N ( m2 , 2 ) independente i seleciile
extrase din populaiile caracterizate de
X 1 , respectiv
X 1 X 2 (m 1m2 )
2
1
n1 S n2 S
+
n1
n2
2
2
n1 n2
n1 +n 2
(4.26)
are o repartiie Student cu n1 +n22 grade de libertate.
Demonstraie: din Teorema 4.8 se tie c variabilele aleatoare
independente i c
56
X 1 i
X 2 sunt
X 1 X 2 N m1 m2 ,
)
n1 n2
n 1+ n2
deoarece 1= 1= .
2
n1 S1
2
n1
n2 S2
x n1 din Teorema
4.10.Ele fiind variabile aleatoare independente, rezult c suma lor va fi o variabil aleatoare
X 2 cu numrul gradelor de libertate egal cu n11+ n21=n 1+ n22 .
repartizat
{ X '1 , X 'n }
1
{ X ''1 , X 'n' }
2
X 1 , respectiv
n1 S 21
n2 S 22
:
(n11) 21 (n 21) 22
(4.27)
are o repartiie Fischer cu ( n11, n21 ) grade de libertate.
2
n1 S1
2
n1
n2 S2
x n1 . Aceste
variabile aleatoare fiind independente se poate aplica proprietate pentru variabile aleatoare
continue pentru a obine variabila aleatoare (4.27) cu repartiia amintit.
4.4. Tipuri de ipoteze. Riscuri. Puterea unui test
Fie X o variabil aleatoare avnd funcia de repartiie F(x) i fie ( X 1 , , X n) o
selecie extras din populaia caracterizat de X.
Presupunem c F(x) aparine unei clase F de funcii de repartiie. Fie C0 F
C1 =C F C0 , atunci
57
H 0 faptul c
F C 0 i ipoteza alternativ
H1
faptul c
ipoteze H 0 i
(4.28)
H 1 : 1 =0 .
H 0 cu
H 0 mulimea A de valori
ale testului T astfel nct dac valoarea T (x 1 , , x n ) , obinut pentru selecia realizat
(x 1 , , x n) , aparine acestei mulimi, atunci ipoteza
H 0 se accept. Dac
T ( x 1 , , x n ) A=W
, atunci se numete regiune critic a testului T ( X 1 , , X n) .
Verificarea ipotezelor statistice fcndu-se pe baza rezultatelor obinute din selecii
aleatoare, exist ntotdeauna riscul de a lua decizii eronate. Aceasta se ntmpl din cauz c
selecia reprezint doar o parte din populaia general i pe baza ei nu putem s determinm cu
precizie repartiia variabilei aleatoare studiate, sau poate c se poate selecta s nu fie
reprezentativ i atunci informaia oferit de ea este incomplet sau nu concord cu realitatea.
Cu toate acestea, avantajele teoriei verificrii ipotezelor statistice sunt date de posibilitile de
a calcula probabilitatea de a lua decizii false. Dac aceast probabilitate este suficient de
mic, atunci se poate considera c testul aplicat asigur un risc mic de a grei n luarea
deciziei.
Definiia 4.3
58
H 0 i
H 0 . Probilitatea de a respinge
H 0 , dei ea este
adevrat
=P [ T ( X 1 , , X n ) A / H 0 ]
(4.29)
se numete eroare de ordin nti, iar probabilitatea de a accepta ipoteza H 0 , dei ea este
fals
H ]
=P [ T ( X 1 , , X n ) A/
1
(4.30)
/H 0 ]
1=P [ T (X 1 , , X n) A
(4.31)
se numete puterea testului.
Deoarece respingerea ipotezei nule
alternative
=Pc ( T A )=P [ T (X 1 , , X n) A / 1 ] .
1
Se observ c, cu ct probabilitatea 1
H0 ,
erorile
dac
(1)
(2)
(1)
,
Un test T
exist un test T
Dac
H 1 i ,
(2)
(4.32)
59
(4.33)
) =1
Pc ( T A
(4.34)
are valoarea maxim, adic se alege dintre mulimile pentru care probabilitatea erorii de
ordinul unu este constant, , aceea pentru care probabilitatea
este minim.
S presupunem c ipotezele
H 0 :=0 i
determinm condiiile n care un cel mai puternic test exist. Pentru aceasta este mai nti
necesar urmtorul rezultat:
Propoziia 4.1
Fie funciile reale G0 ,G1 : M R . Punctual
x0 M
F ( x )=G1 ( x )c G0 (x ) cu condiia G0 ( x0 ) =a .
Demonstraie:
S considerm c
condiia G0 ( x0 ) =a , adic
echivalent cu G1 ( x 0 ) G1 ( x ) , x M
F ( x ) i c satisface
i G0 ( x0 ) =a . Cum funcia
F ( x ) este funcie
densitatea de probabilitate
L=( x , )=L ( x 1 , , x n ; ) = f ( x i ; ) .
i=1
Vom spune c variabila aleatoare X are proprietatea (G) dac exist o funcie
G: R n R astfel nct x R n i 1 , 2 ( 1 > 2 ) s avem
L ( x ; 1 )
L ( x ; 2 )
=h (G ( x ) )
(4.35)
i fie (X 1 , , X n) o selecie.
H 1 : < 1
H 0 cu alternativa
(4.36)
exist un cel mai puternic test de
este
A = { x R nG( x) c }
unde
(4.37)
P ( A )=1 .
0
F C 0 i
F C 1 (conform ipotezelor
H 0 i
H 1 ). n
H 0 : F C 0 i
1=C0 0
).
H 1 : 1
Definiia 4.5
Fie X o variabil aleatoare cu densitatea de probabilitate f ( x ; ) , i fie
(X 1 , , X n)
61
(f ( X i ; ) )
i=1
L( X ; )
A n=
=
n
(f ( X i ; ) ) 0 L(X ; )
0 i=1
(4.38)
n
unde am notat
L ( X ; )= f ( X i ; ) funcia de verosimilitate.
i=1
H 0 cu alternativa
H 1 admite regiunea de
A = { n n ( ) }
acceptare
(4.39)
n care
(4.40)
Teorema 4.17
Fie
ln f ( x ; )
2
cu
21 cnd n .
H 0 : m=m0 , cnd
62
este cunoscut
(4.42)
H 1 :m m0 ;
(4.43)
H 0 : m=m0 ;
n statistica matematic se demonstreaz c pentru fiecare astfel de pereche testul cel
mai puternic este
Z calc =
x m
/n
(4.44)
z < 0 , iar
z 1 >0 .
x m
<a< 0 . Astfel regiunea de respingere
/n
H 0 este de forma:
A = x R n
x m
<a
/n
(4.45)
unde a se determin din condiia:
P
Xm
<a =
/n
(4.46)
63
m0
x + a / n
i a lui
x + a / n fa de m0 , care
H0
Xm
N (0,1) . Probabilitatea (4.45) este o
/ n
X N (m , 2 /n) i deci
N (m , 2) , cu m
Xm
, tiind c m=m0 . Astfel,
/ n
Xm
0
<a = (a ) =
/n
(4.47)
N (0,1) . n concluzie,
dac
x m0
<z ,
/n
(4.48)
atunci ipoteza
Z N ( 0,1 ) , =P ( Z < z )=
Xm
0
N ( 0,1)
/n
64
sau
este
regiune de
respingere
Fig. 4.2 Regiunea de respingere pentru ipoteza
H 0 : m=m0 cu alternativa
H 1 : m<m0
H 1 :m>m 0 , ipoteza
H 0 trebuie respins
x
x m0
>a> 0 . Astfel regiunea de respingere (regiunea critic) a
/n
H 0 este de forma:
A = x R n
x m
>a
/n
(4.49)
Xm
0
>a = .
/n
m0
x a / n
x i a lui
(4.50)
x a / n fa de m0 , care
H0
Xm
0
>a =1 ( a ) =
/n
(4.51)
Xm
0
> z1 ,
/n
(4.52)
atunci ipoteza
Xm
0
N ( 0,1)
/n
regiune de
H 0 : m=m0 cu alternativa
Fig. 4.4 Regiunea de respingere pentru ipoteza
respingere
H 1 :m>m0 .
Dac ipoteza alternativ a ipotezei nule
H 0 : m=m0 este
H 1 :m m0 , regiunea
| | }
A = x R n
x m
>a
/ n
(4.53)
(| |)
X m0
=
/ n
(4.54)
(| | )
X m0
/ n
> a =2(1 ( a ) )=
( 2 )=z
a=1 1
1 /2
66
(4.55)
Deci, dac
| |
Xm
0
> z 1 / 2 ,
/n
(4.56)
Atunci ipoteza
(fig. 4.5)
Xm
0
N ( 0,1)
/n
1 /2
1 /2
regiune de
regiune de
respingere
respingere
Fig. 4.5 Regiunea de respingere pentru ipoteza H 0 : m=m0 cu alternativa
H 1 :m m0 ; domeniile haurate cu arii egale cu 1 /2
n tabelul 4.1 sunt centralizate condiiile n care, pe baza valorilor de selecie, ipoteza
H 0 : m=m0 , asupra mediei distribuiei normale
2
N (m , ) , cu
cunoscut, este
respins.
Tabelul 4.1 Condiiile de respingere a ipotezei nule
alternativ
H 0 : m=m0 , cu ipoteza
N (m , 2) , cu 2 cunoscut.
H 0 : m=m0
H 1 :m<m0
Condiia
x m0
< z
/n
Xm
0
> z1
/n
H 1 :m>m0
67
H 0 : m=m0
H 1 :m m0
Condiia
Xm
0
> z 1 / 2
/n
| |
n urma acestei prezentri teoretice se pot trage concluzii utile pentru a aborda
problematica testrii ipotezelor. Aadar, pentru a rezolva o problem care implic testarea
ipotezelor trebuie parcurse urmtoarele etape:
1) formularea ipotezei nule i a celei alternative;
2) alegerea nivelului de semnificaie =0,05 ; 0,01 sau 0,001 . De cele mai multe
ori acesta este specificat n enunul problemei;
3) identificarea funciei test adecvat i calcularea valorii sale n vectorul datelor de
x
selecie ( 1 , x 2, , x n) ;
H 0 : m=m0 , cnd
este necunoscut
N (m , 2) , cu m i 2
x m
,
s/ n
(4.57)
m
X
t (n1)
s
n
68
(4.58)
are distribuia student n-1 grade de libertate. Cum densitatea de probabilitate a distribuiei
Student este simetric fa de dreapta
proprietate ca i a distribuiei
T (a )=1T (a)
(4.59)
cunoscut, se obin
H 0 cu o probabilitate de eroare
(tabelul 4.2),
H 0 : m=m0 , cu ipoteza
N (m , 2) , cu 2 necunoscut.
H 0 : m=m0
H 1 :m<m0
Condiia
x m0
<t
s/n
Xm
0
> t 1
s /n
H 1 :m>m0
H 1 :m m0
| |
Xm
0
>t 1 / 2
s/n
(4.60)
H 1 :m>m0 ;
(4.61)
H 0 : m=m0 ;
H 0 : m=m0 ;
H 1 :m m0 ;
69
(4.62)
H 0 : m=m0 , cu ipoteza
H 1 : m>m 0
H 1 :m m0
Condiia (
Condiia (
cunoscut)
x m0
< z
s/n
necunoscut)
x m0
< z
s/n
Xm
0
> z1
s/n
| |
Xm
0
> z 1 / 2
s/n
Xm
0
> z1
s/n
| |
Xm
0
> z 1 / 2
s/n
14.000 u.m.
Pentru un coeficient de ncredere 1 =0,95
s se afle:
a) decizia pe care o va lua investitorul, dac orice alt valoare a venitului mediu n afar
de 15.000 u.m. l-ar determina s renune la proiect;
b) decizia lui, dac venitul mediu familial ar fi de cel puin 15.000 u.m. n cazul unui
venit mediu mai mic de 13.500 u.m. este obligat s renune;
c) eroarea de ordinul doi puterea testului n condiiile punctului b);
70
d) erorile de cele dou ordine pentru cuplul ipotezelor punctului b) dac regula de
decizie este: pentru x > 14.000 u.m. se accept construirea centrului comercial;
e) decizia investitorului, dac poate crea acest centru numai pentru un venit mediu
familial de cel puin 15.000 u.m., orice alt valoare fiind inacceptabil;
Rezolvare:
Pentru a rezolva aceast problem care implic testarea ipotezelor trebuie parcurse
urmtoarele etape:
a) 1. formularea ipotezei nule i a celei alternative
Ipoteza nul: H 0 : m=15.000u . m .
Ipoteza alternativ: H 1 :m 15.000 u . m.
2.alegerea nivelului de semnificaie 1 =0,95 =0,05
3.identificarea funciei test adecvat i calcularea valorii sale n vectorul datelor de
selecie
x m0
/ n
14.00015.000
Z calc =
=1,936
2.000/ 15
Z calc =
2
F ( z ( ) ) =0,975
z ( 0,975 )=1,96
z =1,96
5.compararea valorii calculate cu valoarea critic i formularea deciziei de respingere
F ( z ( ) ) =1
|Z calc|< z
| | |
x m 0
< z
/ n
n
71
(x m0 )< z
x < z
+m0
n
Interval de acceptare
< x < m0 + z
n
n
2.000
2.000
15.0001,96
< x <15.000+1,96
15
15
13.987< x <16.012
b) 1. formularea ipotezei nule i a celei alternative
Ipoteza nul: H 0 : m 15.000u . m.
Ipoteza alternativ: H 1 :m<13.500 u . m.
m0z
x m 0
/ n
14.00015.000
Z calc =
=1,936
2.000/ 15
H 1 care
afirm c venitul mediu va fi mai mic de 13.500 u.m., situaie n care investitorul decide
renunarea la proiect.
Interval de ncredere
Z calc > z
x m0
> z
/n
n
+
(x m0 )> z
72
+m0
n
x > m0+ z
n
x > z
x > 15.000+(1,644)
2.000
15
x > 14.151
c) 1. formularea ipotezei nule i a celei alternative
Ipoteza nul: H 0 : m 15.000u . m.
Ipoteza alternativ: H 1 :m<13.500 u . m.
x m 0
Z calc =
< z
/ n
14.00015.000
Z calc =
=1,936
2.000/ 15
4. identificarea valorilor critice pentru testul statistic
F ( z ( ) ) =
F ( z ( ) ) =0,05
z ( 0,05 )=1,644
z =1,644
5. compararea valorii calculate cu valoarea critic i formularea deciziei de
respingere sau nu a ipotezei nule.
Z calc < z
1,936<1,444
Se accept ipoteza
H 1 care
afirm c venitul mediu va fi mai mic de 13.500 u.m., situaie n care investitorul decide
renunarea la proiect.
Interval de ncredere
Z calc > z
x m0
> z
/n
n
+
(x m0 )> z
x > z
+m0
n
x > m0+ z
n
73
x > 15.000+(1,644)
x > 14.151
2.000
15
>m 0 + z m=m1 m 1
=P ( A / H 1 )=P X
n
P X m 1>m0+ z
m1 :
n
n
m0 + z
m 1
Xm
1
n
P
>
/n
/n
2.000
13.500
15
P Z>
2.000
15
=P ( Z >1,260 )=1P ( Z <1,26 )=1 ( 1.26 ) =10,9=0,11
Iar puterea testului este
=1 =10,11=0,89
d) 1. formularea ipotezei nule i a celei alternative
Ipoteza nul: H 0 : m 15.000u . m.
Ipoteza alternativ: H 1 :m<13.500 u . m.
2.alegerea nivelului de semnificaie 1 =0,95 =0,05
3.identificarea funciei test adecvat i calcularea valorii sale n vectorul datelor de
15.000+ (1,644 )
x
selecie ( 1 , x 2, , x n)
x m0
Z calc =
/ n
14.00015.000
Z calc =
=1,936
2.000/ 15
4.identificarea valorilor critice pentru testul statistic
F ( z ( ) ) =
F ( z ( ) ) =0,05
z ( 0,05 )=1,644
z =1,644
5.compararea valorii calculate cu valoarea critic i formularea deciziei de respingere
sau nu a ipotezei nule.
Z calc < z
1,936<1,444
Eroare de ordin doi
=P ( A |H 0 ) =
Z < z ( )H 0=F ( z ( ) )=
P
P( X <14.000m=m0 )
74
14.00015.000
=P ( Z <1,93 )=0,03
2.000 / 15
Eroarea de ordinul doi este
14.000|m=m1 )=
=P ( A |H 1 )=P ( X>
14.00013.500
P Z>
=P ( 0,97 ) =0,166
2.000
15
e) 1. formularea ipotezei nule i a celei alternative
Ipoteza nul: H 0 : m 15.000u . m.
Ipoteza alternativ: H 1 :m<15.000 u . m.
2.alegerea nivelului de semnificaie 1 =0,95 =0,05
3.identificarea funciei test adecvat i calcularea valorii sale n vectorul datelor de
P Z<
x
selecie ( 1 , x 2, , x n)
x m 0
Z calc =
/ n
14.00015.000
Z calc =
=1,936
2.000/ 15
4.identificarea valorilor critice pentru testul statistic
F ( z ( ) ) =
F ( z ( ) ) =0,05
z ( 0,05 )=1,644
z =1,644
5.compararea valorii calculate cu valoarea critic i formularea deciziei de respingere
sau nu a ipotezei nule.
Z calc < z
1,936<1,444
Se accept ipoteza
> z
/n
n
+
(x m0 )> z
x > z
+m0
n
x > m0+ z
n
75
x > 15.000+(1,644)
x > 14.151
Se accept ipoteza
2.000
15
76
BIBLIOGRAFIE
1. Andrei T., Stancu S., Statistic. Teorie i aplicaii, Ed. ALL, 1995.
2. Balaj Mircea, Calculul probabilitilor, Editura Universitii din Oradea, Oradea,
2007.
3. Beganu Gabriela, Giuclea Marius, Elemente fundamentale de matematic, aplicat
n economie, Editura ASE, Bucureti, 2011.
4. Beganu G., Metode probabilistice aplicate n economie i asigurri, Editura Tehnic,
Bucureti, 1996.
5. Beganu G., Elemente de teoria probabiliti i statistic matematic, Editura Meteor
Press, 2004.
6. Bocan, G. Estimarea parametrilor modelelor statistice, Tipografia Universitii de
Vest, Timioara, 1995.
7. Giuclea, M., Popescu, C.C., Metode fundamentale de matematic cu aplicaii n
economie, Editura ASE, 2009.
8. Mihoc Gh., Urseanu V., Ursianu E., Modele de analiz statistic, Editura tiinific i
Enciclopedic, Bucureti, 1982.
9. Petrior Emilia, Probabiliti i statistic. Aplicaii n economie i inginerie, Editura
Politehnic, Timi, 2007.
10. Tudor M., Sibiceanu M., Iulian., Probabiliti, statistic i aplicaii, Editura ASE,
Bucureti, 2009.
77