Sunteți pe pagina 1din 78

UNIVERSITATEA DIN ORADEA

FACULTATEA DE TIINE
PROGRAMUL DE STUDIU: MATEMATIC DIDACTIC
FORMA DE NVMNT: CU FRCVEN

TESTAREA IPOTEZELOR
STATISTICE

COORDONATOR TIINIFIC
Lector. Univ. Dr. Cta Adriana
ABSOLVENT
MOCAI ALEXANDRA

ORADEA
2015

CUPRINS
INTRODUCERE............................................................................................................3
CAPITOLUL 1. CMP DE PROBABILITATE............................................................5
1.1.

Evenimente aleatoare........................................................................................5

1.2.

Definiia probabilitii......................................................................................7

1.3.

Probabilitate condiionat...............................................................................10

1.4.

Formule de calcul al probabilitii..................................................................11

1.4.1 Formule de nmulire....................................................................................11


1.4.2 Formule de adunare......................................................................................12
1.5.

Scheme probabilistice clasice.........................................................................12

1.5.1 Schema urnei cu bila revenit......................................................................13


1.5.2 Schema urnei cu bila nerevenit.................................................................14
1.5.3 Schema lui Poisson.....................................................................................14
1.6.

Formula probabilitii totale. Formula lui Bayes............................................15

CAPITOLUL 2. VARIABILE ALEATOARE..............................................................18


2.1. Definiia variabilei aleatoare discrete................................................................18
2.2.

Repartiii clasice discrete................................................................................20

2.2.1 Repartiia binomial....................................................................................20


2.2.2. Repartiia hipergeometric..........................................................................21
2.2.3. Repartiia geometric..................................................................................21
2.2.4. Repartiia Poisson.......................................................................................22
2.3.

Definiia general a unei variabile aleatoare..................................................23

2.4.

Funcia de repartiie........................................................................................25

2.4.1. Funcia de repartiie a unei variabile aleatoare discrete..............................26


2.4.2 Funcia de repartiie a unei variabile aleatoare continue.............................28
2.4.3.Exemple clasice de variabile aleatoare continue.........................................30
CAPITOLUL 3. MRIMI CARACTERISTICE ALE VARIABILELOR
ALEATOARE..........................................................................................................................36
1

3.1. Momente iniiale ale variabilelor aleatoare.......................................................36


3.2. Momente centrate i absolute ale variabilelor aleatoare....................................38
3.3. Valoarea medie i dispersia unei variabile aleatoare cu repartiia normal.......40
3.4. Funcia caracteristic a repartiiei normale.......................................................42
3.5. Teorema limit central.....................................................................................43
CAPITOLUL 4. NOIUNI TEORETICE A SELECIEI I VERIFICAREA
IPOTEZELOR STATISTICE...................................................................................................45
4.1. Noiunea de selecie...........................................................................................45
4.2. Caracteristici de selecie....................................................................................46
4.3. Selecii din populaii normale............................................................................48
4.4. Tipuri de ipoteze. Riscuri. Puterea unui test......................................................52
4.5. Ipoteze compuse................................................................................................54
4.6. Testul raportului de verosimilitate.....................................................................55
4.7. Teste referitoare la parametrii repartiiei normale.............................................56
4.7.1. Verificarea ipotezei
4.7.2. Testarea ipotezei

H 0: m=m0 , cnd

H 0: m=m0 , cnd

este cunoscut..................56

este necunoscut..................61

4.7.3. Testarea ipotezelor folosind o selecie de volum mare...............................62


4.8. Problem de estimare a parametrilor repartiiei normale..................................63
BIBLIOGRAFIE..........................................................................................................70

INTRODUCERE
Un test statistic const n obinerea unei deducii bazat pe o selecie din populaie
prin testarea unei anumite ipoteze (rezultat din experiena anterioar). De cele mai multe ori
aceast ipotez este o afirmaie referitoare la valoarea parametrului necunoscut al densitii
populaiei.
Testarea unei ipoteze statistice este procedeul prin care folosind informaia dintr-o
selecie a populaiei se ajunge la o decizie asupra ipotezei n cauz. Dac informaia dat de
selecie este consistent cu ipoteza, atunci se accept ipoteza, iar n caz contrar aceasta este
respins.
Lucrarea de fa este structurat n patru capitole, fiecare dintre acestea avnd
importana lui.
Primul capitol este dedicat expunerii cunotinelor fundamentale din teoria
probabilitilor prezentndu-se noiunile de cmp de probabilitate, evenimente aleatoare,
definiia probabilitii, probabilitatea condiionat, formulele de calcul al probabilitii,
scheme probabilistic clasice, formula probabilitii totale i formula lui Bayes.
n cadrul celui de-al doilea capitol este prezentat noiunea de variabil aleatoare. Se
expun n continuare repartiiile clasice discrete, iar n paragraful aferent acestor repartiii se
studiaz repartiia binomial, repartiia hipergeometric, repartiia geometric, repartiia
Poisson. La sfritul capitolului se introduce noiunea de funcie de repartiie a unei
variabilei aleatoare.
Cel de-al treilea capitol este dedicat studiului mrimilor caracteristice ale variabilelor
aleatoare insistnd asupra noiunilor de moment iniial al unei variabilei aleatoare, momente
centrate i absolute ale variabilei aleatoare, valoarea medie i dispersia unei variabile
aleatoare cu repartiie normal, funcia caracteristic a repartiiei normale. Capitolul se
ncheie cu prezentarea teoremei limit central pentru un ir de variabile aleatoare
independente.
Capitolul patru sintetizeaz aspecte referitoare la noiunile teoretice ale seleciei i
verificarea ipotezelor statistice. Se abordeaz noiunea de selecie, caracteristicile de selecie,
selecii din populaii normale, tipuri de ipoteze, riscuri, puterea unui test, ipoteze compuse,
testul raportului de verosimilitate, teste referitoare la parametrii repartiiei normale.
Materialul prezentat n capitolele lucrrii creeaz suportul teoretic pentru elaborarea
unei aplicaii practice expus n ultimul paragraf. Contribuia original a lucrrii const n
3

prezentarea unui studiu de caz concretizat ntr-o problem de decizie n contextul formulrii
diverselor cupluri de ipoteze. Aceasta este o problem de estimare a parametrilor repartiiei
normale i de testare a ipotezelor. Prin eantionarea populaiei considerate se vor lua anumite
decizii. Cum decidem dac rezultatele observrii unui eantion sunt n dezacord cu ipoteza,
cnd trebuie respins ipoteza i cnd nu, care este probabilitatea de a lua o decizie
nepotrivit, ce funcie de valori de selecie folosim n procesul de decizie, sunt ntrebri la
care se ncearc s se rspund prin acest studiu de caz n contextul aplicrii teoriei statistice
i a testrii ipotezelor.
Materialul bibliografic indicat s-a parcurs i sintetizat, de asemenea, ntr-o manier
proprie.
Lucrarea de disertaie se ncheie cu o bibliografie bine selectat, aceasta cuprinznd
10 titluri de lucrri i cri utilizate pe parcursul elaborrii acestui material.

CAPITOLUL 1. CMP DE PROBABILITATE


1.1.

Evenimente aleatoare
Noiunile primare ale teoriei probabilitii sunt cele de eveniment ataat unui

experiment aleator i de probabilitate a unui astfel de eveniment.


n viaa de zi cu zi se gsesc experiene ale cror rezultate sunt diferite innd cont de
circumstane ntmpltoare, ce nu pot s fie cunoscute naintea realizrii lor. Ca i exemple ar
fi:
-

jocurile de noroc;
observarea numrului de apeluri telefonice recepionate de o central telefonic

ntr-un interval de timp;


observarea duratei de via a indivizilor dintr-o populaie uman sau biologic.

Astfel de experimente sunt aleatoare, iar orie rezultat al unei experiene aleatoare se
numete eveniment. Probabilitatea lui este un numr care reprezint ansa de realizare a
evenimentului.
Definiia 1.1
Evenimentul ce se produce cnd se cunosc unul din evenimentele A sau B se numete
eveniment a lui A sau B i se noteaz cu

A B .

Evenimentul ce se produce cnd se produc n acelai timp evenimentele A i B se


numete eveniment intersecie i se noteaz A B .
Nerealizarea evenimentului A este un eveniment ce se numete eveniment opus sau
contrar i se noteaz

(sau CA, sau

A C ).

Definiia 1.2
Dac realizarea evenimentului A implic realizarea evenimentului B, se spune c A l
implic pe B i se scrie
sunt echivalente, deci

A B . Dac

A B

i B A , atunci cele dou evenimente

A=B .

Definiia 1.3
Dou evenimente A i B se numesc incompatibile dac nu se pot realiza simultan,
adic

A B= . n caz contrar, ele sunt compatibile. Evenimentele ale cror realizri nu

se influeneaz reciproc se numesc independente.


Fie mulimea finit a evenimentelor posibile la efectuarea unei experiene i
P() mulimea prilor lui .
Definiia 1.4
5

Fie

K P () o mulime nevid de pri ale lui . Ea se numete corp de

evenimente dac verific urmtoarele axiome:


1.
2.

A K , A K ;
A B K , A , B K .

Propoziia 1.1
Dac mulimea K este corp de evenimente, atunci au loc afirmaiile:
1. K , K ;
2. dac A 1 , A 2 , An K , atunci i=1 n A i K , i=1 n A i K ;
3. dac A , B K , atunci AB K .
Demonstraie: 1. Mulimea K fiind nevid, exist cel puin un eveniment
Din axiomele corpului rezult c

A K

A A K . Rezult c K

A K .

=
K .
2. Se arat prin inducie matematic, folosind axioma 2 a Definiiei
1.4., c i=1 n A i=K . Din definiia corpului avem
A i K , i=1, n i i=1 n A i K . Dar

i=1
, atunci
i=1 n A i= n A i

i=1
n A i = i=1 n A i K .
3. Se folosete proprietatea demonstrat la punctul 2 pentru c
AB=A B .

Definiia corpului de evenimente se generalizeaz n cazul n care

este o

mulime nenumrabil de evenimente.


Definiia 1.5
O mulime
1.
2.

K P () nevid se numete corp borelian de evenimente dac

A K , A K ;
i 1 Ai K , ( A i )i 1 N K .
Datorit formulelor lui De Morgan rezult c operaiile cu membrii ai corpului

borelian K, fcute n orice ordine i manier, au ca rezultat tot un membru al acestei familii
pentru orice mulime numrabil de indici I.
Se extind astfel rezultate Prop. 1.1. i se poate spune c familia K este, n acest sens,
nchis fa de aceste operaii.
Definiia 1.6

Cuplul ( , ) se numete cmp de evenimente dac

este o mulime

numrabil de evenimente posibile la efectuarea unei experiene, iar K este un corp de


evenimente.

Definiia 1.7
Cuplul ( , ) se numete cmp borelian de evenimente dac

este o mulime

nenumrabil de evenimente posibile la efectuarea unei experiene, iar K este un corp


borelian de evenimente.
1.2.

Definiia probabilitii
Noiunea de probabilitate a fost introdus ca o msur a mulimilor de evenimente din

K i a putut fi definit n trei moduri:


1.
definit ca o funcie de mulime, definiie numit axiomatic;
2.
definit clasic n cazul unui numr finit de evenimente egal posibile;
3.
definit statistic cu ajutorul frecvenei de realizare a unui eveniment.
1. Definiia axiomatic st la baza teoriei moderne a probabilitilor i include definiiile
clasic i statistic.
Considerat ca funcie, probabilitatea are domeniul de definiie K, familia tuturor
submulimilor lui .
Dac , ins, are o infinitate nenumrabil de puncte, deci are un numr prea
mare de submulimi, atunci devine imposibil desemnarea unei probabiliti pentru fiecare
dintre ele, probabilitatea care s ndeplineasc anumite condiii. Aadar, dac

este o

mulime finit sau infinit numrabil, atunci desemnarea se poate face pentru toate
submulimile ei.
Vom presupune mai nti c spaiul este numrabil.
Definiia 1.8
Se numete probabilitate pe cmpul de evenimente ( , ) funcia

P: R

care verific urmtoarele axiome:


1.
2.
3.

P ( A ) 0, A K
P ( )=1
P ( A B )=P ( A ) + P ( B ) ,dac A B=

Definiia 1.9
Un cmp de evenimente ( , K) nzestrat cu o probabilitate P se numete cmp de
probabilitate ( , K , P ).
7

Propoziia 1.2
Fie ( , K , P ) un cmp de probabilitate. Atunci:
)=1P ( A ) , A K
1. P ( A
2. P ( )=0
3. Dac A B , atunci P( A) P( B)
4. 0 P( A) 1, A K
5. P ( BA )=P ( B )P( A B)
6. P ( BA )=P ( B )P ( A ) , dac A B
7. P ( A B )=P ( A ) + P ( B )P ( A B ) , dac A B
Demonstraia 1. Se folosesc relaiile
atunci, din axiomele 2 i 3 c
1.
2.

A A=
i A A=
, A K . Rezult,

)=1 .
P ( A )+ P ( A

se folosesc proprietatea 1 si axioma 2.


Cum =
Se poate scrie pentru A , B K
) =(B A ) (B A)

B=B =B ( A A

(1.1)

i
) =
(B A )( B A

(1.2)

Atunci, conform axiomei 3, avem


P ( B ) =P ( B A ) + P(B A)

Punnd condiia

(1.3)

A B , relaia (1.3) devine


P ( B ) =P ( A )+ P( BA )

(1.4)

Din care rezult proprietatea 3.


3.
i 3.
4.
5.
6.

Se tie c A , A K , deci se vor aplica axioma 2 i proprietile 2


Proprietatea 5 se deduce din (1.3).
Proprietatea 6 se deduce din (1.4).
n relaiile (1.1) (1.3) se nlocuiete B cu A. Atunci
) ( A B )
A B=( A B ) ( B A
Aplicnd probabilitatea pentru evenimente incompatibile 2 cte 2, avem
)+ P ( A B
)
P ( A B )=P ( A B ) + P ( B A
Ultimii doi termeni ai sumei se nlocuiesc din relaia (1.3) i similara ei obinut

pentru A n loc de B i gsete proprietatea 7.


Problema desemnrii unei probabiliti pentru oricare dintre submulimile lui
apare atunci cnd este o mulime nenumrabil, dar poate fi rezolvat prin considerarea
unei clase adecvate de mulimi de evenimente numite corp borelian (Definiia 1.5).
Definiia 1.10
Fie ( , K) un cmp borelian de evenimente. Se numete probabilitate complet
aditiv pe K aplicaia f : K R

care verific urmtoarele axiome:


8

P ( A ) 0, A K
P ( )=1
P ( i I A i )= P ( Ai ) , ( Ai )i I K , A i A j= ,i j .
i I

1.
2.
3.

I fiind o mulime cel mult numrabil de indici.


Definiia 1.11
Fie ( , K) un cmp borelian de evenimente i fie P o probabilitate complet
aditiv. Cuplul ( , K , P) se numete cmp borelian de probabilitate.
Propoziia 1.3
Orice probabilitate complet aditiv est probabilitate pe un cmp de evenimente.
Demonstraia: rezult din axioma 3 dac se aleg evenimentele

A i=

pentru

i> n .

Urmtoarele dou teoreme, ce sunt enunate fr demonstraie, reprezint proprietile


de continuitate ale probabilitii.
Teorema 1.1
A
Fie ( , K , P) un cmp borelian de probabilitate i ( n)n N

un ir descendent

de evenimente din K ( A i A j pentru i< j , i, j N . Atunci

P ( A n ) n P ( n N A n ) .

Teorema 1.2
A
Fie ( , K , P) un cmp borelian de probabilitate i ( n)n N

un ir ascendent

de evenimente din K ( A i A j pentru i< j , i, j N . Atunci

P ( A n ) n P ( n N A n ) .
2. Definiia clasic
Se consider c mulimea conine un numr finit de evenimente elementare
i , 1 i n , care au aceeai ans de realizare

p . Atunci din

=i=1 n i
se gsete c
n

P ( )= P ( i) =np=1,
i=1

deci

p=1/n

dac A este un eveniment oarecare pentru care se poate scrie


9

A=i=1 m i , m n
atunci se obine c
m card ( A)
P ( A )= =
n card ()
(1.5)
Se obine astfel:
Definiia 1.12
Se numete probabilitatea unui eveniment A raportul dintre numrul evenimentelor
egal probabile favorabile producerii lui A i numrul total de evenimente egal probabile.
Evident, probabilitatea definit clasic satisface axiomele din definiia (1.8).
Definiia clasic are, ns, anumite inconveniente:
a) se poate aplica doar cnd evenimentele elementare au aceeai ans de realizare;
b) nu poate fi utilizat cnd exist un numr infinit de evenimente elementare;
c) nu se poate aplica unei largi categorii de evenimente crora nu li se poate determina
numrul cazurilor favorabile.
3. Definiia statistic
Se consider un experiment n care se urmrete apariia unui eveniment A. Frecvena
absolut a evenimentului A este numrul m de realizri ale lui. Atunci cnd au loc n
probe, frecvena relativ de realizare a lui A este raportul m/n . La un numr mare de
repetri ale acestei experiene, frecvena relativ se va stabiliza, oscilnd n jurul acestui
numr, care va fi probabilitatea lui A.
1.3.

Probabilitate condiionat
Definiia 1.13
Fie ( , K , P) un cmp de probabilitate i fie A i B dou evenimente dependente

din K, astfel nct

P( A) 0 . Se numete probabilitatea evenimentului B condiionat de

realizarea lui A raportul


P ( B| A )=

P ( A B)
.
P( A)

(1.6)
Se poate arta cu uurin c definiia dat are sens deoarece raportul (1.6) verific
axiomele probabilitii:
1.

P( B A) 0

pentru c

P( A)>0 i

P ( A B ) 0, A , B K ;

10

2.

P [ ( B C ) A ] P [( B A ) ( C A ) ]
=
=
P( A)
P(A)
P ( B A ) + P(C A)
=P ( B| A ) + P(CA ), dac B C= .
P( A)

P ( | A )=

Din formula (1.6) se poate determina


P ( A B ) =P ( A ) P( B A)
(1.7)
adic, probabilitatea ca evenimentele A i B s se realizeze este dat de produsul dintre
probabilitatea lui A i probabilitatea lui B condiionat de realizarea lui A.
Se poate observa uor c probabilitatea condiionat

P( B A) folosete informaie

parial, acea oferit de cunoaterea probabilitii lui A.


Definiia 1.14
Evenimentele A i B sunt independente dac
P ( A B ) =P ( A ) P( B)

(1.8)

Relaia (1.8) deriv din noiunea de independen a evenimentelor A i B, realizarea


lui B, de exemplu, are loc independent de realizarea lui A, deci
P ( B| A )=P(B) sau

P ( A|B )=P( A)

i aceleai relaii nu pot avea loc dect dac este ndeplinit condiia (1.8).
1.4.

Formule de calcul al probabilitii


1.4.1 Formule de nmulire
Propoziia 1.4
Fie ( , K , P) un cmp de probabilitate. Dac

A 1 , A 2 , An

sunt evenimente

independente din K, atunci probabilitatea realizrii lor simultane este


i=1
n

P ( n Ai ) = P( A i )

(1.9)

i=1

Propoziia 1.5
Fie ( , K , P) un cmp de probabilitate. Dac
dependente din K cu proprietatea c

i=1
atunci
P ( n Ai ) 0

11

A 1 , A 2 , An

sunt evenimente

i=1
A n i=1
(
)
P n Ai =P( A1 ) P( A2 A 1) P (A 3 A1 A2 ) P ( n1 A i )

(1.10)

Se observ c formula (1.9) se obine din formula (1.10) dac se consider c


evenimentele sunt independente. Aadar formula (1.10) poate fi numit formula general de
nmulire pentru o intersecie de evenimente.
O interpretare important o ofer formula (1.10) n care se vede c fiecare factor care
conine probabilitatea unui eveniment care este influenat (condiionat) de toate evenimentele
ce s-au realizat pn la acel moment. Acest lucru reprezint o constatare real a modului n
care se desfoar orice proces, i anume, o realizare actual este influenat e toat istoria
desfurrii acelui proces pn la momentul actual.
Propoziia 1.6
Fie ( , K , P) un cmp de probabilitate i

A 1 , A 2 , An

evenimente din K.

Atunci
i =1
n

(1.11)

P ( n Ai ) P ( Ai ) (n1)
i=1

1.4.2 Formule de adunare


Propoziia 1.7
Fie ( , K , P) un cmp de probabilitate. Dac

A 1 , A 2 , An

sunt evenimente

din K incompatibile dou cte dou ( Ai A j = , i j) , atunci


i=1
n

(1.12)

P ( n Ai ) = P( A i)
i=1

Demonstraia: folosete axioma 3 a probabilitii.


Aceast relaie se numete proprietatea de aditivitate finit a probabilitii.
Propoziia 1.8
Fie ( , K , P) un cmp de probabilitate. Dac

A 1 , A 2 , An

A
din K compatibile dou cte dou ( i A j= ,i j ) , atunci

12

sunt evenimente

i=1
P ( A i A j ) +
n

P ( n Ai ) = P ( Ai )
i=1

i=1

i=1
n

(1.13)

P ( Ai A j A k )+(1)n1 P ( n Ai )
i=1

Demonstraia: se face, la fel ca pentru toate formulele de calcul, prin inducie,


pornind de la proprietatea 7 a probabilitii (Propoziia 1.2), care reprezint faptul c (1.13)
este adevrat pentru n=2 .
1.5.

Scheme probabilistice clasice


Foarte multe aplicaii practice i gsesc rezolvarea cu ajutorul schemelor

probabilistice dac se poate face o analogie ntre modurile de desfurare ale experimentelor
din aplicaii i cele din schemele clasice. De aceea este deosebit de important de a reine
condiiile n care are loc fiecare din experimentele ce ilustreaz schemele clasice.

1.5.1 Schema urnei cu bila revenit


p i

O urn conine bile albe i negre identice ca mrime pentru care se tie c

q=1 p sunt probabilitile de a extrage o bil alb, respectiv, o bil neagr. Se fac n
extrageri punndu-se bila extras n urn. Se cere probabilitatea de a obine k
nk

bile negre, eveniment notat cu


Dac se noteaz cu

bile albe i

Xn, k .

A i evenimentul de a obine o bil alb la extragerea

i, i=1,2 , n , atunci o modalitate de a scrie evenimentul a crui probabilitate se cere este

A i A k A k1 A n
unde evenimentul de a extrage o bil neagr este, evident, contrarul celui de a scoate o bil
alb. Din modul de desfurare a experienei se vede c evenimentele sunt independente (nu
are importan rezultatul unei extrageri pentru extragerea urmtoare) i probabilitatea cu care
se scoate o bil alb (sau neagr) este aceeai pentru orice prob pentru c, componena urnei
13

rmne tot timpul aceeai. Atunci evenimentul scris va avea probabilitatea calculat dup
pk qnk

formula (1.9), adic


nk

i, cum numrul total de moduri de a obine k

bile albe i

bile negre este Cnk , rezult c probabilitatea cerut este


P ( X n , k )=C kn p k q nk

(1.14)

Din cauza formulei (1.14), schema bilei revenite se mai numete schema binomial
sau schema lui Bernoulli.
Exemplu
Se arunc un zar de 14 ori. Care este probabilitatea ca de 5 ori s apar faa cu un
numr de cel puin 4 puncte?
Rezolvare:
O fa cu cel puin 4 puncte apare la o aruncare cu probabilitatea

p=4/6

i rmne

constant ori de cte ori se efectueaz experiena, ceea ce este echivalent cu schema
binomial n care componena urnei este aceeai dup fiecare extragere. n aceste condiii
probabilitatea cerut este
P ( X 14,5 )=C

5
14

2
3

1 9
.
3

( )( )

1.5.2 Schema urnei cu bila nerevenit


O urn conine

bile, a albe i b negre, a+b=N . Se extrag succesiv

n bile (n N ) fr a pune bila extras napoi n urn i se cere aflarea probabilitii de

a obine k ( k a) bile albe i (nk ) bile negre.


innd seama de faptul c la fiecare extragere n urn exist cu o bil mai puin,
probabilitatea evenimentului notat la fel ca mai nainte cu
definiia clasic a probabilitii (1.5), obinnd
X
P( n , k )=

k
C ba Cn
b

(1.15)
Exemplu
14

C nN

Xn, k

va fi determinat prin

ntr-un lot de 100 de piese exist 10 piese rebut. Se verific 25 de piese. Care este
probabilitatea de a gsi 3 piese rebut?
Rezolvare:
Verificarea se face, n general, extrgnd piese din lot fr a le mai pune napoi.
Atunci probabilitatea se va determina dup formula (1.15), adic
X
P( 25,3)=

C310 C 22
90
C25
100

1.5.3 Schema lui Poisson


Se consider n urne avnd bile de aceleai dou culori, albe i negre (de exemplu).
Se cunosc probabilitile de a extrage o bil alb

pi , respectiv o bil neagr q1

( pi +qi =1) , pentru fiecare urn U i ,i=1,2, n . Extrgnd cte o bil din fiecare urn,
se cere probabilitatea de a avea k

bile albe i nk

bile negre.

Probabilitatea se afl ca fiind coeficientul lui t k din dezvoltarea


n

Q (t )= ( p i t+qi )

(1.16)

i=1

Se observ pentru

pi= p , i=1,2, n

c polinomul (1.16) devine Q (t )=( pt +q )n

n care coeficientul lui t k este dat de formula (1.14) din schema binomial. Astfel schema
lui Poisson este o generalizare a schemei lui Bernoulli.

Exemplu
n trei loturi de produse exist rebuturi n procent de 3%, 5%, respectiv, 2%. Dac din
fiecare lot se extrage cte un produs, care este probabilitatea de a obine 2 rebuturi?
Rezolvare
Corespunztor fiecrui lot avem:
q 2=0,95 ;

p1=0,03 ; q1 =0,97 ;

p2=0,05 ;

p3=0,02 ; q3 =0,97 .

Pentru ca din cele 3 produse extrase, 2 s fie rebut, se va alege din polinomul
Q (t )=( p 1 t+ q1 ) ( p2 t+q 2 ) ( p3 t+q 3)
Coeficientul lui t 2 , adic

P ( X 3,2 ) =p 1 p2 q3 + p1 p 3 q 2+ p 2 p3 q1 .
15

1.6.

Formula probabilitii totale. Formula lui Bayes


Cele dou formule se determin n aceleai ipoteze i anume, n condiiile n care

exist un sistem complet de evenimente, noiune pe care o definim acum:


Definiia 1.15
Fie

A 1 , A 2 , An dintr-un corp

K . Se spune c ele formeaz un sistem complet

de evenimente dac ndeplinesc urmtoarele axiome:


1. sunt incompatibile dou cte dou ( Ai A j= , i j ) ;
2. i=1 n A i= .

Formula probabilitii totale


Fie

{ A1 , A 2 , An } un sistem complet de evenimente i fie un eveniment B


K . Atunci

oarecare din corpul

P ( B ) = P( Ai ) P(B Ai )

(1.17)

i=1

Demonstraia formulei rezult din modul n care se poate exprima orice eveniment
B

n funcie de evenimentele sistemului complet, i anume


B=( B A 1 ) ( B A 2 ) (B A n)
innd seama de faptul c evenimentele B A i , i=1,2,. ..n

cte dou deoarece

sunt incomptibile dou

A i ,i=1,2,... n formeaz un sistem complet, se va putea aplica regula

de adunare (1.12) obinnd


B
P( Ai )
n

P ( B ) =
i=1

Dac pentru termenul general a sumei se folosete exprimarea (1.7), se gsete relaia
(1.17).
Formula probabilitii totale (1.17) precum i formula lui Bayes, care urmeaz, sunt
folosite atunci cnd se cunosc probabilitile
n modul urmtor: un eveniment B
cauze

P ( B| A ) , i=1,2,. . n . acestea pot fi interpretate

se produce datorit unui numr de circumstane sau

A i ,i=1,2, n . nseamn c sunt cunoscute probabilitile ca B

16

s se realizeze

condiionat de fiecare din cauzele posibile. Atunci probabilitatea lui total este calculat din
probabilitile diferitelor circumstane i probabilitile condiionate corespunztoare.
n aceleai condiii se determin probabilitatea oricrui eveniment al sistemului
complet condiionat de realizarea lui B , adic, tiind c efectul B

s-a realizat, el s fi

fost provocat de o anumit cauz.


Formula lui Bayes
Fie

{ A1 , A 2 , An } un sistem complet de evenimente i fie un eveniment B

oarecare din corpul

K . Atunci
P( Ak B)

P( A k ) P (BA k )
P(B)

(1.18)
pentru orice k =1,2,.. n .
Demonstraia rezult uor din definiia probabilitii condiionate (1.6) din care avem
c
P ( B A k )=P ( B|A k ) P ( A k )=P( A k B) P (B)
De aici se scoate

P( Ak B) ;i se deduce (1.18).

Publicat n 1763, aceast formul cu o demonstraie att de uoar a devenit


faimoas prin interpretarea ei, i anume: se determin probabilitatea unei cauze

baza efectului observat B . n timp ce

Ak

pe

A
P( k ) este o probabilitate a priori,

A
P( k B) este o probabilitate a posteriori din cauza

A k . Este recunoscut

aplicabilitatea formulei n toate domeniile fenomenelor naturale i ale comportamentului


uman. Pentru a ilustra aceast afirmaie ne rezumm doar la un rezultat devenit clasic, acela
obinut de Laplace (unul dintre cei mai mari matematicieni ai tuturor timpurilor, care a scris
un tratat de probabiliti n jurul anului 1815). Folosind teorema lui Bayes, el a estimat
probabilitatea ca soarele s rsar mine. n timpurile moderne, o ramur important a
statisticii a devenit statistica bayesian.

17

Exemplu
n trei secii ale unei fabricaii se asambleaz un anumit tip de lamp electrornic. Se
tie c n prima secie lucreaz 12 muncitori, n a doua 15 i n a treia 13 i c procentul de
rebut al fiecrei secii este 2%, 3%, respectiv 1%. Se alege la ntmplare un produs din
depozit. Se cere:
a) probabilitatea ca produsul s fie defect;
b) probabilitatea ca produsul defect ales s provin de la secia a doua.
Rezolvare:
Se noteaz cu

A i evenimentul ca o lamp aleas la ntmplare s provin din

atelierul i, i=1,2,3 i se observ c cele trei evenimente formeaz un sistem complet de


evenimente. Probabilitile lor sunt
12
15
13
, P ( A 2) = , P ( A3 ) = .
40
49
40
Dac notm cu B evenimentul ca o lamp s fie rebut, atunci gsim din enun c
2
3
1
P ( BA 1 )=
, P ( B A 2) =
, P ( BA 3 )=
.
100
100
100
Cu aceste, valori, probabilitile cerute se determin din formulele (1.17) i (1.18).
12 2 15 3 13 1
P (B)=
+
+
=0,025
a)
40 100 40 100 40 100
15 3
1

=0,54
b) P ( A 2B )=
40 100 0,025
P ( A 1 )=

18

CAPITOLUL 2. VARIABILE ALEATOARE


2.1. Definiia variabilei aleatoare discrete
Materialul prezentat n acest capitol urmeaz expunerea celui din [3].
Acum se poate da o formulare a noiunii de variabil aleatoare discret.
Mai nti se presupune c este o mulime numrabil. Aceast presupunere aduce o
simplificare important, care se va dovedi aparent. Cum este domeniul de definiie a lui
X, este clar c imaginea lui X este finit cnd este finit i cel mult numrabil cnd este
aa. Astfel, imaginea lui X este mulimea numerelor reale
{ X () }= { x1 , x2 , .. x n , }
(2.1)
irul valorilor lui X poate fi finit sau nu. Faptul c (1.1) reprezint mulimea valorilor lui X
conduce la exprimarea
=i { X =xi } = i Ai

unde am notat evenimentul c X ia valoarea

x i cu

A i , i putnd lua un numr finit sau

infinit de valori din N. Valorile lui X fiind distincte, se observ c mulimile


formeaz un sistem complet de evenimente, adic evenimentele

A i ,i N ,

A i K , i I N

verific

condiiile:

Ai A j= , i j I
P ( i I A )= P ( A i )=1
i I

Definiia 2.1
Se numete variabil aleatoare (v.a.) discret o funcie

X =x( ) , definit pe

mulimea evenimentelor cu valori reale, astfel nct


A i= {X ( ) =xi } K , x i R , i I

(2.2)

Dac se noteaz probabilitile evenimentelor (2.2) cu


pi=P ( Ai ) , i I

(2.3)

atunci orice variabil aleatoare discret se prezint sub forma unui tabel, numit i tabel de
xi R

distribuie, avnd prima linie format din valorile


probabilitile corespunztoare astfel:

19

i linia secund din

X:

p 0, i I
xi
,i I , i
pi
Pi=1

()

(2.4)

i I

Dac variabila aleatoare X ia o singur valoare a, avem:


A= { X ( ) =a } = i deci

p=P ( A )=1 .

n acest caz se spune c X este o variabil aleatoare constant i se scrie X=a cu

().

X: a
1

tabelul de distribuie

Sistemul de numere reale

pi ,i I

p i 0,i I
P i=1

cu proprietile
se numete distribuia de probabilitate a

i I

variabilei aleatoare sau repartiia acestei variabile aleatoare discrete.


Definiia 2.2
Fie X i Y dou variabile aleatoare discrete definite prin
A i , i I N

X ( )=x i pentru

i Y ( )= y j pentru B j , j J N , unde

{ Ai } i { B j } sunt

dou sisteme complete e evenimente. Se spune c variabilele aleatoare X i Y sunt


independente dac sistemele complete corespunztoare sunt independente, adic
P ( A i B j )=P ( Ai ) P ( B j ) , i I , j J
Folosind notaia (2.3), relaia de mai nainte devine
P ( X=x i ,Y = y j ) =P( X =X i ) P(Y = y j )

(2.5)

Definiia dat independenei a dou variabile aleatoare discrete se poate, atunci,


extinde conform formulei de nmulire.
Definiia 2.3
Variabilele aleatoare

X 1 , X 2 , , X n cu valori numrabile se spune c sunt

independente dac i numai dac, pentru orice numere reale

x 1 , x 2 , , x n , avem

P ( X 1=x 1 , X 2=x 2 , X n =x n )=
P ( X 1=x 1 ) P ( X 2 =x2 ) P ( X n =x n ) .
Aceast formul poate fi, la rndul ei, generalizat prin nlocuirea valorilor
mulimea oarecare S i ,i=1,2, n .
Propoziia 2.1

20

x i cu

Fie mulimile numrabile oarecare S 1 , Sn . Variabilele aleatoare

X 1 , X 2 , X n

sunt independente dac i numai dac


P ( X 1 S 1 , X n S n )=P ( X 1 S1 ) P( X n S n )
Presupunem acum c variabilele aleatoare

(2.6)

X 1 , X 2 , X n cu valori numrabile sunt

dependente pe mulimea , evident, numrabile. Atunci, pentru valorile posibile oarecare


x 1 , x 2 , , x n , avem
P ( X 1=x 1 , X 2=x 2 , X n =x n )=
P ( X 1=x 1 ) P ( X 2 =x2 X 1=x 1 ) P ( X 3 =x3 X 1=x 1 , X 2=x 2 )
P ( X n=x n|X 1=x 1 , X 2=x 2 , X n1=x n1 ) .

(2.7)

Primul termen al formulei exprim probabilitatea comun a variabilei aleatoare


X 1 , X 2 , X n i este obinut din formula (1.10) ca produs de probabiliti condiionate.
Propoziia 2.2
Fie X o variabil aleatoare i k o constant real. Atunci
2

X + k ,k X ,|X|, X ,

1
,( X 0) sunt, de asemenea, variabile aleatoare.
X

Propoziia 2.3
Fie X i Y dou variabile aleatoare definite pe sisteme complete de evenimente

{ Ai } i { B j } , i I N , j J N i fie g (x,y) o funcie real definit pe R2 . Atunci


z=g( X , Y ) este o variabil aleatoare.

Demonstraie: funcia Z ia valorile


pij =P ( A i B j ) ,i I , j J

z ij=g (x i , y j ) cu probabilitile

fiind definit pe sistemul de evenimente

Cij = { X ( ) =xi , Y ( )= y i }= Ai B j ,i I , j J

(2.8)

Se observ c evenimentele (2.8) determin un sistem complet de evenimente, adic


ndeplinesc condiiile:
1.
2.

Cij Chk =( A i B j ) ( A h B k )=( A i A h ) ( B j B k )= ,


pentrui h , j k , i
i I j J Cij =( i I Ai ) ( j J B j )= pentru c { Ai }i I
sunt sisteme complete de evenimente.

2.2. Repartiii clasice discrete


2.2.1 Repartiia binomial

21

{ B j } j J

n experiena descris n schema bilei revenite sau a lui Bernoulli (capitolul 1, 1.5.1)se
deduce c probabilitatea de a extrage k bile albe i n-k bile negre, punnd napoi bila extras,
este dat de formula (1.14) pe care o vom nota
bk ( n , p )=P ( X =k )=C kn p k qnk ,

(2.9)
p , q 0, p+q=1 .

unde p este probabilitatea de a extrage o bil alb, deci

Se presupune atunci c variabila aleatoare X, ce reprezint numrul de bile albe


obinute n schema lui Bernoulli, are distribuie binomial i se scrie

X Bi (n , p) . Ea va

avea, deci, tabelul de distribuie:


X:

k
k =0,1, n
k nk ,
p , k 0, p+q=1
C p q
k
n

(2.10)

Probabilitile din tabel fiind termeni ai binomului ( p+q)n , rezult c sunt


ndeplinite condiiile (1.8), adic
bk ( n , p ) 0, k =0,1, n
n

b k ( n , p ) =( p+q)n=1
k=0

2.2.2. Repartiia hipergeometric


Schema cu bila nerevenit determin probabilitatea ca avnd a bile albe i N a bile
negre s extragem k bile albe i n-k bile negre (k a , n N ) .
Se va spune c variabila aleatoare X, ce reprezint numrul de bile albe obinute n
schema bilei nerevenite, are distribuie hipergeometric, deci are tabelul de distribuie:
k
nk
k=0,1, a
X : C C N a ,
a n N
n
CN

( )
k
a

(2.11)
Se demonstreaz simplu c probabilitile din (2.11) determin un tabel de distribuie
(condiiile din (2.6)).
2.2.3. Repartiia geometric

22

Presupunem c moneda este neomogen, probabilitatea de a apare stema este p, iar


variabila aleatoare ce reprezint numrul probei n care va apare stema are tabelul de
distribuie
X:

k
k1 , k =1,2, , p , q 0, p+q=1
pq

(2.12)

Condiiile (2.4) sunt respectate deoarece se obine seria geometric de raie subunitar
q,deci

1
=1
p q k1= p 1q

k=1

Variabila aleatoare X se mai poate ca timpul de ateptare pn la apariia stemei, sau


mai general, pn la apariia unui succes, iar distribuia (2.12) se va numi repartiie
geometric cu probabilitatea p a unui succes.
2.2.4. Repartiia Poisson
Repartiia Poisson are o importan deosebit att n teorie ct i n practic. Se
ncearc artarea acestui lucru n cele ce urmeaz.
Se consider o variabil aleatoare X determinat de probabilitile
pk ( )=P ( X =k ) =e k /k ! , > 0,
unde

(2.13)

este un parametru real pozitiv oarecare. Atunci variabila aleatoare cu tabelul de

distribuie

( )
k

X:

k , k=0,1,2, , >0
k!

se va spune c are distribuie Poisson de parametru

(2.14)

Se arat c probabilitile (2.13) verific condiiile (2.4), adic


pk ( ) 0, k =0,1

k=0

k=0

pk ( )=e

k k
=e e =1
k!

unde s-a folosit dezvoltarea n serie Taylor a funciei e . Astfel (2.14) este un tabel de
distribuie.
n continuare se studiaz legtura dintre repartiiile binomial i Poisson, considernd
comportamentul lor la limit, pentru a ajunge la un mod simplificat de a demonstra teorema
lui Poisson.
23

n probabilitile (2.9) ce definesc repartiia Bi(n,p) se va alege

p= pn =

considernd, astfel, un ir de repartiii binomiale pentru c notm termenul general de ordin k


fixat, k=0,1,...n, cu

bk ( n ) =Ckn
n

1
n

nk

( )( )

(2.15)

n continuare se va calcula pentru fiecare k limita irului (2.15) pentru n tinznd la


infinit. Astfel, pentru k=0 se obine
n

n
=e
n

( )

lim b0 ( n )= lim 1

(2.16)

Raportul a doi termeni consecutivi devine


bk+1 ( n ) nk

=
1
n
b k ( n ) k +1 n

( )
nk

1
k +1 n ( n )

relaie care la limit conduce la rezultatul


lim

b k+1 (n)

=
b k (n) k +1

Acesta se poate exprima sub forma


lim bk +1 ( n )=

lim b (n)
k +1 n k

din care se obine, dnd valori lui k:

lim b1 ( n )= lim b0 ( n )= e = p 1( )
1 n
n
2

lim b2 ( n )= lim b1 ( n )=
=p 2 ( )
2 n
n
1 2e

...............................................................................................

k
lim bk ( n )= lim bk1 ( n )=
= pk ( )
k n
n
1 2 k e

S-a demonstrat, aadar, teorema lui Poisson n forma ei cea mai simpl, i anume:

( n )= p ()

lim bk n ,

Acest rezultat rmne valabil i n cazul general n care


. Atunci n loc de

pn= /n vom avea

este limita unui ir

pn= n /n sau npn =n i

lim n p n=lim n =

(2.17)

(2.18)

24

Cu aceast mbuntire, se poate enuna teorema ntr-o form mai general:


probabilitile repartiiei binomiale bk (n , p) , cnd n este mare n comparaie cu np, care
este aproximativ egal cu

, pot fi aproximate de cele ale repartiiei Poisson

pk ( )

pentru valori fixate ale lui k.


Justificarea matematic a repartiiei lui Poisson a fost fcut prin aceast teorem, iar
faptul c o important clas de fenomene se potrivesc asocierii ei cu repartiia binomial, ntro msur mai mic sau mai mare.
2.3. Definiia general a unei variabile aleatoare
Au fost definite astfel variabilele aleatoare care iau o mulime numrabil de valori,
dar, chiar dac rmn la acelai nivel elementar, se poate observa c exist multe probleme
importante n care se consider variabilele aleatoare care nu se supun acestei restricii. Acest
lucru nseamn c mulimea nu mai este numrabil. Problemele ce apar nu pot fi rezolvate
cu o matematic elementar, dar, fr a intra n amnunte, se va considera c aparine unei
clase de mulimi Borel. Atunci definiia general unei variabile aleatoare este:
Definiia 2.4
Fie (, K, P) un cmp borelian de probabilitate. O funcie real
pentru orice se numete variabil aleatoare dac pentru orice
A x ={ X ( )< x }

X =X () definit
xR

mulimea
(2.19)

este un eveniment din mulimea K.


Urmtoarea propoziie va da definiii echivalente cu aceasta.
Propoziia 2.4
Funcia real

X =X ()

este o variabil aleatoare dac i numai dac oricare din

urmtoarele mulimi este un eveniment din K:

{ X () x } K

(2.20)

{ X () x } K

(2.21)

sau

sau

{ X ()> x } K , x R
(2.22)
Pentru a defini operaiile cu variabil aleatoare n general sunt necesare rezultatele
date de:
25

Propoziia 2.5
Dac X i Y sunt variabile aleatoare, atunci:

{ X ( )< Y () } K

(2.23)

X ( ) Y K

(2.24)

X ()=Y K

(2.25)

Propoziia 2.6
Dac X i Y sunt variabile aleatoare, atunci X-Y, X+Y, X Y ,

X
, dac Y 0 ,
Y

sunt, de asemenea, variabile aleatoare.


Demonstraie: se poate scrie c

{ X ( )Y ()< x } ={ X ( ) <Y ( )+ x } .
Aceast mulime este un eveniment din K deoarece X i Y sunt variabile aleatoare i
are loc relaia (2.23). deci X-Y este variabila aleatoare.
Scriind X+Y=X - (-Y), rezult c X+Y este, la rndul ei, variabil aleatoare.
Egalitatea
X Y =

1
{( X +Y )2( XY )2 }
4

Demonstreaz c
X
Y

X Y

este variabil aleatoare, iar din

X
1
=X
Y
Y

rezult c i

este variabil aleatoare.


Noiunea de independen introdus pentru variabilele aleatoare discrete se extinde

pentru cazul general de variabile aleatoare, dac mulimile S 1 , Sn sunt convenabil alese,
adic sunt boreliene. Atunci independena variabilelor aleatoare X 1 , X 2 , X n are loc dac
i numai dac este adevrat relaia (2.7).
2.4. Funcia de repartiie
Definiia 2.5
Fie X o variabil. Se numete funcie de repartiie a variabilei aleatoare X funcia
+
F : R R

dat de
26

F ( x )=P ( X < x ) , x X

(2.26)

n urmtoarele propoziii se vor enuna proprietile funciei de repartiie a unei


variabile aleatoare.
Propoziia 2.7
Fie F(x) funcia de repartiie a unei variabile aleatoare X. Atunci
0 F ( x ) 1, x R .

(2.27)

Demonstraie:Acest lucru se deduce din definiia lui F(x) ca o probabilitate.


Propoziia 2.8
Fie a , b R , cu a< b . Dac F(x)este funcia de repartiie a unei variabile aleatoare
X, atunci au loc relaiile
P ( a X < b )=F ( b )F (a)

(2.28)

P ( a< X <b )=F ( b )F ( a )P( X=a)

(2.29)

P ( a< X b )=F ( b )F ( a )P ( X =a ) + P( X=b)

(2.30)

P ( a X b ) =F ( b ) F ( a ) + P( X=b)

(2.31)

Demonstraie: Notm urmtoarele evenimente din K:


A= { X ()< a } ; B={ X ()<b } ;
C={ X ( )=a } ;

Se observ c

A B

D= { X ( )=b } .

A . Atunci se poate
i c { a X ()< b }=B A=B

scrie
P ( a X < b )=P ( B A )=
P ( B ) P ( A )=F ( b )F(a) , care reprezint relaia (2.28)

Din alegerea evenimentelor A, B, C i D se mai deduce c:


A C B , A C B D i A B D , deci
C ) ]=
P ( a< x< b )=P [ B ( A
P ( B ) P ( A C )=P ( B )+ P ( D )P ( A ) P ( C )=
F ( b )+ P ( X =b ) F ( a ) P (X=a)

iar pentru ultima relaie


P ( a X b ) =
] =
P [( B D ) A
P ( B D )P ( A )=P ( B ) + P ( D )P ( A )=
F ( b )F ( a ) + P( X=b)
Urmtoarele proprieti ale funciei de repartiie se enun fr demonstraie n:
27

Propoziia 2.9
Funcia de repartiie a oricrei variabile aleatoare este o funcie nedescresctoare,
continu la stnga i astfel nct
lim F ( x )=F ( )=0, lim F ( x )=F ( + )=1

n +

(2.32)

Propoziia 2.10
Orice funcie F(x) nedescresctoare, continu la stnga, astfel ca
F ( )=0, F ( + )=1 este o funcie de repartiie a unei variabile aleatoare definit pe un
cmp borelian de probabilitate convenabil ales.
Propoziia 2.11
Dac X este o variabil aleatoare i F(x) este funcia ei de repartiie, atunci
P ( X=x )=F ( x +0 )F ( x ) , x R
unde s-a notat cu

(2.33)

F ( x+ 0 ) limita la dreapta n punctul x.

2.4.1. Funcia de repartiie a unei variabile aleatoare discrete


Se consider acum o variabil aleatoare discret X avnd tabelul de distribuie
X:

x 1 x2 x n
p1 p2 p n

i se construiete funcia ei de repartiie folosind proprietile enunate n Proprietile (2.26) (2.28) se obine astfel:

F ( x )=

0,
p1,
p 1+ p 2 ,
k1

pi
i=1

.
1,

x x1
x 1 <x x 2
x 2 <x x 3
xk 1 <x x k
.
x >x n

Valorile funciei de repartiie a variabilei aleatoare discrete X se vor obine n


urmtorul mod:
-dac x x 1 , atunci
F ( x )=P ( X <x )=P ( X < x x 1 )=0
-dac x 1< x < x 2 , atunci
P ( X < x )=P [ ( X < x 1 ) ( x1 < X < x 2) ]=
P ( X x 1 ) + P ( x1 < X < x 2) =
28

(2.34)

P ( X=x 1 )= p 1 .
-dac

x 1< x x 3 , atunci
P ( X < x )=
P [ ( x x1 ) ( x 1 < X < x 2 ) ( x2 < X< x3 ) ]=
P ( x x1 ) + P ( x 1< X x 2 ) + P ( x 2< X < x 3 )=
P ( X=x 1 ) + P ( X =x 2) =
p1+ p 2 ,
x k1< x < x k , atunci

i, n general, dac
P ( X < x )=

P [ ( X x 1 ) ( x 1< X x 2 ) ( x k 1 < x < x k ) ]=


k1

pi

i=1

iar pentru

x> xn

avem

P ( X < x )= pi=1 .
i=1

Forma (2.34) a funciei de repartiie este dat n cazul unei variabile aleatoare,
discrete cu un numr finit de valori. Dac X ia o mulime numrabil infinit de valori, deci
are tabelul de distribuie
X:
Cu

pn 0 i

n N

x1
p1

x2 xn
; n N ,
p 2 pn

pn=1 , atunci funcia ei de repartiie va fi


F ( x )= pn

(2.35)

xn <x

2.4.2 Funcia de repartiie a unei variabile aleatoare continue


Variabilele aleatoare discrete sunt acele variabile aleatoare care iau o mulime
numrabil de valori variabile aleatoare discrete. n acest paragraf este luat n considerare
o situaie particular, dar foarte important, care acoper aria celor mai multe aplicaii i care
cere o matematic puin mai abstract. Acesta va fi cazul variabilelor aleatoare cu densitate.
Definiia 2.6
Fie

F ( x ) funcia de repartiie a unei variabile aleatoare

integrabil f : R R , astfel ca
29

X . Dac exist o funcie

F ( x )= f ( u ) du

(2.36)

atunci X se numete variabil aleatoare continu, iar f ( x ) se numete densitate de


probabilitate sau densitate de repartiie a variabilei aleatoare

X .

Din relaia (2.36) rezult c f ( x ) este densitate de probabilitate dac i numai dac
verific condiiile
x

f ( x ) >0, f ( x ) dx=1

(2.37)

Consecine:
1. Folosind consecinele din analiza matematic se deduce din formula (2.36) c, dac f
F :
f ( x )=F ' (x )

continu, atunci ea este derivata lui

este
(2.38)

i acum
'

F ( x ) = lim
x 0

F ( x+ x ) F ( x )
P( x X x + x)
= lim
x
x
x 0

,
aceast relaie va conduce la
P ( x X x + x )=f ( x ) x +0( x )
X

ceea ce va nsemna c probabilitatea ca variabila aleatoare


de lungime infinite simal x

s ia valori ntr-un interval

este proporional cu f ( x ) i cu x , 0( x)

reprezentnd o cantitate care mprit la x

tinde la 0 atunci cnd x 0 .

2. n cazul variabilei aleatoare continue, funcia de repartiie este o funcie continu, deci
probabilitatea (2.32) ca variabil aleatoare s ia o anumit valoare este 0, limitele laterale ale
lui F n orice punct fiind egale.
3. Rezult din consecina doi c relaiile (2.28) (2.31) vor avea n membrul doi
F ( b )F( a) .
4. Dac aceleai relaii (2.28) (2.31) se exprim cu ajutorul densitii de repartiie, atunci

avem
P ( a X < b )=
F ( b )F ( a ) =
b

f ( x ) dx f ( x ) dx= f ( x ) dx
x

(2.39)

5. Dac A este o reuniune de intervale nu neaprat disjuncte i care pot fi chiar infinite, atunci
avem

P ( X A )= f ( x ) dx
A

30

(2.40)

n continuare este definit o mrime foarte utilizat n statistica matematic.


Definiia 2.7
o variabil aleatoare i fie (0,1) . Numrul Q( ) care satisface,

Fie

pentru orice > 0 , inegalitile


P ( X <Q ( ) ) , P ( X >Q ( ) + ) 1
se numete -quantil a variabilei aleatoare

X .

Definiia 2.8
Numrul m e =Q(1/2) se numete mediana variabilei aleatoare
F ( x ) este funcia de repartiie a lui

Dac

X .

X , atunci inegalitile corespunztoare

medianei devin:
F [ Q(1/2) ] 1/2, F [ Q(1 /2) ] 1/ 2 .
n afar de =1/2 care conduce la determinarea medianei, pentru valorile
particulare =1/4

se obin quantilele, pentru =1/10 se obin decilele i pentru

=1/100 se gsesc centilele variabilei aleatoare

X .

Dac exist densitatea de probabilitate f ( x ) , atunci -quantilele se pot


determina din ecuaia
Q ( )

f ( x ) dx =

sau
x

f ( x ) dx =1

Q ( )

Se vede c pentru =1/2 mediana me verific ecuaiile


me

f ( x ) dx= f ( x ) dx=
x

me

1
2

Definiia 2.9
Orice punct de maxim local al densitii de probabilitate f ( x ) se numete punct
modal (mod).
Dup numrul punctelor modale, repartiiile vor fi unimodale, bimodale, n general
multimodale.
Dac variabila aleatoare

este discret, punctul modal se numete valoarea cea

mai probabil.

31

Dac variabila aleatoare

x i ordonate cresctor pe care le ia cu

are valorile

pi=P ( X =xi ) , i=1,2. ..n , atunci valoarea cea mai probabil

probabilitile

x i este cea

pentru care
pi1 p i pi+1 , i=1,2 n .
2.4.3.Exemple clasice de variabile aleatoare continue
2.4.3.1. Repartiia uniform
Fie [ a , b ]

R i fie densitatea de probabilitate

un interval compact din

1
, x [ a ,b ]
f ( x )= ba
0, nrest
Se spune c variabila aleatoare

(2.41)

cu aceast densitate de probabilitate are

repartiie uniform pe interval [ a , b ] .


Dac

este o variabil aleatoare uniform pe [ a , b ]

atunci funcia ei de

repartiie este

0, x <a
xa
F ( x )=
,a xb
ba
1, x >b
Exprimarea ce se obine din formula (2.36) astfel:
-

dac x< a , f ( x )=0 , deci


dac a x b , atunci

F ( x )=0
x

F ( x )= f ( u ) du+ f ( u ) du=
x

dac

1
xa
d u=
ba
ba

x> b avem
x

F ( x )= f ( u ) du+ f ( u ) du+ f ( u ) du=


x

1
du=1
ba

2.4.3.2. Repartiia normal


Aceasta este cea mai important dintre toate repartiiile numite clasice, datorit
proprietilor sale fiind determinat de C.F. Gauss, unul dintre cei mai mari matematicieni ai
tuturor timpurilor.
32

Se spune c variabila aleatoare


parametrii m i

i se noteaz cu

are distribuia normal sau Laplace-Gauss de


X N (m , )

dac are densitatea de probabilitate


2

1 xm
, x R ;m R ; >0

(
1
f ( x )=
e2
2

(2.42)

Se demonstreaz c funcia (2.42) satisface condiiile (2.37). prima condiie


(f (x)>0) este ndeplinit, iar pentru a doua se face schimbarea de variabil
t=

x m

(2.43)

i se obine
x

f ( x ) dx= 21 e
x
x

t
2

dt =

1
2 =1
2

pentru c s-a ajuns la integrala Euler-Poisson de valoare

2 .

Cazul particular m=0, =1 poart numele de distribuie normal normat sau


X N (0,1) dac are densitate de probabilitate

normal tip, deci spunem c

, x R
1
f ( x )=
e2
2

(2.44)

Un rol important n analiza acestei repartiii l are funcia care se numete funcia
Laplace i se definete ca fiind
x

1
( z )=
e
2 x

t
2

(2.45)

dt , zR

Densitatea de repartiie normal (2.44) are multe proprieti analitice remarcabile


Gauss a determinat-o prin alegerea ctorva dintre ele drept caracteristici ale unei legi a
erorilor. Cteva dintre proprieti sunt:
-

funcia (2.44) este simetric (f ( x )=f (x ) ) , iar de aici se deduce urmtoarea


proprietate:
x

f ( x ) dx= ( z ) (z )=2 ( z )1

(2.46)

f ( x ) admite derivate de orice ordin i orice derivat este egal cu produsul dintre

f i un polinom numit polinomul Hermit;


existena tuturor derivatelor face ca f ( x ) s se reprezinte grafic ca o curb neted.

Mai mult dect att, funcia descrete rapid la 0 atunci cnd


cauza formei obinute curba se numete clopotul lui Gauss;

33

x tinde la . Din

variabila aleatoare normal cu densitatea (2.44) admite o funcie generatoare de


momente, care rareori exist dac f

este nlocuit cu o densitate arbitrar. De aici

rezult c variabila aleatoare normal admite momente de orice ordin.


Legtura dintre repartiia normal

N (m , ) i funcia Laplace este dat de

urmtoarele rezultate:
Propoziia 2.12
X N (m , ) ,

Funcia de repartiie a variabilei aleatoare


F ( x )=

, x R
( xm
)

(2.47)

unde este funcie Laplace (2.45).


Demonstraie: n relaia (2.36), ce d funcia de repartiie cu ajutorul densitii de
probabilitate, se face schimbarea de variabil (2.43).
Corolar 2.1
Dac

este o variabil aleatoare

N (0,1) , atunci funcia de repartiie este

F ( x )= ( x)

(2.48)
Demonstraie: se particularizeaz m=0, =1 n (2.48)
Propoziia 2.13
Funcia Laplace are proprietatea
(z ) =1 (z)

se face schimbarea de variabil t=u i se obine

Demonstraie: n (z )
z

1
(z ) =
e
2 +x
+x

1
e
2 z
z

u
2

u
2

du=

du=
z

(2.49)

1
1
e 2 du

e 2 du=
2 x
2 x
1 ( z )

Observaie

34

Valorile funciei de repartiie a unei variabile aleatoare normale, ( x ) se gsesc n


tabelele care conin numai argumente pozitive din cauza acestui rezultat.
Propoziia 2.14
X

Dac

este o variabil aleatoare


P ( a X < b )=

N (m , ) , atunci

am
(
( bm
)
)

(2.50)

Demonstraia: rezult imediat din proprietile funciei de repartiie i din formula


(2.47).
Observaie
Funcia Laplace se mai reprezint ca
z

1
( z )=
et dt , z 0

0
2

(2.51)

Cu aceast definiie formulele (2.46)-(2.49) devin, respectiv:


z

f ( x )=2 ( x )

1
xm
F ( x )= +
2

1
F ( x )= + ( x)
2

(z ) = ( z) .

Formula (2.50) rmne la fel pentru ambele definiii ale funciei Laplace.
Propoziia 2.15
Fie

o variabil aleatoare continu cu densitate de probabilitate f ( x)

i fie

: R R o funcie strict monoton cu inversa 1 derivabil. Atunci Y = ( X)

este

o variabil aleatoare continu avnd densitatea de probabilitate.

( 1)( y)

1
g ( y )=f ( ( y ) )

(2.52)

Propoziia 2.16
Dac
Z=

este o variabil aleatoare

N (m , ) , atunci variabila aleatoare

Xm

are o distribuie

N (0,1) .

Demonstraie: pentru a demonstra acest rezultat se folosete formula (2.52), n care


Z = ( X )=

Xm
, deci 1 ( z )=z +m . Atunci

35


(1) ( z )

g ( z )=f
care are densitatea de probabilitate a unei variabile aleatoare

N (0,1) .

2.4.3.4.Repartiia exponenial
Se spune c variabila aleatoare a crei densitate de probabilitate este

x
f ( x )= e , x 0 >0
0, x <0

are distribuie exponenial de parametru


Se verific uor faptul c f

(2.53)

este o densitate de probabilitate (2.46).

Propoziia 2.17
Dac

este o variabil aleatoare exponenial de parametru

, atunci funcia

ei de repartiie este
F ( x )=1ex , x 0
2.4.3.3.Repartiia gamma, beta
Dac variabila aleatoare

(2.54)

2
are densitate de probabilitate

1
x p 1 ex x >0, p>0
f ( x )= ( p)
0, x 0
se spune c are repartiia gamma de parametru p. Vom nota acest lucru prin
Variabila aleatoare

(2.55)
X ( p) .

are repartiia beta de parametrii p i q i scriem

X ( p ,q ) , dac densitatea ei de probabilitate este

1
x r 1 (1x ) 1 x [ 0,1 ]
f ( x ) = ( 1 , 2)
0, n rest , 1 , 2> 0

Variabila aleatoare

cu densitate de probabilitate

36

(2.56)

n
1
2

x
2
2a

x e x> 0,
n
f ( x )= 2 2 a n (n/2)
0, x 0, n N , a>0
se spune c are repartiie

(2.57)

2 cu n grade de libertate i parametru a (repartiia Helmert-

Pearson).
Se demonstreaz c (2.57) este densitate de probabilitate fcnd substituia

x
=t
2 a2

.
2.4.3.5.Repartiia Student
Variabila aleatoare

care are densitatea de probabilitate dat de funcia

1
f ( x )=

( n+12 ) (1=x /n)


n
( )
2
2

n +1
2

, x R , n N

(2.58)

se numete variabila aleatoare repartizat Student cu n grade de libertate.


Se demonstreaz c (2.58) este o densitate de probabilitate cu ajutorul substituiei
2
x /n= y .

37

CAPITOLUL 3. MRIMI CARACTERISTICE ALE


VARIABILELOR ALEATOARE
3.1. Momente iniiale ale variabilelor aleatoare
Definiia 3.1
Fie
valorile

o variabil aleatoare. Dac

x i cu probabilitile

este o variabil aleatoare discret lund

pi=P ( X =xi ) , i I N , valoarea ei medie (sau media sau

sperana matematic) este numrul dat de expresia


M ( X )= x i pi

(3.1)

i I

cu condiia ca seria s fie absolut convergent, iar dac

este o variabil aleatoare

continu cu densitatea de probabilitate f ( x) , valoarea medie a ei este


+

M ( x )= xf ( x ) dx

(3.2)

dac integrala generalizat este convergent.


Definiia 3.2
Fie r N . Expresia
M r ( x ) =M ( X r )

(3.3)

se numete moment iniial de ordin r al variabilei aleatoare


Dac variabila aleatoare

X .

este discret, atunci momentul iniial de ordin r

se

calculeaz prin
M r ( x ) = xir pi

(3.4)

i I

iar n cazul n care

este variabil aleatoare continu va fi


x

M r ( x ) = x r f ( x ) dx , r N

(3.5)

Momentele iniiale de ordin r

exist n aceleai condiii n care exist valoarea

medie. Se observ c pentru r=1 momentul iniial este chiar valoarea medie.
Deoarece momentele iniiale se definesc cu ajutorul valorii medii se iau n considerare
proprietile ei. n demonstraiile acestora se va considera c variabilele aleatoare sunt
discrete, dar, evident, proprietile sunt valabile pentru orice tip de variabil aleatoare.
Propoziia 3.1
Valoarea medie a unei variabile aleatoare constante este constant
38

M ( C )=C ,C R
Demonstraie: avem

(3.6)

X =C , deci { / X (=C) } = i

p=P { X ( )=C }=1 .

Deci
M ( X )=C 1=C
Propoziia 3.2
X

Dac

este o variabil aleatoare cu media

M ( X ) i C este o constant, atunci

M (CX ) exist i este:

M ( CX )=CM ( X ) ,C R

(3.7)

Demonstraie: Avem:
M ( CX )= (C x i) p i=CM ( X) .
i I
Propoziia 3.3
Fie
Atunci exist

i Y

dou variabile aleatoare pentru care exist

M (X ) i

M (Y ) .

M (X +Y ) i

M ( X + Y )=M ( X ) +M (Y )

(3.8)
g ( X ,Y )=X +Y

Demonstraie: se folosete Proprietatea 2.2 n care se ia funcia


pentru care avem:
j J C ij =A i
de unde se obin relaiile

P ( C ij )=P( A i)
j J

j J C ij =B j ,

P ( C ij ) =P(B j )

i I

. Atunci:

( x i+ y i) P ( C ij) = x i P ( Cij ) + y i P ( C ij )= x i ( P ( C ij )) + y j ( P ( C ij ) )= x i P (
j J
i I j J
i I j J
i I
j J
JJ
i I
i I
M ( X + Y )=
i I

innd cont c seriile din membrul doi sunt convergente,

M ( X +Y ) exist i este dat de

(3.8).
Corolar 3.1
Fie

X 1 , X n variabile aleatoare i C1 , Cn constante. Dac

M (x k ) exist

k =1,.. n , atunci exist


n

( )
i=1

Ck Xk =

C k M ( X k ) , C k R , k=1, n

(3.9)

Propoziia 3.4
Dac
M (Y )

i Y

sunt variabile aleatoare independente i dac

M (X ) i

exist, atunci exist


M ( XY ) =M ( X ) M (Y )
39

(3.10)

3.2. Momente centrate i absolute ale variabilelor aleatoare


Definiia 3.3
Se numete moment centrat de ordin r

al unei variabile aleatoare

valoarea

r
[ X M ( X )] (dac exist) i este dat de expresia

medie a variabilei aleatoare

r ( X ) =M ([ XM ( X ) ]) , r N
r

(3.11)

Definiia 3.4
Se numete moment absolut de ordin r

al unei variabile aleatoare

medie a variabilei aleatoare |X|r (dac exist) i este

valoarea

| X|

M ( r ), r N .

Dintre momentele centrate ale unei variabile aleatoare cel mai important este
momentul de ordin 2.
Definiia 3.5
Momentul centrat de ordin 2 se numete dispersia sau variana variabilei aleatoare
X

i se noteaz cu
2 ( X )=D ( X )= 2 ( X )=M ([ X M ( X )
iar

D (X )= ( X )

])

(3.12)

se numete abaterea medie ptratic.

Pentru a nelege ce reprezint abaterea medie ptratic observm c diferena


X M ( X ) este abaterea lui

de la valoarea ei medie, abatere ce poate lua valori


M (|X M ( X )|) se poate folosi, dar este

pozitive sau negative. Abaterea medie absolut

greu de calculat. Aadar s-a introdus radicalul dispersiei variabilei aleatoare, care este o
msur a abaterii medii a variabilei aleatoare de la media ei.
Cu ct ( X) este mai mic, cu att valorile variabilei aleatoare sunt mai apropiate
de

M (X ) i se spune c populaia este mai centrat sau mai concentrat n jurul valorii

medii.
Considernd acum variabila aleatoare

discret, respectiv continu, i folosind

notaia m=M ( X ) pentru simplificarea scrierii, momentele centrate i cele absolute se pot
calcula dup cum urmeaz
r

r ( X ) = ( x im) p i , r N
i I

40

|X|
r

M ( r )= |x i| , r N

(3.13)

i I

dac variabila aleatoare este discret, i


x

r ( X ) = ( xm )r f ( x ) dx , r N
x

|X|
x

(3.14)

M ( r )= |x| f ( x ) dx , r N
x

dac variabila aleatoare este continu.


Propoziia 3.5
Fie

o variabil aleatoare i C o constant real astfel nct

X =C . Atunci

D (C )=0

(3.15)

X =C , avem din (3.6)

Demonstraie: dac

M ( X )=C

i deci

D ( X )=M ( CC )=0
X

Reciproc, fie
x i ,i N

o variabil aleatoare discret dat de

pentru care

X ( )=x i pentru

D ( X )=0 . Atunci

0=D ( X )=M ([ X M ( X ) ])=


2

( xi M ( X ))2 P( X=x i)
i I

Cum

P(X =x i)0, i I , avem


2
( x iM (X )) P ( X =x i) =0, i I .

Se noteaz
mulimea indicilor

I 1 mulimea indicilor i pentru care


j

pentru care

x jM ( X ) 0 i

x iM ( X )=0 i cu

P ( X=x i ) =0 .

Rezult c
x i=M ( X )=constant , i I 1
i
P ( X constant )=P ( X =x j , j J 2) =0
adic
P ( X=constant )=1P ( X constant ) =1
aadar, cu probabilitatea 1, variabila aleatoare

Observaie

41

este constant.

I1

Pentru un cmp de probabilitate finit, un eveniment de probabilitate 1 este eveniment


sigur. Deci dac

D ( X )=0

cu siguran variabila aleatoare

este constant.

n concluzie, ntr-un cmp de probabilitate finit dispersia unei variabile aleatoare este
nul dac i numai dac variabila aleatoare este constant.
Propoziia 3.6
X

Fie

o variabil aleatoare. Atunci


2

(3.16)

D ( X )=M 2 ( X )M ( X )
Demonstraie: folosind proprietile valorii medii, avem
D ( X )=M ([ X M ( X ) ] )=
2

M [ X 22 X M ( X ) + M 2 ( X ) ]=
2

M ( X 2 )2 [ M ( X )2+ M ( X ) ] =
M 2 ( X ) [ M ( X ) ]

Propoziia 3.7
X

Dac

este o variabil aleatoare i C

o constant, atunci

D (CX )=C 2 D(X )

(3.17)

Demonstraie: din formula (3.7) avem


M ( CX )=CM ( X ) ,
M ( C 2 X 2 )=C 2 M ( X 2 )
Propoziia 3.8
Fie

X 1 , , X n variabile aleatoare independente i C1 , , Cn constante reale.

Atunci
n

( )
i=1

C i X i = C21 D ( X i ) ,C i R , i=1,n
i=1

Demonstraie: se aplic formula (3.16) i avem


D ( C i X i ) =
2

( [ C X ] ) M ( [ C X ] )=

C 2i X 2i + Ci C j X i X j [ M ( Ci X i ) ] =

[
]

i,j

42

(3.18)

X
X

M ( i X j ) [ C 2i M ( X i ) ]
Ci C j
M ( i 2)+2
C 2i

M ( j), i , j 1,n
M
CiC j
2
Dar variabilele aleatoare

X i sunt independente, deci conform Propoziiei 3.4 se

deduce c
D ( C i X i ) =

X
X

M ( i)
Ci

[ 2 ) =

M ( i 2) M
C 2i

X
X

2
M ( i )( M (i)2 ]=

C 2i

C 2i D( X i)

3.3. Valoarea medie i dispersia unei variabile aleatoare cu repartiia normal

43

Propoziia 3.9
X N (m , ) , atunci

Dac

M ( X )=m , D ( X ) = 2

(3.19)

Demonstraie:din definiia valorii medii i folosind schimbarea de variabil


xm
=y

se obine
x

1 xm

(
1
M ( X )= xf ( x ) dx=
x e2

2
x
y

dx=

1 (
m+y ) e 2 dy=
2
x

m
2
e 2 dy+
y e 2 dy=m

2 x
x

deoarece prima integral din sum are valoare

2 (fiind o integral Euller-Poisson), iar a

doua este 0 (se integreaz o funcie impar pe un interval ce se poate considera simetric fa
de origine).
Se calculeaz apoi dispersia cu ajutorul definiiei ei de moment centrat de ordin doi

D ( X )= ( xM ( X ) ) f ( x ) dx=

1 xm
2

( xm ) e
dx =
1

2
2

2 y 2 e 2 dy=
y 2 e 2 dy

2 x
2 x
n aceast ultim integral se face substituia
gamma
1

t 2 dt=
x
2 2
(
)
D X=

2 0
2
3
2 2 1 1

=

= 2
2 2 2 2 2

()

()

44

y 2 /2=t

i se obine o integral

Astfel, rezultatele acestei propoziii arat c cei doi parametrii ai repartiiei


N (m , )

sunt valoarea medie i abaterea medie ptratic a variabilei aleatoare cu aceast

densitate de probabilitate.

3.4. Funcia caracteristic a repartiiei normale


Definiia 3.6
X

Fie

o variabil aleatoare. Aplicaia : R C

dat de

X ( t )=M (eitX )

(3.20)

se numete funcia caracteristic a variabilei aleatoare

X.

innd cont de formula lui De Moivre e itX =costX +isintX


consecina ei:

|e itX|=cos2 tX +sin2 tX =1

variabil aleatoare

pentru t

real, i de

, se deduce c funcia (3.20) exist pentru orice

X . Acest lucru acord deosebita importan pe care o are funcia

caracteristic fa de toate celelalte mrimi caracteristice ale unei variabile aleatoare, mrimi
care uneori nu exist deoarece seriile asociate sau integralele generalizate nu sunt
convergente.
Modul de calcul al funciei caracteristice va ine seama de de tipul variabilei
aleatoare, astfel: dac
X:

este o variabil aleatoare discret cu distribuia

xk
,k I N
pk

()

atunci (3.20) devine


X ( t ) = e
k I

iar dac

it x k

pk ,

(3.21)

este o variabil aleatoare cu densitate de probabilitate f ( x) , atunci


x

X ( t )= e itx f ( x ) dx
x

Repartiia normal

N (m , )

1 xm

1
2(
f ( x )=
e
2
x

are o densitate de probabilitate

, x R , >0
1 xm

(
1
X ( t )=
e itx e 2

2 x

) dt
45

(3.22)

xm
= y i se obine

Se face substituia
x

1
X ( t )=
e it itm e 2 dy=

2 x
e

1 2
( y 2ity )
2

dy =

itm

2 x
2

itm

t
2

1
( yit )
2

dy

deci
2

itm

X ( t )=e
Dac

t
2

X N (0,1) , particulariznd parametrii n formula anterioar, se obine


2

X ( t )=e

t
2

3.5. Teorema limit central


Fie ( X n ) n un ir de variabile aleatoare independente definite pe acelai cmp
borelian de probabilitate ( , K , P) , avnd mediile

M ( X i )=mk

i dispersiile

D ( X k ) = 2k , k N finite.
Se definete irul de variabile aleatoare ( Y n )n

prin

Y n= X k , n N

k =1

pentru care
n

k=1

k=1

M (Y n)= M ( X k ) = mk =m(n )
Y
n

D( n)= D ( X k )= k = k (n )
k=1

k=1

Normnd variabila aleatoare Y n , n N


Zn=
cu funcia de repartiie

Y n m (n)
n

se obine irul de variabile aleatoare


,n N

Fn ( x ) .
46

(3.23)

Fie
x

1
F ( x )=
e 2 dt

(3.24)

funcia de repartiie a unei variabile aleatoare normate.


Condiiile n care irul de funcii de repartiie ( F n( x)) n converge ctre funcia
F ( x ) sunt stabilite de teoremele numite teoreme limit central, sau, n ali termeni,
teoremele limit central vor determina ipotezele n care irul de variabile aleatoare (Z n )n
converge ctre o variabil aleatoare Z N (0,1) . Deoarece repartiia normal are un rol
deosebit de important att din punct de vedere teoretic ct i practic, este necesar s se
cunoasc condiiile n care un ir de variabile aleatoare independente are asimptotic o
repartiie normal normat.
Teorema 3.1
Fie ( X n ) n un ir de variabile aleatoare. Dac variabila aleatoare
de repartiie

Fn ( x ) i funcia caracteristic n (t ) , iar

funcia de repartiie

X n are funcia

este o variabil aleatoare cu

F( x ) i funcia caracteristic n (t ) , atunci

Fn (x )n F ( x ) ,

dac i numai dac n ( t ) n (t) uniform pe orice interval finit al lui t .


Teorema 3.2
Fie ( X n ) n un ir de variabile aleatoare independente avnd aceeai repartiie cu
valorile medii

M ( X k )=m i dispersiile

D ( X n ) = 2 , k N . Atunci irul de variabile

aleatoare ( Zn ) n definit de (3.23) are asimptotic o repartiie normat.


Teorema 3.3
Fie ( X n ) n un ir de variabile aleatoare independente repartizate binomial
Bi (1. p) . Atunci irul de variabil aleatoare Z n

repartiia

definite prin (3.23) are asimptotic

N (0,1) .

Corolar 3.1
Fie ( X n ) n un ir de variabile aleatoare independente repartizate binomial i fie
n

Y n= X k . Atunci
k =1

P ( a<Y n <b )

anp

( bnp
)
(
npq
npq )

47

(3.25)

Acest corolar permite ca pentru un numr suficient de mare de probe independente, n


care se urmrete apariia unui eveniment ce se produce n orice prob cu aceeai
probabilitate

p , s poat fi folosit funcia de repartiie normal n locul celei binomiale,

care ar conduce la calule foarte laborioase.

48

CAPITOLUL 4. NOIUNI TEORETICE A SELECIEI I


VERIFICAREA IPOTEZELOR STATISTICE
4.1. Noiunea de selecie
Fie X o caracteristic a populaiei

considerate. Ea se va numi caracteristic sub

cercetare sau variabil aleatoare teoretic.


Definiia 4.1
Se numete selecie sau eantion o submulime finit

de elemente ale lui

alese la ntmplare, iar volumul seleciei este numrul acestor elemente [3].
Operaia de prelevare la ntmplare a elementelor n selecie se numete sondaj.
Se noteaz elementele seleciei extrase din populaia caracterizat de variabila
aleatoare

prin

X 1 , X 2 , X n i le vom numi date de selecie. Atunci

={X1, X2 , Xn} .

Asupra datelor de selecie se face urmtoare precizare deosebit de important i


anume dublul lor caracter:
-

nainte de efectuarea sondajului ele sunt variabile aleatoare independente identic

repartizate cu variabila teoretic X;


dup efectuarea sondajului ele devin constante, valorile numerice obinute prin
numrare.

X
Fie ( 1 , X n) o selecie de volum n extras dintr-o populaie caracterizat de

variabila aleatoare teoretic X.


X
Orice realizare a vectorului aleator ( 1 , X n) ale crei componente sunt

variabile aleatoare independente, va fi notat cu ( x 1 , x n ) .


Presupunem c valorile

x 1 , x n sunt aranjate ordine cresctoare.

Definiia 4.2
Se numete funcie de selecie expresia

0, x x 1

F ( x )= k , x k < x x1
n
1, x > x 1
49

(4.1)

Fie

F ( x )=P funcia de repartiie a variabilei aleatoare X. Din expunerile fcute


X 1 , X n rezult c, pentru orice x fixat, avem:

asupra variabilei aleatoare

P ( X i <x )=F ( x )c , 1 i n
x , F n ( x) este frecvena relativ a unui

Urmeaz c pentru o valoare fixat

eveniment aleator n n probe independente, cnd probabilitatea de realizare a acestui


F(x) .

eveniment n fiecare prob este constant i egal cu


Rezult c

P Fn ( x ) =

k
nk
k k
C n [ F ( x ) ] [ 1F (x) ] , 0 k n
n

(4.2)

Se enun altfel:
Teorema 4.1
Funcia de repartiie de selecie

Fn ( x ) este pentru fiecare x fixat, o variabil

1
k
n1
aleatoare care ia valorile 0, , ,
n
n
n

cu probabilitile (1.2).

Se deduce de aici c
n

M [ F n (x) ] =

k=0

k
nk
k k
C n [ F ( x) ] [ 1F ( x) ] =F ( x)
n

(4.3)

Teorema 4.2
Pentru fiecare

xR

fixat, irul de funcii de repartiie de selecie ( F x ( x) ) n N

converge n probabilitate ctre F(x).


Teorema 4.3 (Glivenko)
Fie

F x (x) funcia de repartiie de selecie corespunztoare unei selecii de volum n

ce provine dintr-o populaie caracterizat de variabila aleatoare X avnd funcia de repartiie


F(x). Atunci
P lim su p|F x ( x )F (x)|=0 =1

(4.4)

Teorema lui Glivenko este considerat a fi teorema fundamental a statisticii


matematicii. Ea d relaia dintre funcia de repartiie de selecie
repartiie teoretic

F( x ) .

4.2. Caracteristici de selecie

50

Fn (x ) i funcia de

Fie

X 1 , X n o selecie efectuat dintr-o populaie caracterizat de variabila


F( x ) . Vom folosi n cele ce urmeaz proprietatea

aleatoare X, avnd funcia de repartiie

potrivit creia variabila aleatoare de selecie


funcie de repartiie

X i , 1 i n sunt independente i au aceeai

F( x ) ca i variabila aleatoare teoretic X.

Definiia 4.2
Variabilele aleatoare definite de relaiile
n

1
r
m = Xi , r N
n k=1
X

n
1

r =
n i=1

(4.5)

(4.6)

se numesc momente iniiale de ordin r de selecie, respectiv momente centrate de


ordin r de selecie.
Ele pot fi considerate ca fiind momente iniiale, respectiv centrate ale unei variabile
aleatoare

X numit variabil aleatoare de selecie construit astfel:

X1
X : 1
n

X 2 , X n
1
1
,
n
n

(4.7)
Atunci
mr=M ( X r )
(4.8)
r =M [ ( X M ( X ) ) ] ,r N
r

(4.9)

Cazuri particulare
n

m r=M ( X )=

1
X = X
n i =1 i

(4.10)

i
n

r =D ( X ) =
vor fi media de selecie

2
1
X i X ) =S 2
(

n i=1

(4.11)

i dispersia de selecie S 2 .

Teorema 4.4
Valorile medii ale momentelor iniiale de selecie sunt egale cu momentele de acelai
ordin ale variabilei aleatoare teoretice X.
51

Demonstraie: datele de selecie fiind variabile aleatoare independente, cu aceeai


funcie de repartiie ca i X, avem
n

M ( mr )=

1
M ( X ri ) =M r ( X)

n i=1

(4.12)

n particular
)=m=M ( X)
M(X

(4.13)

Teorema 4.5
Dispersia momentelor iniiale de selecie este egal cu
1
[ m m2r ]= 1n [ M 2 r ( X )M 2r (X )] , r N
n 2r

D ( mr ) =

(4.14)

Demonstraie: avem din proprietile dispersiei

[ M ( X )M ( X )] =
2

r
i

r
i

D ( mr )=

n2 i=1

1
[ M ( X )M 2r ( X )]
n 2r
n particular
D ( X )=

1
[ M ( X ) M 2( X )]= 1n D( X)
n 2

(4.15)

Teorema 4.6
Dispersia de selecie S 2 are valoarea medie
M ( S 2) =

n1
D (X)
n

(4.16)
i dispersia
D ( S 2 )=

n1
( n1 ) 4( n3 ) D 2( X ) ]
3 [
n

Demonstraie: dispersia de selecie se mai poate exprima ca


n

( X X ) = 1 [ ( X i m )( X m ) ] =
2

i=1

S 2=
n

n i =1

)
m) ( X im) + ( Xm
( X i m ) n ( X
2

i=1

n i=1
52

(4.17)

2
1

)
S = ( X im )2 ( Xm
n i=1
2

M ( X i )=m

Atunci, cum

)=m
M(X

(4.18)

din (4.13), avem

2
2

) ] =
M [ ( X im) ] M [ ( Xm
n

1
M ( S )=
n i=1
2

)=
D ( X i )D ( X
n

n i=1

1
n1
D ( X ) D ( X )=
D( X )
n
n
4.3. Selecii din populaii normale
X
Fie ( 1 , X n) o selecie extras dintr-o populaie caracterizat de variabila

aleatoare teoretic avnd repartiia normal de parametrii

m i , X N ( m , ) .

Teorema 4.7
X
X N ( m, ) i ( 1 , X n) este o selecie dintr-o populaie caracterizat

Dac

X N (m , ) .
n

de variabila aleatoare X, atunci media de selecie

Demonstraia se face tiind c variabila aleatoare


N ( m, )

i repartizate

X j , j=1, n sunt independente

la fel la X. Atunci folosind proprietile funciei caracteristice, se

obine
x

( nt )=
n

x ( i )=
j=1

1
t
i m 2
n
n 2

=e

itm

t
2n

j=1

Conform teoremei de inversiune rezult c


Corolar 4.1
53

X N (m , ) .
n

n condiiile Teoremei 3.1, variabila aleatoare


Z=

Xm
N (0,1)

(4.19)

Teorema 4.8
Fie dou populaii independente caracterizate de variabilele aleatoare teoretice

{ X '1 , .. X 'n }

X 1 N ( m1 , 1 ) ; X 2 N ( m2 , 2 ) i fie

{ X '2' ,.. X 'n' }

dou selecii de volum

n1 , respectiv n2 , extrase din populaiile considerate. Atunci variabila aleatoare


X 1 X 2 N m1 m2 , 1 + 2
n1 n 2

(4.20)

Demonstraie: din teorema 4.1 se tie c

X 1 N m 1 ,

, X 2 N m 1 , 2
n1
n2

X 1 i

Variabilele aleatoare

)
X 2 fiind independente, rezult c i

sunt independente. Atunci, folosind proprietile funciei caracteristice, avem


X X ( t )= X ( t ) X ( t )=
1

it m1

2
1

t
2n1

it m2

2
2

t
2 n2

t2
it ( 1m2 ) + 2
n 1 n1

Rezultat care conduce la concluzia enunat n (4.8)


Corolar 4.2
n ipotezele Teoremei 4.8 avem
Z=

X 1 X 2(m 1m2)

21 22
+
n1 n2

(4.21)
Teorema 4.9

54

N (0,1)

X 1 i

X 2

X
Fie ( 1 , X n) o selecie dintr-o populaie caracterizat de variabila aleatoare

X N ( m, ) . Atunci media de selecie X i dispersia de selecie S 2 sunt variabile


aleatoare independente i S 2 x 2n1 ( ) .

Teorema 4.10
X
Dac ( 1 , X n) este o selecie dintr-o populaie caracterizat de

X N ( m, ) ,

atunci variabila aleatoare


U=

n S2 2
x n1
2

(4.22)

Corolar 4.3
Dispersia de selecie are media i dispersia de date
M ( S 2) =

n1 2 ( 2 ) 2(n1) 4
,D S =

n
n2

(4.23)
Demonstraie: din Teorema 3.4 avem c U x2n1 . Se tie c pentru o variabil
aleatoare repartizat
M (U )=

x 2r , media i dispersia r, respectiv 2r (parametrul fiind a=1). Atunci

n
M ( S 2) =n1
2

i
2

D (U ) =

n ( 2)
D S =2(n1)
4

De unde rezult relaiile (4.23).


Teorema 4.10
X
Fie ( 1 , X n) o selecie dintr-o populaie caracterizat de

X N ( m, ) .

Atunci variabila aleatoare


T=

X m
Sn1
S
n1

(4.24)

are repartiia Student cu n-1 grade de libertate.


55

Demonstraie: din Corolarul 4.1 i Teorema 4.9 se poate exprima variabila aleatoare
(4.24) astfel
T=

Xm
1
Z

=
2

U
nS
1

2
n
n1
n1

Se aplic atunci Teorema (4.2) pentru variabilele aleatoare independente


Z = N (0,1) i U x2n1 .
Sunt enunate urmtoarele dou teoreme fr demonstraie pentru cazul eleciilor de
volum mare, ceea ce reprezint (dup diferii statisticieni) c volumul unei selecii este
n 50 . Astfel se va putea considera, din punct de vedere statistic, c n .

Teorema 4.12
X
Dac ( 1 , X n) este o selecie extras dintr-o populaie caracterizat de

X N ( m, ) i dac volumul n al seleciei este mare, atunci variabila aleatoare


2

nS
2
U M (U )

Z=
=
D(U ) 2(n1)

(4.25)
are o repartiie N(0,1), unde variabila aleatoare U are expresia (4.22).
Teorema 4.13
Variabila aleatoare (4.24) are repartiie N(0,1) pentru n .
Teorema 4.14
Fie variabila aleatoare

{ X '1 , X 'n }
1

{ X ''1 , X 'n' }
2

X 1 N ( m1 , 1 ) ; i X 2 N ( m2 , 2 ) independente i seleciile
extrase din populaiile caracterizate de

X 1 , respectiv

X 2 . Atunci variabila aleatoare


T=

X 1 X 2 (m 1m2 )

2
1

n1 S n2 S
+
n1
n2

2
2

n1 n2
n1 +n 2

(4.26)
are o repartiie Student cu n1 +n22 grade de libertate.
Demonstraie: din Teorema 4.8 se tie c variabilele aleatoare
independente i c
56

X 1 i

X 2 sunt

X 1 X 2 N m1 m2 ,

)
n1 n2
n 1+ n2

deoarece 1= 1= .
2

Pe de alt parte variabilele aleatoare

n1 S1

2
n1

n2 S2

x n1 din Teorema

4.10.Ele fiind variabile aleatoare independente, rezult c suma lor va fi o variabil aleatoare
X 2 cu numrul gradelor de libertate egal cu n11+ n21=n 1+ n22 .

repartizat

Atunci variabila aleatoare (4.26) este o variabil aleatoare Student cu n1 +n22


grade de libertate.
Teorema 4.15
Fie X 1 N ( m1 , 1 ) ; i X 2 N ( m2 , 2 ) variabile aleatoare independente i seleciile

{ X '1 , X 'n }
1

{ X ''1 , X 'n' }
2

extrase din populaiile caracterizate de

X 1 , respectiv

X 2 . Atunci variabila aleatoare


F=

n1 S 21
n2 S 22
:
(n11) 21 (n 21) 22

(4.27)
are o repartiie Fischer cu ( n11, n21 ) grade de libertate.
2

Demonstraie din teorema 4.10 se tie c

n1 S1

2
n1

n2 S2

x n1 . Aceste

variabile aleatoare fiind independente se poate aplica proprietate pentru variabile aleatoare
continue pentru a obine variabila aleatoare (4.27) cu repartiia amintit.
4.4. Tipuri de ipoteze. Riscuri. Puterea unui test
Fie X o variabil aleatoare avnd funcia de repartiie F(x) i fie ( X 1 , , X n) o
selecie extras din populaia caracterizat de X.
Presupunem c F(x) aparine unei clase F de funcii de repartiie. Fie C0 F
C1 =C F C0 , atunci

{ C 0 , C 1 } constituie o partiie a lui F.

Vom numi ipotez statistic orice presupunere privind repartiia necunoscut a


variabilei aleatoare X, iar metodele de verificare a ipotezelor statistice se vor numi teste
statistice.

57

Se va defini ipoteza nul

H 0 faptul c

F C 0 i ipoteza alternativ

H1

F C 1 . Alegerea convenabil a testului cu care se verific cuplul celor dou

faptul c

ipoteze H 0 i

H 1 este o problem deosebit de important n statistica matematic.

Se presupune c, clasa funciilor de repartiie F depinde de un parametru (


fiind vector cu una sau mai multe dimensiuni) adic se va putea identifica f cu .
Astfel dac pentru o variabil aleatoare normal se face presupunerea c m=0 i =1 ,
atunci legea normal devine complet specificat n clasa funciilor de repartiii normale.
Testele cu care se verific ipotezele privind valorile necunoscute ale parametrilor unei
repartiii se numesc teste parametrice.
Atunci ipoteza H 0 : F C 0 devine ipoteza nul
H 0 : 0 ,
Iar ipoteza alternativ a ei va fi

(4.28)

H 1 : 1 =0 .

O ipotez se numete simpl dac determin n mod unic o repartiia variabilei


aleatoare X, adic mulimea 0 se reduce la un punct 0 . De exemplu, ipoteza
m=0

i =1 pentru o variabil aleatoare normal este o ipotez simpl.


O ipotez se numete compus dac ea const dintr-un numr finit sau infinit de

ipoteze simple. De exemplu ipoteza m=0 i >1 este o ipotez compus.


Fie
alternativa

T ( X 1 , , X n) un test statistic utilizat pentru verificarea ipotezei


H 1 . Se numete regiune de acceptare a ipotezei

H 0 cu

H 0 mulimea A de valori

ale testului T astfel nct dac valoarea T (x 1 , , x n ) , obinut pentru selecia realizat
(x 1 , , x n) , aparine acestei mulimi, atunci ipoteza

H 0 se accept. Dac

T ( x 1 , , x n ) A=W
, atunci se numete regiune critic a testului T ( X 1 , , X n) .
Verificarea ipotezelor statistice fcndu-se pe baza rezultatelor obinute din selecii
aleatoare, exist ntotdeauna riscul de a lua decizii eronate. Aceasta se ntmpl din cauz c
selecia reprezint doar o parte din populaia general i pe baza ei nu putem s determinm cu
precizie repartiia variabilei aleatoare studiate, sau poate c se poate selecta s nu fie
reprezentativ i atunci informaia oferit de ea este incomplet sau nu concord cu realitatea.
Cu toate acestea, avantajele teoriei verificrii ipotezelor statistice sunt date de posibilitile de
a calcula probabilitatea de a lua decizii false. Dac aceast probabilitate este suficient de
mic, atunci se poate considera c testul aplicat asigur un risc mic de a grei n luarea
deciziei.
Definiia 4.3
58

H 0 i

Fie cuplul de ipoteze

A regiunea de acceptare a ipotezei

H 1 i fie T ( X 1 , , X n) testul statistic folosit, iar

H 0 . Probilitatea de a respinge

H 0 , dei ea este

adevrat
=P [ T ( X 1 , , X n ) A / H 0 ]
(4.29)
se numete eroare de ordin nti, iar probabilitatea de a accepta ipoteza H 0 , dei ea este
fals
H ]
=P [ T ( X 1 , , X n ) A/
1

(4.30)

se numete eroare de ordin doi.


H 0 cnd este fals

Probabilitatea de a respinge ipoteza

/H 0 ]
1=P [ T (X 1 , , X n) A
(4.31)
se numete puterea testului.
Deoarece respingerea ipotezei nule
alternative

H 0 : nseamn acceptarea ipotezei

H 1 : 1 , erorile de cele dou ordine, sau riscurile date de probabilitile

condiionate (4.29) i (4.30), se mai poate exprima ca


) =P [ T (X 1 , , X n ) A / 0 ]
=Pc ( T A
0

=Pc ( T A )=P [ T (X 1 , , X n) A / 1 ] .
1

Se observ c, cu ct probabilitatea 1

este mai mare, cu att probabilitatea de a

comite eroarea de tipul doi este mai mic.


Definiia 4.4
Fie T o mulime de teste asociate cuplului de ipoteze

H0 ,

corespunztoare celor dou ordine. Se spune c testul T (1) T


testul T (2) T

erorile

este mai puternic dect

dac
(1)

(2)

(1)

,
Un test T
exist un test T
Dac

H 1 i ,

(2)

(4.32)

se numete admisibil de nivel pentru ipoteza H 0 dac nu


mai puternic dect T.

este regiunea de acceptare a ipotezei

admisibil de nivel , iar

H 0 i dac T este un test

H 1 este o ipotez simpl, atunci T se numete cel mai

puternic test de nivel .

59

Regula de alegere a regiunii critice


mulimile

A va fi, deci, urmtoarea: dintre toate

pentru care are loc


) =
Pc ( T A

(4.33)

) =1
Pc ( T A

(4.34)

se alege aceea pentru care


1

are valoarea maxim, adic se alege dintre mulimile pentru care probabilitatea erorii de
ordinul unu este constant, , aceea pentru care probabilitatea

a erorii de ordinul doi

este minim.
S presupunem c ipotezele

H 0 :=0 i

H 1 :=1 sunt simple i s

determinm condiiile n care un cel mai puternic test exist. Pentru aceasta este mai nti
necesar urmtorul rezultat:
Propoziia 4.1
Fie funciile reale G0 ,G1 : M R . Punctual

x0 M

este un punct de extreme

al funciei G1 care satisface condiia G0 ( x )=a dac exist o constant c R astfel ca


x 0 s fie punct de extreme al funciei

F ( x )=G1 ( x )c G0 (x ) cu condiia G0 ( x0 ) =a .

Demonstraie:
S considerm c

x 0 este un punct de maxim al funciei


F ( x0 ) F ( x ) , x M

condiia G0 ( x0 ) =a , adic

echivalent cu G1 ( x 0 ) G1 ( x ) , x M

F ( x ) i c satisface

i G0 ( x0 ) =a . Acest lucru este

i G0 ( x0 ) =a . Cum funcia

F ( x ) este funcie

Lagrange, multplicatorul Lagrange c va exista dac x 0 este un punct de maxim al funciei


G1 i satisface condiia G0 ( x )=a .
4.5. Ipoteze compuse
Fie X o variabil aleatoare cu densitatea de probabilitatea f ( x , ) >0, x R
R i fie (X 1 , , X n) o selecie din populaia caracterizat de X, avnd
n

densitatea de probabilitate

L=( x , )=L ( x 1 , , x n ; ) = f ( x i ; ) .
i=1

Definiia 4.5 (Lehmam)


60

Vom spune c variabila aleatoare X are proprietatea (G) dac exist o funcie
G: R n R astfel nct x R n i 1 , 2 ( 1 > 2 ) s avem
L ( x ; 1 )
L ( x ; 2 )

=h (G ( x ) )

(4.35)

unde h este o funcie strict cresctoare real.


Teorema 4.16 (Lehmam)
Fie X o variabil aleatoare cu densitate de probabilitate f ( x , ) >0, x R
R

i fie (X 1 , , X n) o selecie.

Se consider ipotezele statistice


H 0 : < 0 i

H 1 : < 1

Dac X are proprietatea (G), atunci [ 0,1 ]


nivel

pentru verificarea lui

H 0 cu alternativa

(4.36)
exist un cel mai puternic test de

H 1 , a crei regiune de acceptare

este
A = { x R nG( x) c }
unde

(4.37)

P ( A )=1 .
0

4.6. Testul raportului de verosimilitate


n verificarea ipotezelor statistice simple sau compuse exist cazuri n care Lema
Neyman Pearson nu poate da cea mai bun regiune de acceptare.
Exist, de asemenea, cazuri n care regiunea de acceptare este dependent de alegerea
funciilor de repartiie

F C 0 i

F C 1 (conform ipotezelor

H 0 i

H 1 ). n

aceste cazuri se folosete testul raportului de verosimilitate.


Fie cuplul ipotezelor
H 0 : 0 cu

H 0 : F C 0 i

H 1 : F C1 (C 1=C F C 0) sau, echivalent

1=C0 0
).
H 1 : 1

Definiia 4.5
Fie X o variabil aleatoare cu densitatea de probabilitate f ( x ; ) , i fie
(X 1 , , X n)

o selecie. Se numete test al raportului de verosimilitate variabila aleatoare

61

(f ( X i ; ) )

i=1

L( X ; )

A n=
=
n

(f ( X i ; ) ) 0 L(X ; )

0 i=1
(4.38)
n

unde am notat

L ( X ; )= f ( X i ; ) funcia de verosimilitate.
i=1

Testul de verificarea ipotezei

H 0 cu alternativa

H 1 admite regiunea de

A = { n n ( ) }

acceptare
(4.39)
n care

( ) este ales astfel ca


P ( n > n ( )) , 0

(4.40)

Teorema 4.17
Fie

{ f ( x ; ) , R } o familie de densiti de probabilitate pentru care exist

ln f ( x ; )
2

care este integrabil pe R, este continu n raport cu i uniform n

raport cu x i fie X o variabil aleatoare cu densitatea f ( x ; 0 ) , 0 .


^ n un estimator de maxim verosimilitate al parametrului
Fie

cu

proprietatea c, converge ctre 0 cu probabilitatea 1.


Dac
L( X ;)
^ n)
L(X ;

A n ( 0 )=
=
L(X ; ) L( X ; 0 )
0
atunci variabila aleatoare 2 ln n ( 0) are o repartiie

21 cnd n .

4.7. Teste referitoare la parametrii repartiiei normale


n continuare sunt expuse metode de verificare bazate pe rezultatele enunate mai
nainte, ce duc la determinarea regiunilor de acceptare ale ipotezelor cu privire la parametrii
repartiiei normale cu diferite ipoteze alternative simple sau compuse [9].
4.7.1. Verificarea ipotezei

H 0 : m=m0 , cnd

62

este cunoscut

Fie P o populaie avnd valorile numerice, ce cuantific o caracteristic a sa, normal


distribuite

N (m , 2) . Presupunem c dispersia populaiei este cunoscut. Trebuie analizate

urmtoarele perechi de ipoteze nule i ipoteze alternative relativ la media de populaie:


H 0 : m=m0 ;
H 1 :m<m0 ;
(4.41)
H 0 : m=m0 ;
H 1 :m>m0 ;

(4.42)

H 1 :m m0 ;

(4.43)

H 0 : m=m0 ;
n statistica matematic se demonstreaz c pentru fiecare astfel de pereche testul cel
mai puternic este
Z calc =

x m
/n

(4.44)
z < 0 , iar

Dac (0,1/2) atunci cvantila

z 1 >0 .

1) Fie (0,1/2) fixat ca nivel de semnificaie ( =0,05 ; 0,01 sau 0,001 . Se


H 0 n cazul n care ipoteza

determin regiunea de respingere a ipotezei nule


alternativ

H 1 :m<m0 . Aceast form a ipotezei alternativei sugereaz c ipoteza

H 0 trebuie respins cnd estimatorul mediei,


m0 , n sensul c

x plus un numr a>0

de abateri standard, a / n , este

x m
<a< 0 . Astfel regiunea de respingere
/n

mai mic dect m 0 (fig. 4.1), adic


a ipotezei

x , este cu mult mai mic dect

H 0 este de forma:

A = x R n

x m
<a
/n

(4.45)
unde a se determin din condiia:
P

Xm
<a =
/n

(4.46)

63

m0

x + a / n

Fig. 4.1 Poziia mediei de selecie

i a lui

x + a / n fa de m0 , care

sugereaz respingerea ipotezei

H0

Cum selecia se face dintr-o populaie ce are distribuia normal


necunoscut,

Xm
N (0,1) . Probabilitatea (4.45) este o
/ n

X N (m , 2 /n) i deci

probabilitate asociat variabilei aleatoare


P

N (m , 2) , cu m

Xm
, tiind c m=m0 . Astfel,
/ n

Xm
0
<a = (a ) =
/n

(4.47)

Aadar a=1 ( )==z <0 este cvantila distribuiei

N (0,1) . n concluzie,

dac
x m0
<z ,
/n
(4.48)
atunci ipoteza

H 0 este respins cu probabilitatea de eroare egal cu < 1/2

testul este semnificativ la nivelul

(fig. 4.2); din punct de vedere geometric


(t ) dt

aria domeniului haurat, deoarece dac

Z N ( 0,1 ) , =P ( Z < z )=

Xm

0
N ( 0,1)
/n

64

sau

este

regiune de
respingere
Fig. 4.2 Regiunea de respingere pentru ipoteza

H 0 : m=m0 cu alternativa

H 1 : m<m0
H 1 :m>m 0 , ipoteza

2) n cazul n care ipoteza alternativ este

x , este cu mult mai mare dect m 0 , n sensul c

cnd estimatorul mediei,


minus un numr a>0
(fig. 6.3), adic
ipotezei

H 0 trebuie respins
x

de abateri standard, a / n , este mai mare dect m 0

x m0
>a> 0 . Astfel regiunea de respingere (regiunea critic) a
/n

H 0 este de forma:

A = x R n

x m
>a
/n

(4.49)

Unde a se determin din condiia


P

Xm
0
>a = .
/n

m0

x a / n

Fig. 4.3 poziia mediei de selecie

x i a lui

sugereaz respingerea ipotezei

(4.50)

x a / n fa de m0 , care
H0

Dar pentru o variabil aleatoare


Z N ( 0,1 ) , P ( Z >a )=P ( A ( Z a )) =1P ( Z a ) =1( a) . n cazul nostru
P

Xm
0
>a =1 ( a ) =
/n

(4.51)

i deci ( a ) =1 , iar a=1 ( 1 )=z 1 > 0 . Prin urmare, dac

Xm
0
> z1 ,
/n
(4.52)
atunci ipoteza

H 0 este respins cu o eroare de ordinul 1, egal cu (fig. 4.4 domeniul

haurat reprezint are aria 1 ).


65


Xm
0
N ( 0,1)
/n

regiune de
H 0 : m=m0 cu alternativa
Fig. 4.4 Regiunea de respingere pentru ipoteza
respingere
H 1 :m>m0 .
Dac ipoteza alternativ a ipotezei nule

H 0 : m=m0 este

H 1 :m m0 , regiunea

critic este reuniunea regiunilor critice de la 1) i 2), adic

| | }

A = x R n

x m
>a
/ n

(4.53)

unde a se determin, la fel, din condiia ca:


P

(| |)

X m0
=
/ n

(4.54)

Dar pentru o variabil aleatoare Z N ( 0,1 ) , P (|Z|> a ) =


P ( Z <a ) + P ( Z >a )=P ( Z <a ) +1P ( Z a )=
(a ) +1 ( a )=
1 ( a ) +1 ( a )=2(1 ( a ) ) .

Prin urmare (4.54) devine:


P

(| | )
X m0
/ n

> a =2(1 ( a ) )=

Din 2 ( 1 ( a ) )= , rezult c ( a ) =1 /2 , adic

( 2 )=z

a=1 1

1 /2

66

(4.55)

Deci, dac

| |

Xm
0
> z 1 / 2 ,
/n

(4.56)
Atunci ipoteza

H : m=m 0 este respins cu probabilitate de eroare

(fig. 4.5)

Xm
0
N ( 0,1)
/n

1 /2

1 /2

regiune de

regiune de

respingere

respingere
Fig. 4.5 Regiunea de respingere pentru ipoteza H 0 : m=m0 cu alternativa
H 1 :m m0 ; domeniile haurate cu arii egale cu 1 /2

n tabelul 4.1 sunt centralizate condiiile n care, pe baza valorilor de selecie, ipoteza
H 0 : m=m0 , asupra mediei distribuiei normale

2
N (m , ) , cu

cunoscut, este

respins.
Tabelul 4.1 Condiiile de respingere a ipotezei nule
alternativ

H 1 , pe baza unei selecii din legea

H 0 : m=m0 , cu ipoteza

N (m , 2) , cu 2 cunoscut.

H 0 : m=m0
H 1 :m<m0

Condiia
x m0
< z
/n

Xm
0
> z1
/n

H 1 :m>m0

67

H 0 : m=m0
H 1 :m m0

Condiia

Xm
0
> z 1 / 2
/n

| |

n urma acestei prezentri teoretice se pot trage concluzii utile pentru a aborda
problematica testrii ipotezelor. Aadar, pentru a rezolva o problem care implic testarea
ipotezelor trebuie parcurse urmtoarele etape:
1) formularea ipotezei nule i a celei alternative;
2) alegerea nivelului de semnificaie =0,05 ; 0,01 sau 0,001 . De cele mai multe
ori acesta este specificat n enunul problemei;
3) identificarea funciei test adecvat i calcularea valorii sale n vectorul datelor de
x
selecie ( 1 , x 2, , x n) ;

4) identificarea valorilor critice pentru testul statistic;


5) compararea valorii calculate cu valoarea critic i formularea deciziei de respingere sau
nu a ipotezei nule.
4.7.2. Testarea ipotezei
Fie

H 0 : m=m0 , cnd

x 1 , x 2, , x n o selecie din distribuia normal

este necunoscut
N (m , 2) , cu m i 2

H 0 : m=m0 , aceleai ipoteze alternative la fel ca i

necunoscute. Se asociaz ipotezei nule

sus. Ca i funcie test se folosete funcia t care este definit astfel:


x
( 1 , x 2, , x n)=
t
unde

x m
,
s/ n

x este media de selecie din distribuia

de selecie. Ca de obicei se interpreteaz


aleatoare

(4.57)

N (m , 2) , iar s 2 este dispersia valorilor

x i ca valori de observare asupra variabilei

X i N ( m, 2 ) , i=1, n , variabila aleatoare


X
( 1 , X 2, , X n )=
t

m
X
t (n1)
s
n

68

(4.58)

are distribuia student n-1 grade de libertate. Cum densitatea de probabilitate a distribuiei
Student este simetric fa de dreapta
proprietate ca i a distribuiei

x=0 , funcia de repartiie Student T are aceeai


N (0,1) :

T (a )=1T (a)

(4.59)

Aadar ntr-un mod analog cu cel corespunztor cazului


condiiile n care se respinge ipoteza

cunoscut, se obin

H 0 cu o probabilitate de eroare

(tabelul 4.2),

unde t reprezint cvantila distribuiei Student, t ( n1 ) , cu ( n1 ) grade de libertate,


n fiind volumul seleciei.
Tabelul 4.2 Condiiile de respingere a ipotezei nule
alternativ

H 1 , pe baza unei selecii din legea

H 0 : m=m0 , cu ipoteza

N (m , 2) , cu 2 necunoscut.

H 0 : m=m0
H 1 :m<m0

Condiia
x m0
<t
s/n

Xm
0
> t 1
s /n

H 1 :m>m0

H 1 :m m0

| |

Xm
0
>t 1 / 2
s/n

4.7.3. Testarea ipotezelor folosind o selecie de volum mare


Fie

x 1 , x 2, , x n o selecie aleatoare de volum n 30 , dintr-o distribuie arbitrar

de medie m i dispersie 2 . Se dorete precizarea condiiilor de respingere a ipotezei


H 0 : m=m0 n cazul n care ipoteza alternativ este una din urmtoarele:
H 0 : m=m0 ;
H 1 :m<m0 ;

(4.60)

H 1 :m>m0 ;

(4.61)

H 0 : m=m0 ;

H 0 : m=m0 ;
H 1 :m m0 ;
69

(4.62)

Se valorific faptul c, pentru n suficient de mare, media aritmetic


variabilelor aleatoare de selecie

X 1 , X 2, , X n are distribuia aproximativ normal de

medie m i dispersie D 2= 2 /n , putndu-se repeta raionamentul de mai sus i apoi


obinndu-se urmtoarele condiii de respingere a ipotezei nule (Tabelul 4.3):

Tabelul 4.3 Condiiile de respingere a ipotezei nule


alternativ

H 0 : m=m0 , cu ipoteza

H 1 , pe baza unei selecii de volum mare dintr-o lege arbitrar.


H 0 : m=m0
H 1 : m<m 0

H 1 : m>m 0

H 1 :m m0

Condiia (

Condiia (

cunoscut)
x m0
< z
s/n

necunoscut)
x m0
< z
s/n

Xm
0
> z1
s/n

| |

Xm
0
> z 1 / 2
s/n

Xm
0
> z1
s/n

| |

Xm
0
> z 1 / 2
s/n

4.8. Problem de estimare a parametrilor repartiiei normale


n aceast seciune se prezint o aplicaie referitoare la testarea parametrilor repartiiei
normale.
Un investitor interesat n crearea unui centru comercial face un studiu privind venitul
familiilor din acea zon i decide crearea centrului dac venitul mediu al unei familii este de
15.000 u.m. Se presupune c venitul pe familie este distribuit aproximativ normal cu
=2.000u . m . Fcnd o selecie de 15 familii, se gsete c venitul lor mediu este de

14.000 u.m.
Pentru un coeficient de ncredere 1 =0,95

s se afle:

a) decizia pe care o va lua investitorul, dac orice alt valoare a venitului mediu n afar
de 15.000 u.m. l-ar determina s renune la proiect;
b) decizia lui, dac venitul mediu familial ar fi de cel puin 15.000 u.m. n cazul unui
venit mediu mai mic de 13.500 u.m. este obligat s renune;
c) eroarea de ordinul doi puterea testului n condiiile punctului b);
70

d) erorile de cele dou ordine pentru cuplul ipotezelor punctului b) dac regula de
decizie este: pentru x > 14.000 u.m. se accept construirea centrului comercial;
e) decizia investitorului, dac poate crea acest centru numai pentru un venit mediu
familial de cel puin 15.000 u.m., orice alt valoare fiind inacceptabil;

Rezolvare:
Pentru a rezolva aceast problem care implic testarea ipotezelor trebuie parcurse
urmtoarele etape:
a) 1. formularea ipotezei nule i a celei alternative
Ipoteza nul: H 0 : m=15.000u . m .
Ipoteza alternativ: H 1 :m 15.000 u . m.
2.alegerea nivelului de semnificaie 1 =0,95 =0,05
3.identificarea funciei test adecvat i calcularea valorii sale n vectorul datelor de
selecie

x m0
/ n
14.00015.000
Z calc =
=1,936
2.000/ 15
Z calc =

4.identificarea valorilor critice pentru testul statistic

2
F ( z ( ) ) =0,975
z ( 0,975 )=1,96
z =1,96
5.compararea valorii calculate cu valoarea critic i formularea deciziei de respingere
F ( z ( ) ) =1

sau nu a ipotezei nule.


|Z calc|> z
|1,936|>1,96
1,936<1,96
Se accept ipoteza

H 0 care afirm c venitul mediu va fi de 15.000 u.m., situaie

n care investitorul decide construcia centrului comercial.

|Z calc|< z

| | |

x m 0

< z
/ n
n

71

(x m0 )< z
x < z

+m0
n

Interval de acceptare

< x < m0 + z
n
n
2.000
2.000
15.0001,96
< x <15.000+1,96
15
15
13.987< x <16.012
b) 1. formularea ipotezei nule i a celei alternative
Ipoteza nul: H 0 : m 15.000u . m.
Ipoteza alternativ: H 1 :m<13.500 u . m.
m0z

2.alegerea nivelului de semnificaie 1 =0,95 =0,05


3.identificarea funciei test adecvat i calcularea valorii sale n vectorul datelor de
selecie
Z calc =

x m 0

/ n
14.00015.000
Z calc =
=1,936
2.000/ 15

4.identificarea valorilor critice pentru testul statistic


F ( z ( ) ) =
F ( z ( ) ) =0,05
z ( 0,05 )=1,644
z =1,644
5.compararea valorii calculate cu valoarea critic i formularea deciziei de respingere
sau nu a ipotezei nule.
Z calc < z
1.936<1,444
Se accept ipoteza

H 1 care

afirm c venitul mediu va fi mai mic de 13.500 u.m., situaie n care investitorul decide
renunarea la proiect.
Interval de ncredere
Z calc > z
x m0

> z
/n
n
+

(x m0 )> z

72


+m0
n

x > m0+ z
n
x > z

x > 15.000+(1,644)

2.000
15

x > 14.151
c) 1. formularea ipotezei nule i a celei alternative
Ipoteza nul: H 0 : m 15.000u . m.
Ipoteza alternativ: H 1 :m<13.500 u . m.

2. alegerea nivelului de semnificaie 1 =0,95 =0,05


3. identificarea funciei test adecvat i calcularea valorii sale n vectorul datelor de
x
selecie ( 1 , x 2, , x n)

x m 0
Z calc =
< z
/ n
14.00015.000
Z calc =
=1,936
2.000/ 15
4. identificarea valorilor critice pentru testul statistic
F ( z ( ) ) =
F ( z ( ) ) =0,05
z ( 0,05 )=1,644
z =1,644
5. compararea valorii calculate cu valoarea critic i formularea deciziei de
respingere sau nu a ipotezei nule.
Z calc < z
1,936<1,444
Se accept ipoteza

H 1 care

afirm c venitul mediu va fi mai mic de 13.500 u.m., situaie n care investitorul decide
renunarea la proiect.
Interval de ncredere
Z calc > z
x m0

> z
/n
n
+

(x m0 )> z

x > z
+m0
n

x > m0+ z
n

73

x > 15.000+(1,644)
x > 14.151

2.000
15

>m 0 + z m=m1 m 1
=P ( A / H 1 )=P X
n

P X m 1>m0+ z
m1 :
n
n

m0 + z
m 1

Xm
1
n
P
>
/n
/n

2.000
13.500
15

P Z>
2.000
15
=P ( Z >1,260 )=1P ( Z <1,26 )=1 ( 1.26 ) =10,9=0,11
Iar puterea testului este
=1 =10,11=0,89
d) 1. formularea ipotezei nule i a celei alternative
Ipoteza nul: H 0 : m 15.000u . m.
Ipoteza alternativ: H 1 :m<13.500 u . m.
2.alegerea nivelului de semnificaie 1 =0,95 =0,05
3.identificarea funciei test adecvat i calcularea valorii sale n vectorul datelor de

15.000+ (1,644 )

x
selecie ( 1 , x 2, , x n)

x m0
Z calc =
/ n
14.00015.000
Z calc =
=1,936
2.000/ 15
4.identificarea valorilor critice pentru testul statistic
F ( z ( ) ) =
F ( z ( ) ) =0,05
z ( 0,05 )=1,644
z =1,644
5.compararea valorii calculate cu valoarea critic i formularea deciziei de respingere
sau nu a ipotezei nule.
Z calc < z
1,936<1,444
Eroare de ordin doi
=P ( A |H 0 ) =
Z < z ( )H 0=F ( z ( ) )=
P
P( X <14.000m=m0 )

74

14.00015.000
=P ( Z <1,93 )=0,03
2.000 / 15
Eroarea de ordinul doi este
14.000|m=m1 )=
=P ( A |H 1 )=P ( X>
14.00013.500
P Z>
=P ( 0,97 ) =0,166
2.000
15
e) 1. formularea ipotezei nule i a celei alternative
Ipoteza nul: H 0 : m 15.000u . m.
Ipoteza alternativ: H 1 :m<15.000 u . m.
2.alegerea nivelului de semnificaie 1 =0,95 =0,05
3.identificarea funciei test adecvat i calcularea valorii sale n vectorul datelor de

P Z<

x
selecie ( 1 , x 2, , x n)

x m 0
Z calc =
/ n
14.00015.000
Z calc =
=1,936
2.000/ 15
4.identificarea valorilor critice pentru testul statistic
F ( z ( ) ) =
F ( z ( ) ) =0,05
z ( 0,05 )=1,644
z =1,644
5.compararea valorii calculate cu valoarea critic i formularea deciziei de respingere
sau nu a ipotezei nule.
Z calc < z
1,936<1,444
Se accept ipoteza

H 1 care afirm c venitul mediu va fi mai mic de 15.000 u.m.,

situaie n care investitorul decide renunarea la proiect.


Interval de ncredere
Z calc > z
x m0

> z
/n
n
+

(x m0 )> z

x > z
+m0
n

x > m0+ z
n

75

x > 15.000+(1,644)
x > 14.151

Se accept ipoteza

2.000
15

H 1 care afirm c venitul mediu va fi mai mic de 15.000 u.m.,

situaie n care investitorul decide renunarea la proiect.

76

BIBLIOGRAFIE
1. Andrei T., Stancu S., Statistic. Teorie i aplicaii, Ed. ALL, 1995.
2. Balaj Mircea, Calculul probabilitilor, Editura Universitii din Oradea, Oradea,
2007.
3. Beganu Gabriela, Giuclea Marius, Elemente fundamentale de matematic, aplicat
n economie, Editura ASE, Bucureti, 2011.
4. Beganu G., Metode probabilistice aplicate n economie i asigurri, Editura Tehnic,
Bucureti, 1996.
5. Beganu G., Elemente de teoria probabiliti i statistic matematic, Editura Meteor
Press, 2004.
6. Bocan, G. Estimarea parametrilor modelelor statistice, Tipografia Universitii de
Vest, Timioara, 1995.
7. Giuclea, M., Popescu, C.C., Metode fundamentale de matematic cu aplicaii n
economie, Editura ASE, 2009.
8. Mihoc Gh., Urseanu V., Ursianu E., Modele de analiz statistic, Editura tiinific i
Enciclopedic, Bucureti, 1982.
9. Petrior Emilia, Probabiliti i statistic. Aplicaii n economie i inginerie, Editura
Politehnic, Timi, 2007.
10. Tudor M., Sibiceanu M., Iulian., Probabiliti, statistic i aplicaii, Editura ASE,
Bucureti, 2009.

77

S-ar putea să vă placă și