Documente Academic
Documente Profesional
Documente Cultură
Curs Statistica 2011-2012 Sem I
Curs Statistica 2011-2012 Sem I
Facultatea de Hidrotehnica,
Statistica n Geodezie,
Lector dr. Lucian MATICIUC
1
1.1
C
amp nit de evenimente
Evenimente
Prin experient
a aleatoare ntelegem acele experiente n care intervine ntamplarea.
Rezultatele posibile ale unei experienta aleatoare se numesc probe sau cazuri posibile
ale experientei. Numim eveniment aleator sau, mai simplu, eveniment (atasat unei
experiente) orice situatie care se poate realiza prin una sau mai multe probe si despre care
putem spune cu certitudine ca s-a produs sau nu. Evenimentul elementar este un eveniment care se realizeaza printr-o singura proba a experientei. Evenimentul compus este acel
eveniment care se realizeaza prin mai multe probe. Evenimentul sigur este acel eveniment
care se realizeaza cu certitudine la ecare efectuare a experientei, adica prin oricare dintre
probe. Evenimentul imposibil este evenimentul care nu se realizeaza prin nici o proba a
experientei. Evenimentul contrar unui eveniment dat este evenimentul care se realizeaza
atunci si numai atunci cand nu se realizeaza evenimentul dat.
Exemplul 1 Fie E experienta aruncarii simultane a doua zaruri. Probele experientei sunt
perechile
(1, 1) , . . . , (1, 6) ,
(2, 1) , . . . , (2, 6) ,
..
.
(6, 1) , . . . , (6, 6) .
Proba (i, j) reprezinta aparitia fetei cu numarul i de puncte de la primul zar si a fetei cu
numarul j de puncte de la al doilea zar. Numarul tuturor probelor (al cazurilor posibile)
este de 36.
Fie A evenimentul ca suma numerarului de puncte de pe cele doua fete sa e 5. Atunci
A se realizeaza prin probele (1, 4), (2, 3), (3, 2), (4, 1). Acesta este un eveniment compus.
Fie B evenimentul care consta n aparitia probei (3, 7). Acesta este un eveniment
imposibil.
Fie C evenimentul care consta n aparitia probei (6, 6). Acesta este un eveniment
elementar.
Fie D evenimentul care consta n aparitia oricarei perechi (i, j) cu i, j = 1, 6. Acesta
este un eveniment sigur.
Evenimentul contrar evenimentului C este evenimentul ce consta n aparitia perechilor
(i, j) cu i, j = 1, 6 si i + j < 12.
Evenimentele legate de o experienta E se noteaza cu litere mari A, B, C, D, . . .
Evenimentul sigur se noteaza cu , evenimentul imposibil cu , iar evenimentul contrar
Avem evident
= , = , A = A.
lui A se va nota cu A.
1
1.2
Doua evenimente se numesc echivalente daca ele se realizeaza prin aceleasi probe. Spunem ca evenimentul A implica evenimentul B (vom nota atunci A B) daca realizarea
evenimentului A implica realizarea evenimentului B. Deci orice proba care realizeaza evenimentul A, realizeaza si evenimentul B. Are loc evident A si A, A.
Evenimentele A si B se numesc compatibile daca se realizeaza simultan, adica daca
exista probe care realizeaza atat pe A cat si pe B. In caz contrar evenimentele se numesc
incompatibile.
Date doua evenimente A si B numim reuniunea lor (notata A B) evenimentul care se
realizeaza atunci cand se realizeaza cel putin unul dintre evenimentele A si B. Se numeste
intersectia evenimentelor A si B (notata A B) evenimentul care se realizeaza atunci cand
se realizeaza simultan evenimentele A si B. Vom numi diferenta a doua evenimente (notata
1.3
C
amp nit de evenimente
C
amp nit de probabilitate
2.1
Probabilit
ati conditionate
P (A B)
.
P (A)
(far
a demonstratie).
Formula de mai sus poate luata ca denitie a probabilitatii conditionate.
2.2
Evenimente independente
P (Ai ) , unde Ai Aj = , i, j = 1, n, i = j,
i=1
Similar se poate afla probabilitatea extragerii a doua bile albe care este de 3/4 3/5, si
deci probabilitatea de a extrage o bila rosie si una alba este complementara evenimentelor
de mai sus, deci are probabilitatea 1 (2/20 + 9/20) = 9/20.
Sa discutam acum proprietatile probabilitatii unor evenimente n termeni de aruncare
a unei monede.
acest caz putem reExemplul 19 Presupunem ca aruncam o moned
a de trei ori. In
prezenta rezultatele sub forma unei diagrame de tip arbore. O cale n arbore corespunde
unui posibil rezultat al experimentului. Deci daca aruncam o moned
a de trei ori vom
obtine opt posibile combinatii adica evenimentele elementare A1 , A2 , . . . , A8 si deci
= {A1 , . . . , A8 }. Vom presupune ca fiecare rezultat este egal n probabilitate, adica
fiecare are probabilitatea de 1/8.
Fie E evenimentul ca apare cel putin o data capul monedei. Atunci E nseamna nu
apare capul niciodata si deci E = {A8 }, unde A8 = PPP. Deci
( )
P E = P ({PPP}) = 1/8
si prin urmare
( )
P (E) = 1 P E = 8/9.
Remarc
am ca deseori este mult mai usor sa calcul
am probabilitatea ca un eveniment sa nu
se produca decat ca acesta sa se produc
a.
S
a notam cu A evenimentul ca primul rezultat sa fie capul monedei si B evenimentul
ca al doilea rezultat sa fie pajura monedei. Din diagram
a se vede ca P (A) = P (B) = 4/8.
De asemenea A B = {A3 , A4 } si prin urmare P (A B) = 1/4. Obtinem deci
P (A B) = P (A) + P (B) P (A B) = 1/2 + 1/2 1/4 = 3/4.
Evident se poate vedea din diagram
a ca A B = {CCC, CCP, CPC, CPP, PPC, PPP}
deci prin simpla enumerare se poate vedea ca P (A B) = 6/8.
Sa consideram acum experimentul aruncarii a doua zaruri.
Exemplul 20 Vom lua drept spatiul multimea tuturor perechilor ordonate (i, j) cu i, j =
1, 6, adica
{
}
= (i, j) : i, j = 1, 6 .
Av
and n vedere ca sunt sase posibilit
ati de alegere a lui i si fiec
arei alegeri a lui i i corespund sase alegeri pentru j, deducem ca sunt 36 de posibile rezultate (care vom presupune ca
sunt egale d.p.d.v. al probabilitatii obtinerii lor, deci P ((i, j)) = 1/36, pentru i, j = 1, 6).
Care este probabilitatea sa se obtin
a suma sapte la aruncarea celor doua zaruri? sau
suma unsprezece?
Primul eveniment, notat cu A, este multimea A = {(1, 6) , (2, 5) , (3, 4) , (4, 3) , (5, 2) , (6, 1)}
iar al doilea este B = {(5, 6) , (6, 5)}. Deci P (A) este probabilitatea reuniunii celor sase
evenimente elementare posibile care compun A adica este suma P ((1, 6))+P ((2, 5))+ =
6 1/36 = 1/6. De asemenea, P (B) = 1/36 + 1/36 = 1/18.
Evident probabilitatea obtinerii (a )unei duble de unu sau de sase este deci P (C) =
P ({(1, 1)} {(6, 6)}) = 1/18 iar P C = 1 1/18 = 17/18.
Urmatorul exemplu este legat de erorile aleatoare ce pot apare atunci cand se fac
masuratori.
6
Probabilitatea
1/2
1/2
1/4
1/2
1/4
1/8
3/8
3/8
1/8
1/16
1/4
3/8
1/4
1/16
1/32
5/32
5/16
5/16
5/32
1/32
Probabilit
ati geometrice
Aria (D )
.
Aria (D)
In acest caz, partile masurabile ale multimii D formeaza multimea de evenimente, D este
evenimentul sigur iar multimea vida este evenimentul imposibil. Probabilitatea denita
mai sus satisface denitia probabilitatii si se numeste probabilitate geometric
a.
and o coarda,
Exercitiul 22 (Paradoxul lui Bertrand) Care este probabilitatea ca aleg
la nt
amplare, n interiorul unui cerc, aceasta sa fie mai mare dec
at lungimea laturii triunghiului echilateral nscris n cerc?
Indicatie: Problema comporta mai multe rezolv
ari, n functie de modul n care ntelegem
alegerea la ntamplare a coardei.
a) Coarda dusa aleator n cerc este complet determinata, de exemplu, de urmatorii
doi parametrii: distanta de la centrul cercului la coard
a, notata d, si unghiul facut de
acest caz domeniul parametrilor,
perpendiculara cu un diametru fixat, unghi notat . In
n functie de pozitiile posibile ale corzii, este D : d [0, R) si [0, 2).
Conform desenului avem coarda P Q, cu mijlocul M si triunghiul echilateral ABC de
latur
a l, nscris n cercul de raz
a R.
Aria (D )
2R/2
1
=
= .
Aria (D)
2R
2
b) Coarda dusa aleator n cerc este complet determinata, de exemplu, de urmatorii doi
parametrii: unghiul facut de raza OQ cu un diametru fixat, unghi notat , si unghiul
acest caz domeniul parametrilor, n functie de pozitiile posibile ale
[ , notat . In
OQP
corzii, este D : [0, 2) si [0, /2).
Din calcule obtinem: l = R 3, |P Q| = 2R cos si deciP (|P Q| l) = ... = P ( /6) .
Domeniul situatiilor favorabile este atunci D : [0, 2) si [0, /6).
2 /6
1
Aria (D )
=
= .
Probabilitatea geometric
a este atunci P (|P Q| l) =
Aria (D)
2 /2
3
Exercitiul 23 (Tema) Care este probabilitatea ca aleg
and o coard
a, la nt
amplare, n interiorul unui cerc, aceasta sa fie cel mult R ?
Exercitiul 24 (Tema) Care este probabilitatea ca aleg
and o coard
a, la nt
amplare, n interiorul unui cerc, aceasta sa aiba lungimea cuprinsa ntre a si b ?
[
]
Exercitiul 25 Un segment de lungime este rupt n trei segmente. Care este probabilitatea ca acestea sa poata fi laturile unui triunghi?
Indicatie: Fie segmentul AB, de lungime , rupt n punctele aleatoare P , Q. Notam
x = |AP |, y = |P Q|. Domeniul cazurilor posibile este dat atunci de D : x [0, ], y [0, ]
astfel ncat x + y , adica
D : x [0, ] , y [0, x]
Cele trei segmente formeaza un triunghi daca si numai daca au loc urmatoarele inegalitati
|AP | |P Q| + |QB| ,
x /2,
|P Q| |AP | + |QB| ,
y /2,
|QB| |AP | + |P Q| ,
x + y /2,
Domeniul cazurilor favorabile este dat atunci de D : x [0, /2], y [/2 x, /2].
Probabilitatea geometric
a este atunci
Aria (D )
2 /8
1
= 2 = .
Aria (D)
/2
4
Observatie tem
a: rezolvati problema de mai sus cu notatiile x = |AP |, y = |AQ| .
interiorul unui triunghi echilateral se alege la nt
Exercitiul 26 (Tema) In
amplare (repartizat n mod uniform) un punct. Care este probabilitatea ca distantele la cele trei laturi
ale triunghiului considerat sa fie laturile unui triunghi?
Indicatie: Sa notam cu M punctul din interiorul triunghiului echilateral ABC si cu
P, Q, R picioarele perpendicularelor pe laturile BC, AC, AB. Deoarece AABC = AAM C +
AAM C + ABM C deducem ca
l 3
|M P | + |M Q| + |P Q| = (constant) = h =
2
Deci problema este similara cu problema 5 anterioar
a.
Incercat
i sa dati o interpretare geometric
a a rezultatului (unde se poate situa punctul
M astfel ncat sa aiba loc conditiile cerute n enunt ?).
Exercitiul 27 Doua semnale ajung la un dispozitiv captator uniform n intervalul de timp
[0, T ]. Aparatul se blocheaza daca semnalele sosesc la interval mai mic de a secunde unul
fat
a de celalalt (a < T ). Care este probabilitatea ca aparatul sa se blocheze?
Indicatie: Daca x, y noteaza timpul cand semnalul ajunge la aparat, atunci domeniul
parametrilor, n functie de situatiile posibile este D : x, y [0, T ]. Domeniul situatiilor
favorabile blocarii este atunci D : |x y| < a a x y a
Probabilitatea geometric
a este atunci P (|x y| < a) =
Aria (D )
.
Aria (D)
Aria (D )
.
Aria (D)
2
.
a
Exercitiul 29 (Tema) Sa presupunem ca toate valorile |p| 1, |q| 1 sunt egal probabile
si singurele posibile. Sa se determine probabilitatea ca rad
acinile ecuatiei x2 + px + q = 0
s
a fie: a) reale, b) ambele pozitive.
Exercitiul 30 (Tema) Sa se determine masura multimii M a dreptelor din plan care
intersecteaza un segment de dreapt
a de lungime .
Exercitiul 31 (Tema) Sa se determine masura multimii dreptelor din plan care intersecteaz
a laturile unui triunghi de marimi a, b, c.
Exercitiul 32 (Tema). Pe segmentul OA de lungime situat pe axa Ox se alege la
nt
amplare un punct B. Sa se determine probabilitatea ca cel mai mic dintre segmentele
OB si OA sa aiba o lungime mai mare ca /3. (Raspuns: P = 1/3)
Exercitiul 33 (Tema). Pe segmentul AB de lungime se aleg la nt
amplare doua puncte
C si D. Sa se determine probabilitatea ca C s
a fie situat mai aproape de D dec
at de A.
Pozitiile punctelor C si D sunt egal posibile. (Raspuns: P = 3/4)
amplare doua numere pozitive x si y mai mici sau
Exercitiul 34 (Tema). Se aleg la nt
egale cu 2. Sa se determine probabilitatea ca produsul lor sa nu depaseasc
a 1, iar y/x sa
nu depaseasca pe 2. (Raspuns: P = (1 + 3 ln 2) /8)
3 3
egal posibile. (Raspuns: P = 2/, P = 4 )
10
4
4.1
(1)
P (A B)
P (A)
(2)
(3)
(4)
(5)
Pentru demonstratie observam ca P (Ai X) = P (Ai ) P (X|Ai ) = P (X) P (Ai |X) si deci
P (Ai |X) =
Dar, din (4) avem ca P (X) =
4.2
n
j=1
P (Ai ) P (X|Ai )
.
P (X)
P (Aj ) P (X|Aj ) .
Scheme probabilistice
Exemplul 42 Fie trei urne cu urmatoarele proportii de bile albe si negre: U1 : trei albe
si patru negre, U2 : patru albe si cinci negre, U3 : cinci albe si sase negre. daca din fiecare
urn
a se extrage cate o bila atunci care este probabilitatea ca bilele extrase sa fie albe? Care
este probabilitatea ca una sa fie albe si doua negre?
Fie Ai evenimentul extragerii unei bile albe din urna Ui . Deci pi = P (Ai ), adica
p1 = 3/7, p2 = 4/9, p3 = 5/11 si respectiv q1 = 1 p1 = 4/7, q2 = 5/9, q3 = 6/11. Atunci
probabilitatea ca cele trei bile extrase sa fie albe (adica k = 3 bile albe si 0 bile negre) este coeficientul a3 corespunzator lui x3 din polinomul Q (x) = (p1 x + q1 ) (p2 x + q2 ) (p3 x + q3 ) =
x3 p1 p2 p3 + (p1 p2 q3 + p1 p3 q2 + p2 p3 q1 ) x2 + (p1 q2 q3 + p2 q1 q3 + p3 q1 q2 ) x + q1 q2 q3 , adica a3 =
p1 p2 p3 .
De asemenea, probabilitatea ca sa extragem k = 1 bile albe si 2 bile negre este coeficientul
a1 corespunzator lui x1 din polinomul Q (x) = (p1 x + q1 ) (p2 x + q2 ) (p3 x + q3 ) adic
a a1 =
p1 q2 q3 + p2 q1 q3 + p3 q1 q2 .
Schema lui Bernoulli (schema bilei revenite)
Fie E o experienta si A un eveniment legat de experienta E. Notam cu p = P (A). Fie
X evenimentul care consta n realizarea lui A de k ori si n nerealizarea lui A de n k,
cand se efectueaza experienta E de n ori.
Atunci are loc
Propozitia 43 Probabilitatea P (X) = Cnk pk q nk , cu q = 1 p, unde Cnk =
n!
.
k!(nk)!
Se observa ca suntem ntr-un caz particular al schemei lui Poisson n care pentru i =
1, n, Ei = E, Ai = A, deci pi = p, qi = 1 p iar Q (x) = (px + q)n . prin urmare ak este
coecientul lui xk adica Cnk pk q nk .
O varianta concreta a schemei lui Bernoulli este urmatoarea: se da o urna U care contin
bile a albe si b bile negre (deci probabilitatea p de extragere a unei bile albe din urna U este
p = a/ (a + b) si evident q = b/ (a + b)). Fie E experienta extragerii unei bile din urna U ,
urmand ca bila sa e pusa napoi. Se efectueaza E de n ori. Daca X reprezinta evenimentul
( a )k ( b )nk
extragerii a k bile albe si a n k bile negre. Atunci P (X) = Cnk a+b
.
a+b
Exemplul 44 Se considera experienta aruncarii a doua zaruri de opt ori. care este probabilitatea obtinerii sumei 7 de trei ori?
Evenimentul A este aparitia sumei 7. Probabilitatea p = P (A) = 6/36 (sase perechi
sunt favorabile (1, 6), (2, 5) , . . . si 36 sunt perechile posibile). Avem k = 3 si n = 8. Atunci
( )3 ( 5 )5
.
P (X) = C83 61
6
Exemplul 45 Dintr-o urna U cu 14 de bile (8 albe, 6 negre) se extrag cu revenire 3 bile.
Care este probabilitatea ca cele 3 bile extrase sa fie 2 albe si una neagr
a?
Avem n = 3, k = 2, p = 8/14 = 4/7, q = 3/7.
deoarece P (X = 1) = C51 (0.8) (0.2)4 = 5 (0.8) (0.2)4 = 0.0064, P (X = 2) = C52 (0.8)2 (0.2)3 =
5!
(0.8)2 (0.2)3 = 10 (0.8)2 (0.2)3 = 0.0512, etc.
2!3!
Exercitiul 47 Sa se calculeze si media v.a. de mai sus.
Media unei v.a. discrete este prin definitie
E (X) =
xi pi ,
i=1
unde
X:
x1 x2
p1 p2
xn
pn
)
cu pi = P (X = xi )
si evident ni=1 pi = 1.
cazul nostru obtinem E (X) = 0 0.0003 + 1 0.0064 + 2 0.0512 + = 4.0001.
In
Schema bilei nerevenite
Consideram o urna U cu a bile albe si b bile negre. Experienta E consta n extragerea
a n bile fara a pune bila extrasa napoi (n a + b). Fie X evenimentul ca din cele n bile
extrase sa e albe si = n sa e negre ( a, b).
Atunci are loc
Ca Cbn
Propozitia 48 Probabilitatea P (X) =
.
n
Ca+b
Pentru deducerea acestei probabilitati se foloseste denitia clasica a probabilitatii.
n
Numarul cazurilor posibile este Ca+b
iar numarul cazurilor favorabile este Ca Cbn (ecare grupa de bile albe se poate grupa cu ecare grupa de bile negre).
Exemplul 49 La o extragere sunt 400 de bilete dintre care 4 sunt castig
atoare. O persoan
a
cump
ar
a 10 bilete. Care este probabilitatea ca sa nu aiba nici un bilet castig
ator?
Avem a = 4, b = 396, = 0, n = 10, n = 10. Deci probabilitatea sa obtinem k = 0
C 0 C 10
bilete castigatoare este 4 10396 = 0, 903.
C400
14
5.1
15
5.2
V.a. discreta X este bine determinata daca se cunosc probabilitatile cu care este luata
ecare valoare. Fie tabloul
(
)
x1 x2 xn
X:
(6)
p1 p2 pn
0
, x < x1 ,
p1
, x1 x < x2 ,
p1 + p2
, x2 x < x3 ,
(7)
F (x) =
1
, xn x
(am presupus fara a restrange generalitatea ca x1 < x2 < < xn ).
Gracul se poate reprezenta imediat.
Reamintim functia treapta unitate Heaviside
{
0 , x 0,
H (x) =
1 , x > 0,
si functia generalizata Dirac (distributia Dirac) data de
{
0
, t = 0,
(t) =
+ , t = 0,
H = H (x) =
(t) dt.
pi H (x xi ) ,
i=1
unde pi = P (X = xi ).
Putem introduce si n cazul discret (ca si n cazul continuu) functia densitate de
probabilitate f (t) astfel ncat
x
def
F (x) =
f (t) dt,
pi (t xi ) .
i=1
5.3
xm
pm
(
,
Y :
y1 y2
q1 q2
yn
qn
)
,
p1n
pmn
iar pentru produsul X Y avem
(
x1 y1 x1 y2
X Y :
p11 p12
17
x1 yn
p1n
xm yn
pmn
)
.
pm
(
)
ax1 ax2 axm
aX :
.
p1 p2 pm
De asemenea, daca luam X = Y atunci
2 def
X = X X :
x21 x22
p1 p2
x2m
pm
)
,
pij = pi ,
j=1
pij = qj .
i=1
n
j=1
Exemplul 56 Dintr-o urna se extrage o bila alba cu probabilitatea p. Se fac doua extrageri
pun
andu-se bila napoi dupa extragere. Fie X, Y v.a. ce reprezint
a numarul de bile albe
obtinute la prima extragere, respectiv la a doua extragere. Sa se scrie tabloul de repartitie
al v.a. X, Y, X + Y, XY .
Avem ca
(
)
(
)
0 1
0 1
X:
, Y :
, unde q = 1 p.
q p
q p
(
Deci
X +Y :
(
=
0
1
2
2
q 2pq p2
)
,
deoarece
P (X + Y = 0) = P (X = 0, Y = 0) = P (X = 0) P (Y = 0) = q 2 ,
P (X + Y = 1) = P ({X = 0, Y = 1} {X = 1, Y = 0})
= P (X = 0) P (Y = 1) + P (X = 1) P (Y = 0) = pq + pq = 2pq,
P (X + Y = 2) = P (X = 1, Y = 1) = P (X = 1) P (Y = 1) = p2 .
(
Similar
X Y :
00 01 10 11
q2
pq
pq
p2
18
(
=
0
1
2
q + 2pq p2
)
,
(8)
deoarece
P (XY = 0) =
=
=
P (XY = 1) =
5.4
P ({X = 0, Y = 0} {X = 0, Y = 1} {X = 1, Y = 0})
P (X = 0) P (Y = 0) + P (X = 0) P (Y = 1) + P (X = 1) P (Y = 0)
q 2 + 2pq,
P (X = 1, Y = 1) = P (X = 1) P (Y = 1) = p2 .
m
i=1
x1 x2
p1 p2
xm
pm
)
,
pi = 1.
xi pi .
i=1
Denumirea de medie este ndreptatita daca tinem seama de sensul ei practic. Presupunem ca am repetat de N ori o experient
ma care ne-a condus la v.a. X. Daca ecare valoare
xi este luata de ni ori astfel ncat i=1 ni = N . Atunci suma valorilor luate de v.a. X
este n1 x1 + + nm xm iar media aritmetica a valorilor luate de X va deci
n1 x1 + + nm xm
n1
n2
n3
nm
= x1 + x2 + x3 + +
xm .
N
N
N
N
N
Dar nNi reprezinta raportul dintre numarul cazurilor n care s-a luat valoarea xi si numarul
total de experimentari, adica pi .
Media aritmetica a valorilor luate de X poate aproximata cu p1 x1 + + pm xm , adica
media lui X. Media lui X ne arata la ce valoare putem sa ne asteptam pentru media
aritmetica a unui mare numar de valori ale lui X, obtinute n urma repetarii experientei
date.
Exemplul 58 Fie v.a.
(
X:
0 1
q p
(
, Y :
0 1
q p
)
, unde q = 1 p.
(
X +Y :
0
1
2
q 2 2pq p2
19
pi (xi 1 ) =
2
i=1
i=1
pi x2i
2 1
i=1
pi x2i
i=1
pi xi +
21
pi =
i=1
i=1
pi x2i
2 1 1 +
i=1
pi xi 1 +
pi 21
i=1
21
1=
i=1
pi x2i 2 21 ,
Mentionam ca dispersia unei v.a. X este, ntr-un anume sens, cea mai buna valoare
care caracterizeaza mprastierea valorilor x1 , . . . , xn fata de medie.
Propozitia 65 (Propriet
ati ale dispersiei)
1. Dispersia unei constante este nula:
( )
D2 (c) = E c2 (E (c))2 = c2 c2 = 0.
2.
D2 (aX) = a2 D2 (X) ,
deoarece
2
D (aX) =
pi (axi a 1 ) = a
2
i=1
pi (xi 1 )2 = a2 D2 (X) .
i=1
3.Dispersia sumei a doua v.a. independente este suma dispersiei variabilelor considerate
D2 (X + Y ) = D2 (X) + D2 (Y ) .
Intr-adev
ar,
(
)
D2 (X + Y ) = E (X + Y )2 (E (X + Y ))2
( )
( )
= E X 2 + 2E (XY ) + E Y 2 (EX)2 2E (X) E (Y ) (EY )2
( )
( )
= E X 2 + E Y 2 (EX)2 (EY )2 = D2 (X) + D2 (Y ) .
= D (X) = D2 (X).
Aceasta are avantajul ca se exprima prin aceleasi unitati de masura ca si valorile v.a. X.
Propozitia 66 (Propriet
ati ale abaterii medii p
atratice)
1. D (c) = 0.
2. D (aX) = |a| D (X) .
Exercitiul 67 Fie urmatoarele date 20.1, 20.5, 20.2, 21.7, 20.5, 21.8, 21.9, 20.5. Atunci
(
)
20.1 20.2 20.5 21.7 21.8 21.9
X:
1/8 1/8 3/8 1/8 1/8 1/8
Atunci media aritmetica este
167.2
8
E X
deci
D2 (X)
, unde 1 = E (X) .
2
(f
ar
a demonstratie).
Exemplul 69 Fie v.a.
(
X:
)
.
5.5
1. Repartitia Poisson
Fie X o v.a. care ia drept valori numarul de bile albe extrase din n urne Ui , i = 1, n,
care contine ecare n proportii diferite cunoscute bile albe si negre. Probabilitatea de a
extrage o bila alba din urna Ui este pi , iar o bila neagra qi = 1 pi . Fie Xi v.a. care ia
valoarea 1 daca din Ui se extrage o bila alba si 0 daca se extrage o bila neagra:
(
)
0 1
Xi :
, i = 1, n.
qi p i
Avem si
(
Xi2
0 1
qi pi
)
, i = 1, n,
X = X1 + X2 + + Xn = ni=1 Xi .
Deci
n
n
E (X) =
i=1 pi ,
i=1 E (Xi ) =
n
n
2
D2 (X) =
i=1 pi qi ,
i=1 D (Xi ) =
deoarece v.a. Xi sunt independente.
2. Repartitia Bernoulli
Consideram repartitia Poisson n cazul particular Ui = U si deci pi = p, qi = q. V.a.
X este deci data de
)
(
0
1
2
n
.
X:
Cn0 p0 q n Cn1 p1 q n1 Cn2 p2 q n2 Cnk pk q nk Cnn pn q 0
22
Avem ca
E (X) = np,
D2 (X) = npq.
De fapt, v.a. binomiala descrie o experienta n care un eveniment A se repeta independent
de n ori si intereseaza de cate ori s-a realizat n decursul celor n repetari. Fie X numarul
de realizari ale evenimentului A n cele n efectuari. Deci X va lua valorile 1, 2, 3, ..., n cu
P (X = k) = Cnk pk q nk . In gurile de mai jos putem vedea gracul tabloului de repartitie
al v.a. binomiale pentru n = 24 si p = 0.2 respectiv p = 0.5
3. Repartitia hipergeometric
a
5.6
Daca {Ai }iN constituie un sistem numarabil de evenimente care formeaza domeniul de
denitie al unei v.a. cu P (An ) = pn , n N atunci
(
)
x1 x2 xn
X:
p1 p2 pn
iar Ai = { : X () = xi }. Trebuie evident sa avem ca
pi 0, i N ,
i=1 pi = 1.
Operatiile cu variabile cu un numar innit de valori se denesc ca si n cazul v.a. discrete
cu un numar nit de valori.
5.7
1. Repartitia Poisson
Spunem ca X este o v.a. repartizata Poisson de parametru R+ , daca are tabloul
(
)
0
1
2
X:
.
2
k
e 1! e 2! e k! e
k
k
k
Evident pk = P (X = k) = k! e > 0 si
= e
e =
k=0 k! e
k=0 pk =
k=0 k! = e
1.
Calculam mediile
k
k1
k
k
p
=
k
e
=
e
E X2 =
k
k=0
k=0
k=1
k!
(k 1)!
k
k
k
= e
=e
+e
k=1 (k 1 + 1)
k=1 (k 1)
k=1
(k 1)!
(k 1)!
(k 1)!
k1
k2
+ e
= 2 e e + e e = 2 + ,
= 2 e
k=1
k=2
(k 2)!
(k 1)!
23
deci
( )
D2 (X) = E X 2 (E (X))2 = .
3. Repartitia binomial
a cu exponent negativ
5.8
24
(9)
6.1
Functia de repartitie
Denitia 75 Functia
F : R [0, 1] ,
definit
a prin
F (x) = P ({ : X () x}) = P (X x)
se numeste functie de repartitie.
Determinarea pentru orice x a probabilitatii cu care X ia valori mai mici ca x nseamna
denirea functiei de repartitie.
Functia de repartitie F este mai importanta pentru o v.a. continua, deoarece ea suplineste tabloul de repartitie al unei v.a. discrete.
Propozitia 76 Au loc urmatoarele propriet
ati:
1.
P (X = x) = F (x) F (x 0) .
2.
P (X < x) = F (x) P (X = x)
(evident din {X x} = {X < x} {X = x}).
25
3.
P (X > x) = 1 F (x)
(evident din {X x} {X > x} = ).
4. Dac
a x1 < x2 , atunci
P (x1 < X x2 ) = F (x2 ) F (x1 ) .
5. Functia F este continua daca si numai daca P (X = x) = 0.
6. Dac
a F este continua atunci, pentru x1 < x2 ,
P (x1 X x2 ) = P (x1 X < x2 ) = P (x1 < X x2 ) = P (x1 < X < x2 ) .
7. Functia F este monoton crescatoare.
def
8. Functia F este continua la dreapta, adica F (x) = F (x + 0) = yx
lim F (y).
y>x
9. F () = 1 si F () = 0.
Remarca 77 Daca X este o v.a. continu
a atunci F este functie continu
a si deci graficul
acestei functii este o curba plana continu
a (spre deosebire de v.a. discret
a cand F este o
functie discontinua, n scara).
6.2
P (a < X b) =
f (t) dt.
a
f (t) dt.
def x
=
pi (x xi ) , unde pi = P (X = xi ) ,
i=1
ex
a
, x R.
+ ex
a) Sa se determine a astfel nc
at f s
a fie o densitate de repartitie a unei variabile
aleatoare X.
b) Sa se calculeze P (X < 1, Y < 1) si P (X < 1, Y 1), unde X, Y sunt doua observatii
independente.
6.3
6.4
27
7
7.1
Elemente de statistic
a. Variabile de selectie (empirice)
Fundamentele teoriei selectiei
O multime de elemente ce poseda o trasatura comuna, si care se cerceteaza n statistica, poarta numele de populatie statistic
a (colectivitate statistica). Elementele care
alcatuiesc populatia statistica se numesc indivizi sau unit
ati statistice. Numarul de
indivizi care alcatuiesc populatia statistica determina volumul populatiei.
Caracteristica este o anumita proprietate urmarita la indivizii unei colectivitati statistice. Exista caracteristici cantitative (cele care se pot masura, ca varsta, greutatea, etc.)
si caracteristici calitative.
Se numeste selectie (esantion, sondaj) o colectivitate partiala de elemente extrase
la ntamplare. Notam aceste elemente ale colectivitatii partiale cu xi , i = 1, N , iar N este
volumul selectiei (numarul indivizilor din selectie).
Selectia spunem ca este repetata (cu ntoarcere) daca individul extras este reintrodus
n colectivitate nainte de a se extrage urmatorul; n caz contrar, selectia este nerepetata
(fara ntoarcere). Daca volumul selectiei este foarte mic n raport cu volumul populatiei
atunci nu se mai face distinctia ntre cele doua tipuri de selectie (aceasta se va considera
repetata).
Se numeste serie statistic
a, asociata unei selectii de volum N , un tablou de forma
(
X:
x1 x2
n1 n2
xk
nk
)
, cu
ni = N,
i=1
X :
x1 x2
f1 f2
xk
fk
)
, cu
fi = 1,
(12)
i=1
unde fi = nNi reprezinta frecventele relative, corespunzatoare valorii xi , ale variabilei empirice X , adica
fi = P (X = xi ) , i = 1, N .
Daca volumul selectiei nu este prea mare si ecare valoare xi apare o singura data n timpul
selectiei, atunci variabila empirica mai poate reprezentata astfel
)
(
x1
x2 xN
,
(13)
X :
1/N 1/N 1/N
unde xi reprezinta cele N valori distincte ale caracteristicii masurate.
In cazul n care caracteristicile pot lua orice valoare dintr-un interval (marginit) de
numere reale, iar volumul selectiei este mare, se va face o grupare a acesor valori pe
28
intervale disjuncte (sau clase), de obicei egale, intervale nchise la stanga si deschise la
dreapta:
(
)
[a0 , a1 ) [a1 , a2 ) [ak1 , ak ))
.
n1
n2
nk
Variabila empirica X se va reprezenta atunci
(
)
k
c1 c2 ck
X :
, cu
fi = 1,
f1 f2 fk
(14)
i=1
nj , ni =
j=1
nj , i = 1, k ,
j=i
xj xi
xj xi
adica ni = n1 + n2 + + ni , ni = ni + ni+1 + + nk .
Se numeste frecvent
a relativ
a cumulat
a cresc
ator, respectiv descrescator, corespunzatoare valorii xi , valorile
fi =
ni
ni
, fi =
, i = 1, k .
N
N
Functia empiric
a de repartitie a v.e. X se noteaza cu Fn (x) si este denita astfel:
0
, x < x1 ,
0
, x < x1 ,
f1
, x1 x < x2 ,
i1
f1 + f2
, x2 x < x3 ,
fj , xi1 x < xi , i = 2, k , =
Fn (x) =
j=1
1
, xk x.
Daca X este data de (13) atunci
0
, x < x1 ,
i1
Fn (x) =
, xi1 x < xi , i = 2, N ,
N
1
, xN x.
Daca X este data de (14) atunci
i1
fj +
Fn (x) =
j=1
, x < a0 ,
xai1
fi
h
, ai1 x < ai , i = 2, k ,
, ak x,
7.2
Reprezentarea grac
a a variabilelor empirice
Gracul unei v.e. se numeste diagrama. Reprezentarea graca se poate face n trei moduri:
Reprezentarea n batoane. In planul xOy se trec pe axa absciselor valorile xi iar n
dreptul ecarei valori xi se ridica cate o perpendiculara de lungime egala cu valoare fi (sau
cu ni ) corespunzatoare lui xi . Mentionam ca daca unim varfurile acestor perpendiculare
prin segmente vom obtine poligonul frecventelor cumulate.
Histograma. Aceasta reprezentare se foloseste la o v.e. ale carei valori sunt grupate
sunt grupate pe clase. Pe axa absciselor se iau segmente egale cu amplitudinea claselor
(intervalelor). Pe ecare segment de acest fel, considerat ca baza, se ridica cate un dreptunghi a carui naltime este egala cu frecventa corespunzatoare (relativa sau absoluta) acelei
clase. Mentionam ca daca unim mijloacele laturilor superioare ale acestor dreptunghiuri
vom obtine poligonul frecventelor cumulate.
Poligonul frecventelor cumulate. Se masoara pe Ox valorile xi si pe Oy frecventelor
cumulate corespunzatoare valorilor xi . Unind aceste puncte rezultate vom obtine poligonul
frecventelor cumulate.
7.3
Valorile caracteristice sunt niste date numerice care reprezinta del o v.a. sau o caracteristica avuta n vedere. Cunoasterea valorilor caracteristice este utila n practica la
compararea a doua v.a. sau a doua populatii statistice pe care este denita aceeasi caracteristica, precum si la deducerea legii teoretice urmata de o v.a. sau de caracteristica
considerata.
7.3.1
x1 x2
n1 n2
xk
nk
i=1
X :
x1 x2
f1 f2
xk
fk
)
, cu
fi = 1,
i=1
c1 c2 ck
, cu
fi = 1,
X :
f1 f2 fk
i=1
unde fi =
ni
N
iar ci =
ai1 +ai
2
k
k
1
r
=
fi xri ,
ni xi =
N i=1
i=1
30
(15)
(16)
mr =
x = m1 =
respectiv
def
x =
m1
k
k
1
ni xi =
fi x i ,
N i=1
i=1
k
k
1
=
ni ci =
fi c i .
N i=1
i=1
k
k
1
ni (xi x)r =
fi (xi x)r .
N i=1
i=1
S =
k
k
1
2
=
ni (xi x) =
fi (xi x)2 .
N i=1
i=1
(17)
i=1
k
i=1
fi (xi x) =
2
fi x2i
i=1
fi x2i
2
x x + x =
2
fi xi x +
i=1
k
fi x =
i=1
fi x2i x2 = x2 x2 .
i=1
31
i=1
fi x2i
2
x
i=1
fi xi + x
i=1
fi
Marimea
S=
S2
N
S 2,
N 1
(18)
ni x2i
N i=1N N x2
N x2 N x2
(S ) =
=
=
N 1
N 1
2
ni x2i N x2
i=1
N 1
(19)
Abaterea empiric
a modicat
a este
S = (S )2 .
def
4
.
S4
(f a
r
a demonstratie) = 3 4 iar dispersia este S 2 = 2 , deci EX = S44 3 = (32 )2 3 = 0
(am notat prin E (X) media v.a. X).
Din acest motiv gracul repartitiei normale este curba cu care se compara toate repartitiile.
Daca EX > 0 4 > 3 atunci curba este mai ascutita decat curba corespunzatoare
densitatii repartitiei normale.
Daca EX < 0 4 < 3 atunci curba este mai turtita decat curba corespunzatoare
densitatii repartitiei normale.
Asimetria se masoara prin coecientul de asimetrie
2 =
3
,
S3
adica 2 = 3 . Mentionam ca S este intotdeauna pozitiv (ind radical din dispersie) iar
3 poate pozitiv sau negativ dupa cum abaterile xi x care predomina sunt pozitive,
respectiv negative. Repartitia statistica normala are 2 = 0 3 = 0.
32
Daca 2 < 0 atunci repartitia este cu asimetrie negativa (curba prezinta asimetrie spre
stanga), iar daca 2 > 0 atunci repartitia este cu asimetrie pozitiva.
Evident simetria curbei este data de raportarea la dreapta x = x. Curba repartitiei
normale X N (m, 2 ) are drept axa de simetrie dreapta x = E (X) = m (media v.a.
normale X).
Exercitiul 84 Sa presupunem ca un aparat de masurare este utilizat pentru a citi o
distant
a de 12 de ori. Datele sunt colectate in tabelul de mai jos:
(
)
0.10 0.13 0.20 0.25 0.30 0.35
2
1
4
2
1
2
Obtinem deci
X :
Amplitudinea este 0.35 0.10 = 0.25. Mediana este o valoare situata ntre a sasea si a
saptea, adica media aritmetica 0.20+0.25
= 0.225. Moda este valoarea 0.20.
2
Frecventele cumulate sunt date n tabelul.....
Media de selectie sau media aritmetica este data de
x =
fi xi = = 0.22
i=1
sau echivalent
x =
ni xi
i=1
20
Dispersia empirica (sau varianta) este data de formula
6
6
1
2
S =
ni (xi x) =
fi (xi x)2 = = 0.00643 .
12 i=1
i=1
S = S 2 0.0802.
2 def
12 2 12
S = 0.00643 = 0.0070244 .
11
11
def
S = (S )2 0.083811
Mai trebuie facut graficul poligonului frecventelor relative.
Trebuie scrisa si functia empirica de repartitie F (x) = ....(este o functie n scar
a).
Exercitiul 85 Sa presupunem ca un aparat de masurare este utilizat pentru a citi o
distant
a de 20 de ori. Datele sunt colectate in tabelul de mai jos:
22.7
22.3
25.5
23.8
25.4
24.2
24.7
24.4
22.0
24.7
23.1
23.7
33
20.5
23.5
22.0
23.8
22.5
23.1
23.8
22.6
(20)
Aceste citiri reprezinta multimea de date. O prima analiza a lor din punct de vedere
numeric poate fi facuta calculand amplitudinea. Vedem din tabel ca amplitudinea este
25.5 20.5 = 5.0.
S
a consideram n continuare datele de mai sus puse n ordine cresc
atoare.
20.5
22.6
23.7
24.4
22.0
22.7
23.8
24.7
22.0
23.1
23.8
24.7
22.3
23.1
23.8
25.4
22.5
23.5
24.2
25.5
(21)
15
fi xi = 0.05 20.5 + 0.1 22.0 + 0.05 22.3 + 0.05 22.5 + 0.05 22.6 + 0.05 22.7
i=1
+0.1 23.1 + 0.05 23.5 + 0.05 23.7 + 0.15 23.8 + 0.05 24.2 + 0.05 24.4
+0.1 24.7 + 0.05 25.4 + 0.05 25.5
= 23.415
sau echivalent
15
ni xi
20.5 + 2 22.0 + 22.3 + 22.5 + 22.6 + 22.7 + 2 23.1 + 23.5 + 23.7 + 3 23.8
20
20
24.2 + 24.4 + 2 24.7 + 25.4 + 25.5
+
20
468.3
= 23.415
=
20
x =
i=1
xi
i=1
1
ni (xi x)2 =
fi (xi x)2 .
20 i=1
i=1
15
def
S2 =
15
34
xi x
(xi x)2
1
2
1
1
1
1
2
1
1
3
1
1
2
1
1
0.05 = 1/20
0.1 = 2/20
0.05 = 1/20
0.05 = 1/20
0.205 = 1/20
0.05 = 1/20
0.1 = 2/20
0.05 = 1/20
0.05 = 1/20
0.15 = 3/20
0.05 = 1/20
0.05 = 1/20
0.1 = 2/20
0.05 = 1/20
0.05 = 1/20
2.915
1.415
1.115
0.915
0.815
0.715
0.315
0.085
0.285
0.385
0.785
0.985
1.285
1.985
2.085
8.4972
2.0022
1.2432
0.8372
0.6642
0.5112
0.0992
0.0072
0.0812
0.1482
0.6162
1.97
1.6512
3.9402
4.3472
20
1 = 20/20
xi
Frecventa abs. ni
20.5
22.0
22.3
22.5
22.6
22.7
23.1
23.5
23.7
23.8
24.2
24.4
24.7
25.4
25.5
S = S 2 = 1.4832 = 1, 2178 .
Pe de alta parte dispersia empiric
a modificat
a este numarul
(S )2 =
n
20
S 2 = 1.4832 = 1.5612 .
n1
19
def
S = (S )2 = 1.2494
toate tabele si formulele de mai sus putem lasa toate valorile xi chiar
Remarca 86 In
daca se repeta (deci n = 20 n acest caz). Atunci frecventa relativ
a a fiec
arei valori va fi
aceeasi fi = 1/20 = 0.05 si frecventa absoluta a fiec
arei valori va fi aceeasi ni = 1. Formula
pentru S 2 devine
n
20
1
2
2 def 1
S =
(xi x) =
(xi x)2
n i=1
20 i=1
35
iar
n
(S )2 =
i=1
n
(xi x)2
=
n1
x2i 2
xi x +
i=1
i=1
n1
i=1
i=1
=
20
n1
x2
n1
n
x2i n
x2
x2i 2n
x x + n
x2
i=1
x
x2i 2
xi + n
x2
i=1
i=1
n1
x2i 20
x2
i=1
n1
adic
a obtinem urmatoarea formul
a de calcul a dispersiei empirice modificate (vezi
si formula (19)):
n
x2i n
x2
(S )2 = i=1
.
(23)
n1
Dac
a grupam datele n clase de lungimi egale atunci lungimea clasei va fi amplitudinea
mp
artit
a la numarul claselor. Sa mp
artim datele n 5 clase. Atunci lungimea va fi de
5/5 = 1. deci vom avea intervalele
Clasa
[20.5; 21.5)
[21.5; 22.5)
[22.5; 23.5)
[23.5; 24.5)
[24.5; 25.5)
1
4
5
6
4
Frecventa relativ
a a clasei
0.05 = 1/20
0.2 = 4/20
0.25 = 5/20
0.3 = 6/20
0.25 = 4/20
1 = 20/20
(xi )2
i=1
(xi )
i=1
=
=
i=1
n
i=1
n
(xi x) + 2
2
(xi x) (
x ) +
i=1
(xi x)2 + 2 (
x )
(xi x)2 + 2 (
x )
i=1
n
(
x )2
i=1
n
(xi x) + n (
x )2
i=1
(
n
i=1
xi
)
x
+ n (
x )2
i=1
(xi x) + 2 (
x ) (n
x n
x) + n (
x ) =
2
i=1
i=1
36
(xi x)2 + n (
x )2 .
Obtinem
(xi x)2 =
i=1
(xi )2 n (
x )2 .
i=1
n
i=1
2
def
Xi
(S ) =
(xi x)2
n 2 2
= 2,
n1
i=1
n1
n
i=1
pi = 1.
E (X) =
pi xi
i=1
a de
unde pi 0, i N ,
i=1 pi = 1, atunci media v.a. X este denit
E (X) =
i=1
37
pi xi .
E (XY ) =
xi yj pij =
xi yj P (X = xi , Y = yj )
i,j
i=1,n, j=1,m
i,j
xi yj P (X = xi ) P (Y = yj ) =
i,j
xi yj pi qj =
i,j
xi pi
y j qj
,j
= E (X) E (Y ) .
Se numeste moment initial de ordin r al v.a. X, media v.a. X r . Vom nota
def
r = E (X r ) =
pi xri .
i
def
r = E (|X|r ) =
pi |xi |r .
i
(iii) m1 = [E (X 1 )]
1 1
pi x
i
def
1pi
i
=media armonica.
xi
r0
38
def
r = E [(X 1 )r ] =
pi (xi 1 )r .
i
xk+1
xk sau xk+1 sau
, daca N = 2k + 1,
xk +xk+1
2
, daca N = 2k.
39
[
]
2 = E (X 1 )2 =
(x 1 )2 f (x) dx .
( 2
)
2
2
2
D (X) = E (X 1 ) =
(x 1 ) f (x) dx =
x 2 1 x + 21 f (x) dx
R
R
D (aX) =
R
2
R
3.Dispersia sumei a doua v.a. independente este suma dispersiei variabilelor considerate
D2 (X + Y ) = D2 (X) + D2 (Y ) .
Intr-adev
ar,
(
)
D2 (X + Y ) = E (X + Y )2 (E (X + Y ))2
( )
( )
= E X 2 + 2E (XY ) + E Y 2 (EX)2 2E (X) E (Y ) (EY )2
( )
( )
= E X 2 + E Y 2 (EX)2 (EY )2 = D2 (X) + D2 (Y ) .
De obicei gradul de mprastiere a valorilor unei v.a. X se exprima nu prin dispersie ci
def
prin abaterea medie p
atratic
a notata = D (X), si denita de
= D (X) = D2 (X).
Aceasta are avantajul ca se exprima prin aceleasi unitati de masura ca si valorile v.a. X.
40
Propozitia 92 (Propriet
ati ale abaterii medii p
atratice)
1. D (c) = 0.
2. D (aX) = |a| D (X) .
Teorema 93 (Inegalitatea lui Ceb
asev) Fie X o v.a. care admite media m si disper2
sia finite. Atunci oricare ar fi > 0, are loc inegalitatea
P (|X m| < ) 1
2
, unde m = E (X) .
2
(f
ar
a demonstratie).
O forma des ntalnita n aplicatii este urmatoarea consecinta:
Corolarul 94 Fie X o v.a. care admite media m si dispersia 2 finite. Atunci luand n
inegalitatea lui Cebasev = k, obtinem inegalitatea
P (|X m| < k) 1
41
1
, k > 0.
k2
8
8.1
8.1.1
Distributii clasice
Distributii clasice discrete
Distributia binomial
a B (n, p) (schema bilei revenite)
k=0
n
k=0
Propozitia 99 Media
si dispersia v.a. binomiale X sunt date de
E (X) = np, 2 = D2 (X) = npq.
Demonstratie. Intr-adevar,
E (X) =
n
k=0
= np
k P (X = k) =
n
k=1
n
k=0
k Cnk pk q nk =
n
k=0
n!
pk q nk
k! (n k)!
(n 1)!
pk1 q nk = np (p + q)n1 = np,
(k 1)! (n k)!
iar
n
( )
E X2 =
k=0
=
=
=
=
=
Deci
k 2 P (X = k) =
n
k=0
k 2 Cnk pk q nk =
n
k=0
n!
pk q nk
(k 1)! (n k)!
n!
pk q nk
k=1
(k 1)! (n k)!
n
n
n!
n!
pk q nk +
pk q nk
k=2 (k 2)! (n k)!
k=1 (k 1)! (n k)!
n
n
(n 2)!
(n 1)!
n (n 1) p2
pk2 q nk + np
pk1 q nk
k=2 (k 2)! (n k)!
k=1 (k 1)! (n k)!
n (n 1) p2 (p + q)n2 + np (p + q)n1 = n (n 1) p2 + np
n2 p2 np2 + np = n2 p2 + np (1 p) = n2 p2 + npq.
(k 1 + 1)
( )
2 = E X 2 (E (X))2 = n2 p2 + npq n2 p2 = npq.
1
unde f (x) = 2
e 22 este densitatea de repartitie a v.a. continue repartizate normal
de medie m si dispersie 2 .
Remarca 102 1) Calculand valorile P (X = k) = Cnk pk q nk pentru diferite valori ale lui
p si q = 1 p se constata ca ele sunt distribuite asimetric, cu exceptia cazului cand
p = q = 0.5. Asimetria este cu atat mai pronuntat
a cu cat p este mai mic.
2) Daca n creste, aimetria devine din ce n ce mai putin pronuntat
a astfel nc
at pentru
p = 0.1 si n 100 se ajunge la o distributie simetrica (confirm
and astfel teorema MoivreLaplace).
43
8.1.2
Distributia Poisson
ak xk =
n
k=0
x=1
(pk x + qk ) =
n
k=0
ak =
n
k=0
(pk + qk ) = 1.
a care const
a din
Remarca 103 Semnificatia schemei este urmatoarea: fie E o experient
n experiente independente E1 , . . . , En si A1 , . . . , An evenimente legate de fiecare experienta
n parte. Fie pi = P (Ai ), qi = 1 pi . Atunci X reprezint
a v.a. care ia ca valori numarul
de realiz
ari ale evenimentului Ai cand are loc experienta E.
Propozitia 104 Media
si dispersia v.a. distribuite Poisson X sunt date de
n
n
E (X) =
pk , 2 = D2 (X) =
p k qk .
k=0
8.1.3
k=0
Distributia hipergeometric
a (schema bilei nerevenite)
Cak Cbnk
P (X = k) = ck =
.
n
Ca+b
44
8.1.4
k e
P (X = k) = ak =
.
k!
k e
k
= e
= e e = 1
k=0
k=0
k=0 k!
k!
xk
(am folosit dezvoltarea n serie de puteri a exponentialei: ex =
k=0 k! = 1 +
n
+ xn! + ).
ak =
x
1!
x2
2!
p=/n0
k e
.
k!
Remarca 109 Mai concret, putem preciza ca, pentru n 30 si = np < 5 avem ca
B (n, p) P () .
Propozitia 110 Daca avem doua v.a. independente X, Y repartizate Poisson de parametrii si (vom scrie X P () si Y P ()), atunci suma X + Y este o v.a. repartizate
Poisson de parametru + , adica X + Y P ( + ).
Remarca 111 Distributia Poisson se aplica atunci cand p este mic (p 0), adica n
cazul evenimentelor care se ntampl
a rar. De aceea ea mai poart
a numele de legea evenimentelor rare. Distributia Poisson se aplica deci cand avem un numar mare de obiecte
ce sunt repartizate uniform pe un domeniu mare.
8.2
8.2.1
O v.a. X spunem ca urmeaza distributia uniforma pe intervalul [a, b] daca are densitatea
de repartitie data de
{ 1
, daca a x b,
ba
f (x) =
0 , n rest.
45
Intr-adevar,
+
f (x) dx =
f (x) dx =
a
1
1
dx =
ba
ba
dx =
a
1
x|x=b = 1.
b a x=a
Pentru x a obtinem ca
F (x) =
f (t) dt = 0.
F (x) =
f (t) dt =
f (t) dt +
F (x) =
f (t) dt =
f (t) dt = 0 +
a
f (t) dt +
f (t) dt +
a
1
1
dt =
(x a) .
ba
ba
f (t) dt = 0 +
b
1
dt + 0
ba
1
=
(b a) = 1.
ba
Deci
F (x) =
, daca x a,
xa
ba
, daca a < x b,
, daca x > b.
E (X) =
xf (x) dx,
R
deci
E (X) =
a
1
1
x
dx =
ba
ba
x=b
b2 a 2
1 x2
a+b
=
xdx =
=
.
b a 2 x=a 2 (b a)
2
46
Pe de alta parte
deci
E X
) def
E X =
x2 f (x) dx,
R
x=b
1
1 x3
b3 a 3
a2 + ab + b2
dx =
=
=
x
ba
b a 3 x=a 3 (b a)
3
2
=
a
si
a2 + ab + b2
D (X) =
a+b
2
)2
iar
(
)
(
)
P X > x1/2 = 1 F x1/2
(
)
(
)
P X x1/2 = P X > x1/2 = 1/2,
adic
a x1/2 mparte volumul valorilor lui X n doua parti egale.
Valoarea x1/4 este cuantila inferioar
a iar x3/4 este cuantila superioar
a a repartitiei.
Remarca 114 V.a. X ale carei valori sunt erorile de rotunjire pan
a la cel mai apropiat
ntreg (obtinute atunci cand se masoar
a o anumita caracteristic
a) urmeaz
a o distributie
uniform
a.
8.2.2
Distributia normal
a N (m, 2 )
Intr-adevar,
f (x) dx =
(xm)2
1
e 22 dx
2
xm
= x x = 2x + m dx = 2 dx
2
47
deci
1
f (x) dx =
2
x2
1
1
2
ex dx =
2 dx =
= 1,
et dt =
2
Integrala Gauss:
(ca o consecinta)
et dt =
Integrala Euler-Poisson:
t2
dt =
t2
e 2 dt.
Remarca 115 1) Graficul densitatii de probabilitate f este cunoscut sub numele de clopotul lui Gauss si este simetric fat
a de dreapta x = m.
2) Parametrul 2 da gradul de turtire al graficului densitatii de probabilitate f (sau
gradul de mprastiere al valorilor lui X fat
a de valoarea medie m)
(
)
1
Intr-adev
ar, derivata
2
(xm)2
xm
xm
1
1 (xm)
2 2
(x m) =
f (x) =
e 22 ()
=
e
f (x) .
2
3
2
2
2
f (x) =
e 22 + (x m) e 22 ()
2
2 3
2
1 (xm)
2 (x m)2
2 (x m)2
=
e 22
=
f (x) .
2
4
2 3
t2
e 2 dt , x R
Remarca 119 Pentru valorile lui s-au ntocmit tabele. Evident (x) = (x), adica
este impara, ceea ce nseamna ca tabelele sunt date doar valorile lui cu argumente
pozitive.
Propozitia 120 Avem ca
1
lim (x) = .
x
2
Intr-adev
ar
1
lim (x) =
x
2
t2
e
0
1
dt =
e
0
t2
1
1
= .
dt =
2
2
atur
a ntre F
si functia
Propozitia 121 Fie X N (m, 2 ). Are loc urmatoarea leg
lui Laplace :
(
)
xm
1
F (x) = +
.
(24)
2
Demonstratie. Intr-adevar,
F (x) =
f (t) dt =
(tm)2
1
e 22 dt.
2
deci
0
xm
2
2
t2
1
1
t2
e
e dt =
e dt +
e 2 dt
2
2 0
(
)
xm
2
1
1
xm
t2
= vezi int. Euler-Poisson =
+
e dt = +
.
2
2 2
2 0
1
F (x) =
2
xm
t2
1
dt =
2
xm
49
t2
)
( am )
(
,
(ii) P (a < X b) = F (b) F (a) = bm
(iii) P (|X m| ) = P ( X m ) = P (m X m + )
( )
( )
( )
= F (m + ) F (m ) = = 2 ,
(iv) P (|X m| k) = 2 (k)
Remarca 123 Deoarece (0) = 0 obtinem ca
1
1
+ (0) = ,
2
2
(
)
deci m( = x1/2 este
mediana
repartit
iei,
adic
a
P
X
x
= F (m) iar P (X > m) =
1/2
)
1 P X x1/2 = 1/2.
F (m) =
Propozitia 124 Fie X N (m, 2 ). Atunci, folosind punctul (iv) din propozitia anterioar
a precum si valoarea din tabel
(3) 0.49865
obtinem ca
P (|X m| > 3) = 1 P (|X m| 3) = 1 2 (3) = 1 0.9973 = 0.0027.
Prin urmare, avand n vedere ca valoarea 0.0027 poate fi neglijat
a, putem spune ca o
2
v.a. repartizat
a normal X N (m, ) ia valori semnificative n intervalul
(m 3, m + 3) (regula celor 3).
Propozitia 125 Fie X N (0, 1). Atunci, folosind punctul (iii) din propozitia anterioara
obtinem ca aria regiunii cuprinsa ntre x = a si x = a este
a
a
A=
f (t) dt = 2
f (t) dt = 2 (a) ,
a
deci
A = P (|X| a) = 2 (a) .
Propozitia 126 Fie X N (0, 1). Atunci, folosind punctul (iii) din propozitia anterioara
obtinem ca aria regiunii cuprinsa ntre x = si x = a si x = a si x = este
a
a
A=
f (t) dt +
f (t) dt =
f (t) dt
f (t) dt = 1 2 (a) ,
deci
A = P (|X| a) = 1 2 (a) .
50
Propozitia 127 Fie X N (0, 1). Atunci, evident, aria regiunii cuprinsa ntre x = a si
x = b este
b
A=
f (t) dt = P (a X b) = F (b) F (a) = (b) (a) .
a
def
X m
N (0, 1).
Demonstratie. Avem ca
(
FY (y) = P (Y y) = P
X m
y
)
= P (X y + m) = FX (y + m) .
Deci
fY (y) = (FY (y)) = (FX (y + m)) = FX (y + m) (y + m)
1
= fX (y + m) = 2
e
(y)2
2 2
y
1 e 2
2
51
Problema erorilor. Erori accidentale (aleatoare) Fie a o marime zica si {ai }i=1,n
def
8.2.3
x
n
1
( n ) x 2 1 e 22 , x 0, n N, > 0,
2 n 2
(25)
n
2
() =
x1 ex dx, > 0.
Intr-adevar,
+
f (x) dx =
x
n
1
1
( n ) x 2 1 e 22 dx = n
( )
n
n
n
22 2
2 2 n2
x 2 1 e 22 dx.
n
+
+
( 2 ) n2 1 n 1 x ( 2 )
n
1
1
1 x
2
2
(n)
(n)
f (x) dx =
x
2
x
e
2
dx
=
e dx
n
2 0
2 2 n 2 0
( )
1
( n ) n2 = 1.
=
2
1
1
, x > 0,
1n/2
C x
ex/2
x0+
1 n/22 x/2 n 2 x
x
e
< 0, x > 0 > n 2
C
2
1 1
, x 0,
2 ex/2
deoarece C = 2 (1) = 2.
Au loc limitele
lim f (x) = + , lim f (x) = 0.
x0+
1 x/2 1
e
< 0, x > 0
2
2
x0+
1 n/22 x/2 n 2 x
x
e
C
2
53
adic
a este distribuita 2 (hi patrat) de parametrii n si .
particular avem
In
(
)
X N 0, 2 X 2 2 (1, )
(
)
(
)
X, Y N 0, 2 X 2 + Y 2 2 (2, )
Propozitia 137 Se poate demonstra ca
( )
X 2 (n, ) aX 2 n, a
(27)
adic
a este distribuita 2 (hi patrat) de parametrii n si .
Propozitia 138 Se poate demonstra ca daca
X 2 (n, ) si Y 2 (m, ) (X + Y ) 2 (n + m, ) .
54
(28)
Xi
def
Propozitia 139 Fie acum v.a. Xi N (m, 2 ) si X
= i=1
. Atunci
n
n (
)
2 2 (n 1, ) .
Xi X
i=1
(
)
(
)
(
)
N m, 2 /n X
m N 0, 2 /n .
X
m 2
(Xi m) 2 X m
Xi nm + n X
=
i=1
i=1
n
(
)2
(
)
2
m +n X
m 2
(Xi m) 2n X
=
i=1
8.2.4
i=1
O v.a. X spunem ca urmeaza distributia Student t (n) de parametru n daca are densitatea
de repartitie data de
adic
a T este distribuita Student de parametru a.
55
8.2.5
T =
8.2.6
X
a
Y
b
F (a, b) ,
@@@@@@@@@@@@
56
26.7
Media (notata m) si dispersia (notata 2 ) acestei populatii sunt 26.1 respectiv 17.5.
Alegand la ntamplare 10 valori din tabelul de mai sus putem obtine o estimare a mediei si dispersiei (adica media si dispersia empirica, notate x si S 2 ). Evident aceste valori
vor estimatori ale valorilor teoretice m si 2 (nu vor coincide cu acestea). De asemenea, prin selectarea altor 10 valori vom obtine alta medie si dispersie x, S 2 . Daca volumul
selectiei creste atunci este de asteptat ca x, S 2 sa se apropie de valorile teoretice m si 2 (cu
cat volumul se apropie mai mult de 100, cu atat x si S 2 se apropie mai mult de m = 26.1 si
2 = 17.5). In tabelul de mai jos putem vedea acest lucru (s-au luat la ntamplare selectii
de volum 10, 20, etc. iar aceste selectii de diverse volume nu mai sunt mentionate):
No.
10
20
30
40
50
60
70
80
90
100
x
26.9
25.9
25.9
26.5
26.6
26.4
26.3
26.3
26.2
26.1
S2
28.1
21.9
20.0
18.6
20.0
17.6
17.1
18.4
17.8
17.5
n
i
Avand n vedere ca x si S 2 sunt calculate plecand de la niste v.a. (deoarece x = i=1
n
iar xi sunt alese aleator), obtinem ca x si S 2 sunt si ele, la randul lor, niste v.a. Deci chiar
daca volumul n este mentinut constant pot exista variatii ale mediei si dispersiei empirice.
Pentru aceasta vezi tabelul de mai jos
Primul
Al doilea
Al treilea
Al patrulea
36.0 25.6
30.0 27.1
26.5 29.9
26.5 30.6
19.6 27.9
28.5 25.5
x = 26.9
x = 27.9
x = 26.9
x = 27.2
Fluctuatiile care se vad n tabelul de mai sus ridica urmatoarea problema: n ce masura
valorile x si S 2 estimeaza corect valorile reale ale mediei si dispersiei? Remarcam ca n
57
S2
S2
S2
S2
primul si al treilea set media este mai apropiata de 26.1 dar dispersia este mare. In setul
al doilea dipsersia este mai mica dar n schimb media de 27.9 este destul de departe de
valoarea 26.1. Evident sunt de preferat datele obtinute n urma unei selectii de volum cat
mai mare posibil.
Important n acest sens vor estimatorii (vezi si Denitia (29)), adica functii care sa
depinda de ecare selectie n parte. In cadrul teoriei estimatiei foarte importante vor
trei distributii/repartitii: distributia hi patrat de parametrii n si (notata 2 (n, )),
distributia Student de parametru n (notata t (n)), si distributia Fisher-Snedecor de parametrii a si b (notata F (a, b)). Pentru acestea (denitii si legaturi) vezi Sectiunile 8.2.3,
8.2.4 si 8.2.5.
In general vorbind, e P o populatie si statistica si X o caracteristica cantitativa relativa la P. In cele mai multe cazuri repartitia teoretica a lui X nu este cunoscuta. Scopul
statisticii este acela de a determina pe baza experientelor cu elemente din P (selectiilor
din P) a legii de repartitie a lui X precum si a anumitor caracteristici ale lui X (media si dispersia, de exemplu). Acest lucru este posibil aplicand metoda selectiei sau a
esantioanelor.
Daca numarul de elemente al multimii P este notat N , atunci n urma a n experiente
obtinem rezultatele x1 , . . . , xn , unde n este mult mai mic decat N reprezinta volumul
selectiei.
O selectie poate repetata (cu ntoarcere) sau fara ntoarcere (adica daca elementul
cercetat se pune la loc n populatie sau nu).
Pentru a reecta del proprietatile ntregii populatii, o selectie trebuie sa ndeplineasca
urmatoarele conditii: P sa e cat mai omogena; n sa e cat mai mare; unitatile selectiei
sa e extrase la ntamplare; ecare unitate din P sa aiba aceasi probabilitate (sansa) de a
face parte din selectie.
Tipuri de variabile pe o populatie P : v.a. teoretica X, necercetata direct, care se refera
la P n totalitate; v.a. empirica (de selectie) X , ce ia valorile x1 , . . . , xn , adica
(
)
x1 x2 xn
X =
.
1/n 1/n 1/n
Valorile x1 , . . . , xn se pot considera ca valori pe care le iau n v.a. independente X1 , . . . , Xn ,
ce au aceeasi repartitie si anume repartitia lui X.
Atunci valorile x1 , . . . , xn , observate n urma selectiei, constitue valoarea observata a
v.a. n-dimensionale (X1 , . . . , Xn ). Repetand selectia vom obtine diferite valori ale variabilei n-dimensionale (X1 , . . . , Xn ).
a empirica obtinut
a pe baza selectiei este valoarea unei
Remarca 142 Fiecare carateristic
anumite v.a. teoretice, valoare care variaza odat
a cu selectia.
def x1 ++xn
n
def
De exemplu media de selectie x =
reprezint
a valoarea v.a. X
= X1 ++X
, si de
n
n
aceea putem vorbi de x ca de o v.a.
De asemenea dispersia empirica
1
(xi x)2
n i=1
n
def
S2 =
1
n
n (
Xi X
)2
i=1
58
9.1
Problema estimatiei
(29)
n diferite sensuri.
Denitia 144 n se numeste estimator consistent pentru dac
a
lim P (|n | ) = 1, > 0.
lim D2 (n ) = 0.
E (n )
Denitia 147 Daca = 0 spunem ca estimatorul este deplasat. Estimatorul corect este
un estimator deplasat.
Denitia 148 n se numeste estimator absolut corect pentru daca
E (n ) = si
lim D2 (n ) = 0.
E (n ) =
D2
(n )
1
[
]2
n E [ln (f (x, ))]
eficienta estimatorului n . Daca eficienta estimatorului n este E (n ) = 1 atunci estimatorul nedeplasat n este eficient (adica D2 (n ) este minim).
59
Remarca 151 Din inegalitatea lui Cebasev se deduce imediat ca un estimator absolut
corect este un estimator consistent.
Se cunosc doua cai de estimare: estimari punctuale si estimari prin intervale de ncredere.
9.1.1
Estim
ari punctuale ale valorilor caracteristice teoretice
Atunci
( )
=
E X
E (Xi )
nE (X)
=
= m,
n
n n 2
( )
nD2 (X)
2
i=1 D (Xi )
=
D2 X
=
=
0, pentru n .
n2
n2
n
2) Fie
i=1
)
1 (
2 = X2 X
2 = 1
2.
S =
Xi X
Xi2 X
n i=1
n i=1
n
2 def
( )
D2 S 2 0, pentru n .
E S2 =
E Xi E X
D (Xi ) + [E (Xi )]2 D2 X
n i=1
n i=1
[ 2
]
n
]
1 [ 2
2
2
+m
=
+m
n i=1
n
[ 2
]
[ 2
]
n1 2
2
2
2
= +m
+ m = 2
=
=
n
n
n
n1 2
D (X) .
=
n
60
(S )2 =
Astfel
[
]
E (S )2 =
n
S 2.
n1
( )
n
n n1 2
E S2 =
= 2,
n1
n1 n
Estim
ari punctuale ale parametrilor unei repartitii teoretice
Presupunem ca repartitia teoretica este cunoscuta (din cunoasterea n ansamblu a fenomenului studiat sau n urma unei ipoteze sugerata de grace). Pentru ca repartitia teoretica sa
e complet determinata este necesar sa cunoastem si valorile parametrilor de care depinde
(de exemplu media m si dispersia 2 din repartitia normala). Pentru estimarea acestor
parametri avem la dispozitie doua metode.
Metoda verosimilit
atii maxime Fie f (x, 1 , . . . , k ) functia de frecventa (n cazul v.a.
discrete) sau densitatea de probabilitate (n cazul v.a. continue) si x1 , . . . , xn observatiile
n urma selectiei de volum n.
Denitia 153 Functia
def
V (1 , . . . , k ) =
n
i=1
f (xi , 1 , . . . , k ) ,
[ln V (1 , . . . , k )] = 0, i = 1, k .
i
(
)
3. pentru solutia 01 , . . . , 0k gasit
a mai sus verificam conditia suficienta de extrem
[
(
)]
d2 ln V 01 , . . . , 0k < 0.
Remarca 156 Cand avem mai multe puncte de maxim se ia cel mai mare dintre maxime.
Remarca 157 Se poate demonstra ca, n conditii destul de generale, estimatorii i sunt
consistenti pentru i , i = 1, k.
Exercitiul 158 f (x) = ex , n = 5 , xi = 6.5, 6.9, ....
61
Estim
ari prin intervale de ncredere ale valorilor caracteristice teoretice
m
)
X
n(
def X E X
( ) =
X
m
Y =
=
D X
n
va atunci repartizata normal standard Y N (0, 1).
N (m, 2 /n).
Stim ca X
Pentru a determina intervalul de ncredere pentru m punem conditia
)
(
X m
P (|Y | < t) = P < t =
/ n
62
(30)
Xm
m <
|Y | < t / n < t X
m<
n t < X
t
n
t
n
(31)
Din gracul repartitiei normale standard se poate gasi interpretarea lui t . Astfel
t
(xm)2
1
P (|Y | < t ) =
e 22 dx = .
2
t
acest caz m = E (a) = a si a
Remarca 161 Fie a valoarea exacta a unei marimi. In
a
t < a < a
+ t
n
n
deoarece
a
a
N (0, 1) .
obtinem
|
a a| < t
n
( )2
t n t n
t ,
adica n este primul numar natural care verica inegalitatea de mai sus.
Remarc
) a reprezinta si jumatate din lungimea intervalului de
(am ca eroarea absolut
+ n t .
ncredere a
n t , a
Exemplul 162 Care este numarul de masur
atori necesare pentru a obtine un interval de
n credere de 95% cu o eroare absoluta de 2, stiind ca dispersia empirica modificat
a a fost
obtinut
a si este de 2.6 ?
cazul v.a. normale se stie ca (vezi aplicatiile din Capitolul 8.2.2) valoarea E95 =
In
1.960 (adica acea cantitate pentru care P (|X| < E ) = , unde X N (0, 2 )).
63
)2
t
2.6
1.960
2
)2
= 6.49.
Prin urmare vom lua n = 8 (vom lua de fapt un numar par de masur
atori, iar primul
num
ar par care verifica inegalitatea de mai sus este 8).
Remarca 163 Cazul cand volumul selectiei n > 30, X repartitie oarecare si cunoscut.
Conform teoremei lui Liapunov avem ca
( )
E X
)
X
n(
( ) =
Y =
X m N (0, 1) .
D X
acest caz intervalul de ncredere este dat de relatia (31).
In
Remarca 164 Cazul cand volumul selectiei n > 30, X repartitie oarecare si necunoscut.
Avem ca
2 (S )2
unde
(S )2 =
t
n
n
S 2.
n1
+
<m<X
S
t
n1
t
n
+
<m<X
S
t.
n1
(32)
(33)
adic
a este distribuita 2 (hi patrat) de parametrii n si .
precum si Propozitia 140 (legatura dintre distributia normala, distributia 2 si distributia
Student):
Propozitia 167 Daca X N (0, 2 ), Y 2 (a, ), atunci distributia
def X
T = S (a) ,
Y
a
adic
a T este distribuita Student de parametru a.
64
(
)
)
(
(
)
2
(
)
(
)2
2
2
m N 0,
m 1,
X N m,
X
X
.
n
n
n
2
2
X m 1,
n X m 1, n
= 2 (1, ) .
n
n
(34)
(35)
Pe de alta parte
(
)
m N
X
(
)
)
(
)
(
2
m N 0, 2 .
0,
n X
n
)
n X m
n(
Y = X m =
t (n 1)
S
nS 2
(36)
n1
P X m < t = P (|Y | < t) =
S
iar acum (spre deosebire de cazurile precedente n care Y N (0, 1)) valoarea
t se va citi din tabelul distributiei Student de parametru n 1 (avand n vedere
c
a acum Y t (n 1)).
Acum, similar, intervalul de ncredere pentru medie este dat de
S
S
+
X
t/2 < m < X
t/2 ,
n
n
unde valoarea t/2 este citita din tabelul distributiei Student de parametru n 1.
65
(37)
nS 2
.
2
)
(
nS 2
2
2
P 1 < 2 < 2 =
(38)
2
2
care va reprezenta o ecuatie cu doua necunoscute.
Cantitatea 21 se va determina din relatia
)
( 2
nS
1
2
> 1 = q1 = 1 = 1
P
2
2
2
iar
cantitatea 22 se va determina din relatia
)
( 2
nS
1
2
>
=
q
=
=
.
P
2
2
2
2
2
21
nS 2
1
2
1
2
<
<
<
2
2
2
2
nS 2
21
<
22
21
sau
(n 1) (S )2
(n 1) (S )2
2
<
<
,
22
21
66
(39)
n
deoarece (S )2 = n1
S 2.
Pentru abaterea medie p
atratic
a , intervalul de ncredere este dat de
S n
S n
<<
(40)
2
1
S n 1
S n 1
<<
.
2
1
sau
2 (n 1, 1) N n 1, 2 (n 1) .
Atunci
vom putea folosi
(
) functia lui Laplace si deducem, avand n vedere ca
N n 1, 2 (n 1)
nS 2
2
)
(
)
(
(
)
2
2
2
nS
(n
1)
(n
1)
1
2
.
= P 21 < 2 < 22 =
2 (n 1)
2 (n 1)
(
deci
X=
(n1 1) (S1 )2
(n2 1) (S2 )2
2
(n
1,
1)
s
i
Y
=
2 (n2 1, 1) .
1
21
22
X
def n1 1
= Y
n2 1
T =
adic
a fractia
X/a
F (a, b) ,
Y /b
X/a
este distribuita Fisher-Snedecor de parametrii a si b.
Y /b
In cazul nostru,
2
T =
deci
X
n1 1
Y
n2 1
X
n1 1
Y
n2 1
(n1 1)(S1 )
(S1 )
(n1 1) 21
21
(n2 1) 22
22
(S1 )2 22
=
2 =
2 =
(n2 1)(S2 )
(S2 )
(S2 )2 21
(S1 )2 22
F (n1 1, n2 1) 2 2 F (n1 1, n2 1) .
(S2 ) 1
Din conditia
P (F1 < T < F2 ) =
se vor putea determina, utilizand tabelul distributiei Fisher-Snedecor F (a, b), valorile F1
si F2 .
def
Cantitatea = 1 se numeste prag de semnicatie.
Avem evident ca
(
)
(
)
(
)
(S1 )2 22
(S1 )2 22
(S1 )2 22
= P F1 < 2 2 < F 2 = P
> F1 P
> F2 ,
(S2 ) 1
(S2 )2 21
(S2 )2 21
care va reprezenta o ecuatie cu doua necunoscute.
Cantitatea F1 se va determina din relatia
(
)
2 2
(S1 ) 2
1
P
> F 1 = q1 = 1 = 1
2 2
2
2
(S2 ) 1
iar
cantitatea F2 se va determina din relatia
(
)
(S1 )2 22
1
P
>
F
=
q
=
=
.
2
2
2
2
2
2
(S2 ) 1
68
Reamintim ca din tabel se pot citi valorile ariei portiunii de grac de la F1 la , adica
P (Y > F1 ) =
f (x) dx ,
F1
(41)
1
F,b,a
De exemplu luam a = 5 si b = 15 si = 0.01. Atunci din tabel putem citi valoarea ariei
corespunzatoare distributiei F (5, 15)
F,5,15 = 4.36
precum si valoarea ariei corespunzatoare distributiei F (15, 5)
F,15,5 = 9.72.
Deci valoarea F1,5,15 este calculata folosind valoarea F,15,5 , conform formulei
F1,5,15 =
1
F,15,5
1
= 0.1029
9.72
10
69
(42)