Sunteți pe pagina 1din 44

3/5/2015

PROBABILITI

Teoria probabilitilor este o parte integrant a


statisticii n general, dar este esenial pentru teoria
inferenei statistice, care asigur decidenilor (oameni de
afaceri, economiti) un grup de metode care i ajut n
procesul de luare a deciziilor n condiii de incertitudine.
Incertitudinea provine din cauz c, n situaiile din viaa
real avem rareori informaii perfecte referitoare la
variatele input-uri ale unei decizii. Indiferent dac
incertitudinile se refer la cererea pentru produsul nostru,
la nivelul viitor al ratelor dobnzii sau la posibilitatea unei
greve de munc, teoria probabilitilor este util pentru
msurarea gradului de incertitudine pe care l presupune o
astfel de situaie.

Experiment aleator. Evenimente


Un experiment aleator este o aciune care, efectuat ori de
cte ori se dorete, n aceleai condiii, are un rezultat aleator.
Aciunea se caracterizeaz prin faptul c se cunoate ansamblul
rezultatelor posibile dar nu se poate face o predicie cert asupra
rezultatului care se va produce n momentul realizrii sale.
Exemple de experimente aleatoare i rezultatele lor posibile:
aruncarea unei monede: cap si pajur;
aruncarea unui zar: 1, 2, 3, 4, 5, 6;
aruncarea unui zar: numr par, numr impar;
solicitarea preferinei unui consumator pentru produsul A sau
produsul B: prefer produsul A, prefer produsul B, mi este
indiferent;
observarea modificrii preului la burs al aciunilor unei companii
n decurs de o sptmn: cresc, scad, nu se modific.

3/5/2015

Experiment aleator. Evenimente


Pentru a determina, naintea unui experiment, probabilitile
cu care diferite rezultate vor aprea, trebuie s tim n primul rnd ce
rezultate sunt posibile.
Mulimea rezultatelor (spaiu de selecie), notat cu S este
ansamblul rezultatelor posibile ale unui experiment aleator.
Pentru calculul probabilitilor este important s distingem
dac mulimea rezultatelor este fundamental sau nu. Un cmp de
evenimente este numit fundamental dac fiecare dintre rezultatele
sale posibile are aceleai anse de apariie ca i celelalte; exemplu:
mulimea rezultatelor posibile la aruncarea unui zar: S = {1,2,3,4,5,6}.
Orice rezultat posibil al unui experiment aleator se numete
eveniment elementar. Un astfel de eveniment trebuie clar definit,
pentru a nu putea fi descompus n dou sau mai multe rezultate.
Un eveniment este orice colecie de evenimente elementare; el
este un subansamblu al mulimii S ; exemplu: evenimentul
observarea unui numr par la aruncarea unui zar poate fi descris
alternativ ca A = {2,4,6}.

Definirea probabilitii

Cuvntul probabilitate nu are o definiie precis. Exist


trei interpretri distincte ale probabilitii care ofer trei
moduri de abordare n determinarea probabilitii cu care un
rezultat particular se va produce.
Abordarea clasic ncearc s deduc probabilitatea unui
rezultat n mod logic din natura simetric a experimentului.
Dac o moned perfect echilibrat este aruncat, de
exemplu, este logic s ne ateptm ca rezultatul cap i
rezultatul pajur s fie egal probabile; putem afirma c
probabilitatea s observm o apariie a pajurei este 1/2 . n
general, dac un experiment are n posibile rezultate,
fiecare fiind egal probabile, probabilitatea apariiei oricrui
rezultat particular este 1/n. O astfel de probabilitate o
numim teoretic (apriori), deoarece este calculat fr
efectuarea experimentului, folosind doar informaia care se
cunoate despre situaia fizic.

3/5/2015

Definirea probabilitii

Abordarea empiric presupune exprimarea probabilitii


unui rezultat ca o msur a frecvenei relative de apariie.
Presupunem c un experiment aleator este repetat de n
ori (n fiind un numr mare). Dac x reprezint numrul
de cazuri n care un rezultat particular a aprut n cele n
ncercri (probe), raportul x/n constituie o bun estimare
pentru probabilitatea cu care acest rezultat particular va
aprea. De exemplu, dac 700 dintre ultimii 1000 de clieni
care au intrat ntr-un magazin au cumprat ceva,
probablitatea ca orice client care va intra in magazin s
cumpere este de 0.7. Cu ct n este mai mare, cu att va fi
mai bun estimarea probabilitii dorite. Probabilitatea
determinat folosind rezultatele unui experiment efecuat
de un anumit numr de ori, se numete probabilitate
empiric, sau frecven relativ.

Definirea probabilitii

n multe situaii practice, rezultatele experimentale nu


sunt probabil egale i nu exist un istoric al repetrilor
experimentului; de exemplu, dac dorim s estimm
probabilitatea ca vnzrile unei firme s ating
valoarea de 1 milion de euro ntr-un an. n astfel de
cazuri apelm la o abordare subiectiv, n care
probabilitatea asociat unui rezultat particular reflect
doar gradul nostru de ncredere c acest rezultat va
aprea; altfel spus, ea reflect o evaluare personal a
situaiei i se poate baza doar pe intuiie. n multe
cazuri, totui, intuiia ori evaluarea subiectiv a unui
om de afaceri este probabil influenat de rezultatele
obinute n situaii similare; astfel, abordarea prin
intermediul frecvenei relative joac adesea un rol
important n formarea probabilitilor subiective.

3/5/2015

Definirea probabilitii

Fiecrui eveniment elementar Ei dintr-un cmp de


evenimente
fundamental
(evenimentele
au
probabiliti egale de apariie) i atam un numr
P(Ei), numit probabilitatea lui Ei , care s reprezinte
probabilitatea obinerii acestui rezultat particular; ea
se calculeaz dup formula:



=


Pentru orice cmp de evenimente S = {E1,E2,,En},
probabilitile asociate evenimentelor elementare Ei
trebuie s ndeplineasc urmtoarele cerine de baz:
1. 0 P(Ei) 1, pentru fiecare i

2.
=1

Definirea probabilitii

Probabilitatea unui eveniment A este egal cu suma probabilitilor asociate


evenimentelor elementare coninute n A:
( ) =

Exemple:
la aruncarea unui zar, probabilitatea de a obine un numr impar este :
1,3,5
3
1
(
) =
= =
1,2,3,4,5,6
6
2

Card {1,3,5} cardinalul mulimii {1,3,5}, adic numrul de elemente pe care le


conine. n acest caz Card {1,3,5} = 3

la extragerea unei cri dintr-un pachet de 52 de cri de joc, probabilitatea de a


extrage un as este:
4
1
( ) = =
52 13
la extragerea unei bile dintr-o urn care conine 200 de bile colorate, dintre care
15 sunt de culoare roie, probabilitatea de a extrage o bil roie este :
15
( ) =

200

3/5/2015

Regulile probabilitilor

Arbori de probabilitate

O metod foarte util pentru calculul


probabilitilor este arborele de probabilitate,
n care diferitele evenimente posibile ale unui
experiment sunt reprezentate prin linii sau
ramuri ale acestuia.
Exemplu: Considernd experimentul aruncrii
unei monede (rezultate posibile Cap i Pajur)
de dou ori, cmpul de evenimente asociat
este:
S = { CC, CP, PC, PP }.

3/5/2015

Arbori de probabilitate

Variabila aleatoare

n cadrul multor experimente, putem fi interesai


doar de un anumit aspect al rezultatelor acestora. S
presupunem c n cadrul experimentului anterior ne
intereseaz de cte ori apare pajura . Dac notm cu X
numrul total de apariii ale pajurei, valoarea lui X va
varia aleator de la o prob la alta a experimentului; X este
numit
variabil aleatoare, sau variabil supus
hazardului, deoarece nu i cunoatem dect valorile
posibile (spre deosebire de variabilele statistice ale cror
valori erau cunoscute dintr-o observare sau culegere
anterioar studiului). De fapt, X este o funcie care
asociaz o valoare numeric fiecrui eveniment
elementar din cmpul de evenimente :
S = { CC, CP, PC, PP }
valorile posibile ale lui X sunt 0,1 sau 2.

3/5/2015

Variabila aleatoare

S = {CC, CP, PC, PP }

Variabila aleatoare

O variabil aleatoare este o funcie care asociaz o


valoare numeric fiecrui eveniment elementar dintr-un cmp
de evenimente.
Altfel spus, considernd un experiment aleator, dac asociem
un numr real fiecrui rezultat posibil din mulimea
rezultatelor, ansamblul acestor numere, supuse hazardului,
constituie o variabil aleatoare. Mai puin formal, putem
spune c o variabil aleatoare este o variabil a crei valoare
numeric este determinat de rezultatul unui experiment
aleator.
n mod uzual, variabilele aleatoare sunt notate cu
majuscule de la sfritul alfabetului (X, Y, W,...) iar valorile
acestora cu litere mici (x,y,w,...).
n funcie de numrul de valori posibile pe care i le pot
asuma, variabilele aleatoare sunt de dou tipuri: discrete i
continue.

3/5/2015

Variabila aleatoare discret


valori.

O variabil aleatoare discret poate lua o mulime numrabil de

O variabil aleatoare este discret dac putem identifica prima


valoare, a doua valoare etc. n majoritatea situaiilor practice, o variabil
discret reprezint numrul de ori n care un atribut particular este observat.
Exemple: numrul de produse defecte dintr-un lot, numrul de apeluri
telefonice primite ntr-o anumit or la o central telefonic, numrul de
cumprtori, observai ntr-o perioad, care prefer un anumit produs.
Observaie. O mulime numrabil de valori posibile nu nseamn n
mod necesar o mulime finit.
Este posibil numrarea valorilor unei variabile aleatoare fr o limit
superioar.
Exemplu: numrul de aruncri ale unei monede pn la prima apariie a
pajurei: 1 ( dac la prima aruncare apare pajura ), 2 (dac la prima aruncare
apare capul i la a doua apare pajura) i aa mai departe. O astfel de variabil
nu are limit superioar a valorii sale, dar, fiind numrabil (putem identifica
toate valorile posibile ), ea este discret.

Variabila aleatoare discret

Un tabel, matrice, formul sau grafic ce conine


toate valorile posibile ale unei variabile aleatoare
discrete mpreun cu probabilitile asociate acestora
poart denumirea de repartiie a variabilei aleatoare
discrete (distribuiie discret de probabilitate ).
Fie X, o variabil aleatoare discret asociat unui
anumit experiment aleator. Funcia de probabilitate a
acestei variabile este funcia p, definit astfel:
p: R [0,1]
x p(x) = P( X = x ),
unde P( X = x ) este probabilitatea ca variabila X s ia
valoarea particular x n momentul realizrii
experimentului; ea este suma proabilitilor asociate
evenimentelor elementare pentru care X ia valoarea x.

3/5/2015

Variabila aleatoare discret

Variabila aleatoare discret

3/5/2015

Variabila aleatoare discret

Variabila aleatoare discret


sub form grafic

10

3/5/2015

Variabila aleatoare discret

Indiferent de modalitatea de reprezentare,


o repartiie a variabilei aleatoare discrete trebuie
s satisfac dou condiii. Dac o variabil
aleatoare X poate lua valorile xi, atunci,
urmtoarele relaii trebuie s fie adevrate:
0 p(xi) 1, pentru toate valorile xi

=
=
=1

Variabila aleatoare discret

Pe lng funcia de probabilitate simpl,


putem asocia unei variabile aleatoare discrete i
o funcie de probabilitate cumulat, numit
funcie de repartiie. Dac X este o variabil
aleatoare discret, atunci funcia sa de
repartiie este F, definit astfel:
F: R [0,1]
x F(x) = P (X x) =

11

3/5/2015

Variabila aleatoare discret


Caracteristicile numerice ale variabilei aleatoare discrete sunt
media, dispersia, abaterea standard.
Am definit media distribuiei unei variabile statistice. n cazul
probabilitilor, deoarece valorile distribuiei nu sunt dect valori
posibile, putem s ne gndim la o medie de valori n funcie de
probabilitatea lor de apariie. Aceast caracteristic o numim speran
matematic sau valoare medie sau valoare asteptat a variabilei
aleatoare.
Sperana matematic (media)
Pentru o variabil aleatoare discret X cu xi valori care apar cu
probabilitile p(xi), se definete astfel:
=

Variabila aleatoare discret

Dispersia (variana) unei variabile aleatoare


discrete X, cu xi valori posibile care apar cu
probabilitile p(xi) i a crei medie este E(X) = , o
definim astfel:
=

=
Formula de calcul simplificat este:
=

-
Abaterea tip (abaterea medie ptratic) a lui
X este:
=

12

3/5/2015

Variabila aleatoare discret

Dac X este o variabil aleatoare discret, atunci


, , Y = aX+b este tot o variabil
aleatoare discret, ai crei indicatori numerici
sunt:
media
dispersia

E(Y) = a E(X) + b
V(Y) = a2 V(X)

Variabila aleatoare discret

Momentul teoretic iniial de ordinul k


=
=

;
Momentul teoretic centrat de ordinul k
=
unde

Observaie Momentul centrat de ordinul doi este


dispersia variabilei aleatoare X, iar momentul iniial
de ordinul nti este media acesteia.

13

3/5/2015

Variabila aleatoare continu

O variabil aleatoare este continu dac ansamblul


valorilor sale posibile corespunde celor dintr-un interval dat,
finit sau infinit.
Spre deosebire de variabilele aleatoare discrete care au
un numr finit de valori posibile (de exemplu, x = 0,1,2,... ,n)
sau un numr infinit numrabil de valori (x = 0,1,2,...),
variabilele aleatoare continue au un numr infinit
nenumrabil de valori posibile i pot lua orice valoare ntr-un
interval cuprins ntre dou puncte a i b ( < < ).
n timp ce pentru o variabil aleatoare discret este
specific procesul de numrare, pentru o variabil aleatoare
continu este specific msurarea unor atribute, cum ar fi:
lungimea, greutatea, timpul, temperatura.

Variabila aleatoare continu


Putem enumera toate valorile posibile ale unei variabile
aleatoare discrete i este semnificativ considerarea probabilitii ca
aceasta s ia o valoare particular (individual).
Nu putem ns enumera toate valorile unei variabile aleatoare
continue, deoarece exist ntotdeauna o alt valoare posibil ntre
oricare dou dintre aceste valori de aceea doar intervalele sunt
semnificative pentru aceast variabil.
Probabilitatea ca o variabil aleatoare continu X s ia o
anumit valoare particular este zero.
Nu este practic posibil s asociezi o probabilitate pozitiv
fiecrei valori din mulimea infinit (nenumrabil) a acestora iar suma
acestor probabiliti s ramn egal cu 1. Pentru o astfel de variabil
are semnificaie doar probabilitatea ca valoarea luat de X s fie
cuprins ntr-un anumit interval de valori.

14

3/5/2015

Variabila aleatoare continu

Exemplu
Un experiment aleator poate fi considerat observarea
duratei convorbirilor telefonice pentru un eantion
reprezentativ de angajai ai unei companii ntr-o zi de lucru.
Dac notm cu X durata convorbirilor (msurat n minute),
deoarece angajaii au fost selectai ntmpltor (i n numr
suficient de mare), iar ansamblul valorilor posibile
corespunde unui interval de timp, atunci X este o variabil
aleatoare continu. Reprezentarea grafic a datelor astfel
culese se poate realiza printr-o histogram prin
dreptunghiuri ale crei frecvene relative pot fi reduse
proporional cu mrimea intervalului de variaie, astfel nct
suprafaa histogramei s fie egal cu 1, iar suprafaa fiecrui
dreptunghi s reprezinte proporia n care rezultatele
msurtorilor aparin acestei clase (interval).

Variabila aleatoare continu


frecvene relative

0.3

0.25

0.2

0.15

0.1

0.05

11

11

14

14

17

17 20

durata convorbirilor (minute)

15

3/5/2015

Variabila aleatoare continu

Dac realizm un numr foarte mare de


msurtori, frecvenele relative rezultate pot
aproxima distribuia frecvenelor relative pentru
ntreaga populaie a duratelor convorbirilor
telefonice, iar proporia pe care o reprezint aria
unui dreptunghi ar putea fi o bun aproximaie a
adevratei probabiliti de a obine o mrime plasat
n acest interval. Cu ct volumul eantionului de
msurtori devine mai mare iar dimensiunea
intervalelor mai mic, poligonul frecvenelor pentru
o astfel de distribuie (ajustat pentru a avea o
suprafa total egal cu 1) devine o curb.

Variabila aleatoare continu

Numim densitate de probabilitate a variabilei aleatoare X


funcia pozitiv:
: 0,
astfel nct f(x)dx s fie probabilitatea ca variabila X s ia
valori n intervalul (x, x+dx). n mod natural atunci:
=1
Definim funcia de repartiie pentru o variabil aleatoare
continu X, astfel:
: 0,1
=

<

16

3/5/2015

Variabila aleatoare continu

Densitatea de probabilitate are urmtoarele


proprieti:

0, ;

= 1 - aria total a suprafeei
cuprins ntre curba lui f(x) i axa orizontal este
egal cu 1;

=
;
<
pentru

< =
<
=1
<

( )

=1 ( )

Variabila aleatoare continu

Observaie: f(x) nu este o probabilitate:

= , deoarece probabilitatea ca X s
ia o anumit valoare specific este zero:
=
= 0.
Fiind dat o funcie a densitii probabilitii f(x),
suprafaa cuprins ntre graficul funciei i dou
valori a i b ale lui x (de pe abcis) reprezint
probabilitatea ca X s ia o valoare cuprins ntre a
i b, conform proprietilor densitii de repartiie.

17

3/5/2015

Variabila aleatoare continu

Variabila aleatoare continu

Caracteristicile numerice ale unei variabile


aleatoare continue:
media (sperana matematic):
=

dispersia:
=

abaterea medie ptratic:


=

18

3/5/2015

Variabila aleatoare continu

momentul iniial de ordinul k (k N):


=

momentul centrat de ordinul k (k N):


=

Variabila aleatoare discret. Aplicaie

19

3/5/2015

Variabila aleatoare discret. Aplicaie

Dac notm cu Y ctigul net, exprimat n euroceni,


pe care l obinem la acest joc, Y este tot o variabil
aleatoare discret pe care o putem defini astfel:
= 20 100
innd cont de proprietile mediei i dispersiei,
putem calcula cei trei indicatori ai variabilei Y, fr a descrie
funcia sa de probabilitate, astfel:

= 20
100 = 20 3.5 100 = 30
euroceni
= 20

= 400

= 1166.67

= 34.16 euroceni

Distribuii clasice de probabilitate

Cel mai utilizat tip de cercetare statistic este,


far ndoial, sondajul statistic.
Scopul su este de a cunoate numrul de uniti
statistice de un anumit tip particular din interiorul unei
populaii date.
n domeniul probabilitilor exist, n acelai
timp, o variabil aleatoare discret definit ca
numrul de rezultate de un anumit tip care este
posibil de obinut n urma realizrii unei experiene
aleatoare specifice.
Funcia de probabilitate a unei astfel de variabile
se numete legea binomial sau, n anumite cazuri,
legea lui Poisson.

20

3/5/2015

Distribuia binomial

Distribuia binomial este cea mai


important distribuie discret.
Descrierea componentelor unui context
binomial necesit definirea unei noiuni
direct corelate cu repartiia binomial,
schema lui Bernoulli (sau schema bilei
revenite a lui Bernoulli) - o experien
aleatoare al crei ansamblu de rezultate se
poate rezuma prin dou stri: succes i
eec.

Distribuia binomial

Exemple :
aruncarea unui zar cu dorina de a obine un 6; n acest
caz, schema lui Bernoulli este aruncarea zarului, succesul
const n evenimentul obinerea unui 6 iar eecul const n
evenimentul obinerea unui numr diferit de 6;
probabilitatea unui succes, notat cu p este p=1/6 iar
probabilitatea eecului, notat cu q este q = 5/6 = 1 - p;
extragerea unei bile dintr-o urn care conine 10 bile albe
i 20 de bile negre, cu dorina de a extrage o bil alb;
schema lui Bernoulli este extragerea unei bile; succesul,
definit prin evenimentul extragerea unei bile albe are
probabilitatea p=10/30=1/3 iar eecul, definit prin
evenimentul extragerea unei bile negre are probabilitatea
q = 20/30 = 2/3 = 1 - p.

21

3/5/2015

Distribuia binomial

Cea mai important caracteristic a unui


experiment aleator binomial este faptul c exist doar
dou rezultate posibile, care sunt calificate,
convenional, prin succes sau eec; exemple de
experiene aleatoare cu o astfel de dihotomie a
rezultatelor:
la aruncarea unei monede rezult cap sau pajur;
un candidat electoral este votat sau nu;
un produs fabricat este corespunztor sau rebut;
un angajat este brbat sau femeie;
la revizia contabil, o factur este corect sau
incorect.

Distribuia binomial

Experimentele binomiale implic, de obicei, mai


multe ncercri (probe) ale experimentului de baz; n
definirea unui experiment binomial, aceste ncercri trebuie
s satisfac o serie de condiii sau, altfel spus, un experiment
binomial posed urmtoarele proprieti:
experimentul const ntr-un numr fix n de ncercri;
rezultatul fiecrei ncercri poate fi clasificat n una din
cele dou categorii: succes sau eec;
probabilitatea p a succesului rmne constant pentru
fiecare ncercare;
fiecare prob a experimentului este independent de
celelalte probe ale acestuia.

22

3/5/2015

Distribuia binomial

Exemple de experimente binomiale


Aruncarea de 10 ori a unei monede i observarea
rezultatului fiecrei aruncri. Desemnarea uneia dintre cele
dou posibile rezultate ale fiecrei probe (aruncri) ca
succes este arbitrar. S presupunem c apariia capului
(banului) reprezint un succes; dac moneda este
echilibrat corect, probabilitatea succesului este p=0.5
pentru fiecare dintre cele 10 aruncri, independente ntre
ele. ntr-un astfel de experiment binomial, punctul maxim
de interes l reprezint numrul de succese (de apariii ale
capului monedei) observate n cele 10 probe. Variabila
aleatoare care nregistreaz numrul de succese observate
n cele n=10 ncercri este numit variabil aleatoare
binomial.

Distribuia binomial

Testarea a 500 de produse selectate aleator dintrun lot de produse fabricate de o firm pentru a
stabili dac au defecte (sunt rebuturi) sau nu.
Numrul de ncercri ale experimentului este n =
500; fiecare ncercare (testarea unui produs
selectat) are dou rezultate posibile: rebut sau
nonrebut. Presupunnd c rata rebuturilor este de
1% i calificnd apariia unui rebut ca succes,
probabilitatea succesului este p=0.01 i cea a
eecului q=0.99. Deoarece produsele au fost
selectate aleator pentru testare, cele 500 de
ncercri sunt independente.

23

3/5/2015

Distribuia binomial

Intervievarea unui eantion aleator de 1000 de


persoane cu privire la preferina pentru un
anumit canal de televiziune, A, n defavoarea
celorlalte. Experimentul este compus din 1000 de
ncercri; fiecare ncercare (interogarea unei
persoane selectate) are dou rezultate posibile:
repondentul prefer canalul de televiziune A sau
nu. Dac presupunem c 30% din populaie
prefer canalul A, atunci p=0.3, iar q=0.7
(ncercrile sunt independente).

Distribuia binomial

Observaii:
n fiecare dintre exemplele anterioare am fcut o
presupunere care ne-a permis s asociem o
valoare lui p;
n general, succesul este definit n mod arbitrar n
cadrul unui experiment binomial (i nu este
ntotdeauna ceea ce ne-am dori s se ntmple definim ca succes gsirea unui rebut);
variabila aleatoare care ne intereseaz ntr-un
astfel de experiment este numrul de succese.

24

3/5/2015

Distribuia binomial

Variabila aleatoare binomial indic numrul


de succese n n ncercri independente ale unui
experiment binomial; spunem c o astfel de
variabil aleatoare discret se supune unei legi de
probabilitate binomial, de parametri n si p, unde n
este numrul de probe (ncercri) iar p este
probabilitatea de succes pentru fiecare dintre
probe, i o notm cu:
X ~ B(n;p)

Distribuia binomial

Distribuia de probabilitate a acestei variabile


aleatoare, numit distribuie de probabilitate
binomial, ne d probabilitatea ca un succes s
apar de x ori n n ncercri independente.

25

3/5/2015

Distribuia binomial

Formula lui p(x) descrie corect o funcie de


probabilitate:
1. , 0,

2.

=1

Distribuia binomial

Particularitile unei distribuii binomiale


sunt prezentate n graficele urmtoare:
dac p 0, distribuia este asimetric spre
dreapta (a);
dac p 1 distribuia este asimetric spre stnga
(b);
dac p=0.5, distribuia este simetric (c);
pentru un p dat, poligonul frecvenelor ia
progresiv aspectul unei curbe, pe msur ce
valoarea lui n crete

26

3/5/2015

Distribuia binomial

Distribuia binomial

n orice lucrare de specialitate, numeroase valori


numerice ale lui p(x) sunt calculate pentru un numr
reprezentativ de valori ale lui n, p i x i prezentate n
anex.
Un mod alternativ de a prezenta o distribuie
binomial utilizeaz probabilitile cumulate care
reprezint suma probabilitilor binomiale de la x = 0
pn la x = k.
Caracteristicile numerice ale unei variabile
aleatoare binomiale X ~ B(n,p) sunt:
media
E(X)=np
dispersia
V(X)=np(1-p)

27

3/5/2015

Distribuia binomial. Aplicaie

Dintr-o urn cu 10 jetoane cu valori de la 1 la


10 euro, extragem (conform procedeului bilei
revenite al lui Bernoulli) 5 jetoane i calculm
numrul de jetoane cu valoarea de 10 euro, fiecare
fiind considerat un succes; dac notm cu X
numrul de succese obinute pe parcursul
experimentului, atunci ea este o variabil supus
unei legi binomiale, pentru care n = 5 i p = 1/10,
deci
X ~ B (5; 1/10)

Distribuia binomial. Aplicaie

28

3/5/2015

Distribuia normal

Legea normal de probabilitate, numit i legea


Gauss-Laplace este cea mai important lege de
probabilitate.
1. Modeleaz i descrie ntr-un mod folositor
numeroase variabile aleatoare pe care le ntlnim
n practic: nlimea i greutatea unui grup de
persoane, vnzrile anuale ale unei firme, notele
elevilor dintr-o clas, msurarea erorilor care apar
la realizarea unui experiment; n astfel de cazuri,
valorile observate tind s se aglomereze ntr-un
mod simetric n jurul valorii centrale, dnd natere
unei curbe n form de clopot;

Distribuia normal

2. Asigur o aproximare util pentru numeroase


alte distribuii, inclusiv distribuii discrete (de
exemplu, distribuia binomial);
3. Este distribuia fundamental a inferenei
statistice, reprezentnd distribuia posibilelor
estimri ale unui parametru al populaiei care
pot aprea n diferite eantioane - principala
raiune, de altfel, pentru care distribuia
normal este considerat cea mai important
distribuie.

29

3/5/2015

Distribuia normal

O variabil aleatoare care este normal distribuit


(sau este supus unei legi normale de probabilitate) se
numete variabil aleatoare normal.
Se noteaz cu ~
;
unde
i
reprezint valorile mediei i dispersiei acestei variabile.
Funcia sa de densitate a probabilitii este:
=
unde
=

=
,
= 3.14159 ,
= 2.71828

Distribuia normal
Se observ c variabila normal poate lua orice valoare pe axa real (de
la - la + ) iar funcia normal de densitate a probabilitii f(x):
este continu;
are valori pozitive pentru toate valorile lui x;
este simetric n raport cu = ;
posed un punct de maximum pentru
are dou puncte de inflexiune, n

= i
i n

;
=

30

3/5/2015

Distribuia normal

fiind vorba de o funcie de densitate de


probabilitate, aria suprafeei delimitat de curba
funciei i axa orizontal este egal cu 1 i, din
cauza simetriei, aria fiecrei suprafeei de o parte
si alta a axei = este egal cu 0.5;
ca n cazul oricrei alte funcii de densitate de
probabilitate, valoarea lui f(x) nu este
probabilitatea cu care X ia valoarea x, ci o
expresie a nlimii curbei la valoarea x.

Distribuia normal

Cu toate c, aparent, o distribuie normal


este complet determinat odat cu specificarea
celor doi parametri i , n realitate, exist o
ntreag familie de distribuii normale care au
aceeai form (clopotul lui Gauss) dar difer una de
cealalt prin localizarea mediei i dispersia
valorilor. n graficele urmtoare sunt reprezentate
trei distribuii normale cu aceeai dispersie dar cu
medii diferite, respectiv trei distribuii normale cu
aceeai medie i dispersii diferite.

31

3/5/2015

Distribuia normal

Distribuia normal

32

3/5/2015

Distribuia normal

Din infinitatea de distribuii normale, una dintre acestea


este utilizat ca model de referin pentru toate celelalte:
distribuia normal standard, care are media = 0 i dispersia
= 1. Standardizarea unei variabile normale se realizeaz
astfel:

=
Variabila aleatoare normal corespunztoare, cu media
zero i abaterea standard egal cu unitatea, se numete
variabil aleatoare normal standard, i este notat
Z ~ N(0,1) .
Interpretarea lui Z este foarte important: fiecare valoare
a lui Z este egal cu distana de la valoarea corespunztoare a lui
X pn la medie, msurat n numr de abateri standard ale lui
X.

Distribuia normal

Calculul probabilitilor pentru o variabil


supus unei legi normale standard se efectueaz cu
ajutorul tabelelor de distribuie a probabilitilor
variabilei Z~N(0,1), prezentate n anexa 8, a i b.
Primul tabel cuprinde valorile lui P(0 Z z).
Al doilea tabel cuprinde valorile lui P(Z z)
pentru valori ale lui z pozitiv precizate la dou
zecimale.
Valoarea lui P se gsete la intersecia liniei
corespunztoare prii ntregi i primei zecimale cu
coloana corespunztoare celei de a doua zecimale.

33

3/5/2015

Distribuia normal

n viaa real multe caracteristici cantitative continue


sunt n mod natural distribuite dup un model normal. Din
punct de vedere statstic, frecvena lor relativ este
distribuit n aceeai manier ca i densitatea de
probabilitate a unei legi normale:
nlimea persoanelor dintr-o populaie
greutatea persoanelor dintr-o populaie
coeficientul de inteligen al persoanelor dintr-o populaie
rezistena tijelor de metal n cadrul unei producii
industriale
volumul coninutului sticlelor dintr-o firm de mbuteliere
notele obinute la un examen de ctre studenii unui an
de studiu

Distribuia normal. Aplicaia 1

Presupunem c durata timpului n care studenii rezolv


un test gril este cunoscut ca fiind normal distribuit, cu o
medie de 60 de minute i o abatere standard de 8 minute. Dac
nregistrm (observm) timpul necesar pentru un anumit
student, dorim calculul urmtoarelor probaliliti:
a) probabilitatea ca un student s rezolve testul ntr-un interval
cuprins ntre 60 i 70 de minute;
b) probabilitatea ca un student s rezolve testul n mai mult de
70 de minute;
c) probabilitatea ca un student s rezolve testul ntr-un interval
cuprins ntre 50 i 70 de minute;
d) probabilitatea ce un student s rezolve testul ntr-un interval
cuprins ntre 65 i 70 de minute.
Obs. Rezolvarea acestor cerine se bazeaz pe datele din anexa 8
i proprietile distribuiei normale.

34

3/5/2015

Distribuia normal. Aplicaia 1


a)

Notm cu X timpul necesar pentru rezolvarea testului; probabilitatea pe care ne-am


propus s o aflm este: P(60 X 70) sau P(60 < X < 70), deoarece probabilitatea ca
o variabil aleatoare continu X s ia o valoare particular este zero.
Pentru a putea utiliza tabelul distribuiei normale (anexa 8) trebuie s
transformm variabila normal X din exemplul nostru n variabil normal standard Z.
60 60
60 70 60
60 < < 70
<
<
8
8
8
60 < < 70 = 0 < < 1.25 = 0.3944 = 39.44%

Distribuia normal. Aplicaia 1


b) X > 70

>

Z 1.25

n figura urmtoare sunt prezentate grafic cele dou suprafee de interes


situate sub curba normal: A1 corespunde probabilitii dorite iar A2 corespunde
probabilitii ca 0<Z<1.25; aria total fiind egal cu unitatea, datorit simetriei
curbei fa de z = 0, ntreaga suprafa din partea dreapt este egal cu 0,5:
A1+A2 = 0.5.
Valoarea din tabel corespunztoare suprafeei A2 am gsit-o anterior n anexa 8a;
ea este 0.3944; probabilitatea dorit n acest caz se poate calcula astfel:
> 1.25 =
= 0.5
= 0.5 0.3944 = 0.1056
sau direct din anexa 8b:
> 1.25 = 0.1056
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4

-3

-2

-1

35

3/5/2015

Distribuia normal. Aplicaia 1


c) 50 < X < 70

<

<

1.25 <

< 1.25

De fiecare dat cnd aria de interes include media, ea trebuie determinat ca


sum a celor dou suprafee situate de o parte i de alta a mediei.
Probabilitatea dorit este:
1.25 < < 1.25 =
+
=
= 2
= 2 0.3944 = 0.7888 = 78.88%
Obs. Valoarea lui A2 am calculat-o la punctul a i, datorit simetriei distribuiei
normale A1 =A2
0.4

0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4

-3

-2

-1

Distribuia normal. Aplicaia 1


d) 65

70

<

<

0.63 < < 1.25


Probabilitatea dorit corespunde suprafeei haurate din figur; ea se poate
determina ca diferen ntre ariile a dou suprafee ale cror probabiliti se
gsesc n anexa 8a.

0.63 < < 1.25 = 0 < < 1.25 0 < < 0.63 = 0.3944
0.2357 = 0.1587
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4

-3

-2

-1

36

3/5/2015

Distribuia normal. Aplicaia 2

Un alt exemplu al utilitii legii normale l


constituie furnizarea unui instrument de comparare
ntre valori aparinnd unor distribuii normale
diferite.
Notele obinute la un test naional de ctre
elevii unui colegiu A sunt distribuite dup o lege
normal N(7.2;0.81) iar notele obinute la acelai test
de ctre elevii unui alt colegiu B sunt normal
distribuite N(6.9;1). Considernd un elev care a
obinut nota 7.4 la colegiul A i alt elev care a obinut
nota 7.3 la colegiul B, ne propunem s determinm
care dintre cei doi elevi este mai bine clasat n raport
cu ceilali elevi din colegiul su.

Distribuia normal. Aplicaia 2

Pentru a stabili acest lucru, standardizm nota


fiecrui elev, altfel spus calculm echivalentul notei sale
ntr-o distribuie N(0;1).
Pentru elevul de la colegiul A nota sa de 7.4 ntr-o
distribuie N(7.2;0.81) devine:
. .
.

= 0.2
Pentru elevul de la colegiul B, nota sa de 7.3 ntr-o
distrubuie N(6.9;1) devine:
7.3 6.9
= 0.4
1
Se observ c elevul de la colegiul B, chiar dac a
obinut o not inferioar celei a elevului de la colegiul A,
este mai bine clasat dect acesta, deoarece pe scara
comun a variabilei Z nota sa este superioar.

37

3/5/2015

Distribuia normal

Proprieti ale variabilelor aleatoare normale:


dac X este o variabil aleatoare normal iar a
este o constant, atunci variabilele: X+a, X-a i
aX sunt i ele normal distribuite;
n cazul special n care X i Y sunt dou variabile
aleatoare normale i independente, atunci i
variabilele X+Y i X-Y sunt normal distribuite.
Prin generalizare, putem enuna urmtoarea
teorem referitoare la suma unor variabile supuse
unor legi normale.

Distribuia normal

Fie X1, X2...Xn


n variabile aleatoare
independente unele fa de altele, astfel nct:
~

, 1,
=
~
;
= + +
=

i fie
Atunci
Unde:

++

38

3/5/2015

Distribuia normal

Teorema limit central


Fie X1,X2.......Xn n variabile aleatoare independente ntre
ele i identic distribuite (aceeai lege de probabilitate, aceeai
medie i dispersie).
i fie:
=
Atunci, dac n este mare (teoretic, dac n ):
:
;
Unde:
=
+ +
=
=
+ +
=
Cum aceast teorem se aplic oricrei sume de variabile
aleatoare independente ntre ele i identic distribuite, este
important s precizm c ea permite i aproximarea unei sume
de variabile discrete printr-o variabil continu.

Distribuia normal

Pornind de la aceast teorem, numit i regula


aproximrii normale, se poate enuna un corolar a crui aplicare
este foarte util n studiul unei distribuii binomiale:
Fie
~
;
Dac n este mare, atunci

;
Condiiile de aplicare a unei astfel de aproximri:
cu ct n este mai mare, cu att aproximarea este mai corect;
dac n este moderat de mare, aproximarea este:
foarte bun dac p 0.5
mai puin bun dac p 0 sau p 1

n practic se consider c:
dac, n acelai timp:

;
;
n 30
np 5 i nq 5

39

3/5/2015

Distribuia
O distribuie derivat din distribuia normal, care are un rol
foarte important n inferena statistic este distribuia
(numit i
repartiia Helmert-Pearson):
Fie X1, X2,.....Xn n variabile aleatoare independente astfel nct
~ 0; 1 , 1,
Dac
=
++
atunci X este o variabil aleatoare continu supus unei funcii de
densitate de probabilitate numit
cu n grade de libertate i o notm:
~
Valorile corespunztoare mediei i dispersiei acestei variabile sunt:
=
=2
Observaie: n, numrul gradelor de libertate, reprezint parametrul
specific al acestei distribuii, aa cum n i p sunt pentru o distribuie
binomial i i pentru o distribuie normal.
Reprezentarea grafic a funciei de densitate de probabilitate a
unei variabile X supus unei legi
, pentru trei valori ale lui n, se
regsete n figura urmtoare.

Distribuia

0.9
n=1
0.8

n=3
n=10

0.7
0.6

0.5

0.4

0.3
0.2

0.1

0
0

10

15

20

25

40

3/5/2015

Distribuia

Pe baza acestui grafic se pot formula urmtoarele


caracteristici:
orice variabil aleatoare supus unei legi
nu poate
lua dect valori pozitive (fiind definit ca suma ptratelor
unor variabile);
pentru n foarte mic, curba unei
este total asimetric
(n = 1, n grafic);
pentru 3, curba ia forma unui clopot:
asimetric nti, pentru valori mai mici ale lui n (n = 3, n
grafic);
din ce n ce mai simetric, pe msur ce n crete (n = 10, n
grafic);

atunci cnd n este suficient de mare, forma graficului se


apropie de curba unei legi normale N~ (n ; 2n).

Distribuia

n timp ce tabelul distribuiei unei variabile


Z~N(0;1) prezint valorile probabilitilor de la
intersecia unei linii cu a unei coloane ca definind
o valoare a lui Z (anexa 8), tabelul distribuiei
~ (prezentat n anexa 9) procedeaz invers:
el indic, pentru valori ale lui n de la 1 la 30,
diferite valori ale lui x, pentru o variabil ~ ,
la dreapta crora aria suprafeei delimitat de
curb,
> , corespunde unei valori .

41

3/5/2015

Exemple:
Pentru o variabil ~
dac dorim s aflm pentru care valoare a lui x,
> = 0.05,
gsim aceast valoare la intersecia liniei n = 15 i a coloanei = 0,05: x = 24.996 (anexa 9,
figura a).
Pentru o variabil ~
, dac dorim s aflm pentru care valoare a lui x,
< =0.05,
deducem mai nti c dac
< = 0.05, atunci
> = 0.95 i cutm la intersecia
liniei n = 10 cu coloana = 0.95 pentru a gsi valoarea dorit: x = 3.940 (anexa 9, figura b).

Distribuia student (t)

Fie Z ~ N(0;1) i ~
independente, dac:

dou variabile aleatoare

=
Atunci T este o variabil aleatoare continu supus
unei legi de probabilitate numit t a lui student cu n grade
de libertate, pe care o notm:
~
Valorile mediei i dispersiei pentru o astfel de variabil sunt:
=0

, dac > 2

1, pentru valori mari ale lui n

42

3/5/2015

Distribuia student (t)

Reprezentarea grafic a unei astfel de


variabile are aspectul unei distribuii normale
N(0;1) aplatizate, incluznd i proprietile de
simetrie ale acesteia.
Pentru valori mai mici ale lui n, forma
clopotului este mai larg i plat, iar pe msur ce
valorile lui n sunt mai mari, forma clopotului este
mai ngust i mai nalt, tinznd progresiv ctre
cea a lui N(0;1), atunci cnd .

Distribuia student (t)

N(0,1)

t10
t2
-5

-4

-3

-2

-1

43

3/5/2015

Distribuia student (t)

Tabelul cu valorile specifice ale acestei


distribuii este prezentat n anexa 10.
Valorile unei variabile se regsesc la
intersecia unei linii care precizeaz numrul
gradelor de libertate ale lui cu o coloan care
precizeaz aria a suprafeei situat la dreapta
acestei valori, sub curb.

Exemplu Pentru o variabil ~


, gsim valoarea t pentru care
> = 0,05
la intersecia liniei n = 21 i a coloanei
= 0.05 : t = 1.721 (anexa 10, grafic)
Dac dorim o valoare negativ a variabilei, folosim proprietatea de
simetrie, ca i n cazul ditribuiei normale N(0;1).

44