Sunteți pe pagina 1din 38

Distribuii

statistice
(II)

Variabile aliatoare continui:


normal

(standard /Gauss i general),


uniform,
exponenial

Variabila aliatoare reprezint valorile numerice asociate


unui element al spaiului de selec ie (eveniment elimentar),
atribuirea unui numr real.
O variabil aleatoare este continu atunci cnd variaz n
mod continuu ntr-un interval i poate lua o mulime
nenumrabil de valori. Deci, poate lua orice valoare fiind
condiionat doar de acurateea tehnicii de observare,
msurare.
Exemple:
timp necesar pentru a finaliza o sarcin;
temperatura ntr-o ncpere;
Venituri din vinzri, etc.

Variabila aliatoare continu


Legea normal de distribuie

Forma

unui clopot;
Simetric;
Media, mediana i valoarea
modal sunt egale.

f(X)

Tendina

central este determinat de medie, E(X)= .


Variaia este definit de abaterea medie ptratic, Var(X)= .
Variabila aliatoare continu ia valori de la - .

Distribuia
normal

Pentru diferii parametri i , v-om obine diferite


reprezentri grafice a distribuiilor normale.

Distribuia
normal

f(X)

Schimbarea lui mut distribuia


n stnga sau n dreapta
Schimbarea lui crete sau
scade gradul de mprtiere

Curba normal reprezint grafic densitatea de


probabilitate a repartiiei normale.

Distribuia
normal

Expresia
analitic a densitii de repartiie, n cazul unei distribuii
normale cu parametrii i , este:

unde:
e = constanta matematic aproximat ca 2.71828
= constanta matematic aproximat ca 3.14159
= media colectivitii generale;
= abaterea media ptratic a colectivitii generale;
x = valorile variabilei aliatoare.

Legea normal redus


Este evident c exist o gam infinit de legi normale, care
corespund cte unei perechi de parametri ( i ). Toate
aceste distribuii normale se pot reduce la una singur, avnd
media 0 i abaterea standard 1, cu ajutorul unei schimbri de
variabil, numit standardizare.
Orice distribuie normal poate fi transformat ntr-o
distribuie normal standardizat (Z), aplicnd relaia de
calcul:

X
Z

Legea normal redus va avea densitatea de probabilitate


definit de funcia:

1
f(Z)
e
2

Z2

Exemplu:
Variabila X este normal distribuit avnd media 100 i
abatere medie ptratic 50, valoarea standardizat Z
pentru un X=200 va fi:

X 200 100
Z

2.0

50
Rezultatul dat ne spune c X=200 are dou abateri
standard (2 cu pasul 50) fa de nivelul mediu.

Compararea valorilor X i Z

100
0

200
2.0

X
Z

( = 100, = 50)
( = 0, = 1)

De reinut, distribuia este aceiai, numai scara sa schimbat!


Putem exprima variabila n valori originale (X) sau n valori
standardizate (Z).

Probabilitatea este msurat prin aria de sub curb:


f(X)

P (a X b)
= P (a < X < b)

Aria total de sub curb este egal cu 1.


Fiind o distribuie simetric fa de medie, jumtate se va
prezenta pn la aceast valoare, jumtate peste.

Regula empiric
Ce putem spune despre distribuia valorilor n jurul
mediei?
f(X)cteva reguli generale:
Exist
1 cuprinde

aproximativ 68% din


valorile variabilei X

-1

+1

68.26%

Regula empiric

2 cuprinde aproximativ 95% din


valorile variabilei X

3 cuprinde aproximativ 99.7% din


valorile variabilei X

95.44%

99.73%

Tabelul cu valorile repartiiei normale


standardizate (Funcia Gauss-Laplace)
Valorile
din
captul
coloanelor prezint al doilea
punct zecimal al valorii Z

Z
Valorile
din
captul
liniilor
prezint
primul punct
zecimal
al
valorii Z

0.00

0.01

0.02

0.0
0.1

P(Z < 2,00) = 0,9772

.9772

Valoarea
din
tabel
prezint probabilitatea
pn la valoarea Z

Procedura de gsire a probabilitii

Pentru a gsi P (a <X <b) atunci cnd X este


distribuit n mod normal:
trasai curba normal;
transformai valorile X n valori Z;
utilizai tabelului teoretic al valorilor standardizate
normale pentru identificarea probabilitii.

Gsirea probabilitii:

presupunem c X este normal distribuit de medie = 8,0 i


abatere medie ptratic =5,0;
care va fi P(X < 8,6)?

8,0
8,6

Standardizm

valoarea caracteristicii X

(calculm z):
X 8,6 8,0
Z

0,12

5,0
=0

=8

=1

= 10

8,0 8,6
P(X < 8,6)

0,12

P(Z < 0,12)

Soluie:

P(Z < 0,12)

Tabelul valorilor standardizate


(secven)

0.0

.01

.02

P(X < 8,6)


= P(Z < 0,12)
,5478

0.0 .5000 .5040 .5080

0.1 .5398 .5438 .5478


0.2 .5793 .5832 .5871
0.3 .6179 .6217 .6255

0 0,12

Calculul probabilitii, zona de


maxim
presupunem c X este normal distribuit de medie =
8,0 i abatere medie ptratic =5,0;
care va fi P(X > 8,6)?

8,0
8,6

Calculul probabilitii, zona de maxim

Gsim

0,12)

P(X > 8,6)


P(X > 8,6) = P(Z > 0,12) = 1,0 - P(Z
0,4522
= 1,0 0,5478 =

0.4522

0,5478

1,000

0
0,12

1,0 0,5478
= 0,4522

0
0,12

Calculul probabilitii ntre dou valori


presupunem

c X este normal distribuit de medie = 8,0 i


abatere medie ptratic =5,0;
care va fi P(8<X< 8,6)?
Calculm valorile Z:

X 88
Z1

5
X 8,6 8
Z2

0,12

8 8,6
0 0,12

P(8 < X < 8,6)


= P(0 < Z < 0,12)

X
Z

Soluie:
0,12)

P(0< Z <

Tabelul valorilor standardizate


(secven)
P(8 < X < 8.6)
= P(0 < Z < 0.12)
Z 0.0 .01 .02
= P(Z < 0.12) P(Z 0)
0.0 .5000 .5040 .5080
= 0.5478 - .5000 =0.0478
0.0478

0.1 .5398 .5438 .5478

0.0478

0.5000

0.2 .5793 .5832 .5871


0.3 .6179 .6217 .6255
0.00

0.12

Calculul probabilitii, zona de minim

presupunem c X este normal distribuit de medie = 8,0 i


abatere medie ptratic =5,0;
care va fi P(7,4<X< 8)?

7.4

8.0

Calculul probabilitii, zona de minim


Gsim

P(7,4<X <8)
P(7,4 < X < 8)
= P(-0,12 < Z < 0)
= P(Z < 0) P(Z -0,12)
= 0,5000 0,45220,0478
=

Distribuia
normal
este
simetric astfel probabilitatea
este aceiai ca i n cazul cnd
se determin
P(0 < Z < 0.12)

Evaluarea normalitii distribuiei


Nu toate variabilele aliatoare continui sunt normal distribuite
astfel este important de a evalua dac setul de date este
distribuit aproximativ normal.

Cum?
prin

prisma prezentrii grafice:

pentru seturi de date mici, graficul stem-and-leaf, se prezint


aproape simetric;
pentru seturi de date mari, histograma&poligonul frecvenelor au
forma de clopot.

prin prisma statisticilor descriptive:

amplitudinea intercuartilic (Q3-Q1) este aproximativ 1,33;

Amplitudinea absolut este aproximativ 6.

observnd modul de distribuie a setului de date:

valoarea medie, median, modal sunt egale;

sunt cca 2/3 din observa ii cuprinse n limitele intervalului definit de


medie
1 abateremedie ptratic?
sunt cca 80% din observaii cuprinse n limitele intervalului definit
medii ptratice?
de medie
1,28 abateri
sunt cca 95% din observaii cuprinse n limitele intervalului definit
medii ptratice?
de medie
2 abateri

n baza graficului de probabilitate:

graficul de probabilitate construit ntre valorile variabilei X i


valorile standarde Z corespondente ale acestora va fi aproximativ
liniar.

Graficul probabilitii normale

90
60
30
-2

-1

Graficul probabilitii normale


Asimetrie de stnga
X 90

Asimetrie de dreapta
X 90

60

60

30
-2 -1 0

2 Z

Rectangular

-2 -1 0

2 Z

Forma non-liniar
a graficului indic
deviaie de la
normalitate

X 90
60
30
-2 -1 0

30

2 Z

Variabila aliatoare continu uniform

Distribuia uniform este o distribuie de probabilitate


care are probabiliti egale pentru toate rezultatele
posibile ale variabilei aleatoare. De asemenea, se mai
numete distribuie rectangular.

Variabila aliatoare continu


uniform
Expresia analitic a densitii de repartiie, n cazul unei
distribuii uniforme este:

f(X) =

1
ba
0

dac a X b
alte cazuri

unde:
f(x) = valorile funciei de densitate pentru oricare X;
a = valoarea minim a lui X;
b = valoarea maxim a lui X.

2
2
(
-1
b
)2
a

Proprietile distribuiei uniforme


Valoarea

medie se va determina dup relaia:

Abaterea

medie ptratic se va calcula dup formula:

Distribuie uniform

b
2

4
2
(
-1
a
)2(1
-2
)2
1
.5
4
7

Exemplu:
Fie este cunoscut c variabila X este uniform distribuit i ia
valori ntre 2 X 6,
astfel:

f(X
)
0.25
2

Distribuie uniform
Exemplu: Utiliznd distribuia de probabilitate
uniform definit n slid-ul precedent, calculm P(3 X
5):
P(3 X 5) = (lungimea)(nlimea) = (2)(0.25) = 0.5
f(X)
0.25
2

Distribuia exponenial
Distribuia exponenial se folosete pentru a modela
intervalul de timp dintre dou apariii ale unui eveniment
(timpul scurs ntre sosiri).
Exemple:
timpul ntre tranzacii de la un bancomat;
timpul ntre apelurile telefonice la serviciul de urgen ,
etc.

Distribuia exponenial

este definit doar n baza unui parametru:


media notat prin (lambda)

probabilitatea c momentul sosirii este mai mic dect timpul


specificat X se va calcula dup relaia:

P(momentul sosirii X) 1 e X
unde:
e = 2.71828;
= numrul mediu de sosiri per unitate timp;
X = valoarea variabilei aliatoare n diapazonul 0 < X <

Distribuia exponenial
Exemplu:
Se cunoate c pe parcursul unei ore sunt deservi i cca 15 clien i de ctre
angajaii ghieului de documentare a populaiei. Care este probabilitatea
c timpul de sosire ntre clienii ce au fost deservi i consecutiv este mai
puin de 3 minute?

media clienilor deservii per or este 15, astfel = 15

3 minute constituie 0,05 ore

P(timpul de sosire < .05) = 1 e-X = 1 e-(15)(0.05) =


0.5276

Astfel, cu o probabilitate de 52,76% putem afirma c ntre clien ii


deservii consecutiv este mai puin de 3 minute.

S-ar putea să vă placă și