Sunteți pe pagina 1din 51

C4.

Probabilităţi şi
distribuţii teoretice

Bibliografie: Elisabeta Jaba, Statistica, Ediţia a


treia, Editura Economică, Bucureşti, 2002, pp.
1 84-93, 166-176
Experienţă aleatoare. Eveniment aleator

 Experienţa aleatoare1 este experienţa al cărei rezultat variază la


întâmplare.
 aruncarea unei monede;
 aruncarea unui zar;
 extragerea unei bile din urnă.

 Se cunosc rezultatele posibile ale unei experienţe, dar nu ştim, pentru o


anumită experienţă care va fi rezultatul obţinut.

 Evenimentul aleatoriu este rezultatul unei experienţe aleatoare.

 Spaţiul de selecţie este mulţimea tuturor rezultatelor posibile ale


unui experiment.
1. Cuvântul aleator provine de la cuvântul alea din limba latină, care înseamnă zar.
2
Definiţii ale probabilităţii

 Definiţia clasică a probabilităţii (Bernoulli şi Laplace)


 Probabilitatea ca un eveniment să se realizeze
reprezintă raportul dintre numărul de evenimente
elementare favorabile realizării evenimentului şi numărul
evenimentelor egal posibile.
m
p
n
 m este numărul cazurilor favorabile şi
 n este numărul cazurilor posibile
 unde 0 ≤ m ≤ n, ceea ce implică 0 ≤ p ≤ 1.
 Valoarea p=0 corespunde evenimentului imposibil, iar
valoarea p=1 corespunde evenimentului cert sau sigur.
3
 Definiţia probabilităţii bazată pe frecvenţă
 Probabilitatea este definită ca un caz limită al frecvenţei,
atunci când numărul de experienţe tinde la infinit.
m
p  lim
n  n

 m este numărul efectiv de realizări ale unui eveniment dintr-


un număr n de experienţe realizate
 Probabilitatea este frecvenţa relativă de apariţie a unui
eveniment.

4
5
Variabila aleatoare

 O variabilă aleatoare (v.a.) este o funcţie prin care se


atribuie valori numerice unice rezultatelor posibile ale
unui experiment, în condiţii date.
 v.a. se notează cu X
 valorile unei v.a. X se notează cu xi

6
Distribuţia unei variabile aleatoare

 Distribuţia unei v.a. reprezintă enumerarea tuturor


valorilor posibile ale unei v.a. precum şi a probabilităţilor
corespunzătoare.
 Distribuţia unei v.a. = distribuţia teoretică = distribuţie
probabilistică
 Distribuţia de probabilitate atribuie o probabilitate P(X=xi)
fiecărei valori posibile xi.
 Pentru fiecare xi, probabilitatea P(X=xi) este cuprinsă între 0
şi 1.
 Suma probabilităţilor tuturor valorilor posibile este egală cu 1.

7
Variabila aleatoare discretă

 V.a. discretă are ca valori numere bine precizate, de


exemplu 0, 1, 2, 3, ...

X: ( xi , pi ) cu i =1,...,m
unde
 pi= P( Ei )=P( X = xi ) =f ( xi )
 Ei este evenimentul ca v.a. X = xi , i=1, … ,m

8
Variabila aleatoare discretă

 Exemplu
 X: Numărul de capete obţinut la aruncarea unei monede
de 4 ori
 Valorile posibile ale variabilei X: {0, 1, 2, 3, 4}
 Nr. total de evenimente posibile: 24 = 16
 Distribuţia v.a. X
xi P( X = xi ) f ( xi )
0 1/16 0,0625
1 4/16 0,25
2 6/16 0,375
3 4/16 0,25
4 1/16 0,0625
Total 1,00 1,00
9
Distribuția unei variabile aleatoare
discretă

 Funcţia de probabilitate
 f(x) - funcţia de probabilitate (funcţia masă de
probabilitate)
 Funcţia de probabilitate trebuie să îndeplinească
următoarele două condiţii:
f (x)  0
m
 f (x i )  1
i 1
 Funcţia de repartiţie
 F(x) - funcţia de repartiţie
 Pentru o v.a. discretă X : F(x) = P(X<x) =  f (x i )
i; x i x

10
Variabila aleatoare continuă

 V.a. continuă poate lua un număr infinit de valori posibile


pe un interval.
 Probabilitatea de a observa o anumită valoare este egală
cu 0, deoarece numărul valorilor posibile ale v.a. continue
este infinit.
 P( X=xi ) = 0

11
Distribuția unei variabile aleatoare
continuă

 Funcţia de densitate de probabilitate


 f(x) – funcţia de densitate de probabilitate
 Funcţia de densitate de probabilitate are următoarele
proprietăţi:

f (x)  0 x  [a , b ]
b

 f ( x )dx  1
a

 Funcţia de repartiţie
 F(x) - funcţia de repartiţie
x

12
 F(x) = P(X<x) =
 f (t )dt

Caracteristicile numerice ale unei v.a.

 Media unei v.a.


 Media unei v.a. X se notează cu μ sau M(X).
 Media unei v.a. X se numeşte şi speranţa matematică a
variabilei X şi se notează şi cu E(X).

 Media unei v.a. discrete X este:


   xi f ( xi )
i

 Media unei v.a. continue X este:



  xf ( x )dx

13
Caracteristicile numerice ale unei v.a.

 Varianţa unei v.a.


 Varianţa unei v.a. se notează cu σ2 sau D2(X).

 Varianţa unei v.a. discrete X:


 2   ( xi   )2 f ( xi )
i

 Varianţa unei v.a. continue X:



 2   ( x   )2 f ( x )dx


14
Distribuţia normală

 Distribuţia normală este modelul de distribuţie cel mai


des întâlnit în cazul v.a. continue.
 Distribuţia normală are rol fundamental în teoria selecţiei,
analiza de regresie, analiza variaţiei şi covariaţiei.

 Fie o v.a. continuă X care urmează este o lege normală


(lege Gauss-Laplace) de parametrii μ şi σ2.
 Notăm: X ~ N(μ, σ2)

15
Distribuţia normală

 Funcţia de densitate de probabilitate a unei variabile X


distribuită după o lege normală este:
2
1  x μ 
1   
f(x)  e 2 σ 

σ 2π x  R , e = 2,71828, π = 3,14159

 Funcţia de densitate de probabilitate este reprezentată


grafic prin curba densităţii de probabilitate, curbă cu alură
de clopot (clopotul Gauss-Laplace).

16
Distribuţia normală

 Funcţia de repartiţie a legii normale este definită prin


relaţia:
2
1  t μ 
1 x   
F(x)  e
2 σ 
dt
σ 2π 

17
Distribuţia normală

 Proprietăţile legii normale:


 este simetrică în raport cu ordonata valorii x = μ
 amplitudinea variabilei este infinită    X  
 funcţia f(x) este maximă pentru x = μ
 curba de densitate de probabilitate are puncte de inflexiune
când x    
 Probabilitatea este egală cu 0,68 pentru intervalul media
minus o abatere standard (μ-σ) şi media plus o abatere
standard (μ+σ).

18
Distribuţia normală

 Proprietăţile legii normale:


 o distribuţie normală este unic determinată de medie şi
varianţă.

19
Distribuţia normală
 Proprietăţile legii normale:
 Probabilitatea este egală cu 0,68 pentru intervalul media
minus o abatere standard (μ-σ) şi media plus o abatere
standard (μ+σ).

20
Regula Chebyshev şi Regula empirică

% valorilor care se găsesc în intervalele


din jurul mediei
Interval Regula Chebyshev Regula empirică
(orice distribuţie) (distribuţia normală)

(   ,    ) Cel puţin 0% Aproximativ 68%

(  2 ,   2 ) Cel puţin 75% Aproximativ 95%

(  3 ,   3 ) Cel puţin 88,89% Aproximativ 99,7%

21
Distribuţia normală standard

 Distribuţia normală standard este distribuţia variabilei


normale centrate şi reduse Z.

 V.a. Z urmează o lege de repartiţie normală standard.


 Notăm: Z ~ N(0,1).
 media variabilei Z este egală cu 0.
 varianţa variabilei Z este egală cu 1.
 Scorul z pentru o observaţie x reprezintă numărul de
abateri standard de la medie.
x
z  x    z 
22 
Fie X –Timpul de descărcare a unui fişier video (secunde) pe
site-ul OurCampus!. Se ştie că timpul mediu este egal cu μ = 7
secunde, iar abaterea standard este σ = 2 secunde.

23
Pe un alt site, Timpul de descărcare a unui fişier video (secunde)
este normal distribuit cu media egală cu μ = 4 secunde şi
abaterea standard egală cu σ = 1 secundă.

24
Standardizarea valorilor unei variabile normale X

25
Distribuţia normală standard

 Funcţia de densitate de probabilitate este dată de


relaţia:

z2
1 
f(z)  e 2 zR

 Funcţia de repartiţie a unei variabile normale standard Z


este:

z t2
1 
F(z) 

 e 2 dt

26
Distribuţia normală standard

 Pentru interese practice, de calcul al unor probabilităţi, se


utilizează funcţia de repartiţie Laplace:
z t2
1 
(z)  
2π 0
e 2 dt
unde z>0

 Deci  ( z )  P (0  Z  z )

 Valorile funcţiei  (z ) se găsesc tabelate.


27
28
Distribuţia normală standard

 Exemplul 1
 Φ(1,96) = P(0<Z<1,96) = 0,4750

29
Distribuţia normală standard

 Pe baza funcţiei lui Laplace, se poate determina funcţia de


repartiţie F(z), adică probabilitatea ca variabila aleatoare
normală standard Z să ia valori până la o valoare z.

F ( z )  P( Z  z )  0 ,5  ( z )
 unde 0,5 este jumătate din aria de sub curbă.

30
Distribuţia normală standard

 Exemplul 2

 P(Z < 1,26) = F(1,26) = 0,5 + (1,26) = 0,5 + 0,396 = 0,896

(1,96)

31
Distribuţia normală standard

 Se poate determina şi probabilitatea ca v. a. normală


standard Z să ia valori într-un interval simetric de tipul
(-a; a).
 Această probabilitate este:
a
P( a  Z  a )  F ( a )  F ( a )  ( a )  ( a )  2( a )   f ( t )dt
a
 Deoarece
  (  a )   ( a )

 F (a )  0,5   (a )

 F ( a )  0,5   ( a )  0,5   (a )

32
Distribuţia normală standard

 Exemplul 3
 P(-1,26 < Z < 1,26) = 2 (1,26) = 0,7924

 Deoarece știm că: P (  a  Z  a )  2 ( a )

33
Distribuţia normală standard

 Exemplul 4

P(Z >1,26) = 1 - P(Z<1,26) = 1 – F(1,26)= 1 - [0,5 + (1,26)] = 0,5 – (1,26) =


= 0,5 – 0,3962 = 0,1038

34
Distribuţia normală standard

 Exemplul 5
P(Z > -2,13) = 1 - P(Z<-2,13) = 1 – F(-2,13) = 1 – [0,5 - (2,13)] =
= 0,5 + (2,13) = 0,5 + 0,4834 = 0,9834

35
Distribuţia normală standard

 Pentru o variabilă X ~ N(10,4), să se calculeze probabilitatea


P(8 < X < 12) .

8  10 12  10
 P(8 < X < 12) = P ( Z )  P (1  Z  1)  2 (1) 
2 2
 2  0,341  0,682

36
Folosirea scorurilor Z pentru
compararea distribuţiilor

• Scorurile Z pot fi folosite pentru a compara observaţii care aparţin la


distribuţii normale diferite.

• Exemplul 6
• Pentru admiterea la colegiu se pot susţine două teste: SAT şi ACT.

• Un elev a obţinut scorul 650 pentru testul SAT care are   500 şi

  100 şi scorul 30 la testul ACT care are   21.0 şi   4.7 .

• Cum putem compara cele două scoruri pentru a spune care este
relativ mai mare?
Exemplu: Compararea notelor la teste care
folosesc scale diferite

Comparăm scorurile z:

SAT: z  650  500  1.5


100

ACT: 30  21
z  1.91
 4.7

Deoarece scorul z este mai mare pentru ACT, atunci elevul a


avut un rezultat relativ mai bun la acest test.

Distribuţia χ2 (Hi pătrat)

 Fie ν variabile aleatoare, independente şi identic


repartizate (v.a.i.i.d) după o lege normală standard, Xi ~
N(0, 1), atunci variabila X obţinută ca o sumă a pătratelor
variabilelor Xi urmează o distribuţie χ2 cu ν grade de
libertate.
 Notăm: X ~ χ2(ν)
ν
 unde X =  X 2 pentru Xi ~ N(0, 1),
i
i 1

39
Caracteristicile numerice ale repartiţiei χ2

 Media v.a. X
 M(X)= ν σ 2
 unde
 ν – numărul gradelor de libertate (nr. variabilelor aleatoare
la pătrat însumate)
 σ – abaterea standard a variabilelor aleatoare normale
standard (σ = 1)
 Varianţa v.a. X
 V(X)=2 ν σ 4
 Exemplu
 Pentru o variabilă X ~ χ2(4) , se poate determina constanta
a, astfel încât P (X > a) = 0,05. Din tabela Hi-pătrat se
citeşte valoarea a = 9,48.

40

41
Distribuţia t (Student)

 Fie o v.a. X ~ N(0, 1) şi o v.a. Y ~ χ2(ν ), atunci v.a.


Student este definită de relaţia:
X
t
Y
ν
 Notăm: t ~ t(ν)
 unde
 ν – numărul gradelor de libertate (parametrul repartiţiei
Student)

42
Caracteristicile numerice ale
repartiţiei Student

 Media v.a. t
 M(t)=0
 Varianţa v.a. t
 V(t)= v/(v-2) unde ν – numărul gradelor de libertate
 Exemplu
 Pentru o variabilă aleatoare care urmează o lege de
repartiţie Student cu ν = 25 grade de libertate (X ~ t (25)),
se cere să se determine valoarea a, astfel încât: P(X > a)
= 0,05.
 Din tabela Student, pentru o probabilitate de 0,05 şi 25
grade de libertate se citeşte valoarea a = 1,708.
 Deci, P(X > 1,708) = 0,05.

43
44
Distribuţia Fisher

 Fie două v.a. X şi Y cu distribuţii de probabilitate Hi


pătrat, X ~  2 ( 1 ) şi Y ~  (, 2 ) atunci, o variabilă F
2

care urmează o lege de repartiţie Fisher de parametrii ν1


şi ν2 se obţine prin relaţia:
X
1
F
Y
2

 Notăm: F ~ F ( 1 , 2 )

45
Caracteristicile numerice ale repartiţiei
Fisher – Snedecor

 Media v.a. F

2
 M (X )  , 2  2
2 2
 Varianţa v.a. F

2 22 ( 1   2  2)
 V (X )  , 2  4
 1 ( 2  2) ( 2  4)
2

 Exemplu
 Pentru o variabilă X ~ F(5, 3), se poate determina
constanta a, astfel încât P (X > a) = 0,01. Din tabela
Fisher se citeşte valoarea a = 28,23.
46
47
48
Anexa 1 – Evenimente aleatoare
 Numărul total de evenimente posibile ale unei experienţe
este egal cu nk , unde:
 n – numărul de evenimente posibile ale unei experienţe
 k – numărul de probe ale unei experienţe
 Exemple de evenimente aleatoare:

Nr. total de Spaţiul de selecţie


Experienţa evenimente (mulţimea evenimentelor
posibile posibile)
Aruncarea unei
21 {C, P}
monede
Aruncarea unei
22 {CC, CP, PC, PP}
monede de 2 ori
Aruncarea unei {CCC, CPC, CCP, PCC, PCP,
23
monede de 3 ori PPC, CPP, PPP}
Aruncarea unui zar 61 {1, 2, 3, 4, 5, 6}

49
Anexa 2 – Experiențe independente

 Experienţele sunt independente dacă rezultatul oricărei


probe nu este influenţat de rezultatul unei alte probe.
 De exemplu, dacă am aruncat o monedă de 20 de ori şi
am obţinut de fiecare dată „cap”, nu este obligatoriu să
obţinem „pajură” la următoarea aruncare. Probabilitatea
de a obţine „pajură” este tot ½. O aruncare este
independentă de aruncările anterioare.

50
Anexa 3 - Exemple de variabile
aleatoare
Valorile posibile
Mulţimea evenimentelor
Experienţa Variabila (X) ale variabilei X
posibile
(xi)

Aruncarea unei {CCC, CPC, CCP, PCC, PCP,


Numărul de capete 0, 1, 2, 3
monede de 3 ori PPC, CPP, PPP}

{1,1; 1,2; 1,3; 1,4; 1,5; 1,6;


Aruncarea unui zar Suma numerelor 2, 3, 4, 5, 6, 7, 8, 9,
.........................................
de 2 ori celor 2 feţe 10, 11, 12
6,1; 6,2; 6,3; 6,4; 6,5; 6,6}
{CCCC, PCCC, CPCC,
CCPC,CCCP, PPCC, PCPC,
Aruncarea unei
PCCP, CPCP, CPPC, CCPP, Numărul de capete 0, 1, 2, 3, 4
monede de 4 ori
PPPC, PPCP, PCPP, CPPP,
PPPP }

51

S-ar putea să vă placă și