Documente Academic
Documente Profesional
Documente Cultură
Jaba Elisabeta
iunie 2011
1 Cuprins
2 Considerente introductive
3 Repartiţii (Distribuţii)
Probabilităţi
Probabilităţile au apărut şi s-au dezvoltat iniţial ı̂n contextul jocurilor de noroc.
Actualmente sunt utilizate ı̂n diferite sectoare de activitate pentru estimări
(cantitate, venituri,stocuri), previziuni şi controlul calităţii.
Obiectele centrale sunt evenimentele şi probabilităţile de apariţie ale
evenimentelor, sintetizate ı̂n variabile aleatoare.
Definiţii
Se numeşte câmp de probabilitate o mulţime finită Ω, mulţimea tuturor
submuţimilor posibile ale acesteia F şi o funcţie, numită probabilitate, notată cu
P : F → [0, 1], cu proprietatea P(Ω) = 1
Evenimentul A se defineşte ca fiind o submulţime (finită) a lui Ω. Presupunem că
aceasta submulţime are m elemente, ı̂n timp ce Ω are n elemente (m ≤ n).
Probabilitatea evenimentului A este:
m
P(A) =
n
.
Repartiţii discrete
Caracterizate complet de tabloul
de repartiţie, unde xi
desemnează valorile posibile, ı̂n
timp ce pi reprezintă
probabilitatea apariţiei valorii xi :
x1 x2 ... xk
p1 p2 ... pk
Pk
unde pi ≥ 0, ∀i, i=1 pi = 1.
Fie X o variabilă aleatoare care ı̂nregistrează datele unui anumit experiment. Acest experiemnt poate produce o mulţime de
rezultate (Ω), fiecare din aceste rezultate fiind un eveniment Ai , cu probabilitatea sa, P(Ai ). Dorim să calculăm diverşi
indicatori numerici pentru a analiza datele.
Repartiţii discrete
n
X
E(X ) = p i xi = m
i=1
Dispersia (Varianţa)
n
2 2
X
D (X ) = (xi − m) pi
i=1
n
r r
X
E(X − m) = (xi − m) pi = µr
i=1
Fie X o variabilă aleatoare care ı̂nregistrează datele unui anumit experiment. Acest experiemnt poate produce o mulţime de
rezultate (Ω), fiecare din aceste rezultate fiind un eveniment Ai , cu probabilitatea sa, P(Ai ). Dorim să calculăm diverşi
indicatori numerici pentru a analiza datele.
Dispersia
Dispersia (Varianţa)
Z
2 2 2
n D (X ) = E[(X −m) ] = (x−m) f (x)dx
2 2 R
X
D (X ) = (xi − m) pi
i=1
Moment centrat de ordin r:
1
P(X = k) = , k = 1, 2, ..., n.
n
Media şi dispersia sunt:
n+1 2 n2 − 1
E(X ) = , D (X ) =
2 2
Exemplu: numărul de puncte care apar la aruncarea unui zar corect, numărul de
steme care apar la aruncarea unei monezi corecte.
Modelează extragerile succesive din aceeaşi colectivitate, ı̂n cazul ı̂n care, după examinarea
probei şi notarea rezultatului aceasta este repusă ı̂n colectivitate.
Are ca rezultat probabilitatea ca din n ı̂ncercări independente să se obţină exact k succese,ştiind
că, la o singură ı̂ncercare, probabilitatea unui succes este p.
Notă: Uneori, pentru comoditate, se introduce notaţia: (1 − p) = q, ı̂nsă funcţia depinde
exclusiv de n şi p.
Caracteristici numerice
Media şi dispersia sunt: E(X ) = np; D 2 (X ) = np(1 − p).
n!
Am notat: Ckn = k!(n−k)! , n! = 1 · 2 · ... · n. Momentele centrate de ordin 3 şi 4:
µ23 q − p →0
γ1 = 3
=√ n→∞
[D(X )] npq
µ23 1 − 6pq →0
γ2 = 4
= n→∞
[D(X )] npq
Exemple
Se consideră: N-un lot de produse;d-produse defecte; N-d-produse
corespunzătoare. Se extrag n produse din lotul N (n < N), se controlează apoi se
reintroduc ı̂n lot. Pentru fiecare nr. k ∈ {0, 1, ..., n}, probabilitatea ca exact k să
fie defecte este de b(k, n, p) = Cnk p k (1 − p)n−k , unde p = dn
Probleme practice
1. O mostră de aer are 10% şanse să conţină particule nocive. Dacă se analizează
18 mostre care este proabilitatea ca exact k (k=0,1,...,18) să conţină particule
nocive?
2.Dintre toţi pacienţii suferind de o anumită boală, 35% au raportat ameliorări
după un anumit tratament. Pentru următorii 100 de pacienţi, fie X nr. pacienţilor
amelioraţi. Să se determine distribuţia lui X.
Cak Cbn−k
P(X = k) = n , ∀k, max(0, n − b) ≤ k ≤ min(a, n).
Ca+b
Media şi dispersia sunt:
a+b−n n
E(X ) = np D 2 (X ) = np(1 − p) ≈ np(1 − p)(1 − )
a+b−1 N
λk
P(X = k) = e −λ ∀k ∈ N.
k!
Tabloul de repartiţie este:
0 ... k ...
−λ λk
e −λ ... e k! ...
1 (x−µ)2
f (x, µ, σ) = √ e − 2σ2
σ 2π
Media şi dispersia sunt:
E (X ) = µ şi D 2 (X ) = σ 2 , ı̂n timp ce asimetria şi boltirea sunt nule. Se mai
numeşte şi repartiţia gaussiană.
Repartiţia normală standard
În cazul µ = 0, σ 2 = 1 densitatea de repartiţie devine:
1 x2
f (x) = √ e − 2
2π
În acest caz spunem că X urmează repartiţia normală standard, N (0, 1).
Dacă X ∼ N(µ, σ), atunci Z = X −µ
σ ∼ N(0, 1) şi poartă numele de standardizare.
Intervale de ı̂ncredere
Fie α ∈ (0, 1), foarte apropiat de 0 (de exemplu, α = 0.01, 0.02, 0.05etc). Numim
interval de ı̂ncredere pentru riscul α cu probabilitatea de ı̂ncredere 1 − α, un
interval aleator (Li , Ls ), astfel ı̂ncât
P(Li < x < Ls ) = 1 − α,
Valoarea α se numeşte nivel de semnificaţie sau probabilitate de risc şi măsoară
riscul ca intervalul identificat să nu conţină valoarea căutată.
b−µ
µ
P(−z α2 ≤ √ ≤ z α2 ) = 1 − α
σ/ n
Folosind datele,la nivelul unui eşantion (b
µ = x), intervalul de ı̂ncredere este:
σ σ
x − z α2 √ ≤ µ ≤ x + z α2 √
n n
cu o ı̂ncredere de 1 − α.
Valorile sale sunt timpi realizaţi ı̂ntre două evenimente repartizate Poisson P(λ),
presupunând că acesteau au loc cu o rată constantă. Spunem că
X ∼ exp(λ)(λ > 0) dacă are densitatea de repartiţie:
λe −λx x > 0
f (x; λ) =
0 x ≤0
1 1
Media şi dispersia sunt E(X ) = λ şi D 2 = λ2 .
Media şi dispersia sunt E(X ) = λa şi D 2 = λa2 . Se foloseşte pentru variabile
mărginite (inferior) şi reprezintă distribuţia timpului necesar pentru ca exact a
evenimente independente să aibă loc, considerând că acestea se petrec cu o rată
constantă.
Γ(1, λ) = exp(λ)
Repartiţii continue-Repartiţia χ2
0 x ≤0