Sunteți pe pagina 1din 5

Distribuția geometrică

X ~ Geom(p), p ∈ (0,1)

Distribuția geometrică este un caz special al distribuției binomiale negative. Tratează


numărul de încercări necesare pentru un singur succes.
Definiție: Numim variabilă aleatoare geometrică cu parametrul p ∈ (0,1) o variabilă
aleatoare X reprezentând numărul de încercări efectuate într-un șir de experimente Bernoulli
independente, cu același parametru p până la apariția primului succes, adică:
X = numărul de încercări efectuate până la prima apariție a succesului.

Funcția densitate de probabilitate:


f(x) = P(X = x) = p(1− p ¿ ¿ x−1, unde x = 0,1,2...n
p = probabilitatea succesului într-un experiment individual
Setul de valori: S X = {0,1,2,...}
Distribuția geometrică este utilă pentru modelarea numărului de eșecuri înainte de primul
succes. Distribuția oferă probabilitatea ca la prima reușită să existe zero eșecuri, un eșec înainte
de primul succes, două eșecuri înainte de primul succes, etc.

Proprietățile distribuției geometrice


Distribuția geometrică este o distribuție discretă de probabilitate care are proprietatea de
lipsă a memoriei (eng. memoryless property), ceea ce înseamnă că, dacă un succes nu a avut loc
încă la un moment dat, distribuția probabilității numărului de defecțiuni/eșecuri suplimentare nu
depinde de numărul de defecțiuni/ eșecuri deja observate.
Pentru toți i, j ∈ {0,1,...} are loc relația:
P{X ≥ i+j | X≥ i} = P{X≥ j}
De obicei, această proprietate se referă la cazurile în care distribuția unui „timp de
așteptare” până la un anumit eveniment nu depinde de cât timp a trecut deja. Pentru a modela cu
exactitate situațiile fără memorie, trebuie să „uităm” în permanență în ce stare se află sistemul:
probabilitățile nu vor fi influențate de istoria procesului.
Media și varianța variabilei aleatoare geometrice cu parametrul p sunt:
1 1− p
M(X) = ; σ 2(X) = 2 .
p p
Prezentarea funcției de densitate geometrică în R cu ajutorul funcției "dgeom"
(Geometric Density):
Funcția dgeom(k, prob) calculează probabilitatea să existe k eșecuri înainte de primul
succes, în care parametrul „prob” este probabilitatea succesului la fiecare încercare.
x_dgeom <- seq(0, 20)
y_dgeom <- dgeom(x_dgeom, prob = 0.5)
plot(y_dgeom, type="p", ylim=c(0,1), main="Distributia geometrica pentru p=0.5", ylab="P(X=x)",
xlab="X=Numarul de esecuri inainte de primul succes")

Funcția de repartiție (funcția de distribuție cumulativă geometrică CDF)


Funcția de repartiție a variabilei X este:
F(n) = P[X ≤ n] = 1-(1− p)n, n ∈ {1,2,...}
Fiind definite ca probabilități, valorile funcției de repartiție vor fi, evident, numere reale
din intervalul [0;1], deci: 0 ≤ F(n) ≤ 1.

Prezentarea funcției de repartitie în R cu ajutorul funcției "pgeom" (Geometric


Cumulative Distribution):
x_pgeom <- seq(0, 20)
y_pgeom <- pgeom(x_pgeom, prob = 0.5)
plot(y_pgeom, type="p", ylim=c(0,1), main="Distributia geometrica pentru p=0.5", ylab="P(X=x)",
xlab="X=Numarul de esecuri inainte de primul succes")

Funcția inversă:
F-funcția de distribuție X, astfel încât pentru F(x)=1-(1-p)x, pentru x ∈ X.
F-1(x) = min{x∈X: F(x) ≥ r} unde r ∈ (0,1) este inversa funcției X.
ln ⁡(1−r )
F-1(r) = , r∈ (0,1)
ln ⁡(1−p)
Funcția inversă, precum funcția densității de probabilitate și funcția de repartitie,
determină complet distribuția.
Prezentarea funcției inverse în R cu ajutorul funcției "qgeom" (Geometric Quantile
Function):
x_qgeom <- seq(0, 1, by = 0.01)
y_qgeom <- qgeom(x_qgeom, prob = 0.5)
plot(y_qgeom)
Generarea distribuției de selecție
Exemplu: Un operator sportiv selectează la întâmplare persoane pe stradă până când
întâlnește pe cineva care a participat la un joc sportiv în sezonul trecut. Cu ajutorul distribuției
geometrice dorim să identificăm care este probabilitatea să întânească 3 persoane (x=3) care nu
au participat la un joc înainte de primul succes, când p=0.2 din populație a participat la un joc.
p = 0.20, n = 3
dgeom(x = n, prob = p)
# Generam un numar mare de esantioane
mean(rgeom(n = 10000, prob = p) == 3)
data.frame(x = 0:10, prob = dgeom(x = 0:10, prob = p)) %>%
mutate(Failures = ifelse(x == n, n, "other")) %>%
ggplot(aes(x = factor(x), y = prob, fill = Failures)) + geom_col() + geom_text(aes(label = round(prob,2), y =
prob + 0.01), position = position_dodge(0.9), size = 3, vjust = 0) + labs(title = "Probabilitatea ca X = 3 eșecuri înainte de
primul succes", subtitle = "Geometric(.2)", x = "Eșecuri înainte de primul succes (x)", y = "Probabilitatea")
Aplicabilitatea distribuției geometrice:
Distribuția geometrică este utilă pentru determinarea probabilității unui succes, având un
număr limitat de studii, încercări. Prin urmare, există o varietate de scenarii ce pot fi modelate
prin distribuții geometrice:
- În sport, în special în baseball, este utilă în analiza probabilității ca un jucător să obțină
un succes înainte de a primi trei lovituri; aici scopul este de a ajunge la un succes în trei
încercări;
- În analizele cost-beneficiu, cum ar fi o companie care decide dacă să finanțeze studii de
cercetare care, dacă vor avea succes, vor câștiga companiei un profit estimat. Scopul este
de a atinge un succes înainte ca, costul să depășească potențialul câștig;
- În managementul timpului, scopul este de a finaliza o activitate înainte de o anumită
perioadă de timp;
- alte aplicații, similare celor de mai sus sunt ușor de construit, distribuția geometrică
aplicându-se la nivel intuitiv în viața de zi cu zi.

S-ar putea să vă placă și