Sunteți pe pagina 1din 29

UPT, Anul I CTI

Ghid pentru preg


atirea examenului MS.

2015

Partea relativ la P&S.

1. Probleme de num
arare: cardinalul produsului cartezian, |AB|, |A1 A2 An |,
cand multimile factor sunt nite; k-liste generale, k-liste de elemente distincte, permutari,
k-combinari, partitia unei multimi n k submultimi de cardinal prescris .
Exemplul 1. a) Cate coduri pin de 4 cifre se pot genera pentru cardurile de credit?
b) Cate parole de 8 caractere din multimea {a, b, . . . , x, y, z, &, , %, 0, 1, 2, . . . , 9} se pot
genera?
c) Cate stringuri de 32 de biti au suma bitilor egala cu 13?
d) Intr-o grila de coordonate ntregi (i, j), i = 0, 16, j = 0, 16 sunt admisibile doar
drumurile ce pornesc din (0, 0) si nainteaza e n sus, e la dreapta si au ca punct terminal
pe (16, 16). (desenati!!).
Cate astfel de drumuri trec prin (7, 11)?
e) Cate functii hash h : S10 {0, 1}5 exista, daca S10 = {s = c1 c2 . . . cn | ci
{a, b, c, d, . . . , k}, n 10}?
2. Definitia euristic
a a probabilit
atii unui eveniment:
a) cazul n care experimentul are un numar nit de realizari si acestea sunt echiprobabile si
b) calculul probabilitatii unui eveniment pe baza datelor rezultate din repetarea experimentului n aceleasi conditii .
3. Definitia unei familii admisibile de evenimente, operatii cu evenimente (intersectia,
diferenta). Definitia axiomatic
a a probabilit
atii. Calculul probabilitatii reuniunii a
doua sau mai multe evenimente ce nu sunt mutual exclusive Problema zilei de nastere,
enunt, rezolvare, interpretare si aplicatii n CS.
Este adevarat sau fals ca P (A\B) = P (A)P (B)? Pentru a rapunde corect exprimati
A ca reuniune de A \ B si A B (desenati diagrame Venn pentru A si B si discutati n
functie de pozitia lui B fata de A).
4. Probabilit
ati conditionate. Denitie.
Ce nseamna ca PB este o functie de probabilitate pe o familie admisibila de evenimente K, unde B K?
Formula de conditionare iterata, evenimente independente si distinctia dintre evenimente mutual exclusive si independente.
Exemplul 2. Daca A si B sunt evenimente independente si P (A) = 0.3, P (B) = 0.42,
calculati P (A B). Scrieti formula de conditionare iterata a evenimentelor A1 , A2 , . . . , An
si demonstrati-o pentru n = 2 si n = 3.
Daca o propozitie, f = w1 w2 w3 w4 , este succesiunea a 4 cuvinte, scrieti folosind formula
conditionarii iterate care este probabilitatea ca ntr-un corpus (baza de texte) sa existe
aceasta propozitie.

Exemplul 3. Daca P (A) = 0.3, P (B) = 0.3 si PB (A) = 0.3 deduceti care din armatiile
de mai jos sunt adevarate:
a) A si B sunt mutual exclusive;
b) P (A B) = 0;
c) A si B sunt independente;
d) toate proprietatile de la a)c);
e) nici una dintre a)d)
Formula probabilitatii totale, formula lui Bayes. Enunt si deducere. Interpretare.
Exemplul 4. (Examen Partial 2014) Un robot se misca ntr-un spatiu de lucru. El are
un senzor care poate masura distanta pana la obiectele din spatiul de lucru. Pe baza
informatiei primite de la senzor sistemul de calcul incorporat calculeaza probabilitatea ca
usa camerei de lucru sa e deschisa, pentru a transmite comanda corespunzatoare, intra
pe usa sau stop n fata ei.
Notam cu U evenimentul usa este deschisa. Usa este deschisa cu probabilitatea
p = 0.55. Robotul primeste informatia de la senzor ca o anumita distanta, D1 , pana n
zona usii este d1 . Din experienta robotului n campul de lucru, sistemul de calcul are
stocata informatia ca P ((D1 = d1 )|U ) = 0.65 respectiv P ((D1 = d1 )|U ) = 0.3.
Sa se calculeze probabilitatea ca usa sa e deschisa stiind ca distanta masurata este
d1 .
d) Sa se arate ca daca senzorul mai transmite o noua distanta (D2 = d2 ) pana la
un alt perete din jurul usii, atunci probabilitatea ca usa sa e deschisa actualizata de
informatiile (D1 = d1 ) si (D2 = d2 ) este:
P (U |(D1 = d1 ) (D2 = d2 )) = P (U |(D1 = d1 ))

P ((D2 = d2 )|U (D1 = d1 ))


P ((D2 = d2 )|(D1 = d1 ))

5. Variabile aleatoare discrete. Cum se da distributia de probabilitate a unei v.a.


discrete X?
a) printr-un tablou (modalitate clasica, specica n Romania):
(
X=

x1 x2 . . . xn
p1 p2 . . . pn

)
n
,
pk = 1
k=1

b) Tabel (modalitate specica n domeniul Computer Science):


x
pX (x)

2
1/6

5
8
2/3 1/6

unde linia lui x contine valorile variabilei aleatoare X, iar linia lui pX (x), probabilitatile
ca v.a. X sa ia valorile x, listate.

3
c) Precizand expresia analitica a distributiei de probabilitate, adica a functiei pX
denita pe domeniul valorilor DX , al variabilei aleatoare X, pX : DX [0, 1], pX (x) =
P (X = x). De exemplu pX (x) = 0.65x1 0.35, x = 1, 2, . . . , n, . . . (recunoasteti tipul
distributiei de probabilitate cu aceasta expresie?)
Distributia de probabilitate uniform
a pe o multime finit
a. De exemplu, daca
X este o v.a. uniform distribuita pe multimea literelor din alfabetul englezesc az (fara
majuscule) la care se adauga ciferele 0, 1, . . . , 9, care este expresia analitica a distributiei
pX (x), unde x este litera sau cifra din domeniul precizat?
Functia de repartitie a unei v.a. discrete, FX (x) = P (X x). Ce proprietati are
aceasta functie?
Exemplul 5.
O variabila aleatoare discreta, X, are distributia de probabilitate:
pX (x) =

5x
,
10

x = 1, 2, 3, 4

a) Sa se scrie tabelul explicit al distributiei lui X, sa se determine functia de repartitie si


P (2 X < 4). Calculati valoarea medie, M (X).
Scrieti pseudocodul de simulare a variabilei X, adica de calcul a unei valori de observatie
asupra lui X.
.
Exemplul 6. Dupa ce s-au monitorizat cererile de interogare a unei baze de date s-a
concluzionat ca distributia de probabilitate a cererilor ntr-un minut este cea din tabelul:
nr cereri
0 1
probabilit ? 0.4

2
3
0.2 0.15

4
5
0.1 0.05

a) Care este probabilitatea ca ntr-un minut sa nu existe nici o cerere de interogare a


bazei de date?
b) Calculati probabilitatea sa se nregistreze cel putin doua cereri.
d) Calculati numarul mediu de cereri de interogare/pe minut si abaterea standard.
Ce procent din valorile variabilei, X, ce are distributia data n tabel, intra n intervalul
(M (X) 2, M (X) + 2)?
Imaginea unei v.a. discrete printr-o functie.
Valoarea medie si dispersia unei v.a. discrete.
6. Vectori aleatori discreti. Vectori aleatori cu doua componente, (X, Y ). Cum se
deneste distributia de probabilitate a unui vector aleator (X, Y )?
a) Fie se da un tablou ca n cursul 3;
b) Fie un tabel de forma:
x y

pX,Y (x, y)

4
unde coloana lui x contine toate valorile variabilei X, coloana lui Y toate valorile
variabilei Y , iar pX,Y (x, y) = P (X = x, Y = y).
Aceasta a doua modalitate se foloseste frecvent si n designul sistemelor inteligente n
care sunt implicati vectori aleatori, (X1 , X2 , . . . , Xn ), cu mai mult de 2 componente:
x1

x2

. . . xn

pX1 ,X2 ,...,Xn (x1 , x2 , . . . , xn )

Important!! Cat este suma probabilitatilor de pe ultima coloana? Adica:

pX,Y (x, y),


(x,y)DX DY

respectiv:

pX1 ,X2 ,...,Xn (x1 , x2 , . . . , xn )

(x1 ,x2 ,...,xn )DX1 DX2 DXn

Cum se determina distributiile marginale ale lui X, respectiv Y din distributia vectorului aleator (X, Y )?
Determinarea distributiilor conditionate (X|Y = yj ), (Y |X = xi ) din distributia vectorului aleator (X, Y ).
Observatie: In inteligenta articiala se noteaza cu pX,Y (x, y) distributia de probabilitate a vectorului aleator (X, Y ), cu pX , pY distributiile marginale, iar cu p(x|y), respectiv
p(y|x) distributiile conditionate ale variabilelor (X|Y = y), respectiv (Y |X = x).
Variabile aleatoare discrete, independente.
Exemplul 7. Firma ta acorda asistenta telefonica clientilor. Evenimentele pe care le
raporteaza clientii sunt:
A: "PC-ul este virusat", si B: "un fi
sier sistem este corupt".
Probabilitatile producerii simultane a combinatiilor dintre aceste doua evenimente si
opusele lor sunt date n tabloul:

B
B

A
0.01
0.02

A
0.19
0.78

Fie (X, Y ) vectorul aleator ale carui coordonate sunt variabile aleatoare Bernoulli. X si
Y iau valoarea 1 daca se produce evenimentul A, respectiv B, si valoarea 0 n caz contrar.
Sa se deduca distributiile marginale ale lui X si Y . Sa se calculeze P (X = 1|Y = 0).
Rezolvare: Din datele problemei rezulta ca vectorul aleator (X, Y ) are distributia
din tabelul:

X
1
1 0.01
0 0.02

0
0.19
0.78

5
Prin urmare variabila aleatoare X are distributia
(
) (
)
1
0
1
0
X=
=
0.01 + 0.02 0.19 + 0.78
0.03 0.97
(

iar
Y =

1
0
0.01 + 0.19 0.02 + 0.78

(
=

1
0
0.2 0.8

P (X = 1, Y = 0)
Din tabelul vectorului aleator vedem ca P (X =
P (Y = 0)
1, Y = 0) = 0.02, iar din distributia lui Y avem ca P (Y = 0) = 0.8. Efectuam mpartirea
si gata!
P (X = 1|Y = 0) =

Vectori aleatori discreti de distributie uniform


a.
Distributia de probabilitate a unei variabile aleatoare Z = h(X, Y ). Aplicatie la cazul
h(x, y) = x + y.
7. Distributii discrete clasice.
Distributia Bernoulli, media, dispersia.
Distributia binomial
a. Ce este un experiment Bernoulli? Ce reprezinta o v.a. Binomiala asociata unui experiment Bernoulli? Formula mediei si dispersiei pt X Bin(n,p).
Distributia geometric
a. Ce reprezinta o v.a. geometrica asociata unui experiment
Bernoulli cu numar nelimitat de ncercari? Formula mediei si dispersiei, fara demonstratie.
Distributia Poisson. Ce indica o v.a. Poisson distribuita? Ce reprezinta parametrul
al distributiei Poisson? Care este domeniul valorilor si distributia de probabilitate pX (k),
pentru o v.a. X Pois()? Formula mediei M (X) si a dispersiei 2 (X).
Exemplul 8. La un nod internet, pachetele de informatie sosesc cu o rata de 100 pachete
pe minut.
Care este probabilitatea ca n nodul respectiv sa nu soseasca nici un pachet n 6
secunde?
(Statistica) Monitorizand nodul internet s-au nregistrat urmatoarele valori de observatie
(numar de pachete sosite in 8 secunde consecutive): 12, 15, 9, 11, 7, 5, 13, 6. Sa se calculeze
numar mediu de pachete/secunda din datele experimantale si sa se compare cu media
teoretica a variabilei X ce indica numarul de pachete sosite ntr-o secunda.

Exemplul 9. a) Ce este un experiment Bernoulli? Ce reprezinta valorile unei variabile


aleatoare X Bin(n, p) asociate experimentului? Ce anume reprezinta media M (X)
pentru experimentul Bernoulli? (Tocilarii raspund la aceasta ntrebare astfel: M (X) =
np. Raspunsul asteptat la examen este: media M (X) reprezinta numarul mediu de succese
n n ncercari!!!!!).
Ce distributie are ecare din variabilele:

6
Numarul de documente interogate de un sistem IR pana gaseste un cuvant cheie;
Numarul de coliziuni n 50 de transmiteri independente ale unor pachete de informatie;
Numarul de accesari ale unui server WEB ntr-o ora.
Fie X variabila aleatoare ce ia valoarea 1 daca evenimentul A se produce si 0 n
caz contrar. Care este distributia de probabilitate a lui X? Calculati valoarea medie si
dispersia, stiind ca P (A) = 0.57.
Distributia Zipf. Distributia de probabilitate Zipf simpla si de parametru , adica
1
, n cazul simplu si
sa stiti ca daca X Zipf si X ia n valori, atunci P (X = k) =
kHn
1
P (X = k) =
, n cazul distributiei Zipf generalizate.
k H (n)
8. Variabile aleatoare continue.
Distributia de probabilitate a unei v.a. continue se da precizand densitatea de probabilitate f : R R. Denitia functiei densitate de probabilitate.

P (X I) = I f (x) dx (probabilitatea ca variabila X sa ia valori n intervalul I este


integrala pe I din densitate.
Cum se deneste functia de repartitie, cunoscand densitatea fX a v.a. X?
Functia de repartit
xie a unei v.a. continue este o functie F : R R, denita prin
F (x) = P (X x) = fX (x) dx.
Functia de repartitie a unei variabile aleatoare continue este continu
a, ne-descrescatoare
(x < y F (x) F (y)) si limx F (x) = 0, limx F (x) = 1.
Probabilitatea ca X sa ia valori ntr-un interval de capete a < b, calculata cu functia
de repartitie:
P (a < X b) = P (a X < b) = P (a X b) = P (a < X < b) = F (b) F (a)
unde a, b R {}, F () = limx F (x), F () = limx F (x).
De tinut minte ca, pentru o variabila aleatoare continua avem:
P (X = a) = 0,

a R.

Argumentati de ce!!!
Observatie FFFF important
a:
a) V.a. discrete au functia de repartitie n scara, discontinua n ecare punct xk DX
mai precis F este continua la drepta n xk .
b) V.a. continue care au distributia de probabilitate denita de o densitate fX ,
au functia de repartitie, Fx , continua.
Care din gracele de mai jos este gracul unei distributii discrete si care pentru una

7
F (x)
1
1

F (x)

0.82
0.62
0.47
0.22

x
0
0

9 10 11

continua?

NU CONFUNDAT
I densitatea de probabilitate cu functia de repartitie!!!!!!!
Exemplul 10. care din functiile urmatoare este o densitate de probabilitate pe intervalul
[0, 1] (si egala cu 0 n rest)?
a)f1 (x) =

sin x,
2

b)f2 (x) = ex ,

c)f3 (x) =

2
(1 + x)2

Pentru functiile care sunt densitati sa se ae functiile de repartitie.


Exemplul 11. Daca o functie ia valoarea 2.5 ntr-un punct x poate ea functia de
repartitie a unei v.a. ? Daca da de ce, daca nu, de ce?
Histograma asociata unei densitati de probabilitate, interpretarea unei bare a histogramei ( mai precis a ariei barei). Algoritmul de constructie a histogramei asociate unei
serii de date x1 , x2 , . . . , xN .
Aplicatie. Daca ntr-un experiment nregistrati 150 de valori de observatie asupra
variabilei aleatoare X si 25 dintre acestea cad n intervalul [a, a+0.2), cum estimatti
din aceste informatii P (a X < a + 0.2)? Ce naltime are bara histogramei, desenata
deasupra intervalului [a, a + 0.2)?.
1. Daca simulatorul variabilei aleatoare X genereaza 34 de valori, din 170, n intervalul [1, 1.25), cum se estimeaza probabilitatea P (1 X < 1.25)? Ce naltime are bara
histogramei desenata deasupra intervalului [1, 1.25)?
Indicatie: Trebuie sa stiti modul de generare al unei histograme.
Media si dispersia unei v.a. X cand se cunoaste densitatea lui X.
2. a) Folosind proprietatile mediei unei v.a. X, sa se arate ca dispersia sa, este 2 (X) =
M (X 2 ) (M (X))2 .
b) O v.a. X are media M (X) = 1, si M (X 2 ) = 2. Sa se calculeze dispersia 2 (X).
Indicatie: Se porneste de la denitia dispersiei:
2 (X) = M ((X m)2 ),

8
unde m = M (X). Se ridica la patrat (X m)2 si se aplica operatorul medie M .
3. Fie X o v.a. ce are media m = 3, si dispersia 2 = 1.5, iar Y = 3X 2 + X 1. Sa se
calculeze valoarea medie M(Y) a v.a. Y.
Distributia uniforma pe un interval [a, b): densitatea de probabilitate, functia de
repartitie, justicarea numelui de distributie uniforma, calculul mediei si dispersiei. Particularizare la [a, b) = [0, 1).
Distributia Exp(): densitatea de probabilitate, deducerea functiei de repartitie.
Formula mediei si dispersiei.
Reguli de calcul a mediei si dispersiei
Inegalitatea Markov si Cebasev.
Exemplul 12. Din experienta si istoricul examenelor din anii trecuti s-a dedus ca media
la prima prezentare la PS este de 7.60. Determinati o margine superioara a probabilitatii
ca nota pe care o iei la aceasta prezentare sa e mai mare de 8.75.
Media unei v.a. Y = g(X), unde X are densitatea f .
Exemplul 13. Fie X U nif [0, 5). Sa se calculeze M (X 2 3).
Distributia Pareto. Densitatea de probabilitate, deducerea functiei de repartitie,
calculul mediei si dispersiei si evidentierea parametrului pentru care media si/sau dispersia nu exista (n CS se considera ca atunci cand dispersia nu exista ea este , adica
avem v.a. cu dispersie innita, ceea ce intuitiv nseamna ca valorile v.a. sunt mprastiate
oricat de mult n jurul mediei).
1. Vectori aleatori continui
Densitatea de probabilitate a unui vector aleator continuu, (X, Y );
Calculul probabilitatilor de forma P ((X, Y ) D), cu ajutorul densitatii.
Denitia functiei de repartitie cu ajutorul densitatii ;
Determinarea densitatilor marginale fX , fY din densitatea vectorului aleator, fX,Y ;
Calculul functiilor de repartitie marginale FX , FY ;
Vector aleator uniform distribuit pe o multime marginita de arie nita, D;
Media unei variabile aleatoare Z = g(X, Y );
Variabile aleatoare independente; Vectori aleatori uniform distribuiti cu coordonate
independente ; Aceasta proprietate o folosim la generarea de puncte uniform distribuite
pe un domeniu din plan;
4. Variabilele aleatoare X, Y sunt independente si uniform distribuite, respectiv pe
intervalele [1, 2], [3, 5]. Ce distributie de probabilitate are vectorul aleator (X, Y )?
Justicati raspunsul! Scrieti pseudocodul de simulare a vectorului (X, Y ). Care este
probabilitatea ca simuland vectorul (X, Y ) sa e returnat un punct din patratul [0, 1]
[3, 4]?
Variabile aleatoare conditionate: formula densitatii de probabilitate g(x|y0 ),
h(y|x0 ); Formula lui Bayes pentru densitati de probabilitate

9
5. Tensiunea receptata ntr-un sistem de comunicatie este suma a doua variabile aleatoare
V = X + Y , unde X Bernoulli(p) este mesajul aleator, iar Y N (0, 1) este zgomotul.
Presupunand ca X si Y sunt independente sa se determine functia de repartitie a lui V ,
conditionata de X = b, b {0, 1}
Indicatie: P (V x|X = b) = P (b + Y x) = P (Y x b).
6. Vectorul aleator (X, Y ) are densitatea de probabilitate:
{ 1
(x + y) 0 < x < 2, 0 < y < 2
f (x, y) =
8
0
n rest
a) Sa se calculeze densitatile marginale fX , fY , P (X > 1), M(X) si 2 (X).
b) Sa se determine densitatea variabilei conditionate (Y |X = 1) si apoi sa se calculeze
P (0 < Y < 0.5|X = 1).
7. Un vector aleator (X, Y ) are densitatea de probabilitate:
{
6x x 0, y 0, x + y 1
fX,Y (x, y) =
0 n rest
a) Sa se determine densitatea marginala fY .
b) Sa se calculeze densitatea conditionata a variabilei (X|Y = 0.5) si valoarea ei medie.
y

(x = 0, y = 0.5)

y = 0.5

(x = 0.5, y = 0.5)

O
x

a)

{
fY (y) =

fX,Y (x, y)dx =

1y
0

6xdx y [0, 1]
n rest

Explicatie pentru limitele de integrare: pentru ecare y xat n [0, 1], x merge de la 0
pana ntalneste dreapta x + y = 1, adica pana x = 1 y. b)

fX,Y (x, 0.5)


pt. x [0, 0.5]
f (x|y = 0.5) =
fY (0.5)

0
n rest

10
In lungul dreptei y = 0.5, x-ul merge de la 0 la 0.5 (vezi gura).
Valoarea medie a variabilei conditionate, (X|Y = 0.5) se calculeaza ca pntru orice
variabila aleatoare continua si anume:

0.5
M (X|Y = 0.5) =
xf (x|0.5)dx =
xf (x|0.5)dx

8. Un vector aleator are densitatea de probabilitate


{
2 x y pentru x (0, 1), y (0, 1)
fX,Y (x, y) =
0
n rest
Sa se calculeze P (X +Y < 1), densitatea marginala fX (observati o simetrie ce va permite
sa deduceti fara calcule si fY ), P (Y 1/2) si cov(X, Y ).

Indicatie: P (X + Y < 1) = P ((X, Y ) D) = D fX,Y (x, y)dxdy, unde D este


domeniul D = {(x, y) R2 | x + y < 1} (desenati domeniul D pentru a stabili corect
limitele de integrare!)
cov(X, Y ) = M (XY ) M (X)M (Y ) si:

1 1
M (XY ) =
xyfX,Y dx dy =
xy(2 x y)dx dy
R2

9. (Examen 2009) Fie X si Y timpii de executie a doua procese paralele, independente


si uniform distribuite pe (0, 2), respectiv (0, 5). Sa se determine probabilitatea ca primul
proces sa e executat naintea celui de-al doilea.
Indicatie: In general, probabilitatea ca o variabila aleatoare X sa e mai mica sau
egala decat Y este exprimata ca probabilitatea unui eveniment relativ la vectorul aleator
(X, Y ):
P (X < Y ) = P ((X, Y ) D),

unde D = {(x, y) | x < y}

Desenati domeniul D si apoi calculati

P ((X, Y ) D) =

fX,Y (x, y)dxdy


D

10. Vectorul aleator (X, Y ) este uniform distribuit pe un dreptunghi [1, 3] [2, 5]. Sa
se scrie expresia analitica a densitatii sale de probabilitate, si sa se calculeze P ((X, Y )
D), unde D este domeniul triunghiular ale carui varfuri sunt A(1, 2), B(3, 2), C(3, 5).
Scrieti pseudocodul de generare a n = 1000 puncte n triunghiul ABC.
10. Simularea variabilelor aleatoare
Generatorul liniar congruential; Denitie, deciente; Generatorul randu;
Simularea distributiei uniforme pa [a, b).

11
Pe baza acestei proprietati, daca notam cu urand() generatorul de numere pseudo
aleatoare uniform distribuite pe [0, 1), atunci:
a+(b-a)*urand();
este generatorul de numere pseudoaleatoare uniform distribuite pe [a, b).
Simularea distributiei uniforme discrete; cu demonstratie; algoritm de extragere la
ntamplare dintr-o multime nita de numere ntregi consecutive m, m + 1, . . . , n;
Aplicatie: Variabila aleatoare X este uniform distribuita pe multimea {2; 4; 6; 8; 10}.
Sa se determine distributia de probabilitate a variabilei Y = X/2 + 5, valoarea medie a
lui Y si sa se descrie modalitatea de simulare a lui Y. .
Aplicatie: Dati pseudocodul algoritmului de simulare a unei variabile aleatoare discrete si uniform distribuita pe multimea {0, 1, 2, . . . , n 1}
(
X=

0
1
n

1 ... n 1
1
1
...
n
n

Simularea v.a. discrete si cazul particular Bernoulli.


Simularea unei v.a. aleatoare binomiale.
Simularea distributiei geometrice;
Simularea variabilelor aleatoare continue prin metoda inversarii. Demonstratia ca
daca functia de repartitie a lui X, FX este inversabila si U Unif[0,1), atunci FX1 (U ) are
distributa lui X.
Simularea unui vector aleator uniform distribuit pe un dreptunghi si pe un domeniu
arbitrar de arie nita si nenula;
Denitia unei distributii de probabilitate compuse (mixturi), modalitate de simulare);
Aplicatie: Fie X variabila aleatoare ce reprezinta mantisa unui numar n virgula mobila, exprimat n baza b = 10, generat de un algoritm probabilist. Algoritmul genereaza
doar numere cu mantisa cuprinsa ntre 1/10 X < 1. Stiind ca densitatea de probabilitate a lui X este

pt. x < 1/10


0
1/(x ln 10) pt. x [1/10, 1]
f (x) =

0
pt. x > 1
sa se arate ca X se poate simula prin metoda inversarii. Dati pseudocodul algoritmului
de generare a n valori de observatie asupra variabilei aleatoare X.
Aplicatie: O variabila aleatoare, X, ce are functia de repartitie
F (x) =

1
, x R
1 + ex

se zice ca are distributia de probabilitate logistica. Se foloseste n studiul retelelor neuronale.

12
Sa se arate ca daca U este o variabila aleatoare uniform distribuita pe [0, 1), atunci
U
are distributia de probabilitate logistica.
X = ln
1U
Cum simulati o v.a. ce este logistic distribuita? Se poate aplica metoda inversarii? .
11. O v.a. X ce are densitatea de probabilitate:
fX (x) =

1 |x|/
e
,x R
2

se zice ca are distributia Laplace sau dublu exponentiala.


a) Vericati ca f este ntr-adevar o densitate de probabilitate.
b) Un router poate transmite pachetele dintr-un nod pe doua rute. Diferenta ntre
timpii de ntarziere n transmiterea pe cele doua rute este o v.a. X ce are distributia
Laplace de parametru . Exprimati n cuvinte evenimentul E = (3 X 2) (0
X 3) si apoi calculati probabilitatea lui: P ((3 X 2) (0 X 3)).
12. X este variabila aleatoare ce indica durata de buna functionare a laptopului tau.
Firma producatoare are mentionat n prospect ca acest tip de laptop functioneaza n
medie 5000 de ore.
a) Ce distributie de probabilitate are X? b) Tu folosesti laptopul 6 ore pe zi. Care
este probabilitatea ca el sa reziste 4 ani?
1.2. Covarianta a dou
a variabile aleatoare. Variabile aleatoare corelate si
necorelate. Covarianta variabilelor aleatoare independente.
Dispersia sumei a doua variabile aleatoare X, Y , dependente si independente. Coecientul de corelatie (X, Y ). In ce interval ia valori? Cat este (X, Y ) daca Y =
0 + 1 X?
13. Fie Y = X + N , stiind ca 2 (X) = 0.81), 2 (N ) = 0.25 si ca variabilele X, N sunt
independente.
a) Sa se calculeze P (Y = 0|X = 0) (NU va nevoie de nici un calcul, ci doar de
cunoasterea unui rezultat teoretic!).
b) Sa se calculeze (X, Y ).
Calculul lui (X, Y ):
(X, Y ) = (X, X + N ) =

cov(X, X + N )
(X)(X + N )

Dar,
cov(X, X+N ) = M (X(X+N ))M (X)M (X+N ) = M (X 2 +XN )M (X)(M (X)+M (N ))
Aplicand nca o data proprietatea de liniaritate a mediei avem:
cov(X, X + N ) = M (X 2 ) + M (XN ) (M (X))2 M (X)M (N )

13
Variabilele X si N ind independente rezulta ca M (XN ) = M (X)M (N ) si deci:
cov(X, X + N ) = M (X 2 ) + M (X)M (N ) (M (X))2 M (X)M (N ) = 2 (X) = 0.81
La numitorul fractiei (X, Y ) mai avem de calculat (X + N ). Calculam 2 (X + N ) =
2 (X) + 2 (N ) + 2 cov(X, N )
| {z }
=0,X,N indep.

14. Fie X Exp(1/), Y Exp(1/) doua variabile aleatore independente si exponential


distribuite. Sa se calculeze P (X < Y ).
15. Variabilele aleatoare X1 , X2 sunt independente si identic distribuite avand, respectiv,
M (X1 ) = 1, (X1 ) = 0.5, M (X2 ) = 2, 2 (X2 ) = 0.64. Sa se calculeze cov(Y, X2 ), unde
Y = X1 + 2X2 .
Determinarea distributiei de probabilitate a transform
arii unei variabile
aleatoare, X n g(X), unde g este functie continu
a, inversabil
a sau neinversabil
a.
16. Sa se determine distributia de probabilitate a unei variabile aleatoare Y = X + a,
a > 0, unde X Exp(). Desenati gracul densitatii lui Y .
17. Determinati distributia de probabilitate a unei variabile aleatoare Y = U 3 , unde
U U nif [0, 1).
2. Distributia normal
a, denitie proprietati ale variabilelor Z N (0, 1) si apoi
ale variabilelor X N (m, ). Proprietatea functiei de repartitie . Denitia cvantilei.
Calculul probabilitatilor P (X I), unde I poate orice tip de interval real.
Vectori aleatori normal distribuiti (distributia normala bivariata). Semnicatia parametrilor (m, ) pentru distributia normala bivariata. Caracterizarea sectiunilor cu plane
paralele cu x1 Ox2 , a gracului densitatii normale bivariate.
Distributia imaginii printr-o transformare liniara si ana a unui vector aleator normal
distribuit .
Exemplul 14. Variabilele aleatoare X, Y sunt independente si normal distribuite, X
N (1.5, 2 = 0.81), Y N (0, 2 = 1.44). Sa se calculeze P (X 2Y ) > 2 si 2 (X 2Y ).

Exemplul 15. Un vector aleator (X1 , X2 ) normal distribuit are vectorul mediilor m =
(m1 , m2 )T si matricea de covarianta:
)
(
11 12
=
21 22
Sa se determine vectorul mediilor si matricea de covarianta a vectorului (Y1 , Y2 ), unde
Y1 = X1 2X2 , Y2 = 3X1 + X2 .
Daca m = (1, 2.5)T , iar
(
)
0.64 0.75
=
0.75
1.44

14
Sa se calculeze P (Y1 > M (Y1 )).
Exemplul 16. Vectorul aletaor (X, Y ) (N (m, ), unde m = (8, 2)T , iar
(
)
4 1
=
1 1.69
a) Cat este coecientul de corelatie (X, Y )? Sa se determine x astfel ncat P (X > x) =
0.975.
b) Sa se calculeze P (M (Y ) 2(Y ) < Y < M (Y ) + 2(Y )).
3. Lanturi Markov. Denitia, proprietatile matricilor stochastice, probabilitatea
ca lantul sa evolueze pe o traiectorie. Distributia de probabilitate la momentul n (a
variabilei Xn ).
Distributia de echilibru: denitie, relatia cu sirul n . Lanturi Markov ireductibile si
aperiodice. Algoritmul PageRank.
Lanturi Markov absorbante. Matricea de tranzitie sub forma standard. Studiul limitei
cand n din Qn . Semnicatia elementelor matricii fundamentale, N si a matricii N R.
Numarul mediu de pasi ai lantului, ce pleaca dintr-o stare i, nainte de a absorbit.
Intrebari:
a) Daca Q este matricea de tranzitie a unui lant Markov, ce probabilitate reprezinta
elementul din pozitia (i, j) a matricii Q si apoi a matricii Qn , n > 1?
b) Daca n = [n (1), n (2), . . . , n (m)]T este distributia de probabilitate la momentul
n, expimati n cuvinte ce reprezinta n (3)?
c) Cum argumentati ca daca Q este matricea de tranzitie a unui lant Markov cu m
stari, Q admite valoarea proprie 1?
d) Ce ntelegeti printr-o distributie de echilibru a unui lant Markov?
e) Ce ati dedus din curs relativ la lanturile periodice? Ce anume mpiedica existenta
unei distributii de echilibru ca limita a sirului n , pentru un astfel de lant?
f) De ce este matricea Google, G, matricea unui lant ireductibil si aperiodic?
Daca aati un vector propriu v, corespunzator valorii 1, pentru matricea de tranzitie,
Q, cum deduceti distributia de echilibru din v? Nu e sucient sa scrieti doar o formula,
ci trebuie explicata modalitatea folosita.
18. Un lant Markov are matricea de tranzitie:

0.1 0.2 0.4


0
0.7 0.2
Q=
0
0.3 0.3
0.4 0
0.3

0.3
0.1

0.4
0.3

a) Desenati graful de tranzitie si explicati de ce lantul este ireductibil si aperiodic.


b) Sa se calculeze P (X4 = 3|X0 = 2, X1 = 2, X2 = 3, X3 = 1);

15
c) Care este probabilitatea ca lantul sa evolueze pe traiectoria de noduri (4, 1, 3, 2)?
stiind ca distributia initiala de probabilitate, 0 , este distributia uniforma pe multimea
nodurilor.
d) Matricea Q are vectorul propriu v = (0.5, 0.5, 0.5, 0.5) corespunzator valorii proprii
1, iar QT are vectorul propriu w = (0.22, 0.660.52, 0.48)T corespunzator aceleiasi valori.
Care din cei 2 vectori conduce la distributia de echilibru a lantului Markov? Determinati
coordonatele distributiei de echilibru, , si explicati ce reprezinta a doua corrdonata, 2 .
19. Un lant Markov, ce are matricea de tranzitie:

0.85 0.05 0.05 0


0.05
0.2 0.6 0.1 0
0.1

0.15
0.05
0.5
0.25
0.05
Q=

0.3 0.05 0.05 0


0.6
0
0
0
0
1
modeleaza comportamentul unui navigator pe WEB, pe site-ul unui shop online. Cele 5
noduri ale grafului de tranzitie codica una din actiunile navigatorului pe site:
1- Da click-uri pe diverse produse;
2 Citeste sierele ce descriu produsele sau contin review-uri;
3 Cumpara un produs (completeaza formularul online cu adresa de expediere si detaliile cardului);
4 Da click pentru conrmarea comenzii;
5 Paraseste site-ul.
a) Ce fel de lant este acest lant Markov? Este el ireductibil si aperiodic sau este un
lant absorbant? Justicati raspunsul!
b) Scrieti pseudocodul care determina distributia de probabilitate n . Ce reprezinta
coordonatele vectorului probabilist 6 ?
c) Observam ca numarul mediu de vizite ale nodului 4 nainte de a iesi de pe site este
de fapt numarul mediu de produse cumparate de pe acest site. Scieti etapele de calcul,
care conduc la aarea acestui numar mediu de produse cumparate, stiind ca navigarea a
inceput din nodul 1.

0
0
1
0
0.3
0
0 0.7

20. Un lant Markov pe un spatiu cu 4 stari are matricea de tranzitie: Q =


0 0.4 0.1 0.5
0.2 0.4 0.4
0
Sa se deseneze graful de tranzitie. Daca distributia initiala de probabilitate este
distributia uniforma sa se calculeze probabilitatea ca un agent ce navigheaza de la un
nod la altul al grafului conform matricii de tranzitie sa parcurga urmatoarea traiectorie:
4, 3, 3, 2, 1, 3, 4.
Sa se determine apoi probabilitatea ca la doilea pas n graf agentul sa e n nodul 4.
Transpusa matricii Q are vectorul propriu v = [0.13793, 0.24631, 0.29557, 0.3202]T ,
corespunzator valorii proprii 1. Ce reprezinta vectorul v pentru lantul Markov si ce
interpretare au coordonatele sale?

16
4 Procese Poisson. Denitia si implicatiile ei.
Demonstratia ca variabila aleatoare intersosiri are distributia Exp( = 1/)
Distributia de probabilitate a momentului sosirii celui de-al n-lea client, Tn (sau momentului producerii celui de-al n-lea eveniment din cele contorizate de un proces Poisson),
M (Tn ).
Mixarea mai multor procese Poisson (rata procesului mixat). Propozitia relativ la
distributia de probabilitate a sumei a doua v.a. independente, Poisson distribuite (enunt
si demonstratie). Descompunerea unui proces Poisson n n subprocese, ca urmare a rutarii
aleatoare a clientilor spre divesre cozi.
21. La o celula a unui sistem de comunicatie wirelles apelurile sosesc conform unui proces
Poisson de rata 4 apeluri pe minut. Sa se calculeze:
probabilitatea ca n primele 5.5 minute sa nu soseasca nici un apel;
probabilitatea ca n primele 180 secunde sa se nregistreze 5 apeluri, iar n primele
300 de secunde 8 apeluri (atentie, la a doua ntrebare se cere probabilitatea unui singur
eveniment A B)).
Care este lungimea medie (n secunde) a intervalului de timp ntre doua apeluri?
5 Statistic
a. Problematica statisticii. Estimatori punctuali ai: mediei, dispersiei,
covariantei.
Estimatorul verosimilit
atii maxime. Argumente pentru considerarea functiei de
verosimilitate. Aplicatii la: estimatorul verosimilitatii maxime pentru parametrii: de
la Exp, media, dispersia de la distributia normala, cu toate cele trei cazuri. Estimatorul verosimilitatii maxime pentru din Poisson(). Se poate estima parametrul din
distributia Pareto prin metoda verosimilitatii maxime?
Estimatorul celor mai mici p
atrate, aplicatie la estimarea parametrului p al
distributiei Binomiale. Cum puteti estima parametrul p al distributiei geometrice: prin
metoda verosimilitatii maxime sau metoda celor mai mici patrate?
Drumul spre Teorema limit
a central
a, adica ce distributie de probabilitate are o
combinatie liniara a n v.a. independente, normal distribuite? Enuntul si interpretarea
teoremei limita centrala, si forma a doua relativ la distributia sumei Sn = X1 +X2 + +Xn
.
.

Probleme
Parcurgeti si rezolvati problemele de la seminar, Teme, Problemele de antrenamwent pentru lucrarile de control, partial si examen.

22. Pentru un proiect la computer vision trebuie sa dezvolti o aplicatie ce identica


fetele unor persoane cu o acuratete de 95%. Aplicatia foloseste imaginile unui sistem ce
achizitioneaza 100 de fete umane pe zi.

17
a) Care este probabilitatea ca aplicatia sa nregistreze exact 10 erori de recunoastere
ntr-o zi? b) Care este probabilitatea sa ai o zi fara esecuri n recunoasterea fetelor?
23. Numarul de erori ntr-o nregistrare pe un DVD este o v.a. Poisson cu o medie de
o eroare la ecare 105 biti. Un sector de date consta din 4096 octeti.
a) Care este probabilitatea ca ntr-un sector sa existe mai mult de o eroare?
b) Care este numarul mediu de sectoare pana este identicata o eroare?
Indicatie: Determinati parametru pentru v.a. Poisson, X, ce da numarul de erori
ntr-un sector. b) Daca X Pois() si Y este v.a. ce da numarul de sectoare fara erori
pana la sectorul n care se identica eroare, ce distributie are Y ? Care este parametrul p
ce caracterizeaza distributia de probabilitate a lui Y ? (acest parametru se calculeaza ca
probabilitatea unui eveniment relativ la v.a. X).
24. Cererile de acces la http://www.evz.ro constituie un proces Poisson cu rata = 20
cereri pe minut. Azi la ora 12, tu ncepi sa monitorizezi site-ul.
a) Care este probalitatea ca n primul minut sa existe mai putin de 4 cereri de acces?
b) Calculati probabilitatea ca durata de timp pana la primul acces ncepand cu ora
12, sa e mai mare de 12 secunde.
c) Sa se determine media si dispersia timpului ce trece de la ora 12 ncepand pana la
a 8-a cerere de acces.
d) Numarul de accesari ale paginii evz.ro ntr-o ora este Poisson distribuit de medie
600. Vrei sa calculezi probabilitatea ca site-ul sa e accesat de mai mult de 650 ori ntr-o
ora. Calulati aceasta probabilitate stiind ca n acest caz distributia Poiss() este bine
aproximata de N (, 2 = ).
25. Intr-un birou sierele sunt directionate catre imprimanta cu o medie de 5 n 30
de minute. a) Care este durata medie a intervalului de timp dintre doua directionari
la imprimanta? Care este probabilitatea ca urmatorul sier sa e trimis la printat n
urmatoarele 5 minute?
26. Un vector aleator (X, Y ) are distributia de probabilitate:
{
a(x2 y + xy + 2y) pt.(x, y) [0, 1] [0, 1]
f (x, y) =
0
n rest
a) Sa se determine constanta a > 0;
b) Sa se deduca distributiile marginale fX , fY si distributia conditionata fX|Y =y .
c) Sa se calculeze P (X 0.5|Y = 0.5) si valoarea medie a variabilei (X|Y = 0.5).
27. Un vector aleator (X, Y ) are distributia de probabilitate:
{ 2
(x + 2y) pt. (x, y) [0, 1] [0, 1]
f (x, y) =
3
0
n rest
a) Sa se calculeze P (X >= Y );

18
b) Sa se determine cov(X, Y ) si (X, Y ).
28. Timpii de procesare n secunde, a 10 joburi de catre procesor, sunt:
70; 36; 43; 49; 82; 48; 34; 62; 35; 15
Sa se determine estimatorul timpului mediu de procesare si abaterea standard.
29. Un DVD contine o zona nenregistrata de 350MB. Care este probabilitatea ca
aceasta zona de memorie sa e sucienta pentru a copia 300 de fotograi de dimensiuni
independente, de medie 1MB si abatere standard 0.5?
30. Sa se determine cov(X,Y) stiind ca vectorul aleator (X, Y ) are distributia de probabilitate data n tabloul de mai jos:

Y
0
-1 0.24
0 0.14
1 0.4

1
0.06
0.16
0

31. Sistemul de operare al unui sistem de calcul uniprocesor are un timer intern care
suna ntr-o succesiune de intervale aleatoare de timp ce sunt exponential si independent
distribuite de parametru . Durata de procesare a unui job este o variabila aleatoare
exponential distribuita de parametru , independenta de variabila ce da intervalul aleator
ntre doua semnale ale timer-ului. Daca jobul nu este complet procesat n momentul n
care timerul suna, el este trecut la capatul cozii de joburi si procese. Presupunem ca la
momentul t = 0 ncepe atat procesarea job-ului cat si pornirea timer-ului.
a) Sa se determine densitatea de probabilitate a momentului aleator n care procesorul
sistemului de operare stopeaza jobul, e datorita terminarii procesarii lui, e datorita
faptului ca timerul a emis semnalul de trecere a acestuia la capatul cozii.
b) Care este probabilitatea ca timerul sa sune nainte ca procesarea jobului sa e
completa?
32. Un esantion de 3 observatii 0.4, 0.7, 0.9 a fost nregistrat asupra a 3 indivizi dintr-o
populatie statistica a carei caracteristica de interes este aleatoare de distributie : f (x) =
x1 , x [0, 1] si f (x) = 0 n rest. > 0 este un parametru.
a) sa se determine media teoretica a distributiei de probabilitate si apoi sa se deduca
din aceasta un estimator pentru din esantionul de valori.
b) Sa se determine estimatorul verosimilitatii maxime a lui .
33. Un calculator din incinta bancii BXX, opereaza n doua moduri: este accesibil
clientilor sau angajatilor. In ecare ora el ramane n acelasi mod sau trece n al doilea
mod de functionare conform urmatoarei matrici de tranzitie:
(
)
0.4 0.6
Q=
0.6 0.4

19
Daca sistemul este n modul I de functionare la ora 12.30, care este probabilitatea ca el
sae n modul al doilea la ora 17.30.
34. Un lant Markov cu patru stari S = {1, 2, 3, 4} are matricea de tranzitie:

0.80 0.14 0.04 0.02

0 0.6 0.3 0.10

Q=

0
0 0.65 0.35
0.90
0
0 0.10
Sa se calculeze P (Xn = 3|Xn2 = 2).
Admite lantul o distributie de echilibru? Argumentati raspunsul. Daca da, scrieti
ecuatiile care algebric, conduc la distributia de echilibru.
35. Simulatorul unei variabile aleatoare binomiale X Bin(50,0.3), returneaza numarul
35. Care este multimea valorilor variabilei X simulate si ce reprezinta numarul 35 generat
(interpretarea valorilor unei v.a. binomiale)?
36. Din experienta si istoricul examenelor din anii trecuti eu, EP, stiu ca media la prima
prezentare la PS este de 7.30. a) determinati o margine superioara a probabilitatii ca
nota sa e mai mare de 8. (Indicatie: M (X) = 7.30. Din inegalitatea lui Markov, avem
ca: P (X 8) M (X)/8).
b) Tot din ceilalti ani eu am dedus ca abaterea standard a notei este = 0.5. Sa se
estimeze probabilitatea ca n acest an un student sa ia la prima prezentare o nota cuprinsa
ntre 6.30 si 8.30. (indicatie conform inegalitatii Cebasev avem ca: P (|X 7.30| < 2)
1 1/k 2 )
37. Fie T durata de viata al unui tip de chip. T este o variabila aleatoare ce are
densitatea de probabilitate:
{
0 daca x < 1
c
fT (x) =
daca x 1
x3
a) Sa se determine constanta c;
b) Sa se calculeze probabilitatea P (T > M (T )), unde M (T ) este media variabilei aleatoare
T.
38. O v.a. X are functia de repartitie:

daca x < 0
0
sin x daca x [0, /2]
F (x) =

1
daca x > /2
a) Pentru ce valoare x R avem ca P (X > x) = 0.5?
b) Sa se determine densitatea de probabilitate a lui X.

20
39. O variabila aletoare X are densitatea de probabilitate
{
5(1 x)4 daca 0 < x 1
f (x) =
0
n rest
Calculati functia de repartitie si determinati intervalele pe care este inversabila. Pe astfel
de intervale calculati inversa ei si scrieti pseudocodul de simulare a variabilei X.
40. Fie X o variabila aleatoare ce are M (X) = 2 si 2 (X) = 1, iar Y = 3X + 2.
a) Sa se calculeze covarianta variabilelor X, Y ;
Daca N este un zgomot de medie 0 si dispersie 2 = 0.42 , independent de variabila
aleatoare X, sa se calculeze media si dispersia variabilei Y = 3X + 3 + N .
41. 3.5p Algoritmul de generare de puncte uniform distribuite pe discul eliptic D =
x2 y 2
{(x, y) |
+
1 0} este:
25
9
do{
x 5 + 10 rand;
y 3 + 6 rand;
}while(x x/25 + y y/9 > 1);
return (x, y);
Ce vector aleator este simulat n interiorul buclei do-while? Generarea unui punct n disc
imita un proces Bernoulli. Sa se determine probabilitatea succesului si sa se calculeze apoi
probabilitatea ca primul punct sa e generat dupa ce bucla do -while a fost parcursa de
3 ori. Care este numarul mediu de parcurgeri ale buclei pana la generarea unui punct n
discul D?
42. Fie X o variabila aleatoare ce are M (X) = 2 si 2 (X) = 1, iar Y = 3X + 2.
a) Sa se calculeze covarianta variabilelor X, Y ;
b) Daca N este un zgomot de medie 0 si dispersie 2 = 0.42 , independent de variabila
aleatoare X, sa se calculeze media si dispersia variabilei Y = 3X + 3 + N .
43. Sa se determine matricea de covarianta a doua variabile aleatoare discrete, X, Y ,
stiind ca distributia de probabilitate a vectorului aleator (X, Y ) este cea din tabelul:

Y
0
-1 0.24
0 0.16
1 0.4

1
0.06
0.14
0

44. a) La un nod internet, pachetele de informatie sosesc cu o rata de 100 pachete pe


minut.

21
i) Care este probabilitatea ca n nodul respectiv sa nu soseasca nici un pachet n 6 secunde?
ii) Dar probabilitatea ca 2 sau mai multe pachete sa soseasca n 6 secunde?
iii) Cat este numarul mediu de pachete ce sosec ntr-un minut?
45. a) Un sistem electronic contine 15 componente. Probabilitatea ca o componenta
sa cada (sa esueze n functionare) este de 0.15, si componentele cad independent una de
alta. Stiind ca cel putin patru, dar nu mai mult de 7 componente au cazut, care este
probabilitatea ca numarul celor cazute sa e exact 5?
46. Daca ntr-o ncercare Bernoulli codicam cu 1 succesul si cu 0 esecul si X1 , X2 , . . . , X10
sunt 10 ncercari independente, n care probabilitatea esecului este q = 0.1, calculati
P (X1 , X2 , . . . , X10 ) = (b1 , b2 , . . . , b10 ), unde bi {0, 1}, i = 1, n.
47. Intervalul de timp ntre doua pachete de informatie, pe un canal de comunicatie
internet, are distributia Pareto de parametri > 0, > 1:
( )

daca x
f (x; , ) =
x x

0
n rest
a) Stiind ca = 0.1secunde sa se determine estimatorul verosimilitatii maxime pentru intensitatea , a utilizarii canalului de comunicatie, pe baza valorilor de selectie:
x1 , x2 , . . . , xn ;
b) Daca valorile de selectie de la a) sunt:
0.18, 0.10, 0.13, 0.10, 0.11, 0.12, 0.10, 0.11, 0.14, 0.11
Sa se determine un estimator al lui .
48. Un simulator al distributiei Bernoulli
(
)
1
0
X=
p 1p
de parametru p necunoscut genereaza stringul de biti:
1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1
Sa se determine estimatorul verosimilitatii maxime al parametrului p pe baza esantionului
de biti.
49. Deniti estimatorul celor mai mici patrate (LSE) si deduceti estimatorul LSE al
parametrului p al distributiei geometrice pe baza unei singure observatii x.
50. Fie X, Y doua variabile aleatoare independente, X N (150, 32 ), Y N (100, 42 ).
a) Sa se determine distributiile ariabilelor aleatoare X + Y , X Y , X 3Y .

22
b) Sa se calculeze P (X + Y < 242.6) si P (|X Y | < 40).
51. Variabilele aleatoare X, Y sunt independente si normal distribuite, X N (10, 2 =
2.95), Y N (10, 2 = 2.9). Sa se determine distributia de probabilitate a variabilei
3X 2Y si sa se calculeze probabilitatea P (7 < 3X 2Y 12.5).
52. Pentru a estima rata sosirii cererilor de acces la o baza de date s-au monitorizat
intervalele de timp dintre noua cereri consecutive si s-au nregistrat valorile:
0.2929, 0.0999, 0.1443, 0.0230, 0.0543, 0.1568, 0.7980, 0.0393, 0.1621

Care este estimatorul ratei sosirilor ?


53. Timpii de executie ( n secunde) a 40 de job-uri procesate de un server, nregistrati
ntr-un sir de experimente independente sunt:
10 19 90
23 13 36
27 1 57
9 11 20

40 15 11 32 17 4
101 2 14 2 23 34
17 3 30 50 4 62
13 38 54 46 12 5

152
15
48
26

Sa se determine estimatorul punctual al mediei si dispersiei timpului de executie.


54. Fie X1 , X2 , . . . , X50 variabile aleatoare discrete i.i.d, avand distributia de probabilitate Poisson de parametru lambda = 2.5. Care este distributia de probabilitate a v.a.
medie aritmetica X 50 . Calculati P (X 50 > 3.
55. Fie (X, Y ) un vector aleator ce are densitatea de probabilitate fX,Y . Sa se exprime
modul de calcul al probabilitatilor evenimentelor A, B, A B C cu ajutorul densitatii,
stiind ca evenimentele sunt:
A = (X 2, 1 < Y 3),

B = (2 < X 3, Y 1),

C = (2 < X 3, 1 < Y 3)

Indicatie: a) Evenimentul A se poate exprima echivalent, n forma:


A = ((X, Y ) (, 2] (1, 3]),
adica A este evenimentul ca vectorul aleator (X, Y ) sa ia valori n D = (, 2] (1, 3].
Astfel putem scrie:
)

2 ( 3
P (A) = P ((X, Y ) D) =
fX,Y dxdy =
f (x, y)dy dx
D

56. Variabila aleatoare X are distributia Unif(3,5). Daca generati 60 de valori de


observatie, independente x1 , x2 , . . . , x60 sa se ae media M (X 60 ) si abaterea standard
(X 60 ).

23
57.
Setul de date de intrare pentru un program contine 60% date de tipul I si 40% date
de tipul II. Intrarile pot produce mesaje de atentionare n procent de 25% (cele de tipul
I), respectiv 15% (cele de tipul II). Daca dupa rulare este asat un mesaj de atentionare,
care este probabilitatea ca el sa e cauzat de datele de intrare de tipul I?
58. Ce este un estimator centrat al unui parametru statistic ? Care este estimatorul centrat, s2 , al dispersiei, dedus din esantionul x1 , x2 , . . . , xn , ce este constituit din observatii
asupra variabilelor i.i.d. X1 , X2 , . . . , Xn , cu 2 (Xi ) = 2 , i = 1, n? Care din relatiile
urmatoare ar trebui demonstrata pentru a decide ca s2 este un estimator centrat?
i)

M ((Xi X)2 ) = n 2 ,

i=1

ii)

i=1

M ((Xi X)2 ) = (n1) 2 ,

iii)

M ((Xi X)2 ) = (n+1) 2

i=1

Explicati!
59. a) Evaluarea candidatilor pentru acceptare la practica, la rma FF, se face folosind
un punctaj pe o scara de la 0 la > 0 ( depinde de rma). Densitatea de probabilitate
a punctajului, X, este:
{
x + /2
daca 0 < x <
f (x) =
2
0
n rest
Sa se determine functia de repartitie a punctajului si apoi probabilitatea ca pe o scara de
la 0 la 10 sa nregistrezi un punctaj mai mare de 8.50.
b) Un vector aleator (X, Y ) este uniform distribuit pe domeniul triunghiular de varfuri
O(0, 0), A(2, 0), B(0, 1). Sa se determine densitatea de probabilitate a lui (X, Y ), probabilitatea P ((X, Y ) [0, 0.25] [0, 0.25]) si sa se dea pseudocodul de simulare a lui (X, Y ).
60. a) Fie X o variabila Pareto de parametri , . Se stie ca M (X) =

, > 1, >
1

0, iar dispersia este nita pentru > 2.


Daca generezi 50 de esantioane a cate 100 de valori, xk1 , xk2 , . . . , xk100 , k = 1, 50,
xk + xk2 + + xk100
din Pareto( = 0.75, = 2.5), sunt medile experimentale xk = 1
,
100
k = 1, 50, observatii asupra unei variabile aproximativ, normal distribuite? Argumentati
raspunsul. Daca rapunsul este pozitiv, deduceti media si dispersia variabilei aleatoare X,
din care se presupune ca sunt observate mediile experimentale xk , k = 1, 50.
c)
Deniti contextul n care se pune problema determinarii estimatorului celor
mai mici patrate pentru parametrul al unui model statistic. Ce este estimatorul celor
mai mici patrate?
Un esantion de valori: 0.93, 0.32, 0.41, 0.27, 0.26 a fost nregistrat asupra a 5 indivizi
dintr-o populatie statistica a carei caracteristica de interes este aleatoare de distributie:
f (x) = x1 , x (0, 1) > 0, si f (x) = 0 n rest.

24
Sa se deduca estimatorul verosimilitatii maxime pentru parametrul dintr-un esantion
general x1 , x2 , . . . , xn (0, 1) si apoi estimatorul corespunzator esantionului concret.
61. a) Fie X, Y doua variabile aleatoare Bernoulli, independente, ce iau valorile 1 si 0
cu probabilitatile 2/3, respectiv, 1/3. Sa se determine distributia de probabilitate sumei
modulo 2, a variabilei aleatoare X + Y . Explicati calculele!
b) Durata n secunde a serviciului procesorului pentru o clasa de job-uri este o variabila
aleatoare X, ce are distributia de probabilitate o mixtura de doua distributii: f (x) =
pf1 (x) + (1 p)f2 (x), unde p = 2/3, iar f1 , f2 sunt densitatile de probabilitate pentru
Exp( = 2.4), respectiv Exp( = 1.5). Sa se calculeze probabilitatea ca durata de servire
sa e de cel mult 2 secunde. Fara a efectua calculul integralei de denitie sa se determine
valoarea exacta a mediei duratei serviciului procesorului pentru aceasta clasa de joburi.
62. a) Intr-un sistem de comunicatie se transmite un semnal de voltaj X = 1 si se
receptioneaza un semnal Y = X +N , unde N este un zgomot normal distribuit de medie 0
si dispersie 0.25. Stiind ca X = 1, sa se calculeze media si dispersia semnalului receptionat
Y si sa determine functia sa de repartitie. Calculati apoi P (Y > 0.5) si determinati x R
astfel ncat (Y > x) cu o probabilitate de 0.975.
b) Consideram un model Markov pentru parcurgerea automata a unui document ce
contine litere L, cifre C si alte caractere S (semne de punctuatie, blank, etc). Matricea de
tranzitie de la un tip de simbol la altul este:

L
C
S

L
C
0.7 0.1
0.5 0.3
0.5 0.1

S
0.2
0.2
0.4

Presupunem ca simbolul curent X0 = L este o litera. Calculati probabilitatea ca


urmatoarele trei simboluri sa e cifre si apoi probabilitatea P (X2 = S|X0 = L). Matricea
de tranzitie Q si transpusa sa, QT , au aceleasi valori proprii 1 = 1, 2 = 0.2, 3 = 0.2.
Vectorul propriu v, al lui Q, Qv = 1 v, este v = (0.5, 0.5, 0.5)T , iar al lui QT , este vectorul
w, QT w = 1 w, unde w = (0.91, 0.18, 0.36)T . Din aceste informatii deduceti care este
distributia de echilibru a lantului Markov.
c) Daca o caracteristica a unei populatii este cuanticata de o variabila aleatoare X ce
are densitatea de probabilitate f , sau n cazul n care variabila este discreta, distributia de
probabilitate P (X = x) = p (x), depinde de , necunoscut, cum se deneste estimatorul
celor mai mici patrate pentru ? Aplicatie la determinarea estimatorului celor mai mici
patrate pentru parametrul p al distributiei binomiale.
Urmatoarele valori ar putea utile (0) = 0.5, (2) = 0.9772, (1.5) = 0.9332,
(0.5) = 0.6915.
z0.25 = 0.6744, z0.5 = 0, z0.95 = 1.6448, z0.975 = 1.96

25
63. a) O aplicatie de recunoastere a formelor clasica obiectele n clase. Stiind ca a
clasicat corect 80% dintre datele test si ca rezultatele clasicarii a diferite date sunt
independente, care este distributia de probabilitate a variabilei aleatoare ce da numarul
de exemple dintr-un set de 25 ce sunt corect clasicate? Sa se calculeze probabilitatea ca
cel mult un exemplu sa fost clasicat incorect. Care este numarul mediu de exemple
clasicate corect, din cele 25?
b) Nota studentilor la examenul P&S este o variabila aleatoare X, ce are densitatea
de probabilitate:

1 ( x ) 1

pentru x [0, 10]


f (x) =
>0
10
10

0
n rest,
Parametrul difera de la o grupa la alta.
Sa se determine functia de repartitie si apoi sa se calculeze probabilitatea sa iei la
examen nota intre 7 si 9, inclusiv, stiind ca parametrul caracteristic grupei tale este
= 1.2.
c) Un vector aleator (X, Y ) este uniform distribuit pe domeniul D din R2 , ce este
reuniune a domeniilor D1 = {(x, y) | x [0, 1] [0, 1]}, D2 = {(x, y) | x + y 2 0, x
[0, 1], y (1, 2]}.
Desenati cele doua domenii si determinati densitatea de probabilitate, fX,Y , a vectorului aleator (X, Y ) si probabilitatea P ((X, Y ) D2 .
Dati
pseudocodul de simulare a vectorului aleator (X, Y ).
64. a) Graful din gura:
p
1

2
p(1 p)

(1 p)2

p
3
p(1 p)

(1 p)2

1p

p
1

este este subgraful de tranzitie al unui pachet de informatie ntr-o retea wirelles. Nodul
1 este nodul sursa din care porneste informatia si nodul 4 este destinatia. Sa se scrie
matricea de tranzitie a lantului Markov denit de acest graf. Care noduri sunt tranzitorii
si care sunt absorbante? Deduceti matricea de tranzitie ntre starile tranzitorii si matricea
fundamentala N , a lantului Markov n cazul n care p = 1/3. Deduceti din matricea N
care este numarul mediu de pasi n retea pe care i face un pachet de informatie forwardat
de nodul 2, nainte de ajunge la destinatie.
65. a) Cum se deneste standardizata variabilei Y N (2, = 0.25) si ce distributie de
probabilitate are aceasta? Calculati P ((Y 2.5) (Y > 1.25)). O variabila aleatoare
normal distribuita, X N (m, (6.5)2 ), are media m necunoscuta. Sa se determine m
astfel ncat P (X < 30) = 0.95.
b) Cererile de acces ale site-ului dezvoltat de tine constituie un proces Poisson cu rata
= 20 cereri pe minut. Azi la ora 12, ncepi sa monitorizezi site-ul.
Care este probalitatea ca n primul minut sa existe mai putin de 4 cereri de acces?
Sa se determine media si dispersia timpului ce trece de la ora 12 ncepand, pana la
a 8-a cerere de acces.

26
66. Sa se deduca formula de calcul pentru probabilitatea ca un lant markov, Xn sa
parcurga o traiectorie:
P (X0 = s0 , X1 = s1 , . . . , Xi = si , . . . , Xn = sn )
cunoscand distributia de probabilitate initiala.
67. Enumerati, descrieti si explicati metodele pe care le stiti pentru a calcula distributia
de echilibru a unui lant Markov, ireductibil si aperiodic (atat metode exacte cat si algoritmice.
68. Deniti ce este un proces Poisson (denitia cu 3 proprietati) si dati un exemplu concret de proces Poisson. Demonstati ca variabila aleatoare X ce da lungimea intervalului
de timp ntre doua sosiri ntr-un proces Poisson de rata , are distributia Exp(1/).
69. Sa se deduca relatia dintre functia de reparitie FX a unei variabile aleatoare X
(m, ) si functia de repartitie a v.a. standard Z N (0, 1).
70. a) Fie (Xn ) este un lant Markov pe multimea starilor S = {1, 2, . . . , m}, de matrice
de tranzitie Q si distributia initiala de probabilitate 0 . Scrieti proprietatea de baza a
lantului Markov si anume, lipsa sa de memorie. Sa se completeze semnul ntrebarii cu
evenimentul adecvat: P (X5 = j|X2 = 4) = P (?|X0 = 4) si sa se argumenteze solutia
data.
Sa se enunte si sa se demonstreze formula de calcul a probabilitatii ca lantul sa evoleze
pe traiectoria s0 , s1 , . . . , sk .
b) Fie X N (10, 22 ), Y N (8, 32 ), (X, Y ) = 0.4. Sa se determine vectorul medie
m si matricea de covarianta a vectorului aleator (X, Y ) si sa se calculeze dispersia
2 (2X 3Y ) si P (X > 9).
c) Deniti covarianta a doua variabile aleatoare X, Y . Ce sunt variabilele aleatoare
necorelate? Sa se arate ca daca X, Y sunt doua variabile aleatoare (continue) si independente atunci variabilele X, Y sunt necorelate.
71. O variabila aleatoare X = 2 + 1.2Z, unde Z N (0, 1). Ce distributie de probabilitate are X? calculati P (1 < X < 1.5).
72. Sa se determine n functie de repartitia a distributiei normale standard N (0, 1),
functia de repartitie a variabilei aleatoare Y = 5X, unde X N (1, = 0.7).
Indic:
FY (x) = F5X (x) = P (5X x) = P (X x/5) =
73. Timpul cat i ia unui calculator sa se conecteze la un server este aleator si are
distributia de probabilitate, T N (m = 3.3sec, = 0.66sec).
a) Un calculator se zice ca are conexiune rapida daca se conecteaza n mai putin de
2.5 sec. Care este procentul de calculatoare ce fac parte din aceasta categorie?
b) Care este timpul minim de conexiune pentru cele mai lente 5% calculatoare?

27
Indicatie:
a) P (T < 2.5) =???; b) P (T > t) = 0.05
74. O clasa de imagini color folosite ca date de antrenament pentru un algoritm de
recunoastere a formelor are distributia de probabilitate a culorilor de baza R, G, B, o
mixtura gaussiana 1D:
f = 0.3fR + 0.48fG + 0.22fB
unde fR , fG , fB , sunt respectiv densitatile distributiilor normale: N (m = 195.2, = 0.8),
N (199.5, 1.0), N (203.5, 1.7) (media pt ecare reprezinta numarul mediu de pixeli colorati
cu acea culoare).
0.20

0.15

0.10

0.05

0.00
190

195

200

205

210

Sa se calculeze probabilitatea ca o imagine sa aiba mai mult de 200 de pixeli din


aceasta mixtura.
Indicatie: Notam cu Im variabila aleatoare ce are ca distributie a culorilor, mixtura
f . Din defnitia mixturii (vezi cursul aferent) avem ca functia de repartitie a mixturii este:
FIm (x) = 0.3FR (x) + 0.48FG (x) + 0.22FB (x)
Atunci probabilitatea ceruta este:
P (Im > 200) = 1P (Im 200) = 1FIm (200) = 1(0.3FR (200)+0.48FG (200)+0.22FB (200))
Fiecare functie de repartitie FR , FG , FB ind repartia unei distributii normale se calculeaza
cu ajutorul repartitie normale standard N (0, 1), .
75. Doua variabile aleatoare X, Y au o dependenta liniara Y = 3X + 1. a) Cat
este coecientul de corelatie al celor doua variabile aleatoare? b) Calculati covarianta
cov(X, Y ) siind ca 2 (X) = 0.64 si 2 (Y ) = 1.21.
76. Un semnal S normal distribuit, S N (1, = 1.2), este transmis printr-un canal de
comunicatie si este receptat ca o variabila aleatoare R = S + Z, unde Z N (0, 0.25) este

28
zgomotul independent de S, adaugat semnalului prin canal. Calculati media si dispersia
semnalului receptat, R si cov(S, R).
Indicatie: In general cov(X, Y + Z) = cov(X, Y ) + cov(X, Z), pt ca:
cov(X, Y + Z) = M (X(Y + Z)) M (X)M (Y + Z) =
= M (XY ) + M (XZ) M (X)M (Y ) M (X)M (Z) =
= M (XY ) M (X)M (Y ) + M (XZ) M (X)M (Z) = cov(X, Y ) + cov(X, Z)
77. Pipelining este o tehnica folosita de microprocesoare, ce consta n executia unei
instructiuni nainte ca prima (precedenta) sa e completa. Adica exista simultan cateva
instructiuni n pipeline, ecare ntr-un stadiu diferit de procesare.
Termenul pipelining s-a extins si la transiterea pachetelor de nformatii. Pentru a
modela un astfel de pipeline cu doua stadii (twostage pipeline), printr-un lant Markov
discret xam protocolul de transmitere:
ecare stadiu (etapa) are un singur buer;
Intr-o unitate de timp xata pachetul poate face o singura tranzitie;
intervalul de timp dintre k si k + 1 se numeste slot time. Presupunem ca pipeline-ul
evolueaza astfel ntr-un slot:
daca la nceputul slot-ului nu exista pachete n stadiul 1, atunci soseste un nou
pachet n acest stadiu cu probabilitatea p, independent de istoria trecuta a pipeline-ului
si de ce se ntampla n stadiul doi;
daca la nceputul unui slot, exista un pachet n stadiul 1 si nici un pachet n stadiul
2, atunci pachetul este transferat din stadiul 1 n stadiul 2 cu probabilitatea p1 ;
daca la nceputul unui slot exista un pachet n stadiul 2, atunci pachetul pleaca din
acest stadiu si paraseste sistemul cu probabilitatea p2 , independent de ce se ntampla n
stadiul 1.
Starile modelului pipeline sunt S = {00, 01, 10, 11}, unde de bitii din perechea b1 b2 S
indica cate pachete exista n stadiul 1, respectiv 2.
Din descrierea protocolului de transmitere a pachetelor avem probabilitatile de tranzitie:
p intre starile 00 si 10;
p1 ntre 10 si 01;
p2 ntre 11 si 10.
a) Deduceti probabilitatile de tranzitie corespunzatoare celorlalte arce din graful din
Fig. 1:
b) Aratati ca lantul Markov este ireductibil precizand traiectoriile care unesc orice
stare b1 b2 cu o alta distincta c1 c2 . Argumentati de ce este lantul si aperiodic. Gasiti
distributia de echilibru.
c) In cazul n care p = p1 = p2 = 1/2 sa se scrie matricea de tranzitie si sa se calculeze
probabilitatea P (X3 = 11|X0 = 00, X1 = 10, X2 = 01).
78. Un vector aleator (X, Y ) are densitatea de probabilitate
fX,Y (x, y) =

1 (x2 +y2 )/2


e
, (x, y) R2
2

29
00

01

p1
p

10

p2

11

Fig.1:

Vectorul (Z, W ) are coordonatele denite astfel:


Z = X cos + Y sin
W = X sin Y cos
Sa se determine densitatea de probabilitate a vectorului (Z, W )
79. Care din urmatoarele matrici poate matricea de covariatie a unui vector aleator
normal distribuit:
(
)
(
)
(
)
1 2
0.64 0.72
1 1
1 =
, 2 =
, 3 =
2 3
0.72
2.25
1
1
Matricea care poate o matrice de covariatie este matricea vectorului aleator (X, Y )
normal distribuit de medie m = [2, 1] .
a) Sa se ae coecientul de corelatie (X, Y ) si sa se precizeze ce particularitate ar
avea un nor de puncte rezultat din simularea vectorului (X, Y ).
b) Sa se determine descompunerea Cholesky a matricii de covariatie a vectorului
(X, Y ).
c) Sa se precizeze distributia de probabiliate a lui X, respectiv Y , si sa se determine
y R astfel ncat P (Y > y) = 0.98. Sa se calculeze probabilitatae P (0.5 < X 2Y 1).
80. Un vector aleator normal distribuit (X, Y ) N (m, ) are media m = [0 0] si
matricea de covariatie:
(
)
5 2
=
2 5
Fie T o transformare liniara de matrice:
(
)
1 1
A=
1 1
Sa se determine distributia de probabilitate a vectorului aleator (Z, W ) = T (X, Y ). Sunt
coordonatele Z si W independente? Sa se calculeze P ((Z, W ) (0, 4) (1, 1)).

S-ar putea să vă placă și