Documente Academic
Documente Profesional
Documente Cultură
Problema 1
Se dau trei urne U0, U1, U2 cu următorul conţinut. Urna U0 goală, urna U1 conţine 3 bile
albe şi 3 bile negre iar urna U2 conţine 2 bile albe şi 2 bile negre.
Se extrage o bilă din urna U1 şi dacă este albă se pune în urna U0 iar dacă este neagră se
pune în urna U2; se extrage apoi o bilă din urna U2 şi dacă este albă se pune în urna U0 iar
dacă este neagră se pune în urna U1. Se continuă procedeul, extrăgînd alternativ bile din
urnele U1 şi U2 şi procedînd ca mai înainte.
Care este probabilitatea ca după exact 5 extrageri, începînd cu urna U1, să obţinem 4 bile
albe în urna U0 ?
Soluţie. Avem următoarele 4 cazuri favorabile pentru realizarea cerinţei din enunţ:
I II III IV V
A a1 a2 a1 n2 a1
B a1 a2 n1 a2 a1
C a1 n2 a1 a2 a1
D n1 a2 a1 a2 a1
unde prin ai am notat extragerea unei bile albe din urna Ui iar prin ni am notat extragerea unei
bile negre din urna Ui ( i = 1 sau 2 ).
Probabilităţile celor patru evenimente sunt:
1 1 2 2 1 1
P(A) = . . . . =
2 2 5 3 5 75
1 1 3 1 1 3
P(B) = . . . . =
2 2 5 4 2 160
1 1 1 2 1 1
P(C) = . . . . =
2 2 3 3 5 90
1 2 3 1 1 3
P(D) = . . . . =
2 5 5 4 2 200
Deoarece evenimentele A, B, C, D sunt incompatibile rezultă că, probabilitatea cerută
este:
1 3 + 1 + 3 96 + 135 + 80 + 108 419
P= + = =
75 160 90 200 25.32.52 7200
Problema 2
Într-o urnă sînt 3 bile roşii, 2 bile albe şi o bilă neagră. Extragem bile una cîte una
succesiv, respectînd regula următoare:
- dacă la o extragere obţinem o bilă roşie, nu o înapoiem şi procedăm la o nouă extragere;
- dacă la o extragere obţinem o bilă albă, nu o înapoiem dar oprim procesul de extragere;
- dacă la o extragere obţinem bila neagră, o punem la loc în urnă şi oprim procesul de
extragere.
Care este probabilitatea ca în urnă să mai rămînă k bile ( k = 2, 3, 4, 5, 6 ).
( G.M.B. nr 1/1976)
1
Soluţie: Să notăm cu R extragerea unei bile roşii, cu A extragerea unei bile albe şi cu N
extragerea bilei negre.
a) Probabilitatea ca în urnă să rămînă 2 bile.
În acest caz, afară vor fi 4 bile şi pentru realizarea acestui eveniment e necesară
următoarea succesiune: R R R A. Deci,
3 2 1 2 1
P(2) = . . . =
6 5 4 3 30
b) Probabilitatea ca în urnă să rămînă 3 bile.
În acest caz, avem două succesiuni: R R A sau R R R N. Deci,
3 2 2 1
P(RRA) = . . =
6 5 4 10
3.2.1.1 1
P(RRRN) = =
6 5 4 3 60
Aşadar:
1 1 7
P(3) = + =
10 60 60
c) Probabilitatea ca în urnă să rămînă 4 bile.
În acest caz, avem două succesiuni necesare: R A sau R R N. Deci,
3 2 1
P(RA) = . =
6 5 5
3 2 1 1
P(RRN) = . . =
6 5 4 20
Aşadar:
1 1 1
P(4) = + =
5 20 4
d) Probabilitatea ca în urnă să rămînă 5 bile.
În acest caz, avem două succesiuni necesare: "R N" sau "A". Deci,
3 1 1
P(RN) = . =
6 5 10
2 1
P(A) = =
6 3
Aşadar:
1 1 13
P(5) = + =
10 3 30
d) Probabilitatea ca în urnă să rămînă 6 bile.
În acest caz este necesar să extragem, de prima oară, bila neagră. Deci,
1
P(6) =
6
Observaţie: Să constatăm că evenimentele considerate reprezintă o partiţie a spaţiului,
deci este firesc să avem:
1 7 1 13 1
P(2) + P(3) + P(4) + P(5) + P(6) = + + + + =1
30 60 4 30 6
Problema 3
Se iau la întîmplare două unghiuri u şi v. Considerăm că un unghi poate lua numai valori
de la 00 la 1800. Care este probabilitatea ca ele să fie unghiuri ale unui triunghi ascuţitunghic
2
?
Soluţie. Pentru ca u şi v să fie unghiuri ale unui triunghi oarecare este necesar ca u + v <
1800; dacă cerem, în plus, ca triunghiul să fie ascuţitunghic este necesar ca, în plus, u < 900 , v
< 900 şi u + v > 900.
Obţinem, astfel, un sistem de inecuaţii:
0 ≤ u ≤ 1800
0 ≤ v ≤ 1800
u + v < 1800
u < 900
v < 900
u + v > 900
Problema 4
Doi ţintaşi trag asupra aceleiaşi ţinte cîte un foc. Ţinta se află aşezată între ţintaşi, coliniar
cu poziţiile acestora. Distanţa dintre ţintaşi este de 7 unităţi de lungime, iar bătaia armelor este
de peste 7 unităţi. (Excludem posibilitatea ca ţintaşii să se lovească unul pe altul). Ţintaşii
lovesc ţinta cu probabilităţile:
1 2
P1(x) = P2(y) =
x+1 y+2
unde x şi y sînt distanţele de la ţintaşi la ţintă.
Să se afle poziţia ţintei astfel ca probabilitatea ca aceasta să fie lovită să fie minimă. Cît
este această probabilitate ?
(G.M.B. nr. 12, 1975)
Soluţie:
3
Fie, pe axă, A(0) şi B(7) poziţiiile celor doi ţintaşi şi M(x) poziţia ţintei, 0 ≤ x ≤ 7.
Probabilitatea ca ţinta să fie lovită va fi:
P = P1 + P2 - P1.P2
unde P1, P2 sînt cele din enunţ. Deci:
1 2 1 2
P(x) = + - .
x+1 (7-x)+2 x+1 (7-x)+2
Derivînd funcţia P(x), obţinem:
x2 + 18x - 63
P'(x) =
( x + 1 )2 . ( 9 - x )2
P'(x) = 0 pentru x1 = 3 şi x2 = -21. Soluţia care ne interesează este cea din interiorul
intervalului [0,7], deci x = 3.
Se constată uşor că:
P'(x) < 0 , x ∈ [0,3) şi P'(x) > 0 , x ∈ (3,7]
ceea ce arată că x=3 este un punct de minim pentru funcţia P(x).
Deci avem probabilitatea minimă ca ţinta să fie lovită cînd ţinta se află la distanţa de 3
unităţi de primul ţintaş şi, implicit, la 4 unităţi de al doilea ţintaş.
1
Această probabilitate este: P(3) =
2
Problema 5
Un automobilist pleacă din oraşul A pe o şosea. La 40 de km distanţă de oraşul A, şoseaua
se intersectează cu o cale ferată. La ora 1:00 prin această intersecţie va trece un tren.
Automobilistul pleacă din oraşul A între orele 0 şi 0:30, momentul plecării fiind aleatoriu, şi
parcurge distanţa pînă la intersecţie cu o viteză medie aleatorie cuprinsă între 0 şi 90 km/h.
Care este probabilitatea ca automobilistul să treacă prin intersecţie înainte de trecerea
trenului ?
Soluţie: Să notăm cu t momentul plecării şi cu v viteza medie cu care sînt parcurşi cei 40
km pînă la intersecţie.
Să reprezentăm, într-un sistem de axe ortogonal, pe abscisă timpul iar pe ordonată viteza.
Problema 6
Următoarea serie de date arată preţul de vânzare (sute lei) pentru 13 lucrări de grafică la o
licitaţie de obiecte de artă: 51, 60, 72, 35, 32, 57, 63, 61, 48, 33, 67, 54, 37.
Stabiliţi valoarea de adevăr a următoarelor afirmaţii, justificând răspunsurile:
a) 25 % dintre lucrarile licitate s-au vandut pentru un pret mai mic de 48 sute de lei;
b) jumatate dintre lucrarile licitate au un pret mai mic sau egal cu 54 sute lei;
c) 25 % dintre lucrari s-au vandut cu cel putin 62 sute de lei;
d) pentru 75% dintre obiecte s-a obtinut un pret de cel putin 36 sute lei;
e) precizati care dintre urmatoarele valori: 25, 29, 16, 40, 124, 85, 99,8 sute lei sunt
outliers in raport cu datele initiale.
Rezolvare:
Cele n=13 valori ale seriei de date se ordonează crescător:
x(1)=32, x(2)=33, x(3)=35, x(4)=37, x(5)=48, x(6)=51, x(7)=54, x(8)=57, x(9)=60, x(10)=61,
x(11)=63, x(12)=67, x(13)=72.
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13
25% 75%
Q1
36
Cu interpretarea:
25 % dintre termenii seriei au valori mai mici decat 36 sute lei (Q1 este percentila de
ordinul 25), iar 75% dintre termenii seriei au valori mai mari ca 36 sute lei;
5
sau
25% dintre lucrarile de grafica licitate s-au vandut pentru un pret mai mic decat 36
sute lei, iar restul de 75% dintre ele s-au vandut cu un pret mai mare de 36 sute lei.
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13
50% Me 50%
54
Cu interpretarea:
jumatate dintre termenii seriei au valori mai mici ca 54 sute lei (Me este percentila
de ordinul 50), iar restul au valori mai mari ca 54 sute lei;
sau
jumatate dintre lucrarile de grafica licitate s-au vandut cu mai putin de 54 sute lei,
iar restul s-au vandut cu un pret mai mare de 54 sute lei.
Q3 – cuartila de ordinul 3 sau cuartila superioara
n 1 13 1
Locul lui Q3 este 3 3 10,50 N, dar 10 < 10,50 < 11
4 4
x10 x11 61 63
x10 Q3 x11 si Q3 62 sute lei.
2 2
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13
25% 75%
Q3
62
Cu interpretarea:
75 % dintre termenii seriei au valori mai mici decat 62 sute lei (Q3 este percentila de
ordinul 75), iar 25% dintre termenii seriei au valori mai mari ca 62 sute lei;
sau
75% dintre lucrarile de grafica licitate s-au vandut pentru un pret mai mic decat 62 sute
lei, iar restul de 25% dintre ele s-au vandut cu un pret mai mare de 62 sute lei.
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13
25% 50% 25%
Q1 Q3
36 62
Jumatate din termenii din mijlocul seriei au valori cuprinse intre Q1=36 sute lei si
Q3=62 sute lei.
6
Abaterea intercuatilica este IQR=Q3-Q1=26 sute lei.
Definitie: Spunem ca o valoare x este outlier pentru un set de date statistice numerice daca:
x Q1 1,5 IQR sau x Q3 1,5 IQR
sau
valoarea x este outlier pentru un set de date statistice daca daca se gaseste in afara
intervalului
Q1 1,5 IQR; Q3 1,5 IQR .
In cazul nostru, Q1 1,5 IQR; Q3 1,5 IQR 3;101 , deci numai valoarea 124 este
outlier in raport cu setul initial de date statistice.
Problema 7
Pentru 39 de actrite care au obtinut premiul Oscar se cunoaste varsta, in ani impliniti, la
momentul castigarii premiului:
50, 44, 35, 80, 26, 28, 41, 21, 61, 38, 49, 33, 74, 30, 33, 41, 31, 35, 41, 42,
37, 26, 34, 34, 35, 26, 61, 60, 34, 24, 30, 37, 31, 27, 39, 34, 26, 25, 33 ani.
Se cere:
a) sa se determine si sa se interpreteze indicatorii tendintei centrale si cuartilele acestei
serii de date;
b) sa se construiasca diagrama box-plot (sau diagrama cu mustati box-and-whisker),
punand in evidenta daca seria are valori extreme;
c) sa se calculeze indicatorii variatiei si sa se stabileasca daca seria este omogena;
d) analizati asimetria;
e) Descriptive Statistics.
Rezolvare: a)
o Populatia statistica este multimea actritelor care au castigat premiul Oscar.
o Unitatea statistica este o actrita.
o Variabila sau caracteristica de interes, notata X, este variabila ce arata varsta unei actrite la
momentul obtinerii premiului; variabila numerica, discreta.
o Pentru un esantion de volum n 39 de actrite se cunosc valorile variabilei X, adica {x1=50,
x2=44, x3=35, x4=80, ..., xn=x39=33 ani}, care reprezinta o serie simpla sau nesistematizata
de date statistice numerice.
n
x
x1 x2 ... xn i 1 i
o Media unei serii simple de date numerice x1 , x2 , ..., xn este x .
n n
In cazul acestei serii, varsta medie a unei actrite din esantion care a castigat premiul Oscar
39
x1 x2 ... x39
xi
1486
este x i 1
38,1025 ani.
39 39 39
7
o Pentru a determina mediana, vom proceda astfel:
- seria simpla de date se ordoneaza crescator x1 x2 ... xn , unde
xi , i 1, n este elementul cu rangul i din seria ordonata crescator,
n 1
- locul medianei este 20 N Me x20 34 ani.
2
Jumatate dintre actritele din selectie au obtunut premiul Oscar la o varsta de cel mult 34 de ani
(jumatate dintre actritele din esantion au castigat premiul Oscar la o varsta de peste 34 de ani).
o Exista doua valori care au frecventa maxima si anume valorile 26 ani si 34 ani, care apar
pentru 4 actrite fiecare.
Se observa ca intervalul cuprins intre marginea inferioara si cea superioara diagramei box-plot,
adica intervalul de numere reale [21; 50] nu contine toate valorile observate, in afara lui
ramanand valorile x(35)=60, x(36)=61, x(37)=61, x(38)=74, x(39)=80 ani.
9
Valoarea x este outlier pentru seria de date statistice numerice daca x se gaseste in afara
intervalului Q1 1,5 IQR; Q3 1,5 IQR 13,5; 57,5 , x(35)=60, x(36)=61, x(37)=61, x(38)=74,
x(39)=80 sunt outliers si vor fi reprezentate distinct in diagrama box-plot.
*
** * *
21 30 34 41 50 60 61 74 80
x x
2
s x2
x1 x
2
... xn x
2
i 1
i
,
n 1 n 1
39
x x
2
i
6791,5897
adica s x2 i 1
178,7260 ,
39 1 39 1
abaterea standard (standard deviation) este s x s x2 13,3688 ani.
sx
Coeficientul de variatie este v x 100 35,09% 35% , ceea ce indica faptul ca
x
seria de date nu este omogena, iar media nu este reprezentativa pentru colectivitate, ca indicator
al tendintei centrale.
Varsta actritelor
Nr. crt.
xi
xi x xi x 2
11
28 60 21,8974 479,4977
29 34 -4,10256 16,8310
30 24 -14,1025 198,8823
31 30 -8,1025 65,6515
32 37 -1,1025 1,2156
33 31 -7,1025 50,4464
34 27 -11,1025 123,2669
35 39 0,8974 0,8053
36 34 -4,1025 16,8310
37 26 -12,1025 146,4720
38 25 -13,1025 171,6771
39 x39=33 -5,1025 26,0361
39
x x
39 2
xi 1486
i 1
39
x i x 0 i 1
i
i 1 6791,5897
x 38,1025 s 178,7260
2
x
s x s x2 13,3688
v x 35,09%
x x
3
i
- Indicatorul asimetriei este coeficientul de asimetrie (Skewness) CAS i 1
, al carui
n s x
3
semn si marime arata tipul asimetriei (pozitiva sau negativa), iar marimea arata gradul mai putin
accentuat sau mai accentuat al asimetriei seriei de date sau al distributiei. In cazul acestei serii
de date, CAS 1,5734 , o valoare pozitiva si mai mare ca 1, ceea ce arata ca seria de date prezinta
o asimetrie pozitiva pronuntata.
- Sistematizarea printr-o serie de distributie de frecvente pe r 6 intervale de variatie de
marime egala a dat urmatoarea distributie a celor n=39 de actrite din esantion dupa varsta la
momentul obtinerii premiului Oscar:
12
Frecventa absoluta n k
Intervalul k de a intervalului k de Centrul x k
Nr. variatie
variatie al intervalului k
crt. (numarul de actrite
(clasa de varsta) de variatie
din fiecare clasa de
varsta)
1 20-30 ani 11 25
2 30-40 ani 16 35
3 40-50 ani 7 45
4 50-60 ani 1 55
5 60-70 ani 2 65
6 70-80 ani 2 75
6
n
k 1
k 39=n
16
14
14
Numarul de actrite
12
12 11 11
10
actrite)
10
8
8 7
7
6
6
4 4
2 2
2 1 2 2 2
1
0 0
20-30 30-40 40-50 50-60 60-70 70-80 0 10 20 30 40 50 60 70 80
ani ani ani ani ani ani Varsta, in ani (centrele intervalelor)
13
Varsta actritelor Statistics
Varsta actritelor Oscar
Mean (media) x 38.1025
Standard Error 2.1407 N Valid 39
Median Me=34 Missing 0
Mode Mo=26
Standard Deviation Mean x 38.10
(abaterea standard) s x s 13.3688
2
x Std. Error of Mean 2.141
Sample Variance Median Me=34.00
(dispersia de
selectie) s x2 178.7260 Mode Mo=26a
Kurtosis 2.3830 Std. Deviation s x s x2 13.369
Skewness
(coeficientul de Variance s x2 178.726
asimetrie) CAS 1.5734
Skewness CAS 1.573
Range Ax xmax xmin
(Amplitudinea) Std. Error of Skewness .378
59
Minimum xmin 21 Kurtosis 2.383
Maximum xmax 80 Std. Error of Kurtosis .741
39 Range Ax xmax xmin
Sum x
i 1
i 1486
59
Count n=39 Minimum xmin 21
Maximum xmax 80
39
x
Sum
i 1486
i 1
Percentiles 25 Q1 30.00
50 Q2 Me 34.00
75 Q3 41.00
a. Multiple modes exist. The smallest value
is shown
xi x x x
4 2
i
CBA i 1
3 , unde s x2 i 1
.
n s x2
2
n 1
14
Definiţia este bazată pe momentul centrat de ordinul 4.
In cazul acestei serii de date statistice, CAB 2,383 0 , ceea ce indica o distributie leptocurtica
(cu cocoasa, asa cum se poate vedea si din histograma sau poligonul frecventelor).
Problema 8
Rezolvare: a)
o Populatia statistica – mutimea debitorilor cu intarziere in efectuarea platilor pentru
rambursarea unor credite.
o Unitatea statistica – un debitor.
o Variabila sau caracteristica de interes, X, este variabila ce arata numarul de zile de intarziere
a efectuarii platii catre banca de catre un deitor; variabila numerica, discreta.
o S-a realizat o selectie de volum n 500 de debitori restantieri pentru care s-a inregistrat
numarul de zile de intarziere, datele obtinute fiind sistematizate intr-o serie de distributie de
frecvente pe r 6 intervale de variatie de marime egala.
Notam cu:
nk , k 1, r , frecventa absoluta a intervalului k de variatie (numarul de debitori restantiei
pentru care numarul de zile de intarziere apartine intervalului k de variatie),
n1 ... nr n ;
15
0;1, k 1, r , frecventa relativa a intervalului k de variatie, n1* ... nr* 1 ;
nk
nk*
n
n
nk* % 100 k , k 1, r , frecventa relativa exprimata procentual a intervalului k de
n
variatie sau ponderea debitorilor cu numarul de zile de intarziere din intervalul sau clasa
k, n1* % ... nr* % 100% ;
Fck n1 ... nk , k 1, r , este frecventa absoluta cumulata crescator a intervalului k;
Fck* n1* ... nk* , k 1, r , este frecventa relativa cumulata crescator a intervalului k;
Fck* % n1* % ... nk* %, k 1, r , este frecventa relativa exprimata procentual cumulata
crescator a intervalului k (ponderea cumulata a intervalului k).
nk* % 100%
k 1
nk* 1
k 1
n
k 1
k 500 n
Distributia celor 500 de debitori dupa numarul de zile de intarziere a platii este
urmatoarea serie de distributie de frecvente pe intervale:
Intervalul k de variatie Numarul de debitori Centrul x k al
Nr. (frecventa absoluta),
a numarului de zile intervalului k
crt.
de intarziere a platii nk de variatie
1 15-25 de zile n1 125 debitori x1 20
2 25-35 de zile n2 250 x2 30
3 35-45 de zile n3 50 x3 40
4 45-55 de zile n4 40 x4 50
5 55-65 de zile n5 25 x5 60
6 65-75 de zile n6 10 x6 70
6
n
k 1
k 500 n debitori
16
b)
300 300
250
250 250
Numarul de debitori
Numarul de debitori
200 200
150 150
125
100 100
50
50 40 50
25
10
0
0
15-25 25-35 35-45 45-55 55-65 65-75 0 10 20 30 40 50 60 70 80
de zile de zile de zile de zile de zile de zile
Numarul zilelor de intarziere
Numarul de zile de intarziere
Fig. ..... Distributia celor 500 de debitori dupa numarul Fig. .... Poligonul frecventelor absolute pentru
de zile de intarziere a platii distributia celor 500 de debitori dupa numarul de zile
de intarziere a platilor
c)
Numarul de Centrul
Nr.
crt.
Intervalul k debitori, n k xk
x k nk Fck xk x 2 nk
6 6
x k nk x x nk
2
6 k
n
k 1
k 500 n k 1
16200
k 1
=69120
x 32,4 s 138,5170
2
x
s x s x2 11,7693
v x 36,33%
17
6
x1 n1 ... xr n6
x k nk
16200
o Media este x k 1
, deci x 32,4 zile este numarul
n1 ... n6 n 500
mediu de zile de intarziere a platilor pentru un debitor restantier.
n 1 n 1
o Locul medianei este 250,5 ; primul interval cu proprietatea ca Fck este
2 2
intervalul 25-35 de zile, deoarece Fc1 125 250,5 , dar Fc 2 375 250,5 , deci:
n 1
Fc Me1
Me xinf Me hMe 2
nMe
250,5 125
25 10 30,02 zile, adica jumatate dintre debitorii restantieri au
250
intarziat cel putin 30 de zile cu efectuarea platilor.
o Intervalul modal este intervalul 25-35 de zile deoarece are frecventa absoluta cea mai mare
250 n2 max nk , k 1,6 , atunci
1
Mo xinf Mo hMo
1 2
250 125
25 10 28,84 zile; numarul cel mai intalnit de zile
250 125 250 50
de intarziere a platilor celor 500 de debitori restantieri este de aproximativ 29 de
zile.
o Relatia in care se gasesc cei trei indicatori ai tendintei centrale este Mo Me x , ceea ce
indica o asimetrie pozitiva.
6
xk x 2 nk
o Dispersia in esantion este
s x2 1
x x 2
n1 ... x 6 x 2
n6
k 1
69120
,
n1 ... n6 1 500 1 500 1
deci s x2 138,5170 , iar abaterea standard s x s x2 11,7693 zile, care arata cu cate zile
se abat, in medie, valorile observate ale seriei de date fata de numarul mediu de zile de
intarziere.
s 11,7693
o Coeficientul de variatie in esantion este v x x 100 100 36,33% 35% , ceea
x 32,4
ce arata ca distributia nu este omogena si media, ca indicatot al tendintei centrale, nu este
reprezentativa pentru colectivitate.
18
unde Y 1 pentru unitatile statistice din esantion care verifica evenimentul favorabil, iar m
este numarul de unitati statistice din esantion pentru care se verifica evenimentul
favorabil, m n4 n5 n6 75 debitori,
iar Y 0 pentru unitatile statistice din esantion care nu verifica evenimentul favorabil,
n m este numarul de unitati statistice din esantion pentru care nu se verifica
evenimentul favorabil, n m 425 debitori.
m 75
Media variabilei alternative este y 0,15 , adica 15% dintre debitori au
n 500
intarziat mai mult de 45 de zile.
m m
Dispersia variabilei alternative este s y2 1 0,1275 , iar abaterea standard
n n
m m
sy 1 0,36 .
n n
19