Sunteți pe pagina 1din 19

PROBLEME

Problema 1
Se dau trei urne U0, U1, U2 cu următorul conţinut. Urna U0 goală, urna U1 conţine 3 bile
albe şi 3 bile negre iar urna U2 conţine 2 bile albe şi 2 bile negre.
Se extrage o bilă din urna U1 şi dacă este albă se pune în urna U0 iar dacă este neagră se
pune în urna U2; se extrage apoi o bilă din urna U2 şi dacă este albă se pune în urna U0 iar
dacă este neagră se pune în urna U1. Se continuă procedeul, extrăgînd alternativ bile din
urnele U1 şi U2 şi procedînd ca mai înainte.
Care este probabilitatea ca după exact 5 extrageri, începînd cu urna U1, să obţinem 4 bile
albe în urna U0 ?

Soluţie. Avem următoarele 4 cazuri favorabile pentru realizarea cerinţei din enunţ:
I II III IV V
A a1 a2 a1 n2 a1
B a1 a2 n1 a2 a1
C a1 n2 a1 a2 a1
D n1 a2 a1 a2 a1
unde prin ai am notat extragerea unei bile albe din urna Ui iar prin ni am notat extragerea unei
bile negre din urna Ui ( i = 1 sau 2 ).
Probabilităţile celor patru evenimente sunt:
1 1 2 2 1 1
P(A) = . . . . =
2 2 5 3 5 75
1 1 3 1 1 3
P(B) = . . . . =
2 2 5 4 2 160
1 1 1 2 1 1
P(C) = . . . . =
2 2 3 3 5 90
1 2 3 1 1 3
P(D) = . . . . =
2 5 5 4 2 200
Deoarece evenimentele A, B, C, D sunt incompatibile rezultă că, probabilitatea cerută
este:
1 3 + 1 + 3 96 + 135 + 80 + 108 419
P= + = =
75 160 90 200 25.32.52 7200

Problema 2
Într-o urnă sînt 3 bile roşii, 2 bile albe şi o bilă neagră. Extragem bile una cîte una
succesiv, respectînd regula următoare:
- dacă la o extragere obţinem o bilă roşie, nu o înapoiem şi procedăm la o nouă extragere;
- dacă la o extragere obţinem o bilă albă, nu o înapoiem dar oprim procesul de extragere;
- dacă la o extragere obţinem bila neagră, o punem la loc în urnă şi oprim procesul de
extragere.
Care este probabilitatea ca în urnă să mai rămînă k bile ( k = 2, 3, 4, 5, 6 ).
( G.M.B. nr 1/1976)

1
Soluţie: Să notăm cu R extragerea unei bile roşii, cu A extragerea unei bile albe şi cu N
extragerea bilei negre.
a) Probabilitatea ca în urnă să rămînă 2 bile.
În acest caz, afară vor fi 4 bile şi pentru realizarea acestui eveniment e necesară
următoarea succesiune: R R R A. Deci,
3 2 1 2 1
P(2) = . . . =
6 5 4 3 30
b) Probabilitatea ca în urnă să rămînă 3 bile.
În acest caz, avem două succesiuni: R R A sau R R R N. Deci,
3 2 2 1
P(RRA) = . . =
6 5 4 10
3.2.1.1 1
P(RRRN) = =
6 5 4 3 60
Aşadar:
1 1 7
P(3) = + =
10 60 60
c) Probabilitatea ca în urnă să rămînă 4 bile.
În acest caz, avem două succesiuni necesare: R A sau R R N. Deci,
3 2 1
P(RA) = . =
6 5 5
3 2 1 1
P(RRN) = . . =
6 5 4 20
Aşadar:
1 1 1
P(4) = + =
5 20 4
d) Probabilitatea ca în urnă să rămînă 5 bile.
În acest caz, avem două succesiuni necesare: "R N" sau "A". Deci,
3 1 1
P(RN) = . =
6 5 10
2 1
P(A) = =
6 3
Aşadar:
1 1 13
P(5) = + =
10 3 30
d) Probabilitatea ca în urnă să rămînă 6 bile.
În acest caz este necesar să extragem, de prima oară, bila neagră. Deci,
1
P(6) =
6
Observaţie: Să constatăm că evenimentele considerate reprezintă o partiţie a spaţiului,
deci este firesc să avem:
1 7 1 13 1
P(2) + P(3) + P(4) + P(5) + P(6) = + + + + =1
30 60 4 30 6

Problema 3
Se iau la întîmplare două unghiuri u şi v. Considerăm că un unghi poate lua numai valori
de la 00 la 1800. Care este probabilitatea ca ele să fie unghiuri ale unui triunghi ascuţitunghic
2
?

Soluţie. Pentru ca u şi v să fie unghiuri ale unui triunghi oarecare este necesar ca u + v <
1800; dacă cerem, în plus, ca triunghiul să fie ascuţitunghic este necesar ca, în plus, u < 900 , v
< 900 şi u + v > 900.
Obţinem, astfel, un sistem de inecuaţii:
0 ≤ u ≤ 1800
0 ≤ v ≤ 1800
u + v < 1800
u < 900
v < 900
u + v > 900

Să alegem un sistem de axe ortogonale uOv.


Primele două inecuaţii ne dau ca soluţie domeniul format de pătratul OAMB, unde
A(1800,00), B(00,1800), M(1800,1800). Acest domeniu reprezintă toate cazurile posibile în
alegerea aleatorie a unghiurilor u şi v.
Inecuaţia 3-a împreună cu precedentele ne dau triunghiul OAB care reprezintă toate
cazurile favorabile ca u şi v să fie unghiuri ale unui triunghi oarecare.
În fine, întregul sistem are soluţia triunghiul haşurat A1M1B1, unde A1(900,00),
M1(900,900), B1(00,900).
Notăm prin SOAMB, SOAB, SA1M1B1 ariile suprafeţelor OAMB, OAB şi A1M1B1.
Ţinînd seama de cele de mai sus, este natural să considerăm probabilitatea ca u şi v să fie
unghiuri ale unui triunghi oarecare, egală cu:
SOAB 1
P= =
SOAMB 2
iar probabilitatea ca u şi v să fie unghiuri ale unui triunghi ascuţitunghic este:
SA1M1B1 1
P1 = =
SOAMB 8
Urmînd acelaşi procedeu, se deduce uşor că probabilitatea ca u şi v să fie unghiuri ale unui
triunghi obtuzunghic este 3/8.

Problema 4
Doi ţintaşi trag asupra aceleiaşi ţinte cîte un foc. Ţinta se află aşezată între ţintaşi, coliniar
cu poziţiile acestora. Distanţa dintre ţintaşi este de 7 unităţi de lungime, iar bătaia armelor este
de peste 7 unităţi. (Excludem posibilitatea ca ţintaşii să se lovească unul pe altul). Ţintaşii
lovesc ţinta cu probabilităţile:
1 2
P1(x) = P2(y) =
x+1 y+2
unde x şi y sînt distanţele de la ţintaşi la ţintă.
Să se afle poziţia ţintei astfel ca probabilitatea ca aceasta să fie lovită să fie minimă. Cît
este această probabilitate ?
(G.M.B. nr. 12, 1975)

Soluţie:
3
Fie, pe axă, A(0) şi B(7) poziţiiile celor doi ţintaşi şi M(x) poziţia ţintei, 0 ≤ x ≤ 7.
Probabilitatea ca ţinta să fie lovită va fi:
P = P1 + P2 - P1.P2
unde P1, P2 sînt cele din enunţ. Deci:
1 2 1 2
P(x) = + - .
x+1 (7-x)+2 x+1 (7-x)+2
Derivînd funcţia P(x), obţinem:
x2 + 18x - 63
P'(x) =
( x + 1 )2 . ( 9 - x )2
P'(x) = 0 pentru x1 = 3 şi x2 = -21. Soluţia care ne interesează este cea din interiorul
intervalului [0,7], deci x = 3.
Se constată uşor că:
P'(x) < 0 , x ∈ [0,3) şi P'(x) > 0 , x ∈ (3,7]
ceea ce arată că x=3 este un punct de minim pentru funcţia P(x).
Deci avem probabilitatea minimă ca ţinta să fie lovită cînd ţinta se află la distanţa de 3
unităţi de primul ţintaş şi, implicit, la 4 unităţi de al doilea ţintaş.
1
Această probabilitate este: P(3) =
2

Problema 5
Un automobilist pleacă din oraşul A pe o şosea. La 40 de km distanţă de oraşul A, şoseaua
se intersectează cu o cale ferată. La ora 1:00 prin această intersecţie va trece un tren.
Automobilistul pleacă din oraşul A între orele 0 şi 0:30, momentul plecării fiind aleatoriu, şi
parcurge distanţa pînă la intersecţie cu o viteză medie aleatorie cuprinsă între 0 şi 90 km/h.
Care este probabilitatea ca automobilistul să treacă prin intersecţie înainte de trecerea
trenului ?

Soluţie: Să notăm cu t momentul plecării şi cu v viteza medie cu care sînt parcurşi cei 40
km pînă la intersecţie.
Să reprezentăm, într-un sistem de axe ortogonal, pe abscisă timpul iar pe ordonată viteza.

Dreptunghiul OAMB este dreptunghiul cazurilor posibile.


Distanţa parcursă de automobilist pînă la ora 1 va fi D = v.(1 - t) unde t este momentul
plecării. Trebuie ca D ≥ 40. Obţinem astfel inecuaţia:
v.(1 - t) ≥ 40 (1)
Să reprezentăm curba:
40
v(t) =
1-t
Avem:
1 40 80
v(0)=40 v( )=80 v'(t)= 2 v''(t)=
2 (1 - t) (1 - t)3
ceea ce arată că această curbă trece prin punctele B1(0,40), A1(0.5,80), este strict crescătoare
pe intervalul [0,0.5] şi este convexă pe acest interval. Graficul este desenat în figură.
Inecuaţia (1) împreună cu condiţiile 0 ≤ t ≤ 0.5, 0 ≤ v ≤ 90 ne dă ca soluţie domeniul
4
B1A1MB.
E natural să considerăm probabilitatea cerută ca fiind raportul:
SB1A1MB
SOAMB
dintre ariile domeniului B1A1MB şi respectiv aria dreptunghiului OAMB.
Avem:
1 1
2 40 2
SOAA1B1 = ∫ dt = -40.ln(1 - t) | = 40.ln 2
1-t
0 0
SB1A1MB = SOAMB - SOAA1B1 = 45 - 40.ln 2
Probabilitatea cerută va fi:
45 - 40.ln 2 8
P= = 1 - ln 2
45 9

Problema 6
Următoarea serie de date arată preţul de vânzare (sute lei) pentru 13 lucrări de grafică la o
licitaţie de obiecte de artă: 51, 60, 72, 35, 32, 57, 63, 61, 48, 33, 67, 54, 37.
Stabiliţi valoarea de adevăr a următoarelor afirmaţii, justificând răspunsurile:
a) 25 % dintre lucrarile licitate s-au vandut pentru un pret mai mic de 48 sute de lei;
b) jumatate dintre lucrarile licitate au un pret mai mic sau egal cu 54 sute lei;
c) 25 % dintre lucrari s-au vandut cu cel putin 62 sute de lei;
d) pentru 75% dintre obiecte s-a obtinut un pret de cel putin 36 sute lei;
e) precizati care dintre urmatoarele valori: 25, 29, 16, 40, 124, 85, 99,8 sute lei sunt
outliers in raport cu datele initiale.
Rezolvare:
Cele n=13 valori ale seriei de date se ordonează crescător:
x(1)=32, x(2)=33, x(3)=35, x(4)=37, x(5)=48, x(6)=51, x(7)=54, x(8)=57, x(9)=60, x(10)=61,
x(11)=63, x(12)=67, x(13)=72.

Q1 – cuartila de ordinul 1 sau cuartila inferioara


n 1 13  1
Locul lui Q1 este 1  1  3,50  N, dar 3 < 3,50 < 4
4 4
x3  x4  35  37
 x3  Q1  x4  si Q1    36 sute lei.
2 2

x1  x2   x3  x4   x5   x6   x7   x8   x9   x10  x11  x12  x13
  
25%  75%
Q1

36

Cu interpretarea:
 25 % dintre termenii seriei au valori mai mici decat 36 sute lei (Q1 este percentila de
ordinul 25), iar 75% dintre termenii seriei au valori mai mari ca 36 sute lei;
5
sau
 25% dintre lucrarile de grafica licitate s-au vandut pentru un pret mai mic decat 36
sute lei, iar restul de 75% dintre ele s-au vandut cu un pret mai mare de 36 sute lei.

Q2=Me – cuartila de ordinul 2 sau mediana seriei de date statistice.


n  1 13  1
Locul lui Q2=Me este   7  N  Me  x7   54 sute lei
2 2

x1  x2   x3  x4   x5   x6   x7   x8   x9   x10  x11  x12  x13

 

50% Me 50%

54

Cu interpretarea:
 jumatate dintre termenii seriei au valori mai mici ca 54 sute lei (Me este percentila
de ordinul 50), iar restul au valori mai mari ca 54 sute lei;
sau
 jumatate dintre lucrarile de grafica licitate s-au vandut cu mai putin de 54 sute lei,
iar restul s-au vandut cu un pret mai mare de 54 sute lei.
Q3 – cuartila de ordinul 3 sau cuartila superioara
n 1 13  1
Locul lui Q3 este 3   3  10,50  N, dar 10 < 10,50 < 11
4 4
x10  x11 61  63
 x10  Q3  x11 si Q3    62 sute lei.
2 2

x1  x2   x3  x4   x5   x6   x7   x8   x9   x10  x11  x12  x13
    
25%  75%
Q3

62

Cu interpretarea:
 75 % dintre termenii seriei au valori mai mici decat 62 sute lei (Q3 este percentila de
ordinul 75), iar 25% dintre termenii seriei au valori mai mari ca 62 sute lei;
sau
 75% dintre lucrarile de grafica licitate s-au vandut pentru un pret mai mic decat 62 sute
lei, iar restul de 25% dintre ele s-au vandut cu un pret mai mare de 62 sute lei.

x1  x2   x3  x4   x5   x6   x7   x8   x9   x10  x11  x12  x13
     
25%  50%  25%
Q1 Q3

36 62

Jumatate din termenii din mijlocul seriei au valori cuprinse intre Q1=36 sute lei si
Q3=62 sute lei.
6
Abaterea intercuatilica este IQR=Q3-Q1=26 sute lei.

Definitie: Spunem ca o valoare x este outlier pentru un set de date statistice numerice daca:
x  Q1 1,5  IQR sau x  Q3  1,5  IQR
sau
valoarea x este outlier pentru un set de date statistice daca daca se gaseste in afara
intervalului
Q1 1,5  IQR; Q3  1,5  IQR  .
In cazul nostru, Q1  1,5  IQR; Q3  1,5  IQR    3;101 , deci numai valoarea 124 este
outlier in raport cu setul initial de date statistice.

In concluzie, a) fals; b) adevarat; c) adevarat; d) adevarat; e) numai valoarea 124


sute lei este outlier in raport cu seria initiala de date.

Problema 7
Pentru 39 de actrite care au obtinut premiul Oscar se cunoaste varsta, in ani impliniti, la
momentul castigarii premiului:
50, 44, 35, 80, 26, 28, 41, 21, 61, 38, 49, 33, 74, 30, 33, 41, 31, 35, 41, 42,
37, 26, 34, 34, 35, 26, 61, 60, 34, 24, 30, 37, 31, 27, 39, 34, 26, 25, 33 ani.
Se cere:
a) sa se determine si sa se interpreteze indicatorii tendintei centrale si cuartilele acestei
serii de date;
b) sa se construiasca diagrama box-plot (sau diagrama cu mustati box-and-whisker),
punand in evidenta daca seria are valori extreme;
c) sa se calculeze indicatorii variatiei si sa se stabileasca daca seria este omogena;
d) analizati asimetria;
e) Descriptive Statistics.

Rezolvare: a)
o Populatia statistica este multimea actritelor care au castigat premiul Oscar.
o Unitatea statistica este o actrita.
o Variabila sau caracteristica de interes, notata X, este variabila ce arata varsta unei actrite la
momentul obtinerii premiului; variabila numerica, discreta.
o Pentru un esantion de volum n  39 de actrite se cunosc valorile variabilei X, adica {x1=50,
x2=44, x3=35, x4=80, ..., xn=x39=33 ani}, care reprezinta o serie simpla sau nesistematizata
de date statistice numerice.
n

x
x1  x2  ...  xn i 1 i
o Media unei serii simple de date numerice x1 , x2 , ..., xn  este x   .
n n
In cazul acestei serii, varsta medie a unei actrite din esantion care a castigat premiul Oscar
39

x1  x2  ...  x39 
xi
1486
este x   i 1
  38,1025 ani.
39 39 39

7
o Pentru a determina mediana, vom proceda astfel:
- seria simpla de date se ordoneaza crescator x1  x2   ...  xn  , unde
xi  , i  1, n este elementul cu rangul i din seria ordonata crescator,
n 1
- locul medianei este  20  N  Me  x20  34 ani.
2
Jumatate dintre actritele din selectie au obtunut premiul Oscar la o varsta de cel mult 34 de ani
(jumatate dintre actritele din esantion au castigat premiul Oscar la o varsta de peste 34 de ani).
o Exista doua valori care au frecventa maxima si anume valorile 26 ani si 34 ani, care apar
pentru 4 actrite fiecare.

Varsta actritelor, in ordine


Nr. crt. Varsta actritelor xi
crescatoare x i 
1 x1=50 x(1)=21
2 x2=44 x(2)=24
3 x3=35 x(3)=25
4 x4=80 x(4)=26
5 x5=26 x(5)=26
6 28 26
7 41 26
8 21 27
9 61 28
10 38 x(10)=30=Q1
11 49 30
12 33 31
13 74 31
14 30 33
15 33 33
16 41 33
17 31 34
18 35 34
19 41 34
20 42 x(20)=34=Me
21 37 35
22 26 35
23 34 35
24 34 37
25 35 37
26 26 38
27 61 39
28 60 41
29 34 41
30 24 x(30)=41=Q3
31 30 42
32 37 44
33 31 49
8
34 27 x(34)=50
35 39 x(35)=60
36 34 x(36)=61
37 26 x(37)=61
38 25 x(38)=74
39 x39=33 x(39)=80

o Pentru determinarea cuartilelor procedam astfel:


n 1
- locul cuartilei de ordinul 1, Q1, este 1  10  N  Q1  x10  30 ani; un
4
sfert dintre actrite au castigat premiul Oscar la o varsta mai mica sau egala
cu 30 de ani, iar restul la cel putin 30 de ani;
n 1
- locul cuartilei de ordinul 3, Q3, este  3  30  N  Q3  x30  41 ani;
4
trei sferturi dintre actrite au castigat premiul Oscar la o varsta mai mica sau
egala cu 41 de ani, iar restul la cel putin 41 de ani.
o Abaterea intercuartilica este IQR  Q3  Q1  11 ani si arata lungimea intervalului in care
se gasesc jumatate dintre valorile din mijlocul seriei de date.

b) Diagrama cu mustati (box-and-whisker) sau diagrama box-plot pentru o serie de date


statistice numerice se construieste punand in evidenta urmatoarele cinci elemente si eventualele
valori extreme sau outliers:
- cuartila inferioara sau de ordinul 1, Q1=30 ani;
- mediana sau cuartila de ordinul al 2-lea, Q2=Me=34 ani;
- cuartila superioara sau de ordinul al 3-lea, Q3=41 ani;
- limita sau marginea inferioara a diagramei box-plot este cea mai mica
dintre valorile seriei de date cu proprietatea ca este mai mare sau egala cu
 
Q1 1,5  IQR , adica lim inf box plot  min xi  , i  1, n xi   Q1  1,5  IQR :
o Q1 1,5  IQR  13,5
o cea mai mica dintre valorile seriei de date, cu proprietatea ca este
 13,5 , este x(1)=21 ani, deci marginea inferioara este egala cu 21
ani, lim inf box plot  21  x1 ;
- limita sau marginea superioara a diagramei box-plot este cea mai mare
dintre valorile seriei de date cu proprietatea ca este mai mica sau egala cu
 
Q3  1,5  IQR , adica lim sup box plot  max xi  , i  1, n xi   Q3  1,5  IQR :
o Q3  1,5  IQR  57,5
o cea mai mare dintre valorile seriei de date, cu proprietatea ca este
 57,5 , este x(34)=50 ani, deci marginea superioara este egala cu 50
ani, lim sup box plot  50  x34 .

Se observa ca intervalul cuprins intre marginea inferioara si cea superioara diagramei box-plot,
adica intervalul de numere reale [21; 50] nu contine toate valorile observate, in afara lui
ramanand valorile x(35)=60, x(36)=61, x(37)=61, x(38)=74, x(39)=80 ani.

9
Valoarea x este outlier pentru seria de date statistice numerice daca x se gaseste in afara
intervalului Q1  1,5  IQR; Q3  1,5  IQR   13,5; 57,5 , x(35)=60, x(36)=61, x(37)=61, x(38)=74,
x(39)=80 sunt outliers si vor fi reprezentate distinct in diagrama box-plot.

*
** * *

21 30 34 41 50 60 61 74 80

(Q1) (Me) (Q3)

Fig. …. Diagrama box-plot sau diagrama cu mustati (box-and-whisker).

Fig. …. Diagrama box-plot in SPSS.


10
c) Dispersia de selectie (sample variance) pentru o serie simpla de date numerice asupra
variabilei X este
n

 x  x
2

s x2 
x1  x 
2
 ...  xn  x 
2
 i 1
i
,
n 1 n 1
39

 x  x
2
i
6791,5897
adica s x2  i 1
  178,7260 ,
39  1 39  1
abaterea standard (standard deviation) este s x  s x2  13,3688 ani.
sx
Coeficientul de variatie este v x   100  35,09%  35% , ceea ce indica faptul ca
x
seria de date nu este omogena, iar media nu este reprezentativa pentru colectivitate, ca indicator
al tendintei centrale.
Varsta actritelor
Nr. crt.
xi
xi  x xi  x 2

1 x1=50 11,8974 141,5489


2 x2=44 5,8974 34,7797
3 x3=35 -3,1026 9,6259
4 x4=80 41,8974 1755,3951
5 x5=26 -12,1026 146,4720
6 28 -10,1026 102,0618
7 41 2,8974 8,3951
8 21 -17,1026 292,4977
9 61 22,8974 524,2925
10 38 -0,1026 0,0105
11 49 10,8974 118,7541
12 33 -5,1025 26,0361
13 74 35,8974 1288,6259
14 30 -8,1025 65,6515
15 33 -5,1025 26,0361
16 41 2,8974 8,3951
17 31 -7,1025 50,4464
18 35 -3,1025 9,6259
19 41 2,8974 8,3951
20 42 3,8974 15,1900
21 37 -1,1025 1,2156
22 26 -12,1025 146,4720
23 34 -4,1025 16,8310
24 34 -4,1025 16,8310
25 35 -3,1025 9,6259
26 26 -12,1025 146,4720
27 61 22,8974 524,2925

11
28 60 21,8974 479,4977
29 34 -4,10256 16,8310
30 24 -14,1025 198,8823
31 30 -8,1025 65,6515
32 37 -1,1025 1,2156
33 31 -7,1025 50,4464
34 27 -11,1025 123,2669
35 39 0,8974 0,8053
36 34 -4,1025 16,8310
37 26 -12,1025 146,4720
38 25 -13,1025 171,6771
39 x39=33 -5,1025 26,0361

39

 x  x 
39 2

 xi  1486
i 1
39

 x i  x  0 i 1
i

i 1 6791,5897
x  38,1025 s  178,7260
2
x

s x  s x2  13,3688
v x  35,09%

d) Asimetria unei serii de distribuţie de frecvenţe se poate stabili:


- prin compararea indicatorilor tendintei centrale,
- prin analiza distantei intre mediana si cele doua cuartile inferioara si superioara,
- prin calculul si interpretarea valorii unui indicator specific, coeficientul de asimetrie,
- se observă din reprezentarea grafică prin histogramă sau poligonul frecvenţelor.
- Cum Me  34  38,1025  x , atunci concluzionam ca seria de date prezinta asimetrie pozitiva.
- Cum mediana este mai apropiata de Q1 decat de Q2, adica Me  Q1  Q3  Me , asa cum se
poate vedea din diagrama box-plot, atunci concluzionam ca seria prezinta asimetrie pozitiva, in
seria de date predominand valorile mici.
n

 x  x
3
i
- Indicatorul asimetriei este coeficientul de asimetrie (Skewness) CAS  i 1
, al carui
n  s x 
3

semn si marime arata tipul asimetriei (pozitiva sau negativa), iar marimea arata gradul mai putin
accentuat sau mai accentuat al asimetriei seriei de date sau al distributiei. In cazul acestei serii
de date, CAS  1,5734 , o valoare pozitiva si mai mare ca 1, ceea ce arata ca seria de date prezinta
o asimetrie pozitiva pronuntata.
- Sistematizarea printr-o serie de distributie de frecvente pe r  6 intervale de variatie de
marime egala a dat urmatoarea distributie a celor n=39 de actrite din esantion dupa varsta la
momentul obtinerii premiului Oscar:

12
Frecventa absoluta n k
Intervalul k de a intervalului k de Centrul x k
Nr. variatie
variatie al intervalului k
crt. (numarul de actrite
(clasa de varsta) de variatie
din fiecare clasa de
varsta)
1 20-30 ani 11 25
2 30-40 ani 16 35
3 40-50 ani 7 45
4 50-60 ani 1 55
5 60-70 ani 2 65
6 70-80 ani 2 75
6

n
k 1
k  39=n

Reprezentarea grafica seriei de distributie de frecvente pe intervale, adica histograma si


poligonul frecventelor sugereaza ca aceasta prezinta asimetrie pronuntata la dreapta sau
asimetrie pozitiva, adica predomina valorile mai mici ale variabilei de interes, cu coada mai
lungă a distribuţiei spre valorile mari, care apar cu frecventa mai mica. Intre cele 39 de actrite
castigatoare ale premiului Oscar, predomina cele cu varste relativ mai mici.

Histograma - distributia celor n=39 de actrite dupa


variabila ce arata varsta la momentul castigarii premiului
Poligonul frecventelor pentru seria de distributie de frecvente
Oscar
18
18
16 16 16
Frecventa absoluta (numarul de

16
14
14
Numarul de actrite

12
12 11 11
10
actrite)

10
8
8 7
7
6
6
4 4
2 2
2 1 2 2 2
1
0 0
20-30 30-40 40-50 50-60 60-70 70-80 0 10 20 30 40 50 60 70 80

ani ani ani ani ani ani Varsta, in ani (centrele intervalelor)

Varsta (intervalele sau clasele de varsta)

e) Indicatorii tendintei centrale, principalii indicatori ai variatiei si ai formei distributiei pentru


o serie simpla de date numerice pot fi calculati in Excel si in SPSS, output-urile fiind de forma:
Output-ul Descriptive Statistics in Excel Output-ul Descriptive Statistics in SPSS

13
Varsta actritelor Statistics
Varsta actritelor Oscar
Mean (media) x  38.1025
Standard Error 2.1407 N Valid 39
Median Me=34 Missing 0
Mode Mo=26
Standard Deviation Mean x  38.10
(abaterea standard) s x  s  13.3688
2
x Std. Error of Mean 2.141
Sample Variance Median Me=34.00
(dispersia de
selectie) s x2  178.7260 Mode Mo=26a
Kurtosis 2.3830 Std. Deviation s x  s x2  13.369
Skewness
(coeficientul de Variance s x2  178.726
asimetrie) CAS  1.5734
Skewness CAS  1.573
Range Ax  xmax  xmin 
(Amplitudinea) Std. Error of Skewness .378
59
Minimum xmin  21 Kurtosis 2.383
Maximum xmax  80 Std. Error of Kurtosis .741
39 Range Ax  xmax  xmin 
Sum x
i 1
i  1486
59
Count n=39 Minimum xmin  21
Maximum xmax  80
39

x
Sum
i  1486
i 1

Percentiles 25 Q1  30.00
50 Q2  Me  34.00
75 Q3  41.00
a. Multiple modes exist. The smallest value
is shown

Observatie: Analiza boltirii/aplatizării


Boltirea(kurtosis, în engl.) exprimă înălţimea curbei („cocoaşei”) comparativ cu distribuţia
normală teoretică. Întâlnim, astfel distribuţii leptocurtice, ascuţite (cu „cocoaşa” înaltă) şi
distribuţii platicurtice, aplatizate. Coeficientul de boltire sau aplatizare (kurtosis) este o măsură
a împrăştierii fiecărei observaţii în jurul unei valori centrale şi se determină, pe eşantion, cu
formula:
n n

  xi  x   x  x
4 2
i
CBA  i 1
 3 , unde s x2  i 1
.
 
n  s x2
2
n 1
14
Definiţia este bazată pe momentul centrat de ordinul 4.

Interpretarea valorii coeficientului de aplatizare si boltire:


 Dacă CBA  0 , avem distribuţie leptocurtică, valorile varibilei fiind concentrate în jurul
indicatorilor tendinţei centrale
 Dacă CBA  0 , avem distribuţie platicurtica, valorile varibilei fiind dispersate în raport
cu indicatorii tendinţei centrale
 Dacă CBA  0 , avem distribuţie mezocurtică, adică distribuţia normală.

In cazul acestei serii de date statistice, CAB  2,383  0 , ceea ce indica o distributie leptocurtica
(cu cocoasa, asa cum se poate vedea si din histograma sau poligonul frecventelor).

Problema 8

La o banca se analizeaza distributia a 500 de debitori restantieri dupa situatia datelor de


intarziere a rambursarii creditelor. Datele au fost sistematizate astfel:
Intervale de variatie Ponderea cumulata
a numarului de zile de intarziere a platii a debitorilor (%)
mai putin 25 de zile 25
25-35 de zile 75
35-45 de zile 85
45-55 de zile 93
55-65 de zile 98
peste 65 de zile 100
Se cere:
a) sa se scrie distributia de frecvente pe intervale de variatie;
b) sa se reprezinte grafic distributia de frecvente absolute;
c) sa se calculeze si sa se analizeze indicatorii tendintei centrale si sa se stabileasca daca
durata medie de intarziere a platilor este reprezentativa;
d) sa se calculeze media si abaterea standard pentru variabila alternativa care evidentiaza
debitorii ce au intarziat mai mult de 45 de zile cu efectuarea platilor.

Rezolvare: a)
o Populatia statistica – mutimea debitorilor cu intarziere in efectuarea platilor pentru
rambursarea unor credite.
o Unitatea statistica – un debitor.
o Variabila sau caracteristica de interes, X, este variabila ce arata numarul de zile de intarziere
a efectuarii platii catre banca de catre un deitor; variabila numerica, discreta.
o S-a realizat o selectie de volum n  500 de debitori restantieri pentru care s-a inregistrat
numarul de zile de intarziere, datele obtinute fiind sistematizate intr-o serie de distributie de
frecvente pe r  6 intervale de variatie de marime egala.
Notam cu:
 nk , k  1, r , frecventa absoluta a intervalului k de variatie (numarul de debitori restantiei
pentru care numarul de zile de intarziere apartine intervalului k de variatie),
n1  ...  nr  n ;
15
 0;1, k  1, r , frecventa relativa a intervalului k de variatie, n1*  ...  nr*  1 ;
nk
 nk* 
n
n
 nk* %  100  k , k  1, r , frecventa relativa exprimata procentual a intervalului k de
n
variatie sau ponderea debitorilor cu numarul de zile de intarziere din intervalul sau clasa
k, n1* %  ...  nr* %  100% ;
 Fck  n1  ...  nk , k  1, r , este frecventa absoluta cumulata crescator a intervalului k;
 Fck*  n1*  ...  nk* , k  1, r , este frecventa relativa cumulata crescator a intervalului k;
 Fck* %  n1* %  ...  nk* %, k  1, r , este frecventa relativa exprimata procentual cumulata
crescator a intervalului k (ponderea cumulata a intervalului k).

Intervalul k de Frecventa Frecventa


variatie a Ponderea cumulata Ponderea absoluta,
Nr. relativa,
a debitorilor (%) intervalului k,
crt.
numarului de zile
n* % nk  n  nk* 
de intarziere a Fck %  n1* %  ...  nk* %
*
nk* % nk*  k
platii 100  500  nk*
1 15-25 de zile Fck* %  n1* %  25% n1* %  25% n1*  0,25 n1  125
2 25-35 de zile F %  n %  n %  75%
*
c2
*
1
*
2 n %  50%
*
2 n  0,50
*
2
n2  250
3 35-45 de zile Fc*3 %  n1* %  ...  n3* %  85% n %  10%
*
3 n3*  0,10 n3  50
4 45-55 de zile Fc*4 %  n1* %  ...  n4* %  93% n4* %  8% n4*  0,08 n4  40
5 55-65 de zile Fc*5 %  n1* %  ...  n5* %  98% n5* %  5% n5*  0,05 n5  25
Fc*6 %  n1* %  ...  n6* %  n6*  0,02 n6  10
6 65-75 de zile n6* %  2%
100%
6 6 6

 nk* %  100%
k 1
 nk*  1
k 1
n
k 1
k  500  n

Distributia celor 500 de debitori dupa numarul de zile de intarziere a platii este
urmatoarea serie de distributie de frecvente pe intervale:
Intervalul k de variatie Numarul de debitori Centrul x k al
Nr. (frecventa absoluta),
a numarului de zile intervalului k
crt.
de intarziere a platii nk de variatie
1 15-25 de zile n1  125 debitori x1  20
2 25-35 de zile n2  250 x2  30
3 35-45 de zile n3  50 x3  40
4 45-55 de zile n4  40 x4  50
5 55-65 de zile n5  25 x5  60
6 65-75 de zile n6  10 x6  70
6

n
k 1
k  500  n debitori

16
b)

Poligonul frecventelor absolute


Histograma

300 300

250
250 250

Numarul de debitori
Numarul de debitori

200 200

150 150
125

100 100

50
50 40 50
25
10
0
0
15-25 25-35 35-45 45-55 55-65 65-75 0 10 20 30 40 50 60 70 80
de zile de zile de zile de zile de zile de zile
Numarul zilelor de intarziere
Numarul de zile de intarziere

Fig. ..... Distributia celor 500 de debitori dupa numarul Fig. .... Poligonul frecventelor absolute pentru
de zile de intarziere a platii distributia celor 500 de debitori dupa numarul de zile
de intarziere a platilor
c)
Numarul de Centrul
Nr.
crt.
Intervalul k debitori, n k xk
x k  nk Fck xk  x 2  nk

1 15-25 de zile n1  125 x1  20 x1  n1  2500 Fc1  125 x1  x 2  n1  19220


2 25-35 de zile n2  250 x2  30 7500 Fc 2  375 1440
3 35-45 de zile n3  50 x3  40 2000 Fc3  425 2888
4 45-55 de zile n4  40 x4  50 2000 465 12390,4
5 55-65 de zile n5  25 x5  60 1500 490 19044
n6  10
x6  70 x6  x   n6 2

6 65-75 de zile x6  n6  700 Fc 6  500 14137,6

6 6

 x k  nk   x  x   nk 
2
6 k
n
k 1
k  500  n k 1
16200
k 1
=69120
x  32,4 s  138,5170
2
x

s x  s x2  11,7693
v x  36,33%

17
6

x1  n1  ...  xr  n6 
x k  nk
16200
o Media este x   k 1
 , deci x  32,4 zile este numarul
n1  ...  n6 n 500
mediu de zile de intarziere a platilor pentru un debitor restantier.
n 1 n 1
o Locul medianei este  250,5 ; primul interval cu proprietatea ca Fck  este
2 2
intervalul 25-35 de zile, deoarece Fc1  125  250,5 , dar Fc 2  375  250,5 , deci:
n 1
 Fc Me1
Me  xinf Me  hMe  2 
nMe
250,5  125
 25  10   30,02 zile, adica jumatate dintre debitorii restantieri au
250
intarziat cel putin 30 de zile cu efectuarea platilor.
o Intervalul modal este intervalul 25-35 de zile deoarece are frecventa absoluta cea mai mare
 
250  n2  max nk , k  1,6 , atunci
1
Mo  xinf Mo  hMo  
1   2
250  125
 25  10   28,84 zile; numarul cel mai intalnit de zile
250  125  250  50
de intarziere a platilor celor 500 de debitori restantieri este de aproximativ 29 de
zile.
o Relatia in care se gasesc cei trei indicatori ai tendintei centrale este Mo  Me  x , ceea ce
indica o asimetrie pozitiva.
6

 xk  x 2  nk
o Dispersia in esantion este

s x2  1
x  x 2
 n1  ...   x 6  x 2
 n6
 k 1 
69120
,
n1  ...  n6   1 500  1 500  1
deci s x2  138,5170 , iar abaterea standard s x  s x2  11,7693 zile, care arata cu cate zile
se abat, in medie, valorile observate ale seriei de date fata de numarul mediu de zile de
intarziere.
s 11,7693
o Coeficientul de variatie in esantion este v x  x 100  100  36,33%  35% , ceea
x 32,4
ce arata ca distributia nu este omogena si media, ca indicatot al tendintei centrale, nu este
reprezentativa pentru colectivitate.

d) Definim “evenimentul favorabil” ca evenimentul ca un debitor intarzie cu platile mai mult


de 45 de zile. Variabila alternativa care evidentiaza debitorii ce au intarziat mai mult de 45 de
 0 1
zile cu efectuarea platilor este Y :   ,
 n  m m

18
unde Y  1 pentru unitatile statistice din esantion care verifica evenimentul favorabil, iar m
este numarul de unitati statistice din esantion pentru care se verifica evenimentul
favorabil, m  n4  n5  n6  75 debitori,
iar Y  0 pentru unitatile statistice din esantion care nu verifica evenimentul favorabil,
n  m este numarul de unitati statistice din esantion pentru care nu se verifica
evenimentul favorabil, n  m  425 debitori.

m 75
Media variabilei alternative este y    0,15 , adica 15% dintre debitori au
n 500
intarziat mai mult de 45 de zile.
m  m
Dispersia variabilei alternative este s y2   1    0,1275 , iar abaterea standard
n  n
m  m
sy   1    0,36 .
n  n

19

S-ar putea să vă placă și