Documente Academic
Documente Profesional
Documente Cultură
Testul (0,8 din NF) va conţine două subiecte cu următoarea structură şi barem:
1
I. TEORIE:
3. Definiţi probabilitatea.
R: Fie un câmp de evenimente ,K. Funcţia P : ,K 0,1 care satisface axiomele lui
Kolmogorov:
a) P(X) 0, X ,K (probabilitatea oricărui eveniment este un număr pozitiv),
b) P() = 1 (probabilitatea evenimentului sigur este egală cu unu),
c) P(X Y) = P(X) + P(Y), X,Y ,K cu X Y = (probabilitatea reuniunii a două
evenimente incompatibile este egală cu suma probabilităţilor lor), se numeşte probabilitate.
2
7. Enumeraţi distribuţii clasice ale variabilelor aleatoare discrete. Explicitaţi una dintre acestea.
R: Dintre distribuţiile clasice ale variabilelor aleatoare discrete amintim: binomială, geometrică,
hipergeometrică, Poisson.
Distribuţia binomială (Bernoulli) – este corespunzătoare schemei urnei cu bile returnate. O
variabilă binomială este asociată unui proces Bernoulli; acest proces constă din n repetiţii ale unui
experiment care are două rezultate mutual exclusive, unul de succes, altul de eşec. Rezultatul unei
încercări nu influenţează rezultatul alteia. Pentru fiecare încercare, probabilitatea succesului este
aceeaşi, p. O variabilă aleatoare binomială este o variabilă discretă având distribuţia de probabilitate
k
dată de relaţia X : k k n k , p q 1, p, q 0
C p q
n k 0, n
Rezultă că probabilitatea de a avea k succese în n încercări este PX k C kn p k q n k .
3
10. Clasificaţi şi enumeraţi caracteristici numerice ale variabilelor aleatoare.
R: Caracteristicile numerice se grupează astfel:
caracteristici de grupare, care pun în evidenţă anumite numere în jurul cărora se grupează,
după cum le spune şi numele, variabilele aleatoare; dintre acestea amintim: valoarea medie,
valoarea mediană, valoarea modală, momentul de ordin superior k, media de ordinul k.
caracteristici de împrăştiere, care arată gradul de depărtare a valorilor variabilelor aleatoare
faţă de o caracteristică de grupare principală care se poate referi la boltire, turtire, asimetrie,
simetrie; ; dintre acestea amintim: dispersia, abaterea medie pătratică, momentul centrat de
ordinul k.
5
18. Definiţi indicatorul statistic.
R: Indicatorul statistic este o variabilă cantitativă, atributivă care caracterizează numeric o
proprietate a unităţilor populaţiei statistice. Indicatorul statistic poate fi rezultatul unei măsurători
directe (manuală sau automatizată) sau poate fi obţinut pe baza unui algoritm de calcul.
19. Clasificaţi indicatorii statistici din punct de vedere al conţinutului algoritmului de calcul:
R: Din punct de vedere al conţinutului algoritmului de calcul, indicatorii statistici se clasifică în:
indicatori absoluţi;
indicatori relativi.
În categoria indicatorilor absoluţi intră următorii indicatori:
a. frecvenţa absolută simplă;
b. frecvenţa absolută cumulată;
c. indicatorul de nivel;
d. diferenţa absolută a unui indicator.
20. Definiţi seria statistică.
R: Seria statistică este un mod ordonat de grupare a datelor pentru a reflecta o corespondenţă dintre
variantele unei variabile şi un anumit indicator. Este o construcţie care redă fie distribuţia unei
populaţii în raport cu una sau mai multe variabile, fie variaţia unei mărimi în timp, în spaţiu sau de
la o categorie la alta.
21. Criterii de clasificare ale seriilor statistice.
Seriile statistice se pot clasifica după mai multe criterii:
a) după numărul de variabile luate în studiu:
serii unidimensionale, construite în funcţie de o singură variabilă;
serii multidimensionale, ce au la bază două sau mai multe variabile.
b) după natura variabilelor:
serii atributive, care au la bază o variabilă atributivă;
serii de spaţiu sau teritoriu, care au la bază o variabilă de spaţiu;
serii cronologice, care au la bază o variabilă de timp.
c) după modul de exprimare a variabilelor:
serii numerice (cantitative), care au la bază variabile numerice şi care, în funcţie de modul
de variaţie al variabilei, poate fi: discretă şi continuă;
serii nenumerice (calitative), care au la bază variabile exprimate prin cuvinte.
d) după semnificaţia indicatorului de pe rândul al doilea al seriei:
serii de repartiţie (de distribuţie);
serii de variaţie care se construiesc cu indicatori obţinuţi din prelucrarea unor indicatori
absoluţi.
22. Definiţi selecţia.
R: Numim selecţie (sondaj) o subcolectivitate a colectivităţii cercetate, iar numărul elementelor
selecţiei poartă numele de volumul selecţiei (sondajului).
23. Enunţaţi principiul de bază al teoriei selecţiei.
R: Variabila aleatoare de selecţie converge în lege către variabila aleatoare teoretică, iar
caracteristicile variabilei de selecţie converg în probabilitate către caracteristicile corespunzătoare
ale variabilei aleatoare teoretice.
24. Care este scopul teoriei estimaţiei?
R: Scopul teoriei estimaţiei este de a evalua parametri de care depinde legea de probabilitate a lui
X, folosind datele de selecţie x 1 , x 2 ,..., x n şi bazându-ne pe rezultatele teoretice relative la
variabilele de selecţie X1 , X 2 ,..., X n .
6
25. Definiţi operaţia de estimare a parametrilor.
R: Estimarea parametrilor este operaţia prin care se evaluează parametrii necunoscuţi ai unei legi
de probabilitate.
7
II. PROBLEME:
1. În cadrul unui proiect POSDRU, echipa de cercetare şi-a propus ca pe întreaga durată de
derulare a proiectului să încerce să ducă la bun sfârşit realizarea a 3 obiective (teme de cercetare
majore independente, O1, O2 , O3), în conformitate cu termenele prevăzute în graficul Gantt;
probabilităţile de realizare la termen a acestor obiective sunt: P(O 1) = 0,95, P(O2) = 0,90,
respectiv P(O3 ) = 0,88. Să se calculeze probabilitatea:
a) ca toate cele 3 obiective să fie îndeplinite la termen;
b) ca primele două să fie îndeplinite la termen, iar ultimul, nu;
c) fie primul, fie al doilea, fie al treilea obiectiv să fie îndeplinit la termen.
Rezolvare: Notăm cu O i ( i 1,3 ) evenimentul „obiectivul i este îndeplinit la termen”.
a) PO1 O2 O3 PO1 PO2 PO3 0,95 0,9 0,88 0,7524;
b) O1, O2, O3 sunt evenimente independente că şi O 1, O2 , O 3 sunt evenimente independente.
P O1 O 2 O 3 PO1 PO 2 P O 3 0,95 0,9 1 0,88 0,1026 ;
c) P(O1O2 O3) = P(O1) + P(O2) + P(O3) - P(O1 O2) - P(O1 O3) - P(O 2O3) +P(O1 O2O3 )
P(O1O 2O3) = 0,95 + 0,90 + 0,88 - 0,950,90 - 0,950,88 - 0,90,88 + 0,950,900,88= 0,9994.
2. Un anume tip de produs dintr-o firmă provine de la trei fabrici diferite în proporţii de 1/2 de
la prima fabrică, 1/6 de la fabrica a doua şi restul de la fabrica a treia. Produsele de la cele trei
fabrici satisfac standardele de calitate în proporţie de 95%, 97%, respectiv 92%. Un client cumpără,
la întâmplare, o bucată din produsul respectiv.
a) Care este probabilitatea ca respectivul produs să satisfacă standardele de calitate?
b) Care e probabilitatea ca produsul să provină de la a doua fabrică, în ipoteza în care, acasă,
clientul constată că produsul este defect?
Rezolvare: Notăm cu Ai ( i 1,3 ) evenimentul „produsul respectiv să provină de la fabrica i”.
PA1 1 / 2
Probabilităţile de apariţie a evenimentelor A i sunt:
PA 2 1 / 6 .
PA 1 PA PA 1 / 3
3 1 2
Avem: A1 A2 A3 = , deoarece produsul luat de client poate proveni doar de la o singură fabrică.
{A1,A2, A3}formează un sistem complet de evenimente, deoarece produsul nu poate proveni în
acelaşi timp de la două fabrici diferite, deci evenimentele sunt incompatibile două câte două.
a) Fie X evenimentul ca produsul ales de client să satisfacă standardele de calitate.
Cunoaştem că probabilităţile ca produsele de la cele trei fabrici să satisfacă standardele de calitate
sunt de 0,95, 0,97, respectiv 0,92.
Acest lucru presupune că:
Dacă produsul cumpărat ar proveni de la prima fabrică, probabilitatea ca acesta să satisfacă
standardele de calitate este de 0,95, adică probabilitatea lui X condiţionată de A1 este 0,95 şi
vom scrie: PA 1 X 0,95 ;
Dacă produsul cumpărat ar proveni de la a doua fabrică, probabilitatea ca acesta să satisfacă
standardele de calitate este de 0,97, adică probabilitatea lui X condiţionată de A2 este 0,97 şi
vom scrie: PA 2 X 0,97 ;
Dacă produsul cumpărat ar proveni de la prima fabrică, probabilitatea ca acesta să satisfacă
standardele de calitate este de 0,92, adică probabilitatea lui X condiţionată de A3 este 0,92 şi
vom scrie: PA 3 X 0,92 .
Deci răspunsul la această întrebare este dat de formula probabilităţii totale
3
1 1 1
P(X) P(Ai ) PA i (X) 0,95 0,97 0,92 0,475 0,161 0,306 0,942 .
i 1
2 6 3
8
b) Probabilitatea evenimentului A2 în condiţiile nerealizării evenimentului X, adică probabilitatea
lui A2 condiţionată de X va fi:
1 - 0,97
1
P(A2 ) PA 2 (X) P(A2 ) 1 - PA 2 (X) 6 0,005
PX (A 2 ) 0,086 .
PX 1 PX 1 - 0,942 0,058
3. Dintr-o urnă cu 10 bile albe, 12 bile negre şi 8 bile roşii se extrag 16 bile. Care este
probabilitatea ca printre acestea să fie 7 bile albe şi 4 bile negre?
Rezolvare: schemă hipergeometrică cu bile nereturnate
a1=10, a2=12, a3=8 N=a1+a2+a3=30;
n=16, 1=7, 2=4 3=n-1 -2=5.
Rezultă:
Ca 1 Ca 2 Ca 3 C 7 C12
4
C85
Pn (1 , 2 , 3 ) 1 2 3
P16 (7, 4, 3) 10 .
C nN C16
30
4. Dintr-o urnă cu 4 bile albe, 5 bile negre şi 11 bile roşii se fac 30 extrageri cu revenire. Care
este probabilitatea ca 10 din bilele extrase să fie albe şi 11 roşii?
4 4 5 11
Rezolvare: n 30, p1 0,2 p2 0,25 p3 0,55
4 5 11 20 20 20
1 10 2 n 1 3 30 10 11 9 3 11
p 1 p 2 2 p3 3
Rezultă: Pn (1 , 2 , 3 ) n! 1 P30 (10, 9,11) 30!
0,210 0,259 0,5511 .
1! 2 ! 3! 10!9!11!
schema Bernoulli cu bile returnate
6. Variabila aleatoare timp de bună funcţionare (TBF) a unui anume tip de echipament electric
are distribuţia exponenţială cu 105 h 1 . Care este probabilitatea ca:
a) TBF 10.000h ?
b) TBF 100.000h ?
c) TBF 10.000 100.000 ?
Rezolvare:
a) Din condiţia TBF 10.000h , rezultă că echipamentul electric supus analizei funcţionează mai
mult de 10.000h; prin aplicarea coroborată a relaţiilor (2.8.16), (2.8.28) şi (2.8.35) rezultă că
probabilitatea de bună funcţionare cu privire la distribuţia exponenţială este dată de relaţia:
R t e t , adică în cazul nostru:
5
Pr obTBF 10.000 h R 10.000 e 10 10.000 0,91
9
b) Este o problemă care se pune complementar celei anterioare, adică echipamentul electric supus
analizei funcţionează mai puţin de 100.000h; prin aplicarea coroborată a relaţiilor (2.8.30), (2.8.31)
cu cele de la punctul anterior rezultă că Ft 1 e t , adică în cazul nostru:
5
Pr obTBF 100.000h F100.000 1 e 10 100.000 0,631.
c) Probabilitatea de funcţionare în intervalul dat este dată de relaţia:
Pr ob10.000 TBF 100.000
100.000
f t dt
100.000 t
e dt
100.000 d e t
dt
10.000 10.000 10.000
5 5
e 10 100.000 e 10 10.000 0,369 0,91 0,541.
7. Să se afle probabilitatea ca aruncând două zaruri, suma punctelor de pe ele să fie un număr
a) divizibil prin 2.
b) cub perfect.
Rezolvare:
Evenimentul sigur este: 1, 2, 3, 4, 5, 6 1, 2, 3, 4, 5, 6 cu card 36 = numărul cazurilor posibile
în experienţa aruncării celor două zaruri.
a) Fie A evenimentul ca suma să fie divizibil prin 2:
A 1,1; 2,2; 3,3; 4,4; 5,56,6; 1,3; 3,1; 1,5; 5,1; 2,4; 4,2; 2,6; 6,2; 3,5; 5,3; 4,6; 6,4
cardA 18 PA
card A 18
0,5 .
card 36
b) Fie B evenimentul ca suma să fie cub perfect:
B 2,6; 6,2; 3,5; 5,3; 4,4 cardB 5 PB
card B 5
0,13(8) .
card 36
8. O urnă conţine 4 bile albe şi 6 negre, iar o altă urnă conţine 2 bile albe şi 8 negre. Dacă din
fiecare urnă se extrage câte o bilă, care este probabilitatea ca o bilă şi numai una din cele extrase să
fie albă?
Rezolvare: Fie A evenimentul ca bila extrasă din prima urnă să fie albă.
Avem: PA 4 / 10 0,4 şi P A 6 / 10 0,6 .
Fie B evenimentul ca bila extrasă din a doua urnă să fie albă.
Avem: PB 2 / 10 0,2 şi P B 8 / 10 0,8 .
Fie C evenimentul ca o bilă şi numai una din cele extrase să fie albă: C A B A B .
Rezultă: PC P A B A B P A B P A B PA P B P A PB
PC 0,4 0,8 0,6 0,2 0,44
PC 0,44 .
10
6
a) m MX x i f x i 1 2 3 4 5 6 1 2 3 4 5 6
1 1 1 1 1 1 1
i 1
6 6 6 6 6 6 6
21
m 3,5
6
2 X DX M X m2
1 3,5 2 3,5 3 3,5 4 3,5 5 3,5 6 3,5
b) X m : 1 1 1 1 1 1
6 6 6 6 6 6
2,5 1,5 0,5 0,5 1,5 2,5
X m: 1 1 1 1 1 1
6 6 6 6 6 6
2,52 1,52 0,52 0,5 2 1,5 2 2,5 2
2
X m : 1 1 1 1 1 1
6 6 6 6 6 6
6,25 2,25 0,25 0,25 2,25 6,25
2
X m : 1 1 1 1 1 1
6 6 6 6 6 6
6,25 2,25 0,25 0,25 2,25 6,25 6,25 2,25 0,25
X m 2 : 1 1 1 1 1 1 , rezultă X m 2 : 1
1 1
6 6 6 6 6 6 3 3 3
Deci, 2 X DX M X m 2 6,25 2,25 0,25
1
3
1
3
1 8,75
3 3
2,916
11
2 1 0 1 1 0 1 2 0 1 2 3
X Y 48 192 50 10 240 960 250 50 144 576 150 30
2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700
1 0 1 2 0 0 0 0 1 0 1 2
X Y 48 192 50 10 240 960 250 50 144 576 150 30
2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700
Se verifică faptul că suma probabilităţilor distribuţiilor X+Y şi X Y este 1.
f 0
40!
0,010 0,9940 0 0,9940 0,6689
0!40 0!
b) Probabilitatea de a găsi un produs defect în lotul considerat, presupune x 1, N0 n 40.
f 1
40!
0,011 0,9940 1 40 0,01 0,9939 0,27.
1!40 1!
c) Probabilitatea de a găsi mai mult de un produs defect în lotul considerat presupune că putem găsi
un număr întreg de produse defecte în lot cuprinse între 2 şi 40, adică ştiind că:
40
F2 f x 1
x 0
f 2 f 3 f 4 ... f 40 1 f 0 f 1
F2 1 0,6689 0,27 0,0611.
12. Se consideră un eşantion de 16 clienţi care intră într-o măcelărie dintr-un cartier. În scopul
de a cerceta frecvenţa X cu care clienţii se aprovizionează din această măcelărie în decursul unei
săptămâni şi cheltuielile lunare Y ale clienţilor [mii lei] s-au obţinut următoarele date de selecţie:
X: 2, 3, 4, 6, 4, 3, 2, 1, 2, 1, 4, 3, 2, 5, 6, 3.
Y: 101, 88, 85, 77, 100, 86, 97, 106, 76, 124, 113, 110, 96, 119, 107, 109.
Să se determine:
a) distribuţiile empirice de selecţie pentru caracteristicile X şi Y;
b) mediile de selecţie, momentele centrate de selecţie de ordinul al doilea şi dispersiile de selecţie
pentru caracteristicile X şi Y;
12
Rezolvare:
1 2 3 4 5 6
a) Distribuţia empirică de selecţie pentru X este: X: .
2 4 4 3 1 2
Pentru caracteristica Y datele de selecţie sunt diferite. Se face o grupare a datelor de selecţie
corespunzătoare caracteristicii Y astfel: prima clasă cuprinde valorile datelor de selecţie în
intervalul [70,80), a doua clasă cuprinde valorile din intervalul [80,90),…, ultima grupă [120,130] .
În urma grupărilor, distribuţia empirică de selecţie a lui Y devine:
75 85 95 105 115 125
Y: .
2 3 2 5 3 1
b) Mediile de selecţie pentru cele două caracteristici sunt:
1 16 1 6 1 1
x
16 i 1
x i
16 i 1
x 'i f i [2 1 4 2 4 3 3 4 1 5 2 6] 51 3,1875.
16 16
1 6 1
y
16 k 1
y' k f k [2 75 3 85 2 95 5 105 3 115 1 125] 99,375.
16
Valorile momentelor centrate de selecţie de ordinul doi pentru caracteristicile X şi Y sunt:
1 16 1 6 1
2 ( X)
16 i1
( x i x ) 2
16 i1
f i ( x 'i x ) 2 [2 (1 3,1875) 2 4 (2 3,1875) 2
16
4 (3 3,1875) 2 3 (4 3,1875) 2 (5 3,1875) 2 2 (6 3,1875) 2 ] 2,288.
1 16 1 6 1
2 ( Y)
16 i 1
( y i y ) 2
16 i1
f i ( y'i y) 2 [2 (75 99,375) 2 3 (85 99,375) 2
16
2 (95 99,375) 2 5 (105 99,375) 2 3 (115 99,375) 2 1 (125 99,375) 2 ] 212,10875
Valorile dispersiilor de selecţie se calculează astfel:
1 16 16
2 ( X)
15 i 1
( x i x ) 2 2 (X) 2,44
15
(X) 2 (X) 1,562
1 16 16
2 ( Y)
15 i 1
( y k y) 2 2 (Y) 226,249
15
(Y) 2 (Y) 15,042
13. Fie o populaţie statistică eşantionată formată din N = 40 de angajaţi din cadrul administraţiei
financiare a judeţului Bihor. Se studiază această populaţie în raport cu variabila statistică X =
"salariul de încadrare". Datele observate au fost sistematizate în următoarea serie statistică :
Se cere:
a) Să se caracterizeze seria după toate criteriile cunoscute;
b) Să se construiască seriile statistice cu indicatori derivaţi posibili şi să se interpreteze rezultatele.
Rezolvare:
a) Seria statistică are la bază variabila atributivă X="salariul de încadrare" şi este construită cu
indicatorul frecvenţă absolută. Seria este unidimensională, numerică, continuă şi de repartiţie.
b) Deoarece seria statistică este construită cu indicatorul frecvenţă absolută - Ni se vor putea
construi serii derivate cu indicatorii : frecvenţa relativă - fri , frecvenţa relativă cumulată - fric ,
frecvenţa absolută cumulată - N ic .
13
Seria statistică derivată construită cu indicatorul frecvenţă relativă
Ni
fri , i 1,4
N
N 20 N 6
fr1 1 0,5 (50%) ; fr2 2 0,15 (15 %)
N 40 N 40
N 9 N 5
fr3 3 0,225 (22,5%) ; fr4 4 0,125 (12,5%)
N 40 N 40
Rezultă că seria statistică derivată construită cu indicatorul frecvenţă relativă este:
800 1000 1000 1200 1200 1400 1400 1600
X :
50% 15% 22,5% 12,5%
Interpretare: 50% dintre angajaţii administraţiei financiare din judeţul Bihor, la nivelul
eşantionului, au un salar de încadrare cuprins între 800 Ron şi 1000 Ron.
Seria statistică derivată construită cu indicatorul frecvenţă relativă cumulată
N N 2 ... N i
fric 1 fr1 fr2 ... fri , i 1,4
N
N N N 2 20 6
fr1c 1 fr1 0,5 (50%) ; fr2c 1 0,65 (65 %)
N N 40
N N 2 N 3 20 6 9
fr3c 1 0,875 (87,5%)
N 40
N N 2 N 3 N 4 20 6 9 5
fr4c 1 1 (100%)
N 40
Rezultă că seria statistică derivată construită cu indicatorul frecvenţă relativă cumulată este:
800 1000 1000 1200 1200 1400 1400 1600
X :
50% 65% 87,5% 100%
Interpretare: 87,5% dintre angajaţii administraţiei financiare din judeţul Bihor, la nivelul
eşantionului, au un salariu de încadrare sub 1400 Ron.
14
14. Se consideră o populaţie statistică formată din totalitatea angajaţilor din administraţia
financiară a unui judeţ. S-a observat această populaţie, la nivelul unui eşantion format din 30 de
angajaţi, în raport cu următoarele variabile :
X1 – salariul de încadrare;
X2 – nivelul de instruire (Bacalaureat, Licenţă, Master) ;
X3 – Calificativul acordat competenţelor de utilizarea a calculatorului ( Slab, Bine, Fbine);
X4 – vârsta.
Datele observate au fost sitematizate în următorul tabel :
Angajat X1 X2 X3 X4
1 700 B Slab 45
2 1200 L Bine 32
3 1200 M Fbine 30
4 850 B Slab 48
5 900 L Bine 25
6 900 M Fbine 25
7 700 B Bine 24
8 1000 M Fbine 30
9 750 L Slab 32
10 1500 L Slab 45
11 1350 L Slab 48
12 1200 L Slab 52
13 1100 B Slab 51
14 1700 L Slab 50
15 700 L Fbine 23
16 800 L Fbine 25
17 850 M Bine 26
18 750 M Bine 25
19 850 B Bine 30
20 900 L Fbine 30
21 1000 L Bine 32
22 1200 B Slab 44
23 1250 L Bine 36
24 750 B Bine 25
25 900 L Slab 30
26 900 M Bine 28
27 1000 B Slab 42
28 1400 L Slab 44
29 1500 L Slab 45
30 1600 L Slab 52
Cerinţe:
1) Să se construiscă seriile satistice unidimensionale ce redau repartiţia unităţilor în raport cu variabilele :
X1, X2, X3, X4 ;
2) Să se construiască seriile statistice bidimensionale ce redau repartiţia unităţilor în raport cu (X1, X4);
15
Rezolvare :
(1) Seria variabilei X1 : Calculăm lungimea unui interval de variaţie urmărind să obţinem patru intervale de
variaţie.
x -x 1700 700
L max min 250
k 4
Seria va fi :
700 950 950 1200 1200 1450 1450 1700
X 1 :
15 4 7 4
Seria variabilei X2 :
B L M
X 2 :
8 16 6
Seria variabilei X3:
Slab Bine Fbine
X 3 :
14 10 6
Seria variabilei X4:
Calculăm lungimea unui interval de variaţie folosind formula lui Sturges.
x max - x min 52 23
L 4,9
1 3,322 lg N 1 3,322 lg30
Seria va fi :
23 - 27,9 27,9 - 32,8 32,8 - 37,7 37,7 - 42,6 42,6 - 47,5 47,5 - 52,4
X 4 :
8 9 1 1 5 6
(2) Vom urmări pentru fiecare unitate a populaţiei statistice cuplul de stări ( x1j , x 4i ), j 1,4 , i 1,6 ,
şi vom număra de câte ori o unitate, din cele 30 observate, se încadrează într-unul din astfel de
cupluri. De exemplu pentru cuplul (700-950 ; 23-27,9) găsim 8 unităţi statistice. Seria
bidimensională este :
15. Conform anuarului statistic al judeţului Bihor din anul 2014, 9489 din totalul societăţilor
comerciale ale judeţului Bihor au activat în domeniile: Comerţ, Transporturi, Construcţii, Hoteluri-
Restaurante. Seria statistică construită cu indicatorul de nivel « cifra de afaceri (în miliarde lei) » se
prezintă astfel :
Comert Transportu ri Constructi i Hoteluri - Restaurant e
X :
49509 9695 4758 1375
1) Să se caracterizeze seria după toate criteriile cunoscute;
2) Să se construiască seriile statistice cu indicatori derivaţi posibili. Interpretare.
Rezolvare:
16
(1) Seria statistică are la bază variabila de spaţiu X=« domeniul de activitate » şi este construită cu
indicatorul de nivel « cifra de afaceri ». Seria este unidimensională, calitativă, de repartiţie.
(2) Deoarece seria statistică este construită cu indicatorul de nivel (Y i) – în cazul nostru cifra de afaceri, vom
putea construi serii derivate cu indicatorii :
diferenţa absolută ( Y );
indicele unui indicator ( I Y );
diferenţa relativă a unui indicator ( R Y );
greutatea specifică ( g i ).
a) Dacă alegem baza de comparaţie nivelul clasei "1", diferenţa absolută cu bază fixă se calculează cu
relaţia :
i/1
Y Yi Y1 , i 2,4
2/1
Y Y2 Y1 9695 49509 39814 ;
3/1
Y Y3 Y1 4758 49509 44751;
4/1
Y Y4 Y1 1375 49509 48134 .
Seria statistică corespunzătoare se scrie:
x1 x2 x3 x4
X : , adică
_ Y2/1
Y
3/1
4/1
Y
x1 x2 x3 x4
X : .
_ - 39814 - 44751 - 48134
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul construcţiilor, în judeţul Bihor, a fost cu
44751 miliarde mai mică decât cifra de afceri înregistrată de domeniul comerţului
3/2
Y Y3 Y2 4758 9695 4937 ;
4/3
Y Y4 Y3 1375 4758 3383
Seria statistică corespunzătoare se scrie:
x1 x2 x3 x4
X : , adică
_ Y2/1
Y
3/2
4/3
Y
x1 x2 x3 x4
X : .
_ - 39814 - 4937 - 3383
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul hoteluri-restaurante, în judeţul Bihor, a
fost cu 3383 miliarde mai mică decât cifra de afaceri înregistrată de domeniul construcţiilor
b) Dacă alegem baza de comparaţie nivelul clasei "2", indicele unui indicator cu bază fixă se calculează cu
relaţia :
Yi
Y
I i/1 , i 1,4
Y2
Y1 49509
Y
I1/2 5,106 (sau 510,6%) ;
Y2 9695
Y3 4758
Y
I 3/2 0,4907 (sau 49,07%) ;
Y2 9695
Y4 1375
Y
I 4/2 0,1418 (sau 14,18%) .
Y2 9695
17
Seria statistică corespunzătoare se scrie:
x1 x2 x3 x4
X : 1/2 3/2
, adică
4/2
I Y _ I Y I Y
x x x x4
X : .
1 2 3
x1 x2 x3 x4
X : .
_ 0,1958 0,4907 0,2889
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul transporturilor, în judeţul Bihor, este de
0,1958 ori mai mică decât cifra de afaceri înregistrată de domeniul comerţului.
Sau, folosind valori procentuale, avem:
x1 x2 x3 x4
X :
_ 19,58% 49,07% 28,89%
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul transporturilor, în judeţul Bihor,
reprezintă 19,58% din cifra de afaceri înregistrată de domeniul comerţului
c) Dacă alegem baza de comparaţie nivelul clasei "1", diferenţa relativă a unui indicator cu bază fixă se
calculează cu relaţia:
Y (I Y 1) (100%) , i 2,4
R i/1 i/1
Y2
Y IY 1
R 2/1 1 0,1958 1 0,8042 (sau - 80,42%) ;
2/1
Y1
Y3
Y IY 1
R 3/1 1 0,0961 1 0,9038 (sau - 90,38%) ;
3/1
Y1
Y4
Y IY 1
R 4/1 1 0,027 1 0,9722 (sau - 97,22%) .
4/1
Y1
Seria statistică corespunzătoare se scrie:
18
x1 x2 x3 x4
X : 2/1 3/1
, adică
_ RY RY R 4/1
Y
x1 x2 x3 x4
X : .
_ - 80,42% - 90,38% - 97,22%
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul construcţiilor, în judeţul Bihor, este cu
90,38% mai mică decât cifra de afaceri înregistrată de domeniul comerţului
Y2
Y IY 1
R 2/1 1 0,1958 1 0,8042 (sau - 80,42%) ;
2/1
Y1
Y3
Y IY 1
R 3/2 1 0,4907 1 0,5093 (sau - 50,93%) ;
3/2
Y2
Y4
Y IY 1
R 4/3 1 0,2889 1 0,7110 (sau - 71,10%) .
4/3
Y3
Seria statistică corespunzătoare se scrie:
x1 x2 x3 x4
X : 2/1 3/2
, adică
_ RY RY R 4/3
Y
x1 x2 x3 x4
X : .
_ - 80,42% - 50,93% - 71,10%
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul hoteluri-restaurante, în judeţul Bihor,
este cu 71,10% mai mică decât cifra de afaceri înregistrată de domeniul construcţiilor
19
16. Pentru şirul de date
n 11 8 15 17
ştiind că media este 13, calculaţi n.
R:
n 11 8 15 17
X
5
X 13
n 11 8 15 17
13 n 51 65 n 14
5
17. Un auditor bancar a selectat 10 conturi şi a înregistrat sumele existente în fiecare dintre
aceste conturi. Sumele sunt date în Euro: 150, 175, 195, 200, 235, 240, 250, 256, 275, 294. Se cere
să se calculeze suma medie de bani existentă într-un cont şi să se testeze 3-4 proprietăţi ale mediei.
R:
10
x
150 175 195 200 235 240 250 256 275 294
i
X i 1
227 euro
10 10
Proprietatea 1: Media aritmetică are întotdeauna valoare cuprinsă între valoarea minimă a
caracteristicii Xmin şi valoarea maximă Xmax
X min X X max 150 227 294 A
Proprietatea 2: Suma abaterilor valorilor individuale ale caracteristicii de la media lor este nulă,
adică distanţele faţă de centru se compensează reciproc:
x X 0
n
i
i 1
x X 0
10
i
i 1
150 227 175 227 195 227 200 227 235 227 240 227 250 227 256 227 275 227 294 227 0
77 52 32 27 8 13 23 29 48 67 188 188 0
Proprietatea 3: Dacă toţi termenii unei serii statistice se măresc sau se micşorează cu o constantă
“a”, atunci şi media se va mări sau se va micşora cu respectiva constantă “a”:
n
x a i
X X a
i 1
n
Pentru exemplul nostru, considerând a = 2, ales arbitrar, avem:
n
x 2 150 2 175 2 195 2 200 2 235 2 240 2 250 2 256 2 275 2 294 2
i
X
i 1
10 10
148 173 193 198 233 238 248 254 273 292 2250
225 X 2 227 2 225
10 10
Proprietatea 4: Dacă toţi termenii unei serii statistice se înmulţesc sau se împart cu o constantă “h”,
atunci şi media se va multiplica sau se va reduce de “h” ori:
n
xi
h
; h 0,1
X
X i 1
n h
20
Pentru exemplul nostru, considerând h = 2, ales arbitrar, avem:
10
xi
h 150 175
...
294
2 1135 113,5 X 227 113,5
X i 1
2 2
n 10 10 h 2
19. Repartiția sucursalelor unei bănci comerciale în funcție de volumul depozitelor bancare atrase
într-o lună este:
40 - 60 14 26
60 - 80 20 46
80 - 100 18 64
100 - 120 16 80
Total 80 -
Calculați mediana.
R:
1 5 1
LMe ni 1 81 40,5 46 Me 60,80
2 i 1 2
LMe n pMe 40,5 26
Me x 0 h 60 20 74,5 mii euro
nMe 20
20. Considerăm o populaţie statistică formată din N=31 de gospodării distribuite în funcţie de
variabila statistică X=„numărul de copii”, în următoarea serie statistică discretă:
0 1 2 3 4 5
X :
8 10 6 3 3 1
Să se calculeze mediana, să se scrie seria derivată şi să se interpreteze rezultatul.
21
R: Deoarece N=31 (impar) obţinem 15,5 15 . De unde +1=15+1=16. Acum vom
N 31 N
2 2 2
calcula, succesiv, frecvenţele absolute cumulate pâna când vom atinge valoarea 16.
N1c N 1 8 ;
Deoarece valoarea găsită este mai mică decât 16 vom calcula următoarea frecvenţă cumulată.
N c2 N1 N 2 8 10 18 16 ;
Am obţinut o valoare mai mare decât 16, cu alte cuvinte am atins valoarea 16, fapt pentru care ne
oprim.
Valoarea medianei va fi egală cu starea variabilei din clasa „2”, adică Me=1.
Pentru interpretare formăm seria cu împărţirea populaţiei în cele două părţi egale:
0 1 1 5
X : .
50% 50%
Această serie exprimă că o jumătate din gospodăriile studiate au maxim un copil iar cealaltă
jumătate au între 1 şi 5 copii.
21. Se consideră populaţia statistică a N=149 societăţi comerciale dintr-un oraş distribuite în raport
cu variabila X=”cifra de afaceri” (milioane lei), în următoarea serie statistică:
6-8 8 - 10 10 - 12 12 - 14 14 - 16
X : .
25 35 40 39 10
Să se determine valoarea mediană.
R: Observăm ca seria este continuă, aşadar vom parcurge paşii algoritmului de determinare a
medianei în acest caz:
i) N=149 (impar), rezultă
N 149
rMe = +1= +1= 74,5 +1=74+1=75;
2 2
ii) Determinăm intervalul median. Vom calcula, succesiv, frecvenţele absolute cumulate pâna când
vom atinge valoarea rangului rMe =75.
N 1c N 1 25 75 (continuăm);
N c2 N1 N 2 25 35 60 75 (continuăm);
N 3c N1 N 2 N 3 25 35 40 100 75 (ne oprim).
Ne-am oprit la a treia frecvenţă cumulată, rezultă că intervalul median este al treilea interval al
seriei, adică intervalul [10,12). Deducem că valoarea mediană va fi o valoare cuprinsă între 10 şi 12.
iii) Vom aplica formula de calcul a valorii mediane pentru serii continue.
Mărimile care intervin în formulă sunt următoarele: x Me =10, rMe =75, F(x Me ) =60, FMe =40, l Me =2.
Valoarea medianei este:
r F(x Me ) 75 60 15
Me x Me Me l Me = 10 2 10 10,75 .
FMe 40 20
x Me - limita inferioara a intervalului median;
r Me - rangul medianei;
F(x Me ) - frecventa absoluta cumulate pana la intervalul median
FMe - frecventa intervalului median
Interpretăm rezultatul construind seria care împarte populaţia în cele două părţi egale:
6 10,75 10,75 - 16
X : .
50% 50%
22
22. Se consideră populaţia satatistică a N=149 societăţi comerciale dintr-un oraş distribuite în raport
cu variabila X=”cifra de afaceri” (milioane lei), în următoarea serie statistică:
6-8 8 - 10 10 - 12 12 - 14 14 - 16
X : .
25 35 40 39 10
Ne propunem să calculăm valoarea modală.
R: Cea mai mare frecvenţă este N 3=40, rezultă că intervalul modal este intervalul [10,12).
Aplicăm formula de calcul a modalei pentru serii continue. Mărimile care apar în formulă sunt:
xMo =10, 1 =40-35=5, 1 =40-39=1, l Mo =2. Modala va fi:
1 5 5
Mo x Mo 1 1
l Mo = 10 2 10 11,66 .
5 1 3
1
= frecventa intervalului modal – frecventa intervalului anterior
1 = frecventa intervalului modal + frecventa intervalului urmator
xMo = limita inferioara a intervalului modal;
Afirmăm că cele mai multe societăţi comerciale dintre cele studiate înregistrează o cifră de afaceri
de aproximativ 11,66 milioane lei.
23. Se consideră populaţia statistică a N=149 societăţi comerciale dintr-un oraş distribuite în raport
cu variabila X=”cifra de afaceri” (milioane lei), în următoarea serie statistică:
6-8 8 - 10 10 - 12 12 - 14 14 - 16
X : .
25 35 40 39 10
Să se calculeze cuartilele.
R: Cuartila mijlocie Q2 este chiar valaorea mediană pe care am determinat-o în aplicaţia 21, aşadar
Q2=Me=10,75.
N
Rangul cuartilei (Q1) este rQ1 1 37 1 38 .Valoarea cuartilei (Q1) va fi:
4
rQ1 F(x Q1 ) 38 25
Q1 x Q1 l Q1 8 2 8,74
FQ1 35
3N
Rangul cuartilei (Q3) este rQ3 1 111 1 112 . Valoarea cuartilei (Q3) va fi:
4
rQ3 F(x Q3 ) 112 100
Q 3 x Q3 l Q3 12 2 12,61
FQ3 39
Interpretăm rezultatul construind seria care împarte populaţia în cele patru părţi egale:
6 8,74 8,74 10,75 10,75 12,61 12,61 16
X : .
25% 25% 25% 25%
24. 30 dintre cele 40 de agenţii ale unei companii turistice îşi au sediul în ţară (intern) şi 10 dintre
ele în străinătate (extern). Să se studieze influenţa factorului de amplasare al agenţiilor (intern,
extern), asupra variabilităţii totale a vânzărilor firmei.
Considerăm variabila Y=”zona de amplasare” factorul de grupare al populaţiei statistice. Situaţia
descrisă este sistematizată în următoarea serie bidimensională:
X
0-10 10-20 20-30 Total
Y
intern 15 10 5 30
extern 2 5 3 10
Total 17 15 8 40
23
R: Calculăm mediile în cele două clase (grupe):
- la intern (clasa 1)
5 15 15 10 25 5 350
X1 11,67 ;
30 30
- la extern (clasa 2)
5 2 15 5 25 3 160
X2 16
10 10
Calculăm dispersiile în cele două clase (grupe):
-la intern (clasa 1)
12
5 11,672 15 15 11,672 10 25 11,672 5 55,55 .
30
-la extern (clasa2)
2
5 16 2 15 16 5 25 16 3
2 2 2
49
2
10
Dispersia din interiorul grupelor ( x2 ) se calculează astfel:
2 30 22 10 55,55 30 49 10
x2 1 53,91
40 40
Ştiind ca X =12,75 (vezi exemplul1), dispersia dintre grupe ( x2 ) se calculează astfel:
5 17 15 15 25 8
X 12,75
40
x2
11,67 12,752 30 16 12,752 10 3.52
40
Dispersia totală este: x2 =53,91+3,52=57,43.
Acum putem determina coeficientul de determinaţie (R2):
x2 3,52
2
R
6,13% .
x2 57,43
De aici deducem imediat şi valoarea coeficientului de variaţie reziduală:
Vx 1 R 2 93,87%
Valoarea mică a coeficientului de determinaţie (R 2) arată companiei că zona de amplasare a
agenţiilor influenţează într-o mică măsură variabilitatea vânzărilor. Explicaţia pentru variabilitatea
mare a vânzărilor trebuie căutată în altă parte.
25. Repartiţia celor 40 de hoteluri în funcţie de variabila Y=”profitul unităţii hoteliere” (milioane
lei) este redată de următoarea serie unidimensională:
0-3 3-6 6-9 9 - 12
Y :
13 14 10 3
Se cere:
1) Să se calculeze profitul mediu înregistrat de companie.
2) Să se măsoare variabilitatea profitului cu ajutorul abaterii medie liniară absolută .
3) Să se măsoare variabilitatea profitului cu ajutorul abaterii medie pătratică.
4) Să se determine gradul de omogenitate al seriei statistice a profitului, atât folosind coeficientul de
variaţie al lui Pearson, cât şi coeficientul simplu de variaţie şi să se analizeze reprezentativitatea
profitului mediu.
5) Să se structureze populaţia statistică a celor 40 de hoteluri în patru părţi egale.
6) Să se determine valoarea modală a seriei de distribuţie a profitului.
7) Sa se aprecieze gradul de asimetrie al seriei profitului cu ajutorul coeficientului de asimetrie al
lui Pearson.
24
Rezolvare:
(1) Profitul mediu se calculează cu relaţia:
4
y i 1
i Ni
1,5 13 4,5 14 7,5 10 10,5 3
Y 4
4,725 .
40
N
i 1
i
Interpretare: Fiecare hotel al companiei a înregistrat, în medie, un profit egal cu 4,725 milioane lei
| y
i 1
i Y | N i
dy = 4
N
i 1
i
y Y Ni
4
2
i
i 1
y 4
N i 1
i
y2
1,5 4,2752 13 ... 10.5 4,7252 3 7,8243 7,8243 2,7972
y
40
Interpretare: Valorile profitului se abat în medie pătratică de la tendinţa centrală cu 2,7972
milioane lei
(4) Coeficienul de variaţie al lui Pearson se calculează cu relaţia:
y 2,7972
Vy 100 Vy 100 59,20% .
Y 4,725
25
(5) Stucturarea populaţiei în patru părţi egale se face cu ajutorul cuartilelor. Vom calcula, aşadar,
cele trei cuartile (Q1 , Q2, Q3) pentru seria continuă.
Cuartila mijlocie Q2 este chiar valoarea mediană, fapt pentru care calculul acestei cuartile
păstrează modul de calcul al medianei. Aplicăm formula
rMe F(x Me )
Q 2 Me x Me l Me
FMe
40
i) N= 40 (par) rangul cuartilei (Q2) este rQ 2 rMe 20 .
2
ii) Determinăm intervalul cuartilei – Q2 (intervalul median). Vom calcula, succesiv, frecvenţele
absolute cumulate pâna când vom atinge valoarea rangului rQ2 rMe 20 .
N1c N1 13 20 (continuăm);
N c2 N1 N 2 13 14 27 20 (ne oprim).
Ne-am oprit la a doua frecvenţă cumulată, rezultă că intervalul median este al doilea interval al
seriei, adică intervalul [3,6). Deducem că valoarea cuartilei –Q2 (medianei) va fi o valoare cuprinsă
între 3 şi 6.
iii) Vom aplica formula de calcul a valorii mediane pentru serii continue.
Mărimile care intervin în formulă sunt următoarele: x Q2 x Me 3 , rQ2 rMe 20 ,
F(x Q2 ) F(x Me ) 13 , FQ2 FMe 14 , lQ2 l Me 3 . Valoarea cuartilei –Q2 (medianei) este:
20 - 13
Q 2 Me 3 3 3 1,5 4,5
14
Pentru calculul cuartilei (Q1) aplicăm formula
rQ1 F(x Q1 )
Q1 x Q1 l Q1 .
FQ1
40
i) N= 40 (se divide cu 4) rangul cuartilei (Q1) este rQ1 10 = N/4.
4
ii) Determinăm intervalul cuartilei – Q1. Vom calcula, succesiv, frecvenţele absolute cumulate pâna
când vom atinge valoarea rangului rQ1 10 .
N1c N1 13 10 (ne oprim).
Ne-am oprit la prima frecvenţă cumulată, rezultă că intervalul cuartilei –Q 1 este primul interval al
seriei, adică intervalul [0,3). Deducem că valoarea cuartilei –Q1 va fi o valoare cuprinsă între 0 şi 3.
iii) Vom aplica formula de calcul a cuartilei –Q1 pentru serii continue.
Mărimile care intervin în formulă sunt următoarele: x Q1 0 , rQ1 10 , F(x Q1 ) 0 , FQ1 13 , l Q2 3 .
Valoarea cuartilei –Q1 este:
10 - 0
Q1 0 3 2,3 .
13
Pentru calculul cuartilei (Q3) aplicăm formula
rQ3 F(x Q3 )
Q 3 x Q3 l Q3
FQ3
40
i) N= 40 (se divide cu 4) rangul cuartilei (Q3) este rQ3 3 30 = 3N/4.
4
ii) Determinăm intervalul cuartilei – Q3. Vom calcula, succesiv, frecvenţele absolute cumulate pâna
când vom atinge valoarea rangului rQ3 30 .
N1c N1 13 30 (continuăm);
N c2 N1 N 2 13 14 27 30 (continuăm);
N 3c N1 N 2 N 3 13 14 10 37 30 (ne oprim).
26
Ne-am oprit la a treia frecvenţă cumulată, rezultă că intervalul cuartilei –Q3 este al treilea interval
al seriei, adică intervalul [6,9). Deducem că valoarea cuartilei –Q3 va fi o valoare cuprinsă între 6 şi
9.
iii) Vom aplica formula de calcul a cuartilei –Q3 pentru serii continue.
Mărimile care intervin în formulă sunt următoarele: x Q3 6 , rQ3 30 , F(x Q3 ) 27 , FQ3 10 ,
l Q3 3 . Valoarea cuartilei –Q3 este:
30 - 27
Q3 6 3 6 0,9 6,9 .
10
Populaţia structurată în cele patru părţi egale este redată în seria următoare:
X min Q1 Q1 Q 2 Q2 - Q3 Q3 - Qmax
X :
25% 25% 25% 25%
0 2,3 2,3 4,5 4,5 6,9 6,9 12
X : .
25% 25% 25% 25%
Interpretare: 25% din populaţia unităţilor hoteliere înregistrează un profit cuprins între valorile 4,5
milioane lei şi 6,9 milioane lei. Se poate observa că primele 25%, respectiv ultimele 25%, dintre
unităţile hoteliere înregistrează un profit destul de îndepărtat de profitul mediu ( Y 4,725 milioane
lei).
(6) Seria profitului este o serie continuă. Valoarea modală pentru o serie continuă se determină cu
formula:
1
Mo x Mo l Mo
1 1
i) Determinăm intervalul modal. Intervalul modal este intervalul seriei cu cea mai mare frecvenţă,
adică intervalul [3,6).
ii) Mărimile care apar în formulă sunt: xMo 3 , 1 =14-13=1, 1 =14-10=4, l Mo =3. Modala va fi:
1
Mo 3 3 3 0,6 3,6 .
1 4
Interpretare: Afirmăm că cele mai multe unităţi hoteliere ale companiei înregistrează un profit
anual de aproximativ 3,6 milioane lei.
(7) Coeficientului de asimetrie al lui Pearson se determină cu relaţia:
Y Mo 4,725 3,6
0,4 .
y 2,7972
Interpretare: Valoarea coeficientului de asimetrie al lui Pearson este strict pozitiv şi depăşeşte
praagul de 0,3, motiv pentru care spunem că seria profitului prezintă o asimetrie pozitivă, relativ
mare
26. Repartiţia celor 40 de hoteluri în funcţie de variabila X=”numărul anual de clienţi al unităţii
hoteliere”(mii) este redată de următoarea serie unidimensională:
0 - 4 4 - 8 8 - 12 12 - 16
X :
10 16 11 3
Se cere:
1) Să se determine numărul mediu de clienţi al companiei.
2) Să se măsoare variabilitatea numărului de clienţi cu ajutorul abaterii medie pătratică.
3) Să se determine gradul de omogenitate al seriei statistice a numărului de clienţi folosind
coeficientul de variaţie al lui Pearson şi să se analizeze reprezentativitatea numărului mediu de
clienţi.
Rezolvare:
27
(1) Numărul mediu de clienţi se calculează cu relaţia:
x
i 1
i Ni
2 10 6 16 10 11 14 3
X 4
6,7
40
N
i 1
i
Interpretare: Fiecare hotel al companiei a avut în 2010, în medie, un număr de clienţi egal cu 6,7 mii
x X Ni
4
2
x i 1
i
x2
2 6,7 2 10 ... 14 6,72 3 12,71 12,71 3,565
4 x
40
N i 1
i
Interpretare: Numărul de clienţi se abate în medie pătratică de la tendinţa centrală a seriei cu 3,565
mii clienţi.
(3) Coeficientul de variaţie al lui Pearson pentru seria numărului de clienţi se determină cu relaţia:
3,565
Vx x 100 100 53,21% .
X 6,7
Interpretare:Valoarea coeficientului de variaţie al lui Pearson depăşeşte considerabil pragul de
30%, motiv pentru care afirmăm că seria numărului de clienţi nu este omogenă, sau prezintă un grad
mic de omogenitate. Vom spune că numărul mediu de clienţi nu este reprezentativ pentru compania
hotelieră
27. Se studiază formarea profitului pe anul 2014 la o companie naţională care îşi desfăşoară
activitatea în domeniul hoteluri-restaurante. Compania deţine un lanţ hotelier format din 40 de
hoteluri amplasate în oraşele mari ale ţării, precum şi în staţiunile renumite de la munte şi malul
mării.
S-a constatat că profitul prezintă o variabilitate mare. O parte din această variabilitate a fost
explicată pe seama numărului anual de clienţi. A rămas, totuşi, o parte destul de însemnată
(23,68%) din variabilitatea profitului neexplicată. Ţinând cont de sezonalitatea activităţii de turism,
o posibilă explicaţie pentru variabilitatea neexplicată a profitului ar fi zona de amplasare a
hotelurilor (Oraşe, Staţiune de la malul mării, Staţiune de munte).
Repartiţia celor 40 de hoteluri în funcţie de variabila Y=”profitul unităţii hoteliere”(milioane lei) şi
Z=” zona de amplasare a hotelurilor” este redată în următoarea serie bidimensionlă:
Y
Z 1,5 4,5 7,5 10,5 Total
Orase 6 10 8 4 28
Mare 0 2 2 0 4
Munte 2 1 4 1 8
Total 8 13 14 5 40
Rezolvare:
28
(1) Metoda 2 (hi-pătrat) presupune construirea unui nou tabel, având aceleaşi dimensiuni ca şi primul, iar
apoi determinarea unei măsuri a distanţei între cele două tabele.
Noul tabel se construieşte recalculând frecvenţele absolute ale tabelului cu ajutorul formulei:
N iy N zj
N ij , i 1,3, j 1,4
N
28 8 28 13 85
N 11
5,6 , N 12 9,1 , ..., N 34 1
40 40 40
Noul tabel se scrie:
Y
Z 1,5 4,5 7,5 10,5 Total
Orase 5,6 9,1 9,8 3,5 28
Mare 0,8 1,3 1,4 0,5 4
Munte 1,6 2,6 2,8 1 8
Total 8 13 14 5 40
i 1 j1
N ij
2
6 5,62 10 9,12 ...
(1 1) 2
4,052
5,6 9,1 1
Interpretare: Valoarea foarte apropiată de zero a statisticii 2 ne spune că între profit şi zona de amplasare
nu există legatură sau dacă aceasta există înseamnă că este foarte slabă. Datorită lipsei legăturii între cele
două variabile, nu putem explica variabilitatea profitului pe seama zonei de amplasare
0 Cap 1
Legătura este mai intensă dacă C ap 1
29