Sunteți pe pagina 1din 29

Materiale pregătitoare pentru verificarea pe parcurs la disciplina

TEORIA PROBABILITĂŢLOR ŞI STATISTICĂ MATEMATICĂ

INFORMAŢII referitoare la VP-ul/Examenul de Teoria probabilităţlor şi statistică matematică:

 Examenul de tipul Verificare pe parcurs (VP) pentru programele de studii ISE si EI se


va desfăşura marţi, 12.01.2021, începând cu ora 12:00; Rezultatele finale ale VP-ului se vor
comunica la orele de seminar din data de 12.01.2021 începând cu ora 15:00 (ISE), respectiv
începând cu ora 17:00 (EI);
 Examenul pentru programele de studii IEI si TTC se va desfăşura marţi, 19.01.2021,
începând cu ora 12:00; Rezultatele finale ale examenului se vor afişa pe platformă în ziua
examenului la ora 21:00.
 Modalitatea de susţinere: Test grilă(on-line) -controlat și temporizat + Sarcini de lucru pe
durata semestrului încărcate pe platforma e.uoradea.ro
 Testul va dura 45 minute şi va cuprinde teorie şi probleme de tipul celor postate în
Materialul pregătitor pentru examen din platformă.
 Nota finală = 0,8NTF + 0,2 NEP
o NTF = Notă Test Final - teorie și aplicații;
o NEP = Notă Evaluare pe parcursul semestrului la cursuri/seminarii - Teme.

Testul (0,8 din NF) va conţine două subiecte cu următoarea structură şi barem:

1 punct din oficiu

Teorie – listă ataşată 4 puncte


5 întrebări teoretice 4 puncte = 5 x 0,8

Aplicaţii - cu cursuri/seminarii pe bancă; este necesar calculator 5 puncte


Probleme – listă ataşată
1. o problemă din categoria celor rezolvate 1,5 puncte = 1 x 1,5
2. o problemă din categoria celor rezolvate 1,5 puncte = 1 x 1,5
3. o problemă din categoria celor rezolvate 2 puncte = 1 x 2

Total: 45 minute 10 puncte = 10 (zece)

1
I. TEORIE:

1. Daţi exemplu de un experiment şi evenimentele acestuia.


R: experiment = aruncarea unui zar, evenimentele = apariţia feţei cu numărul 1, apariţia feţei cu
numărul 2, apariţia feţei cu numărul 3, apariţia feţei cu numărul 4, apariţia feţei cu numărul 5,
apariţia feţei cu numărul 6.

2. Definiţi probabilitatea unui eveniment P(E) şi daţi un exemplu.


R: probabilitatea unui eveniment P(E) este raportul dintre numărul cazurilor favorabile şi numărul
cazurilor posibile: P(E) = f/p = număr de cazuri favorabile / număr de cazuri posibile.
 0,5  0,1 , deoarece
3
Exemplu: Probabilitatea de apariţie a unei feţe cu număr impar este
6
evenimentul de apariţie a unei feţe cu număr impar este: A  1, 3, 5 , card A  3 .

3. Definiţi probabilitatea.
R: Fie un câmp de evenimente ,K. Funcţia P : ,K  0,1 care satisface axiomele lui
Kolmogorov:
a) P(X)  0,  X  ,K (probabilitatea oricărui eveniment este un număr pozitiv),
b) P() = 1 (probabilitatea evenimentului sigur este egală cu unu),
c) P(X Y) = P(X) + P(Y),  X,Y  ,K cu X Y =  (probabilitatea reuniunii a două
evenimente incompatibile este egală cu suma probabilităţilor lor), se numeşte probabilitate.

4. Enumeraţi şi clasificaţi schemele clasice de probabilitate.


Schemele clasice folosesc ca model uzual urnele cu bile identice, care diferă doar prin culorile lor,
dar care nu se văd în timpul extragerii. Există două tipuri principale de extrageri: cu returnare (după
fiecare extragere bila se reintroduce înapoi în urnă) şi fără returnare (extragerile continuă fără ca
bilele extrase să mai fie reintroduse în urnă).
Exemple de scheme cu bile nereturnate: schema hipergeometrică, geometrică,
Exemple de scheme cu bile returnate: schema binomială, binomială generalizată.

5. Definiţi, exemplificaţi şi clasificaţi variabilele aleatoare.


R: Variabila aleatoare este acea variabilă a cărei realizare depinde de evenimente aleatoare
(întâmplătoare).
Exemple de variabile aleatoare:
 cantitatea de căldură folosită de locatarii cartierului Nufărul din Oradea în decursul unei luni;
 temperatura minimă înregistrată în Arad, în cursul unui an.
Clasificare:
 variabilă aleatoare discretă - variabilă aleatoare care poate lua valori într-o mulţime cel mult
numărabilă,
 variabilă aleatoare continuă - variabilă care poate lua valori într-o mulţime continuă.
Exemple de:
 variabilă aleatoare discretă: numărul obţinut la aruncarea unui zar poate lua valori discrete
x i , i  1, 2, 3, 4, 5, 6.
 variabilă aleatoare continuă: temperatura aerului într-un anumit interval de timp stabilit.

6. Definiţi distribuţia pentru o variabilă aleatoare discretă.


 xi   x1 x 2 x 3 ...x n  n
R: Tabloul distribuţiei discrete X :  , i  I se scrie detaliat X :   cu  p i  1

 pi   p1 p 2 p 3 ...p n  i 1
şi defineşte distribuţia de probabilitate a variabilei aleatoare X.

2
7. Enumeraţi distribuţii clasice ale variabilelor aleatoare discrete. Explicitaţi una dintre acestea.
R: Dintre distribuţiile clasice ale variabilelor aleatoare discrete amintim: binomială, geometrică,
hipergeometrică, Poisson.
Distribuţia binomială (Bernoulli) – este corespunzătoare schemei urnei cu bile returnate. O
variabilă binomială este asociată unui proces Bernoulli; acest proces constă din n repetiţii ale unui
experiment care are două rezultate mutual exclusive, unul de succes, altul de eşec. Rezultatul unei
încercări nu influenţează rezultatul alteia. Pentru fiecare încercare, probabilitatea succesului este
aceeaşi, p. O variabilă aleatoare binomială este o variabilă discretă având distribuţia de probabilitate
 k 
dată de relaţia X :  k k n  k  , p  q  1, p, q  0
C p q 
 n  k  0, n
Rezultă că probabilitatea de a avea k succese în n încercări este PX  k   C kn p k q n  k .

Figura 1. Densitatea distribuţiei binomiale în Figura 2.Probabilitatea distribuţiei binomiale în


condiţiile alese condiţiile alese

8. Definiţi distribuţia şi densitatea de probabilitate pentru o variabilă aleatoare continuă.


R: Dacă X este o variabilă aleatoare continuă, care poate lua valori într-un interval a , b ,
x 
distribuţia (repartiţia) sa se notează X :   , iar f x   PX  x  se numeşte densitate de
 f x   xa , b
b
probabilitate şi satisface condiţiile: f x   0, x  a , b şi Fx    f x  dx  1 .
a
9. Enumeraţi distribuţii clasice ale variabilelor aleatoare continuă. Explicitaţi una dintre
acestea.
R: Dintre distribuţiile clasice ale variabilelor aleatoare continue amintim: uniformă, normală,
exponenţială, Weibull, Gamma, Beta, T,  2 (hi-pătrat).
Distribuţia exponenţială
O variabilă aleatoare X care are densitatea de probabilitate definită prin
  e    x , pentru x  0

f x    ,   0 se numeşte variabilă aleatoare cu distribuţie exponenţială,

0 , pentru x  0
cu parametrul  .

Figura 3. Densitatea distribuţiei exponenţiale în Figura 4. Probabilitatea distribuţiei exponenţiale


condiţiile alese în condiţiile alese

3
10. Clasificaţi şi enumeraţi caracteristici numerice ale variabilelor aleatoare.
R: Caracteristicile numerice se grupează astfel:
 caracteristici de grupare, care pun în evidenţă anumite numere în jurul cărora se grupează,
după cum le spune şi numele, variabilele aleatoare; dintre acestea amintim: valoarea medie,
valoarea mediană, valoarea modală, momentul de ordin superior k, media de ordinul k.
 caracteristici de împrăştiere, care arată gradul de depărtare a valorilor variabilelor aleatoare
faţă de o caracteristică de grupare principală care se poate referi la boltire, turtire, asimetrie,
simetrie; ; dintre acestea amintim: dispersia, abaterea medie pătratică, momentul centrat de
ordinul k.

11. Definiţi şi figuraţi noţiunile de evenimente dependente şi evenimente independente.


R: Fie X,Y   două evenimente. Dacă X  Y, spunem că evenimentul X implică evenimentul Y,
adică la orice producere a evenimentului X se produce şi evenimentul Y. În acest caz spunem că
evenimentele X şi Y sunt evenimente dependente.

Figura 5. Evenimente dependente


Fie X,Y   două evenimente (mulţimi asociate). Dacă X  Y şi Y  X atunci
evenimentele X şi Y se numesc independente. Ele pot fi: compatibile, dacă X  Y   sau
incompatibile, dacă X  Y =  .

Figura 6. Evenimente compatibile Figura 7. Evenimente incompatibile


12. Cu ce se ocupă statistica matematică?
R: Statistica matematică se ocupă de activitatea de grupare, analiză şi interpretare a datelor
referitoare la un anumit fenomen, precum si cu unele previziuni privind producerea lui viitoare.
13. Definiţi populaţia statistică şi daţi exemple.
R: Populaţia statistică sau colectivitatea statistică reprezintă mulţimea elementelor simple sau
complexe, de aceeaşi natură, care au una sau mai multe însuşiri esenţiale comune, proprii
elementelor, cât şi populaţiei privită ca un tot unitar.
Exemple: mulţimea studenţilor de la Facultatea de Inginerie Energetică şi Management Industrial,
Universitatea din Oradea, mulţimea societăţilor comerciale cu prestări de servicii din municipiul
Bihor, mulţimea familiilor din judeţul Bihor, mulţimea angajaţilor din sectorul IT din România, etc,
constituie exemple de populaţii statistice.
14. Definiţi unitatea statistică şi daţi exemple. Clasificări.
Unitatea statistică desemnează elementul component al populaţiei statistice asupra căruia se va
efectua observarea; este purtătorul originar de informaţie sau subiectul logic al informaţiei statistice.
Exemple: studentul, societatea comercială cu prestări servicii, angajatul sunt exemple de unităţi
statistice referitoare la cele din exemplele de la subiectul 13.
În funcţie de gradul de complexitate, unităţile statistice se clasifică astfel:
 unităţi statistice simple sunt acele elemente ale populaţiei statistice care nu permit o divizare
a lor în părţi mai mici fără a-şi pierde cel puţin o trăsătură iniţială, ca de exemplu: student la
specializarea Informatică economică, membrul unei familii, etc.
 unităţi statistice complexe sunt acele unităţi care rezultă din agregarea mai multor unităţi
simple, ca de exemplu: grupa de studenţi, familia, etc.
Unităţile populaţiei statistice se notează cu litere mici corespunzătoare majusculei cu care
4
s-a simbolizat populaţia statistică, la care se ataşează un indice numeric inferior, care reprezintă
numărul de ordine al unităţii respective: A  (a1 , a 2 ,..., a n ) .
15. Definiţi variabila statistică şi daţi exemple.
R: Variabila (caracteristica) statistică este acea trăsătură sau însuşire comună care se regăseşte la
fiecare unitate a populaţiei statistice. Variabilele statistice se notează, de obicei, cu majusculele de
la sfârşitul alfabetului: X, Y, Z.
Exemple de variabile statistice. Dacă studiem populaţia statistică reprezentând şomerii dintr-un
oraş, atunci şomerului îi putem asocia variabile statistice, cum ar fi: sexul, vârsta, calificarea,
reşedinţa, etc. Dacă populaţia statistică este formată din totalul firmelor dintr-un anumit oraş, atunci
unei firme îi putem asocia variabile statistice, cum ar fi: numărul de angajaţi, cifra de afaceri,
cheltuieli cu publicitatea, etc.
16. Criterii de clasificare ale variabilelor statistice.
R: Variabilele statistice, deoarece sunt foarte utilizate şi diverse, se clasifică în mai multe criterii,
după cum urmează:
a) după modul de exprimare, variabilele statistice pot fi:
 variabile cantitative (numerice, metrice) a căror variante se exprimă prin valori numerice,
cifre, cum ar fi, de exemplu vârsta, cifra de afaceri, numărul de angajaţi;
 variabile calitative (nenumerice) a căror stări sunt reprezentate prin cuvinte, cum ar fi, de
exemplu, sexul, reşedinţa, calificarea, dar şi prin coduri.
b) după modul de variaţie, variabilele cantitative se împart în:
 variabile numerice discrete care, în intervalul de definiţie, înregistrează numai valori
raţionale. De aceea, variaţia lor are loc în salturi, ca de exemplu, vârsta.
 variabile numerice continue sunt acelea care în intervalul de variaţie al variabilei
înregistrează orice valoare reală. Modul de scriere a unei variabile continue este totdeauna
sub formă de intervale; de exemplu, cifra de afaceri.
c) după natura variabilei:
 variabile atributive care exprimă orice însuşire esenţială comună unităţilor populaţiei
statistice, alta decât spaţiul sau timpul, ca de exemplu: vârsta, cifra de afaceri.
 variabile spaţiale care arată spaţiul în care există sau au luat fiinţă unităţile populaţiei
statistice, cum ar fi, reşedinţa.
 variabile temporale care arată momentul sau perioada de timp în care au luat naştere
unităţile populaţiei statistice; de exemplu, variabila şomaj urmărită lunar pe parcursul unui
an de zile.
d) după numărul de variante ale variabilei:
 variabilă alternativă care are două variante posibile ce se exclud reciproc, ca de exemplu,
sexul.
 variabile nealternative care pot înregistra mai mult de două variante, cum ar fi, de
exemplu, vârsta, cifra de afaceri, reşedinţa.
17. Daţi exemple de variabile statistice relativ la populaţia formată din mulţimea consumatorilor
unui produs:
R: Câteva exemple de variabile statistice relativ la populaţia formată din mulţimea consumatorilor
unui produs sunt:
 vârsta: variabilă atributivă, cantitativă, continuă: X = { x1 = [5-10) [10-20) ... };
 frecvenţa de cumpărare: variabilă atributivă, calitativă: Y = { y1 - foarte des; y2 – des, ... };
 număr de sortimente cumpărate relativ la produsul analizat: variabilă atributivă, cantitativă,
discretă: Z = { z1 = 10; z2 = 12, ... };
 localizarea magazinelor de unde cumpără: variabilă de spaţiu, calitativă:
S = { s1 – cartierul M sau s2 – strada P1, ... };
 data ultimei cumpărări a produsului analizat: variabilă de timp, cantitativă:
T = { t 1 = 10.11.2010; t2 = 16.12.2010, ... }.

5
18. Definiţi indicatorul statistic.
R: Indicatorul statistic este o variabilă cantitativă, atributivă care caracterizează numeric o
proprietate a unităţilor populaţiei statistice. Indicatorul statistic poate fi rezultatul unei măsurători
directe (manuală sau automatizată) sau poate fi obţinut pe baza unui algoritm de calcul.
19. Clasificaţi indicatorii statistici din punct de vedere al conţinutului algoritmului de calcul:
R: Din punct de vedere al conţinutului algoritmului de calcul, indicatorii statistici se clasifică în:
 indicatori absoluţi;
 indicatori relativi.
În categoria indicatorilor absoluţi intră următorii indicatori:
a. frecvenţa absolută simplă;
b. frecvenţa absolută cumulată;
c. indicatorul de nivel;
d. diferenţa absolută a unui indicator.
20. Definiţi seria statistică.
R: Seria statistică este un mod ordonat de grupare a datelor pentru a reflecta o corespondenţă dintre
variantele unei variabile şi un anumit indicator. Este o construcţie care redă fie distribuţia unei
populaţii în raport cu una sau mai multe variabile, fie variaţia unei mărimi în timp, în spaţiu sau de
la o categorie la alta.
21. Criterii de clasificare ale seriilor statistice.
Seriile statistice se pot clasifica după mai multe criterii:
a) după numărul de variabile luate în studiu:
 serii unidimensionale, construite în funcţie de o singură variabilă;
 serii multidimensionale, ce au la bază două sau mai multe variabile.
b) după natura variabilelor:
 serii atributive, care au la bază o variabilă atributivă;
 serii de spaţiu sau teritoriu, care au la bază o variabilă de spaţiu;
 serii cronologice, care au la bază o variabilă de timp.
c) după modul de exprimare a variabilelor:
 serii numerice (cantitative), care au la bază variabile numerice şi care, în funcţie de modul
de variaţie al variabilei, poate fi: discretă şi continuă;
 serii nenumerice (calitative), care au la bază variabile exprimate prin cuvinte.
d) după semnificaţia indicatorului de pe rândul al doilea al seriei:
 serii de repartiţie (de distribuţie);
 serii de variaţie care se construiesc cu indicatori obţinuţi din prelucrarea unor indicatori
absoluţi.
22. Definiţi selecţia.
R: Numim selecţie (sondaj) o subcolectivitate a colectivităţii cercetate, iar numărul elementelor
selecţiei poartă numele de volumul selecţiei (sondajului).
23. Enunţaţi principiul de bază al teoriei selecţiei.
R: Variabila aleatoare de selecţie converge în lege către variabila aleatoare teoretică, iar
caracteristicile variabilei de selecţie converg în probabilitate către caracteristicile corespunzătoare
ale variabilei aleatoare teoretice.
24. Care este scopul teoriei estimaţiei?
R: Scopul teoriei estimaţiei este de a evalua parametri de care depinde legea de probabilitate a lui
X, folosind datele de selecţie x 1 , x 2 ,..., x n şi bazându-ne pe rezultatele teoretice relative la
variabilele de selecţie X1 , X 2 ,..., X n .

6
25. Definiţi operaţia de estimare a parametrilor.
R: Estimarea parametrilor este operaţia prin care se evaluează parametrii necunoscuţi ai unei legi
de probabilitate.

26. Enumeraţi metode de prelucrare statistică.


R: Dintre metodele prin care se poate realiza estimarea parametrilor pentru funcţiile analitice care
modelează şirul variaţional Xn se amintesc: metodele punctuale - metoda verosimilităţii maxime,
metoda momentelor, metoda celor mai mici pătrate, metoda liniarizării – şi metoda intervalelor de
încredere.

27. Explicaţi utilitatea metodei liniarizării.


R: Metoda liniarizării se utilizează pentru estimarea parametrilor, dar şi pentru stabilirea tipului de
funcţie de repartiţie când aceasta nu este cunoscută. Metoda presupune reprezentarea grafică a
funcţiei de repartiţie, în care funcţia de repartiţie teoretică are alura grafică a unei drepte. Parametrii
funcţiei teoretice, necunoscuţi rezultă din parametrii dreptei (panta, termenul liber) care reprezintă
selecţia. În inginerie se utilizează frecvent trei tipuri de distribuţii teoretice: distribuţia exponenţială
(DE), distribuţia Weibull (DW) şi distribuţia normală (DN). Metoda liniarizării se aplică eficient în
combinaţie cu metoda celor mai mici pătrate, astfel putându-se estima parametrii pentru distribuţiile
enumerate anterior.

28. Definiţi ipoteza statistică, testul statistic şi clasificarea acestuia.


R: Numim ipoteză statistică o presupunere relativă cu privire la o caracteristică X a unei populaţii,
fie la legea de probabilitate a lui X, fie la parametrii de care depinde această lege. Testul statistic
este o metodă prin care o ipoteză statistică ce trebuie verificată se acceptă sau se respinge.
Testele de verificare a ipotezelor statistice pot fi:
 teste parametrice, care vizează parametrii de care depinde legea de probabilitate;
 teste neparametrice, care vizează forma analitică a funcţiei de repartiţie. (testul 2 , testul
Kolmogorov).

29. Când se utilizează testul 2?


R: Testul 2 este un test de concordanţă, neparametric, folosit pentru a testa gradul de apropiere
dintre o distribuţie empirică şi una teoretică. Se aplică pentru validarea formei analitice a funcţiei de
repartiţie când volumul selecţiei este mare

30. Când se recomandă testul Kolmogorov?


R: Testul Kolmogorov este un test neparametric, recomandat pentru cazul în care funcţia de
repartiţie empirică se construieşte prin puncte. Pentru aplicarea testului este semnificativ calculul
abaterii maxime dintre funcţia de repartiţie testată şi funcţia empirică, pentru cele n valori ale
selecţiei.

7
II. PROBLEME:

1. În cadrul unui proiect POSDRU, echipa de cercetare şi-a propus ca pe întreaga durată de
derulare a proiectului să încerce să ducă la bun sfârşit realizarea a 3 obiective (teme de cercetare
majore independente, O1, O2 , O3), în conformitate cu termenele prevăzute în graficul Gantt;
probabilităţile de realizare la termen a acestor obiective sunt: P(O 1) = 0,95, P(O2) = 0,90,
respectiv P(O3 ) = 0,88. Să se calculeze probabilitatea:
a) ca toate cele 3 obiective să fie îndeplinite la termen;
b) ca primele două să fie îndeplinite la termen, iar ultimul, nu;
c) fie primul, fie al doilea, fie al treilea obiectiv să fie îndeplinit la termen.
Rezolvare: Notăm cu O i ( i  1,3 ) evenimentul „obiectivul i este îndeplinit la termen”.
a) PO1  O2  O3   PO1   PO2   PO3   0,95  0,9  0,88  0,7524;
b) O1, O2, O3 sunt evenimente independente  că şi O 1, O2 , O 3 sunt evenimente independente.
   
P O1  O 2  O 3  PO1   PO 2   P O 3  0,95  0,9  1  0,88  0,1026 ;
c) P(O1O2 O3) = P(O1) + P(O2) + P(O3) - P(O1 O2) - P(O1 O3) - P(O 2O3) +P(O1 O2O3 )
P(O1O 2O3) = 0,95 + 0,90 + 0,88 - 0,950,90 - 0,950,88 - 0,90,88 + 0,950,900,88= 0,9994.

2. Un anume tip de produs dintr-o firmă provine de la trei fabrici diferite în proporţii de 1/2 de
la prima fabrică, 1/6 de la fabrica a doua şi restul de la fabrica a treia. Produsele de la cele trei
fabrici satisfac standardele de calitate în proporţie de 95%, 97%, respectiv 92%. Un client cumpără,
la întâmplare, o bucată din produsul respectiv.
a) Care este probabilitatea ca respectivul produs să satisfacă standardele de calitate?
b) Care e probabilitatea ca produsul să provină de la a doua fabrică, în ipoteza în care, acasă,
clientul constată că produsul este defect?
Rezolvare: Notăm cu Ai ( i  1,3 ) evenimentul „produsul respectiv să provină de la fabrica i”.
PA1   1 / 2
Probabilităţile de apariţie a evenimentelor A i sunt: 
PA 2   1 / 6 .
PA   1  PA   PA   1 / 3
 3 1 2
Avem: A1 A2 A3 = , deoarece produsul luat de client poate proveni doar de la o singură fabrică.
{A1,A2, A3}formează un sistem complet de evenimente, deoarece produsul nu poate proveni în
acelaşi timp de la două fabrici diferite, deci evenimentele sunt incompatibile două câte două.
a) Fie X evenimentul ca produsul ales de client să satisfacă standardele de calitate.
Cunoaştem că probabilităţile ca produsele de la cele trei fabrici să satisfacă standardele de calitate
sunt de 0,95, 0,97, respectiv 0,92.
Acest lucru presupune că:
 Dacă produsul cumpărat ar proveni de la prima fabrică, probabilitatea ca acesta să satisfacă
standardele de calitate este de 0,95, adică probabilitatea lui X condiţionată de A1 este 0,95 şi
vom scrie: PA 1 X   0,95 ;
 Dacă produsul cumpărat ar proveni de la a doua fabrică, probabilitatea ca acesta să satisfacă
standardele de calitate este de 0,97, adică probabilitatea lui X condiţionată de A2 este 0,97 şi
vom scrie: PA 2 X   0,97 ;
 Dacă produsul cumpărat ar proveni de la prima fabrică, probabilitatea ca acesta să satisfacă
standardele de calitate este de 0,92, adică probabilitatea lui X condiţionată de A3 este 0,92 şi
vom scrie: PA 3 X   0,92 .
Deci răspunsul la această întrebare este dat de formula probabilităţii totale
3
1 1 1
P(X)   P(Ai )  PA i (X)   0,95   0,97   0,92  0,475  0,161  0,306  0,942 .
i 1
2 6 3

8
b) Probabilitatea evenimentului A2 în condiţiile nerealizării evenimentului X, adică probabilitatea
lui A2 condiţionată de X va fi:

 
 1 - 0,97
1
P(A2 )  PA 2 (X) P(A2 )  1 - PA 2 (X) 6 0,005
PX (A 2 )      0,086 .
PX  1  PX  1 - 0,942 0,058

3. Dintr-o urnă cu 10 bile albe, 12 bile negre şi 8 bile roşii se extrag 16 bile. Care este
probabilitatea ca printre acestea să fie 7 bile albe şi 4 bile negre?
Rezolvare: schemă hipergeometrică cu bile nereturnate
a1=10, a2=12, a3=8  N=a1+a2+a3=30;
n=16, 1=7, 2=4  3=n-1 -2=5.
Rezultă:
  
Ca 1  Ca 2  Ca 3 C 7  C12
4
 C85
Pn (1 ,  2 ,  3 )  1 2 3
 P16 (7, 4, 3)  10 .
C nN C16
30

4. Dintr-o urnă cu 4 bile albe, 5 bile negre şi 11 bile roşii se fac 30 extrageri cu revenire. Care
este probabilitatea ca 10 din bilele extrase să fie albe şi 11 roşii?
4 4 5 11
Rezolvare: n  30, p1    0,2 p2   0,25 p3   0,55
4  5  11 20 20 20
1  10  2  n  1  3  30  10  11  9 3  11
  
p 1  p 2 2  p3 3
Rezultă: Pn (1 ,  2 ,  3 )  n! 1 P30 (10, 9,11)  30!
0,210 0,259 0,5511 .
1! 2 ! 3! 10!9!11!
schema Bernoulli cu bile returnate

5. Se dau trei urne neidentice:


 prima conţine 3 bile albe şi 2 bile negre;
 a doua conţine o bilă albă şi 4 bile negre;
 a treia conţine 2 bile albe şi 3 bile negre.
Din fiecare urnă se extrage câte o bilă. Care este probabilitatea ca 2 bile să fie albe şi una neagră?
Rezolvare: schema Poisson
3 2 1 4 2 3
n  3, k  2, p1  , q1  p2  , q2  , p3  , q 3 
5 5 5 5 5 5
3 2
3 2  1 4  2 3  6x  37x  58x  24 , deci 37
 x   x   x    P3 (2)  coeficientul lui x2 = .
5 5  5 5  5 5 125 125

6. Variabila aleatoare timp de bună funcţionare (TBF) a unui anume tip de echipament electric
are distribuţia exponenţială cu   105 h 1 . Care este probabilitatea ca:
a) TBF  10.000h ?
b) TBF  100.000h ?
c) TBF  10.000  100.000 ?
Rezolvare:
a) Din condiţia TBF  10.000h , rezultă că echipamentul electric supus analizei funcţionează mai
mult de 10.000h; prin aplicarea coroborată a relaţiilor (2.8.16), (2.8.28) şi (2.8.35) rezultă că
probabilitatea de bună funcţionare cu privire la distribuţia exponenţială este dată de relaţia:
R t   e t , adică în cazul nostru:
5
Pr obTBF  10.000 h   R 10.000  e 10 10.000  0,91
9
b) Este o problemă care se pune complementar celei anterioare, adică echipamentul electric supus
analizei funcţionează mai puţin de 100.000h; prin aplicarea coroborată a relaţiilor (2.8.30), (2.8.31)
cu cele de la punctul anterior rezultă că Ft   1  e   t , adică în cazul nostru:
5
Pr obTBF  100.000h   F100.000  1  e 10 100.000  0,631.
c) Probabilitatea de funcţionare în intervalul dat este dată de relaţia:
Pr ob10.000  TBF  100.000 


100.000
f t dt    
100.000    t
e dt  

100.000 d e    t 
dt 
10.000 10.000 10.000 
5 5
 e 10 100.000  e 10 10.000  0,369  0,91  0,541.

7. Să se afle probabilitatea ca aruncând două zaruri, suma punctelor de pe ele să fie un număr
a) divizibil prin 2.
b) cub perfect.
Rezolvare:
Evenimentul sigur este:   1, 2, 3, 4, 5, 6 1, 2, 3, 4, 5, 6 cu card   36 = numărul cazurilor posibile
în experienţa aruncării celor două zaruri.
a) Fie A evenimentul ca suma să fie divizibil prin 2:
A  1,1; 2,2; 3,3; 4,4; 5,56,6; 1,3; 3,1; 1,5; 5,1; 2,4; 4,2; 2,6; 6,2; 3,5; 5,3; 4,6; 6,4
 cardA  18  PA  
card A 18
  0,5 .
card  36
b) Fie B evenimentul ca suma să fie cub perfect:
B  2,6; 6,2; 3,5; 5,3; 4,4  cardB  5  PB 
card B 5
  0,13(8) .
card  36

8. O urnă conţine 4 bile albe şi 6 negre, iar o altă urnă conţine 2 bile albe şi 8 negre. Dacă din
fiecare urnă se extrage câte o bilă, care este probabilitatea ca o bilă şi numai una din cele extrase să
fie albă?
Rezolvare: Fie A evenimentul ca bila extrasă din prima urnă să fie albă.

Avem: PA   4 / 10  0,4 şi P A  6 / 10  0,6 .
Fie B evenimentul ca bila extrasă din a doua urnă să fie albă.

Avem: PB  2 / 10  0,2 şi P B  8 / 10  0,8 .
Fie C evenimentul ca o bilă şi numai una din cele extrase să fie albă: C  A  B  A  B .    
       
Rezultă: PC  P A  B  A  B  P A  B  P A  B  PA   P B  P A  PB  
PC  0,4  0,8  0,6  0,2  0,44
PC  0,44 .

9. Se aruncă un zar şi se consideră variabila aleatoare discretă cu distribuţia:


1 2 3 4 5 6
X:1 1 1 1 1 1.
 
6 6 6 6 6 6
Să se calculeze
a) media,
b) dispersia.
Rezolvare:

10
6
a) m  MX    x i  f x i   1   2   3   4   5   6    1  2  3  4  5  6
1 1 1 1 1 1 1
i 1
6 6 6 6 6 6 6
21
m  3,5
6

 2 X  DX  M X  m2 
1  3,5 2  3,5 3  3,5 4  3,5 5  3,5 6  3,5 
b) X  m :  1 1 1 1 1 1 
 
 6 6 6 6 6 6 
  2,5  1,5  0,5 0,5 1,5 2,5 
X m: 1 1 1 1 1 1 
 
 6 6 6 6 6 6 
  2,52  1,52  0,52 0,5 2 1,5 2 2,5 2 
2  
X  m  :  1 1 1 1 1 1 
 
 6 6 6 6 6 6 
 6,25 2,25 0,25 0,25 2,25 6,25 
2 
X  m  :  1 1 1 1 1 1 

 6 6 6 6 6 6 
 6,25 2,25 0,25 0,25 2,25 6,25   6,25 2,25 0,25
X  m 2 :  1 1 1 1 1 1  , rezultă X  m 2 :  1
 
1 1 

 6 6 6 6 6 6   3 3 3 
 
Deci,  2 X   DX   M X  m 2  6,25   2,25   0,25  
1
3
1
3
1 8,75
3 3
 2,916

10. Se dau variabilele aleatoare discrete X şi Y cu distribuţiile:


 1 0 1   1 0 1 2 
X: 2 5 1  şi Y :  2 8 1 1  . Să se determine:
p p  q q 
 3 3  5 6 30 
a) p şi q;
b) distribuţia variabilelor X+Y, XY;
Rezolvare:
 1 1   1 0 1
a) Din p 2  p   1  3p 2  5p  2  0  p   2;   p     X :  1 5 1
5 1
3 3  3 3  
9 9 3
 1 0 1 
 X : 1 5 3
 
 9 9 9
Din
 2 2  1 0 1 2
 1  5q 2  8q  4  0  q   2;   q     Y :  4 16 1
8 1 1
q2  q   1
5 6 30  5 5   
 25 25 6 30 
 1 0 1 2 
 Y :  48 192 50 10 
 
 300 300 300 300 
b)
 11 1 0 11 1 2 1 0 1 2 0 1 2 3 
X  Y  1 48 192 50 10 240 960 250 50 144 576 150 30 
  
 9 300 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 

11
 2 1 0 1 1 0 1 2 0 1 2 3 
X  Y  48 192 50 10 240 960 250 50 144 576 150 30 
 
 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 
 1 0 1 2 0 0 0 0 1 0 1 2 
X  Y  48 192 50 10 240 960 250 50 144 576 150 30 
 
 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 2700 
Se verifică faptul că suma probabilităţilor distribuţiilor X+Y şi X  Y este 1.

11. Se livrează un lot de N 0  40 produse având fiecare aceeaşi probabilitate de


defectare p  0,01. Care este probabilitatea
a) de a nu găsi nici un produs defect în lot?
b) de a găsi doar un produs defect în lot?
c) de a găsi mai mult de un produs defect în lot?
Rezolvare: În cazul nostru variabila aleatoare este numărul de produse.
În rezolvarea problemei se poate aplica distribuţia binomială sau Poisson, deoarece aceste legi sunt
legi discrete care caracterizează evenimente rare. Vom aplica distribuţia binomială.
a) Probabilitatea de a nu găsi nici un produs defect în lotul considerat, presupune :
f x   C nx  p x  q n  x 
n!
 p x  q n  x , n  N, n  x
x!n  x !
unde:
n = N 0  40 = număr de exemplare testate;
x = număr de exemplare defecte;
p = probabilitatea de defectare;
q = probabilitatea de bună funcţionare.
Din q  p  1  q  1  p  1  0,01  0,99
Pentru N 0  40 şi x  0 , avem:

f 0 
40!
 0,010  0,9940  0  0,9940  0,6689
0!40  0!
b) Probabilitatea de a găsi un produs defect în lotul considerat, presupune x  1, N0  n  40.

f 1 
40!
 0,011  0,9940 1  40  0,01 0,9939  0,27.
1!40  1!
c) Probabilitatea de a găsi mai mult de un produs defect în lotul considerat presupune că putem găsi
un număr întreg de produse defecte în lot cuprinse între 2 şi 40, adică ştiind că:
40
F2    f x   1 
x 0
f 2   f 3  f 4   ...  f 40  1  f 0   f 1
F2  1  0,6689  0,27  0,0611.

12. Se consideră un eşantion de 16 clienţi care intră într-o măcelărie dintr-un cartier. În scopul
de a cerceta frecvenţa X cu care clienţii se aprovizionează din această măcelărie în decursul unei
săptămâni şi cheltuielile lunare Y ale clienţilor [mii lei] s-au obţinut următoarele date de selecţie:
X: 2, 3, 4, 6, 4, 3, 2, 1, 2, 1, 4, 3, 2, 5, 6, 3.
Y: 101, 88, 85, 77, 100, 86, 97, 106, 76, 124, 113, 110, 96, 119, 107, 109.
Să se determine:
a) distribuţiile empirice de selecţie pentru caracteristicile X şi Y;
b) mediile de selecţie, momentele centrate de selecţie de ordinul al doilea şi dispersiile de selecţie
pentru caracteristicile X şi Y;

12
Rezolvare:
1 2 3 4 5 6
a) Distribuţia empirică de selecţie pentru X este: X:   .
 2 4 4 3 1 2
Pentru caracteristica Y datele de selecţie sunt diferite. Se face o grupare a datelor de selecţie
corespunzătoare caracteristicii Y astfel: prima clasă cuprinde valorile datelor de selecţie în
intervalul [70,80), a doua clasă cuprinde valorile din intervalul [80,90),…, ultima grupă [120,130] .
În urma grupărilor, distribuţia empirică de selecţie a lui Y devine:
 75 85 95 105 115 125
Y:  .
2 3 2 5 3 1 
b) Mediile de selecţie pentru cele două caracteristici sunt:
1 16 1 6 1 1
x 
16 i 1
x i  
16 i 1
x 'i f i  [2  1  4  2  4  3  3  4  1  5  2  6]   51  3,1875.
16 16
1 6 1
y 
16 k 1
y' k f k  [2  75  3  85  2  95  5  105  3  115  1  125]  99,375.
16
Valorile momentelor centrate de selecţie de ordinul doi pentru caracteristicile X şi Y sunt:
1 16 1 6 1
 2 ( X)  
16 i1
( x i  x ) 2
 
16 i1
f i  ( x 'i  x ) 2   [2  (1  3,1875) 2  4  (2  3,1875) 2 
16
 4  (3  3,1875) 2  3  (4  3,1875) 2  (5  3,1875) 2  2  (6  3,1875) 2 ]  2,288.
1 16 1 6 1
 2 ( Y)  
16 i 1
( y i  y ) 2
 
16 i1
f i  ( y'i  y) 2  [2  (75  99,375) 2  3  (85  99,375) 2 
16
 2  (95  99,375) 2  5  (105  99,375) 2  3  (115  99,375) 2  1  (125  99,375) 2 ]  212,10875
Valorile dispersiilor de selecţie se calculează astfel:
1 16 16
 2 ( X)  
15 i 1
( x i  x ) 2    2 (X)  2,44
15
 (X)   2 (X)  1,562

1 16 16
 2 ( Y)  
15 i 1
( y k  y) 2    2 (Y)  226,249 
15
(Y)   2 (Y)  15,042

13. Fie o populaţie statistică eşantionată formată din N = 40 de angajaţi din cadrul administraţiei
financiare a judeţului Bihor. Se studiază această populaţie în raport cu variabila statistică X =
"salariul de încadrare". Datele observate au fost sistematizate în următoarea serie statistică :

 800  1000 1000  1200 1200  1400 1400  1600


X :  
 20 6 9 5 

Se cere:
a) Să se caracterizeze seria după toate criteriile cunoscute;
b) Să se construiască seriile statistice cu indicatori derivaţi posibili şi să se interpreteze rezultatele.
Rezolvare:
a) Seria statistică are la bază variabila atributivă X="salariul de încadrare" şi este construită cu
indicatorul frecvenţă absolută. Seria este unidimensională, numerică, continuă şi de repartiţie.
b) Deoarece seria statistică este construită cu indicatorul frecvenţă absolută - Ni se vor putea
construi serii derivate cu indicatorii : frecvenţa relativă - fri , frecvenţa relativă cumulată - fric ,
frecvenţa absolută cumulată - N ic .

13
Seria statistică derivată construită cu indicatorul frecvenţă relativă
Ni
fri  , i  1,4 
N
N 20 N 6
fr1  1   0,5 (50%) ; fr2  2   0,15 (15 %)
N 40 N 40
N 9 N 5
fr3  3   0,225 (22,5%) ; fr4  4   0,125 (12,5%)
N 40 N 40
Rezultă că seria statistică derivată construită cu indicatorul frecvenţă relativă este:
 800  1000 1000  1200 1200  1400 1400  1600
X :  
 50% 15% 22,5% 12,5% 
Interpretare: 50% dintre angajaţii administraţiei financiare din judeţul Bihor, la nivelul
eşantionului, au un salar de încadrare cuprins între 800 Ron şi 1000 Ron.
Seria statistică derivată construită cu indicatorul frecvenţă relativă cumulată
N  N 2  ...  N i
fric  1  fr1  fr2  ...  fri , i  1,4 
N
N N  N 2 20  6
fr1c  1  fr1  0,5 (50%) ; fr2c  1   0,65 (65 %)
N N 40
N  N 2  N 3 20  6  9
fr3c  1   0,875 (87,5%)
N 40
N  N 2  N 3  N 4 20  6  9  5
fr4c  1   1 (100%)
N 40
Rezultă că seria statistică derivată construită cu indicatorul frecvenţă relativă cumulată este:
 800  1000 1000  1200 1200  1400 1400  1600
X :  
 50% 65% 87,5% 100% 
Interpretare: 87,5% dintre angajaţii administraţiei financiare din judeţul Bihor, la nivelul
eşantionului, au un salariu de încadrare sub 1400 Ron.

Seria statistică derivată construită cu indicatorul frecvenţă absolută cumulată


Nic  N1  N 2  ...  Ni , i  1,4  N1c  N1  20 ; N c2  N1  N 2  20  6  26 ;
N 3c  N1  N 2  N 3  20  6  9  35 ; N c4  N1  N 2  N 3  N 4  20  6  9  5  40 .
Rezultă că seria statistică derivată construită cu indicatorul frecvenţă absolută cumulată este:
 800  1000 1000  1200 1200  1400 1400  1600
X :  
 20 26 35 40 
Interpretare: 26 dintre angajaţii administraţiei financiare din judeţul Bihor, la nivelul eşantionului,
au un salar de încadrare sub 1200 Ron.

14
14. Se consideră o populaţie statistică formată din totalitatea angajaţilor din administraţia
financiară a unui judeţ. S-a observat această populaţie, la nivelul unui eşantion format din 30 de
angajaţi, în raport cu următoarele variabile :
 X1 – salariul de încadrare;
 X2 – nivelul de instruire (Bacalaureat, Licenţă, Master) ;
 X3 – Calificativul acordat competenţelor de utilizarea a calculatorului ( Slab, Bine, Fbine);
 X4 – vârsta.
Datele observate au fost sitematizate în următorul tabel :

Angajat X1 X2 X3 X4
1 700 B Slab 45
2 1200 L Bine 32
3 1200 M Fbine 30
4 850 B Slab 48
5 900 L Bine 25
6 900 M Fbine 25
7 700 B Bine 24
8 1000 M Fbine 30
9 750 L Slab 32
10 1500 L Slab 45
11 1350 L Slab 48
12 1200 L Slab 52
13 1100 B Slab 51
14 1700 L Slab 50
15 700 L Fbine 23
16 800 L Fbine 25
17 850 M Bine 26
18 750 M Bine 25
19 850 B Bine 30
20 900 L Fbine 30
21 1000 L Bine 32
22 1200 B Slab 44
23 1250 L Bine 36
24 750 B Bine 25
25 900 L Slab 30
26 900 M Bine 28
27 1000 B Slab 42
28 1400 L Slab 44
29 1500 L Slab 45
30 1600 L Slab 52

Cerinţe:
1) Să se construiscă seriile satistice unidimensionale ce redau repartiţia unităţilor în raport cu variabilele :
X1, X2, X3, X4 ;
2) Să se construiască seriile statistice bidimensionale ce redau repartiţia unităţilor în raport cu (X1, X4);

15
Rezolvare :

(1) Seria variabilei X1 : Calculăm lungimea unui interval de variaţie urmărind să obţinem patru intervale de
variaţie.
x -x 1700  700
L  max min   250
k 4
Seria va fi :
 700  950 950  1200 1200  1450 1450  1700 
X 1 :  
 15 4 7 4 
Seria variabilei X2 :
B L M
X 2 :  
8 16 6 
Seria variabilei X3:
 Slab Bine Fbine 
X 3 :  
 14 10 6 
Seria variabilei X4:
Calculăm lungimea unui interval de variaţie folosind formula lui Sturges.
x max - x min 52  23
L   4,9
1  3,322  lg N 1  3,322  lg30
Seria va fi :
 23 - 27,9 27,9 - 32,8 32,8 - 37,7 37,7 - 42,6 42,6 - 47,5 47,5 - 52,4 
X 4 :  
 8 9 1 1 5 6 

(2) Vom urmări pentru fiecare unitate a populaţiei statistice cuplul de stări ( x1j , x 4i ), j  1,4 , i  1,6 ,
şi vom număra de câte ori o unitate, din cele 30 observate, se încadrează într-unul din astfel de
cupluri. De exemplu pentru cuplul (700-950 ; 23-27,9) găsim 8 unităţi statistice. Seria
bidimensională este :

X1 700-950 950-1200 1200-1450 1450-1700 Total


X4
23-27,9 8 0 0 0 8
27,9-32,8 5 2 2 0 9
32,8-37,7 0 0 1 0 1
37,7-42,6 0 1 0 0 1
42,6-47,5 1 0 2 2 5
47,5-52,4 1 1 2 2 6
Total 15 4 7 4 30

15. Conform anuarului statistic al judeţului Bihor din anul 2014, 9489 din totalul societăţilor
comerciale ale judeţului Bihor au activat în domeniile: Comerţ, Transporturi, Construcţii, Hoteluri-
Restaurante. Seria statistică construită cu indicatorul de nivel « cifra de afaceri (în miliarde lei) » se
prezintă astfel :
 Comert Transportu ri Constructi i Hoteluri - Restaurant e 
X :  
 49509 9695 4758 1375 
1) Să se caracterizeze seria după toate criteriile cunoscute;
2) Să se construiască seriile statistice cu indicatori derivaţi posibili. Interpretare.

Rezolvare:

16
(1) Seria statistică are la bază variabila de spaţiu X=« domeniul de activitate » şi este construită cu
indicatorul de nivel « cifra de afaceri ». Seria este unidimensională, calitativă, de repartiţie.
(2) Deoarece seria statistică este construită cu indicatorul de nivel (Y i) – în cazul nostru cifra de afaceri, vom
putea construi serii derivate cu indicatorii :
 diferenţa absolută (  Y );
 indicele unui indicator ( I Y );
 diferenţa relativă a unui indicator ( R Y );
 greutatea specifică ( g i ).

a) Dacă alegem baza de comparaţie nivelul clasei "1", diferenţa absolută cu bază fixă se calculează cu
relaţia :
i/1
Y  Yi  Y1 , i  2,4 

2/1
Y  Y2  Y1  9695  49509  39814 ;

3/1
Y  Y3  Y1  4758  49509  44751;

4/1
Y  Y4  Y1  1375  49509  48134 .
Seria statistică corespunzătoare se scrie:
 x1 x2 x3 x4 
X :   , adică

 _ Y2/1
Y
3/1
4/1
Y 
 x1 x2 x3 x4 
X :  .
 _ - 39814 - 44751 - 48134 
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul construcţiilor, în judeţul Bihor, a fost cu
44751 miliarde mai mică decât cifra de afceri înregistrată de domeniul comerţului

Diferenţa absolută cu bază în lanţ se calculează cu relaţia :


i/iY-1  Yi  Yi-1 , i  2,4 
2/1
Y  Y2  Y1  9695  49509  39814 ;

3/2
Y  Y3  Y2  4758  9695  4937 ;

4/3
Y  Y4  Y3  1375  4758  3383
Seria statistică corespunzătoare se scrie:
 x1 x2 x3 x4 
X :   , adică

 _ Y2/1
Y
3/2
4/3
Y 
 x1 x2 x3 x4 
X :  .
 _ - 39814 - 4937 - 3383 
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul hoteluri-restaurante, în judeţul Bihor, a
fost cu 3383 miliarde mai mică decât cifra de afaceri înregistrată de domeniul construcţiilor

b) Dacă alegem baza de comparaţie nivelul clasei "2", indicele unui indicator cu bază fixă se calculează cu
relaţia :
Yi
Y 
I i/1 , i  1,4 
Y2
Y1 49509
Y 
I1/2   5,106 (sau 510,6%) ;
Y2 9695
Y3 4758
Y 
I 3/2   0,4907 (sau 49,07%) ;
Y2 9695
Y4 1375
Y 
I 4/2   0,1418 (sau 14,18%) .
Y2 9695

17
Seria statistică corespunzătoare se scrie:
 x1 x2 x3 x4 
X :  1/2 3/2
 , adică
4/2 
 I Y _ I Y I Y 

 x x x x4 
X :  .
1 2 3

5,106 _ 0,4907 0, 1418 


 
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul comerţului, în judeţul Bihor, este de
5,106 ori mai mare decât cifra de afaceri înregistrată de domeniul transporturilor.
Sau, folosind valori procentuale, avem:
 x1 x2 x3 x4 
X :  
 510,6% _ 49,07% 14,18%
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul comerţului, în judeţul Bihor, reprezintă
510,6% din cifra de afaceri înregistrată de domeniul transporturilor

- Indicele unui indicator cu bază în lanţ se calculează cu relaţia:


Yi
Y 
I i/i -1
 (100 %) , i  2,4 
Yi -1
Y2 9695
Y 
I 2/1   0,1958 (sau 19,58%) ;
Y1 49509
Y3 4758
Y 
I 3/2   0,4907 (sau 49,07%) ;
Y2 9695
Y4 1375
Y 
I 4/3   0,2889 (sau 28,89%) .
Y3 4758
Seria statistică corespunzătoare se scrie:
 x1 x2 x3 x4 
X :  2/1 3/2
 , adică

 _ IY IY I 4/3
Y 

 x1 x2 x3 x4 
X :  .
 _ 0,1958 0,4907 0,2889
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul transporturilor, în judeţul Bihor, este de
0,1958 ori mai mică decât cifra de afaceri înregistrată de domeniul comerţului.
Sau, folosind valori procentuale, avem:
 x1 x2 x3 x4 
X :  
 _ 19,58% 49,07% 28,89%
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul transporturilor, în judeţul Bihor,
reprezintă 19,58% din cifra de afaceri înregistrată de domeniul comerţului

c) Dacă alegem baza de comparaţie nivelul clasei "1", diferenţa relativă a unui indicator cu bază fixă se
calculează cu relaţia:
Y  (I Y  1)  (100%) , i  2,4 
R i/1 i/1

Y2
Y  IY 1 
R 2/1  1  0,1958  1  0,8042 (sau - 80,42%) ;
2/1
Y1
Y3
Y  IY 1 
R 3/1  1  0,0961  1  0,9038 (sau - 90,38%) ;
3/1
Y1
Y4
Y  IY 1 
R 4/1  1  0,027  1  0,9722 (sau - 97,22%) .
4/1
Y1
Seria statistică corespunzătoare se scrie:

18
 x1 x2 x3 x4 
X :  2/1 3/1
 , adică

 _ RY RY R 4/1
Y 

 x1 x2 x3 x4 
X :  .
 _ - 80,42% - 90,38% - 97,22%
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul construcţiilor, în judeţul Bihor, este cu
90,38% mai mică decât cifra de afaceri înregistrată de domeniul comerţului

- diferenţa relativă a unui indicator cu bază în lanţ se calculează cu relaţia:


Y  (I Y  1)  (100%) , i  2,4 
R i/i-1 i/i-1

Y2
Y  IY 1 
R 2/1  1  0,1958  1  0,8042 (sau - 80,42%) ;
2/1
Y1
Y3
Y  IY 1 
R 3/2  1  0,4907  1  0,5093 (sau - 50,93%) ;
3/2
Y2
Y4
Y  IY 1 
R 4/3  1  0,2889  1  0,7110 (sau - 71,10%) .
4/3
Y3
Seria statistică corespunzătoare se scrie:
 x1 x2 x3 x4 
X :  2/1 3/2
 , adică

 _ RY RY R 4/3
Y 

 x1 x2 x3 x4 
X :  .
 _ - 80,42% - 50,93% - 71,10%
Interpretare: Cifra de afaceri înregistrată în anul 2014 de domeniul hoteluri-restaurante, în judeţul Bihor,
este cu 71,10% mai mică decât cifra de afaceri înregistrată de domeniul construcţiilor

d) greutatea specifică se determină ca şi o pondere a unei părţi din întreg.


Avem Y1= 49509, Y2= 9695, Y3=4758, Y4= 1375, de unde nivelul total al cifrei de afaceri va fi:
Y  49509  9695  4758  1375  65337 .
Relaţia de determinare a greutăţii specifice este:
Y
g i  i  (100) , i  1,4 
Y
Y1 49509
g1    0,7577 (sau 75,78%) ;
Y 65337
Y 9695
g2  2   0,1484 (sau 14,84%) ;
Y 65337
Y 4758
g3  3   0,0728 (sau 7,28%) ;
Y 65337
Y 1375
g4  4   0,0210 (sau 2,10%) .
Y 65337
 x1 x2 x3 x4 
X :   , adică
 g1 g2 gi g 4 
 x1 x2 x3 x4 
X :  .
 75,78% 14,84% 7,28% 2,10% 
Interpretare: 75,78% din totalul cifrei de afaceri înregistrată în anul 2014 de cele patru domenii de
activitate, în judeţul Bihor, reprezintă cifra de afaceri înregistrată de domeniul comerţului.

19
16. Pentru şirul de date
n 11 8 15 17
ştiind că media este 13, calculaţi n.
R:
 n  11  8  15  17
X 
 5 
 X  13

n  11  8  15  17
  13  n  51  65  n  14
5

17. Un auditor bancar a selectat 10 conturi şi a înregistrat sumele existente în fiecare dintre
aceste conturi. Sumele sunt date în Euro: 150, 175, 195, 200, 235, 240, 250, 256, 275, 294. Se cere
să se calculeze suma medie de bani existentă într-un cont şi să se testeze 3-4 proprietăţi ale mediei.
R:
10

x
150  175  195  200  235  240  250  256  275  294
i
X i 1
  227 euro
10 10
Proprietatea 1: Media aritmetică are întotdeauna valoare cuprinsă între valoarea minimă a
caracteristicii Xmin şi valoarea maximă Xmax
X min  X  X max  150  227  294 A
Proprietatea 2: Suma abaterilor valorilor individuale ale caracteristicii de la media lor este nulă,
adică distanţele faţă de centru se compensează reciproc:

 x  X   0
n

i
i 1

 x  X   0 
10

i
i 1

150  227  175  227  195  227  200  227  235  227  240  227  250  227  256  227  275  227  294  227  0
 77  52  32  27  8  13  23  29  48  67  188  188  0

Proprietatea 3: Dacă toţi termenii unei serii statistice se măresc sau se micşorează cu o constantă
“a”, atunci şi media se va mări sau se va micşora cu respectiva constantă “a”:
n

 x  a  i
X   X a
i 1
n
Pentru exemplul nostru, considerând a = 2, ales arbitrar, avem:
n

 x  2 150  2  175  2  195  2  200  2  235  2  240  2  250  2  256  2  275  2  294  2
i
X  
i 1

10 10
148  173  193  198  233  238  248  254  273  292 2250
   225  X  2  227  2  225
10 10

Proprietatea 4: Dacă toţi termenii unei serii statistice se înmulţesc sau se împart cu o constantă “h”,
atunci şi media se va multiplica sau se va reduce de “h” ori:
n
 xi 
  h 
; h  0,1
X
X  i 1

n h

20
Pentru exemplul nostru, considerând h = 2, ales arbitrar, avem:
10
 xi 
  h  150 175
  ... 
294
2  1135  113,5  X  227  113,5
X  i 1
 2 2
n 10 10 h 2

18. Se dă seria de date:


r 3 13 1 11
Dacă mediana este 3, ce număr poate să fie r?
R: Avem un număr impar de numere pe care le aranjăm crescător, ținând cont de faptul că mediana
este 3, deci 3 se află la mijlocul șirului ordonat crescător.
Obținem: 1 r 3 11 13
Vizualizînd cele două posibilități de alegere a variantei corecte, rezultă: r = 1

19. Repartiția sucursalelor unei bănci comerciale în funcție de volumul depozitelor bancare atrase
într-o lună este:

Volum depozite bancare (xi) Nr. sucursale bănci (ni) ni cumulat


(mii euro) crescător
20 – 40 12 12

40 - 60 14 26

60 - 80 20 46

80 - 100 18 64

100 - 120 16 80

Total 80 -

Calculați mediana.
R:

1  5  1
LMe     ni  1   81  40,5  46  Me  60,80
2  i 1  2
LMe  n pMe 40,5  26
Me  x 0  h   60  20   74,5 mii euro
nMe 20

x 0 - limita inferioara a intervalului median;


h – lungimea intervalului median
Deci, 50% din sucursale au atras depozite în valoare de 74,5 mii euro, iar 50% peste 74,5 mii euro.

20. Considerăm o populaţie statistică formată din N=31 de gospodării distribuite în funcţie de
variabila statistică X=„numărul de copii”, în următoarea serie statistică discretă:
 0 1 2 3 4 5
X :  
 8 10 6 3 3 1 
Să se calculeze mediana, să se scrie seria derivată şi să se interpreteze rezultatul.

21
R: Deoarece N=31 (impar) obţinem       15,5  15 . De unde   +1=15+1=16. Acum vom
N 31 N
2 2 2
calcula, succesiv, frecvenţele absolute cumulate pâna când vom atinge valoarea 16.
N1c  N 1  8 ;
Deoarece valoarea găsită este mai mică decât 16 vom calcula următoarea frecvenţă cumulată.
N c2  N1  N 2  8  10  18  16 ;
Am obţinut o valoare mai mare decât 16, cu alte cuvinte am atins valoarea 16, fapt pentru care ne
oprim.
Valoarea medianei va fi egală cu starea variabilei din clasa „2”, adică Me=1.
Pentru interpretare formăm seria cu împărţirea populaţiei în cele două părţi egale:
 0 1 1 5 
X :   .
 50% 50% 
Această serie exprimă că o jumătate din gospodăriile studiate au maxim un copil iar cealaltă
jumătate au între 1 şi 5 copii.

21. Se consideră populaţia statistică a N=149 societăţi comerciale dintr-un oraş distribuite în raport
cu variabila X=”cifra de afaceri” (milioane lei), în următoarea serie statistică:
 6-8 8 - 10 10 - 12 12 - 14 14 - 16 
X :  .
 25 35 40 39 10 
Să se determine valoarea mediană.
R: Observăm ca seria este continuă, aşadar vom parcurge paşii algoritmului de determinare a
medianei în acest caz:
i) N=149 (impar), rezultă
N 149 
rMe =   +1=   +1= 74,5 +1=74+1=75;
2  2 
ii) Determinăm intervalul median. Vom calcula, succesiv, frecvenţele absolute cumulate pâna când
vom atinge valoarea rangului rMe =75.
N 1c  N 1  25  75 (continuăm);
N c2  N1  N 2  25  35  60  75 (continuăm);
N 3c  N1  N 2  N 3  25  35  40  100  75 (ne oprim).
Ne-am oprit la a treia frecvenţă cumulată, rezultă că intervalul median este al treilea interval al
seriei, adică intervalul [10,12). Deducem că valoarea mediană va fi o valoare cuprinsă între 10 şi 12.
iii) Vom aplica formula de calcul a valorii mediane pentru serii continue.
Mărimile care intervin în formulă sunt următoarele: x Me =10, rMe =75, F(x Me ) =60, FMe =40, l Me =2.
Valoarea medianei este:
r  F(x Me ) 75  60 15
Me  x Me  Me  l Me = 10   2  10   10,75 .
FMe 40 20
x Me - limita inferioara a intervalului median;
r Me - rangul medianei;
F(x Me ) - frecventa absoluta cumulate pana la intervalul median
FMe - frecventa intervalului median

Interpretăm rezultatul construind seria care împarte populaţia în cele două părţi egale:
 6  10,75 10,75 - 16 
X :  .
 50% 50% 

22
22. Se consideră populaţia satatistică a N=149 societăţi comerciale dintr-un oraş distribuite în raport
cu variabila X=”cifra de afaceri” (milioane lei), în următoarea serie statistică:
 6-8 8 - 10 10 - 12 12 - 14 14 - 16 
X :  .
 25 35 40 39 10 
Ne propunem să calculăm valoarea modală.

R: Cea mai mare frecvenţă este N 3=40, rezultă că intervalul modal este intervalul [10,12).
Aplicăm formula de calcul a modalei pentru serii continue. Mărimile care apar în formulă sunt:
xMo =10, 1 =40-35=5, 1 =40-39=1, l Mo =2. Modala va fi:
1 5 5
Mo  x Mo  1 1
 l Mo = 10   2  10   11,66 .
  5 1 3
1
 = frecventa intervalului modal – frecventa intervalului anterior
1 = frecventa intervalului modal + frecventa intervalului urmator
xMo = limita inferioara a intervalului modal;
Afirmăm că cele mai multe societăţi comerciale dintre cele studiate înregistrează o cifră de afaceri
de aproximativ 11,66 milioane lei.

23. Se consideră populaţia statistică a N=149 societăţi comerciale dintr-un oraş distribuite în raport
cu variabila X=”cifra de afaceri” (milioane lei), în următoarea serie statistică:
 6-8 8 - 10 10 - 12 12 - 14 14 - 16 
X :  .
 25 35 40 39 10 
Să se calculeze cuartilele.
R: Cuartila mijlocie Q2 este chiar valaorea mediană pe care am determinat-o în aplicaţia 21, aşadar
Q2=Me=10,75.
N
Rangul cuartilei (Q1) este rQ1     1  37  1  38 .Valoarea cuartilei (Q1) va fi:
4
rQ1  F(x Q1 ) 38  25
Q1  x Q1   l Q1  8   2  8,74
FQ1 35
 3N 
Rangul cuartilei (Q3) este rQ3     1  111  1  112 . Valoarea cuartilei (Q3) va fi:
 4 
rQ3  F(x Q3 ) 112  100
Q 3  x Q3   l Q3  12   2  12,61
FQ3 39
Interpretăm rezultatul construind seria care împarte populaţia în cele patru părţi egale:
 6  8,74 8,74  10,75 10,75  12,61 12,61  16 
X :  .
 25% 25% 25% 25% 

24. 30 dintre cele 40 de agenţii ale unei companii turistice îşi au sediul în ţară (intern) şi 10 dintre
ele în străinătate (extern). Să se studieze influenţa factorului de amplasare al agenţiilor (intern,
extern), asupra variabilităţii totale a vânzărilor firmei.
Considerăm variabila Y=”zona de amplasare” factorul de grupare al populaţiei statistice. Situaţia
descrisă este sistematizată în următoarea serie bidimensională:

X
0-10 10-20 20-30 Total
Y
intern 15 10 5 30
extern 2 5 3 10
Total 17 15 8 40
23
R: Calculăm mediile în cele două clase (grupe):
- la intern (clasa 1)
5  15  15  10  25  5 350
X1    11,67 ;
30 30
- la extern (clasa 2)
5  2  15  5  25  3 160
X2    16
10 10
Calculăm dispersiile în cele două clase (grupe):
-la intern (clasa 1)
 12 
5  11,672  15  15  11,672  10  25  11,672  5  55,55 .
30
-la extern (clasa2)
 2

5  16  2  15  16  5  25  16  3
2 2 2
 49
2
10
Dispersia din interiorul grupelor (  x2 ) se calculează astfel:
 2  30   22  10 55,55  30  49  10
 x2  1   53,91
40 40
Ştiind ca X =12,75 (vezi exemplul1), dispersia dintre grupe (  x2 ) se calculează astfel:
5 17  15 15  25  8
X   12,75
40
 x2 
11,67  12,752  30  16  12,752  10  3.52
40
Dispersia totală este:  x2 =53,91+3,52=57,43.
Acum putem determina coeficientul de determinaţie (R2):
 x2 3,52
2
R 
  6,13% .
 x2 57,43
De aici deducem imediat şi valoarea coeficientului de variaţie reziduală:
Vx  1  R 2  93,87%
Valoarea mică a coeficientului de determinaţie (R 2) arată companiei că zona de amplasare a
agenţiilor influenţează într-o mică măsură variabilitatea vânzărilor. Explicaţia pentru variabilitatea
mare a vânzărilor trebuie căutată în altă parte.

25. Repartiţia celor 40 de hoteluri în funcţie de variabila Y=”profitul unităţii hoteliere” (milioane
lei) este redată de următoarea serie unidimensională:
 0-3 3-6 6-9 9 - 12 
Y :  
 13 14 10 3 
Se cere:
1) Să se calculeze profitul mediu înregistrat de companie.
2) Să se măsoare variabilitatea profitului cu ajutorul abaterii medie liniară absolută .
3) Să se măsoare variabilitatea profitului cu ajutorul abaterii medie pătratică.
4) Să se determine gradul de omogenitate al seriei statistice a profitului, atât folosind coeficientul de
variaţie al lui Pearson, cât şi coeficientul simplu de variaţie şi să se analizeze reprezentativitatea
profitului mediu.
5) Să se structureze populaţia statistică a celor 40 de hoteluri în patru părţi egale.
6) Să se determine valoarea modală a seriei de distribuţie a profitului.
7) Sa se aprecieze gradul de asimetrie al seriei profitului cu ajutorul coeficientului de asimetrie al
lui Pearson.

24
Rezolvare:
(1) Profitul mediu se calculează cu relaţia:
4

y i 1
i  Ni
1,5  13  4,5  14  7,5  10  10,5  3
Y 4
  4,725 .
40
N
i 1
i

Interpretare: Fiecare hotel al companiei a înregistrat, în medie, un profit egal cu 4,725 milioane lei

(2) Abaterea medie liniară absolută a profitului se calculează cu relaţia:


4

| y
i 1
i  Y | N i
dy = 4

N
i 1
i

1,5 - 4,725  13  ...  10,5 - 4,725  3


dy   2,2537
40
Interpretare: Valorile profitului se abat în medie liniară de la tendinţa centrală cu 2,2537 milioane
lei

(3) Abaterea medie pătratică a profitului se calculează cu relaţia:

 y  Y  Ni
4
2
i
i 1
y  4

N i 1
i

 y2 
1,5  4,2752  13  ...  10.5  4,7252  3  7,8243    7,8243  2,7972
y
40
Interpretare: Valorile profitului se abat în medie pătratică de la tendinţa centrală cu 2,7972
milioane lei
(4) Coeficienul de variaţie al lui Pearson se calculează cu relaţia:
y 2,7972
Vy   100  Vy   100  59,20% .
Y 4,725

Coeficientul simplu de variaţie se calculeză cu relaţia:


dy 2,2537
Cv   100  C v   100  47,70%
Y 4,725
Seria este omogenă, dacă valorile Vy şi C v sunt sub 30%.

Interpretare: Valoarea coeficientului de variaţie al lui Pearson, precum şi coeficientul simplu de


variaţie, depăşesc considerabil pragul de 30%, motiv pentru care afirmăm că seria nu este omogenă,
sau prezintă un grad mic de omogenitate. Înţelegem, în fapt, că profitul mediu nu este reprezentativ
pentru compania hotelieră. Această nereprezentativitate se datorează faptului că o parte
semnificativă dintre hotelurile companiei înregistrează profituri la marginea seriei, adică la distanţă
destul de mare de profitul mediu (în acest sens este utilă structurarea populaţiei în părţi egale cu
ajutorul cuartilelor). Compania hotelieră va trebui să facă cercetări în sensul identificării surselor
de variabilitate şi să încerce să le elimine

25
(5) Stucturarea populaţiei în patru părţi egale se face cu ajutorul cuartilelor. Vom calcula, aşadar,
cele trei cuartile (Q1 , Q2, Q3) pentru seria continuă.
Cuartila mijlocie Q2 este chiar valoarea mediană, fapt pentru care calculul acestei cuartile
păstrează modul de calcul al medianei. Aplicăm formula
rMe  F(x Me )
Q 2  Me  x Me   l Me
FMe
40
i) N= 40 (par)  rangul cuartilei (Q2) este rQ 2  rMe   20 .
2
ii) Determinăm intervalul cuartilei – Q2 (intervalul median). Vom calcula, succesiv, frecvenţele
absolute cumulate pâna când vom atinge valoarea rangului rQ2  rMe  20 .
N1c  N1  13  20 (continuăm);
N c2  N1  N 2  13  14  27  20 (ne oprim).
Ne-am oprit la a doua frecvenţă cumulată, rezultă că intervalul median este al doilea interval al
seriei, adică intervalul [3,6). Deducem că valoarea cuartilei –Q2 (medianei) va fi o valoare cuprinsă
între 3 şi 6.
iii) Vom aplica formula de calcul a valorii mediane pentru serii continue.
Mărimile care intervin în formulă sunt următoarele: x Q2  x Me  3 , rQ2  rMe  20 ,
F(x Q2 )  F(x Me )  13 , FQ2  FMe  14 , lQ2  l Me  3 . Valoarea cuartilei –Q2 (medianei) este:
20 - 13
Q 2  Me  3   3  3  1,5  4,5
14
Pentru calculul cuartilei (Q1) aplicăm formula
rQ1  F(x Q1 )
Q1  x Q1   l Q1 .
FQ1
40
i) N= 40 (se divide cu 4)  rangul cuartilei (Q1) este rQ1   10 = N/4.
4
ii) Determinăm intervalul cuartilei – Q1. Vom calcula, succesiv, frecvenţele absolute cumulate pâna
când vom atinge valoarea rangului rQ1  10 .
N1c  N1  13  10 (ne oprim).
Ne-am oprit la prima frecvenţă cumulată, rezultă că intervalul cuartilei –Q 1 este primul interval al
seriei, adică intervalul [0,3). Deducem că valoarea cuartilei –Q1 va fi o valoare cuprinsă între 0 şi 3.
iii) Vom aplica formula de calcul a cuartilei –Q1 pentru serii continue.
Mărimile care intervin în formulă sunt următoarele: x Q1  0 , rQ1  10 , F(x Q1 )  0 , FQ1  13 , l Q2  3 .
Valoarea cuartilei –Q1 este:
10 - 0
Q1  0   3  2,3 .
13
Pentru calculul cuartilei (Q3) aplicăm formula
rQ3  F(x Q3 )
Q 3  x Q3   l Q3
FQ3
40
i) N= 40 (se divide cu 4)  rangul cuartilei (Q3) este rQ3  3   30 = 3N/4.
4

ii) Determinăm intervalul cuartilei – Q3. Vom calcula, succesiv, frecvenţele absolute cumulate pâna
când vom atinge valoarea rangului rQ3  30 .
N1c  N1  13  30 (continuăm);
N c2  N1  N 2  13  14  27  30 (continuăm);
N 3c  N1  N 2  N 3  13  14  10  37  30 (ne oprim).

26
Ne-am oprit la a treia frecvenţă cumulată, rezultă că intervalul cuartilei –Q3 este al treilea interval
al seriei, adică intervalul [6,9). Deducem că valoarea cuartilei –Q3 va fi o valoare cuprinsă între 6 şi
9.
iii) Vom aplica formula de calcul a cuartilei –Q3 pentru serii continue.
Mărimile care intervin în formulă sunt următoarele: x Q3  6 , rQ3  30 , F(x Q3 )  27 , FQ3  10 ,
l Q3  3 . Valoarea cuartilei –Q3 este:
30 - 27
Q3  6   3  6  0,9  6,9 .
10
Populaţia structurată în cele patru părţi egale este redată în seria următoare:
 X min  Q1 Q1  Q 2 Q2 - Q3 Q3 - Qmax 
X :  
 25% 25% 25% 25% 
 0  2,3 2,3  4,5 4,5  6,9 6,9  12 
X :  .
 25% 25% 25% 25% 
Interpretare: 25% din populaţia unităţilor hoteliere înregistrează un profit cuprins între valorile 4,5
milioane lei şi 6,9 milioane lei. Se poate observa că primele 25%, respectiv ultimele 25%, dintre
unităţile hoteliere înregistrează un profit destul de îndepărtat de profitul mediu ( Y  4,725 milioane
lei).

(6) Seria profitului este o serie continuă. Valoarea modală pentru o serie continuă se determină cu
formula:
1
Mo  x Mo   l Mo
1  1
i) Determinăm intervalul modal. Intervalul modal este intervalul seriei cu cea mai mare frecvenţă,
adică intervalul [3,6).
ii) Mărimile care apar în formulă sunt: xMo  3 , 1 =14-13=1, 1 =14-10=4, l Mo =3. Modala va fi:
1
Mo  3   3  3  0,6  3,6 .
1 4
Interpretare: Afirmăm că cele mai multe unităţi hoteliere ale companiei înregistrează un profit
anual de aproximativ 3,6 milioane lei.
(7) Coeficientului de asimetrie al lui Pearson se determină cu relaţia:
Y  Mo 4,725  3,6
   0,4 .
y 2,7972
Interpretare: Valoarea coeficientului de asimetrie al lui Pearson este strict pozitiv şi depăşeşte
praagul de 0,3, motiv pentru care spunem că seria profitului prezintă o asimetrie pozitivă, relativ
mare

26. Repartiţia celor 40 de hoteluri în funcţie de variabila X=”numărul anual de clienţi al unităţii
hoteliere”(mii) este redată de următoarea serie unidimensională:

 0 - 4 4 - 8 8 - 12 12 - 16 
X :  
 10 16 11 3 
Se cere:
1) Să se determine numărul mediu de clienţi al companiei.
2) Să se măsoare variabilitatea numărului de clienţi cu ajutorul abaterii medie pătratică.
3) Să se determine gradul de omogenitate al seriei statistice a numărului de clienţi folosind
coeficientul de variaţie al lui Pearson şi să se analizeze reprezentativitatea numărului mediu de
clienţi.
Rezolvare:

27
(1) Numărul mediu de clienţi se calculează cu relaţia:

x
i 1
i  Ni
2  10  6  16  10  11  14  3
X 4
  6,7
40
N
i 1
i

Interpretare: Fiecare hotel al companiei a avut în 2010, în medie, un număr de clienţi egal cu 6,7 mii

(2) Abaterea medie pătratică a numărului de clienţi se calculează cu relaţia:

 x  X  Ni
4
2

x  i 1
i
  x2 
2  6,7 2  10  ...  14  6,72  3  12,71    12,71  3,565
4 x
40
N i 1
i

Interpretare: Numărul de clienţi se abate în medie pătratică de la tendinţa centrală a seriei cu 3,565
mii clienţi.

(3) Coeficientul de variaţie al lui Pearson pentru seria numărului de clienţi se determină cu relaţia:
 3,565
Vx  x  100   100  53,21% .
X 6,7
Interpretare:Valoarea coeficientului de variaţie al lui Pearson depăşeşte considerabil pragul de
30%, motiv pentru care afirmăm că seria numărului de clienţi nu este omogenă, sau prezintă un grad
mic de omogenitate. Vom spune că numărul mediu de clienţi nu este reprezentativ pentru compania
hotelieră

27. Se studiază formarea profitului pe anul 2014 la o companie naţională care îşi desfăşoară
activitatea în domeniul hoteluri-restaurante. Compania deţine un lanţ hotelier format din 40 de
hoteluri amplasate în oraşele mari ale ţării, precum şi în staţiunile renumite de la munte şi malul
mării.
S-a constatat că profitul prezintă o variabilitate mare. O parte din această variabilitate a fost
explicată pe seama numărului anual de clienţi. A rămas, totuşi, o parte destul de însemnată
(23,68%) din variabilitatea profitului neexplicată. Ţinând cont de sezonalitatea activităţii de turism,
o posibilă explicaţie pentru variabilitatea neexplicată a profitului ar fi zona de amplasare a
hotelurilor (Oraşe, Staţiune de la malul mării, Staţiune de munte).
Repartiţia celor 40 de hoteluri în funcţie de variabila Y=”profitul unităţii hoteliere”(milioane lei) şi
Z=” zona de amplasare a hotelurilor” este redată în următoarea serie bidimensionlă:

Y
Z 1,5 4,5 7,5 10,5 Total
Orase 6 10 8 4 28
Mare 0 2 2 0 4
Munte 2 1 4 1 8
Total 8 13 14 5 40

1) Să se aprecieze existenţa legăturii dintre profitul companiei şi zona de amplasare a hotelurilor


folosind metoda  2 (hi-pătrat).
2) Să se aprecieze intensitatea legăturii dintre cele două variabile statistice cu ajutorul coeficientului
de asociere al lui Pearson.

Rezolvare:

28
(1) Metoda  2 (hi-pătrat) presupune construirea unui nou tabel, având aceleaşi dimensiuni ca şi primul, iar
apoi determinarea unei măsuri a distanţei între cele două tabele.
Noul tabel se construieşte recalculând frecvenţele absolute ale tabelului cu ajutorul formulei:
N iy  N zj
N ij  , i  1,3, j  1,4
N
28  8 28  13 85
 
N 11  
 5,6 , N 12  9,1 , ..., N 34  1
40 40 40
Noul tabel se scrie:

Y
Z 1,5 4,5 7,5 10,5 Total
Orase 5,6 9,1 9,8 3,5 28
Mare 0,8 1,3 1,4 0,5 4
Munte 1,6 2,6 2,8 1 8
Total 8 13 14 5 40

Distanţa între cele două tabele se determină cu formula:


3 4 N  N  2
2   
ij ij

i 1 j1

N ij

2 
6  5,62  10  9,12  ... 
(1  1) 2
 4,052
5,6 9,1 1
Interpretare: Valoarea foarte apropiată de zero a statisticii  2 ne spune că între profit şi zona de amplasare
nu există legatură sau dacă aceasta există înseamnă că este foarte slabă. Datorită lipsei legăturii între cele
două variabile, nu putem explica variabilitatea profitului pe seama zonei de amplasare

(2) Coeficientul de asociere al lui Pearson se calculează cu formula:


2 4,052
C ap    0,3 .
N 2
40  4,052
Interpretare: Valoarea coeficientului de asociere al lui Pearson este mult destul de apropiat de zero, fapt
care arată că legătura dintre cele două variabile are o intensitate foarte mică

0  Cap  1
Legătura este mai intensă dacă C ap  1

29

S-ar putea să vă placă și