Sunteți pe pagina 1din 103

Grile statistica

1. Dintr-o populatie s-a extras un esantion de volum n=900


persoane. Pentru o variabila X, consumul saptamanal de
paine(kg), s-au obtinut urmatoarele rezultate: 𝑥̅ =3 kg, s’=1kg.
Considerand un risc de 5% (0,05) se poate considera ca nivelul
consumului mediu saptamanal de paine:
a. Este egal cu µ0=3,5kg;
b. Nu difera semnificativ de µ0=3,5kg;
c. Difera semnificativ de µ0=3,5kg.
2. Se verifica daca media unei populatii, µ, difera in mod
semnificativ de o valoare fixa µ0 . In acest caz, ipotezele
statistice sunt:
a. H0: µ ≠µ0, H1: µ =µ0;
b. H0: µ =µ0, H1: µ >µ0;
c. H0: µ =µ0, H1: µ≠µ0.
3. Esantionul reprezinta o subpopulatie sau un subansamblu
extras din populatia de referinta care:
a. Respecta proprietatea de reprezentativitate;
b. Din motive de cost, are un volum mai mic decat
volumul populatiei;
c. Poate fi extras aleator, cu revenire sau fara revenire.
4. Ipoteza statistica reprezinta:
a. O teorie care se verifica statistic;
b. O presupunere cu privire la un parametru;
c. O presupunere cu privire la legea de distributie a unei
populatii.
5. Parametrul reprezinta:
a. O valoare fixa si necunoscuta la nivelul unei populatii;
b. O functie a variabilelor de selectie;
c. O statistica.
6. Demersul testarii statistice cuprinde etapele:
a. Calculul valorii statisticii test;
b. Regula de decizie;
c. Formularea ipotezelor statistice.
7. Se studiaza daca exista diferente semnificative intre speranta
medie de viata a femeilor din Europa de Est, egala cu 68 de
ani, si speranta medie de viata a femeilor la nivel mondial,
egala cu 70 de ani. Se cunosc urmatoarele date: n=16, s’=1,75.
Sunt adevarate afirmatiile:
a. Cu o probabilitate de 95%, nivelul mediu al sperantei
de viata a femeilor din Europa de est este acoperit de
intervalul de incredere (67,068 ; 68,932);
b. Se garanteaza cu o prbabilitate de 90% ca nu exista
diferente semnificative intre speranta medie de viata a
femeilor din Europa de Est si media la nivel mondial;
c. Exista diferente semnificative intre speranta medie de
viata a femeilor din Europa de Est si media la nivel
mondial, in conditiile riscului asumat de 5%.
8. In urma prelucrarii datelor privind veniturile familiilor
inregistrate la nivelul unui esantion de volum n=625, s-au
obtinut urmatoarele rezultate: : 𝑥̅ =12 mii lei, s’=2 mii lei. Sa se
testeze daca exista diferente semnificative intre veniturile
medii ale familiilor la nivelul populatiei din care a fost extras
esantionul si venitul mediu pe tara: µ0=13 mii lei:
a. Se accepta ipoteza H0;
b. Exista diferente semnificative intre cele doua medii;
c. Se respinge ipoteza H0.
9. Pentru o variabila X-N(µ,σ2), se cere sa se calculeze
probabilitatea P(µ-σ<X< µ+σ). Acesta probabilitate este:
a. 75%;
b. 95%;
c. 68,2%.

10. Pentru o variabila X-N(10,4), P(X>11) este:


a. 0,1915;
b. 0,3085;
c. 0,5915.
11. Intr-un sondaj aleator simplu de 400 studenti, pentru
variabila nota la un test, s-a obtinut o valoare medie de 8,25 si
o abatere standard de esantion modificata egala cu 1,5.
Intervalul de incredere pentru parametrul medie, cu o
probabilitate de 0,95, este:
a. [7,5260 ; 9,3424];
b. [8,0736 ; 8,2464];
c. [8,1260 ; 9,2020].

12. In vederea testarii ipotezei de egalitate a salariului mediu cu


o valoare fixa, µ0=46, s-a integistrat un esantion de volum
n=10 persoane. In acest caz se pot formula urmatoarele
ipoteze statistice:
a. H0: µ0=46, H1: µ0<46;
b. H0: µ=10, H1: µ≠10;
c. H0: µ=46, H1: µ≠46.
13. Precizia estimarii creste atunci cand:
a. Varianta esantionului este mare;
b. Varianta esantionului este mica;
c. Volumul esantionului creste.
14. Sporul absolut cu baza mobila se calculeaza ca:
a. Raport intre doi termeni consecutivi
b. Diferenta intre oricare termen si termenul initial al
seriei
c. Diferenta intre doi termeni consecutivi
15. Sporul absolut cu baza fixa exprima:
a. Cu cat s-a modificat, in marime absoluta, nivelul unei
variabile Y din momentul curent comparative cu
momentul de referinta;
b. Cu cat s-a modificat, in marime relativa, nivelul unei
variabile Y din momentul curent comparative cu
momentul de referinta;
c. De cate ori s-a modificat nivelul unei variabile Y din
momentul curent comparativ cu momentul de
referinta.
16. Pentru un esantion de 100 zile extras din activitatea unei
firme, s-a observat valoarea zilnica a vanzarilor (mii lei). La
nivelul esantionului s-a obtinut o medie de 550 mii lei si o
abatere standard de 40 mii lei. Pentru un risc asumat de 5%
este valabil rezultatul:
a. Se accepta ipoteza nula (H0);
b. Testul folosit este testul Z;
c. Valoarea teoretica a testului este 0,05;
d. Valoarea medie a vanzarilor difera semnificativ de
valoarea inregistrata anul trecut, de 650 mii lei.
17. La nivelul unui esantion de 250 de pacienti ai unui spital,
30% sunt de sex feminin. Pentru o probabilitate de 99%,
intervalul de incredere pentru ponderea pacientilor de sex
masculine este:
a. [22,6 ; 37,4]%;
b. [62,2 ; 77,4]%;
c. [11,5 ; 25,7]%.
18. Pentru a estima proportia la nivelul unei populatii in
conditiile unei increderi de 95%, a unei variante de 0,24
si a unei erori maxim admisibile de +/- 3,5
este necesar un volum al esantionului de:
a. 2350
b. 753
c. 1060
19. La nivelul unui esantion de 25 de tari, observate dupa
valoarea exporturilor (mil. Euro), se cunoaste ca media este
150 mil. euro, iar varianta este de 100. Pentru o probabilitate
de 90%, intervalul de incredere pentru valoarea medie a
exportului la nivelul populatiei tarilor este:
a. [146,57 ; 153,42] mil. euro;
b. [50; 250] mil. euro;
c. [115,78 ; 184,22] mil.euro.
20. Pentru X-N(-1; 1), ponderea valorilor cuprinse intre -0,5 si
0,5 este:
a. 24,17%;
b. 50%;
c. 62,47%.
21. Se doreste verificarea compatibilitatii dintre performanta
portofoliului firmei ALPHA comparative cu cel al principalei
concurente, care are o rata de rentabilitate de 68% a
investitiilor. Pentru acest lucru, se extrage un esantion de 100
de investitii ale firmei ALPHA si se obtine, la nivelul
esantionului, o rentabilitate medie de 63% si o abatere
standard de 4%. Pentru un risc 0,05, care afirmatie este
adevarata:
a. Intre cele doua companii exista o compatibilitate in
ceea ce priveste rentabilitatea investitiilor;
b. Se respinge ipoteza H0;
c. Se testeaza H0: π= π0.
22. Din clientii a doua magazine au fost extrase doua
esantioane, iar clientii au fost observati dupa varsta. Pentru
un risc de 5% si o valoare Sig=0,002, este adevarata afirmatia:
a. Testul folosit este testul F;
b. Exista diferente semnificative de varsta intre clientii
celor doua magazine;
c. Nu se poate lua o decizie cu privire la diferenta de
varsta intre clientii magazinelor;
d. Se accepta ipoteza H0.
23. Pentru un esantion de 300 de studenti, extras dintr-o serie
de studenti din anul curent, s-a observant o rata de
promovabilitate de 78%. Pentru un risc de 5% si cunoscand ca
rata de promovabilitate inregistrata anul trecut a fost de 82%,
este adevarata afirmatia:
a. Testul folosit este testul F;
b. Ipoteza nula este H0: µ1=µ2;
c. Promovabilitatea din anul curent difera semnificativ de
promovabilitatea din anul trecut;
d. Proportia la nivelul esantionului este de 0,82.(este
0,78)
24. Pentru firmele din Iasi se cunoaste ca cifra de afaceri(X, mil.
lei) este normal distribuita: X-N(250, 400). Probabilitatea ca o
firma sa aiba o cifra de afaceri de cel mult 200 mil. lei este:
a. 0,75;
b. 0,0062;
c. 0,9938.
25. La un examen, punctajele obţinute de studenţi sunt
distribuite normal cu media 500 şi abaterea standard 100. Un
student a obţinut punctajul X = 650. Ce procent din studenţi
au obţinut un punctaj mai mare decât el?
a) 4,3%
b) 1,5%
c) 6,7%
26. Pentru o variabilă X ~ N(12,4), P(10<X<13) este:
a) 0,289
b) 0,532
c) 0,341
27. Într-un sondaj aleator simplu de 400 studenţi, pentru
variabila nota la un test, s-a obţinut o valoare medie de 8,25 şi
o abatere standard de eşantion modificată egală cu 1,8.
Intervalul de încredere pentru parametrul medie, cu o
probabilitate de 0,95, este:
a) (7,5260 - 9,3424)
b) (8,1280 - 9,2020)
c) (8,0736 - 8,4264)
28. Se testează diferenţele dintre veniturile medii din 2 regiuni,
A şi B, şi se obţin următoarele rezultate: tcalc=8,23, numărul
gradelor de libertate=25. Pentru un risc de 5%, sunt adevărate
afirmaţiile:

a) valoarea teoretică a statisticii test este egală cu 1,960 ;

b) suma volumelor celor două eşantioane este 27 ;

c) există diferenţe semnificative între veniturile medii din


cele 2 regiuni ;

d) ipoteza H0 este µ1=µ2=µ3.

29. Un estimator este nedeplasat dacă:


a). M (θ̂)=θ
b). V (θ̂)→θ când n→N
c). are varianţa cea mai mică posibil faţă de varianţa
oricărui alt estimator calculat pentru acelaşi eşantion
30. Pentru aplicarea metodei ANOVA, trebuie îndeplinite
următoarele condiţii:
a) condiţia de normalitate
b) condiţia de homoscedasticitate
c) condiţia de independenţă
31. Variaţia explicată măsoară:
a) variaţia sub influenţa factorilor esenţiali (de grupare)
b) variaţia sub influenţa factorilor aleatori (întâmplători)
c) variaţia sub influenţa factorilor esenţiali şi aleatori
(întâmplători).
32. Aplicând metoda ANOVA s-au obţinut următoarele rezultate:

Sursa variatiei Suma patratelor Gradele de Estimatori ai


variatiei libertate variantei
Explicata 150 (ESS) 2 (K-1) 75 ESS/(k-1)
(intergrupe)
Reziduala 65 (RSS) 17 (n-k) 3,823 RSS/(n-k)
(intragrupe)
Variabila numerică este "Venitul", iar variabila (factorul) de
grupare este "Regiunea". În această situaţie, se poate afirma că:
a. există diferenţe semnificative între veniturile
medii pe regiuni la nivelul populaţiilor, pentru un
risc de 5%;
b. valoarea teoretică a a statisticii F, considerând un
risc de 0,05, este 3,592;
c. se respinge ipoteza H0: µ1=µ2=µ3
33. Aplicând metoda ANOVA s-au obţinut următoarele rezultate:
Sursa variatiei Suma patratelor Grade de libertate
variatiei
Explicata 350 3
(intergrupe)
Reziduala 150 21
(intragrupe)
Totala 500 24
Variabila numerică este "Salariul", iar variabila (factorul) de
grupare este "Regiunea". În această situaţie, se poate afirma că:

a. valoarea calculată a statisticii F este 16,33


b. ipoteza H0 este: H0: µ1=µ2=µ3=µ4
c. se garantează cu o probabilitate de 0,95 că factorul de
grupare are o influenţă semnificativă asupra variaţiei
salariului
34. Aplicând metoda ANOVA, s-au obţinut următoarele
rezultate:
Sursa variatiei Suma patratelor Grade de libertate
variatiei
Explicata 130 4
(intergrupe)
Reziduala 250 95
(intragrupe)
Sunt corecte afirmaţiile:
a. volumul eşantionului este de 95 unităţi
b. numărul de grupe ale factorului de grupare este 5
c. numărul gradelor de libertate asociate variaţiei totale
este 99.
35. Pentru un eşantion de persoane se cunosc următoarele
rezultate:
Frequency Percent Valid Cumulative
percent percent
Valid Masculin 4 40.0 40.0 40.0
Feminin 6 60.0 60.0 100.0
Total 10 100.0 100.0
Considerând un risc de 0,10, să se calculeze limitele intervalului de
încredere pentru proporţia persoanelor de sex feminin la nivelul
populaţiei.

36. Aplicând metoda ANOVA s-au obţinut următoarele rezultate:


Sursa variatiei Suma patratelor Grade de libertate
variatiei
Intergrupe ESS 120 2
Intragrupe RSS 320 200
Totala TSS 440 202
Variabila numerică este "Salariul", iar variabila (factorul) de
grupare este "Regiunea". În această situaţie, considerând un risc
de 0,05, se poate afirma că:
a. se garantează cu o probabilitate de 0,95 că
factorul de grupare are o influenţă semnificativă
asupra variaţiei salariului
b. ipoteza H0 este µ1=µ2=µ3
c. se respinge ipoteza H0
37. Nivelul vânzărilor unei firme a înregistrat în perioada 2010 -
2013 următoarea evoluţie:
Anii 2010 2011 2012 2013
Volumul vanzarilor(mld. lei) 2 8 10 12
Sunt corecte afirmaţiile:
a. vânzările firmei au crescut în 2013 faţă de 2011
cu 50%
b. vânzările firmei au crescut în 2013 faţă de 2011
cu 150%
c. vânzările firmei au crescut în 2012 faţă de 2011
de 1,25 ori .
38. Nivelul cifrei de afaceri (mld.lei) a unei firme pe trimestre a
înregistrat în perioada 2010-2011 următoarea evoluţie:
2010 2011
Trim. I 1 3
Trim. II 3 5
Trim. III 2 4
Trim. IV 4 7
Ştiind că 𝑖̅=2,98 , sunt corecte afirmaţiile:
a. cifra de afaceri medie a firmei a fost de 3,625
mld. lei pe an;
b. cifra de afaceri medie a firmei a crescut în medie
cu 0,85 mld. lei pe trimestru;
c. cifra de afaceri a firmei a crescut în medie cu
198% pe trimestru.
39. La un examen, profesorul a stabilit ca elevii care vor obtine
un punctaj cuprins intre 65 si 70 in anul curent, distributia
punctajelor este normala, X-N(55,25). Care este procentul
elevilor:
a. 47,72%
b. 12,28%
c. 2,15%.
40. Pentru o variabila X-N(0,1), se cunoaste P(-a<X<a)=0,6424. In
acest caz:
a. a=0,1331
b. a=0,0675
c. a=0,92.
lOMoARcPSD|7897807

Tipuri grile EVP Bazele statisticii an I ID 2020-rezolvate

Bazele statisticii (Universitatea Alexandru Ioan Cuza din Iași)

StuDocu nu este sponsorizat sau avizat de nicio universitate


Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)
lOMoARcPSD|7897807

---------------------------------------------------------------------
1) Se consideră distribuţia firmelor dintr-o localitate după numărul de
salariaţi înregistraţi în luna ianuarie 2018. Variabila statistica, în acest
caz, este reprezentată de
a) ansamblul firmelor
b) o firmă
c) numărul de salariaţi
---------------------------------------------------------------------
2) Care din următoarele variabile sunt variabile numerice (cantitative)?
a) talia, greutatea, salariul
b) sexul persoanelor, starea civilă, domiciliul
c) nivelul de studii absolvite
---------------------------------------------------------------------
3) Sunt discrete următoarele variabile:
a) sexul persoanelor, starea civilă, domiciliul
b) numărul de membri ai unei gospodării, numărul de angajaţi ai unei
firme
c) salariul lunar, venitul gospodăriilor, PIB/locuitor

---------------------------------------------------------------------
4) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($)
s-au obţinut rezultatele din tabelul de mai jos.
Statistics

Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Median $28,000.00
Mode $30,500
Std. Deviation $17,000.000
Percentiles 25 $24,000.00
50 $28,000.00
75 $37,000.00

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

Sunt valabile interpretările:


a) în medie, un angajat câştigă anual 34000$ Me=Q3
b) jumătate dintre angajaţi câştigă între 24000$ şi 37000$ Q3-
Q1=50%
c) un sfert dintre angajaţi au salariul între 24000$ şi 28000$ Q2-
Q1=25%
d) jumătate din salariaţi câştigă mai puţin de 28000$ annual Q2=Me
---------------------------------------------------------------------
5) Pentru un eşantion de angajaţi s-au obţinut următoarele rezultate cu
privire la nivelul salariului ($):

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

Statistics

Current Salary
N Valid 474
Missing 0
Mean $34,419.57
Std. Error of Mean
$784.311

Median $28,875.00
Mode $30,750
Std. Deviation
$17,075.661
Variance 291578214,453
Skewness 2,125
Std. Error of Skewness
,112
Kurtosis 5,378
Std. Error of Kurtosis
,224
Range $119,250
Minimum $15,750
Maximum $135,000
Sum $16,314,875
Percentiles 25 $24,000.00
50 $28,875.00
75 $37,162.50

Se poate aprecia că:


a) repartiţia angajaţilor după salariu este asimetrică la
dreapta(Mo<Me<x(media=mean))
b) repartiţia angajaţilor după salariu este asimetrică la stânga(Mo>Me>x)
c) repartiţia angajaţilor după salariu este leptocurtică K=5,37>0 Adevarat
---------------------------------------------------------------------
---------------------------------------------------------------------
6) 25% din salariaţii unei întreprinderi au un salariu de cel mult 2500 lei.
Această valoare reprezintă
a) quartila unu
b) mediana
c) quartila trei
---------------------------------------------------------------------
7) Distribuţia a n familii dintr-un bloc, după numărul de copii (X), la un
moment dat, se prezintă astfel :
xi 0 1 2 3 4
ni 5 15 20 10 5
Ponderea familiilor care au cel mult 2 copii este :
a) 72,7%(5+15+20)/ni => 40/55(se calc Fi crescator-care reprezinta cel mult)
b) 40%/
c) 2%
---------------------------------------------------------------------
8) Pentru două judeţe, A şi B, s-a înregistrat rata şomajului (%) în perioada
1990-2011. Rezultatele sunt reprezentate in figura de mai jos.

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

judetul_B

judetul_A

4 6 8 10 12 14 16 18 20 22

Care dintre afirmaţiile următoare sunt adevărate?


a) Judeţul B are o distribuţie a şomajului asimetrică la dreapta
b) Rata mediană a şomajului pentru judeţul A este mai mică decât cea pentru
judeţul B
c) Judeţul A este mai omogen decât judeţul B din punctul de vedere al ratei
şomajului
d) Mediana pentru judeţul B este de 14%
---------------------------------------------------------------------
9) Cheltuielile lunare (milioane lei) pentru plata serviciilor şi a dobânzilor la
creditele luate de un eşantion format din 8 familii sunt: X: (4, 6, 12, 7, 8,
10, 27, 16)
Pentru această distribuţie sunt valabile rezultatele:
a) Mo = 27
b) x = 11,25 milioane lei(90/8)
c) Me = 9( serie cu nr par (4,6,7,8,10,12,16,27) (8+10)/2
---------------------------------------------------------------------
10). Distribuţia unui eşantion de 200 de firme din judeţul Iaşi după profitul
lunar, obţinut in anul 2012, este caracterizată prin următoarele valori: x = 180
milioane şi s2= 361. Abaterea medie pătratică (abaterea standard) arată
că=>abaterea S= =19 mil
a) o firmă obţine un profit lunar care se abate de la profitul mediu cu 19
milioane lei
b) o firmă obţine un profit lunar care se abate, în medie, de la profitul mediu, cu
19 milioane lei, în sens pozitiv şi negativ
c) o firmă obţine un profit lunar care se abate, în medie, de la profitul mediu, cu
361 milioane lei, în sens pozitiv şi negativ
d) o firmă obţine un profit lunar mai mare decât profitul mediu cu 19 milioane
lei
---------------------------------------------------------------------
11) Distribuţia familiilor dintr-un bloc după numărul de copii se prezintă astfel:
Număr 0 1 2 3 4
copii
Număr 3 10 18 3 2
familii

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

Pentru exemplul dat, valoarea modului este:


a) Mo = 2 copii(xi cu valoare ni cea mai mare)
b) Mo = 18 copii
c) Mo = 32 copii
---------------------------------------------------------------------
12) Diagramele box-plot obţinute pentru distribuţia angajaţilor a două firme
după salariul lunar (euro) obţinut sunt prezentate mai jos:

Care dintre interpretările următoare sunt corecte?


a) Angajaţii de la firma A obţin un salariu mediu lunar mai mare decât angajaţii
de la firma B
b) Distribuţia angajaţilor după salariul obţinut este mai omogenă în cazul firmei
B decât în cazul firmei A
c) 50% dintre angajaţii firmei A obţin un salariu lunar mai mic de 400 euro în
timp ce 50% din angajaţii firmei B obţin un salariu lunar mai mic de 350 euro
d) 75% dintre angajaţii firmei B obţin un salariu mediu lunar mai mare de 250
euro
---------------------------------------------------------------------
13) În urma prelucrării datelor privind vârsta, înregistrate pentru o populaţie
formată din 100 de persoane, s-au obţinut următoarele rezultate:
x 25 ani s 2 9.
; Valoarea şi interpretarea corectă a coeficientului de variaţie
sunt:
a) v=12% şi arată că media distribuţiei este reprezentativă(v=s/x=3/25)
b) v=36% şi arată că media distribuţiei este reprezentativă
c) v=8,33% şi arată că media distribuţiei este nereprezentativă
--------------------------------------------------------------------
14) Un coeficient de boltire (k) egal cu - 4 arată:
a) o distribuţie leptocurtică
b) o distribuţie mezocurtică
c) o distribuţie platicurtică
1) 25% din salariaţii unei întreprinderi au un salariu de cel mult 1000 RON.
Această valoare reprezintă
a) quartila unu
b) mediana
c) quartila trei

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

2) Distribuţia familiilor dintr-un bloc după numărul de copii se prezintă astfel:


Număr copii 0 1 2 3 4
Număr familii 3 10 32 18 2

Pentru exemplul dat valoarea modului este


a) Mo 2 copii
b) Mo 18 familii
c) Mo 32 familii

3) În urma prelucrării datelor privind vârsta, înregistrate pentru o populaţie


formată din 100 de persoane, s-au obţinut următoarele rezultate:
x 30 ani s 2 16.
; Valoarea şi interpretarea corectă a coeficientului de variaţie
sunt:
a) v=13,33% şi arată că media distribuţiei este reprezentativă
b) v=1,2% şi arată că media distribuţiei este reprezentativă
c) v=53,33% şi arată că media distribuţiei este nereprezentativă

4) Un coeficient de variaţie egal cu 56% arată că:


a) media este reprezentativă
b) distribuţia se caracterizează printr-o dispersie mare
c) media este nereprezentativă

5) Sunt variabile discrete


a) PNB/locuitor, speranţa de viaţă
b) numărul de copii pe familie, numărul de camere ale unui apartament
c) sexul persoanelor, starea civilă, domiciliul

6) Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea


iunie 2009 se prezintă astfel:
Nota Nr. Ni cresc-cel
9(xi) Studenţi(ni) mult
4 10 10
5 25 10+25=35
6 40 10+25+40=75
7 55 75+55=130
8 60 130+60=190
9 15 190+15=205
10 5 205+5=210

TOTAL 210
Numărul studenţilor care au obţinut cel mult nota 8 la examen este:

a) 130 studenţi

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

b) 190 studenţi
c) 80 studenţi

7) Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în


sesiunea iunie 2009 se prezintă astfel:
Nota Nr. fi =ni/n Fi desc -
studenţi cel
putin=pest
e
4 10 10/210*10 95,24+4,7
0=4,76 6=100

5 25 25/210*10 83,33+11,
0=11,91 91=95,24
6 40 40/210*10 64,28+19,
0=19,05 05=83,33
7 55 55/210*10 38,09+26,
0=26,19 19=64,28
8 60 60/210*10 9,52+28,5
0=28,57 7=38,09
9 15 15/210*10 2,38+7,14
0=7,14 =9,52
10 5 5/210*100 2,38
=2,38
TOTAL 210 100
Ponderea studenţilor care au obţinut peste nota 7 la examen este
a) 64,28%
b) 28,57%
c) 38,09%

8) Valoarea vânzărilor (mld. lei) înregistrate de niste firme se prezintă astfel:


10, 12, 15, 18, 10. Pentru exemplul dat, sunt corecte afirmaţiile:
Seria. 10,10, 12, 15, 18.
a) vânzările medii sunt de 13 mld .lei----media arit x=suma(xi)/n=65/5=13 mil
b) jumătate din firme au vânzări de până la 10 mld. lei, iar jumătate din firme au
peste 10 mld. Lei===Me=> Ume=(n+1)/2=6/2=3, x3=12
c) cele mai multe firme au vânzări de 10 mld. Lei=> Mo=xi cu ni max, ni=2 pt
xi=10

9) Distribuţia firmelor dintr-o localitate după valoarea cifrei de afaceri realizate


în anul 2010 este caracterizată prin următoarele valori: x 17 mld . lei ;
Mo 10 mld . lei ; Me 12 mld . lei ; s 2 9 . Pentru exemplul dat, sunt corecte

afirmaţiile:
a) distribuţia este asimetrică la dreapta(Mo<Me<x)
b) media distribuţiei este reprezentativă(v=s/x=3/17*100=17.64<50%)

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

c) cele mai multe firme au înregistrat o cifră de afaceri de 12 mld.


Lei(Mo=10mil)

10) Distribuţiile studenţilor din două serii (seria 1 şi seria 2) după nota obţinută
la un examen în sesiunea ianuarie 2012 se prezintă astfel:

NOTA_1

NOTA_2

3 4 5 6 7 8 9 10 11

Pentru exemplul dat, sunt corecte afirmaţiile:


a) 50% din numărul total al studenţilor din prima serie au obţinut o notă de
până la 6

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

b) 75% din numărul total al studenţilor din a doua serie au obţinut o notă de
până la 8
c) distribuţia studenţilor din prima serie se caracterizează printr-o dispersie
mai mare
d) 50% din studenţii din prima serie au luat note între 5 şi 9.

11. Se cunosc următoarele rezultate privind vârsta înregistrată pentru un


eşantion de persoane:

Mean 23.57
Standard Error 0.45
Median 23.00
Mode 22.00
Standard Deviation 2.46
Sample Variance 6.05
Kurtosis(K) -1.06
Skewness(Sk) 0.33
Range 8.00
Minimum 20.00
Maximum 28.00
Sum 707.00
Count 30.00

Indicatorii formei (Skewness-pt asimetrie, Kurtosis-pt boltire).


Dupa cum stiti forma unei distributii poate fi identificata atat prin intermediul
graficelor, cat si
prin intermediul unor indicatori. Asadar:
-
pentru asimetrie avem coeficientul Skewness = 0.33(din tabel) (daca SK < 0 =>
distributia este asimetrica la stanga, intrucat SK > 0- distributia noastra este
asimetrica la
dreapta, iar daca Sk= 0 – distributia este simetrica);
-
pentru boltire avem coefiecientul de boltire Kurtosis = -1.06 (daca K>0 ->
distributia este
leptocurtica, intrucat k<0 – distributia este platicurtica, iar k=0 -> distributia
este
mezocurtica).
Sunt corecte afirmaţiile:
a) cele mai multe persoane au o vârstă de 23 de ani;(Mo)
b) coeficientul de variaţie este 10,44% şi arată că media este reprezentativă;
(v=s/x=2.46/23.57=10.44
c) distribuţia este asimetrică şi platicurtică.? Mo<Me<x---asimerica la dreapta,
SK=0.33>0, platicurtica K=-1,06<0

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

12. Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual


($) s-au obţinut rezultatele din tabelul de mai jos.
Statistics

Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Median $28,000.00
Mode $30,500
Std. Deviation $17,000.000
Percentiles 25 $24,000.00
50 $28,000.00
75 $37,000.00

Sunt valabile interpretările:


a) în medie, un angajat câştigă anual 34000$ Me=Q3=37000$
b) jumătate dintre angajaţi câştigă între 24000$ şi 37000$ Q3-Q1=50%
c) un sfert dintre angajaţi au salariul între 24000$ şi 28000$ Q2-Q1=25%
d) jumătate din salariaţi câştigă mai puţin de 28000$ anual Q2=Me

13. Pentru două judeţe, A şi B, s-a înregistrat rata şomajului (%) în perioada
1990-2011. Rezultatele sunt reprezentate in figura de mai jos.

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

judetul_B

judetul_A

4 6 8 10 12 14 16 18 20 22

Care dintre afirmaţiile următoare sunt adevărate?


a) Judeţul B are o distribuţie a şomajului asimetrică la dreapta
b) Rata mediană a şomajului pentru judeţul A este mai mică decât cea pentru
judeţul B
c) Judeţul A este mai omogen decât judeţul B din punctul de vedere al ratei
şomajului
d) Mediana pentru judeţul B este de 14%

12. Se consideră distribuţia persoanelor pe medii de rezidenţă după salariul


lunar obţinut (sute lei) prezentată astfel:

Mediul Salariu
9 12 15 20
Urban 1 5 7 15
Rural 6 4 2 1

Sunt corecte afirmaţiile:


a) ponderea persoanelor din mediul rural este de 31,7%;
b) ponderea persoanelor din mediul rural este de 68,3%;
c) ponderea persoanelor cu un salariu de 12 sute lei este de 21,95%;
Rezolvare

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

13. Se consideră distribuţia persoanelor pe medii de rezidenţă după salariul


lunar obţinut (sute lei), prezentată astfel:

Mediul Salariu
8-10 10-12 12-14 14-16
Urban 1 5 7 15
Rural 6 4 2 1

Sunt corecte afirmaţiile:


a) salariul mediu al persoanelor din mediul urban este de 9,27 sute lei;
b) salariul mediu al persoanelor din mediul rural este de 10,69 sute lei;
c) salariul mediu al persoanelor din eşantion este de 12,66 sute lei;
d) coeficientul de variaţie a salariilor din mediul urban faţă de salariul mediu
este de 12,98%.
Rezolvare

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


lOMoARcPSD|7897807

Desc?rcat de Lorena Mocanu (lorenamocanu198@gmail.com)


Recapitulare test EVP

1. Se considera urmatoarea distributie:

Nr.copii 0 1 2 3 4
Nr. familii 9 7 10 0 4

Sa se precizeze populatia, volumul populatiei, unitatea statistica, variabila si tipul


variabilei.

Rezolvare

Populatia este reprezentata de ansamblul familiilor. Volumul populatiei este de 30


familii. Unitatea statistica este familia. Variabila este numarul de copii ai unei familii.
Variabila este numerica, discreta.

2. În 2001, pentru un eşantion de familii, mediana venitului pe gospodărie era de


44.517$, iar media era 60.512$. Cum e distribuţia: simetrică, asim la stg sau asim la
dreapta?

Rezolvare
Media este mai mare decat mediana, deci distributia este asimetrica la dreapta.

3. Pentru o distribuţie a studenţilor după nota obţinută la Statistică se cunoaşte: D1=


2,5, Q1 = 4, Me=6,5, Q3 = 7, D9=8. Să se interpreteze valorile indicatorilor si a
amplitudinii intervalului interquartilic.

Rezolvare

D1 = 2.5
10% din studenti au obtinut note de cel mult 2.5, iar restul de 90% au obtinut note de
cel putin 2.5 puncte.

Q1 = 4
25% din studenti au obtinut note de cel mult 4, iar restul de 75% au obtinut note de
cel putin 4 puncte.

Me = 6.5
50% din studenti au obtinut note de cel mult 6.5, iar restul de 50% au obtinut note de
cel putin 6.5 puncte.

Q3 = 7
75% din studenti au obtinut note de cel mult 7, iar restul de 25% au obtinut note de
cel putin 7 puncte.

1
D9 = 8
90% din studenti au obtinut note de cel mult 8, iar restul de 10% au obtinut note de
cel putin 8 puncte.

Amplitudinea intervalului interquartilic


IQ = Q3 – Q1 = 7 – 4 = 3
Pentru 50% din studenti, diferenta de punctaj este de maxim 3 puncte.

4. Se consideră distribuţia locuitorilor unei localităţi după sexul persoanei, prezentată


în tabelul de mai jos.

xi ni fi %
Masculin 70 45
Feminin 85 55
Total 155 100

Sa se interpreteze modul.

Rezolvare
Modul este Feminin (valoarea variabilei cu cea mai mare frecventa de apartiei, 85).
Cele mai multe persoane sunt de sex feminin.

5. Se considera distributia angajatilor unei firme dupa nivelul de educatie (ani), pe


sexe.
Se cere sa se caracterizeze asimetria celor doua distributii si sa se compare nivelurile
medii si de dispesie pentru cele doua sexe.

2
Female
Respondent's Sex

735 765 621897 1,412 961 757

Male
75 244

0 5 10 15 20

Highest Year of School Completed

Rezolvare

Evaluarea asimetriei
Ambele distributii ale nivelului de educatie sunt asimetrice la dreapta.

Evaluarea nivelului mediu


Nivelul mediu de educatie al barbatilor este usor mai mare decat cel al femeilor
(mediana nivelului de educatie al barbatilor este mai mare decat mediana nivelului de
educatie al femeilor)

Evaluarea nivelului de dispersie


Dispersia nivelului de educatie al femeilor este mai mica decat cel al barbatilor (exista
diferente mai mici intre femei decat intre barbati, nivelul de educatie al femeilor este
mai omogen decat cel al barbatilor).

6. Valoarea cifrei de afaceri (mld. lei) înregistrată de un eşantion de firme se prezintă astfel:
10, 12, 15, 18, 9. Sa se calculeze si sa se interpreteze mediana si coeficientul de variatie.

Mediana

9, 10, 12, 15, 18

Mediana este 12 mld.lei.

50% din firme au o cifra de afaceri de cel mult 12 mld. lei, iar 50% din firme au cifra
de afaceri de cel putin 12 mld. lei.

Coeficientul de variatie

3
Media aritmetica

64
x  12.8
5
(9  12.8) 2  (10  12.8) 2  (12  12.8) 2  15  12.8  18  12.8
2 2
s =3.31
5

v=(3.31/12.8)*100=25.85%

Dispersia este mica, populatia este omogena, media este reprezentativa.

7. Pentru sirul de valori

1, 5, 6, 3, 4, 5, 7, 5, 300

care este cel mai potrivit indicator pentru a caracteriza tendinta centrala?

Rezolvare

Mediana este mai potrivita, deoarece sirul de valori prezinta o valoare atipica si
media aritmetica ar fi influentata de aceasta valoare.

8. Pentru distributia unui esantion de angajati dupa educatie, prezentata in figura


de mai jos, identificati si interpretati valorile decilelor si quartilelor care sunt
folosite in construirea diagramei.

22

20

18

16

14

12

10

Educational Level (years)

4
D1=8 ani
Q1=12 ani
Q2=15 ani
Q3=16 ani
D9=21 ani

9. Se considera distributia studentilor unei grupe dupa nota obtinuta la un test.

xi-1, xi ni
2-4 10
4-6 12
6-8 20
8-10 8
Total 50

Sa se calculeze si sa se interpreteze media aritmetica.

Rezolvare

xi-1, xi ni xi’ xi’*ni


2-4 10 3 30
4-6 12 5 60
6-8 20 7 140
8-10 8 9 72
Total 50 302

302
x  6.04 puncte
50

In medie, un student a obtinut la test 6.04 puncte.

10. Se considera distributia studentilor unei serii dupa mediul de rezidenta si numarul
de frati/surori.

Numarul de frati/surori Urban Rural


Media 1.7 2.3
Abaterea standard 0.46 1.55
Nr. studenti 50 30

Se cere:
1. Sa se precizeze variabila X si variabila Y
2. Sa se determine care din cele doua grupuri este mai omogen
3. Sa se calculeze media totala la nivelul seriei de studenti
4. Sa se calculeze varianta inter-grupe si varianta intra-grupe
5. Sa se calculeze varianta totala la nivelul seriei

5
6. Sa se precizeze cat % din variatia variabilei X este explicata prin factorul de
grupare.

Rezolvare

1. Variabila X este numarul de frati/surori.


Variabila Y este mediul de rezidenta.

2. vU=(0.46/1.7)*100=27.05%
vR=(1.55/2.3)*100=67.39%

Coeficientul de variatie este mai mic pentru mediul urban, deci grupul studentilor din
urban este mai omogen decat cel al studentilor din rural.

1.7 * 50  2.3 * 30
3. x   1.92
80

4.

Numarul de frati/surori Urban Rural


Media 1.7 2.3
Abaterea standard 0.46 1.55
Nr. studenti 50 30

Varianta inter-grupe
(1.7  1.92) 2 * 50  2.3  1.92 * 30
2
sx j 
2
 0.084
80

Varianta intra-grupe

0.462 * 50  1.552 * 30
s 
2
 1.03
80

5. Varianta totala

s X2  0.084  1.03  1.114

6. Calculam coeficientul factorului de grupare (esential), k1.

k1=(0.084/1.114)*100=7.54%

6
11. Se considera distributia notelor unei grupe de studenti pe sexe.

Nota Masculin Feminin Total


4 5 4 9
6 8 6 14
8 10 20 30
10 4 5 9
Total 27 35 62

Se cere:
1. Cat % din totalul studentilor sunt de sex feminin si au nota 6? Ce tip de
frecventa este aceasta?

(6/62)*100=9.67%
Aceasta este o frecventa relativa partiala.

2. Cat % din totalul studentilor de sex feminin au nota 6? Ce tip de frecventa este
aceasta?

(6/35)*100=17.14%
Aceasta este o frecventa relativa conditionata, de tipul fi|j

3. Cat % din totalul studentilor cu nota 6 sunt de sex feminin? Ce tip de frecventa
este aceasta?

(6/14)*100=42.85%
Aceasta este o frecventa relativa conditionata, de tipul fj|i

4. Cat % din totalul studentilor sunt de sex feminin? Ce tip de frecventa este
aceasta?

(35/62)*100=56.45%
Aceasta este o frecventa relativa marginala, de tipul f.j.

5. Cat % din totalul studentilor au nota 6? Ce tip de frecventa este aceasta?

(14/62)*100=22.58%
Aceasta este o frecventa relativa marginala, de tipul fi..

7
12. Se considera distribuţia unui eşantion de 150 de angajaţi ai unei firme A după nr
de ore suplimentare facute zilnic la locul de munca
xi fi (%)
1 13.34
2 53.34
3 24.66
4 8.66
Total 100

Se cere sa se determine:
1. Câţi angajaţi fac zilnic 3 ore suplimentare?

0.2466*150=37 angajati
2. Câţi angajaţi fac cel mult 3 ore suplimentare?
((13.44+53.34+24.66)*150)/100=137 angajati

3. Cât % dintre angajaţi fac cel puţin 3 ore suplimentare?


24.66+8.66=33.32%

4. Cât % dintre angajaţi fac maxim 3 ore suplimentare?


13.44+53+34+24.66=91.34%

5. Cât % dintre angajaţi fac 2 ore suplimentare?


53.34%

6. Câţi angajaţi fac minim 2 ore suplimentare?


((100-13.34)*150)/100=130 angajati

7. Media aritmetica, mediana, modul, abaterea medie patratica, coeficientul de


variatie, Q3 si D6.

xi fi (%)
ni (fi*150) xi*ni Ni↓ xi  x x i x  x  x   n
2
i
2
i

1 13.34 20 20 20 -1.28 1.63 32.76


2 53.34 80 160 100 -0.28 0.07 6.27
3 24.66 37 111 137 0.72 0.51 19.18
4 8.66 13 52 150 1.72 2.96 38.45
Total 100 150 343 - 96.66

Media aritmetica
343
x  2.28 ~ 2ore
150

In medie, un angajat face zilnic 2 ore suplimentare.

Mediana
UMe=151/2=75.5
Ni=100, deci Me=2 ore

8
50% din angajati fac cel mult 2 ore suplimentare, iar restul de 50% fac cel putin 2 ore
suplimentare.

Modul
ni maxim = 80, deci Mo=2 ore

Cei mai multi angajati fac 2 ore suplimentare.

Abaterea medie patratica


96.66
s  0.802 ~ 1ora
150

In medie, numarul de ore suplimentare facute de un angajat se abate de la numarul


mediu de ore suplimentare cu o ora.

Coeficientul de variatie
v=(0.802/2.28)*100=35.17%

Dispersia este mica, populatia este omogena, media este reprezentativa.

Q3
UQ3=3*(151/4)=113.25
Ni=137, deci Q3=3 ore

75% din angajati fac cel mult 3 ore suplimentare, iar restul de 25% fac cel putin 3 ore
suplimentare.

D6
UD6=6*(151/10)=90.6
Ni=100, deci D6=2 ore

60% din angajati fac cel mult 2 ore suplimentare, iar restul de 40% fac cel putin 2 ore
suplimentare.

9
Seminar 6 - Distribuții bidimensionale

Distribuția unui eșantion de 750 de firme din Iași după cifra de afaceri, X, și tipul
firmei, Y, (mici, mijlocii și mari) este prezentată în tabelul de mai jos.

Tabelul 6.1. Distribuția firmelor din Iași după cifra de afaceri și tipul firmei

xi yj mici mijlocii mari TOTAL


(mii lei)
10 132 30 8 170
20 42 60 13 115
30 20 90 40 150
40 6 70 239 315
TOTAL 200 250 300 750

Q: Ce trebuie sa imi arate datele astfel incat eu sa zic ca dimensiunea firmei influenteaza cifra
de afaceri (adica Y este factor de influenta pentru X)?
A: DIFERENTELE DIN INTERIORUL GRUPELOR TREBUIE SA FIE MAI MICI DECAT
DIFERENTELE DINTRE GRUPURI!!!

2 CONDITII TREBUIE INDEPLINITE: GRUPURILE TREBUIE SA FIE OMOGENE IN


INTERIOR & SA FIE ETEROGENE INTRE ELE!!!!

AM DOI INDICATORI CARE IMI ARATA DACA CELE DOUA CONDITII SUNT
INDEPLINITE:
- varianta intra-grupe, care imi arata cat de omogene sunt grupele in interior, adica cat
de omogene sunt firmele de aceeasi dimensiune;
- varianta inter-grupe, care imi arata cat de diferit se comporta grupurile intre ele, adica
cat de diferite sunt fimele de dimensiune diferita intre ele.
DECI, TREBUIE CA VARIANTA INTRA-GRUPE SA FIE MAI MICA DECAT
VARIANTA INTER-GRUPE!!!

Se cere:
1. Puneți în evidență distribuția marginală a variabilei X și distribuția marginală a
variabilei Y
2. Puneți în evidență distribuțiile condiționate. Câte distribuții condiționate sunt?
3. Să se interpreteze frecvențele absolute parțiale

1
4. Să se interpreteze frecvențele absolute marginale
5. Să se calculeze și să se interpreteze frecvențele relative parțiale
6. Să se calculeze și să se interpreteze frecvențele relative marginale
7. Să se calculeze și să se interpreteze frecvențele relative condiționate
8. Să se calculeze și să se interpreteze mediile condiționate (mediile pe grupe) -
OPTIONAL
9. Să se calculeze varianțele condiționate (varianțele de grupă) - OPTIONAL
10. Să se calculeze și să se interpreteze media pe total
11. Să se calculeze media varianțelor de grupă (varianta intragrupe)
12. Să se calculeze varianța între grupe (varianța intergrupe)
13. Să se calculeze varianța generală
14. Să se calculeze coeficientul de influență a factorului de grupare și coeficientul de
influență a factorilor aleatori/întâmplători

Forma generală a unei distribuții bidimensionale poate fi prezentată astfel:


xi yj y1 y2 yj yp TOTAL

x1 n11 n12 n1 j n1 p n1.


x2 n21 n22 n2 j n2 p
n2.

xi ni1 ni 2 nij nip ni.

xm nm1 nm 2 nmj nmp nm.

TOTAL n.1 n.2 n.j n.p n..

2
În cazul problemei noastre, avem:
xi yj y1 y2 y3
TOTAL
(ni.)
x1 n11 n12 n13 n1.
x2 n21 n22 n23 n2.
x3 n31 n32 n33 n3.
x4 n41 n42 n43 n4.

TOTAL
n.1 n.2 n.3 n..
(n.j)

xi yj mici mijlocii mari TOTAL


(mii lei)
10 132 30 8 170
20 42 60 13 115
30 20 90 40 150
40 6 70 239 315
TOTAL 200 250 300 750

3
1. Puneți în evidență distribuția marginală a variabilei X și distribuția marginală a variabilei
Y
O distribuție a unei variabile empirice poate fi pusă în evidență prin prezentarea
valorilor variabilei și a frecvențelor lor de apariție.
Sunt două distribuții marginale constituite din valorile variabilei și frecvențele marginale.
Tabelul 6.2. Distribuția firmelor din Iași după cifra de afaceri
xi ni.
(mii lei)
10 170
20 115
30 150
40 315
TOTAL 750

Tabelul 6.3. Distribuția firmelor din Iași după tipul firmelor


yj n.j
mici 200
mijlocii 250
mari 300
TOTAL 750

2. Puneți în evidență distribuțiile condiționate. Câte distribuții condiționate sunt?


Sunt m+p=4+3=7 distribuții condiționate
Tabelul 6.4 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mică”  X / Y  y1 
xi ni1
(mii lei)
10 132
20 42
30 20
40 6
TOTAL 200

Tabelul 6.5 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mijlocie”  X / Y  y2 
xi ni 2
(mii lei)
10 30
20 60
30 90
40 70
TOTAL 250

4
Tabelul 6.6 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mare”  X / Y  y3 
xi ni 3
(mii lei)
10 8
20 13
30 40
40 239
TOTAL 300

Distribuțiile prezentate în tabelele 6.2, 6.4, 6.5 și 6.6 sunt distribuții ale unei variabile
cantitative, discrete. Prin urmare pentru acestea putem determina nivelul mediu prin media
aritmetică, dispersia prin abaterea standard etc.

Tabelul 6.7 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 10 mii lei Y / X  x1 
yj n1 j
mici 132
mijlocii 30
mari 8
TOTAL 170

Tabelul 6.8 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 20 mii lei Y / X  x1 
yj n2 j
mici 42
mijlocii 60
mari 13
TOTAL 115

Tabelul 6.9 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 30 mii lei Y / X  x1 
yj n3 j
mici 20
mijlocii 90
mari 40
TOTAL 150

Tabelul 6.10 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 40 mii lei Y / X  x1 
yj n4 j
mici 6
mijlocii 70
mari 239
TOTAL 315

5
3. Să se interpreteze frecvențele absolute parțiale

xi yj mici mijlocii mari TOTAL


(mii lei)
10 132 30 8 170
20 42 60 13 115
30 20 90 40 150
40 6 70 239 315
TOTAL 200 250 300 750

n11  132 . 132 de firme sunt mici și au cifra de afaceri egală cu 10 mii lei
n21  42 . 42 de firme sunt mici și au cifra de afaceri egală cu 20 mii lei
n31  20 . 20 de firme sunt mici și au cifra de afaceri egală cu 30 mii lei
n41  6 . 6 firme sunt mici și au cifra de afaceri egală cu 40 mii lei
n12  30 . 30 de firme sunt mijlocii și au cifra de afaceri egală cu 10 mii lei
n22  60 . 60 de firme sunt mijlocii și au cifra de afaceri egală cu 20 mii lei
n32  90 . 90 de firme sunt mijlocii și au cifra de afaceri egală cu 30 mii lei
n42  70 . 70 de firme sunt mijlocii și au cifra de afaceri egală cu 40 mii lei
n13  8 . 8 firme sunt mari și au cifra de afaceri egală cu 10 mii lei
n23  13 . 13 firme sunt mari și au cifra de afaceri egală cu 20 mii lei
n33  40 . 40 de firme sunt mari și au cifra de afaceri egală cu 30 mii lei
n43  239 . 239 de firme sunt mari și au cifra de afaceri egală cu 40 mii lei

4. Să se interpreteze frecvențele absolute marginale


Tabelul 6.2. Distribuția firmelor din Iași după cifra de afaceri
xi ni.
(mii lei)
10 170
20 115
30 150
40 315
TOTAL 750

n1  170 . 170 de firme au cifra de afaceri de 10 mii lei


n2  115 . 115 firme au cifra de afaceri de 20 mii lei
n3  150 . 150 de firme au cifra de afaceri de 30 mii lei
n4  315 . 315 firme au cifra de afaceri de 40 mii lei

6
Tabelul 6.3. Distribuția firmelor din Iași după tipul firmelor
yj n.j
mici 200
mijlocii 250
mari 300
TOTAL 750

n 1  200 . 17 firme sunt mici


n 2  250 . 250 de firme sunt mijlocii
n 3  300 . 300 de firme sunt mari

5. Să se calculeze și să se interpreteze frecvențele relative parțiale

nij
fij  100
n

Tabelul initial
xi yj mici mijlocii mari TOTAL
(mii lei)
10 132 30 8 170
20 42 60 13 115
30 20 90 40 150
40 6 70 239 315
TOTAL 200 250 300 750

Frecventele relative partiale (%)

xi yj mici mijlocii mari


(mii lei)
10 17.6 4 1.07
20 5.6 8 1.73
30 2.67 12 5.33
40 0.8 9.33 31.87

n11 132
f11  100  100  17,6% . 17,6% din firme sunt mici și au cifra de afaceri egală cu 10 mii lei
n 750
n 42
f 21  21 100   100  5,6% . 5,6% din firme sunt mici și au cifra de afaceri egală cu 20 mii lei
n 750
n 20
f31  31 100  100  2,67% . 2,67% din firme sunt mici și au cifra de afaceri egală cu 30 mii lei
n 750
n 6
f 41  41 100   100  0,8% . 0,8% din firme sunt mici și au cifra de afaceri egală cu 40 mii lei
n 750

7
n12 30
f12  100  100  4,00% . 4,00% din firme sunt mijlocii și au cifra de afaceri egală cu 10 mii
n 750
lei
n22 60
f 22  100  100  8,00% . 8,00% din firme sunt mijlocii și au cifra de afaceri egală cu 20 mii
n 750
lei
n32 90
f32  100  100  12,00% . 12,00% din firme sunt mijlocii și au cifra de afaceri egală cu 30
n 750
mii lei
n 70
f 42  42 100  100  9,33% . 9,33% din firme sunt mijlocii și au cifra de afaceri egală cu 40 mii
n 750
lei

n13 8
f13  100   100  1,07% . 1,07% din firme sunt mari și au cifra de afaceri egală cu 10
n 750
mii lei
n23 13
f 23  100  100  1,73% . 1,73% din firme sunt mari și au cifra de afaceri egală cu 20
n 750
mii lei
n33 40
f33  100  100  5,33% . 5,33% din firme sunt mari și au cifra de afaceri egală cu 30
n 750
mii lei
n43 239
f 43  100  100  31,87% . 31,87% din firme sunt mari și au cifra de afaceri egală cu
n 750
40 mii lei

8
6. Să se calculeze și să se interpreteze frecvențele relative marginale
Tabelul 6.2. Distribuția firmelor din Iași după cifra de afaceri
xi ni.
(mii lei)
10 170
20 115
30 150
40 315
TOTAL 750

Frecventele relative marginale dupa X


xi fi.
(mii lei)
10 (170/750)*100=22.67
20 (115/750)*100=15.33
30 (150/750)*100=20
40 (315/750)*100=42
TOTAL 100

ni
fi  100
n

n1 170
f1  100  100  22, 67% . 22,67% dintre firme au cifra de afaceri de 10 mii lei
n 750
n 115
f 2  2 100  100  15,33% , 15,33% dintre firme au cifra de afaceri de 20 mii lei
n 750
n 150
f3  3 100  100  20, 00% , 20% dintre firme au cifra de afaceri de 30 mii lei
n 750
n 315
f 4  4 100  100  42, 00% , 42% dintre firme au cifra de afaceri de 40 mii lei
n 750

Tabelul 6.3. Distribuția firmelor din Iași după tipul firmelor


yj n.j
mici 200
mijlocii 250
mari 300
TOTAL 750

Frecvente relative marginale dupa Y


yj f.j
mici (200/750)*100=26.67
mijlocii (250/750)*100=33.33
mari (300/750)*100=40
TOTAL 100

9
nj
fj 100
n

n1 200
f1  100  100  26, 67% , 26,67% dintre firme sunt mici
n 750
n 250
f 2  2 100  100  33,33% , 33,33% dintre firme sunt mijlocii
n 750
n 300
f 3  3 100  100  40, 00% , 40% dintre firme sunt mari
n 750

7. Să se calculeze și să se interpreteze frecvențele relative condiționate


nij
fi j  100 , j valoare fixă (mărimea firmei)
nj
Firme Mici
ni1
fi 1  100
n1
Tabelul 6.4 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mică”  X / Y  y1 
xi ni1
(mii lei)
10 132
20 42
30 20
40 6
TOTAL 200

Frecventele conditionate pentru grupul firmelor mici


xi fi1
(mii lei)
10 (132/200)*100=66
20 (42/200)*100=21
30 (20/200)*100=10
40 (6/200)*100=3
TOTAL 100

f1/1 reprezintă frecvența relativă a firmelor mici condiționate ca valoarea cifrei de afaceri să fie de
10 mii lei
n11 132
f1 1  100  100  66, 00% . 66% dintre firmele mici au cifra de afaceri egală cu 10 mii lei
n1 200

10
n21 42
f2 1  100  100  21, 00% . 21% dintre firmele mici au cifra de afaceri egală cu 20 mii lei
n1 200
n 20
f3 1  31 100  100  10, 00% . 10% dintre firmele mici au cifra de afaceri egală cu 30 mii lei
n1 200
n 6
f 4 1  41 100  100  3, 00% . 3% dintre firmele mici au cifra de afaceri egală cu 40 mii lei
n1 200

**********************************************************************************
Firme Mijlocii

Tabelul 6.5 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mijlocie”  X / Y  y2 
xi ni 2
(mii lei)
10 30
20 60
30 90
40 70
TOTAL 250

Frecventele conditionate pentru grupul firmelor mijlocii


xi fi2
(mii lei)
10 (30/250)*100=12
20 (60/250)*100=24
30 (90/250)*100=36
40 (70/250)*100=28
TOTAL 100

ni 2
fi 2  100
n2
f1/ 2 -reprezintă frecvența relativă a firmelor mijlocii condiționate ca valoarea cifrei de afaceri să fie
de 10 mii lei
n12 30
f1 2  100  100  12, 00% . 12% dintre firmele mijlocii au cifra de afaceri egală cu 10 mii
n2 250
lei
n22 60
f2 2  100  100  24, 00% . 24% dintre firmele mijlocii au cifra de afaceri egală cu 20
n2 250
mii lei
n32 90
f3 2  100  100  36, 00% . 36% dintre firmele mijlocii au cifra de afaceri egală cu 30
n2 250
mii lei
n42 70
f4 2  100  100  28, 00% . 28% dintre firmele mijlocii au cifra de afaceri egală cu 40
n2 250
mii lei

11
********************************************************************************
Firme Mari
ni 3
fi 3  100
n3

Tabelul 6.6 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mare”  X / Y  y3 
xi ni 3
(mii lei)
10 8
20 13
30 40
40 239
TOTAL 300

Frecventele conditionate pentru grupul firmelor mari


xi fi3
(mii lei)
10 (8/300)*100=2.67
20 (13/300)*100=4.33
30 (40/300)*100=13.33
40 (239/300)*100=79.67
TOTAL 100

n13 8
f1 3  100  100  2, 67% . 2,67% dintre firmele mari au cifra de afaceri egală cu 10 mii
n3 300
lei
n23 13
f2 3  100  100  4,33% . 4,33% dintre firmele mari au cifra de afaceri egală cu 20 mii
n3 300
lei
n33 40
f3 3  100  100  13,33% . 13,33% dintre firmele mari au cifra de afaceri egală cu 30 mii
n3 300
lei
n43 239
f4 3  100  100  79, 67% . 79,67% dintre firmele mari au cifra de afaceri egală cu 40
n3 300
mii lei

nij
fi j  100 , i valoare fixă (cifra de afaceri)
ni

**********************************************************************************

12
Firme cu cifra de afaceri de 10 mii lei

n1 j
f1 j  100
n1

Tabelul 6.7 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 10 mii lei Y / X  x1 
yj n1 j
mici 132
mijlocii 30
mari 8
TOTAL 170

Frecvente conditionate pentru grupul firmelor care au CA de 10 mii lei


yj f1j
mici (132/170)*100=77.65
mijlocii (30/170)*100=17.65
mari (8/170)*100=4.7
TOTAL 100

n11 132
f1 1  100  100  77, 65% . 77,65% dintre firmele ce au cifra de afaceri egală cu 10 mii lei
n1 170
sunt mici
n12 30
f1 2  100  100  17, 65% . 17,65% dintre firmele ce au cifra de afaceri egală cu 10 mii lei
n1 170
sunt mijlocii
n13 8
f1 3  100  100  4, 70% . 4,70% dintre firmele ce au cifra de afaceri egală cu 10 mii lei
n1 170
sunt mari

*********************************************************************************

13
Firme cu cifra de afaceri de 20 mii lei

n2 j
f2 j  100
n2

Tabelul 6.8 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 20 mii lei Y / X  x1 
yj n2 j
mici 42
mijlocii 60
mari 13
TOTAL 115

Frecvente conditionate pentru grupul firmelor care au o CA de 20 mii lei


yj f2j
mici (42/115)*100=36.52
mijlocii (60/115)*100=52.17
mari (13/115)*100=11.31
TOTAL 100

n21 42
f2 1  100  100  36,52% . 36,52% dintre firmele ce au cifra de afaceri egală cu 20 mii lei
n2 115
sunt mici
n22 60
f2 2  100  100  52,17% . 52,17% dintre firmele ce au cifra de afaceri egală cu 20 mii
n2 115
lei sunt mijlocii
n23 13
f2 3  100  100  11,31% . 11,31% dintre firmele ce au cifra de afaceri egală cu 20 mii lei
n2 115
sunt mari

*********************************************************************************

14
Firme cu cifra de afaceri de 30 mii lei

n3 j
f3 j  100
n3

Tabelul 6.9 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 30 mii lei Y / X  x1 
yj n3 j
mici 20
mijlocii 90
mari 40
TOTAL 150

Frecvente conditionate pentru grupul firmelor care au o CA de 30 mii lei


yj f3j
mici (20/150)*100=13.33
mijlocii (90/150)*100=60
mari (40/150)*100=26.67
TOTAL 100

n31 20
f3 1  100  100  13,33% . 13,33% dintre firmele ce au cifra de afaceri egală cu 30 mii lei
n3 150
sunt mici
n32 90
f3 2  100  100  60, 00% . 60,00% dintre firmele ce au cifra de afaceri egală cu 30 mii lei
n3 150
sunt mijlocii
n33 40
f3 3  100  100  26, 67% . 26,67% dintre firmele ce au cifra de afaceri egală cu 30 mii
n3 150
lei sunt mari

*********************************************************************************

15
Firme cu cifra de afaceri de 40 mii lei

n4 j
f4 j  100
n4

Tabelul 6.10 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 40 mii lei Y / X  x1 
yj n4 j
mici 6
mijlocii 70
mari 239
TOTAL 315

Frecvente conditionate pentru grupul firmelor care au CA de 40 mii lei


yj f4j
mici (6/315)*100=1.91
mijlocii (70/315)*100=22.22
mari (239/315)*100=75.87
TOTAL 100

n41 6
f4 1  100  100  1,91% . 1,91% dintre firmele ce au cifra de afaceri egală cu 40 mii lei
n4 315
sunt mici
n42 70
f4 2  100  100  22, 22% . 22,22% dintre firmele ce au cifra de afaceri egală cu 40 mii
n4 315
lei sunt mijlocii
n43 239
f4 3  100  100  75,87% . 75,87% dintre firmele ce au cifra de afaceri egală cu 40 mii lei
n4 315
sunt mari

16
8. Să se calculeze și să se interpreteze mediile condiționate (mediile pe grupe)
Mediile condiționate pot fi calculate pentru fiecare din distribuțiile condiționate ale variabilei
cantitative, cifra de afaceri.
m m

x n i ij x n i ij
xj  i 1
p
 i 1

nj
n
j 1
ij

Tabelul 6.4 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mică”  X / Y  y1 
xi ni1 xi ni1
(mii lei)
10 132 1320
20 42 840
30 20 600
40 6 240
TOTAL 200 3000

m m

x n i i1 x n i i1
3000
x1  i 1
p
 i 1
  15 mii lei
n1 200
n
j 1
ij

Cifra medie de afaceri a firmelor mici este de 15 mii lei.

Tabelul 6.5 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mijlocie”  X / Y  y2 
xi ni 2 xi ni 2
(mii lei)
10 30 300
20 60 1200
30 90 2700
40 70 2800
TOTAL 250 7000
m m

x n i i2 x n i i2
7000
x2  i 1
p
 i 1
  28 mii lei
n2 250
n j 1
ij

Cifra medie de afaceri a firmelor medii este de 28 mii lei.

17
Tabelul 6.6 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mare”  X / Y  y3 
xi ni 3 xi ni 3
(mii lei)
10 8 80
20 13 260
30 40 1200
40 239 9560
TOTAL 300 11100
m m

 xi ni 3 x n i i3
11100
x3  i 1
p
 i 1
  37 mii lei
n3 300
n
j 1
ij

Cifra medie de a faceri a firmelor mari este de 37 mii lei.

9. Să se calculeze varianțele condiționate (varianțele de grupă)


Varianțele de grupă pot fi calculate pentru fiecare din distribuțiile condiționate ale
variabilei cantitative, cifra de afaceri.

 x  x j  nij  x  x j  nij
m m

i i
s 2j  i 1
m
 i 1

n
n j
ij
i 1

Tabelul 6.4 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mică”  X / Y  y1 
xi ni1 xi ni1 xi  x1  xi  x1 
2
 xi  x1 
2
ni1
(mii lei)
10 132 1320 -5 25 3300
20 42 840 5 25 1050
30 20 600 15 225 4500
40 6 240 25 625 3750
TOTAL 200 3000 - - 12600
m m

  xi  x1   x  x1  ni1
2 2
ni1 i
s12  i 1
m
 i 1

n
n1
i1
i 1

12600
s12   63
200

18
Tabelul 6.5 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mijlocie”  X / Y  y2 
xi ni 2 xi ni 2 xi  x2  xi  x2 
2
 xi  x2 
2
ni 2
(mii lei)
10 30 300 -18 324 9720
20 60 1200 -8 64 3840
30 90 2700 2 4 360
40 70 2800 12 144 10080
TOTAL 250 7000 - - 24000
m m

  xi  x2   x  x2  ni 2
2 2
ni 2 i
s22  i 1
m
 i 1

n
n2
i2
i 1

24000
s22   96
250

Tabelul 6.6 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mare”  X / Y  y3 
xi ni 3 xi ni 3 xi  x3  xi  x3 
2
 xi  x3 
2
ni 3
(mii lei)
10 8 80 -27 729 5832
20 13 260 -17 289 3757
30 40 1200 -7 49 1960
40 239 9560 3 9 2151
TOTAL 300 11100 - - 13700
m m

 x  x3  ni 3  x  x3  ni 3
2 2
i i
s32  i 1
m
 i 1

n
n3
i3
i 1

13700
s32   45,67
300

In sinteza, mediile si variantele conditionate sunt prezentate in tabelul de mai jos.

Firme mici Firme mijlocii Firme mari


Mediile de grupa 15 28 37
Variantele de grupa 63 96 45.67
Volumul grupelor 200 250 300

10. Să se calculeze și să se interpreteze media pe total


p p

 xjn j
j 1
x n
j 1
j j

x p

n
n
j 1
j

15  200  28  250  37  300 3000  7000  11100 21100


x    28,13 mii lei
750 750 750

19
Cifra medie de afaceri a tuturor firmelor este de 28.13 mii lei.

Media pe total poate fi calculată și cu ajutorul distribuției marginale a variabilei X.

Tabelul 6.2. Distribuția firmelor din Iași după cifra de afaceri


xi ni. xini.
(mii lei)
10 170 1700
20 115 2300
30 150 4500
40 315 12600
TOTAL 750 21100
m m

 xi ni xn i i
x i 1
m
 i 1

n
n
i
i 1

21100
x  28,13 mii lei
750

11. Să se calculeze media varianțelor de grupă (varianța intragrupe sau varianta datorata
factorilor intamplatori)
p p

 s 2j n
j 1
j s n
j 1
2
j j

s2  p

n
n
j 1
j

Varianta intra-grupe trebuie sa-mi arate care e valoarea diferentelor de CA intre firmele de aceeasi
dimensiune.

Firme mici Firme mijlocii Firme mari


Mediile de grupa 15 28 37
Variantele de grupa 63 96 45.67
Volumul grupelor 200 250 300

63  200  96  250  45,67  300 12600  24000  13700


s2  
750 750
50300
s2   67,067
750

20
12. Să se calculeze varianța între grupe (varianța intergrupe sau varianța datorata factorului
de grupare – tipul firmei)

 x  x n j  x  x n j
p p
2 2
j j
j 1 j 1
sx2j  p

n
n
j 1
j

Varianta inter-grupe imi da o valoare a diferentelor de CA intre firmele de dimensiuni diferite.

Firme mici Firme mijlocii Firme mari


Mediile de grupa 15 28 37
Variantele de grupa 63 96 45.67
Volumul grupelor 200 250 300

xj  x x  x x  x n
2 2
xj n j j j j

15 200 -13,13 172,48 34496,89


28 250 -0,13 0,02 4,44
37 300 8,87 78,62 23585,33
TOTAL 750 58086,67

Media generala este 28.13.

s x2j 
15  28.132  200  28  28.132  250  37  28.132  300
750
58086,67
sx2j   77,45
750

13.Să se calculeze varianța generală

Tabelul 6.2. Distribuția firmelor din Iași după cifra de afaceri


xi ni xi  x  xi  x 
2
 xi  x 
2
ni
(mii lei)
10 170 -18,13 328,82 55899,02
20 115 -8,13 66,15 7607,38
30 150 1,87 3,48 522,67
40 315 11,87 140,82 44357,60
TOTAL 750 -12,53 539,27 108386,67
m m

  xi  x   x  x  ni
2 2
ni i
s X2  i 1
m
 i 1

n
n
i
i 1

108386,67
sX2   144,52
750

21
Dar, daca avem deja cele doua componente ale variantei generale, varianta intergrupe si varianta
intragrupe, calculam varianta generala ca suma a celor doua.

sX2  sx2j  s 2

144,52=77,45+67,07

14. Să se calculeze coeficientul de influență a factorului de grupare și coeficientul de


influență a factorilor aleatori/întâmplători

sx2j 77, 45
k1  2
 100   100  53,59%
s X 144,52
2
s 67,07
k2  2
100   100  46, 41%
sX 144,52

Deoarece coeficientul factorului de grupare k1 este mai mare decât coeficientul influenței factorilor
întâmplători k 2 , factorul de grupare, tipul firmelor (mici, mijlocii și mari) are influență asupra cifrei de
afaceri a firmelor din Iași.

53,59% din variatia totala a cifrei de afaceri este explicata de factorul de grupare, tipul firmelor.

Restul de 46.41% din variatia totala a cifrei de afaceri este datorata factorilor intamplatori (alti factori
decat factorul de grupare).

22
PROBLEME

1. Pentru lotul olimpic de sărituri în înălţime al unei ţări s-a înregistrat înălţimea săriturii (X) şi sexul atletului (Y).
S-au obţinut datele de mai jos.

Sexul persoanei
Înălţimea săriturii
Masculin Feminin

Media xM  2.1 xF  1.85


Varianţa s M2  0.037 s F2  0.026
Volumul grupei j 25 15

Se cere:

a. Să se calculeze înălţimea medie a săriturii la nivelul lotului


b. Să se calculeze media varianţelor condiţionate (varianta intra-grupe)
c. Să se calculeze varianţa mediilor condiţionate (varianta inter-grupe)
d. Să se calculeze varianţa înălţimii săriturii
e. Să se determine dacă sexul persoanei influentează inălţimea săriturii

2. Se consideră distribuţia unui eşantion de persoane după statusul de fumator (Da sau Nu) şi greutate (kg.).

Status fumat Da Nu Total


Greutate
50 2 0 2
55 0 2 2
60 0 3 3
63 3 2 5
68 2 0 2
70 1 0 1
Total 8 7 15

Se cere:

1. Să se construiască distribuţiile marginale


2. Să se construiască distribuţiile condiţionate

3. Să se calculeze frecvenţele relative marginale

4. Să se calculeze frecvenţele relative condiţionate

5. Să se calculeze frecvenţele relative parţiale

6. Cât la sută din persoanele din eşantion sunt fumătoare şi au 63 de kg?


7. Cât la sută din persoanele nefumătoare au 55 de kg?

8. Cât la sută din persoanele cu greutatea de 68 de kg sunt fumătoare?

23
Seminar analiza descriptiva univariata a unei serii

I. Se inregistreaza numarul de zboruri in ultimul an pentru un esantion de 5 persoane: 6, 7, 10, 12, 15.
Sa se calculeze si sa se interpreteze media aritmetica si mediana.

Rezolvare

6  7  10  12  15 50
x   10 zboruri
5 5

In medie, o persoana a efectuat 10 zboruri in ultimul an.

Me= 10 zboruri
Jumatate din persoane au efectuat cel mult 10 zboruri in ultimul an, iar 50% au efectuat cel putin 10
zboruri in ultimul an.

II. Se considera distributia unui eşantion de angajaţi ai firmei X după numărul de mijloace de
transport în comun folosite zilnic până la locul de muncă. Datele sunt prezentate in tabelul de mai jos.

Tabelul 1. Distribuţia unui eşantion de angajaţi ai firmei X după numărul de mijloace de transport în
comun folosite zilnic până la locul de muncă

xi ni
1.00 5
2.00 75
3.00 27
4.00 3
Total 110

1. Sa se calculeze si sa se interpreteze frecventele absolute si relative, simple si cumulate (doar


pentru nivelul (xi=2), media aritmetica, modul si mediana.
2. Sa se calculeze si sa se interpreteze Q1, Q3 si D7.
3. Sa se calculeze si sa se interpreteze varianta, abaterea medie patratica si coeficientul de variatie.
4. Sa se reprezinte grafic distributia, folosind curba frecventelor
5. Stiind ca γ1 = 0.761 si γ2 = 1.056, sa se intrepreteze asimetria si boltirea distributiei.

1
Rezolvare

Calculul si interpretarea frecventelor

xi ni fi (%) Ni↓ Ni↑ Fi↓ Fi↑


1 5 4,55 5+0=5 5+105=110 4.55+0=4.55 4.55+95.45=100
2 75 68,18 75+5=80 75+30=105 68.18+4.55=72.73 68.18+27.27=95.45
3 27 24,55 27+80=107 27+3=30 24.55+72.73=97.28 24.55+2.72=27.27
4 3 2,72 3+107=110 3+0=3 2.72+97.28=100 2.72+0=2.72
Total 110 100,0 - - - -

Interpretare frecvente pentru nivelul xi=2

- 75 angajati folosesc zilnic 2 mijloace de transport pentru a ajunge la locul de munca


- 68.18% dintre angajati folosesc zilnic 2 mijloace de transport pentru a ajunge la locul de munca
- 80 angajati folosesc cel mult 2 mijloace de transport pentru a ajunge la locul de munca
- 105 angajati folosesc cel putin 2 mijloace de transport pentru a ajunge la locul de munca
- 72.73% dintre angajati folosesc cel mult 2 mijloace de transport pentru a ajunge la locul de munca
- 95.45% dintre angajati folosesc cel putin 2 mijloace de transport pentru a ajunge la locul de munca

Calculul si interpretarea mediei aritmetice

xi ni xi*ni
1 5 5
2 75 150
3 27 81
4 3 12
Total 110 248

x
x n
i i

248
 2.25  2 mijloace de transport
n i 110

In medie, un angajat foloseste zilnic 2 mijloace de transport pentru a ajunge la locul de munca.

Calculul si interpretarea modului

Algoritm:
- se identifica frecventa maxima: nimax = 75
- in dreptul frecventei maxime se citeste, din coloana valorilor xi, valoarea modala: Mo=2
mijloace de transport
Cel mai frecvent, angajatii folosesc 2 mijloace de transport pentru a ajunge la locul de munca.

2
Calculul si interpretarea medianei

xi ni Ni
1.00 5 5
2.00 75 80
3.00 27 107
4.00 3 110
Total 110 -

Algoritm:

1. Aflam pozitia ocupata de Me in sirul celor 110 valori

UMe = (110+1)/2 = 55.5

Prima valoare Ni care acopera valoarea 55.5, adica prima valoare Ni ≥ UMe este 80.

2. Identificam Me ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul


anterior, deci Me = 2. Prin urmare, jumatate din angajati folosesc cel mult 2 mijloace de
transport, iar jumatate folosesc cel putin 2 mijloace de transport.

2.

xi ni Ni
1.00 5 5
2.00 75 80
3.00 27 107
4.00 3 110
Total 110 -

Pentru Q1 aplicam algoritmul de identificare a acesteia.


3. Aflam pozitia ocupata de Q1 in sirul celor 110 valori

UQ1 = (110+1)/4 = 27.75

Prima valoare Ni care acopera valoarea 27.75, adica prima valoare Ni ≥ UQ1 este 80.

4. Identificam Q1 ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul


anterior, deci Q1 = 2. Prin urmare, 25% din angajati folosesc cel mult 2 mijloace de transport,
iar 75% folosesc cel putin 2 mijloace de transport.

Pentru Q3 aplicam algoritmul de identificare a acesteia.


1. Aflam pozitia ocupata de Q3 in sirul celor 110 valori

3
UQ3 = 3*(110+1)/4 = 83.25

Prima valoare Ni care acopera valoarea 83.25, adica prima valoare Ni ≥ UQ3 este 107.

2. Identificam Q3 ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul


anterior, deci Q3 = 3. Prin urmare, 75% din angajati folosesc cel mult 3 mijloace de transport,
iar 25% folosesc cel putin 3 mijloace de transport.

Pentru D7 aplicam algoritmul de identificare a acesteia.


1. Aflam pozitia ocupata de D7 in sirul celor 110 valori

UD7 = 7*(110+1)/10 = 77.7

Prima valoare Ni care acopera valoarea 77.7, adica prima valoare Ni ≥ UD7 este 80.

2. Identificam D7 ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul


anterior, deci D7 = 2. Prin urmare, 70% din angajati folosesc cel mult 2 mijloace de transport,
iar 30% folosesc cel putin 2 mijloace de transport.

4
3. Sa presupunem distributia a 5 persoane dupa cantitatea de Cola (l) consumata intr-o saptamana.

In medie, cantitatea de Cola consumata de o persoana se abate de la media grupului cu 2.96 l.

Coeficientul de variatie

v = (s/medie)*100

v > 50%, atunci dispersia este mare, populatia este eterogena, media este nereprezentativa
v<= 50%, atunci dispersia este mica, populatia este omogena, media este reprezentativa

Pentru noi, v = (2.96/4) * 100 ~ 75%


v > 50%, atunci dispersia este mare, populatia este eterogena, media este nereprezentativa

Pentru seria noastra:

xi ni xi  x ( xi  x ) 2 ( x i  x ) 2  ni
1.00 5 -1.25 1.5625 7.8125
2.00 75 -0.25 0.0625 4.6875
3.00 27 0.75 0.5625 15.1875
4.00 3 1.75 3.0625 9.1875
Total 110 - - 36.875

Varianţa

5
Abaterea medie patratica (abaterea standard)

In medie, numarul mijloacelor de transport folosite de un angajat se abate de la media grupului cu 1


mijloc de transport.

Coeficientul de variatie

Daca v ≤ 50% (abaterea standard este cel mult jumatate din valoarea mediei) dispersia este mica,
populatia este omogena si media este reprezentativa.

Daca v > 50% (abaterea standard este peste jumatate din valoarea mediei) dispersia este mare,
populatia este eterogena si media este nereprezentativa.

In cazul nostru, v<50%, deci dispersia este mica, populatia este omogena si media este
reprezentativa.

4.

6
5.

7
8
Coeficientul de asimetrie γ1 este pozitiv, deci distributia este asimetrica la dreapta.
Coeficientul de boltire γ2 este pozitiv, deci distributia este leptocurtica.

III. Pentru o distributie s-au inregistrat valorile: D1=5, Q1=12, Q2=20, Q3=22, D9=25. Sa se
interpreteze asimetria distributiei folosind diagrama box-plot.

9
IV. Pentru doua serii de studenti s-au reprezentat grafic distributiile notelor obtinute la un test. Sa se
interpreteze quartilele si decilele. Sa se precizeze sensul asimetriei. Sa se specifice care serie a
obtinut note mai mari.

NOTA _1

NOTA _2

3 4 5 6 7 8 9 10 11

Distributia primei serii de studenti (reprezentata la Nota_1)


D1 = 4: 10% dintre studenti au obtinut cel mult 4, 90% cel putin 4
Q1 = 5: 25% dintre studenti au obtinut cel mult 5, 75% dintre studenti au obtinut cel putin 5
Q2 = 6: 50% dintre studenti au obtinut cel mult 6, 50% cel putin 6
Q3 = 9: 75% dintre studenti au obtinut cel mult 9, 25% cel putin 9
D9=10: 90% dintre studenti au obtinut cel mult 10, 10% au obtinut cel putin 10

Distributia celei de-a doua serii de studenti (reprezentata la Nota_2)


D1 = 4: 10% dintre studenti au obtinut cel mult 4, 90% cel putin 4
Q1 = 6.5: 25% dintre studenti au obtinut cel mult 6.5, 75% dintre studenti au obtinut cel putin 6.5
Q2 = 8: 50% dintre studenti au obtinut cel mult 8, 50% cel putin 8
Q3 = 9: 75% dintre studenti au obtinut cel mult 9, 25% cel putin 9
D9=10: 90% dintre studenti au obtinut cel mult 10, 10% au obtinut cel putin 10

Distributia primei serii este asimetrica la dreapta, distributia celei de-a doua serii este asimetrica la
stanga.

Prin urmare, in urma analizarii tuturor acestor informatii, a doua serie a obtinut note ai mari decat
prima.

10
Variabila continua

I. Se considera distribuţia unui eşantion de reclame difuzate într-o zi la TV, observate după durata
reclamei în secunde. Datele sunt prezentate in tabelul urmator.

Tabelul 1. Distribuţia unui eşantion de reclame difuzate într-o zi la TV după durata reclamei în
secunde – elemente de calcul
xi-1-xi ni
8-12 20
12-16 55
16-20 15
20-24 10
Total 100

Se cere:
1. Sa se reprezinte grafic distributia folosind histograma si curba frecventelor
2. Sa se calculeze si sa se interpreteze media aritmetica
3. Sa se aprecieze reprezentativitatea mediei, stiind ca s=3.42.

Rezolvare

1.

Histogram

60

50

40
Frequency

30

20

10

Mean = 14.60
Std. Dev. = 3.42893
0 N = 100
5.00 10.00 15.00 20.00 25.00

Cases weighted by n

11
2.

Tabelul 2. Distribuţia unui eşantion de reclame difuzate într-o zi la TV după durata reclamei în
secunde – elemente de calcul
xi-1-xi
ni xi’ Ni xini xi  x ( xi  x )  ni ( xi  x ) 2 ( x i  x ) 2  ni
8-12
20 10 20.00 200 -4.60 -92.00 21.16 423.20
12-16
55 14 75.00 770 -0.60 -33.00 0.36 19.80
16-20
15 18 90.00 270 3.40 51.00 11.56 173.40
20-24
10 22 100.00 220 7.40 74.00 54.76 547.60

Total 100 1460 0.00 1164.00

Pentru a calcula indicatorii descriptive in cazul unei serii continue, pentru care valorile acesteia sunt grupate
pe intervale de variatie, se va proceda mai intai la “discretizarea” seriei, adica la folosirea mijloacelor
intervalelor de variatie a variabilei, ca valoare considerate reprezentativa pentru tot intervalul.
Mijloacele intervalelor sunt calculate in coloanal a treia din table (coloana xi’).
Din acest punct, toate calculele se vor face folosind coloanele 2 si 3, deci se va urma exact acelasi
procedeu de calcul ca in cazul variabilelor discrete.

In medie, durata unei reclama este de 14.6 secunde.

In software-urile de analiza statistica, rezultatele apar ca in tabelul prezentat mai jos, in care:

- N este volumul esantionului


- Mean este media artimetica
- Median este mediana
- Mode este modul
- Std. deviation este abaterea standard sau abaterea medie patratica
- Variance este varianţa
- Skewness este coeficientul de asimetrie Fisher
- Kurtosis este coeficientul de boltire Fisher
- Percentile 10 este D1
- Percentile 20 este D2
- Percentile 25 este Q1
- Percentile 50 este mediana sau Q2 sau D5
- Percentile 75 este Q3 etc.

12
Statistics

X
N Valid 100
Missing 0
Mean 14.6000
Median 14.2857a
Mode 14.00
Std. Deviation 3.42893
Variance 11.758
Skewness .686
Kurtos is .086
Percentiles 10 10.0000b
20 11.0667
25 11.6000
28 11.9200
30 12.1333
40 13.2000
50 14.2857
60 15.4286
70 16.5714
75 17.1429
80 17.7143
90 20.4000
95 22.0000
a. Calculated from grouped data.
b. Percentiles are calculated from grouped data.

3.Pentru reprezentativitatea mediei se calculeaza coeficientul de variatie.

Valoarea coeficientului de variatie este inferioara pragului de 50%, deci dispersia este mica, populatia este
omogena iar media este reprezentativa.

13
Variabile calitative

I. Se consideră distribuţia după regiunea de provenienţă a angajaţilor unei firme, prezentată în tabelul
următor.

xi ni
Nord-Est 40
Sud 22
Vest 12
Centru 4
Total 78

Să se interpreteze frecvenţele absolute şi relative, modul şi să se reprezinte grafic distribuţia.

Rezolvare

xi ni fi(%)
Nord-Est 40 51.28
Sud 22 28.21
Vest 12 15.38
Centru 4 5.13
Total 78 100

Interpretare frecvente relative


51.28% dintre angajati provin din regiunea de NE, 28.21% din regiunea de S etc.

Modul este valoarea variabilei (regiunea) cel mai frecvent observata. Frecventa maxima este
inregistrata de regiunea de NE, deci modul este regiunea NE. Prin urmare, puteam afirma ca cel mai
frecvent, angajatii provin din regiunea de NE.

14
Reprezentarea grafica a unei variabile nominale se realizeaza folosind diagrame prin bare. Coloane
su diagrame de structura, cum ar fi cercul de structura.

II. Se consideră distribuţia după nivelul de studiu al angajaţilor unei firme, prezentată în tabelul
următor.

xi ni
Medii 72
Universitare 30
Post-universitare 15
Total 117

Să se interpreteze frecvenţele absolute şi relative, simple şi cumulate, modul si mediana.

Rezolvare

xi ni fi Ni Ni Fi Fi


Medii 72 61.54 72 117 61.54 100
Universitare 30 25.64 102 45 87.18 38.46
Post-universitare 15 12.82 117 15 100 12.82
Total 117 100

15
Interpretare frecvente pentru nivelul de studii universitare (al doilea nivel de variatie a lui X):
30 de angajati au studii universitare
25.64% din angajati au studii universitare
102 angajati au cel mult studii universitare
45 angajati au cel putin studii universitare
87.18% din angajati au cel mult studii universitare
38.46% din angajati au cel putin studii universitare

Modul este studii medii, intrucat acesta este nivelul de studii cu cea mai mare frecventa de aparitie.
Prin urmare, cei mai multi angajati au studii medii.

Pentru mediana aplicam algoritmul de identificare a acesteia.


3. Aflam pozitia ocupata de mediana in sirul celor 117 valori

UMe = (117+1)/2 = 59

Prima valoare Ni care ajunge in mijloc, adica prima valoare Ni ≥ UMe este 72.

4. Identificam mediana ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul
anterior, deci mediana este studii medii. Prin urmare, 50% din angajati au cel mult studii
medii, iar 50% au cel putin studii medii.

16
Tema – optional 😊

Concepte si notiuni fundamentale


- Populatie
- Esantion
- Unitate statistica
- Variabila statistica
- Scala de masurare

1. Intr-o comuna cu 2300 de gospodarii s-a studiat suprafata de pamant arabil (ha) si numarul de
animale (bucati) detinute de fiecare gospodarie.
- Identificaţi populaţia studiată, unitatea statistică, variabila observată, tipul variabilei şi al
scalei.
- Precizaţi tipul cercetării (totală sau parţială).

2. Un eşantion de angajaţi ai unei firme a răspuns la câteva întrebări cu caracter personal şi


profesional. Precizaţi natura următoarelor variabile şi tipul de scală specific:
- numărul de animale al familiei
- locul naşterii
- anul naşterii
- vârsta în ani împliniţi
- fumator (da, nu)
- nivelul ultimei diplome de studii obţinută (liceu, facultate, master, doctorat, post-
doctorat)
- tipul de maşină deţinut: autohton sau de import
- distanţa, în km, de acasă până la locul de muncă
- valoarea IQ-ului
- poziţia ierarhică ocupată în firmă (funcţionar, middle management, top management)
- calificativul obţinut la ultima evaluare la locul de muncă
- poziţia privind politica firmei de a reduce salariile în locul reducerii personalului existent
(acord total, acord, indiferent, dezacord, dezacord total)
- numărul de ore petrecute zilnic navigând pe internet

3. Pentru ţările din U.E. s-a înregistrat rata de creştere a PIB-ului în 2012. Se cere:
- Identificaţi populaţia studiată, unitatea statistică, variabila observată si tipul acesteia.

4. Precizaţi domeniul (setul de valori) pentru următoarele variabile:


- nr. de litri de combustibil din rezervorul unei maşini
- statusul marital al unei persoane
- nr. de cărţi de pe raftul unei biblioteci
- suma punctelor obţinute prin aruncarea simultana a două zaruri
- regiune din România

17
Analiza statistica univariata a unei serii numerice

Analiza numerica
1. Indicatori medii: media aritmetica, modul, mediana, quartile, decile
2. Indicatori ai variatiei (dispersiei): varianţa, abaterea medie patratica, coeficientul de
variatie, amplitudinea intervalului interquartilic
3. Indicatori ai formei: asimetrie (coeficientul de asimetrie Fisher) şi boltire (coeficientul de
boltire Fisher)

Analiza grafica
- Histograma
- Poligonul frecventelor
- Curba frecventelor
- Diagrama box-plot

I. Se inregistreaza numarul de ore de pregatire la matematica efectuate de un grup elevi in vederea


pregatirii pentru BAC: 10, 2, 7, 46, 15. Sa se calculeze si sa se interpreteze media aritmetica, modul,
mediana si coeficientul de variatie.

II. Se considera distributia unui eşantion de studenti după numărul de ore de voluntariat efectuate in
ultima saptamana. Datele sunt prezentate in tabelul de mai jos.

Tabelul 1. Distribuţia unui eşantion de student dupa numarul de ore de voluntariat efectuate in ultima
saptamana

xi ni
1.00 10
3.00 19
4.00 80
7.00 25
Total 134

1. Sa se calculeze media aritmetica, modul si mediana.


2. Sa se calculeze si sa se interpreteze Q1, Q3 si D9.
3. Sa se calculeze si sa se interpreteze varianta, abaterea medie patratica si coeficientul de variatie.
4. Stiind ca valoarea coeficientului de asimetrie este 0.38 si valoarea coeficientului de boltire este
0.31, sa se interpreteze forma distributiei.

III. Pentru o distribuţie a studenţilor după nota obţinută la Statistică se cunoaşte: D1= 2,5, Q1 = 4,
Me=6,5, Q3 = 7, D9=8. Se cere:
a. Să se construiască diagrama box-plot.
b. Să se precizeze sensul asimetriei.
c. Să se calculeze şi interpreteze intervalul interquartilic.

18
IV. Se considera distribuţia unui eşantion firme din judetul Iasi, observate după valoarea profitului
acestora (milioane lei). Datele sunt prezentate in tabelul urmator.

Tabelul 2. Distribuţia unui eşantion de firme după valoarea profitului (milioane lei) – elemente de
calcul

Se cere:
4. Sa se reprezinte grafic distributia folosind histograma si curba frecventelor
5. Sa se calculeze si sa se interpreteze media artimetica
6. Sa se interpreteze indicatorii prezentati in tabelul de mai jos. Apreciati gradul de
reprezentativitate al mediei.

Statistics
profit
Valid 120
N
Missing 0
Mean 21.2500
Median 20.0000
Mode 15.00
Std. Deviation 11.52728
Variance 132.878
Skewness .442
Std. Error of Skewness .221
Kurtosis -.484
Std. Error of Kurtosis .438
Sum 2550.00
25 15.0000
Percentiles 50 20.0000
75 25.0000

19
V. Pentru o companie, s-a observat distributia salariului femeilor si a barbatilor. Sa se interpreteze
rezultatele obtinutwe in urma analizei.

20
Aplicaţii

Concepte si notiuni fundamentale


- Populatie
- Esantion
- Unitate statistica
- Variabila statistica
o reprezintă însuşirea, trăsătura esenţială purtată de unităţile statistice ale unei
populaţii.
o se notează cu X. Valorile (categoriile) variabilei se notează cu xi.
o De exemplu, o intrebare dintr-un chestionar este o variabila, raspunsurile oferite la
intrebare sau raspunsurile posibile ce pot fi oferite la intrebare sunt valorile
variabilei.
 Intrebare: “Care este varsta dumneavoastra?”
 Variabila este varsta persoanei
 Valorile variabilei sunt raspunsurile posibile sau oferite, adica
valori de la 0 la 120.
 Intrebare: “Care este sexul dumneavoastra?”
 Variabila este sexul persoanei
 Valorile variabilei sunt rapunsurile posibile sau oferite, adica
masculin sau feminin.

Tipuri de variabile
1. Variabile numerice (cantitative):
- variabile discrete – variabila poate avea ca valori doar numere intregi, respectiv unitatea
de masura a variabilei nu admite subdiviziuni. De exemplu, numarul de copii ai unei
familii, numarul de angajati ai unei firme etc.;
- variabile continue – variabila poate avea ca valori orice fel de numar, respectiv unitatea
de masura a variabilei admite subdiviziuni. De exemplu, pretul unui produs, salariul unei
persoane, rata somajului unei tari, inaltimea unei persoane etc.
2. Variabile nenumerice (calitative):
- variabile nominale. Caz particular: variabile alternative (dummy), adica variabile care pot
avea doar doua valori posibile. Valorile variabilei nominale nu pot fi ordonate dupa un
criteriu de intensitate a raspunsurilor oferite. De exemplu, religia unei persoane, judetul
de rezidenta al unei persoane, domeniul de activitate a unei firme etc.
- variabile ordinale. Daca valorile variabilei trebuie insiruite intr-o anumita ordine data de
gradul de intensitate care face diferenta intre ele, atunci variabila este ordinala. De
exemplu, nivelul de studii al unei persoane, gradul de acord sau dezacord cu o afirmatie
etc.

OBS. In functie de cum se prezinta valorile variabilei, putem determina tipul variabilei.

- Scala de masurare
Scala este un continuum de cifre sau de simboluri, plasate ierarhic, de la inferior la
superior.

1
Tipuri de scale
1. Variabile calitative
Scala nominală presupune acordarea de numere (coduri) fiecărei categorii a unei populaţii
(doi indivizi care aparţin unor categorii distincte au valori diferite).
 este caracteristică variabilelor nominale
Scala ordinală presupune ca atribuirea de coduri numerice pentru fiecare categorie să se
realizeze în ordine descrescătoare, după importanţa lor.
 este caracteristică variabilelor ordinale.

2. Variabile cantitative
Scala interval are ca proprietăţi identitatea, ordinea şi faptul că intervalul între numere are
un sens.
 se poate, astfel, compara diferenţa dintre două valori ale aceleiaşi variabile.

Exemplu:
- temperatura în sistemul Celsius şi în sistemul Fahrenheit: diferenţa dintre două temperaturi
are un sens;
- scorurile obţinute la testele de evaluare.

Scala raport
 are aceleaşi proprietăţi ca scala interval şi, în plus, posedă un zero absolut (considerat punct
de referinţă).
 diferenţa şi raportul dintre două valori au un sens.

Exemplu:
- Rata şomajului, PIB/locuitor, rata natalităţii, vârsta, înălţimea, greutatea ...

- Scala de masurare

2
APLICATII

1. Intr-o comuna cu 2300 de gospodarii s-a studiat suprafata de pamant arabil (ha) si numarul de
animale (bucati) detinute de fiecare gospodarie.
- Identificaţi populaţia studiată, unitatea statistică, variabila observată, tipul variabilei şi al
scalei.
- Precizaţi tipul cercetării (totală sau parţială).

2. Un eşantion de angajaţi ai unei firme a răspuns la câteva întrebări cu caracter personal şi


profesional. Precizaţi natura următoarelor variabile şi tipul de scală specific:
- numărul de animale al familiei
- locul naşterii
- anul naşterii
- vârsta în ani împliniţi
- fumator (da, nu)
- nivelul ultimei diplome de studii obţinută (liceu, facultate, master, doctorat, post-
doctorat)
- tipul de maşină deţinut: autohton sau de import
- distanţa, în km, de acasă până la locul de muncă
- valoarea IQ-ului
- poziţia ierarhică ocupată în firmă (funcţionar, middle management, top management)
- calificativul obţinut la ultima evaluare la locul de muncă
- poziţia privind politica firmei de a reduce salariile în locul reducerii personalului existent
(acord total, acord, indiferent, dezacord, dezacord total)
- numărul de ore petrecute zilnic navigând pe internet

3. Pentru ţările din U.E. s-a înregistrat rata de creştere a PIB-ului în 2012. Se cere:
- Identificaţi populaţia studiată, unitatea statistică, variabila observată si tipul acesteia.

4. Precizaţi domeniul (setul de valori) pentru următoarele variabile:


- nr. de litri de combustibil din rezervorul unei maşini
- statusul marital al unei persoane
- nr. de cărţi de pe raftul unei biblioteci
- suma punctelor obţinute prin aruncarea simultana a două zaruri
- regiune din România

3
Analiza statistica univariata a unei serii numerice

Analiza numerica
1. Indicatori medii: media aritmetica, modul, mediana, quartile, decile
2. Indicatori ai variatiei (dispersiei): varianţa, abaterea medie patratica, coeficientul de
variatie, amplitudinea intervalului interquartilic
3. Indicatori ai formei: asimetrie (coeficientul de asimetrie Fisher) şi boltire (coeficientul de
boltire Fisher)

Analiza grafica
- Histograma
- Poligonul frecventelor
- Curba frecventelor
- Diagrama box-plot

I. Se inregistreaza numarul de ore de pregatire la matematica efectuate de un grup elevi in vederea


pregatirii pentru BAC: 10, 2, 7, 46, 15. Sa se calculeze si sa se interpreteze media aritmetica,
mediana si coeficientul de variatie.

Rezolvare

Media aritmetica

In medie, un elev efectueaza 16 ore de pregatire.

Mediana

Mediana este valoarea variabilei care imparte in jumatate un sir ordonat de valori.

1. Ordonam seria

2, 7, 10, 15, 46

2. Identificam mediana ca fiind valoarea centrala din sir, adica Me=10 ore. Prin urmare, 50%
din elevi fac cel mult 10 ore de pregatire, iar 50% cel putin 10 ore de pregatire.

Coeficientul de variatie

Pentru a calcula valoarea coeficientului de variatie, trebuie sa calculam valoarea abaterii medii
patratice, s.

4
s 15.58
v  *100  *100  97.37%
x 16

Daca v ≤ 50% (abaterea standard este cel mult jumatate din valoarea mediei) dispersia este mica,
populatia este omogena si media este reprezentativa.

Daca v > 50% (abaterea standard este peste jumatate din valoarea mediei) dispersia este mare,
populatia este eterogena si media este nereprezentativa.

In cazul nostru, v>50%, deci dispersia este mare, populatia este eterogena si media nu este
reprezentativa.

II. Se considera distributia unui eşantion de studenti după numărul de ore de voluntariat efectuate in
ultima saptamana. Datele sunt prezentate in tabelul de mai jos.

Tabelul 1. Distribuţia unui eşantion de student dupa numarul de ore de voluntariat efectuate in ultima
saptamana

xi ni
1.00 10
3.00 19
4.00 80
7.00 25
Total 134
5
1. Sa se calculeze media aritmetica, modul si mediana.
2. Sa se calculeze si sa se interpreteze Q1, Q3 si D9.
3. Sa se calculeze si sa se interpreteze varianta, abaterea medie patratica si coeficientul de variatie.
4. Stiind ca valoarea coeficientului de asimetrie este 0.38 si valoarea coeficientului de boltire este
0.31, sa se interpreteze forma distributiei.

Rezolvare

xi ni xi*ni Ni xi  x ( xi  x ) 2 ( x i  x ) 2  ni
1.00 10 10 10 -3,19 10,1761 101,761
3.00 19 57 29 -1,19 1,4161 26,9059
4.00 80 320 109 -0,19 0,0361 2,888
7.00 25 175 134 2,81 7,8961 197,4025
Total 134 562 - - - 328,9574

1.
Media aritmetica

x
x n
i i

562
 4.19  4ore
n i 134

In medie, un student efectueaza 4 ore de voluntariat.

Modul

Modul reprezinta valoarea variabilei cel mai frecvent intalnita intr-o distributie. Cea mai mare
frecventa de aparitie este 80, iar valoarea variabilei corespunzatoare acestei frecvente este 4. Prin
urmare, Mo = 4 ore, adica cel mai frecvent, studentii efectueaza 4 ore de voluntariat.

Mediana
Pentru mediana aplicam algoritmul de identificare a acesteia.
3. Aflam pozitia ocupata de mediana in sirul celor 134 valori.

UMe = (134+1)/2 = 67.5

Prima valoare Ni care ajunge in mijloc, adica prima valoare Ni ≥ UMe este 109.

4. Identificam mediana ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul
anterior, deci Me = 4 ore. Prin urmare, 50% din studenti efectueaza cel putin 4 ore de
voluntariat, iar 50% cel mult 4 ore de voluntariat.

2.
Pentru Q1 aplicam algoritmul de identificare a acesteia.

6
1. Aflam pozitia ocupata de Q1 in sirul celor 134 valori

UQ1 = (134+1)/4 = 33.75

Prima valoare Ni care acopera valoarea 33.75, adica prima valoare Ni ≥ UQ1 este 109.

2. Identificam Q1 ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul


anterior, deci Q1 = 4. Prin urmare, 25% din studenti efectueaza cel mult 4 ore de voluntariat,
iar 75% efectueaza cel putin 4 ore de voluntariat.

Pentru Q3 aplicam algoritmul de identificare a acesteia.


5. Aflam pozitia ocupata de Q3 in sirul celor 134 valori.

UQ3 = 3*(134+1)/4 = 101.25

Prima valoare Ni care acopera valoarea 101.25, adica prima valoare Ni ≥ UQ3 este 109.

6. Identificam Q3 ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul


anterior, deci Q3 = 4. Prin urmare, 75% din studenti efectueaza cel mult 4 ore de voluntariat,
iar 25% efectueaza cel putin 4 ore de voluntariat.

Pentru D9 aplicam algoritmul de identificare a acesteia.


1. Aflam pozitia ocupata de D9 in sirul celor 134 valori

UD9 = 9*(134+1)/10 = 121.5

Prima valoare Ni care acopera valoarea 121.5, adica prima valoare Ni ≥ UD9 este 134.

2. Identificam D9 ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul


anterior, deci D9 = 7. Prin urmare, 90% studenti efectueaza cel mult 7 ore de voluntariat, iar
10% efectueaza cel putin 7 ore de voluntariat.

3.
Varianta

 x  x 
2
 ni 328,9574
   2,45
i
s2
n i 134

7
Abaterea medie patratica (abaterea standard)

s  s 2  2,45  1,56  2ore

In medie, numarul orelor de voluntariat effectuate de un student se abate de la media grupului cu 2


ore.

Coeficientul de variatie

s 1,56
v *100  *100  37,23%
x 4,19

v ≤ 50% (abaterea standard este cel mult jumatate din valoarea mediei) dispersia este mica, populatia
este omogena si media este reprezentativa.

8
4.

9
10
Coeficientul de asimetrie γ1 este pozitiv, deci distributia este asimetrica la dreapta.
Coeficientul de boltire γ2 este pozitiv, deci distributia este leptocurtica.

III. Pentru o distributie s-au inregistrat valorile: D1=5, Q1=12, Q2=20, Q3=22, D9=25. Sa se
interpreteze asimetria distributiei folosind diagrama box-plot.

11
IV. Pentru doua serii de studenti s-au reprezentat grafic distributiile notelor obtinute la un test. Sa se
interpreteze quartilele si decilele. Sa se precizeze sensul asimetriei. Sa se specifice care serie a
obtinut note mai mari.

NOTA _1

NOTA _2

3 4 5 6 7 8 9 10 11

Distributia primei serii de studenti (reprezentata la Nota_1)


D1 = 4: 10% dintre studenti au obtinut cel mult 4, 90% cel putin 4
Q1 = 5: 25% dintre studenti au obtinut cel mult 5, 75% dintre studenti au obtinut cel putin 5
Q2 = 6: 50% dintre studenti au obtinut cel mult 6, 50% cel putin 6
Q3 = 9: 75% dintre studenti au obtinut cel mult 9, 25% cel putin 9
D9=10: 90% dintre studenti au obtinut cel mult 10, 10% au obtinut cel putin 10

Distributia celei de-a doua serii de studenti (reprezentata la Nota_2)


D1 = 4: 10% dintre studenti au obtinut cel mult 4, 90% cel putin 4
Q1 = 6.5: 25% dintre studenti au obtinut cel mult 6.5, 75% dintre studenti au obtinut cel putin 6.5
Q2 = 8: 50% dintre studenti au obtinut cel mult 8, 50% cel putin 8
Q3 = 9: 75% dintre studenti au obtinut cel mult 9, 25% cel putin 9
D9=10: 90% dintre studenti au obtinut cel mult 10, 10% au obtinut cel putin 10

Distributia primei serii este asimetrica la dreapta, distributia celei de-a doua serii este asimetrica la
stanga.

Prin urmare, in urma analizarii tuturor acestor informatii, a doua serie a obtinut note mai mari decat
prima.

12
V. Se considera distribuţia unui eşantion firme din judetul Iasi, observate după valoarea profitului
acestora (milioane lei). Datele sunt prezentate in tabelul urmator.

Tabelul 2. Distribuţia unui eşantion de firme după valoarea profitului (milioane lei) – elemente de
calcul

Se cere:
1. Sa se reprezinte grafic distributia folosind histograma si curba frecventelor
2. Sa se calculeze si sa se interpreteze media aritmetica
3. Sa se interpreteze indicatorii prezentati in tabelul de mai jos. Apreciati gradul de
reprezentativitate al mediei.

Statistics
profit
Valid 120
N
Missing 0
Mean 21.2500
Median 20.0000
Mode 15.00
Std. Deviation 11.52728
Variance 132.878
Skewness .442
Std. Error of Skewness .221
Kurtosis -.484
Std. Error of Kurtosis .438
Sum 2550.00
25 15.0000
Percentiles 50 20.0000
75 25.0000

13
Rezolvare

1.

2.
Pentru a calcula indicatorii descriptive in cazul unei serii continue, pentru care valorile acesteia sunt grupate
pe intervale de variatie, se va proceda mai intai la “discretizarea” seriei, adica la folosirea mijloacelor
intervalelor de variatie a variabilei, ca valoare considerate reprezentativa pentru tot intervalul.
Mijloacele intervalelor sunt calculate in coloana a treia din tabel (coloana xi’).
Din acest punct, toate calculele se vor face folosind coloanele 2 si 3, deci se va urma exact acelasi procedeu
de calcul ca in cazul variabilelor discrete.

x
x ni i

2550
 21.25mil.lei
n i 129

In medie, o firma realizeaza un profit de 21.25 milioane lei.

3.
In software-urile de analiza statistica, rezultatele apar ca in tabelul prezentat mai jos, in care:

- N este volumul esantionului


- Mean este media aritmetica
- Median este mediana (50% din firme au realizat un profit de cel mult 20 milioane lei, iar 50% un
profit de cel putin 20 milioane lei)
- Mode este modul (Cele mai multe firme au realizat un profit de 15 milioane lei)
- Std. deviation este abaterea standard sau abaterea medie patratica (In medie, profitul unei firme se
abate de la profitul mediu al grupului cu 11.52 milioane lei)
14
- Variance este varianţa
- Skewness este coeficientul de asimetrie Fisher (distributia este asimetrica la dreapta)
- Kurtosis este coeficientul de boltire Fisher (distributia este leptocurtica)
- Percentile 25 este Q1 (25% din firme au realizat un profit de cel mult 15 milioane lei, iar 75% din
firme au realizat cel putin 15 milioane lei profit)
- Percentile 50 este mediana sau Q2 sau D5
- Percentile 75 este Q3 (75% din firme au realizat un profit de cel mult 25 milioane lei, iar 25% din
firme au realizat cel putin 25 milioane lei profit)

15
Variabile calitative

I. Se consideră distribuţia după regiunea de provenienţă a angajaţilor unei firme, prezentată în tabelul
următor.

xi ni
Nord-Est 40
Sud 22
Vest 12
Centru 4
Total 78

Să se interpreteze frecvenţele absolute şi relative, modul şi să se reprezinte grafic distribuţia.

Rezolvare

xi ni fi(%)
Nord-Est 40 51.28
Sud 22 28.21
Vest 12 15.38
Centru 4 5.13
Total 78 100

Interpretare frecvente relative


51.28% dintre angajati provin din regiunea de NE, 28.21% din regiunea de S etc.

Modul este valoarea variabilei (regiunea) cel mai frecvent observata. Frecventa maxima este
inregistrata de regiunea de NE, deci modul este regiunea NE. Prin urmare, puteam afirma ca cel mai
frecvent, angajatii provin din regiunea de NE.

16
Reprezentarea grafica a unei variabile nominale se realizeaza folosind diagrame prin bare, coloane
sau diagrame de structura, cum ar fi cercul de structura.

II. Se consideră distribuţia după nivelul de studiu al angajaţilor unei firme, prezentată în tabelul
următor.

xi ni
Medii 72
Universitare 30
Post-universitare 15
Total 117

Să se interpreteze frecvenţele absolute şi relative, simple şi cumulate, modul si mediana.

Rezolvare

xi ni fi Ni Ni Fi Fi


Medii 72 61.54 72 117 61.54 100
Universitare 30 25.64 102 45 87.18 38.46
Post-universitare 15 12.82 117 15 100 12.82
Total 117 100

17
Interpretare frecvente pentru nivelul de studii universitare (al doilea nivel de variatie a lui X):
30 de angajati au studii universitare
25.64% din angajati au studii universitare
102 angajati au cel mult studii universitare
45 angajati au cel putin studii universitare
87.18% din angajati au cel mult studii universitare
38.46% din angajati au cel putin studii universitare

Modul este studii medii, intrucat acesta este nivelul de studii cu cea mai mare frecventa de aparitie.
Prin urmare, cei mai multi angajati au studii medii.

Pentru mediana aplicam algoritmul de identificare a acesteia.


7. Aflam pozitia ocupata de mediana in sirul celor 117 valori

UMe = (117+1)/2 = 59

Prima valoare Ni care ajunge in mijloc, adica prima valoare Ni ≥ UMe este 72.

8. Identificam mediana ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul
anterior, deci mediana este studii medii. Prin urmare, 50% din angajati au cel mult studii
medii, iar 50% au cel putin studii medii.

18
1. Pentru o companie, s-a observat distributia salariului femeilor si a barbatilor. Sa se interpreteze
rezultatele obtinute in urma analizei.

19

S-ar putea să vă placă și