Sunteți pe pagina 1din 8

P1 : Procentul din profit cheltuit de 70 de firme pentru reclamă şi publicitate în anul 2007 a avut

următoarea distribuţie:
% pentru reclamă şi Nr. firme (ni)
publicitate
0,6-1,0 14
1,0-1,4 18
1,4-1,8 24
1,8-2,2 8
2,2-2,6 4
Peste 2,6 2
Total 70
Notă: limita inferioară inclusă în interval.
Se cere:
a) Să se reprezinte grafic distributia firmelor in functie de procentul din profit cheltuit pentru reclamă şi
publicitate;
b) Caracterizati colectivitatea folosind indicatorii tendintei centrale;
c) Analizati omogenitatea si asimetria colectivitatii;
d) Determinati media şi dispersia firmelor care au cheltuit mai mult de 2,2% din profit pentru reclamă şi
publicitate;

a)
% cheltuit Frecvenţe Centre de
pentru absolute interval
reclamă şi (nr. (xi) Fci
publicitate firme)
(ni)
[0,6-1,0) 14 0,8 11,2 -0,66 6,098 14
[1,0-1,4) 18 1,2 21,6 -0,26 1,217 32
[1,4-1,8) 24 1,6 38,4 0,14 0,470 56
[1,8-2,2) 8 2,0 16 0,54 2,333 64
[2,2-2,6) 4 2,4 9,6 0,94 3,534 68
[2,6-3,0) 2 2,8 5,6 1,34 3,591 70
Total - 102,
70 4 17,244

a ) HISTOGRAMA

Distribuţia firmelor după procentul cheltuit pentru reclamă şi publicitate

b) Indicatorii tendintei centrale :

Media %
Aşadar, o firmă din cele 70 luate în studiu a cheltuit, în medie, 1,46% din profit pentru reclamă şi
publicitate.

Mediana (Me)
FCi

Mediana se găseşte în intervalul 1,4-1,8.

%.

Deci, 50% din firme au cheltuit pentru reclamă şi publicitate mai mult de 1,458 % din profit, iar 50%
mai puţin.

Modul

unde:
x0 = limita inferioară a intervalului modal;
h = mărimea intervalului modal;
Intervalul modal este intervalul cu frecvenţa maximă: [ 1,4-1,8)
1 = nMo – nMo-1 = frecvenţa intervalului modal minus frecvenţa intervalului anterior celui modal;
2 = nMo - nMo+1 = frecvenţa intervalului modal minus frecvenţa intervalului următor celui modal;
Se obţine
Cele mai multe firme au cheltuit pentru reclamă şi publicitate 1,52% din profit.

c) Omogenitatea

Se determina coeficientul de variaţie:

Dispersia variabilei în eşantion este:

Abaterea medie pătratică va fi:


%.

iar coeficientul de variaţie:


< 35%, ceea ce înseamnă că media calculată este reprezentativă,
colectivitatea fiind omogenă.

d) Se creează o caracteristică alternativă cu o stare favorabilă (firmele care au cheltuit peste 2,2%) şi o
stare nefavorabilă (firmele care au cheltuit mai puţin de 2,2%).
Media caracteristicii alternative este:
(în medie, 9% din firme au cheltuit peste 2,2%)
iar dispersia:
.

P2: Un profesor doreşte să vadă care au fost rezultatele medii obţinute de studenţii săi la examen. De
asemenea, ar vrea să observe care a fost variaţia notelor. Calculaţi mărimile necesare. Notele obţinute de
studenţi la examen au fost următoarele:

8,1 9,2 3,0 7,9 9,0 6,9 9,6 3,9 9,4 8,8 6,5 7,3 8,4 8,3 9,5 3,8 9,7
9,4 9,3 7,3 7,8 8,6 5,7 9,8 9,3 8,3 9,9 4,2 9,9 5,1 8,4 9,0 8,8 5,9
9,5 7,0 8,1 9,1 7,5 8,2 8,3 6,5 3,4 8,9 4,3 8,5 7,5 6,4 6,4 9,3 8,6
8,4 4,8 8,1 9,6 9,1 9,6 8,3 4,1 10,0 2,5 4,8 7,1 8,9 6,1 7,7 7,6 1,8
5,3 6,9 6,6 9,4 8,0 5,5 8,4 6,6 3,4 9,8 7,2 1,1 3,8 8,5 7,7 9,6 5,0
7,2 8,3 8,7 7,4 9,4 9,0 8,4 9,5 9,0 7,3 9,9 8,5 7,1 3,7 1,6
Rezolvare folosind EXCEL:
Instrumentul de analiză Descriptive Statistics generează un raport de statistici univariate pentru datele din
zona de intrare, furnizând informații despre tendința centrală și variabilitatea datelor.
Pentru obținerea indicatorilor tendinței centrale și pentru indicatorii variabilității accesăm: Data/Data
Analysis/Descriptive Statistics
Pentru instalarea modului Data Analysis procedăm astfel:
1. Din mediu, accesăm File/Options/Add-ins/Go/Analysis ToolPak – VBA și enter
2 În fereastra deschisă, bifăm opțiunea Analysis ToolPak și OK (enter)
Rezultatul prelucrarii optiunii Descriptive Statistics.

Note

Mean 7.398
Standard Error 0.215022
Median 8.1
Mode 8.4
Standard Deviation 2.150216
Sample Variance 4.62343
Kurtosis 0.393661
Skewness -1.0731
Range 8.9
Minimum 1.1
Maximum 10
Sum 739.8
Count 100
Media notelor obţinute la examen este 7,398 (Mean) cu mediana 8,1 (Median). Modulul este 8,4
(Mode). Acesta este posibil să nu fie singurul, deoarece EXCEL nu afişează decât o singură valoare.
Cea mai mică notă obţinută a fost 1,1 (Minimum) iar cea mai mare Maximum = 10. Amplitudinea
(diferenţa între valoarea minimă şi cea maximă) este 8,9 (Range).
Variaţia măsurată prin dispersie este 4,62 (Sample Variance) iar abaterea medie pătratică este 2,15
(Standard deviation). Eroarea standard (acest indicator va fi explicat la capitolul de sondaj statistic) este
0,215 (Standard Error).
Deoarece Skewness este negativ şi mult diferit de zero (-1,07) seria de date este puternic asimetrică
negativ, curba fiind alungită spre stânga. Predomina valori mari ai in ceea ce priveste notele.
Kurtosis este 0,39, pozitiv, ceea ce înseamnă că avem o curbă ascuţită (distribuţie leptocurtică).S-
au înregistrat veniturile a 310 salariați ai unei companii din domeniul IT( indicatori ce vor fi prezentati in
cursul urmator).

P3:S-au înregistrat veniturile a 310 salariați ai unei companii din domeniul IT. Datele înregistrate sunt
prezentate în tabelul următor:

Grupe de salarii (lei) - [1500-2500) [2500-3500) [3500-4500) [4500-5500) > 5500


xi
Număr angajați-ni 50 70 120 35 35
Nota: Limita inferioara inclusa în interval

Cerințe:
a) Realizați graficul distribuției și interpretarea acestuia.
b) Calculați indicatorii tendinței centrale și interpretați valorile acestora.
c) Calculați cuartilele și interpretați valorile acestora.
d) Calculați media pentru caracteristica salariul <3500 lei.
e) Identificați dacă în eșantionul considerat sunt valori de tip outlier (valori aberante) .
Rezolvare:

a) Reprezentarea grafică
Analizând histograma seriei de date se poate observa faptul ca cei mai mulți salariați din domeniul
IT câștiga intre 3500 lei și 4500 lei, iar seria are o distribuție aproximativ normal (cele mai mari frecvențe se
găsesc în grupele din mijloc).

b) Indicatorii tendinței centrale


Media aritmetică:

Unde:
xi= centru intervalului de variatie a variabilei,
xi = ,
Li = limita inferioară a intervalului,
Ls = limita superioară a intervalului.

Interpretare: În medie, un salariat a unei companii din domeniul IT are un salariu lunar de 3790,323 lei.

Observatie: Deoarece seria are tendință de normalitate (cele mai mari frecvențe se găsesc în centrul seriei) ,
media se află în intervalul căruia îi corespunde frecvența absolută maximă. =3790,323ϵ[3500.4500]

Salariu (lei) xi Număr Centru de interval xi*ni


angajați ni xi
1500-2500 50 2.000 100.000
2500-3500 70 3.000 210.000
3500-4500 120 4.000 480.000
4500-5500 35 5.000 175.000
5500- 6500 35 6.000 210.000
Total 310 - 1.175.000
Simbol

Modul:
Se determină intervalul cu frecvența absolute cea mai mare. În cazul nostru cea mare frecvență absolută este
120 intervalul modal fiind [3500, 4500).
Unde:
h=4500-3500=1000 este mărimea intervalului modal
1 = nMo – nMo-1 =120-70=50 ;
2 = nMo - nMo+1=120-35=85

Interpretare: Cei mai mulți salariați au avut salariul egal cu 3870,37 lei.
Determinarea Medianei:

Se determină frecvențele cumulate crescător:


Salariul
1500-2500 50 50
2500-3500 70 120
3500-4500 120 240
4500-5500 35 275
5500- 6500 35 310
Total n=310 -
Intervalul median va fi intervalul pentru care prima frecvență cumulată crescător este mai mare decat locul
medianei, astfel

intervalul median fiind [3500,4500) .

lei
Interpretare: 50% dintre angajați au avut salariul mai mic de 3795,83 lei, iar 50% au avut salariul mai mare
de 3795,83 lei.

Compararea indicatorilor tendinței centrale- aprecierea tipului asimetriei


Deoarece =3790,323 < = < = putem aprecia că avem asimetrie negativă sau de
stanga, adică predomină salariații cu valori mari ale salariului (valori peste medie) .
c) Cuartilele
Algoritmul de calcul al cuartilelor este similar algoritmului de calcul al medianei.
Cuartila 1:

Se determină frecvențele cumulate crescător:


Salariul
1500-2500 50 50
2500-3500 70 120

3500-4500 120 240


4500-5500 35 275
> 5500 35 310
Total 310 -
Intervalul cuartilei 1 va fi intervalul pentru care prima frecvență cumulată crescător este mai mare sau egală
cu locul cuartilei 1, astfel intervalul cuartilei 1 fiind [2500,3500)

lei
Interpretare: 25% dintre angajați au avut salariul mai mic de 2896,42 lei, iar 75% au avut salariul mai mare
de 2896,42 lei.

Cuartila 2 = Mediana

Cuartila 3:

Se determină frecvențele cumulate crescător:


Salariul
1500-2500 50 50
2500-3500 70 120
3500-4500 120 240

4500-5500 35 275
> 5500 35 310
Total 310 -

Intervalul cuartilei 3 va fi intervalul pentru care prima frecvență cumulată crescător este mai mare cu locul
cuartilei 3, astfel intervalul cuartilei 3 fiind [3500,4500)

4443,75 lei

Interpretare: 75% dintre angajați au avut salariul mai mic de 4443,75 lei, iar 25% au avut salariul mai mare
de 4443,75 lei.

d)Calculați media pentru caracteristica salariul <3500 lei

Media variabilei alternative se calculează după relația:

Unde:
m - numărul de unități în stare favorabilă,
n - numărul total de unități din eșantion (volumul eșantionului) .
Salariul (lei) Media
Sub 3500 lei (DA) 50+70=120

Mai mare sau egal cu 3500 lei (NU) 190


Total 310 1

Aproximativ 38,7% dintre salariați au salariul mai mic de 3500 lei, în timp ce 61,3% dintre salariați au
salariul mai mare sau egal cu 3500 lei.
e)Identificați dacă în eșantionul considerat sunt valori extreme de tip outlier
Identificarea valorilor aberante (outlier) se face parcurgând următoarele etape:

 cuartila inferioară sau de ordinul 1, lei;


 mediana sau cuartila de ordinul 2, lei;
 cuartila superioară sau de ordinul 3, 4443,75 lei
 abaterea intercuartilică: IQR = = 4443,75- =1547,33 lei
 limita sau marginea inferioară a diagramei Box-Plot este cea mai mică dintre valorile seriei de
date cu proprietatea că este , adică

Cea mai mică dintre valorile seriei de date, cu proprietatea că este ,425 este
lei; limita sau marginea superioară a diagramei Box-Plot este cea mai
mare dintre valorile seriei de date cu proprietatea că este , adică:

Cea mai mare dintre valorile seriei de date, cu proprietatea că este , este 6500, deci
marginea superioară este egală cu
6500,
Se observă că intervalul cuprins între marginea inferioară și cea superioară diagramei Box-Plot, adică
intervalul de numere reale [1500; 6500] conține toate valorile observate seria nu conține valori extreme
(outlier) .
Observație: Având în vedere faptul că pentru determinarea mediei noi am închis seria de date cu
valoarea de 6500, respectiv nu cunoaștem cu exactitate care sunt valorile mai mari decât 5000, atunci putem
afirma că orice valoare mai mare decât poate fi considera că ca fiind valoare
extremă. Astfel, în cazul problemei noastre nu putem aprecia dacă avem valori extreme.

S-ar putea să vă placă și