Documente Academic
Documente Profesional
Documente Cultură
următoarea distribuţie:
% pentru reclamă şi Nr. firme (ni)
publicitate
0,6-1,0 14
1,0-1,4 18
1,4-1,8 24
1,8-2,2 8
2,2-2,6 4
Peste 2,6 2
Total 70
Notă: limita inferioară inclusă în interval.
Se cere:
a) Să se reprezinte grafic distributia firmelor in functie de procentul din profit cheltuit pentru reclamă şi
publicitate;
b) Caracterizati colectivitatea folosind indicatorii tendintei centrale;
c) Analizati omogenitatea si asimetria colectivitatii;
d) Determinati media şi dispersia firmelor care au cheltuit mai mult de 2,2% din profit pentru reclamă şi
publicitate;
a)
% cheltuit Frecvenţe Centre de
pentru absolute interval
reclamă şi (nr. (xi) Fci
publicitate firme)
(ni)
[0,6-1,0) 14 0,8 11,2 -0,66 6,098 14
[1,0-1,4) 18 1,2 21,6 -0,26 1,217 32
[1,4-1,8) 24 1,6 38,4 0,14 0,470 56
[1,8-2,2) 8 2,0 16 0,54 2,333 64
[2,2-2,6) 4 2,4 9,6 0,94 3,534 68
[2,6-3,0) 2 2,8 5,6 1,34 3,591 70
Total - 102,
70 4 17,244
a ) HISTOGRAMA
Media %
Aşadar, o firmă din cele 70 luate în studiu a cheltuit, în medie, 1,46% din profit pentru reclamă şi
publicitate.
Mediana (Me)
FCi
%.
Deci, 50% din firme au cheltuit pentru reclamă şi publicitate mai mult de 1,458 % din profit, iar 50%
mai puţin.
Modul
unde:
x0 = limita inferioară a intervalului modal;
h = mărimea intervalului modal;
Intervalul modal este intervalul cu frecvenţa maximă: [ 1,4-1,8)
1 = nMo – nMo-1 = frecvenţa intervalului modal minus frecvenţa intervalului anterior celui modal;
2 = nMo - nMo+1 = frecvenţa intervalului modal minus frecvenţa intervalului următor celui modal;
Se obţine
Cele mai multe firme au cheltuit pentru reclamă şi publicitate 1,52% din profit.
c) Omogenitatea
d) Se creează o caracteristică alternativă cu o stare favorabilă (firmele care au cheltuit peste 2,2%) şi o
stare nefavorabilă (firmele care au cheltuit mai puţin de 2,2%).
Media caracteristicii alternative este:
(în medie, 9% din firme au cheltuit peste 2,2%)
iar dispersia:
.
P2: Un profesor doreşte să vadă care au fost rezultatele medii obţinute de studenţii săi la examen. De
asemenea, ar vrea să observe care a fost variaţia notelor. Calculaţi mărimile necesare. Notele obţinute de
studenţi la examen au fost următoarele:
8,1 9,2 3,0 7,9 9,0 6,9 9,6 3,9 9,4 8,8 6,5 7,3 8,4 8,3 9,5 3,8 9,7
9,4 9,3 7,3 7,8 8,6 5,7 9,8 9,3 8,3 9,9 4,2 9,9 5,1 8,4 9,0 8,8 5,9
9,5 7,0 8,1 9,1 7,5 8,2 8,3 6,5 3,4 8,9 4,3 8,5 7,5 6,4 6,4 9,3 8,6
8,4 4,8 8,1 9,6 9,1 9,6 8,3 4,1 10,0 2,5 4,8 7,1 8,9 6,1 7,7 7,6 1,8
5,3 6,9 6,6 9,4 8,0 5,5 8,4 6,6 3,4 9,8 7,2 1,1 3,8 8,5 7,7 9,6 5,0
7,2 8,3 8,7 7,4 9,4 9,0 8,4 9,5 9,0 7,3 9,9 8,5 7,1 3,7 1,6
Rezolvare folosind EXCEL:
Instrumentul de analiză Descriptive Statistics generează un raport de statistici univariate pentru datele din
zona de intrare, furnizând informații despre tendința centrală și variabilitatea datelor.
Pentru obținerea indicatorilor tendinței centrale și pentru indicatorii variabilității accesăm: Data/Data
Analysis/Descriptive Statistics
Pentru instalarea modului Data Analysis procedăm astfel:
1. Din mediu, accesăm File/Options/Add-ins/Go/Analysis ToolPak – VBA și enter
2 În fereastra deschisă, bifăm opțiunea Analysis ToolPak și OK (enter)
Rezultatul prelucrarii optiunii Descriptive Statistics.
Note
Mean 7.398
Standard Error 0.215022
Median 8.1
Mode 8.4
Standard Deviation 2.150216
Sample Variance 4.62343
Kurtosis 0.393661
Skewness -1.0731
Range 8.9
Minimum 1.1
Maximum 10
Sum 739.8
Count 100
Media notelor obţinute la examen este 7,398 (Mean) cu mediana 8,1 (Median). Modulul este 8,4
(Mode). Acesta este posibil să nu fie singurul, deoarece EXCEL nu afişează decât o singură valoare.
Cea mai mică notă obţinută a fost 1,1 (Minimum) iar cea mai mare Maximum = 10. Amplitudinea
(diferenţa între valoarea minimă şi cea maximă) este 8,9 (Range).
Variaţia măsurată prin dispersie este 4,62 (Sample Variance) iar abaterea medie pătratică este 2,15
(Standard deviation). Eroarea standard (acest indicator va fi explicat la capitolul de sondaj statistic) este
0,215 (Standard Error).
Deoarece Skewness este negativ şi mult diferit de zero (-1,07) seria de date este puternic asimetrică
negativ, curba fiind alungită spre stânga. Predomina valori mari ai in ceea ce priveste notele.
Kurtosis este 0,39, pozitiv, ceea ce înseamnă că avem o curbă ascuţită (distribuţie leptocurtică).S-
au înregistrat veniturile a 310 salariați ai unei companii din domeniul IT( indicatori ce vor fi prezentati in
cursul urmator).
P3:S-au înregistrat veniturile a 310 salariați ai unei companii din domeniul IT. Datele înregistrate sunt
prezentate în tabelul următor:
Cerințe:
a) Realizați graficul distribuției și interpretarea acestuia.
b) Calculați indicatorii tendinței centrale și interpretați valorile acestora.
c) Calculați cuartilele și interpretați valorile acestora.
d) Calculați media pentru caracteristica salariul <3500 lei.
e) Identificați dacă în eșantionul considerat sunt valori de tip outlier (valori aberante) .
Rezolvare:
a) Reprezentarea grafică
Analizând histograma seriei de date se poate observa faptul ca cei mai mulți salariați din domeniul
IT câștiga intre 3500 lei și 4500 lei, iar seria are o distribuție aproximativ normal (cele mai mari frecvențe se
găsesc în grupele din mijloc).
Unde:
xi= centru intervalului de variatie a variabilei,
xi = ,
Li = limita inferioară a intervalului,
Ls = limita superioară a intervalului.
Interpretare: În medie, un salariat a unei companii din domeniul IT are un salariu lunar de 3790,323 lei.
Observatie: Deoarece seria are tendință de normalitate (cele mai mari frecvențe se găsesc în centrul seriei) ,
media se află în intervalul căruia îi corespunde frecvența absolută maximă. =3790,323ϵ[3500.4500]
Modul:
Se determină intervalul cu frecvența absolute cea mai mare. În cazul nostru cea mare frecvență absolută este
120 intervalul modal fiind [3500, 4500).
Unde:
h=4500-3500=1000 este mărimea intervalului modal
1 = nMo – nMo-1 =120-70=50 ;
2 = nMo - nMo+1=120-35=85
Interpretare: Cei mai mulți salariați au avut salariul egal cu 3870,37 lei.
Determinarea Medianei:
lei
Interpretare: 50% dintre angajați au avut salariul mai mic de 3795,83 lei, iar 50% au avut salariul mai mare
de 3795,83 lei.
lei
Interpretare: 25% dintre angajați au avut salariul mai mic de 2896,42 lei, iar 75% au avut salariul mai mare
de 2896,42 lei.
Cuartila 2 = Mediana
Cuartila 3:
4500-5500 35 275
> 5500 35 310
Total 310 -
Intervalul cuartilei 3 va fi intervalul pentru care prima frecvență cumulată crescător este mai mare cu locul
cuartilei 3, astfel intervalul cuartilei 3 fiind [3500,4500)
4443,75 lei
Interpretare: 75% dintre angajați au avut salariul mai mic de 4443,75 lei, iar 25% au avut salariul mai mare
de 4443,75 lei.
Unde:
m - numărul de unități în stare favorabilă,
n - numărul total de unități din eșantion (volumul eșantionului) .
Salariul (lei) Media
Sub 3500 lei (DA) 50+70=120
Aproximativ 38,7% dintre salariați au salariul mai mic de 3500 lei, în timp ce 61,3% dintre salariați au
salariul mai mare sau egal cu 3500 lei.
e)Identificați dacă în eșantionul considerat sunt valori extreme de tip outlier
Identificarea valorilor aberante (outlier) se face parcurgând următoarele etape:
Cea mai mică dintre valorile seriei de date, cu proprietatea că este ,425 este
lei; limita sau marginea superioară a diagramei Box-Plot este cea mai
mare dintre valorile seriei de date cu proprietatea că este , adică:
Cea mai mare dintre valorile seriei de date, cu proprietatea că este , este 6500, deci
marginea superioară este egală cu
6500,
Se observă că intervalul cuprins între marginea inferioară și cea superioară diagramei Box-Plot, adică
intervalul de numere reale [1500; 6500] conține toate valorile observate seria nu conține valori extreme
(outlier) .
Observație: Având în vedere faptul că pentru determinarea mediei noi am închis seria de date cu
valoarea de 6500, respectiv nu cunoaștem cu exactitate care sunt valorile mai mari decât 5000, atunci putem
afirma că orice valoare mai mare decât poate fi considera că ca fiind valoare
extremă. Astfel, în cazul problemei noastre nu putem aprecia dacă avem valori extreme.