Documente Academic
Documente Profesional
Documente Cultură
Cuprins
3.1 Analiza grafică
3.2 Analiza numerică. Indicatori ai statisticii descriptive
3.3 Aplicaţie în SPSS
Obiective
- prezentarea tipurilor de frecvenţe utilizate în analiza uunei serii continue
- prezentarea tipurilor de grafice specifice unei serii continue
- definirea indicatorilor descriptivi, a proprietăţilor, a modului de calcul şi a interpretării acestora
- realizarea de exemple cu date reale
- prezentarea modului de analiză gafică şi numerică a unei serii continue în SPSS
Competenţe
- însuşirea principalelor metode de analiză grafică şi numerică a unei serii continue
- dezvoltarea abilităţilor practice de prelucrare şi interpretare a datelor statistice sistematizate într-o
serie continuă
- dezvoltarea capacităţii de utilizare a softului statistic pentru prelucrarea automată a datelor
- capacitatea de a realiza o sinteză a informaţiei statistice, având la dispoziţie rezultatele analizei
grafice şi numerice
Termen mediu: 4 h
Bibliografie
1. Andrei, T. şi Stancu, S., Statistică - teorie şi aplicaţii , Editura All, Bucureşti, 1995
2. Jaba, E., Statistica, Ediţia a treia, Editura Economica, Bucureşti, 2002
3. Jaba, E., Pintilescu, C., Statistică. Teste grilă şi probleme, Editura Sedcom Libris, Iaşi, 2005.
4. Lecaillon, J.; Labrousse, C., Statistique descriptive, Editura Cujas, Paris, 1988
5. Mills, Fr.G., Statistical Methods, 3rd ed., Henry Holt, New York, 1955.
6. McNabb, D., Research methods in public administration and nonprofit management : quantitative
and qualitative approaches, Armonk, M.E. Sharpe, 2002
7. Tövissi, L.; Isaic-Maniu, Al., Statistica, A.S.E., Bucureşti, 1984.
8. Yule, U.G.; Kendall, M.C. - Introducere în teoria statisticii, Editura Ştiinţifică, Bucureşti, 1969.
9. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.
Caracterizarea unităţilor statistice observate după o variabilă continuă se realizează folosind
metode grafice sau numerice.
Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei), înregistrată
în luna octombrie 2009, este prezentată în tabelul de mai jos:
Tabelul 3.1. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
până la 10 20
10-20 40
20-30 35
30-40 15
peste 40 10
TOTAL 110
Rezolvare
Închiderea intervalelor de variaţie
Mărimea intervalelor de variaţie este l=10. Limita inferioară a primului interval de variaţie
se închide luând în considerare aceeaşi mărime, deci: 10-10=0. Limita superioară a ultimului
interval de variaţie este: 40+10=50.
Interpretare
Un număr de 20 firme au realizat vânzări de până la 10 mil. Lei ( N 1 ). Un număr de 60
firme au realizat vânzări de până la 20 mil. Lei ( N 2 ). În mod similar se interpretează celelalte
valori din tabelul de mai sus.
Din numărul total al firme, 10 firme au realizat vânzări de peste 40 mil. Lei. Un număr de 25
de firme au realizat vânzări de peste 30 mil. Lei. În mod similar se interpretează celelalte valori din
tabelul de mai sus.
Observaţie
În interpretarea frecvenţelor absolute cumulate crescător se consideră limita superioară a
intervalului de variaţie, iar în interpretarea frecvenţelor absolute cumulate descrescător se consideră
limita inferioară a intervalului de variaţie.
Interpretare
Ponderea firmelor care au realizat vânzări de până la 10 mil. Lei ( F1 ) este de 16,67%.
Ponderea firmelor care au realizat vânzări de până la 20 mil. Lei ( F2 ) este de 50%. În mod similar
se interpretează celelalte valori din Tabelul 3.3.
Ponderea firmelor care au realizat vânzări de peste 40 mil. Lei este de 8,33%. 20,83% din
numărul total al firmelor au realizat vânzări de peste 30 mil. Lei. În mod similar se interpretează
celelalte valori din Tabelul 3.3.
Histogram
5
Frequency
3
0
4,00 6,00 8,00 10,00
Poligonul frecvenţelor
Construirea poligonului frecvenţelor presupune găsirea locului geometric al punctelor Ai de
coordonate ( xi' , ni ) sau ( xi' , ni ) şi unirea acestora prin segmente de dreaptă. Valorile x i' reprezintă
mijlocul sau centrul intervalelor de variaţie, calculat ca medie aritmetică simplă a limitelor
intervalelor de variaţie:
x xi
xi' i 1 .
2
Curba frecvenţelor
Construirea curbei frecvenţelor presupune ajustarea printr-o linie curbă, continuă a
poligonului frecvenţelor. Curba frecvenţelor pentru o distribuţie normală este reprezentată în figura
de mai jos:
4
Frequency
0
4,00 6,00 8,00 10,00
Nota
75%
Percent
50%
25%
0%
5 6 7 8 9
nota
a. Media aritmetică
Media aritmetică pentru o serie statistică după o variabilă continuă se calculează după
relaţia:
xi' ni xi 1 xi
i
x , unde xi' .
ni 2
i
Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei), înregistrată
în luna octombrie 2009, este prezentată în tabelul de mai jos:
Tabelul 3.4. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
- 10 20
10-20 40
20-30 35
30-40 15
peste 40 10
TOTAL 110
Rezolvare
xi' ni xi 1 xi
i
Media aritmetică se calculează după relaţia x , unde xi' .
ni 2
i
x0 x1 0 10
Centrul intervalelor de variaţie se calculează astfel: x1' 5;
2 2
x1 x 2 10 20
x'2 15 etc.
2 2
Elementele pentru calculul mediei aritmetice sunt prezentate în tabelul de mai jos:
Interpretare
Valoarea medie a vânzărilor zilnice realizate în luna octombrie 2009 de firmele din judeţul
Iaşi este de 21,25 milioane lei.
b. Modul (Mo)
Pentru aflarea modului în cazul unei variabile continue, trebuie parcurse următoarele etape:
se află frecvenţa maximă, nimax;
în dreptul acestei frecvenţe maxime, se citeşte intervalul modal (xi-1, xi);
în acest interval, modul se află prin interpolare, după relaţia:
1
Mo xi 1 d , unde:
1 2
xi-1, reprezintă limita inferioară a intervalului modal;
d este mărimea intervalului modal, d= xi - xi-1;
1 este diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului anterior:
1 ni max ni 1 ;
2 este diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului următor:
1 ni max ni 1 .
]
Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei), înregistrată
în luna octombrie 2009, este prezentată în tabelul de mai jos:
Tabelul 3.6. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
0- 10 20
10-20 40
20-30 35
30-40 15
40-50 10
TOTAL 110
Rezolvare
Etapele aflării modului sunt:
se află frecvenţa maximă, nimax=40;
în dreptul acestei frecvenţe maxime se citeşte intervalul modal (10-20);
în acest interval, modul se află prin interpolare, după relaţia:
1
Mo xi 1 d , unde:
1 2
xi-1 =10;
d= xi - xi-1 =20-10=10 ;
1 ni max ni 1 40 20 20 ;
1 ni max ni 1 40 35 5 .
Înlocuind în relaţia de mai sus, se obţine:
( 40 20 )
Mo 10 10 18 mil. Lei.
( 40 20 ) ( 40 35 )
Interpretare
Cele mai multe firme din judeţul Iaşi au realizat în luna octombrie 2009 vânzări zilnice de
18 mil. Lei.
c. Mediana (Me)
Aflarea medianei presupune parcurgerea următoarelor etape:
ni
Me
se calculează unitatea mediană: U i ;
2
se calculează frecvenţele absolute cumulate crescător, Ni↓;
se află prima valoare Ni↓≥UMe;
în dreptul primei valori Ni↓≥UMe, se citeşte intervalul median: (xi-1, xi);
în acest interval, mediana se află prin interpolare după relaţia:
U Me N i 1
Me xi 1 d , unde:
ni
xi-1, reprezintă limita inferioară a intervalului median;
d este mărimea intervalului median, d= xi - xi-1;
N i 1 este frecvenţa absolută cumulată corespunzătoare intervalului anterior intervalului median;
ni este frecvenţa absolută corespunzătoare intervalului median.
Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei), înregistrată
în luna octombrie 2009, este prezentată în tabelul de mai jos:
Tabelul 3.7. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
0- 10 20
10-20 40
20-30 35
30-40 15
40-50 10
TOTAL 120
Rezolvare
Etape pentru aflarea medianei:
ni
120
Me i
se calculează unitatea mediană: U 60 ;
2 2
se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
1. Quartilele
Quartila unu (Q1)
Aflarea quartilei unu presupune parcurgerea următoarelor etape:
ni
Q1
se calculează unitatea quartilică unu: U i ;
4
se calculează frecvenţele absolute cumulate crescător, Ni↓;
se află prima valoare Ni↓≥UQ1;
în dreptul primei valori Ni↓≥UQ1, se citeşte intervalul quartilic unu: (xi-1, xi);
în acest interval, quartila unu se află prin interpolare după relaţia:
U Q1 N i 1
Q1 xi 1 d , unde:
nQ1
xi-1, reprezintă limita inferioară a intervalului quartilic unu;
d este mărimea intervalului quartilic unu, d= xi - xi-1;
N i 1 este frecvenţa absolută cumulată corespunzătoare intervalului anterior intervalului quartilic
unu;
nQ1 este frecvenţa absolută corespunzătoare intervalului quartilic unu.
Profit
N Valid 120
Mean 21.2500
Median 20.3333
Mode 15.00
Std. Deviation 11.52728
Variance 132.878
Skew ness .442
Kurtosis -.484
Percentiles 10 5.6667
20 9.6667
25 11.6667
30 13.6667
40 17.1333
50 20.3333
60 23.5333
70 27.6000
75 30.0000
80 32.4000
90 39.4000
Histogram
50
40
Frequency
30
20
10
Mean = 21.25
Std. Dev. = 11.52728
0 N = 120
0.00 10.00 20.00 30.00 40.00 50.00
Profit
Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei) înregistrată în
luna octombrie 2009 este prezentată în tabelul de mai jos:
Tabelul 3.9. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
0- 10 20
10-20 40
20-30 35
30-40 15
40-50 10
TOTAL 120
Rezolvare
Quartila unu
Etape pentru aflarea quartilei unu:
120
ni
Q1 i
se calculează unitatea quartilică unu: U 30 ;
4 4
se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
Tabelul 3.10. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
xi-1-xi ni Ni
0- 10 20 20
10-20 40 60
20-30 35 95
30-40 15 110
40-50 10 120
TOTAL 120 -
Quartila trei
3 ni
Q3 i 3 120
se calculează unitatea quartilică trei: U 90 ;
4 4
Q1
prima valoare Ni↓=95 ≥U =90;
în dreptul acestei valori se citeşte intervalul quartilic trei: (20-30);
în acest interval, quartila trei se află prin interpolare după relaţia:
U Q3 N i 1
Q3 xi 1 d , unde:
nQ3
xi-1=20;
d= xi - xi-1=30-20=10;
N i 1 60 ;
ni = 35.
90 60
Înlocuind în relaţia de mai sus, se obţine: Q3 20 10 28,57 mil. Lei.
35
Interpretare
75% din numărul total al firmelor din judeţul Iaşi au realizat vânzări zilnice de până la 28,57
mil. Lei, iar 25% au realizat vânzări zilnice de peste 28,57 mil. Lei.
3.2.2. Indicatori ai dispersiei
Principalii indicatori ai dispersiei sunt:
1. Amplitudinea de variaţie
Amplitudinea de variaţie măsoară distanţa dintre nivelul maxim şi nivelul minim al unei
variabile. Se calculează pe baza relaţiei:
A xmax xmin .
2. Varianţa
Varianţa se calculează pe baza relaţiei:
( xi' x )2 ni
s2 i . Varianţa nu are unitate de măsură şi nu se interpretează.
ni
i
4. Coeficientul de variaţie
Coeficientul de variaţie se calculează după relaţia:
s
v 100 .
x
Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei) înregistrată în
luna octombrie 2009 este prezentată în tabelul de mai jos:
Rezolvare
Abaterea standard
Abaterea standard se calculează pe baza relaţiei:
( xi' x )2 ni
s s2 i
.
ni
i
Pentru această distribuţie, media aritmetică este x 21,25 mil. Lei.
Elementele de calcul ale abaterii standard sunt prezentate în tabelul de mai jos:
Interpretare
Vânzările zilnice ale firmelor din judeţul Iaşi, realizate în luna octombrie 2009, variază, în
medie, de la nivelul mediu al vânzărilor zilnice, cu ± 11,48 mil. Lei.
Coeficientul de variaţie
Coeficientul de variaţie se calculează după relaţia:
s 11,48
v 100 100 54,02% .
x 21,25
Interpretare
Valoarea coeficientului de variaţie arată că distribuţia firmelor după valoarea vânzărilor
zilnice realizate în luna octombrie 2009 este o distribuţie eterogenă, caracterizată printr-o dispersie
mare (v>50%). Media nu este reprezentativă pentru această distribuţie.
Asimetria
Indicatorii asimetriei se calculează, în cazul unei variabile continue, astfel:
1. Asimetria în mărime absolută
Asimetria în mărime absolută poate fi calculată pe baza relaţiei:
As x Mo .
Modul de interpretare este identic cu cel prezentat în cazul variabilelor discrete.
Boltirea
Indicatorii boltirii se calculează după relaţiile
1. Coeficientul de boltire Pearson
Coeficientul de boltire Pearson se calculează pe baza relaţiei:
2 42 44 , unde:
2 s
( xi' x )4 ni
i
4 reprezintă momentul centrat de ordinul 4.
ni
i
O valoare a coeficientului de boltire Pearson 2 3 arată o distribuţie mezocurtică. O
valoare 2 3 arată o distribuţie leptocurtică iar o valoare 2 3 arată o distribuţie platicurtică.
Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei) înregistrată în
luna octombrie 2009 este prezentată în tabelul de mai jos:
Tabelul 3.14. Elemente de calcul ale momentelor centrate de ordinul doi şi trei
xi-1-xi ni x i' x i' x ( xi' x ) 2 ( x i' x ) 2 ni ( xi' x )3 ( xi' x )3 ni
0 – 10 20 5 -16,25 264,06 5281,25 -4291,02 -85820,31
10-20 40 15 -6,25 39,06 1562,50 -244,14 -9765,63
20-30 35 25 3,75 14,06 492,19 52,73 1845,70
30-40 15 35 13,75 189,06 2835,94 2599,61 38994,14
40-50 10 45 23,75 564,06 5640,63 13396,48 133964,84
TOTAL 120 - - - 15812,50 - 79218,75
Interpretare
Valoarea coeficientului de asimetrie Pearson arată că distribuţia dată prezintă o asimetrie (
1 0 ) la dreapta (µ3>0).
Interpretare
Valoarea coeficientului de boltire Pearson arată că distribuţia dată este o distribuţie
platicurtică ( 2 3 ).
Folosind programul informatic SPSS (Statistical Package for Social Sciences), se cere să se
determine şi să se interpreteze mărimile medii, quartila 1 şi quartila 3, decila 1 şi decila 9,
indicatorii dispersiei şi indicatorii formei unei distribuţii.
Tabelul 3.16. Distribuţia judeţelor României după rata şomajului, în anul 2010
Rezolvare
Valorile indicatorilor descriptivi sunt prezentate în tabelul 3.17.
Interpretare
Media aritmetică arată că, în medie, un judeţ are o rată a şomajului de 7.8927%.
Mediana arată că 50% dintre judeţe au o rată a şomajului mai mică de 8.1%, inclusiv, iar
50% dintre judeţe au rata şomajului mai mare de 8.1%, inclusiv.
Modul arată că cel mai frecvent, judeţele au o rată a şomaului de 5.8%.
Abaterea standard arată că, în medie, rata şomajului unui judeţ se abate de la rata medie a
şomajului cu 1.96652%.
Coeficientul de asimetrie Fisher arată că distribuţia este asimetrică la stânga.
Coeficientul de boltire Fisher arată că distribuţia este leptocurtică.
Amplitudinea variaţiei arată că diferenţa maximă dintre ratele şomajului a două judeţe este
de 9.1%.
Decila 1 arată că 10% dintre judeţe au rata şomajului mai mică de 5.32% inclusiv, iar 90%
dintre judeţe au rata şomajului mai mare de 5.32%, inclusiv.
Quartila 1 arată că 25% dintre judeţe au au rata şomajului mai mică de 6.4% inclusiv, iar
75% dintre judeţe au rata şomajului mai mare de 6.4%, inclusiv.
Quartila 3 arată că 75% dintre judeţe au rata şomajului mai mică de 9.35% inclusiv, iar 25%
dintre judeţe au rata şomajului mai mare de 9.35%, inclusiv.
Decila 9 arată că 90% dintre judeţe au rata şomajului mai mică de 10.34% inclusiv, iar 10%
dintre judeţe au rata şomajului mai mare de 10.34%, inclusiv
Teste1
1) Histograma este:
a) specifică seriilor continue
b) o medie specială
c) o suprafaţă
3) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($) s-au obţinut rezultatele
din tabelul de mai jos.
Statistics
Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Median $28,000.00
Mode $30,500
Std. Deviation $17,000.000
Percentiles 25 $24,000.00
50 $28,000.00
75 $37,000.00
1
Răspunsuri: 1- a,c; 2 – a,b; 3 - a; 4 – b; 5 – c.
4) Pentru repartiţia de mai jos, quartila 1 are valoarea:
xi-1-xi ni
0- 10 20
10-20 40
20-30 35
30-40 15
40-50 10
TOTAL 120
a) 10
b) 12,5
c) 25