Sunteți pe pagina 1din 55

STATISTICĂ ĨN SPSS

Curs 2- 22 februarie 2021

Rezumarea tabelară a datelor statistice


Rezumarea grafică a datelor statistice
Rezumarea tabelară a datelor
Exemplu: datele referitoare la
salariile iniţiale ale absolvenţilor de
facultate

Datele referitoare la 80 de absolvenţi


 Volum mare de date
 Incomoditate
 Dacă ne interesează ceva anume ? Ce facem ?
Absolvent Specializarea Salariu iniţial (lei) Absolvent Specializarea Salariu iniţial (lei)

. 1 Finanţe 1550 21 Management 1380

2 Management 1310 22 Marketing 1730

3 Management 1575 23 Management 1640

4 Marketing 1675 24 Contabilitate 2000

5 Contabilitate 1585 25 Marketing 1400

6 Marketing 1590 26 Management 1325

7 Management 1580 27 Contabilitate 1900

8 Contabilitate 1475 28 Marketing 1600

9 Management 1300 29 Contabilitate 1600

10 Finanţe 1650 30 Contabilitate 1555


11 Contabilitate 1565 31 Marketing 1700

12 Marketing 1320 32 Marketing 1380

13 Finanţe 1750 33 Management 1620

14 Contabilitate 1725 34 Contabilitate 1650

15 Marketing 1650 35 Contabilitate 2000


16 Management 1740 36 Finanţe 1455

17 Contabilitate 1650 37 Contabilitate 1625

18 Contabilitate 1875 38 Management 1340

19 Marketing 1620 39 Contabilitate 1530

20 Finanţe 1550 40 Finanţe 1410


.
Absolvent Specializarea Salariu iniţial (lei) Absolvent Specializarea Salariu iniţial (lei)
41 Finanţe 1590 61 Management 1775
42 Contabilitate 1570 62 Finanţe 2025
43 Contabilitate 2015 63 Marketing 1450
44 Management 1620 64 Management 1425
45 Finanţe 1860 65 Management 1820
46 Marketing 1625 66 Management 1900
47 Management 2000 67 Contabilitate 1700
48 Marketing 1850 68 Management 1900
49 Finanţe 1640 69 Contabilitate 1475
50 Marketing 1900 70 Contabilitate 1850
51 Contabilitate 1450 71 Management 1500
52 Contabilitate 1815 72 Finanţe 1620
53 Marketing 1440 73 Management 1600
54 Management 1420 74 Finanţe 1580
55 Management 1550 75 Contabilitate 1705
56 Contabilitate 1550 76 Management 1780
57 Contabilitate 1660 77 Management 1400
58 Contabilitate 1760 78 Contabilitate 1550
59 Marketing 1550 79 Contabilitate 1390
60 Management 1650 80 Management 1600
Întrebări posibile

 Câţi absolvenţi ai fiecărei specializări în parte au fost


chestionaţi?
 Care este salariul cel mai mare?
 Dar cel mai mic?
 Cărei specializări îi aparţine salariul maxim/ salariul
minim?
 ....
Distribuţia de frecvenţă

 Una dintre cele mai utile metode de rezumare a unei


mulţimi de date

 Prezentare tabelară a unei mulţimi de date care arată


frecvenţa de itemi din fiecare dintre clasele diferite
care au fost luate în calcul
Distribuţia de frecvenţă pentru salariile iniţiale ale absolvenţilor facultăţii

Salariul iniţial (lei) Numărul de absolvenţi

Cel puţin 1300, dar sub 1400 8

Cel puţin 1400, dar sub 1500 11

Cel puţin 1500, dar sub 1600 17

Cel puţin 1600, dar sub 1700 19

Cel puţin 1700, dar sub 1800 10

Cel puţin 1800, dar sub 1900 6

Cel puţin 1900, dar sub 2000 4

Cel puţin 2000, dar sub 2100 5

Total 80
Distribuţia de frecvenţă a salariilor iniţiale ale absolvenţilor
specializării Contabilitate

Salariul iniţial (lei) Numărul de absolvenţi

Cel puţin 1300, dar sub 1400 1

Cel puţin 1400, dar sub 1500 3

Cel puţin 1500, dar sub 1600 7

Cel puţin 1600, dar sub 1700 5

Cel puţin 1700, dar sub 1800 4

Cel puţin 1800, dar sub 1900 3

Cel puţin 1900, dar sub 2000 1

Cel puţin 2000, dar sub 2100 3

Total 27
Distribuţia de frecvenţă a salariilor iniţiale ale absolvenţilor facultăţii

Salariul iniţial (lei) Numărul de absolvenţi

Cel puţin 1300, dar sub 1700 55

Cel puţin 1700, dar sub 2100 25

Total 80

 Imagine neclară deoarece tabelul nu oferă prea


multă informaţie
Distribuţia de frecvenţă pe tipuri de absolvenţi ai facultăţii studiate

Specializarea absolvită Frecvenţa

Contabilitate 27

Finanţe 12

Management 25

Marketing 16

Total 80
Construcţia distribuţiei de
frecvenţă
 Nu există reguli propriu-zise
 Obiectivul este prezentarea datelor în
formă tabelară astfel încât să conţină cât
mai multă informaţie şi să nu
dezinformeze cititorul
 Tabelul va fi impărţit în mai multe clase
 Dimensiunea claselor ar trebui să fie
egală
 Numărul claselor nu trebuie să fie nici
prea mare, nici prea mic
Număr aproximativ al claselor

 Ar fi ideal să avem între 5 şi 20 de clase


 Numărul total al claselor se calculează folosind
expresie: (cea mai mare valoare – cea mai mică valoare)
/ dimensiunea clasei
 (2025 - 1300) / 100 = 7,5 => 8 clase

SAU…
Număr aproximativ al claselor

 Se calculeaza amplitudinea (rangul):


A = xmax – xmin = 2025 – 1300 = 725
 Se aplica formula lui Sturges pentru stabilirea numarului
de grupe:
r = 1 + 3.322 * lg n = 1 + 3.322 * lg 80 = 7.322 => 7 clase
 Se determina marimea intervalului de grupare:
h = A / r = 103.57

Se stabilesc intervalele de variatie si se efectueaza gruparea.


Capetele tabelului

 După cum observăm, în tabele avem “cel puţin 1300 dar


sub 1400”, “cel puţin 1400 dar sub 1500”, ....
 Avem deci intervalele [1300, 1400), [1400, 1500), .....
Interpretare

 8 absolvenţi au salariul iniţial cuprins între 1300 şi 1400


 Cei mai mulţi absolvenţi au un salariu cuprins între 1600
şi 1700
“Tipuri” de frecvenţe

 Distribuţia de frecvenţă discutată până acum a fost


construită pe baza unor date:
 Numerice (cantitative)
 Calitative

Identificati tabelele in functie de tipul datelor!


Distribuţia relativă de
frecvenţă

 Frecvenţa unei clase – numărul total de itemi din


mulţimea de date care aparţin clasei respective
 Frecvenţa relativă a itemilor – fracţiunea din totalul
itemilor care aparţine unei anumite clase
 Frecvenţa relativă a clasei = (Frecvenţa clasei / n)
Distribuţia de frecvenţă relativă pentru salariile iniţiale ale
absolvenţilor facultăţii

Salariul iniţial (lei) Frecvenţa Frecvenţa relativă

Cel puţin 1300, dar sub 1400 8 8/80 = 0,10000

Cel puţin 1400, dar sub 1500 11 11/80 = 0,1375

Cel puţin 1500, dar sub 1600 17 17/80 = 0,2125

Cel puţin 1600, dar sub 1700 19 19/80 = 0,2375

Cel puţin 1700, dar sub 1800 10 10/80 = 0,1250

Cel puţin 1800, dar sub 1900 6 6/80 = 0,0750

Cel puţin 1900, dar sub 2000 4 4/80 = 0,0500

Cel puţin 2000, dar sub 2100 5 5/80 = 0,0625

Total 80 1
Distribuţia de frecvenţă relativă pe tipuri de absolvenţi ai facultăţii
studiate

Specializarea Frecvenţa Frecvenţa relativă

Contabilitate 27 27/80 = 0,3375

Finanţe 12 12/80 = 0,1500

Management 25 25/80 = 0,3125

Marketing 16 16/80 = 0,2000

Total 80 1
Interpretare

 0,0625  6,25 % din cei 80 de absolvenţi au salarii


cuprinse între 2000 şi 2100
 0,3375 33,75 % din cei 80 absolvenţi au studiat
Contabilitatea
Distribuţia cumulativă de
frecvenţă
 Este una dintre variantele derivate din
distribuţia de frecvenţă
 Este utilă uneori în procesul rezumării
unei mulţimi de date
 cuprinde acelaşi număr de clase ca şi
distribuţia de frecvenţă, doar că
pentru fiecare dintre aceste clase ea
indică totalul itemilor care sunt mai
mici decât limita superioară a clasei
Exemplu

 Ne referim la exemplul salariilor iniţiale ale


absolvenţilor facultăţii cu profil economic
 Au fost culese 80 de date, provenite de la 80 de
absolvenţi
 Tabelul următor arată distribuţia cumulativă de
frecvenţă
Distribuţia de frecvenţă pentru salariile
iniţiale ale absolvenţilor facultăţii

Salariul iniţial (lei) Numărul de absolvenţi

Cel puţin 1300, dar sub 1400 8

Cel puţin 1400, dar sub 1500 11

Cel puţin 1500, dar sub 1600 17

Cel puţin 1600, dar sub 1700 19

Cel puţin 1700, dar sub 1800 10

Cel puţin 1800, dar sub 1900 6

Cel puţin 1900, dar sub 2000 4

Cel puţin 2000, dar sub 2100 5

Total 80
Tabel care arată distribuţia
cumulativă de frecvenţă
Salariul iniţial (lei) Frecvenţa cumulativă

Mai mic de 1400 8

Mai mic de 1500 19

Mai mic de 1600 36

Mai mic de 1700 55

Mai mic de 1800 65

Mai mic de 1900 71

Mai mic de 2000 75

Mai mic de 2100 80


Observaţii

 Clasele pentru distribuţia cumulativă


de frecvenţă nu au o limită inferioară
 Ele sunt deschise la valori oricât de
mici ale itemilor
 Dacă avem informaţii despre o
distribuţie de frecvenţă, putem
calcula rapid distribuţia cumulativă de
frecvenţă prin simpla însumare a
claselor de frecvenţă (temă de
seminar)
Noi perspective de a privi
datele
 un număr de 55 dintre absolvenţi câştigă mai puţin de
1700 lei
 36 dintre aceştia câştigă mai puţin de 1600 lei
 19 câştigă mai puţin de 1500 lei
 8 câştigă mai puţin de 1400 lei
Aceeaşi informaţie poate fi
obţinută din distribuţia de
frecvenţă,
dar nu fără să efectuăm o serie de calcule
suplimentare
Distribuţia cumulativă de
frecvenţă relativă
 distribuţia cumulativă de frecvenţă
relativă este cea care arată fracţiunea
itemilor a căror valoare este mai mică
decât limita superioară menţionată a
clasei
 poate fi obţinută din distribuţia de
frecvenţă relativă în acelaşi mod în
care distribuţia cumulativă de
frecvenţă se poate deduce din
distribuţia de frecvenţă (temă de
seminar)
Observaţie

 distribuţia cumulativă de frecvenţă relativă poate fi


obţinută şi prin împărţirea frecvenţelor cumulative
prin numărul de itemi din mulţimea de date.
 Tabelul următor conţine distribuţia cumulativă de
frecvenţă relativă pentru salariile iniţiale ale
absolvenţilor facultăţii.
Tabel care arată distribuţia
cumulativă de frecvenţă relativă
Salariul iniţial (lei) Frecvenţa cumulativa relativa

Mai mic de 1400 0,1000

Mai mic de 1500 0,2375

Mai mic de 1600 0,4500

Mai mic de 1700 0,6875

Mai mic de 1800 0,8125

Mai mic de 1900 0,8875

Mai mic de 2000 0,9375

Mai mic de 2100 1,0000


Reprezentarea grafică a
distribuţiilor de frecvenţă
 Distributia de frecvenţa absoluta,
frecvenţa relativă, frecvenţa
cumulativă şi cumulativă de
frecvenţă relativă sunt proceduri
tabelare de rezumare a datelor
 pot fi utilizate pentru creşterea
gradului de înţelegere a informaţiilor
conţinute în mulţimea de date

! Rezumarea grafică oferă adesea


informatii suplimentare cu privire la
natura mulţimii de date
Rezumarea grafică a datelor
statistice
Moduri de reprezentare a
datelor statistice
 Pentru variabilele numerice
- Graficele prin coloane
- Graficele prin benzi
- Cronograma
- Cartograma
- Diagramele de distributie
- Corelograma
 Pentru variabilele nenumerice
- Diagrama prin coloane
- Diagrama de structura
Diagramele de distributie

! Se aplica seriilor de repartitie de frecvente


 Histograma
 Poligonul de frecventa
 Ogiva
Histograma

 Este cea mai obişnuită formă de


reprezentare grafică a distribuţiei de
frecvenţă
 Este construită prin plasarea claselor
pe axa orizontală şi a frecvenţelor pe
axa verticală
 Fiecare clasă este reprezentată pe
grafic ca un dreptunghi care are baza
în intervalul corespunzător clasei şi
înălţimea corespunzătoare frecvenţei
clasei respective
Distribuţia de frecvenţă pentru
salariile iniţiale
Salariul iniţial (lei) Numărul de absolvenţi

Cel puţin 1300, dar sub 1400 8

Cel puţin 1400, dar sub 1500 11

Cel puţin 1500, dar sub 1600 17

Cel puţin 1600, dar sub 1700 19

Cel puţin 1700, dar sub 1800 10

Cel puţin 1800, dar sub 1900 6

Cel puţin 1900, dar sub 2000 4

Cel puţin 2000, dar sub 2100 5

Total 80
Histograma pentru datele iniţiale
Observaţii

 salariile iniţiale cu cea mai mare frecvenţă sunt


repartizate în intervalul 1600 – 1700
 frecvenţa salariilor descreşte de o parte şi de alta a
acestui nivel
Poligonul de frecvenţă

 este o alternativă la histogramă, ca manieră de


prezentare a distribuţiei de frecvenţă în formă grafică
 valorile datelor sunt poziţionate pe axa orizontală şi
frecvenţele pe axa verticală
Particularităţi de construcţie

 În loc să utilizăm dreptunghiuri ca în


cazul histogramei, determinăm punctul
de mijloc al clasei pe axa orizontală şi
reprezentăm direct punctul care
corespunde acestui mijloc al clasei şi
frecvenţei clasei respective
 Clasa de frecvenţă zero este adăugată de
fiecare dată în reprezentarea poligonului
de frecvenţă de ambele părţi ale acestuia
 Poligonul de frecvenţă este construit în
final prin unirea punctelor rezultate
Poligonul de frecvenţă

20
18
Numărul de absolvenţi

16
14
12
10
8
6
4
2
0
1300 1400 1500 1600 1700 1800 1900 2000 2100
Salariul iniţial
Observaţii

 Poligonul de frecvenţă şi histograma pe care le-am


reprezentat se bazează pe distribuţia de frecvenţă
 Le putem reprezenta pe baza distribuţiei frecvenţei
relative (temă de seminar)
Ogiva

 Este reprezentarea grafică a unei distribuţii cumulative


de frecvenţă, sau a unei distribuţii cumulative de
frecvenţă relativă
 Valorile datelor sunt poziţionate pe axa orizontală şi
frecvenţele cumulate pe axa verticală
Cum facem reprezentarea?

 Un punct este reprezentat exact


deasupra fiecărei limite superioare a
clasei, la înălţimea care corespunde
frecvenţei cumulate pentru respectiva
limită superioară de clasă.
 Un punct suplimentar este apoi
reprezentat corespunzător limitei
inferioare a primei clase, la înălţime
zero – deci pe axa orizontală
Apoi

 Toate aceste puncte sunt unite printr-o linie dreaptă


 Această linie dreaptă permite aproximarea frecvenţei
cumulative între limitele claselor prin interpolare
Ogiva pentru salariile iniţiale

90
80
Frecvenţa cumulativă

70
60
50
40
30
20
10
0
1300 1400 1500 1600 1700 1800 1900 2000
Salariul iniţial
Aplicație

 Se consideră următoarele date privind numărul de


minute acordate clienților unei banci intr-o zi:

5 2 11 12
8 5 12 21
9 6 14 23
12 8 15 24
Cerințe:

 Folosind datele din tabelul precedent, începând


formarea claselor de la valoarea 0 si marimea
intervalului 5, construiți următoarele distribuții de
frecvență:
a. Distribuția de frecvență absolută
b. Distribuția de frecvență relativă
c. Distribuția de frecvență cumulativă
d. Distribuția de frecvență cumulativă relativă
Distribuția de frecvență
absolută
Intervalul (clasa) Frecvența absolută
[0, 5) 1
[5, 10) 6
[10, 15) 5
[15, 20) 1
[20, 25) 3
Total 16
Distribuția de frecvență
relativă
Intervalul (clasa) Frecvența absolută Frecvența relativă
[0, 5) 1 1/16 = 0,0625
[5, 10) 6 6/16 = 0,375
[10, 15) 5 5/16 = 0,3125
[15, 20) 1 1/16 = 0,0625
[20, 25) 3 3/16 = 0,1875
Total 16 1
Distribuția de frecvență
cumulativă
Intervalul (clasa) Frecvența absolută Frecvența cumulativă
<5 1 1
< 10 6 7 =1+6
< 15 5 12 = 1 + 6 + 5
< 20 1 13 = 1 + 6 + 5 + 1
< 25 3 16 = 1 + 6 + 5 + 1 + 3
Total 16
Distribuția de frecvență
cumulativă relativă
Intervalul (clasa) Frecvența cumulativă Frecvența cumulativă relativă
<5 1 1/16 = 0,0625
< 10 7 7/16 = 0,4375
< 15 12 12/16 = 0,75
< 20 13 13/16 = 0,8125
< 25 16 16/16 = 1
Distribuția de frecvență
relativă
Intervalul Frecvența Frecvența cumulativă relativă
(clasa) relativă
<5 0,0625 0,0625
(0.0625)
< 10 0,375 0,4375
(0,0625 + 0,375)
< 15 0,3125 0,7500
(0,0625 + 0,375 + 0,3125)
< 20 0,0625 0,8125
(0,0625 + 0,375 + 0,3125 + 0,0625)
< 25 0,1875 1
(0,0625 + 0,375 + 0,3125 + 0,0625 + 0,1875)
Va multumesc!

 What can a pie chart be used for?

S-ar putea să vă placă și