Sunteți pe pagina 1din 25

CURS 2

Sistematizarea datelor statistice


PREZENTAREA ŞI
REPREZENTAREA DATELOR
STATISTICE
Etapele cercetării statistice
1. Observarea- etapă în care se culeg date şi
informaţii statistice de la unităţile colectivităţii, pentru
toate caracteristicile urmărite;
2. Prelucrarea-etapă în care datele sunt sistematizate
şi sunt calculaţi indicatorii statistici primari şi derivaţi,
absoluţi şi sintetici ce caracterizează fenomenul
studiat;
3. Analiza şi interpretarea rezultatelor -etapă în care
sunt verificate ipotezele, formulate concluziile şi
fundamentate procesele decizionale.
A.1. Observarea statistică
 Definire:
 este înregistrarea după o metodologie unitară a

valorilor caracteristicilor pentru fiecare unitate


statistică din cadrul colectivităţii statistice cercetate,

 Are ca obiectiv culegerea datelor statistice primare


(individuale)
 Elementele care stau la bază sunt:
 Planul observării

 Tipul (Felul) observării

 Erorile de observare
A.1. Observarea statistică (continuare-2)
OBIECTIVUL investigaţiei

UNITATEA de observare
Probleme
METODOLOGICE PROGRAMUL observării

TIMPUL şi LOCUL observării

PURTĂTORII DE INFORMAŢII
PLANUL
observării
Elaborarea şi tipizarea
documentelor de înregistrare
Identificarea
obiectivului şi a unităţilor de observare
Probleme
ORGANIZATORICE Elaborarea purtătorilor de informaţii

Instruirea personalului ce va executa observarea


obiectivului şi a unităţilor de observare
Popularizarea observării
A.1. Observarea statistică (continuare-3)
O. Directă - chestionar
Modalităţi
de realizare a
observaţiei O. pe bază de documente

TIPUL Rapoarte statistice


observaţiei O. Totală Recensăminte

Metode Inventariere stocuri


de
observare Sondaj (Selecţie)
O. Parţială
Anchete
A.1. Observarea statistică (continuare-4)
ERORI de OBSERVARE

ERORI
de
ÎNREGISTRARE

E.R. SISTEMATICE

ERORI
de
REPREZENTATIVITATE
E.R. ÎNTÂMPLĂTOARE

E.R.Î. EFECTIVE

E.R.Î. PROBABILE
(eroare medie de selecţie şi eroarea limită)
A.2. Prelucrarea datelor statistice
 Sistematizarea datelor
 Centralizare

 Clasificare şi grupare

 Calculul indicatorilor
 Prezentarea rezultatelor sub forma:
 seriilor

 tabelelor

 graficelor
GRUPAREA ŞI CLASIFICAREA DATELOR
 Sistematizarea datelor constituie o metodă eficientă pentru a
căpăta o imagine generală asupra distribuţiei, concetrării /
împrăştierii valorilor
 Sistematizarea datelor se realizează prin gruparea şi
clasificarea datelor statistice
 Grupele/clasele trebuie să fie omogene
 Criteriul de grupare/clasificare –este dat de variabila
(caracteristica) statistică în funcţie de care sistematizăm
datele.
 Grupările sunt simple sau combinate în funcţie de numărul
criteriilor utilizate
 Rezultatul grupării datelor îl reprezintă seria de distribuţie
de frecvenţe

8
GRUPAREA ŞI CLASIFICAREA DATELOR
 Clasificarea = împărţirea unităţilor în clase/categorii (de obicei
cand sistematizarea se face dupa o variabila nenumerica)
 Prin numărarea unităților statistice ce se încadrează în fiecare clasă
se stabilește frecventa absolută a clasei.
 Frecvenţa absoluta a clasei =ni
 Frecvenţa relativă:indică proporția din numărul total de unități ,
*
care se încadrează în fiecare clasă= ni
 n= volumul total el eșantionului
Frecventa clasei
Frecventa relativa a clasei=
 Numarul total de observatii
ni
ni ni ni
n  r
*
i
 n *i%  100  100
n r
n
 in
i 1
n i
i 1
GRUPAREA DATELOR
 Gruparea reprezintă sistematizarea datelor după o
variabilă (caracteristică) numerică (discretă sau
continuă).
A. Dacă variabila este discretă şi cu un număr redus de
valori distincte (max. 10) sistematizarea datelor se
face prin gruparea pe variante, obţinându-se o serie de
distribuţie de frecvenţe pe variante.
Frecvenţa grupelor se stabileşte prin numărarea unită-
ţilor care iau aceeaşi valoare.
B. Dacă variabila numerică este discretă şi are un număr
mare de valori distincte sau este continuă
sistematizarea presupune gruparea pe intervale de
variaţie.
Gruparea datelor
 repartiţia de frecvenţe a unei variabile discrete se poate
prezenta si astfel: x x ... x 

X :
1 2 r

 n1 n2 ... n r 

 repartiţia de frecvenţe a unei variabile continue:
 x 1inf  X  x 1sup x 2inf  X  x 2 sup ... xrinf  X  x r sup 
X :  

 n1 n2 ... nr 
 sau:  x1 x2 ... xr 
X :  
 n1 n2 ... nr 

11
GRUPAREA DATELOR
 Se obţine o serie de distribuţie de frecvenţe pe intervale.
 Intervalul de variaţie reprezintă un şir de valori ale
variabilei studiate delimitat prin limita inferioară şi limita
superioară.
 Intervalele de variaţie pot fi de mărime egală sau neegală.
 Pentru gruparea pe intervale egale de variaţie se
recomandă utilizarea unui număr moderat de grupe (5-10
grupe).
 Pentru gruparea pe intervale neegale de variaţie se
recomandă utilizarea unui număr moderat de grupe (2-4
grupe).
 Numărul intervalelor depinde de numărul unităţilor statistice.
Gruparea datelor
În cazul seriilor de distribuţie de frecvenţe pe intervale se mai determină:

1. Centrul de interval = valoarea situată la jumătatea distanţei dintre limitele


intervalului şi este considerat reprezentativ pentru datele din interiorul
intervalului:
hi x x
sau xi  i inf 2 i sup , i  1, r .
xi  xi inf 
2
2. Frecvenţa absolută cumulată crescător a unei grupe (Fci) = numărul
unităţilor statistice care au valoarea variabilei mai mică sau egală cu limita
superioară a intervalului
i
Fci  n
k 1
k .
3. Frecvenţa relativă cumulată crescător a unei grupe ( Fci ) = procentul
*

unităţilor statistice care au valoarea variabilei mai mică sau egală cu limita
superioară a grupei:
i
Fci*  n
k 1
*
k .
4. Frecvenţe absolute şi relative cumulate descrescător = numărul sau
procentul unităţilor statistice care au valoarea variabilei mai mare sau egală cu
limita inferioară a intervalului

r r
Fdi   k i
nk , Fdi*  n
k i
*
k .
Gruparea datelor pe variante

Număr de unităţi
Categorii de confort de cazare turistica
(numar stele) (nI)

0 619

1 1059

2 1068

3 284

4 85

5 6

TOTAL 3121

14
Gruparea datelor pe variante

Număr de Frecvenţe Frecvenţe


Categorii de unităţi de absolute relative
% din total
confort cazare cumulate cumulate
ni*
(nr. stele) turistica (ni) crescător crescător
Fci (%)

0 619 19,9 619 19,9

1 1059 33,9 1678 53,8

2 1068 34,2 2746 88,0

3 284 9,1 3030 97,1

4 85 2,7 3115 99,8

5 6 0,2 3121 100

TOTAL 3121 100 - -

15
Gruparea datelor pe intervale de variaţie

Preţ de Repartizarea Frecvenţe


vânzare observaţiilor pe absolute de
(mil. lei) grupe aparitie-ni

[120-170) llll 4

[170-220) lllllllllllllllll 17

[220-270) lllllllllllll 13

[270-320) lllllllllll 11

[320-370) lllll 5

TOTAL – 50

16
Gruparea datelor pe intervale de variaţie

Distribuţia hotelurilor după capacitatea de cazare

Frecvenţe
Frecvenţe Frecvenţe relative
Capacitate de cazare Număr de cumulate
relative n
*
absolute cumulate
(locuri) hoteluri (ni) i
crescator
(%) crescator (Fci)
( Fci* ) (%)
Mai mică de [170- 190) 5 6.7 5 6.7
[190-210) 9 12.0 14 18.7
[210-230 12 16.0 26 34.7
[230-250 18 24.0 44 58.7
[250-270 22 29.3 66 88
[270-290 4 5.3 70 93.3
[290-310 2 2.7 72 96.0
310 şi peste[310-330) 2 2.7 74 98.7
1 1.3 75 100
TOTAL 75 100 — —

17
Reprezentarea grafică a seriilor de distribuţie
de frecvenţe pe intervale
 O serie de distribuţie de frecvenţe pe intervale de
variaţie se reprezintă grafic cu ajutorul histogramei şi a
poligonului frecvenţelor.
 Datele cantitative se pot reprezenta grafic utilizând
histograma frecvenţelor absolute sau relative, construită
într-un sistem de coordonate rectangulare.
 Pe abscisă sunt reprezentate intervalele de variaţie, iar
pe ordonată sunt reprezentate frecvenţele absolute
sau relative.
 Histograma se construieşte prin ridicarea unor
dreptunghiuri, fiecare dreptunghi fiind de lăţime egală cu
mărimea intervalului de grupare şi de înălţime egală cu
frecvenţa intervalului
Histograma

24

20

16
Numar de hoteluri

12

0
<170 170-190 190-210 210-230 230-250 250-270 270-290 290-310 310 si peste

Capacitate de cazare

Distribuţia hotelurilor după capacitatea de cazare


19
Forme ale distribuţiilor de frecvenţe

20
Distribuţia de frecvenţe
bidimensională
Intervale/variante
pentru Y y1 y2 ... yj ... ym Total
Intervale/
Variante pentru X
0 1 2

x1 n11 n12 ... n1j ... n1m n1 .


x2 n21 n22 ... n2j ... n2m n2 .
. ................... ...
. ni1 ni2 ... nij ... nim ni.
xi .................... ...
. nr1 nr2 ... nrj .... nrm nr .
.
xr
TOTAL n.1 n.2 .... n.j ... n.m n..

21
Diagramă de împrăştiere

3800

3400

3000
Incasari (mil. lei)

2600

2200

1800

1400

1000
10 12 14 16 18 20 22 24 26

Cheltuieli de promovare (mil. lei)

22
A.2. Prelucrarea datelor statistice
(continuare)
 SERIILE statistice
 Definire: două şiruri paralele de date statistice, în
care
- primul şir prezintă variaţia caracteristicii urmărite
- al doilea şir cuprinde frecvenţele de apariţie a
caracteristicii urmărite
 Clasificare după natura caracteristicilor :
a. - serii de repartiţie (distribuţie)
b. -serii cronologice (de timp)
c. - serii teritoriale
A.3. Analiza şi interpretarea
rezultatelor
 Compararea datelor
 Verificarea ipotezelor statistice
 Formularea concluziilor
 Fundamentarea calculelor
Clasificarea indicatorilor statistici
în raport cu etapele cercetării statistice
Indicatori de nivel
Modificări absolute

Indicatori absoluţi
INDICATORI
STATISTICI
Indicatori derivaţi

Mărimi Mărimi Indicatorii Indicatorii Indicatori Indici


relative medii variaţiei asimetriei corelaţiei statistici

S-ar putea să vă placă și