Sunteți pe pagina 1din 38

CURS 3-4

PREZENTAREA DATELOR STATISTICE


1. Tipurile de caractere
1.1. Caracterele calitative
1.2. Caracterele cantitative

2. Gruparea, descrierea şi prezentarea datelor statistice


2.1. Tabelul elementar
2.2. Tabelul elementar pentru un caracter discret şi reprezentarea
grafică a unui caracter discret
2.2.1. Tabelul de contingenţă
2.3. Tabelul elementar pentru un caracter continuu şi reprezentarea
grafică a unui caracter continuu
2.3.1. Stabilirea numărului de clase
2.3.2. Fixarea limitelor claselor
2.3.2.1.Progresia aritmetică
2.3.2.2.Progresia geometrică
2.3.2.3.Progresia pătratică
2.3.3. Histograma, poligonul frecvenţelor, curbele frecvenţelor
cumulate ascendent şi descendent
1. TIPURILE DE CARACTERE

1.1. Caracterele calitative : modalităţile lor nu sunt măsurabile deoarece sunt


nume, atribute sau coduri. Caracterele calitative nu se pot însuma şi de
asemenea acestora nu li se poate calcula media (dacă de exemplu aceste coduri
sunt CNP-uri, operaţiile enunţate nu au nici un sens).
 
Caracterele calitative pot fi nominale sau ordinale

Caracterul calitativ nominal este exprimat pe o scară nominală iar fiecare


modalitate este exprimată printr-un nume sau printr-un cod. Diferitele modalităţi
nu pot fi (sau nu are sens să fie) ordonate.

Caracterul calitativ ordinal este exprimat pe o scară ordinală iar modalităţile pot fi
clasificate într-o anumită ordine unele în raport cu altele.

Caracterele calitative pot fi exhaustive sau discrete.

Un caracter calitativ exhaustiv are numărul de modalităţi egal cu numărul de


elemente (de ex. persoanele identificate prin CNP-uri sau unitățile administrative
identificate prin geocoduri – SIRUTA, de exemplu).

Un caracter calitativ discret are mai puţine modalităţi diferite decât elemente. Mai
multe elemente au aceeaşi modalitate prin urmare pot fi grupate în clase.
Există patru tipuri de caractere calitative :

Categorie Ex. tipurile de relief cu trei modalităţi


(caracter calitativ nominal discret) (câmpie, deal, munte)
Ex. numele judeţelor României;
Identificator 
numerele de înmatriculare ale
(caracter calitativ nominal exhaustif)
autovehicolelor
Ierarhie Ex. mărimea oraşelor după trei
(caracter calitativ ordinal discret) modalităţi (redusă, medie, mare)
Clasament Ex. rangul oraşelor României după
(caracter calitativ ordinal exhaustif) populaţia înregistrată în 2018
1.2. Caracterele cantitative : modalităţile lor sunt numerice, sunt ordonabile prin
definiţie, pot să fie însumate iar media lor are semnificaţie.

Pentru a diferenţia caracterele cantitative se pot utiliza următoarele trei criterii:

a) Ele pot fi reperabile sau măsurabile

Caracterele cantitative reperabile se numesc astfel deoarece pe o scară de


intervale poziţia fiecărui element poate fi reperată în funcţie de o origine arbitrară
(valoarea 0/zero este convenţională şi nu înseamnă lipsa fenomenului).
Ex. : Latitudine, longitudine, temperatură, altitudine, ...

Caracterele cantitative măsurabile pot fi măsurate pe o scară numerică pe care


valoarea 0/zero înseamnă absenţa fenomenului.
Ex. : populaţia, rata de fecunditate, precipitaţiile
 
Sursa: http://www.scientia.ro/fizica/43-termodinamica/184-celsius-fahrenheit-kelvin.html
b) Ele pot fi stocuri sau rate/raporturi

Caracterele cantitative de stoc exprimă cantităţi concrete iar suma modalităţilor


are sens.
Ex. Populaţia totală a unui judeţ.

Caracterele cantitative de rată/de raport exprimă raportul între două valori iar
totalul lor nu are semnificaţie
Ex. Densitatea populaţiei unui judeţ sau proporţia şomerilor la un moment dat în totalul
populaţiei active.

c) Ele pot fi discrete (discontinue) sau continue

Caracterele cantitative discrete (discontinue) sunt caractere ale căror modalităţi


sunt izolate (dar nu sunt în mod necesar numere întregi)
Ex. Numărul de oraşe de peste 1 000 000 de locuitori din ţările Europei ; valoarea
bancnotelor și monedelor din buzunarele masteranzilor TDR/RNAT

Caracterele cantitative continue sunt caractere ale căror valori sunt definite pe
un interval continuu de valori date şi au o infinitate de valori posibile.
Ex. Suprafaţa unei comune
2. Gruparea, descrierea şi prezentarea datelor statistice

Ansamblul ordonat al modalităţilor unei caracteristici poartă denumirea


de distribuţie (repartiţie) a populaţiei după caracteristica respectivă sau,
mai scurt, distribuţie statistică.

Există două forme principale de prezentare a unei distribuţii statistice: sub formă
de tabel statistic (tabele elementare şi tabele de contingenţă) sau sub forma unor
reprezentări grafice, cel mai adesea de tip histogramă. În geografie se adaugă
reprezentarea cartografică. Ele au menirea de a oferi un rezumat numeric sau
grafic al repartiţiei după o caracteristică, prin regruparea şi stabilirea frecvenţelor
fiecărei modalităţi a caracteristicii.
2.1. Tabelul elementar

este tabelul care descrie ansamblul elementelor (pe linii) cu ajutorul unui
ansamblu de caractere (pe coloane). Prima coloană este destinată caracterului
cu rol de identificator. Dacă acesta lipseşte, elementele sunt reperate în funcţie
de ordinea apariţiei lor în tabel (liniile numerotate de la 1 la N) şi se notează i
un element oarecare al tabelului şi Xi modalitatea luată de elementul i pentru
caracterul X.
Caracterele X, Y, Z care descriu elementele i

ID X Y Z

Elementele i A 1000 67 15
identificate
prin ID (A, B, B 5000 19 19
C, D) sau,
dacă nu se C 2000 23 32
cunoaște ID-
ul, prin D 1000 46 23
numere, în
ordinea
apariției lor
(primul – 1; al X Y Z
doilea – 2
etc.). 1 x1 y1 z1

2 x2 y2 z2

3 x3 y3 z3

4 x4 y4 z4
CodeNom Nr.municipii_2016
1 Alba Code Nom Nr. sate_2016
4
2 Arad 1 1 Alba 656
3 Argeş 3 2 Arad 270
4 Bacău 3 3 Argeş 576
5 Bihor 4 4 Bacău 491
6 Bistriţa-Năsăud 1 5 Bihor 430
7 Botoşani 2 6 Bistriţa-Năsăud 235
8 Brăila 1 7 Botoşani 333
În cadrul primei etape de prelucrare a datelor empirice (gruparea) se
9 Braşov 4 8 Brăila
9 Braşov
140
10 Buzău 2 149
urmăreşte să se răspundă la întrebarea: câte elemente din populaţia de bază
11 Călăraşi 2 10 Buzău 475

corespund fiecărei modalităţi (este posibil în cazul caracterelor discrete şi în


12 Caraş-Severin
13 Cluj
2
5
11 Călăraşi
12 Caraş-Severin
160
287
cazul în care numărul de indivizi şi cel de modalităţi sunt reduse) sau câte
14 Constanţa 3 13 Cluj 420
14 Constanţa 189
elemente corespund fiecărui grup de modalităţi (în cazul variabilelor cantitative
15 Covasna 2
16 Dâmboviţa 2 15 Covasna 122

continue sau a celor discrete cu număr foarte mare de modalităţi se


17 Dolj 3 16 Dâmboviţa
17 Dolj
353
378
18 Galaţi 2
procedează, pentru reducerea volumului de muncă, la o grupare a
19 Giurgiu 1
18 Galaţi 180
19 Giurgiu 167
modalităţilor în clase de valori, urmând a se determina frecvenţa fiecărei clase
20 Gorj
21 Harghita
2
4
20 Gorj 411

prin numărarea elementelor ale căror valori sunt cuprinse între limitele clasei
22 Hunedoara 7
21 Harghita
22 Hunedoara
235
457
23 Ialomiţa 3
respective).
24 Iaşi 2
23 Ialomiţa 127
24 Iaşi 418
25 Ilfov 0
25 Ilfov 91
26 Maramureş 2
Noţiunea de „clasă” este utilizată curent în descrierea distribuţiilor de frecvenţe
27 Mehedinţi 2
26 Maramureş
27 Mehedinţi
214
344
ale variabilelor cantitative şi, prin extindere, ale variabilelor calitative.
28 Mureş
29 Neamţ
4
2
28 Mureş 464
29 Neamţ 344
30 Olt 2
30 Olt 377
31 Prahova 2
31 Prahova 405
32 Sălaj 1
32 Sălaj 281
33 Satu Mare 2 33 Satu Mare 220
34 Sibiu 2 34 Sibiu 162
35 Suceava 5 35 Suceava 379
36 Teleorman 3 36 Teleorman 231
37 Timiş 2 37 Timiş 313
38 Tulcea 1 38 Tulcea 133
39 Vâlcea 2 39 Vâlcea 560
40 Vaslui 3 40 Vaslui 449
41 Vrancea 2 41 Vrancea 331
42 Bucureşti 1 42 Bucureşti 0
Max=7 Max=656
Min=0
2.2. Tabelul elementar pentru un caracter discret
şi reprezentarea grafică a unui caracter discret

60%

ID Efectivul Frecvenţa

 
50%
Diagrama în coloane : este A 12 20%
40%
reprezentarea grafică normală pentru un

Frecvenţa
B 3 5%
caracter discret. Pe abscisă (axa X) ea 30%
reprezintă suita ordonată a modalităţilor C 7 12%
20%
caracterului X iar pe ordonată (axa Y) D 8 13%
prezintă fie efectivul fie frecvenţa simplă a 10%
modalităţilor. Coloanele nu trebuie să fie E
                              
30 50%
0%
unite deoarece caracterul este discret. Total 60 100% A B C D E
Modalităţi

ID Efectivul Frecvenţa

 
A; 20%
A 12 20%
Sectoare de cerc (camembert sau
B 3 5%
plăcintă): Reprezentare echivalentă
B; 5%
diagramei în coloane însă mai puţin C 7 12%
E; 50%
performantă pe plan vizual. Deşi este D 8 13%
foarte frecvent utilizată, recomandăm C; 12%

evitarea folosirii ei. E


                             
30 50%

Total 60 100% D; 13%


100%
ID Efectivul Frecvenţa

 
90%
A 12 20% 80%
Bara fragmentată : Reprezentarea constă în a 70%
E

tăia o bară (care reprezintă 100% din efectiv) în B 3 5% 60%

segmente a căror lungime este proporţională cu C 7 12%


50%
D
40%
efectivul fiecărei modalităţi. Utilizarea sa este 30% C
D 8 13%
foarte eficientă în cazul în care există o ordine 20% B

oarecare între modalităţi. E                                


30 50% 10%
0%
A

1
Total 60 100% frecvenţa

ID Efectivul Frecvenţa

 
A
Diagrama în stea (radar sau pânză de A 12 20%
50%
40%
păianjen) : reprezentarea constă în a trasa 30%
B 3 5% 20%
plecând de la un punct central tot atâtea linii câte E
10%
B

modalităţi există şi a le da o lungime proporţională C 7 12% 0%

cu frecvenţa lor. Această reprezentare este foarte D 8 13%


adaptată în cazul caracterelor ciclice precum zilele
E
                          
30 50%
săptămânii sau lunile anului. D C

Total 60 100%
TABEL STATISTIC PENTRU O VARIABILĂ CANTITATIVĂ DISCRETĂ
SAU PENTRU O VARIABILĂ CALITATIVĂ NOMINALĂ

Efectivul Frecvenţa
Frecvenţa Frecvenţa cumulat relativă
Caracteristica absolută relativă Ni (asc./desc.) cumulată
xi (efectivul)ni fi Fi (asc./desc.)
x1 n1 f1 N1 F1
x2 n2 f2 N2 F2
. . . . .
. . . . .
. . . . .
xi ni fi Ni Fi
. . . . .
. . . . .
. . . . .
xm nm fm Nm Fm
m m

TOTAL
 ni  n
i 1  
 i 1
fi  1
     
2.2.1. Tabelul de contingenţă *

Tabelul de contingenţă sau tabelul cu dublă intrare, este un caz particular al tabelului
elementar, în care liniile şi coloanele joacă un rol simetric şi în care conţinutul
celulelor corespunde unor efective care pot fi însumate pe linii sau pe coloane.

Orice tabel de contingenţă este de fapt rezultatul transformării unui tabel elementar
constituit din două caractere discrete X şi Y care descriu acelaşi ansamblu E .

Numărul de linii al unui tabel de contingenţă (k) corespunde numărului de modalităţi


al primului caracter discret (X) iar numărul de coloane (p) corespunde numărului de
modalităţi al celui de-al doilea caracter discret (Y). Efectivul unei celule, notat Nij,
corespunde numărului de elemente ale tabelului elementar E care iau simultan
modalitatea i a lui X şi modalitatea j a lui Y.

ID X Y Y
A mic da
  da nu TOTAL
B mic da
mic 2 0 2
C mediu da

D mediu nu
X mediu 1 1 2

mare 1 2 3
E mare nu
TOTAL 4 3 7
F mare da

G mare nu

*Analiza tabelelor de contingenţă va fi aprofundată la studierea relaţiilor dintre două caractere


2.3. Tabelul elementar pentru un caracter continuu
şi reprezentarea grafică a unui caracter continuu

Pentru un caracter cantitativ, ansamblul ordonat al modalităţilor pe care le ia


Rang ID %din 13 Fasc(X) Fdesc(X) X
caracterul X pentru ansamblul elementelor din E se numeşte distribuţie statistică.
Tabelul
1 de distribuţie
1 statistică este
7,7 un tabel elementar
7,7 în care
100valorile caracterului
1,51
X au fost ordonate (fiecărei modalităţi Xi din acest tabel i-a fost asociat un rang,
care este
2 poziţia sa 1în clasamentul
7,7valorilor de15,4
la cea mai mică
92,3la cea mai 1,62
mare.

3 ID X
1 7,7 Rang(X)
23,1 X F asc(X)
84,6 F desc(X) 1,62
A 2,11 1
4 1 7,7 30,81,51 7,7 76,9 100 1,71
B 2,08 2 1,62 15,4 92,3
5 C 1,511 7,7 3 38,51,62 23,1
69,2 84,6
1,81
D 1,71 4 1,71 30,8 76,9
6 1 7,7 46,2 61,5 2,02
E 1,62 5 1,81 38,5 69,2
7 F 3,241 7,7 6 53,82,02 46,2 53,8 61,5 2,08
G 2,79 7 2,08 53,8 53,8
8 1 7,7 61,5 46,2 2,11
H 2,12 8 2,11 61,5 46,2
9 I 2,721 7,7 9 69,22,12 69,2 38,5 38,5 2,12
J 2,02 10 2,18 76,9 30,8
10 1 7,7 76,9 30,8 2,18
K 2,18 11 2,72 84,6 23,1
11 L 1,811 7,7 12 84,62,79 92,3 23,1 15,4 2,72
M 1,62 13 3,24 100,0 7,7
12 1 7,7 92,3 15,4 2,79
Tabel elementar Tabel de distribuţie statistică

13 1 7,7 100,0 (tabel de numărare)


7,7 3,24
Diagrama de distribuţie este o reprezentare elementară şi unidimensională a
unei distribuţii statistice, constând în reprezentarea distribuţiei printr-un punct
pe o axă gradată. Dacă două elemente au modalităţi identice sau foarte
apropiate se procedează la suprapunerea punctelor. Diagrama distribuţiei
corespunde astfel unei histograme ce utilizează clase foarte mici de efective
egale.                        

Rang(X) X

1 1,51
2 1,62
3 1,62
4 1,71
5 1,81
6 2,02
7 2,08
8 2,11
9 2,12
10 2,18
11 2,72
12 2,79
13 3,24
Construcţia elementară a curbelor de frecvenţe cumulate constă în a asocia fiecărei
modalităţi din tabelul de distribuţie statistică frecvenţa sa cumulată ascendentă (%
dintre elemente având modalităţi de valoare inferioară sau egală) şi frecvenţa sa
cumulată decendentă (% dintre elemente având modalităţi de valoare superioară
sau egală)
F asc i = Ri / N sau F% asc i = Ri*100 / N
F desc i = 1 – (Ri/N) sau F% desc i = 100 - (Ri*100 / N)
Se reprezintă apoi pe grafic intersecţia modalităţilor Xi (pe abscisă) cu frecvenţa
lor cumulată ascendentă sau descendentă.

Rang(X) X F asc(X) F desc(X)


100%
1 1,51 8% 100%
80%
2 1,62 15% 92%
3 1,62 23% 85% 60%

4 1,71 31% 77% 40%


5 1,81 38% 69%
20%
6 2,02 46% 62%
7 2,08 54% 54% 0%
1,5 2 2,5 3
8 2,11 62% 46%
F asc(X) F desc(X)
9 2,12 69% 38%
10 2,18 77% 31%
11 2,72 85% 23%
12 2,79 92% 15%
13 3,24 100% 8%
Diagrama de distribuţie şi curbele frecvenţelor cumulate permit se se repereze zonele
de concentrare ale distribuţiei (multe elemente pe interval) şi zonele de dispersie
(puţine elemente pe interval). De asemenea pot fi reperate discontinuităţile
distribuţiei, adică zonele de dispersie care separă zonele de concentrare a
elementelor.

Pe curba frecvenţelor cumulate:


- pantele accentuate corespund zonelor de concentrare a valorilor
- pantele line corespund zonelor de dispersie a valorilor
- " treptele " corespund discontinuităţilor distribuţiei
Dacă nu se dispune de alte informaţii despre
distribuţie, se pot folosi trei metode de bază pentru
gruparea în clase:

- Metoda pragurilor naturale: constă în plasarea


limitelor claselor în zonele de discontinuitate a
distribuţiei. Numărul de clase depinde de numărul
discontinuităţilor descoperite.

ex. [1.5 ; 1.9[ ; [1.9 ; 2.5[ ; [2.5 ; 3.3]


100%

- Metoda amplitudinilor egale : constă în divizarea


80%
întinderii distribuţiei în clase de aceeaşi
60% amplitudine (însă nu în mod necesar de acelaşi
efectiv).
40%

20% ex. [1.5 ; 2.1[ ; [2.1 ; 2.7[ ; [2.7 ; 3.3]


0%
-Metoda efectivelor egale: constă în plasarea
1,5 2 2,5 3
limitelor de clasă în aşa fel încât să se obţină
F asc(X) F desc(X)
acelaşi efectiv în fiecare clasă. De obicei
amplitudinile claselor astfel obţinute nu sunt egale.

ex. [1.5 ; 1.75[ ; [1.75 ; 2.15[ ; [2.15 ; 3.3]


Pentru a-şi atinge scopul principal (sintetizarea informaţiilor cuprinse în
ansambluri mari de date) statistica necesită de cele mai multe ori gruparea
modalităţilor în clase (k).

Prin clasă se înţelege o subdiviziune a domeniului de variaţie a variabilei. Pentru


clasele constituite din grupe de valori trebuie determinate elementele
caracteristice ale acestora: limitele (inferioară şi superioară), amplitudinile
claselor, a (care pot fi egale sau inegale) şi centrele claselor (valorile situate în
mijlocul claselor, ca medii aritmetice ale celor două limite de clasă).

O schemă simplă ar putea facilita înţelegerea acestor noţiuni:

clasa 1: [l i1..c1..l s1], cu c1 = (l s1 + l i1)/2 și a1=l s1-l i1;


clasa 2: [l i2..c2..l s2], cu c2 = (l s2 + l i2)/2 și a2=l s2-l i2;
.
.
clasa n: [l in..cn..l sn], cu cn = (l sn + l in)/2 și an=l sn-l in.

unde : l i - limita inferioară a unei clase; l s - limita superioară; c - centrul de


clasă; a - amplitudinea clasei.
2.3.1. Stabilirea numărului de clase

Dacă numărul de modalităţi este foarte mare (infinit în cazul caracterelor continue)
şi se LOGARITMI - noțiunisuplimentare
dispune de informaţii elementareasupra distribuţiei, există câteva relaţii
care Dacă
pot fi butile
= acîn<=> c = log
procesul deab grupare a valorilor.
a, b, c sunt numere reale cu b > 0, a > 0, a ≠ 1
a esteo numit
Nu există reţetă baza logaritmului.
prestabilită pentru stabilirea numărului de clase în care pot fi
Exemplu
grupate (cu baza
elementele 2):
unei 23 =
serii 8 => logCu
statistice. 28 toate
= 3 acestea gruparea în clase, şi mai
ales în clase de frecvenţe, este extrem de importantă deoarece de aceasta depinde
corectitudinea
În funcțieprelucrărilor ulterioare şi (10
de baza logaritmului exactitatea
sau e), rezultatelor obţinute.
notațiile standard
Numărul
sunt. de clase depinde de numărul de modalităţi şi/sau de numărul de elemente
analizate.
log10bPrintre
= lg b formulele care pot fi aplicate în scopul asigurării unei cât mai
corecte
logedivizări
b = ln ba seriei se pot enumera:
Proprietățile logaritmilor:
- relaţia
logaaHuntsberger:
=1 k = 1+ 3.332* log(n)
şi
log (b*c) = logab + logac
- relaţiaa Brooks-Caruthers:
loga(b/c) = logab - logac
k < 5 * lg(n)
logak
în care bn==numărul
n*logab de clase iar n = efectivul total al modalităţilor (nr. de valori
logba = 1/logab
din şir).
logbc = logac/logab
Odată logcunoscut numărul de clase se poate calcula mărimea intervalului care va fi
ab = logac <=> b = c
sistematic aplicat pentru obţinerea numărului de clase (relaţia lui H.D. Sturges):

xmax  xmin
l
1  3,332 log n
2.3.2. Fixarea limitelor claselor

Exigenţe:
- limitele claselor să varieze regulat
- repartizarea valorilor pe clase să fie cât mai uniformă

Dificultăţi:

-dacă se stabilesc limitele de clasă ca termeni ai unei progresii regulate, se


obţin frecvent fie clase vide (dar, din motive de corectitudine a prelucrărilor
ulterioare, se recomandă ca efectivul unei clase să nu fie mai mic de 5), fie
clase foarte „aglomerate”;
-dacă se încearcă o repartizare uniformă a valorilor pe clase, atunci limitele
succesive nu urmează o progresie regulată, rezultând clase cu amplitudini
inegale.

Inegalitatea amplitudinilor de clasă atrage după sine imposibilitatea comparării directe a


frecvenţelor claselor. În acest caz se calculează aşa-numitele „frecvenţe medii reduse -
Fmr”, ca raporturi între frecvenţele de clasă şi frecvenţa clasei cu cea mai mică amplitudine
(numită „clasă de referinţă”); aceste Fmr vor fi apoi utilizate în prelucrările ulterioare şi în
construirea graficelor de distribuţie (histograme şi curbe cumulative).
Este clar că stabilirea unor clase cu amplitudini inegale duce la creşterea
volumului de muncă în vederea alcătuirii distribuţiei de frecvenţe. De aceea se va evita, pe
cât posibil, această alternativă de lucru şi se va încerca fixarea unor limite de clasă care să
se succeadă într-o progresie regulată.
Se poate aplica aceeași metodă de împărțire în clase a valorilor pantelor din
sectoarele A, B și C?
Pentru stabilirea limitelor de clasă, cele mai utilizate progresii sunt progresia
aritmetică, progresia geometrică şi cea pătratică. Cu ajutorul lor limitele se pot
stabili precis, utilizând valorile extreme (maximul și minimul) şi numărul de clase.

2.3.2.1.Progresia aritmetică

În cazul progresiei aritmetice diferenţele dintre două limite succesive, respectiv


amplitudinile de clasă, sunt constante şi se obţin în felul următor:

M -m 35605 - 2 35603 *
a= adică a=   2966,91
k 12 12
Unde.
a este amplitudinea şi simultan rata progresiei,
M este valoarea maximă iar
m este valoarea minimă a şirului
k este numărul de clase

Limitele obţinute vor fi respectiv m, m+a, m+2a, ..., m+ka=M.

Neajunsul principal al acestei metode este că detaliază în mod exagerat


zona valorilor mari din şir (acolo unde, de regulă, există un număr mai mic de
valori).

* Exemplele valorice se referă la suprafața arabilă a comunelor României.


2.3.2.2.Progresia geometrică

În cazul progresiei geometrice limitele de clasă succesive se obţin prin


înmulţirea cu un raport constant R. Acest raport (rata progresiei) se
calculează astfel:

M 35605 12
R= k (m > 0) adică R = 12  17801,5  2,260501
m 2

adică

Limitele vor fi de forma m, Rm, R²m, R³m, ..., R km=M.


k

Neajunsul acestei metode este acela că detaliază, în cadrul distribuţiei de


frecvenţe, zona valorilor mici, iar amplitudinile sunt inegale. În plus, metoda nu se
poate aplica decât dacă m este strict pozitiv.

Pentru uşurarea calculelor se poate valorifica faptul că logaritmii limitelor urmează


o progresie aritmetică - deci limitele vor fi de forma log(m), log(m)+log(R), log(m)
+2log(R) etc.
2.3.2.3.Progresia pătratică
Progresia pătratică, prin proprietăţile sale, elimină dezavantajele primelor
două. Limitele succesive se obţin prin ridicarea la pătrat a termenilor unei
progresii aritmetice la care rata se calculează cu formula:

M - m 35605 - 2 188,69  1,41


P= adică P=   15,60655
k 12 12

rezultând seria:

m, ( m  P)², ( m  2 P)²,....., ( m  kP)².


Ni Fi ni Fi Ni Fi
  (aritm.) (aritm.)   (geom.) (geom.)   (patr.) (patr.)
<2969 1695 1695 <5 5 5 <290 232 232
2969_5936 857 2552 5_10 7 12 290_1064 419 651
5936_8903 259 2811 10_23 7 19 1064_2326 714 1365
8903_11870 77 2888 23_52 22 41 2326_4075 783 2148
11870_1483
7 30 2918 52_118 56 97 4075_6311 456 2604
14837_1780
4 17 2935 118_266 119 216 6311_9034 214 2818
17804_2077
0 4 2939 226_602 186 402 9034_12245 77 2895
20770_2373
7 0 2939 602_1361 404 806 12245_15942 29 2924
23737_2670
4 0 2939 1361_3076 942 1748 15942_20127 14 2938
26704_2967
1 0 2939 3076_6952 923 2671 20127_24799 1 2939
29671_3263
8 2 2941 6952_15712 253 2924 24799_29957 1 2940
>32638 1 2942 >15712 18 2942 >29957 2 2942
TABEL STATISTIC (TABEL DE NUMĂRARE)
PENTRU O VARIABILĂ CANTITATIVĂ CONTINUĂ
SAU PENTRU O VARIABILA CANTITATIVĂ DISCRETĂ CU NUMĂR MARE DE
MODALITĂŢI

Frecvenţa Efectivul Frecvenţa


absolută Frecvenţa cumulat relativă
Caracteristica (efectivul) relativă Ni (asc./desc.) cumulată
xi ni fi Fi (asc./desc.)
x0-x1 n1 f1 N1 F1
x1-x2 n2 f2 N2 F2
. . . . .
. . . . .
. . . . .
x(i-1)-xi ni fi Ni Fi
. . . . .
. . . . .
. . . . .
x(k-1)-xk nm fm Nm Fm
TOTAL n 1    
Histograma este realizată plecându-se de la un tabel de numărare (de distribuţie statistică) . Este o
reprezentare bidimensională care prezintă fiecare clasă sub forma un ui dreptunghi a cărui bază este
proporţională cu amplitudinea clasei şi a cărui înălţime este proporţională frecvenţei medii a clasei .
Suprafaţa dreptunghiului este prin urmare proporţională cu efectivul clasei (sau cu frecvenţa simplă a
clasei) deoarece :
Suprafaţa dreptunghiului = lungimea x lăţimea = ( fmi x ai) = (fi / ai) x Ai= fi

Legenda unei histograme este constituită dintr-un element de suprafaţă pe care este indicată
proporţia elementelor pe care le reprezintă (exprimată în frecvenţă simplă sau în efectiv).

Histograma permite o dublă lectură a distribuţiei statistice :


1) Înălţimea dreptunghiului (ordonata) oferă informaţii asupra densităţii elementelor din fiecare
clasă. O frecvenţă medie cu valori mari indică o concentrare a valorilor în vreme ce o frecvenţă medie
cu valori mici indică o dispersie accentuată a valorilor .
2) Suprafaţa dreptunghiurilor oferă informaţii asupra efectivului fiecărei clase.

Minute Persoane
0_30
250
30_60
500
60_90
600
90_120
450
120_150
150
150_180
50
Poligonul frecvenţelor se obţine unind mijlocurile laturilor superioare ale coloanelor şi reprezintă o
aproximare corectă a distribuţiei efectivelor . Ajustarea (netezirea sa) conduce la obţinerea curbei
frecvenţelor simple (brute sau relative), care aproximează şi mai bine distribuţia frecvenţelor.
fi% fi%
  Iaşi fi% Cluj Constanţa

0_5 4,7 4,1 4,2


6_10 3,9 4,1 3,9
11_15 7,6 6,4 7,0
14,0
16_20 10,3 10,1 7,9
12,0
21_25 13,3 12,6 8,8
26_30 8,5 8,3 7,6 10,0

8,7 8,3 8,8 8,0 fi% Iaşi


31_35
fi% Cluj
36_40 5,1 6,0 5,8 6,0 fi% Constanţa
41_45 7,4 7,7 8,3 4,0

46_50 8,5 7,9 9,3 2,0


51_55 6,5 6,0 7,5
0,0
56_60 3,6 4,5 4,9
61_65 3,8 4,3 5,2
66_70 3,0 3,5 4,3
71_75 2,4 2,8 3,3
76_80 1,5 1,9 2,0
>81 1,1 1,3 1,2
Curbele frecvenţelor cumulate ascendent şi descendent se realizează plecându-se de la un tabel de
distribuţie statistică / de la un tabel de numărare. Acest grafic bidimensional prezintă pe abscisă
modalităţile caracterului X iar pe ordonată frecvenţele cumulate şi se construieşte astfel:

- Pentru frecvenţa cumulată ascendent se trec pe abscisă valorile care corespund limitelor claselor
grupării caracterului X iar pe ordonată frecvenţele cumulate ascendent corespondente. Se reperează
cuplurile de valori care corespund acestor puncte, cărora li se adaugă punctul care are drept
coordonate xmin (borna inferioară a primei clase) şi 0 pentru frecvenţe (0 sau 0% dintre elemente
înregistrează valori mai mici decât xmin). Se efectuează apoi o extrapolare liniară între aceste
puncte (ipoteza de echirepartiţie a elementelor în fiecare clasă) şi în fine se unesc punctele cu o
dreaptă.
-Pentru frecvenţa cumulată ascendent se procedează identic însă în sens invers.

Curbele obţinute se intersectează la punctul de frecvenţă cumulată ascendent/descendent de 0,5 sau


de 50%. Valoarea caracterului X ce corespunde frecvenţei cumulate de 0.5 sau de 50% şi care poate
fi citită direct pe ordonata graficului este una dintre valorile centrale, respectiv mediana (Xmed).

  Fi asc Fi desc
0 0 2000
30 250 1750
60 750 1250
90 1350 650
120 1800 200
150 1950 50
180 2000 0
fi asc% fi asc% fi asc%
  Iaşi Cluj Constanţa

0_5 4,7 4,1 4,2


6_10 8,6 8,2 8,1
11_15 16,1 14,6 15,1
16_20 26,5 24,7 23,0 100,0
90,0
21_25 39,8 37,3 31,8
80,0
26_30 48,3 45,6 39,4 70,0
31_35 57,0 53,9 48,2 60,0 fi asc% Iaşi
50,0 fi asc% Cluj
36_40 62,1 60,0 54,0
40,0 fi asc% Constanţa
41_45 69,5 67,7 62,3 30,0
46_50 78,0 75,6 71,7 20,0
10,0
51_55 84,5 81,7 79,2
0,0
56_60 88,2 86,2 84,1
61_65 92,0 90,5 89,2
66_70 95,0 94,0 93,6
71_75 97,4 96,8 96,8
76_80 98,9 98,7 98,8
>81 100,0 100,0 100,0
Coeficientul
Grupe (clase) Numărul de Mărimea de reducere Frecvenţele
după numărul comune intervalului a frecvenţelor reduse
comunelor (xi) ni li ki=(li/lmin) hi=ni/ki
0_50 42 50 1,0 42,0
50_200 123 150 3,0 41,0
200_400 123 200 4,0 30,8
400_800 230 400 8,0 28,8
800_1600 444 800 16,0 27,8
1600_3600 1040 2000 40,0 26,0
3600_7200 707 3600 72,0 9,8
7200-10000 150 2800 56,0 2,7
10000_35605 89 25606 512,1 0,2
Poligoanele frecvenţelor şi curbele cumulative pot fi „netezite” (ajustate) iar noile
curbe ajustate se compară apoi cu nişte curbe teoretice în ceea ce priveşte
numărul şi poziţia, în cadrul intervalului de variaţie, ale claselor cu frecvenţă
maximă. Din acest punct de vedere se pot întâlni mai multe cazuri tipice de
curbe ale frecvenţelor relative simple/medii.
simple/medii
Câteva forme tipice ale unor curbe de distribuţie a frecvenţelor întâlnite în geografie

Simetria/asimetria unei distribuţii de frecvenţe s-ar putea defini astfel: spunem că o distribuţie este simetrică atunci când
clasele cu cele mai mari frecvenţe se grupează spre mijlocul intervalului total de variaţie; dimpotrivă, distribuţia este
asimetrică atunci când clasele cu frecvenţe mari se grupează spre extremităţile intervalului total de variaţie (fie în zona
valorilor mici, fie în cea a valorilor mari).
Curba normală (a) şi curba normală normată (b).