Sunteți pe pagina 1din 26

CURS 2

Introducere în analiza de date


şi în analiza spaţială

1. Analiza statistică în geografie


2. Sursele de date statistice
3. Organizarea datelor statistice
4. Statistică, cartografie şi analiză spaţială
1. Analiza statistică în geografie
Relaţiile dintre geografie şi statistică depind de poziţionările diferite ale
geografiei ca ştiinţă, adică de modul în care geografia abordează locurile:

-geografia clasică se interesează de locurile bine individualizate


(excepţionalismul); statistica nu este de nici un folos în acest caz;

-geografia cantitativă elementară consideră spaţiul ca un ansamblu de locuri iar


cercetarea geografică urmăreşte caracterizarea simultană atât a acestui
ansamblu cât şi a elementelor sale, în diversitatea lor. În acest caz statistica
poate furniza câteva metode utile;

- geografia ca analiză a organizării spaţiului (ca analiză spaţială) tinde către


generalizare, către abstractizare, căutând reguli de repartiţie a diversităţii
locurilor spaţiului şi plecând de la ipoteza conform căreia caracteristicile unui
loc depind măcar în parte de poziţia sa în spaţiu şi de vecinătăţile sale de la
diferite scări geografice. Deşi statistica nu este făcută pentru acest lucru, unele
dintre metodele sale pot să ajute geografia să demonstreze că structurile
spaţiale sunt rezultatul proceselor de organizare .
Ţinând cont de aceste poziţionări, relaţiile dintre geografie şi statistică pot să ia
mai multe forme:

a) – indiferenţă: metodele statistice sunt aplicate locurilor la fel cum se aplică


şuruburilor care ies dintr-o uzină. Rezultatele analizelor pot fi corecte însă
geografia nu găseşte nici un interes în acest fel de cercetare, fiindcă spaţiul este
absent;

b) – căsătoria din interes: statistica nu ţine cont de faptul că locurile sunt


situate, deoarece tehnicile şi modelele statistice nu pot integra localizările, însă
ia în considerare faptul că ele sunt obiecte spaţiale fie în etapa de constituire a
bazei de date, fie în timpul prelucrării datelor;

c) – puţină dragoste nu strică: statistica pleacă de la ideea că locurile au o


localizare în spaţiu şi ţine cont de această natură spaţială, fie prin intermediul
coordonatelor, fie prin transformări topologice diverse. Pentru a ţine cont şi de
interesele geografiei, statistica îşi poate adopta tehnicile generale pentru a
putea fi aplicate spaţiului încât poate deveni o altfel de ştiinţă, respectiv
geostatistica.
2. Sursele de date statistice
a) Surse de date statistice internaţionale

- Siturile oficiilor statistice naţionale


- Siturile instituţiilor financiare mondiale (World Bank, FMI)
- Siturile organizaţiilor internaţionale (United Nations Organization, World Trade
Organization, World Tourism Organization, etc.)
b) Surse de date statistice europene

- Siturile oficiilor statistice naţionale ale statelor membre UE


http://www.statistik.at/
http://www.statbel.fgov.be/
http://www.nsi.bg/
http://www.czso.cz/
http://www.mof.gov.cy/
http://www.dst.dk/
http://www.stat.ee/
http://www.stat.fi/
http://www.insee.fr/
http://www.destatis.de/
http://www.statistics.gr/
http://www.cso.ie/
http://www.istat.it/
http://www.csb.gov.lv/
http://www.stat.gov.lt/
http://www.statec.public.lu/
http://www.nso.gov.mt/
http://www.cbs.nl/
http://www.stat.gov.pl/
http://www.ine.pt/
http://www.statistics.gov.uk/
http://www.insse.ro/
http://portal.statistics.sk/
http://www.stat.si/
http://www.ine.es/
http://www.scb.se/
http://portal.ksh.hu/
http://www.dzs.hr/default_e.htm

- Eurostat
c) Surse de date statistice naţionale
d) Surse de date statistice judeţene
d) Anchete şi surse cartografice

d1) Anchetele – surse de informaţii statistice

În anchetele (sau sondajele) de teren, ale căror principii le veţi afla la cursul
« Tehnici de anchetă » trebuie să ţineţi seama de un fapt specific geografiei:
localizarea subiectului sau obiectului anchetat. Dacă nu veţi nota localizarea,
cartografierea rezultatelor procesării informaţiilor va deveni imposibilă.
d2) Documentele cartografice – surse de informaţii statistice

În lipsa unei baze administrative de colectare a informaţiei, informaţiile pot fi


extrase de pe documentele cartografice prin metoda caroiajului. Alegerea laturii
pătratului se alege în funcţie de scara hărţii şi mai ales în funcţie de gradul de
fineţe care se doreşte a fi acordat analizei. Atributul care se acordă unui pătrat
oarecare poate fi obţinut fie prin aplicarea principiului ariei maxime, fie prin
calcularea proporţională a suprafeţelor ocupate.

A B C D E F G H
....
Informaţii Corine Land Cover Produsul Intern Brut (PIB)

EXCEL EXCEL
3. Organizarea datelor statistice
a) Matricea de informaţii spaţiale (geografice)

Deoarece în analiza statistică aplicată în geografie indivizii sunt locuri sau


obiecte localizate în spaţiu, tabelul se numeşte matrice de informaţii spaţiale
sau geografice.

Statistica , nefiind
Prin convenţie, interesată
informaţia de locuri,
statistică privilegiază
este prezentată sublectura verticală
forma unui tabel (pe
cu
coloane), deoarece vizează cu precădere descrierea caracterelor
dublă intrare: pe orizontală/pe linii sunt prezentaţi indivizii statistici iar pe (media,
mediana,
verticală/pe amplitudinea,
coloane suntvarianţa, etc.). Ţelul
prezentate său este descrierea
caracteristicile ansamblului
indivizilor şi
statistici.
nu a fiecăruiunui
Intersecţia individ în parte.
individ Analiza statistică
cu o caracteristică permite
reprezintă o astfel facilitarea
observaţie studierii
statistică .
poziţiei fiecărui individ în funcţie de ansamblu (ceea ce deschide pentru
geografie perspectivele
Liniile şi coloanele nu aupoziţionării individului/locului
aceeaşi natură: indivizii sunt în contextul
descrişi său spaţial
în acelaşi ).
fel însă
Lectura
nu pe verticalălor,
şi caracteristicile (univariată,
care pot fibivariată
calitativesau
sau multivariată) estesau
cantitative, brute uşurată de
relative,
faptul
etc. că datele sunt o m o g e n e.

Geografia, care are locul drept obiect central de studiu, privilegiază lectura
orizontală (pe linii), deoarece vizează cu precădere descrierea locurilor pentru a
le putea compara ulterior şi astfel să ajungă la sesizarea diferenţierilor spaţiale.
Lectura statistică pe orizontală este îngreunată din cauza e t e r o g e n i t ă ţ i i
caracteristicilor. Pentru a se putea face analiza statistică pe linii,
caracteristicile trebuie să fie omogenizate; analizele uni- sau bivariate sunt de
cele mai multe ori imposibile sau fără sens, tehnica obişnuită fiind aceea a
statisticii multivariate.
b) « Cubul » informaţilor spaţiale (geografice)

Mai lent în geografia fizică şi mult mai rapid în geografia umană, locurile
evoluează iar caracteristicile lor se modifică neîncetat. Acest lucru, coroborat cu
faptul că de multe ori configuraţiile prezentului au drept cauză configuraţiile
trecutului, conduce la necesitatea construirii bazelor de date.

Bazele de date geografice au ca dimensiune specifică faptul că indivizii pe care


îi studiază sunt locuri, aflate într-o neîntreruptă recompunere (de ex. în
România anului 1992 existau 2948 de comune iar la 1 ianuarie 2007 se numărau
3175 de comune (3181 în prezent); în geografia fizică trebuie luată în calcul
evoluţia rapidă a rezoluţiei la care sunt furnizate informaţiile spaţiale). Prin
urmare, bazele de date spaţiale/geografice trebuie să aibă în vedere
următoarele:
- să fie uşor reactualizabile;
- să fie conectate permanent la surse de informaţie omogenă şi sistematică;
- să aibă sisteme de recompunere a datelor statistice în funcţie de
recompunerile locurilor studiate;
- să constituie serii lungi de observaţii statistice pentru a diminua riscurile
interpretărilor eronate a rezultatelor prelucrărilor statistice.
c) Organizarea datelor statistice: caractere şi modalităţi

Caracteristicile/caracterele
Matricea de informaţii spaţiale
Caracteristicile
este organizată
reprezintă subiectul calitative
cantitative
pe linii analizelordescriu
se
stări
preteazăale indivizilor/locurilor
cel
(indivizi=.locuri
statistice mai
Metodele bine
) şi pe analizelor
decoloane
analiză (în
exemplul
statistice.
(caracteristici
statistică nostru
aDe lorobicei
)sunt statutul
ele sunt
diferite,
administrativ
măsuri , rezultate
Caracteristicile
deoarece natura sau prin
lorrangul
este înse
cantitative
ierarhia
numărare
pot aşezărilor),
sau prin
exprima fie în valori
diferită. stăribrutecare
nu pot
înregistrarea
(de ex.finumărul
măsurate parametrilor
de. locuitori
Analizacu lor
Caracterele
Fiecare
cere
instrumentele
metodeunitate reprezintă
statistică
specifice
de măsură. poate
deoarece
Ele
dintr-un oraş), fie în valori
« măsuri
lua
ele
sunt un
nu »,fiadică
anumit
exprimate
pot nivel
studiate rezultatele
alcantitativ
printr-un
relative
O , adică
caracteristică
O caracteristică prin valori
numerică
se noteazăcare
cu se
cu
«
O măsurătorilor
caracteristică
caracteristicii
(de ex. care
număr suma » efectuate
numerică
observate,
lasau
rândul media luidelor cuîn
numită
nu
raportează
variaţie
literă la
discontinuă
majusculă,o valoare Xse denumeşte
exemplu,
«
aupunctele
variaţie
variantă.
exprimă
sens). dealtfel
continuă
Această
o(de
De observaţie
cantitate, se ar»
numeşte
variabilitate
ele caz în care
carea
trebui Un loc este considerat de către statistica
referinţă
variabilă
iar o variantă
discretăex. ponderea
a şi
acesteia,
are valorile
luată
sunt locurile.
variabilă
nivelelor
să numesc
se se numească continuă
care Categoriile
pot
variabile mai şi
fi totalul
.luate de
degrabă ia
poate să geografică drept o unitate statistică,
populaţiei
exprimate
de o astfel tinere
unitateîn numere în
sau de întregi.
un grup
măsuri
o infinitate
conferă
rubrici obţinute
decaractere
valori
caracteristicilor
decât în pot fi: de
.domeniul adică un element de observare şi de
populaţiei
Aceste
unităţi valori
nunui
i la suntoraş,
un moment etc.).
izolate: dat se
său de variaţie.
statistice
- suprafeţe, caracterul
pe Din această
categorii de variabilă
de înregistrare a observaţiilor . Unităţile
notează
cauză este cu xi. Mulţimea
necesară gruparea posibilă
aleatoare
x1 , x2
Caracterele
utilizare (stohastică).
, a.......xi , .......xn
cantitative
terenurilor discrete statistice pot fi simple (conţin un singur
a
lor potunei
în kluaclasevariabile
ale un X
variabileireprezintăX:
Caracterele
nu
Se utilizează decât
calitative
termenul număr
nominale element, de exemplu o persoană) sau
undedomeniul
- rezultatele de variaţiede
numărării a
descriu
limitat
(x0 , x1de
variabilă loculvalori,
prin
),(modalitate=fr.;
(x1 denumirea
,respectiv
x2), obicei
..... (xi , xk) complexe (conţin mai multe elemente, de
variabileim
obiectelor, bunurilor sau
calităţilor
numere
X1< întregi,
acestora
x2<.......xi<.......xn
atribut=en.) doar îndar (ex.
nu
cazulmod
în
oraşul exemplu un oraş cu locuitorii săi).
persoanelor
Aceste
Iaşi
necesar (xclase
X:este de
de pe
,municipiu)
x2.......x
1(numărul aceste
valori
i.......x
de dar(sau)
persoane
nnu Deoarece caracterele locurilor sunt
caracteristicilor
suprafeţe: case cantitative
(pe tipuri), .
intervale)
oferă
pe familie, pot
alte informaţii. fi de
de luni într-un mărimi
Pentru (de
an, măsurate pe o suprafaţă (spaţiul este
În Sau caracteristicilor
persoane
amplitudini)
cazul (pe categorii
egale sau inegale,
analiză,
de locuitori ele într-un
trebuie oraş). astfel discontinuu, discretizat),
socioprofesionale,
închise
calitative
transformatesau
X: (xi) cu deschise.
se i=1......n
preferă
(codate) vârste),
termenul etc.;de totalitatea caracterelor geografice sunt
nomenclatură
- cantităţi produse sau , mai ales dacă discrete/discontinue, ceea ce nu convine
numărul
Caracterele
consumate, variantelor
cantitative
indicând tipurile de prea bine analizei statistice. Dacă
caracteristicii
Caracterele
continue pot
activitate economică este
calitative
lua oricefoarte mare,
ordinale
valoare
efectuate numărul de locuri studiate este destul de
cum
descriueste
dintr-un
de locuitori cazul
locul
interval de
numindu-i
dar şide exemplu
variaţie
intensitateao în mare (zeci, sute şi mai ales mii sau mai
nomenclatorului
calitate
(mărimea (ex.
muncii acestora; parcelelor, meseriilor.
aici apartenenţa mult) atunci caracterele discrete pot fi
într-o ierarhie
suprafeţele fermelor).
a aşezărilor) Din însă condiderate continue.
- fluxuri intrate sau ieşite pe
oferă şi
cauza faptului
alte informaţiică ele pot (de lua o
unitatea de timp (migraţii, Totalitatea locurilor alcătuieşte populaţia
exemplu câte
infinitate de valori,
aşezări esteare în faţă
export-importuri, etc.). statistică studiată.
sau câtesă
necesar urmează
le grupăm după înlocul
clasexi).
cu o bornă deschisă şi cu una
închisă (de ex. [100-150[
POPULAŢIA OCUPATĂ CIVILĂ, PE ACTIVITĂŢI ALE ECONOMIEI REGIUNII DE NORD-EST
( la sfârşitul anului 2005)
sursa: Anuarul statistic al României 2007

TABEL STATISTIC PENTRU O VARIABILĂ CALITATIVĂ SAU


CANTITATIVĂ DISCRETĂ*
Frecvenţa Frecvenţa Frecvenţa Frecvenţa
absolută Frecvenţa relativă Efectivul
absolută Frecvenţa relativă
Ramura de activitate Efectivul
(ni)
cumulată relativă cumulată cumulată Frecvenţa relativă (fi)
relativă Procentul (%)
cumulată
Ramura de activitate (ni) Frecvenţa relativă (fi) Procentul
Efectivul ascendentă cumulată
Agricultură, vânătoare ascendentă
şi silvicultură descendentă
539400 cumulată 0,426 descendentă42,6
(ni) (persoane) ascendentă
Agricultură, vânătoare (%)
şi silvicultură (persoane)
539400 descendentă 0,426 (%) 42,6
Pescuit şi piscicultură 600 0,000 0,0
539400 539400
Industrie 0,426 42,6 1265600
245300 1,000
0,194 100,0
19,4
Industrie 245300 0,194 19,4
245300 Comerţ784700 0,620 62,0 726200
135600 0,574
0,107 57,4
10,7
Construcţii 54100 0,043 4,3
135600 920300
Învăţământ 0,727 72,7 480900
75100 0,380
0,059 38,0
5,9
Comerţ 135600 0,107 10,7
75100 995400
Sănătate 0,787
şi asistenţă socială 78,7 345300
60000 0,273
0,047 27,3
4,7
Hoteluri şi restaurante 16700 0,013 1,3
60000 1055400
Construcţii 0,834 83,4 270200
54100 0,213
0,043 21,3
4,3
Transport, depozitare şi comunicaţii 41300 0,033 3,3
54100 1109500
Transport, depozitare şi0,877
comunicaţii 87,7 210200
41300 0,166
0,033 16,6
3,3
Intermedieri financiare 8700 0,007 0,7
41300 1150800
Tranzacţii 0,909
imobiliare şi alte servicii 90,9 156100
35400 0,123
0,028 12,3
2,8
Tranzacţii imobiliare şi alte servicii 35400 0,028 2,8
35400 Alte 1186200
activitati ale economiei
0,937nationale 93,7 31300
114800 0,025
0,091 2,5
9,1
Administraţie publică şi apărare 22100 0,017 1,7
31300 Administraţie
1217500 publică şi0,962
apărare 96,2 2210079400 0,017
0,063 1,7
6,3
Învăţământ 75100 0,059 5,9
22100 Hoteluri şi restaurante 0,979
1239600 97,9 1670048100 0,013
0,038 1,3
3,8
Sănătate şi asistenţă socială 60000 0,047 4,7
16700 Intermedieri
1256300 financiare 0,993 99,3 870026000 0,007
0,021 0,7
2,1
Alte activitati ale economiei nationale 31300 0,025 2,5
8700 Pescuit şi piscicultură 1,000
1265000 100,0 600 9300 0,000
0,007 0,0
0,7
Total economie 1265600 1,000 100,0
600 Total1265600
economie 1,000 100,0 1265600 600 1,000
0,000 100,0
0,0
*Datorită numărului mare de indivizi şi de modalităţi putem considera că acest caracter discret poate
fi considerat ca fiind unul continuu. În mod normal, pentru o variabilă cantitativă discretă tabelul
conţine doar trei coloane: lista ordonată a modalităţilor (sau a claselor), efectivele corespondente şi
frecvenţa simplă.
TABEL STATISTIC PENTRU O VARIABILĂ CALITATIVĂ SAU CANTITATIVĂ DISCRETĂ

Efectivul Frecvenţa
Frecvenţa Frecvenţa cumulat relativă
Caracteristica absolută relativă Ni (asc./desc.) cumulată
xi (efectivul)ni fi Fi (asc./desc.)
x1 n1 f1 N1 F1
x2 n2 f2 N2 F2
. . . . .
. . . . .
. . . . .
xi ni fi Ni Fi
. . . . .
. . . . .
. . . . .
xm nm fm Nm Fm
m m

 ni  n  fi  1
TOTAL i 1   i 1     
TABEL STATISTIC PENTRU O VARIABILĂ CANTITATIVĂ CONTINUĂ

Frecvenţa Efectivul Frecvenţa


absolută Frecvenţa cumulat relativă
Caracteristica (efectivul) relativă Ni (asc./desc.) cumulată
xi ni fi Fi (asc./desc.)
x0-x1 n1 f1 N1 F1
x1-x2 n2 f2 N2 F2
. . . . .
. . . . .
. . . . .
x(i-1)-xi ni fi Ni Fi
. . . . .
. . . . .
. . . . .
x(k-1)-xk nm fm Nm Fm
TOTAL n 1    
4. Statistică, analiză spaţială şi cartografie
Utilizarea statisticii poate permite
afinarea analizelor structurilor
spaţiale, capacitatea sa de
sinteză a volumelor mari de date
reflectându-se şi pe documentele
cartografice.

1. Statistica permite studiul


sintetic al distribuţiilor numerice
şi deschide calea aprofundării
analizei cartografice.

2. Cartografia permite studiul


sintetic al distribuţiilor spaţiale şi
lansarea ipotezelor pentru analiza
spaţială.

3. Analiza spaţială permite studiul


geografic al structurilor spaţiale,
fiind o combinaţie de metode
statistice şi cartografice.