Sunteți pe pagina 1din 33

STATISTICĂ SPAȚIALĂ

Prof.dr. Zizi Goschin,


Departamentul de Statistică și Econometrie,
cam. 2610, 2606; zizi.goschin@csie.ase.ro
S1. Introducere în GEODA.
Hărți
GEODA - Geographic Data Analysis
(http://geodacenter.github.io/) este un software gratuit,
open source, specializat în analize
spatiale.

Download GeoDa 1.18 pentru Windows sau Mac:


http://geodacenter.github.io/download.html
1. Dublu clic pe fisierul
Instalare software
descarcat de pe site.

2. Acceptati activarea fisierului


executabil: clic pe Run. Sursa este
sigură: Center for Spatial Data 3. Selectati limba
Science, Universitatea din Chicago. engleza..
APLICAȚIA 1.
• Inițierea unei sesiuni de lucru în Geoda folosind fișierele
spațiale din folderul „fisiere GeoDa – judete” (descărcate
pe desktop).

• Încărcarea datelor din fisierul Excel „date judet.xls”.


• Construirea de hărți.
Inițierea unei sesiuni de lucru

• Activati GeoDa (cu dublu clic pe shortcut)

ÞSe deschide meniul principal:

• In continuare încărcăm fișierele de lucru din folderul „fisiere


GeoDa – judete”.
IMPORTANT: Fișierele folosite de Geoda au 3 componente
obligatorii, care au același nume (dar extensii diferite) și
trebuie să se afle toate în același folder (în acest caz, folderul
„fisiere GeoDa – judete”):

•Fișierul nume.shp – conține geometria teritorială cu care


lucram (puncte sau poligoane)
•Fișierul nume.dbf – conține date (valorile variabilelor
corespunzătoare unităților teritoriale analizate)
•Fișierul nume.shx – indexul unităților teritoriale

La inițierea unei noi sesiuni de lucru trebuie să avem în


prealabil setul de fișiere (.shp, .dbf, .shx) pentru structura
teritorială pe care o analizăm (în acest caz, județele României).
Încărcarea unui fișier – varianta 1
File → New → Connect to Data Source: Input file –clic pe , apoi
selectăm din lista derulanta din dreapta jos tipul fișierului care va fi încărcat:
ESRI Shapefile
1 Acces rapid la
fișierele folosite
recent.

3
Deschidem întâi un fișier shapefile,
pentru a accesa geometria spațială.
După ce am precizat tipul fișierului (ESRI shapefile) se deschide o noua
fereastră: Choose a spatial file to open. Bowse folderul „fisiere GeoDa
– judete”, selectăm fisierul judete.shp, clic pe Open.
2. Varianta mai rapidă de încărcare a fișierelor: în fereastra anterioară
Connect to Data Source se selectează fișierul judete.shp din folderul
„fisiere GeoDa – judete”de pe desktop și se mută cu mouse-ul în căsuța
”Drop files here” (funcția ”drag and drop”).
1 După incarcarea fișierului
shapefile (indiferent de variantă) se
deschide automat o hartă neutră;
este necesara pentru a verifica
dacă am accesat geometria
teritoriala corectă; o închidem
imediat.

2 Se deschide tabelul cu
date din GeoDa cu clic pe
semnul de tabel din
meniul principal.
3 Se vizualizează datele existente deja în fișierul judete.dbf.
Variabilele: populatie (persoane), PIB pe locuitor (lei/pers.), suprafața
județului (ha). Tabelul are 42 rânduri.
IMPORTUL DATELOR: Table → Merge → în fereastra Merge – Judete
care se deschide, în Select data source, clic pe semnul de folder care
se deschide.

1 2
Varianta 1. În fereastra Connect to Data Source, clic pe semnul de
folder deschis -> selectam tipul fisierului (Excel) în noua fereastra
de dialog, apoi selectam fisierul “date judet.xls” și clic pe Open.
Varianta 2. Clic pe semnul de folder deschis -> în noua fereastra de dialog, “Drag and drop” în
căsuța “Drop files here” fisierul “date judet.xls”, selectat din folderul „S1. Harti Geoda”.
Indiferent de varianta aleasă, în următoarea fereastra de dialog, fisierul “date judet.xls”
apare la Select datasource și numele variabilelor pe care le contine apar în căsuța Exclude.
• Cheia de identificare a unităților
teritoriale este numele județului;
variabila trebuie denumită diferit în
fișierul sursă ”date judet.xls” (jud)
IMPORTANT! DE RETINUT!

față de fișierul destinație


”judete.shp” (JUDET).

• Numele județelor trebuie să fie


identice în fișierul sursă și în fișierul
destinație; nu se admit diacritice.

• Ordinea județelor in tabel nu are


importanță deoarece identificarea lor
este asigurată prin variabilele jud și
JUDET.
1 1. În fereastra Merge este bifată
automat opțiunea Merge by key
values; selectam key values: JUDET
pt current table (din Geoda) si jud pt
import table (fisierul Excel).

Se mută
toate
variabilele
simultan

Se mută
câte una.

Se mută
înapoi.
2

2. Transferăm variabilele de importat din


caseta dreaptă (Exclude), care conține lista
variabilelor existente in fișierul Excel, în
caseta stângă (Include) – clic Merge
3. Daca nu sunt probleme, apare un mesaj de
confirmare – clic OK.
3

Dacă există diferențe între cele două variabile de identificare


Jud si Judet (de exemplu, denumiri diferite pentru același
judet), apare un mesaj de eroare:
Fisierul care conține datele (.dbf) are anumite cerințe privind
denumirile variabilelor importate:
- max. 10 caractere
- fără spații
- fără diacritice.

În cazul în care variabilele importate din Excel nu respectă condițiile,


se propun automat denumiri conforme, dar acestea pot fi schimbate
Eroare: cu unele mai sugestive.
același nume
pt key
variable in
fișierul sursa
si destinație.

Eroare: spațiu
in numele
variabilei
Deschizând tabelul vizualizăm variabilele importate (ultimele coloane).
Variabilele JUDET și jud ne permit să verificăm corectitudinea fuzionării
(județele trebuie să fie în aceeași ordine pe cele 2 coloane).
Putem șterge una din variabilele de identificare (de ex. jud) și/sau alte variabile
inutile. Meniu: Table → în fereastra Delete variable (selectăm variabila jud) →
Delete
Chiar dacă vom continua sesiunea de lucru, este bine
să salvăm imediat modificările făcute: File – Save
sau un clic pe iconița Save din meniu.
Toate modificările nesalvate se pierd.

Închidem Geoda (implicit și sesiunea de lucru) cu File – Exit. Avem opțiunea să


salvăm proiectul pentru a accesa mai ușor aceste date în sesiuni de lucru
ulterioare: 1. File - Save Project – 2. Răspundem YES la întrebarea Create
project file now? – 3. Alegem locația (folderul Judete) și numele proiectului
”judete new.gda” – Save - 4. Mesaj de confirmare - OK.

2
3

4
Noul proiect se găsește acum în folderul fisiere GeoDa – judete care
conține fișierele spațiale (.shp, .shx, .dbf).

Cu dublu clic pe

activăm imediat Geoda și accesăm datele salvate anterior.


Hărțile pot fi accesate direct din meniul principal, cu clic pe iconiță,
sau pe Map.

Tipuri de hărți
disponibile.
Themeless map
este o hartă ce
prezintă doar
geometria
teritoriului, fără
date.
1
Equal intervals map. Crearea unei
hărți în care variabila ”populatie 2006”
este grupată in 6 intervale de variație
egale:Map - Equal intervals map –
selectarea variabilei și a nr. de grupe
(classes) – OK.

3
2
Intervalele egale nu sunt
indicate când există outlieri
(aici două intervale au
frecvența nulă, iar 25 județe
sunt în prima grupă)

Intervalele inegale oferă o imagine mai clară a variației. Map -


Natural breaks map – selectarea variabilei Pop2006 și a nr. de
grupe (tot 6) – OK. Un algoritm special alege limitele grupelor a.î.
să maximizeze omogenitatea în grupe.

Nu mai există
intervale cu frecvența
nulă și diferențele de
populație dintre județe
sunt mai clare.
Quantile map - variabila selectată este distribuită în 2
până la 10 grupe cu număr (aproximativ) egal de termeni
(de unități teritoriale).

Creăm o hartă
cu cinci grupe
de populație,
fiecare având nr.
egal de județe.
Quantile map – pentru variabila ”populatie 2006”
42 nu se împarte
exact la 5!

Ex. 1: 5 grupe cu
8-9 termeni
(județe) fiecare.

Ex. 2: 7 grupe
(cu 6 termeni
fiecare)
Standard deviation map – gruparea județelor după distanța
față de medie. Grupele formate reprezintă 1, 2 și respectiv 3
abateri standard sub media variabilei (bleu-albastru) și 1, 2, 3
abateri standard peste medie (roz-roșu). Outlierii sunt la peste 2
abateri standard de medie (aici, București).

outlier
media
Box map – o grupare pe
cuartile (4 grupe, fiecare
cu 25% din termeni)
excluzând însă valorile
extreme (lower și upper
outlier) situate la
capetele distributiei.

Valori extreme= valori


identice
care sunt de peste 1,5
sau 3 ori mai mari/mici
decât intervalul inter-
cuartilic (Q1-Q3).

-arată împrăștierea față


de mediană;
-echivalentul spatial al
Box-plot.
APLICAȚIA 2.
• De pe site-ul INS, descărcați datele privind rata șomajului în anul
2019, în România, la nivel de județ.
http://statistici.insse.ro:8077/tempo-online/#/pages/tables/insse-table

• Încărcați datele în GeoDa.

• Reprezentați datele pe hartă.

S-ar putea să vă placă și