Sunteți pe pagina 1din 6

Modelarea și vizualizarea geospațială a datelor statistice

1. Reprezentarea datelor în GIS (Geographic Information System)

1.1 Tipuri de date spaţiale

Data spaţială este un termen utilizat pentru a descrie datele care aparţin spaţiului ocupat de
obiectele unei baze de date. În sens larg, datele spaţiale pot fi: puncte, linii, poligoane, suprafeţe,
volume (date având mai multe dimensiuni), numite generic, vectori.
Punctul este caracterizat prin locaţia sa, nu ocupă spaţiu şi nu are asociată o arie sau un
volum. Intr-o bază de date, punctul se stochează printr-o măsură directă a lui sau printr-o măsură
indirectă (transformare). Data de tip raster este un exemplu de folosire a măsurii directe a unui punct
şi include harta de pixeli (imaginea bitmap). De exemplu, o imagine preluată din satelit realizează o
corespondenţă directă între un pixel de imagine şi suprafaţa acoperită de el pe suprafaţa terestră.
Linia se caracterizează prin existenţa a două puncte (cel de început şi cel de sfârşit) urmând
ca punctele intermediare să fie generate prin ecuaţia dreptei. Un obiect spaţial este descris, de obicei,
printr-o colecţie de segmente ca de exemplu cursul unui râu sau un drum. Caracteristica nonspațială
asociată în mod implicit acestui tip de dată spațială este lungimea (Shape_Lenght).
O dată spaţială de tip poligon se caracterizează printr-o locaţie şi un contur. Locaţia este dată
de un punct fix pentru a ancora poligonul în spaţiu (de obicei este punctul din centrul regiunii,
denumit centroid). In spaţiul bidimensional, conturul se vizualizează ca o linie iar în spaţiul
tridimensional ca o suprafaţă. Data de tip poligon stocată într-o bază de date este o aproximare
geometrică a unui obiect spaţial care ocupă o anumită suprafață în spațiul real (de exemplu, judeţele
unei ţări, lacurile etc.). Caracteristicile nonspațiale asociate, în mod implicit acestui tip de dată
spațială, sunt: perimetrul (Shape_Lenght) și aria (Shape_Area).
Coordonatele unui punct se precizează printr-o pereche de valori (x,y) sau prin tripleta
(x,y,z), unde z exprimă altitudinea punctului. Coordonatele punctelor furnizează datelor spaţiale
două perspective: una geografică care depinde de sistemul de coordonate folosit şi referă poziţia şi
eventual dimensiunea elementului în spaţiul real precum şi una ecran ce ţine de afişarea datelor
spaţiale pe monitorul calculatorului.

Un sistem de coordonate este un sistem pentru referirea locaţiilor caracteristicilor spaţiale pe


suprafaţa pamântului. Deoarece sistemele informatice geografice lucrează cu date geografice,
sistemul de coordonate joacă un rol cheie într-un proiect GIS. Sunt două tipuri de sisteme de
coordonate: geografice şi proiecţii.

Figura 1. Latitudine - Longitudine


1
Un sistem de coordonate geografice este format din longitudine şi latitudine. Prin longitudine
se înțelege unghiul format între primul meridian și poziția pe glob, în timp ce prin latitudine se
înțelege unghiul format între ecuator și poziția pe glob (figura 1).
Un sistem de coordonate de tip proiecţie este un sistem de coordonate în plan, bazat pe o
proiecţie a hărţii. Hărţile sunt reprezentate în plan dar ele reprezintă suprafeţe curbe. Transformarea
spaţiului tridimensional într-un spaţiu bidimensional se numeşte proiecţie (figura 2). De exemplu,
sistemul de coordonate UTM (Universal Transverse Mercator) se bazează pe proiecţia Mercator.

Suprafața pamântului
Proiecția
Harta în plan

Figura 2. Proiecția
hărților
Un sistem de coordonate, fie geografic fie proiecţie, este definit de un set de parametri.
Parametrul de bază al unui sistem de coordonate geografic este datum-ul. Datum-ul este o
reprezentare matematică a formelor pe suprafaţa pământului. Un datum este definit printr-un sferoid
care aproximează forma pamântului şi prin poziţia relativă la centrul pamântului. Există mai multe
astfel de reprezentări. Datum-ul orizontal furnizează un cadru de referinţă pentru măsurarea locaţiilor
de pe suprafaţa pământului. Un datum local aliniază sferoidul astfel încât acesta să cuprindă cât mai
exact o anumită suprafaţă din suprafaţa pământului; punctul de origine este localizat pe suprafaţa
pământului şi nu în centrul lui. De exemplu, datumul European din 1950 şi NAD27 sunt datum-uri
locale. Spre deosebire de un datum local, un datum centrat pe întregul pământ nu are un punct iniţial
de origine; în acest caz, centrul pamântului este considerat a fi originea. Cel mai recent datum definit
şi utilizat având ca sferă de cuprindere întregul pământ este WGS84 (World Geodetic System din
1984).
Parametrii unui sistem de coordonate de tip proiecţie defineşte nu numai proiecţia ci şi sistemul de
coordonate geografic care este astfel proiectat. Spre exemplu, pentru România sistemul geografic de
coordonate este Stereo70, proiecţia stereografica, datum Pulkovo 1942, elipsoid Krasovsky 1940.

Figura 3. Vizualizarea spaţială a tabelei judeţe

2
Datele spaţiale sunt frecvent puse în corelaţie cu atribute convenţionale (date nonspaţiale). De
exemplu, un judeţ se descrie spaţial printr-un poligon (regiune) dar şi nonspaţial prin nume,
reședință, număr de localităţi, populaţie etc. In funcție de modul de organizare a datelor și al
realizării legăturii dintre atributele nonspațiale și cel spațial s-au definit două modele:
 Modelul de date georelațional implică stocarea datelor în formate independente care
se bazează pe divizarea atributelor în două entități și stocarea lor separată. Astfel, o dată spațială este
alcătuită din atributul spațial, care se stochează separat de atributele nonspațiale, legătura fiind făcută
prin intermediul unui câmp de identificare (ID), ce are rolul de combina, în mod coerent, cele două
tipuri de atribute. Legătura dintre entități se poate face bidirecțional adică fie de la cele spațiale către
cele nonspațiale sau invers, ca în figura 5. Acest lucru este vizibil la formatul independent shape
(shp) deoarece acest format are, din punct de vedere fizic, mai multe fișiere printre care cel cu
extensia shp care stochează geometria datelor și cel cu extensia dbf care stochează atributele
nonspațiale sub forma unei tabele de date conform modelului relațional. Legătura înainte (figura 5a)
este utilizată la accesarea informaţiilor spaţiale ale unui obiect, pornind de la informaţiile lui
nespaţiale în timp ce Legătura înapoi (figura 5b) foloseşte la regăsirea informaţiei nespaţiale a unui
obiect pornind de la informaţia lui spaţială.
 Stocarea datelor spațiale prin modelul geobază de date presupune stocarea atât a
atributelor spațiale cât și a celor nonspațiale, împreună, într-o tabelă de atribute. Câmpul care conține
atributul spațial este de tip shape (formă geometrică) iar din perspectiva sistemului de gestiune a
bazelor de date este de cele mai multe ori un câmp de tip BLOB (binary large object). Există
extenstii ale unor SGBD-uri care includ si tipuri asociate datelor spațiale cum ar fi Oracle Spatial,
extensia spatiala a celor de la Oracle sau mai nou, în MSSQLSERVER. Atributele spaţiale ca şi cele
nespaţiale apar şi la nivelul conceptual. Astfel, valoarea unui atribut spaţial este comună tuturor
atributelor nespaţiale dintr-un tuplu. Tuplurile unei tabele care conţine un atribut spaţial pot fi
vizualizate atît geometric (spaţial) cît şi în mod clasic, relaţional (tabelar).
Pentru exemplificare, să presupunem că tabela judeţe stochează judeţele României descrise
printr-un atribut spaţial de tip poligon (suprafaţă) şi prin atribute nonspaţiale: simbolul judeţului,
numele şi reşedinţa lui. In figura 3 se vizualizează tuplurile în formă geometrică în timp ce, în figura
4, aceeaşi tabelă se vizualizează tabelar.

Figura 4 Vizualizarea tabelară a relaţiei judeţe

Se poate observa că tabela este indexată după cel puțin două câmpuri:

3
- OBJECTID, de tip numeric, care indentifică în mod unic un judeţ (tuplu) şi care reprezintă
cheia primară a tabelei și satisface astfel, restricția de unicitate a cheilor din modelul de date
relațional (PRIMARY KEY);
- Shape, atributul care stochează data spațială, vectorială, iar în acest caz indexul este unul
spațial, construit folosind tehnici ce țin de natura acestor date și el permite regăsirea datei
spațiale mult mai rapid prin restrângerea zonei din hartă unde se cauta elementul. Structuri de
date consacrate pentru reprezentarea și indexarea datelor spațiale sunt Quadtree și R-tree,
împreună cu variantele lor.
Construirea talelelor de date, în baze de date geografice, folosind ArcGIS Pro, determină în mod
automat existența acestor două atribute, dacă este vorba de o tabelă spațială (Feature Class) sau doar
a atributului OBJECTID dacă tabela creată este nonspațială (Table).
Modelul orientat obiect poate fi de asemenea utilizat ca fundament pentru bazele de date
spaţiale. Aceast model de date permite o mai bună structurare a informaţiilor, prin introducerea
conceptelor de clasă şi moştenire. Încapsularea datelor şi supraîncărcarea funcţiilor facilitează
manipularea datelor şi fac ca reprezentarea fizică şi logică a datelor să fie independente, una în raport
cu cealaltă. In cazul bazelor de date spaţiale, concepte precum: clasa, moştenire, încapsulare, tip şi
metodă sunt uşor de utilizat. Diferitele tipuri spaţiale de date pot fi implementate ca nişte clase cu
posibilităţi de a fi moştenite, construind subclase. Astfel, datele spaţiale pot fi modelate la două
niveluri: hartă şi geometric. O bază de date spaţială conţine un set de hărţi, unde o hartă este o relaţie
care are cel puţin un atribut spaţial. Operaţiile cu o hartă sunt implementate ca metode ale obiectelor
ce aparţin hărţii. Nivelul geometric corespunde atributelor spaţiale care sunt reprezentate prin tipuri
de date geometrice, ca de exemplu: puncte, linii, poligoane etc.
Atribute nespaţiale Structuri de date spaţiale

Date nespaţiale pentru Regiunea 1 Regiunea 1

Date nespaţiale pentru Regiunea 2 Regiunea 2

Date nespaţiale pentru Regiunea 3


Regiunea 3 Regiunea 4
Date nespaţiale pentru Regiunea 4

Date nespaţiale pentru Regiunea 5

Regiunea 5

(a)

4
Structuri de date spaţiale
Atribute nespaţiale

Date nespaţiale pentru Regiunea 1 Regiunea 1

Date nespaţiale pentru Regiunea 2 Regiunea 2

Date nespaţiale pentru Regiunea 3


Regiunea 3 Regiunea 4
Date nespaţiale pentru Regiunea 4

Date nespaţiale pentru Regiunea 5

Regiunea 5

(b)
Figura 5 Tipuri de legături: înainte (a) şi înapoi (b)

1.2 Modelul raster

Pe lângă reprezentarea vectorială, lumea mai poate fi reprezentată şi în format raster sau
bitmap. In acest format, o imagine se reprezintă ca fiind un grid de culoare, fiecare celulă (pixel)
acoperă o anumită arie de pe suprafaţa terestră. Gridul (imaginea) este, de asemenea, localizată
geografic în spaţiu. Cu alte cuvinte, o dată spaţială de tip raster conţine pe lângă harta propriu-zisă de
biţi şi informaţii de localizare în spaţiul geografic, astfel se spune că imaginea este georeferențiată. In
acest format sunt furnizate hăţile de către salteliţi, cele obţinute prin scanare, prin fotografierea
arealului studiat (ortofotoplan) etc. Pornind de la hărţile în format raster, prin procesul de vectorizare
se obţin atributele spaţiale care sunt apoi grupate pe straturi tematice (layers). Reprezentările în
format raster sunt adesea utilizate pentru a reprezenta altitudinea unei regiuni prin folosirea unui
gradient de culoare astfel încât variația culorii are semnificația de variație a altitudinii punctelor pe
care le reprezintă. In GIS reprezentările raster se pot combina cu reprezentările vectoriale pentru a
oferi mai mult realism regiunii analizate. Spre exemplificare, în figura 6, se reprezintă în ArcGIS Pro
o zonă din Bucureşti printr-un raster în format tif (un ortofotoplan), iar clădirile analizate sunt
reprezentate printr-un strat tematic de tip poligon. Pentru a oferi mai mult realism zonei analizate,
harta 2D a fost transformată în 3D ceea ce a permis vizualizarea cladirilor atât după forma cat și după
înălțimea lor (figura 6). O altă utilitate a hărților în format raster este dată de faptul că, prin
intermediul lor se pot exprima fenomene dintre cele mai diverse care nu pot fi delimitate aprioric
spațial prin existența unor vectori. De exemplu, dacă se urmărește vizualizarea răspândirii noxelor în
diverse concentrații pe arealul studiat, se va utiliza o reprezentare de tip raster deoarece fenomenul
nu poate fi limitat la granița unui județ sau a unei regiuni. Insă dacă dorim să analizăm rata șomajului
atunci este indicat ca acest indicator să se vizualizeze pe date vectoriale care să reprezinte unitățile
administrative pentru care au fost colectate datele. Ulterior, prin agregare, acestea se pot reprezenta
și la nivelul altor unități adninistrative, de exemplu, județele unei tări, prin agregare se pot obține
datele la nivelul regiunilor de dezvoltare, apoi la nivelul macroregiunilor sau chiar pentru țările unui
continent.

5
Figura 6. Descrierea unei regiuni prin vectori şi raster în format 3D și 2D

S-ar putea să vă placă și