Documente Academic
Documente Profesional
Documente Cultură
Normalizarea datelor
- introducem setul de date .dbf
- Analyse -> Descriptive statistic -> Explore -> introducem variabila, la Plot bifm Norm T Test.
p > 0.05 = date parametrice (Probabilistici)
p < 0.05 = date nonparametrice (Deterministici)
> 50 eantioane = Kolmogorov
< 50 eantioane = Shapiro-Wilk
- n Gis facem histograma, qqplot
- Skewness (asimetrie) = ptr distribuia normal trebuie s fie aproape de 0
- Kurtosis = ptr distribuia normal trebuie s fie aproape de 3
- Media i Mediana = valorile lor s fie egale sau apropiate
- n search Morans1 pentru Autocorelarea datelor -> Geoprocessing -> Results
A. Metode Deterministice
- Prima Lege a Geografiei: Punctele apropiate sunt mai relaionate dect cele ndeprtate
- punctele pot fi distribuite diferit: clasterizat, aleatoriu (cu distane diferite ntre ele) sau uniform.
1. Global Polynomial:
- pentru suprafee mari
- ne arat tendina general (nu scoate n eviden anomaliile locale)
- calculeaz o singur ecuaie pentru zona de studiu
- se folosete cel mai mult pentru valorile care se schimb ncet, gradual (ex. Temperatura)
- folosete tot setul de date pentru estimarea valorii
2. Local Interpolation:
- se folosete cnd am variaii locale n setul de date
- creaz cte un polinom ptr fiecare punct n care interpoleaz
- nu cere anumite condiii (nu trebuie s fie distribuite normal)
- nu este folosit tot setul de date pentru estimarea valorilor, ci doar punctele cele mai apropiate
- trebuie cunoscut fenomenul pentru alegerea ariei potrivite pentru interpolare.
- Exploratory: ct de local vrei s fie interpolarea
- Kernel = ptr poligoane de ordin 1,2,3 (teoretic)
3. IDW
- are la baz 100% principiul geografiei
- fa de ceilali 2 (global i local), este un interpolator exact (trece prin punctele ini iale, dup interpolare
valorile rmn aceleai).
- nu se folosete cnd avem goluri mai mari n setul de date (din punct de vedere spaial)
- Cross validare: ia setul de date, taie un punct i aplica aceeai formul ca s calcuzele valoarea din
punct. (testeaz o formul pentru fiecare punct n parte). Dac eroarea i eroare medie sunt mici, e bine
- puterea optim e atunci cand eroarea e cea mai mic
- cu ct puterea crete, particularitatea local scade; cu ct puterea scade se generealizeaz mai bine
interpolarea
- dac am mai muli vecini, mi omogenizez valorilor
- sectoare: sunt mai multe puncte luate n considerare
modific sector type cnd am o zon n care punctele nu sunt perfect distribuite.
- dezavantaje : scoate n eviden tendinele ; dac dataele nu sunt uniform distribuite, erorile sunt mari.
***
RMS = apropiat de 1
4. Model DEM
a) Anudem = Topo to raster
- tine cont de cote, curbe de nivel, reteaua hidro, lacuri, si o limita a zonei de studiu
b) Natural Neighbor
- interpolator exact
- vizual d rezultate suficient de asemntoare cu ce trebuie s ias.
- pentru fiecare punct ce trebuie interpolat, metoda calculeaz un poligon Voronoi (nu returneaza
suprafata, ci doar vectori/obiecte)
- n search: Natural Neighbour -> rezoluia la 3000 m
- barier n setul de date: Spline with Barrires -> bag punctele, valoarea i bariera.
Triangulaia (TIN) = distana dintre puncte i valoarea lor. Unete prin triunghiuri toate punctele i
genereaz o reea de triunghiuri neregulate. Triunghiurile (se numesc delauney.) vor fi de a a natur nct
ele s fie inscriptibile. Folosit in special pentru altitudine.
- Search: Create TIN - input datele, la simbology Add - Simbology with the same.
Voronoi (ptr hidrologie mai mult) - jumtatea distanei dintre 2 puncte reprezint limita distan ei.
Nu ne intereseaz valorile punctelor, ci doar o gril de poligon ce se se afl la jumtatea celor 2 puncte
care au poligoane comune. Este un pas intermediar n analiz.
c) Universal
- se mai numete kriging din valori reziduale (ex. direcia de btaie a vntului)
- cnd exist o tendin n setul de date
- tendina se estimeaz cu ajutorul regresiei i face prima interpolare pt a ie i suprafa a; face diferen a
ntre valorile iniiale i rezultatul interpolrii, apoi face kriging pe coloana 3 (diferen a) i n final adun
prima interpolare cu interpolarea din kriging i iese suprafaa.
- un tabel cu coordonatele fiecrui punct i nc 2 coloane care ne indic corela ia i n care se calculeaz
tendina (val de temp si altitudine).
d) Indicator
- putem s vedem care e probabilitatea de depire a unui prag
- scoate probabilitatea ca o anumit zon s arate ceva (ex: temp maxim 15 grade)
- folosit adesea pt a estima valori cuprinse ntre 0 i 1
e) Probability
- putem s calculm posibilitatea de a depi un prag
- nu estimeaz valori exacte, ci doar o estimare a probabilitii de depire sau nedepire a unui prag
-harta rezultat ne va spune dac punctele au depit sau nu pragul.
2. Semivariograma/variograma:
- grafic ce cuantific presupunerea ca lucrurile apropiate sunt asemntoare iar cele deprtate diferite
- arat cum se coreleaz valorile n raport de distana dintre punctele vecine i o direcie predefinit
- pe axa OX e distana iar pe OY diferena dintre puncte.
- pe grafic se reprezint un punct pentru fiecare pereche de puncte apropiate.
- linia albastr descris cum anume se modific valorile n raport de distan i direc ie. Ea nu trebuie s
fie plat. Trebuie s treac ct mai aproape de punctele albastre.
Lag Size = interval de distan ntre puncte
- search Average Nearest i ne uitm n Results la Observed.
Anizotropie = diferena ntre puncte pe o anumit direcie.
- dac pe o direcie temperatura scade mai repede dect pe cealalt direcie
- cnd axa minor difer de axa major spre exemplu cnd vrem s vedem distribu ia poluan ilor,
direcia acestora nu este dreapt.
- la Kriging i Local
- la Trend Analysis dau la 120 grade
- la semivariogram la hart, punctele de sus (stnga sau pe direcia \ ) iar punctele de jos (dreapta sau pe
direcia / ).
Range:
- distana fa de care (nu) mai exist corelare.
- unde curba se aplatizeaz se traseaz o linie pe axa OX i OY
- Lag Size x Number of Lags
Sill:
- diferena de valori pn la care exist corelaie ntre distana i valoarea punctelor.
- ajut la identificarea corect a lag-urilor (distana medie dintre puncte).
Nugget:
- distana dintre OY i locul de unde ncepe curba
- o oscilaie la microscar sau o eroare la msurtoare
- calculat automat = inexact, calculat exact = 0
3. Validare = interpolez dintr-un set de date i validez cu un al doilea set (secundar)
- search: Subset -> click pe el
- poi face validarea cnd ai minum 50 pct
- dup ce am fcut interpolarea... click dreapta pe Validation
4. Cross Validare = am setul mare de date, de unde programul scoate un punct din set i interpoleaz fr
acel punct.
- cnd am sub 50 puncte
- pe grafic, X = estimat, Y = msurat
- dac punctele grupate sunt n jurul liniei albaste iar linia albastr se afl n apropierea liniei gri, atunci
interpolarea este bun.
RMS = s fie ct mai mic
Med Standard = ct mai mic
RMSS = aproape de 1