Sunteți pe pagina 1din 8

Alina-Maria Stancescu, GIS an 2

Subiect: Meuse, Cadmium

Metoda

Testarea normalitatii in limbajul R


Majoritatea procedurilor de analiza statistica pleaca de la ipoteza ca seturile de date au o distributie
normala.

Pentru a verifica daca aceasta ipoteza este valida se efectuaza Shapiro-Wilk Test. -fig.1

Ipozeta nula a acestui test este ca datele au o distributie normala, iar ipoteza alternativa este ca datele
nu au o distributie normala.

Se respinge ideea daca rezulatul lui P-value este mai mic de 0,05, iar daca este mai mare de 0.05
atunci presupunem ca datele au o distributie normala.-fig.2

Fig.1
Fig.2

P value - probabilitatea cu care gresesc daca resping ipoteza nula

Tendita: scade

ArcGIS
Kriging

Inainte de a incepe sa facem Kriging trebuie verificate datele. Pentru a aplica kriging trebuie ca
datele :

-sa aiba distributie normala

-sa nu aiba tendinte

-sa fie date stationare


Verificarea datelor
Setul de date Meuse_Cadmium prezinta tendinta (scade), nu are o distributie normala, si datele sunt
stationare.

Deoarece setul de date pentru Cadmium prezinta si valori cu 0, cand doresc sa aplic Kriking-ul nu
pot sa logaritmez si sa uniformizez setul de date(sa rezulte o distributie normala).

Prin urmare, am interpretat setul de date in urmatorul mod: pentru a putea netezi datele, am ales sa
sterg valorile cu 0, deoarece acolo nu exista urme de Cadmium, astfel analiza statisticanu este
influentata.

Histograma

asimetrie pozitiva (valorile sunt in partea stanga) – fig.3

netezirea suprafetei dupa logaritmare – fig.4

Fig.3
Fig.4

QQ-Ploot -nu avem distributie normala conform QQ plot – fig.5

Fig.5
Rezolvarea distrubutiei dupa logaritmare – fig.6

Fig.6

Voronoi Map- date stationare – fig.7

Fig.7
Rezultate

Kriging Universal
Am ales sa aplic Kriging Universal deoarece am tendinta in setul de date.(fig.8-fig.11)
Pentru a indeplini conditia de uniformizare a setului de date, am ales sa aplic o transformare
logaritmica asupra lui.

Fig.8

Fig.9
Fig.10

Fig.11
Concluzii
Pentru validarea rezultatelor am folosit Subset Feature din Geostatistical Analysis.
Intai am ales datele de test, aleator. (20 de puncte) aproximativ 12procente din totalul datelor.
Am rulat validarea pe baza datelor de test, apoi am evaluat interpretarea validarii. Astfel media
erorii este 0.3, este aproape de 0, adica metoda aleasa este corecta. -fig.12

Fig.12

Astfel pot ajunge la concluzia ca metoda geostatistica de interolarea aleasa este cea mai optima
pentru a analiza acest set de date.