Sunteți pe pagina 1din 3

ECONOMETRIE SPATIALA (Tectonic Shifter):

Crearea bazei de date:


->Trebuie sa faci un inner join cred pe cele doua baze de date din folderul
"Crearea bazei de date"
->Trebuie sa imbogatesti prima baza de date sau sa transpui coloana cu anii in mai
multe coloane cu fiecare an in parte ( gandestete la ce ai facut la softwere
statistic la proiect); rectific, trebuia transpus daca foloseam mai multi ani; asa
daca folosesc doar 2018 trebuie doar sa fac un filtru pe coloana year cu valoarea
2018
-> Odata transpusa, baza de date trebuie filtrata cu ce e necesar:
->Trebuie sa te hotarasti, ori alegi cel mai recent an cu toate datele disponibile
(aprox.) or faci pentru 2019 o medie mobila pentru doata Elvetia care nu are date.
->Pentru a invata cat mai mult propun ca join-ul sa il faci cu sql code (era o
librarie in python care iti permitea sa faci asa ceva); pentru transpunerea si
modificarea datelor propun python (este recomandat pentru a te pregati pentru
intership sau poate chiar post de lucru)
->Harta pe care o voi folosi este ori cea folosita la proiectul initial (desi nu
recomand din cauza tuturor insulelor alora) sau harta Europei de la clasa) : in
ambele sunt insule si in ambele trebuie sa am grija la matricea de ponderare
spatiala

*Inainte de a incepe analiza este recomandat sa te uiti pe inregistrarea facuta la


clasa cand s-a prezentat sa iti iei o mai buna idee pentru ce trebuie sa contina
Analiza datelor:
-> Refa analizele din proiect, de data aceasta cu corectarile necesare
-> Analizele mai compleze de la sfarsit necesita mai mult timp pentru a intelege ce
reprezinta toti indicatorii si pentru a ajunge la modelul cel mai potrivit pentru
date.

### Notite cursuri econometrie spatiala


Lucrari stintifice: Moran 1948, Geary 1954 si Whittle (pioniieri)
Cliff si Ord ( Spatial autocorrelation)
Paelink si Klaassen ( econometrie spatiala):
-Rolul interdependențelor spațiale în modelele de analiză, în special cele
spațiale,
- Gradul de asimetrie care apare în interdependențele spațiale,
- Importanța factorilor explicativi regăsiți în alte spații,
- Diferențele care există înainte și după ce au loc interacțiunile,
Modelarea explicită a spațialității.

!!!!!Statistica spațială măsoară gradul de asociere teritorială pentru entități


aflate la diverse distanțe!!!!

Econometria spațială modelează interacțiunile teritoriale între seturi de ”vecini”


pentru diverse observații. Efectele spațiale surprinse au la bază două
caracteristici – dependența (autocorelația) spațială și eterogeneitatea spațială.
Plecând de la econometria seriilor cronologice, Anselin (1988) identifică și
explică și în cazul cercetărilor spațiale două tipuri de modele – cu decalaje
(spatial lag model) și cu erori (spatial error model).

Tipuri de convergenta ---

HArtile:
Vizualizarea efectivă a distribuției spațiale a unităților statistice analizate
(în special hărțile);
Reliefarea observațiilor atipice - outlier-ilor (unitățile statistice cu valori
extreme) (ex. box-plot);

Evidențierea schemelor de asociere spațială – gradul și tipul concentrării


spațiale, valoarea și nivelul de semnificație al autocorelației spațiale globale și
locale.

Detectarea schemelor specifice de eterogenitate spațială și formularea unor


ipoteze privind cele mai adecvate modele spațiale.

Cartograma (harta)
Este orice hartă pe care locații spațiale distincte sunt reprezentate cu culori
diferite, în funcție de valoarea variabilelor analizate.
Se poate utiliza singură sau însoțită de histogramă —> histograma cartografică

---Quantilelor – se alege numărul de grupe în care dorim să împărțim eșantionul


studiat. Implicit este 4 – quartile – fiecare grupă cuprinde 25% din unitățile
statistice studiate. Putem alege însă și 2 – mediana - sau alte valori.
Fiecare clasă are număr egal de membri.

Procentilelor – cele 100 de grupe sunt sintetizate în 6 clase: <1%, între 1-10%,
între 10-50%, între 50-90%, între 90-99% și peste 99%.

Dispersiei – bazată pe abaterea medie pătratică. Unitățile spațiale sunt grupate în


k grupe, fiecare grupă conținând observațiile situate în intervalul
Spre deosebire de primele două tipuri de cartograme, în cazul acesteia,
numărul de elemente din fiecare grupă nu mai este același, ci el depinde de
distribuția valorilor.

Cand este folositor sa folosim cartodiagrama?

----Observatii extreme
Sunt considerate extreme observațiile care:
Sunt mai mari decât q3+1,5*(q3-q1),
Sunt mai mici decât q1-1,5*(q3-q1),
Sunt înafara intervalului

Ele pot fi vizualizate cu ajutorul cartogramelor, a box-plot-ului și a box-hărții


(box-map).

Matricea de ponderare spațială generalizată


Decalajul spațial

!!!!Validarea :
Se bazează pe simulări și nu pe testarea clasică de ipoteze.
Aceasta, deoarece complexitatea proceselor spațiale îngreunează găsirea unui test
statistic a cărui distribuție probabilistică să fie cunoscută. !!!!

Diagrama si testul Moran :


Permite vizualizarea grafică a autocorelației și eterogenității spațiale, cu
predilecție a autocorelației spațiale globale.

Este formată din 4 cadrane:


HH (high - high) – unități spațiale cu valori ridicate ale variabilei analizate
sunt asociate (învecinate) cu unități spațiale cu aproximativ acealeași niveluri
ale variabilei.
LL (low - low) - unități spațiale cu valori scăzute ale variabilei analizate sunt
asociate (învecinate) cu unități spațiale cu aproximativ acealeași niveluri ale
variabilei.
HL (high - low) – unități spațiale cu valori ridicate ale variabilei analizate sunt
învecinate cu unități spațiale cu valori scăzute ale variabilei.
LH (low - high) – unități spațiale cu valori scăzute ale variabilei analizate sunt
învecinate cu unități spațiale cu valori ridicate ale variabilei.

Cadranele HH și LL corespund autocorelației spațiale pozitive și arată gruparea/


concentrarea spațială a valorilor similare în spațiu.

Cadranele HL și LH corespund autocorelației spațiale negative și arată gruparea/


concentrarea spațială a valorilor diferite în spațiu. Ele evidențiază localizările
atipice (punctele de nestaționaritate locală, outlier-ii spațiali).

Validarea statisticii Moran I


Are loc prin testarea stabilității valorice.
Principalul procedeu este prin permutări aleatoare (randomization).

Se generează aleator seturi de date spațiale cu aceeași distribuție ca și datele


reale.
Numărul de permutări folosit poate fi ales din mai multe opțiuni (99 – 999 sau
chiar 49999).

Cica aveam voie sa luam hartile, dar nu avem voie sa fie gata cu datele.... ceea ce
am facut eu ??? va trebui sa caut o diferita baza de date

S-ar putea să vă placă și