Sunteți pe pagina 1din 8

Ministerul Educației al Republicii Moldova

Colegiul de Ecologie

Referat
Tema:Metoda aurelhy, reprezantivitatea spațială a
rețelei meteo.

A elaborat:Levcenco Mihaela

A verificat:Sorocovici Aurel

Chișinău 2018
Metode statistice aplicate în climatologie măsurători, sau calitative, exprimate non-
numeric sau textual (ex: utilizarea terenului, exprimată în clase de folosințe, direcția vântului
exprimată prin clasele Nord, Nord-Est... Nord-Vest). De asemenea, variabilele cantitative
pot fi continue, atunci când acestea pot lua orice valoare dintr-un anumit interval (ex:
temperaturile, precipitațiile etc.), sau discrete, atunci când variabila poate lua doar anumite
valori dintr-un anumit interval (ex: albedoul, atunci când acesta este exprimat prin valori
unice ataşate tipurilor de utlizare a terenului). Observația: reprezintă valoarea unei variabile
pentru o anumită locație (individ) şi pentru un anumit moment sau interval de timp (ex:
temperatura medie anuală la stația Iaşi). Distribuție statistică: reprezintă ansamblul ordonat
al frecvențelor (distribuții de frecvențe) sau probabilităților (distribuții de probabilități)
valorilor unei anumite variabile. Distribuțiile de frecvențe sunt distribuții empirice
determinate pe baza unui eşantion, în timp ce distribuțiile de probabilități sunt distribuții
teoretice, descrise prin ecuații matematice, asociate populațiilor (ex: distribuția normală sau
gaussiană, lognormală, gamma, chi-pătrat, t Student, F Snedecor-Fisher, Z Fisher etc.). Pe
măsură ce dimensiunea eşantionului creşte, frecvența tinde să devină echivalentă cu
probabilitatea, iar configurația distribuției de frecvențe tinde tot mai mult spre configurația
distribuției de probabilități. Statistica pleacă de la ideea că legitățile care guvernează
procesele şi fenomenele pot fi deduse din analiza unui număr mare de cazuri particulare
(indivizi), iar aceste legități au caracter probabilistic. Cu alte cuvinte, fiecare individ are o
personalitate proprie, comportându-se mai mult sau mai puțin diferit față de ceilalți indivizi
aparținând aceleiaşi populații, dar împreună, masa de indivizi (populația, eşantionul) se
comportă unitar, supunându-se aceloraşi legi. Însă aplicarea acestor legi pentru derivarea
comportamentului unui individ este probabilistică, astfel încât comportamentul estimat va
diferi de cel real într-o anumită măsură. În acest sens, statistica îşi propune nu reproducerea
fidelă a comportamentului individual, ci minimizarea abaterilor acestora față de
comportamentele estimate.

Metode de interpolare spaţială Aurelhy, se aplică analiza componenților principali


asupra modelului numeric al altitudinii, în cadrul unei ferestre glisante, pentru a condensa
informația despre topografia locală. Ecuația de regresie folosită utilizează 16 predictori,
respectiv scorurile primilor 15 componenți principali (EOF 8 ), la care se adaugă altitudinea
medie din centrul ferestrei glisante. Reziduurile, calculate ca diferență între valorile reale şi
cele calculate prin regresie, sunt ulterior interpolate prin kriging şi apoi adăugate tendinței
spațiale. Figura 30. Primii 5 EOF derivați din aplicarea metodei Aurelhy în Alpii francezi
(Patriche C. V., Lhotellier R., 2006) EOF 1, 40.9% EOF 2, 9.3% EOF 3, 4.6% EOF 4, 2.3%
EOF 5, 2.0% În figura 30 sunt redați, spre exemplificare, primii 5 EOF derivați din aplicarea
metodei Aurelhy pentru teritoriul Alpilor francezi, la o rezoluție spațială de 5x5 km.
Remarcăm faptul că fiecare EOF descrie un anumit aspect, elementar al suprafeței
topografice: EOF 1: proprietatea suprafeței topografice de a fi alcătuită din forme pozitive şi
negative; EOF 2: prezența pantelor orientate spre Sud-Vest; EOF 3: prezența pantelor
orientate spre Nord; EOF 4, 5: succesiuni de văi şi interfluvii.Definiţii şi noţiuni de bază
Statistica include o mare varietate de metode, de la indici simpli, de tipul mediei, medianei,
deviației standard etc., până la metode complexe de analiză, cum ar fi regresia, krigingul,
analiza componenților principali, analiza canonică etc. În cadrul acesteia, pot fi deosebite
două ramuri principale: Statistica descriptivă: se ocupă cu descrierea informației statistice
(populație, eşantion) prin intermediul unor indici statistici (medii, mediana, modul, deviația
standard, varianța etc.). Statistica inferențială: se ocupă cu prelucrarea informației statistice
în scopul obținerii de informații noi referitoare la dinamica şi conexiunile interne ale
fenomenelor de masă. Pentru aplicarea corectă, precisă şi rapidă a metodelor statistice este
necesară utilizarea unui soft adecvat. În prezent, există o paletă largă de programe care pot fi
utilizate pentru prelucrarea statistică a datelor. Câteva dintre acestea sunt redate în tabelul 1
împreună cu caracteristicile lor principale. Se pot deosebi, în general, două categorii de
programe: programe complexe (Excel/XLSTAT/WinSTAT, Statistica, Minitab etc.), care
pun la dispoziție o gamă variată de metode de analiză statistică şi programe specializate pe
un anumit tip de analiză, cum ar fi modelările de tip kriging (Variowin, Vesper etc.). O listă
consistentă de programe statistice gratuite poate fi vizualizată pe website-ul: Pentru
modelarea spațială a parametrilor climatici este necesară aplicarea metodelor statistice de
spațializare în cadrul programelor de SIG. Tabelul 2 redă câteva exemple de programe SIG
de largă circulație şi o serie de caracteristici principale, incluzând posibilitățile de analiză
statistică. Putem remarca că, în general, programele complexe de SIG includ module de
interpolare de tipul krigingului. Modulele de regresie sunt însă implementate în mai puține
cazuri, iar flexibilitatea acestora este, de regulă, insuficientă pentru o analiză riguroasă. Mai
multe informații privind capacitățile de modelare spațială ale programelor de SIG sunt
specificate în cadrul capitolului dedicat metodelor de interpolare spațială.

Metode statistice aplicate în climatologie elaborarea unor modele de regresie în care


variabilele explicative sunt reprezentate prin seriile de timp ale factorilor de control (ex:
bioxidul de carbon atmosferic, numarul petelor solare, indici de circulație atmosferică etc.).
Pentru vizualizarea relațiilor statistice dintre 2 variabile sunt folosite cel mai frecvent
graficele de tip puncte (grafice de corelație, scatterplot). Configurația norului de puncte ne
oferă informații despre sensul şi intensitatea relației (figura 11). Astfel, dacă norul de puncte
urmează o direcție ascendentă, relația este una directă, în sensul că o creştere a valorilor
cauzei (X) determină o creştere corespunzătoare a valorilor efectului (Y) (ex: relația
altitudine precipitații). Dacă, dimpotrivă, norul urmează un traseu descendent, rezultă că
între cele 2 variabile este o relație inversă, indicând descreşterea valorilor efectului pe
măsura creşterii valorilor cauzei (ex: relația altitudine temperatură). Intensitatea relației
dintre variabile este cu atât mai mare cu cât norul de puncte este mai alungit şi mai
comprimat, cu alte cuvinte cu cât dispersia punctelor în afara direcției de alungire este mai
mică. Dacă traseul norului de puncte este abrupt, rezultă că relația dintre variabile prezintă
sezitivitate ridicată, în sensul că o modificare mică a cauzei atrage cu sine o modificare
importantă a efectului. De asemenea, graficele de corelație pot indica posibila prezență a
unor erori sau interferența accentuată a unei alte cauze prin intermediul acelor puncte care
ies semnificativ în afara norului de corelație. Pentru vizualizarea relației dintre un efect şi
mai multe cauze se procedează, în general, la reprezentarea valorilor estimate ale efectului în
funcție de valorile reale ale acestuia (ca în exemplul din figura 13c). Modelul general al
regresiei liniare multiple este: yˆ = a + n i= 1 b i x i ± ε unde: - ŷ - variabila dependentă; - x i
- variabilele independente; - n - numărul variabilelor independente; - a - termenul liber; - b i
- coeficienții de regresie parțială; - ε - eroarea standard de estimare a variabilei dependente.

Metode statistice aplicate în climatologie Avantajul principal al abordării problemei


spațializării informației climatice pe baza regresiei multiple constă în cuantificarea rolului
factorilor explicativi în condiționarea variabilității spațiale a parametrului climatic în cauză.
Efectul acestora este, în consecință, explicit. Dezavantajele principale constau în netezirea
variației spațiale reale, cu modificarea valorilor reale, din punctele cunoscute, în funcție de
relația cauzală identificată. De asemenea, interpolatorii globali nu sunt capabili să redea
anomalii în distribuția spațială a parametrului climatic analizat şi necesită un număr relativ
mare de puncte (stații, posturi) pentru identificarea unei relații cauzale statistic
semnificative. O problemă delicată, care necesită o atenție specială, o constituie extrapolarea
modelului de regresie în afara zonei de calibrare a acestuia. În consecință, abordarea globală
pe baza regresiei este adecvată în cazul elementelor climatice cu variabilitate spațială mai
redusă şi predictibilitate spațială mai ridicată (temperatura, umezeala aerului, durata de
strălucire a Soarelui etc.), care depind, într-o mai mare măsură, de factorii radiativi. Regresia
poate fi aplicată însă şi ca interpolator local, caz în care dezavantajul incapacității redării
anomaliilor spațiale este eliminat. Modelele de acest tip sunt însă mult mai complexe, fiind
dezvoltate în cadrul unor programe SIG. Dintre acestea, menționăm modelele PRISM şi
GWR. Modelul PRISM 6 (Parameter-elevation Regression on Independent Slopes Model)
este aplicat în SUA şi a fost elaborat de Daly et al. (1994) cu scopul inițial genera modele
spațiale pentru precipitațiile anuale şi lunare din regiuni cu topografie complexă. Ulterior,
modelul a fost extins şi la nivelul altor parametri climatici (temperaturi maxime, minime,
temperatura punctului de rouă etc.), astfel încât termenul inițial de precipitation prezent în
denumirea inițială a modelului, a fost schimbat cu cel de parameter. Modelul lucrează la o
rezoluție de cca 4x4 km, însă prin tehnici specifice de reeşantionare, hărțile digitale pot fi
aduse la o rezoluție de cca 1x1 km. Metode statistice aplicate în climatologie Prin însumarea
celor mai importanți EOF, sub aspectul varianței explicate, poate fi reprodusă orice
configurație a suprafeței topografice. Dintre posibilitățile de ameliorare ale spațializării prin
kriging a variabilelor climatice menționăm: testarea performanțelor diferitelor tipuri de
kriging testarea performațelor obținute pentru lag-uri diferite, cu toleranțe diferite testarea
comparativă a perfomanțelor mai multor semivariograme standard ameliorarea componentei
deterministe (modelului de regresie) prin procedurile indicate anterior, pentru modelele de
regresie (în cazul krigingului rezidual) testarea utilității unor componente deterministe fizice
(modele fizice) în cazul krigingului rezidual (ex: spațializarea temperaturii pe baza unui
model al bilanțului radiativ) Probleme specifice modelării spațiale prin metode statistice
Spațializarea prin metode statistice se confruntă cu o serie de probleme specifice, dintre care
putem menționa: Calitatea datelor climatice Presupunerile metodelor statistice de
interpolare: linaritatea relațiilor cauzale în cazul modelelor de regresie liniare: trebuie testate
şi modele neliniare; independența predictorilor: trebuie procedat la integrarea pas cu pas a
acestora, sau utilizarea predictorilor sintetici, ortogonali, derivați din ACP; normalitatea
reziduurilor regresiei. Reprezentativitatea spațială a stațiilor / posturilor în raport cu
predictorii: probleme în regiuni înalte şi puternic accidentate generate de extrapolarea
modelului de regresie în arii neacoperite sau slab acoperite de stații / posturi. Influența scării
de spațiu şi timp Probleme legate de programele SIG utilizate: deficiențe ale modulelor de
regresie, kriging, probleme de inteoperabilitate etc. Metode de interpolare spaţială
Reprezentativitatea spațială a rețelei meteorologice Problema reprezentativității spațiale a
rețelei de stații meteorologice / posturi pluviometrice este o problemă importantă care
necesită a fi analizată într-o etapă preliminară modelării spațiale a variabilelor meteo-
climatice, consituind o potențială sursă de erori. Teoretic, rețeaua meteorologică ar trebui să
acopere echilibrat un teritoriu, pentru a surprinde toate caracteristicile meteo-climatice ale
acestuia. Figura 31. Reprezentativitatea altitudinală a unui eşantion de 28 de posturi
pluviometrice din Moldova şi zonele de extrapolare ale modelelor statistice bazate pe
altitudine Frecvente altitudinale asociate MNT si posturilor pluviometrice în Moldova % 15
posturi MNT >350 altitudine (m ) Reprezentativitatea rețelei meteorologice în raport cu
predictorii potențiali poate fi vizualizată şi evaluată prin compararea histogramelor
predictorilor cu histogramele aceloraşi predictori obținute însă pe baza valorilor predictorilor
asociate stațiilor meteorologice / posturilor pluviometrice. Un exemplu este redat în figura
31 pentru reprezentativitatea altitudinală a unui eşantion din rețeaua de posturi pluviometrice
din Podişul Moldovei. Într-o situație ideală, curbele histogramelor cumulate ale altitudinii
derivate de pe MNT şi ale altitudinii stațiilor ar trebui să coincidă. Remarcăm însă deficitul
de posturi din zona joasă (sub 50m), din intervalul m şi din zona 91.

etode statistice aplicate în climatologie înaltă (peste 350m). Lipsa posturilor


pluviometrice la altitudini joase (sub 50m) şi mari (peste 350m) ne forțează să extrapolăm
modelele de regresie bazate pe altitudine în aceste regiuni. Extrapolarea poate fi generatoare
de erori, fapt ce impune acordarea unei atenții sporite aprecierii verosimilității valorilor
estimate din aceste regiuni. Influența scării de spațiu şi timp Scara de spațiu și timp exercită
o influență importantă asupra spațializării informației meteo-climatice. În general, se poate
afirma că valorile medii (lunare, anuale) sunt mai predictibile spațial în raport cu valorile
momentane (ex., diurne), deci mai ușor de spațializat, iar spațializarea este mai dificilă pe
teritorii restrânse (scara de spațiu locală) comparativ cu teritoriile mai extinse. Ultima
afirmație este relativă, deoarece, de la un anumit nivel, creșterea eterogenității teritoriului
studiat determinată de creșterea suprafeței acestuia face dificilă elaborarea unui model
statistic unic pentru întreaga regiune, impunându-se subdivizarea ei în regiuni caracterizate
printr-o relativă omogenitate climatică. Figura 32. Exemplu privind problemele ridicate de
spațializarea valorilor momentane de temperatură la scara locala pentru un decupaj din
Podișul Central Moldovenesc (data achizitiei imaginii LANDSAT: ) Testimat kriging
rezidual Tradiativa LANDSAT Testimat model determinist 92. Metode de interpolare
spaţială Problema valorilor extreme (outliers) Problema valorilor extreme (outliers)
constituie un alt aspect al problemei reprezentativității rețelei meteorologice în raport cu
predictorii care trebuie analizată preliminar pentru a minimiza erorile potențiale. În primul
rând, pentru a elimina orice confuzie, o valoare extremă de tip outliers este o valoare care se
abate semnificativ de la modelul statistic (prin urmare cu reziduuri mari), corespunzătoare
unor puncte (stații) ce marchează anomalii spațiale în distribuția elementului analizat (ex.,
zone de foehnizare, de potențare orografică a precipitațiilor, cu inversiuni termice etc.). O
astfel de valoare rebelă poate fi și o valoare eronată și acest lucru trebuie verificat. Daca însă
nu este vorba despre o eroare, atunci trebuie să stabilim în ce măsură această valoare ne
alterează modelele statistice, în principal de regresie. Acest lucru se întâmplă în cazul
regresiei deoarece, fiind adesea folosită ca metodă globală de interpolare, regresia nu este
capabilă să redea anomalii spațiale. Daca acestea există, atunci includerea în model a
valorilor care descriu aceste anomalii poate modifica semnificativ relația de regresie, care
devine astfel eronată. Prin urmare, valorile de tip outliers nu se confundă neapărat cu valorile
extreme din eşantionul de date, respectiv cu valorile maxime sau minime. Spre exemplu,
dacă valoarea maximă a precipitațiilor medii anuale dintr-un eşantion de stații este de
800mm şi este înregistrată la 1000m altitudine, nu putem vorbi de un outlier, deoarece
altitudinea ridicată explică valoarea ridicată. Dacă însă o astfel de valoare se înregistrează la
400m, atunci vorbim de un outlier în raport cu relația altitudine precipitații. În general,
putem identifica 2 tipuri de outliers: Cu reziduuri mari, dar cu valori asemănătoare ale
reziduurilor reale şi a celor recalculate în lipsa stației acestea nu modifică modelul de
regresie şi pot fi păstrate. Cu reziduuri mari, dar cu diferențe semnificative între valoarea
reziduului real şi valoarea reziduului recalculat în lipsa stației acestea modifică modelul de
regresie şi trebuie eliminate dacă modificarea este semnificativă, sau trebuie găsită o soluție
alternativă.