Sunteți pe pagina 1din 103

MODELAREA PROCESELOR ECOLOGICE MODELE CANTITATIVE STATISTICE DANIEL SCRADEANU

3. Modele cantitative statistice .........................................................................1 3.1. Cuantificarea intensitii corelaiilor .......................................................1 3.1.1. Coeficienii de corelaie...................................................................3 3.1.2. Coeficienii de corelaie a rangurilor..............................................13 3.1.3. Coeficieni de asociere..................................................................19 3.1.4. Coeficieni de corelaie temporal .................................................24 3.2. Factorizarea corelaiilor .......................................................................36 3.2.1. Valori proprii i vectori proprii........................................................38 3.2.2. Standardizarea .............................................................................42 3.2.3. Analiza n componeni principali ...................................................44 3.2.4. Analiza factorial R-MOD .............................................................55 3.2.5. Rotatia factorilor............................................................................63 3.2.6. Analiza factorial Q-MOD .............................................................68 3.3. Modelarea matematic a corelaiilor substaniale................................73 3.3.1. Model liniar de o singur variabil independent ..........................73 3.3.2.Model liniar multiplu .......................................................................88 Bibliografie .....................................................................................................97

Modele cantitative statistice

Daniel Scrdeanu

3. Modele cantitative statistice


Modelele cantitative statistice exprim interdependeele dintre

componentele ecosistemelor i sunt construite pe baza prelucrrii unui mare numr de msurtori experimentale realizate pe parcursul unui program complex de monitorizare. Elaborarea modelelor statistice se realizeaz n trei etape principale: Cuantificarea intensitii corelaiilor de diferite tipuri prin intermediul coeficienilor de corelaie, coeficieni difereniai n funcie de tipul variabilelor factoriale i al variabilelor independente (x,y, t); Factorizarea corelaiilor care are ca scop ierarhizarea i selectarea corelaiilor reprezentative din punct de vedere statistic. Modelarea matematic a corelaiilor de diferite tipuri. Modelele statistice au un domeniu de aplicare restrans la spaiul i intervalul de timp n care s-a realizat programul de monitorizare pe baza cruia s-au obinut datele necesare elaborrii acestora.

3.1. Cuantificarea intensitii corelaiilor


Utilizarea termenului corelaie n ecologie are o semnificatie mult mai larg dect cea matematic. n sens statistic, corelaia reprezint un anumit grad de legtur evaluat prin diferite tehnici matematice, fiecare caracter fiind tratat ca o variabil aleatoare. Ansamblul caracterelor studiate formeaz o variabil aleatoare cu mai multe componente iar ipoteza normalittii acestei variabile n spatiul multidimensional este la baza tehnicilor de evaluare a intensittii corelaiei. In ecologie o mare parte a cercetrii este consacrat identificrii relatiilor dintre caracteristicile msurabile.

Modele cantitative statistice

Daniel Scrdeanu

Natura corelaiilor n ecologie este determinat de structura fizicochimic i bilogic a obiectelor de studiu care este constituit dintr-un ansamblu de variabile care formeaz biotopul i biocenoza. De aici rezult natura substantial a corelaiilor care se realizeaz pe baza compozitiei fizice, chimice, pe baza speciilor sau a calittii fizico-chimice a cmpurilor terestre (magnetic, gravimetric etc). Ecologia se ocup, de asemenea, cu analiza proceselor ce se desfsoar n timp i spaiu; n acest fel se completeaz spectrul naturii corelaiilor ecologice cu trei componente principale: corelaii substantiale; corelaii temporale. corelaii spaio-temporale sau topo-probabiliste;

Cercetarea corelaiilor poate fi realizat cu instrumente diferite n functie de dimensiunea i natura fenomenelor studiate. n literatura exist nc o mare confuzie n terminologia utilizat pentru instrumentele cu ajutorul crora evalum intensitatea legturilor/corelaiilor dintre caracteristicile ecologice. Vom adopta n continuare pentru instrumentele de cuantificare a intensittii corelaiilor substaniale dintre dou variabile urmtoarele categorii: coeficient de corelaie utilizat pentru variabile cantitative (numerice) i adaptabil, n anumite circumstane, pentru variabile calitative (alfanumerice); coeficient de corelaie a rangurilor utilizai pentru variabile ordonabile (numerice/alfanumerice); coeficie de asociere utilizai pentru variabile calitative (alfanumerice) Cuantificarea corelaiilor temporale se bazeaz pe o formalizare particular a serilor de timp se exprim prin: coeficieni de autocorelaie coeficieni de intercorelaie

Cuantificarea corelaiilor spaio-temporale presupune o prelucrare complex i un volum mare de date cu o structur spaial i temporal

Modele cantitative statistice

Daniel Scrdeanu

complex. Metodologia de evaluare a acestor corelaii este de o deosebit complexitate constituind o direcie special ( Scrdeanu, D., 2003, Geostatistic aplicat).

3.1.1. Coeficienii de corelaie


Aceast categorie de coeficieni este definit pentru cuantificarea intensittii legturii dintre caracteristicile ecologice cantitative dar pot fi adaptati i pentru studiul caracteristicilor calitative. Caracteristica lor comun este adimensionalitatea i domeniul valoric restrns ( [ 1;1] sau [0;1] ). Valorile extreme indic o intensitate maxim sau minim a intensittii corelaiei.

a) Raportul de corelaie

Raportul de corelaie permite evaluarea intensittii i sensului corelaiei dintre dou variabile geologice

( y, x )

independent de modelul de corelaie.

Raportul de corelaie realizeaz aceast evaluare prin intermediul gradului de mprtiere al valorilor yi msurate n jurul mediilor condiionate y xi . Analiznd intensitatea dependenei variabilei y (rezultative) n raport de variabila x (factorial), dispersia acesteia poate fi exprimat sub forma:
2 2 2 sy = sy (x ) + s y0

(III.169)

n care
2 sy - dispersia total a variabilei y n raport cu toti factorii cunoscuti sau

necunoscuti;
2 sy ( x ) - dispersia condiionat a variabilei y n raport cu variabila x ; 2 sy 0 - dispersia rezidual a variabilei y n raport cu celelalte variabile care-i

condiioneaz variabilitatea i care nu sunt specificate n model.

Modele cantitative statistice

Daniel Scrdeanu

Separarea dispersiei totale n cele dou componente necesit gruparea datelor ntr-un tabel de corelaie a crui configuratie este condiionat de sensul corelaiei. Pentru evaluarea gradului de dependent al variabilei y n raport cu variabila x , tabelul de corelaie (Tabelul III.19) contine:

m yxi - mediile variabilei y pentru fiecare interval xi ; n xi - frecventele marginale ale valorilor yi pentru fiecare interval xi ;
n timp ce tabelul de corelaie al variabilei x n raport cu y ( x = f ( y ) ) (Tabelul III.20):

m xyi - mediile variabilei x pentru fiecare interval yi ; n yi - frecventele marginale ale variabilei xi pentru fiecare interval yi .
Tabelul III.19 Corelaie y = f (x )
x

Tabelul III.20 Corelaie x = f ( y )

ydependent

var.

n xi

m yxi

x-

var.

n yi

m xyi

dependent

x1 x2

y11 , y12 ,..., y1n1 y 21 , y 22 ,..., y 2 n 2


. . .

n x1 nx 2
. . .

m yx1 m yx 2
. . .

y1 y2

x11 , x12 ,..., x1n1 x21 , x22 ,..., x2 n 2


. . .

n y1 ny2
. . .

m xy1 m xy 2
. . .

. . .

. . .

xk

y k 1 , y k 2 ,..., y knk

n xk

m yxk

yk

xk1 , xk 2 ,..., xknk

n yk

m xyk

2 2 Dispersiile s y i s y ( x ) se evalueaz cu relaiile:

2 y

(y =
k i =1 k

my )

k 1

(III.170)

2 y(x)

i =1

n xi (m yxi m y ) k 1

(III.171)

Modele cantitative statistice

Daniel Scrdeanu

2 2 pentru analiza intensitii corelaiei y = f (x ) , iar dispersiile s x i s x ( y ) cu

relaiile:

2 x

(x =
k i =1

mx )

k 1 n yi (m xyi m x ) k 1

(III.172)

2 x( y )

i =1

(III.173)

pentru analiza intensitii corelaiei x = f ( y ) . Intensitatea corelaiei dintre cele dou variabile se msoar cu ajutorul raportului dintre dispersia ( s y ( x ) sau s x ( y ) ) i dispersia total ( s 2 y sau s 2 x ). Pentru exprimarea cantitativ a acestei corelaii se defineste corelaie cu: raportul de

y(x ) =

2 sy (x ) 2 sy

(III.174)

x( y ) =

2 sx (y) 2 sx

(III.175)

Valoarea maxim a raportului de corelaie este 1 i exprim o corelaie maxim ntre cele dou variabile, iar lipsa de corelaie dintre cele dou variabile corespondente valorii zero, valoarea minim a raportului de corelaie. n analiza corelaiei dintre dou variabile geologice, nu ntotdeauna este evident care din variabile este rezultativ i care este factorial, motiv pentru care este necesar s se determine valoarea raportului de corelaie n ambele variante (III.174) i (III.175). Analiza ambelor valori poate conduce la urmtoarele variante extreme de interpretare: a) variabila y este dependent de x iar x este independent;

y ( x ) = 1 i x ( y ) = 0

(III.176)

b) variabila x este dependent de y iar y este independent;

Modele cantitative statistice

Daniel Scrdeanu (III.177)

y ( x ) = 0 i x ( y ) = 1
b) variabilele x i y sunt independente; c)

y ( x ) = 0 i x ( y ) = 0
d) variabilele
x i

(III.178)

se intercondiioneaz sau ambele sunt

condiionate de o a treia variabil neidentificat:

y ( x ) = 1 i x ( y ) = 1

(III.179)

n practica analizei corelaiilor dintre variabilele geologice, raportul de corelaie ia valori cuprinse ntre 0 i 1 iar semnificatia lor statistic se poate testa cu ajutorul factorului F pe baza inegalittii:

Fexp

2 nk > F ( , 1 ; 2 ) = 2 k 1 1

(III.180)

n care 1 = k 1 , 2 = n k ( n = perechi de valori, k = numr de intervale de grupare, = nivelul de semnificaie al testului). Verificarea inegalittii (III.180) indic o valoare semnificativ statistic a raportului de corelaie, deci existenta unei corelaii ntre variabilele analizate.

b) Coeficientul corelaiei lineare

Coeficientul corelaiei lineare este cel mai des ntlnit n cercetarea ecologic a corelaiilor i din nefericire este utilizat n general fr absolut nici o precautie legat de caracteristicile statistice ale variabilelor implicate. Definit pentru dou variabile cu repartiie normal ( x, y ), coeficientul corelaiei lineare (= coef. lui PEARSON = coeficientul corelaiei totale) este definit cu relaia: 6

Modele cantitative statistice

Daniel Scrdeanu

rxy =
(III.181)

(x m )(y m ) (x m ) (y m )
n i =1 i x i y n
2

i =1

Valorile coeficientului de corelaie linear sunt cuprinse ntre 1 i 1 iar dac x i y sunt independente, rxy = 0 . Abaterea de la repartitia normal a variabilelor x i y antreneaz modificri ale interpretrii valorilor coeficientului de corelaie linear. Valoarea minim a coeficientului Pearson ( rxy = 0 ) nu este un indicator al independentei celor dou caracteristici, ci numai de necorelare liniar a lor. Acestea pot fi corelate printr-o relatie functional de tip parabolic, logaritmic etc. Pentru interpretarea valorilor nenule ale coeficienilor de corelaie, o explicare grafic este mult mai sugestiv pentru cei neacomodati cu statistica matematic. Valoarea coeficientului de corelaie linear este n dependen direct cu distribuia perechilor de valori ( xi , yi ) ntr-un sistem rectangular de referint
XOY .

Corespunztor

configuratiei

geometrice

distributiei

punctelor, se disting urmtoarele cazuri: a) alinierea perfect a punctelor de-a lungul unei drepte - fie ascendent ( rxy = 1 ; Fig. 58a), fie descendent ( rxy = 1 ; Fig. 58b) - care indic o dependen linear perfect ntre cele dou variabile. O astfel de situaie este foarte rar ntlnit n studiul unor relatii functionale ntre dou caracteristici geologice; b) punctele sunt dispersate aleator, norul de puncte neavnd nici o orientare preferential (Fig. 58c). n circumstanele amintite anterior, cele dou variabile sunt independente sau necorelate ( rxy = 0 );

Modele cantitative statistice

Daniel Scrdeanu

c) configuraia tranzitorie ntre cele dou extreme, n care norul de puncte are o orientare preferenial corespunztoare valorilor lui aparinnd intervalului [ 1,1] (Fig. 58d). a
y y

rxy

b
y

c
y

x
r =0

x
0 < r <1

r 1

r 1

Fig. 58 Semnificaia geometric a coeficientului Pearson

O analiz mai detaliat a coeficientului de corelaie linear este reluat la analiza modelului liniar de o singur variabil independent . Valorile coeficientului de corelaie linear, n cazul n care repartitia celor dou variabile se abate de la cea normal, nu mai exprim n mod obligatoriu intensitatea corelaiei lineare ntre cele dou variabile x i y . n cazul frecvent al pentru repartitiilor calculul
x1 F1 A1

lognormale,

coeficientului de corelaie linear se opereaz cu valorile logaritmate ale caracteristicilor analizate.

x2

A2

c) Coeficientul cosinus

1
F2 y1 y2

Coeficientul cosinus este o msur a distantei unghiulare, utilizat

Fig. 59 Coeficientul cosinus pentru un spaiu bidimensional

pentru estimarea similarittii ntre obiecte geologice de studiu (ex.: aflorimente, zcminte, bazine de sedimentare, acvifere etc), reprezentate n

Modele cantitative statistice spatiul variabilelor msurabile (ex.: compozitie etc).

Daniel Scrdeanu chimic, compozitie lui implic

granulometric,

parametri

hidrogeologici

Estimarea

ortogonalitatea axelor sistemului de referint, motiv pentru care este preferat n analiza factorial Q - MOD. ntr-un spatiu bidimensional definirea coeficientului cosinus se bazeaz pe relatiile trigonometrice elementare ale cosinusului unghiului unei diferente de unghiuri (Fig.59):

cos A1 A2 = cos(1 2 ) =

(x

x1 y1 + x2 y 2
2 1

2 2 ) + y12 )(x2 + y2

(III.183)

Generaliznd pentru n dimensiuni ( n factori independenti F1 , F2 ,..., Fn , spre exemplu n aflorimente probate n cazul analizei Q-MOD) se obine formula:

cos A1 A2 =
(III.183)

xy x
k i =1 i k 2 i =1 i

i =1

yi2

Acest coeficient de corelaie indic o similaritate complet ntre dou obiecte geologice A1 i A2 pentru cos = 1 i o disimilaritate total pentru
cos = 0 (corespunztor unui unghi = 90 o echivalent cu ortogonalitatea

vectorilor de poziie).

d) Coeficientul distantei taxonomice

Ca msur a similarittii ntre dou obiecte geologice, coeficientul distantei taxonomice i are originea n modelul geometric al distantei euclidiene ntre dou puncte A i B ntr-un spatiu n -dimensional. Distanta taxonomic ntre cele dou obiecte geologice este invers proportional cu similaritatea, n fiind numrul de caracteristici proprii celor dou obiecte geologice studiate. 9

Modele cantitative statistice

Daniel Scrdeanu

n cazul distanei taxonomice dintre dou eantioane A i B reprezentate prin dou caracteristici x1 i x2 (Fig.60) formula de calcul este:

D AB =

(x1A x1B )2 + (x2 A x2 B )2

(III.184)

n care:
x1 A - caracteristica x1 determinat n eantionul A (ex.: coninutul n

zinc);
x1B - caracteristica x1 determinat n eantionul B; x2 A

- caracteristica n eantionul

x2

determinat

x1 x1 A

(exemplu: coninutul n plumb);


x2 B

- caracteristica

x2 x1B

determinat n eantionul B.

Dac

pentru

cele

dou
x2 A x2B x2

obiecte geologice (A i B) se determin mai multe caracteristici ( x1 , x2 ,..., xn ) generalizare taxonomice: se a utilizeaz o Fig. 60 Distana taxonomic n spaiu bidimensional

distanei

D AB =

(X
n i =1

iA

X iB )

(III.185)

Creterea numrului de caracteristici utilizate reduce posibilitatea interpretrii valorii distantei taxometrice n comparatie cu a altor coeficieni de corelaie datorit diversittii unittilor de msur i a amplitudinilor de selectie. Eliminarea acestor inconveniente se realizeaz prin standardizarea valorilor caracteristicilor msurate, normarea lor pe intervalul coeficientului distanei taxonomice:

[0,1]

i definirea

10

Modele cantitative statistice


1 n ( XSiA XSiB )2 n i =1

Daniel Scrdeanu

d AB = 1

(III.186)

n care:

XS iA - valoarea standardizat i normat a caracteristicii "i" din eantionul A; XS iB - valoarea standardizat i normat a caracteristicii "i" din eantionul B.
n aceste condiii, valorile extreme ale coeficientului de distan sunt: zero, cnd cele dou esantioane sunt identice, deci similaritatea este maxim i unu, cnd cele dou eantioane A i B sunt total diferite.

e) Coeficientul corelaiei binare

Coeficientul corelaiei binare ( rD ) a fost propus de Derec, Sarcia i Troly (1964) pentru cercetri metalogenetice i este definit prin relaia:
neab ab

rD = n a b

ab(n a )(n b )

(III.188) n care:
n

e ab
Fig. 61 Relaia dintre elementele coeficientului de corelaie binar

- numrul total de cazuri

analizate (Fig. 61);


a - numrul de cazuri analizate

care prezint caracteristica A;

b - numrul de cazuri analizate care prezint caracteristica B;

eab - numrul de cazuri analizate care prezint ambele caracteristici A


i B, a cror corelaie se analizeaz. Coeficientul de corelaie binar este o msur a intensitatii legturii ntre caracteristicile A i B. Cu ct coeficientul rD este mai mare (valori

11

Modele cantitative statistice

Daniel Scrdeanu

pozitive) legtura este mai puternic. Valorile negative indic o "respingere" a caracteristicilor, iar valoarea nul o independen total. Interpretarea naturalist a valorilor lui
rD

permite ierarhizarea

corelaiilor ntr-un sistem multivariat pe baza coeficienilor corelaiei binare calculati pentru toate perechile de caracteristici msurabile. Asamblate ntr-o matrice de similaritate, toate valorile coeficientului de corelaie pot forma o imagine sintetic a ierarhiilor corelaionale din sistemul studiat. n tabelul III.21 este prezentat configuratia unei astfel de matrici ce va constitui obiectul unor prelucrri ulterioare n scopul factorizrii corelaionale. Tabelul III.21 Matricea coeficienilor rD pentru mineralele caracteristice ale pegmatitelor cu beril din Madagascar i Mozambic (dup P. Lafitte, 1972)
1 1 2 3 4 5 6 7 8 9 10 11
1 0.31 0.34 -0.16 0.18 0.31 0.17 0.18 -0.06 -0.57 0.26

2
0.31 1 -0.17 -0.46 0.13 0.1 0.05 0.13 0.13 -0.55 -0.19

3
0.34 -0.17 1 -0.16 0.18 -0.28 -0.31 -0.06 0.18 0.01 0.26

4
-0.16 -0.46 -0.16 1 0 0.14 -0.11 0.29 0 0.14 0.15

5
0.18 0.13 0.18 0 1 -0.24 -0.13 -0.07 -0.33 0.08 0.24

6
0.31 0.1 -0.28 0.14 -0.14 1 0.55 0.08 0.08 -0.18 0.06

7
0.17 0.05 -0.31 -0.11 -0.13 0.55 1 -0.13 -0.13 -0.1 -0.28

8
0.18 0.13 -0.06 0.29 -0.07 0.08 -0.13 1 0.73 -0.24 0

9
-0.06 0.13 0.18 0 -0.33 0.08 -0.13 0.73 1 -0.24 0

10
-0.57 -0.55 0.01 0.14 0.08 -0.18 -0.1 -0.24 -0.24 1 -0.23

11

0.26 -0.19 0.26 0.15 0.24 0.06 -0.29 0 0 -0.23 1 1 - minereuri de Nb i Ta; 2 - mic litinifier; 3 - amfibolit i spodumen; 4 - fosfati de Mn i Fe; 5 - minerale de Bi; 6 - casiterit i wolframit; 7 - molibdenit; 8 - minerale de U; 9 pmnturi rare; 10 - minerale de Cs; 11 - granat.

12

Modele cantitative statistice

Daniel Scrdeanu

3.1.2. Coeficienii de corelaie a rangurilor

Ordonarea valorilor unei caracteristici geologice ntr-o succesiune ascendent sau descendent este realizabil att pentru caracteristicile cantitative ct i pentru cele calitative. Operatiune extrem de ieftin din punct de vedere al prelucrrii, ordonarea asociaz fiecrei valori a caracteristicii studiate un numr natural, cunoscut sub denumirea de rang. Analiza corelaiei rangurilor este o tehnic neparametric pentru studiul legturilor dintre variabilele geologice care nu tine seama de diferenta dintre valorile numerice ale propriettilor, ci numai de ordinea lor. Coeficienii definiti pentru cuantificarea intensittii corelaiei rangurilor au valori cuprinse n intervalul [ 1,1] i permit analiza corelaiilor pentru dou sau mai multe variabile. Ei pot fi utilizati cu deosebit succes pentru corelarea secventelor sedimentare investigate prin carotaj geologic complex n structuri sedimentare cu numeroase alternane litologice pe unitatea de adncime.

a) Coeficientul lui Spearman

Coeficientul lui Spearman ( SP ) este definit pe baza coeficientului corelaiei lineare al lui Pearson ntre dou variabile v1 , v2 i are formula:

SP = 1
n care:

6i =1 d i2
n

n(n 2 1)

(III.189)

n - numrul de perechi de valori ordonate cresctor;

d i - diferenta rangurilor celor dou variabile : d i = rang xi rang yi


rang xi - rangul valorii xi n sistemul ordonat cresctor; rang yi - rangul valorii yi n sistemul ordonat cresctor.

13

Modele cantitative statistice

Daniel Scrdeanu

Aplicatie. Analiza corelaiei ntre valoarea economic a unei roci i indicele ei de duritate pe baza valorilor din tabelul III.22 conduce la o valoare a coeficientului lui Spearman:

SP = 1

6 150 = 0,9 10 (100 1)

Valorile SP sunr cuprinse n intervalul [ 1,1] iar interpretarea este similar cu a coeficientului lui Pearson din care este dedus. Pentru aplicaia precedent se poate concluziona pe baza valorii SP = 0,9 c exist o bun concordan ntre valoarea economic a rocii i tria ei rezultat dintr-un ansamblu de proprieti elementare (compoziie mineralogic, structur, textur etc.). Tabelul III.22 Calculul coeficientului lui Spearman Nr. crt. 1 2 3 4 5 6 7 8 9 10 P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 Proba Rangul Valoare economic 10 2 3 1 5 4 6 7 8 9 5 3 1 10 8 2 9 4 6 7 5 -1 2 -9 -3 2 -3 3 2 2 25 1 4 81 9 4 9 9 4 4 Trie

di

d i2

14

Modele cantitative statistice


b) Coeficientul lui Kendall

Daniel Scrdeanu

Coeficientul lui Kendall ( k ) are aceleai proprieti cu coeficientul Spearman, fiind egal cu zero cnd cele dou variabile analizate sunt independente i cu +1 i -1 cnd dependena dintre cele dou variabile este maxim, pozitiv sau negativ. Relaia de definitie este:

k =
(III.190) n care:

2S n(n 1)

n - numrul de perechi de valori ordonate; S - suma concordantelor posibile, calculate prin consemnarea cu +1 a

"consensului" i cu -1 a variaiei inverse. Aplicatie. Pentru o serie de n = 5 perechi de valori [densitate ( ), coeziune ( c )] (Tabelul III.23a), succesiunea operaiunilor necesare calculului coeficientului k este: Tabelul III.23 Elementele de calcul pentru coeficientul Kendall a) Proba 1 2 3 4 5 Rangul b) Proba 3 2 4 5 1 Rangul

5 2 1 3 4

1 2 3 4 5

4 1 3 2 5

3 1 2 5 4

1. Ordonarea probelor dup rangul unei caracteristici, de exemplu (Tabelul III.23b). 2. Realizarea perechilor de ranguri prin combinarea probelor disponibile (Tabelul III.24). 15

Modele cantitative statistice

Daniel Scrdeanu

3. Calculul lui S prin nsumarea algebric a variaiilor relative. 4. Calculul lui k cu formula (III.190):

k =

24 = 0,4 5(5 1)

Tabelul III.24 Calculul parametrului pentru coeficientul Kendall Nr. crt. 1 2 3 4 5 6 7 8 9 10

12 13 14 15 23 24 25 34 35 45

Consens +1 Contrasens -1 -1 -1 +1 +1 +1 +1 +1 +1 +1 -1 4

31 32 35 34 12 15 14 25 24 54
S=

n practic, frecvent, seleciile de date conin grupuri de k valori cu acelai rang. Pentru astfel de situaii se calculeaz un rang mediu prin media aritmetic a rangurilor celor k valori. Vor apare astfel n seria ordonat a selectiei k valori cu acelai rang. Tranzitiile ntre valori cu acelai rang sunt consemnate cu valoarea zero n calculul parametrului S . Aplicatie. Dac ordonarea a n = 5 probe dup gradul de alterare este realizat de doi specialisti (A, B) obtinndu-se situatia din tabelul III.25, rangul mediu al probelor P3 i P4 dup clasificarea obtinut de specialistul A este:

rangAP 3 = rangAP 4 =

2+3 = 2,5 2

16

Modele cantitative statistice

Daniel Scrdeanu

Conform tabelelor de calcul (tabelul III.26 i tabelul III.27):

k =
Tabelul III.25 Coef. Kendall Proba P1 P2 P3 P4 P5 RANG A 1 4 2-3 2-3 5 RANG A 1 2,5 2,5 4 5 B 3 2 4 1 5 B 3 1 2 4 5

2 1 = 0,1 5(5 1)

Tabelul III.27 Coef. Kendall Nr. crt. 1 2 3 4 5 6 7 8 9 10 A 1 2,5 1 2,5 14 15 2,5 2,5 2,5 4 2,5 5 2,5 4 2,5 5 45 B 32 34 31 35 24 21 25 41 45 15 +1/-1 -1 1 -1 1 0 -1 1 -1 1 1
S =1

Tabelul III.26 Coef.Kendall Proba 1 2 3 4 5

c) Coeficientul OMEGA-Kendall

Corelarea simultan a rangului mai multor variabile poate fi cuantificat prin coeficientul definit cu relaia:

K =

12 S m n3 n
2

(III.191)

17

Modele cantitative statistice n care:


S - suma concordanelor multiple:

Daniel Scrdeanu

S = i =1 S i S
m

(III.192)

S i - suma concordanelor binare;


S - media concordanelor binare; m - numrul variabilelor comparate; n - numrul cuplurilor de valori ale selectiei.

Aplicatie. Analiza corelaiei rangurilor a trei variabile V1, V2 i V3, a cror clasificare este consemnat n tabelul III.28a, conduce la urmtoarele etape de calcul (Tabelul III.28b): 1 - media concordanelor binare

S=

4+0+2 =2 3

2 - suma concordanelor multiple

S = (4 2) + (0 2) + (2 2) = 8
2 2 2

3 - coeficientul K

K =

12 8 = 0,1 3 53 5
2

Valoarea 0,1 indic o corelaie nesemnificativ ntre cele trei variabile (V1, V2 i V3).

Tabelul III.28 Elementele de calcul pentru coeficientul OMEGA-Kendall b) Nr. a) Nr. prob P1 V1 1 Rang V2 2 V3 3 crt. 1 2 3 V1 Tranziii V2 V3 12 21 32 13 24 35 14 25 31 -1 +1 +1 +1/-1 V1:V2 V1:V3 V2:V3 -1 +1 -1 +1 +1 -1

18

Modele cantitative statistice P2 P3 P4 P5 2 3 4 5 1 4 5 3 2 5 1 4 4 5 6 7 8 9 10 15 23 34 23 14 25 24 15 21 25 13 24 34 15 51 35 45 54 45 53 14

Daniel Scrdeanu +1 +1 +1 +1 +1 +1 -1 +1 +1 -1 +1 -1 -1 +1 +1 +1 -1 +1 -1 +1 -1

Dac n seleciile analizate exist i valori identice, deci cu acelai rang, formula (III.191) se modific sub forma:

K =

m 2 n 3 n mi =1 t i3 t i
n

12 S

(III.193) semnificatiilor notatiilor fiind aceleai cu cele mentionate anterior:

3.1.3. Coeficieni de asociere

Asocierea caracteristicilor calitative este o problem de importan deosebit n cercetarea geologic fundamental. Compararea rocilor pe baza asociatiilor mineralogice, a nivelurilor stratigrafice pe baza speciilor fosile determinate, a zcmintelor pe baza caracteristicilor petrografice, toate solicit existenta unui instrument pentru ierarhizarea asocierii caracteristicilor calitative functie de intensitatea ei. Aproape jumtate din datele obtinute prin prospectiune i explorare geologic sunt de natur calitativ i ignorarea acestora n etapa de analiz corelaional echivaleaz cu pierderea contactului cu ambianta geologic a fenomenului studiat. Coeficienii de asociere permit descrierea cantitativ a celor dou tipuri de relatii fundamentale ce se stabilesc ntre dou caracteristici calitative A i B

19

Modele cantitative statistice

Daniel Scrdeanu

(ex.: A=tipul petrografic: granit, dacit, bazalt etc.; B=caracterul mineralogic: ortoz, albit, olivin etc.): independenta i asocierea . Independenta a dou caracteristici calitative A i B este exprimat cantitativ prin identificarea aceleiai proportii de elemente A, att printre elementele B ct i nonB. Exprimat prin intermediul frecventelor de grup, forma clasic a criteriului de independent pentru cele dou caracteristici A i B este:

( AB ) = ( A ) (B )
(III.194) Pentru identificarea comod a independentei, indiferent de forma n care au fost sistematizate datele din cele N puncte de probare, criteriul exprimat prin relaia (III.194) poate fi formulat n diferite variante echivalente :

( AB ) = ( A) (B ) N
(III.195)

( AB ) = (B ) ( A) N
(III.196)

( AB ) = ( A)(B )
N
(III.197)

( AB ) = ( A) (B )
N N N
(III.198) Ecuaia independentei: "Dac caracteristicile calitative A i B sunt independente, proportia elementelor ( AB ) este egal cu proportia elementelor A nmultit cu proportia elementelor B." (III.198) exprim simbolic regula fundamental a

20

Modele cantitative statistice

Daniel Scrdeanu

Asocierea exprim existenta unei legturi ntre caracteristicile calitative, iar functie de sensul, intensitatea i numrul de variabile implicate poate fi: pozitiv sau negativ, complet sau incomplet, total sau partial. Asocierea pozitiv a dou caracteristici A i B atrage cresterea numrului de elemente B o dat cu cresterea numrului de elemente A i este exprimat de inegalitatea:

( AB ) > ( A)(B )
N
(III.199) Asocierea negativ, opus celei pozitive, exprim dezasocierea caracteristicilor comparate, adic reducerea numrului de elemente B proportional cu cresterea numrului de elemente A, i este exprimat de inegalitatea:

( AB ) < ( A)(B )
N
(III.200) Proporional cu creterea intensitii legturii ntre cele dou caracteristici calitative implicate, asocierea pozitiv i negativ tind s devin complete ((A)=(B) - asociere complet; (AB)=0 dezasociere = asociere negativ complet). Analiza corelaional a unui sistem geologic, fie el bazin de sedimentare, zcmnt polimetalic sau de petrol, implic n mod obligatoriu studiul simultan al mai multor variabile calitative. Numai din considerente operationale, n anumite etape ale prelucrrii datelor se ignor ansamblul de corelaii, lunndu-se n considerare numai informatiile referitoare la dou caracteristici calitative A i B, definindu-se asocierea total ntre acestea. Definirea asocierii totale, presupune ipoteza c n sistemul studiat nu exist o alt variabil care s condiioneze variabilele luate n studiu. Pentru cuantificarea intensittii asocierii, presupuse totale, se utilizeaz n mod uzual coeficientul de asociere ( Q ), coeficientul de interdependent ( Y ) i coeficientul de corelaie calitativ ( rAB ).

21

Modele cantitative statistice


a) Coeficientul de asociere Yule i Kendall

Daniel Scrdeanu

Coeficientul Yule i Kendal, ( Q ),are relaia de definitie:

Q=
(III.201)

( AB )( ) (B )( A ) ( AB )( ) + (B )( A )

Coeficientul de asociere Q este zero cnd cele dou caracteristici A i B sunt independente, +1 cnd exist asociere pozitiv complet i -1 cnd cele dou caracteristici sunt dezasociate (= asociere complet negativ). Coeficientul de asociere Q este independent de proportiile relative ale elementelor A i n selectia de date, proprietate ce-l face adecvat cazurilor n care proportiile sunt arbitrare.

b) Coeficientul de interdependen

Coeficientul de interdependen ,( Y ), cu proprieti similare coeficientului de asociere Q este definit cu relaia:

1 Y= 1+
(III.202)

( A )(B ) ( AB )( ) ( A )(B ) ( AB )( )

c) Coeficientul de corelaie asociativ

Coeficientul de corelaie asociativ ( rAB ) este definit (Sarapov, 1968) pe structura coeficientului corelaiei lineare, avnd aceleai proprietti cu acesta : 22

Modele cantitative statistice

Daniel Scrdeanu

rAB =

( AB )( ) ( A )(B ) ( A)( )(B )( )

(III.203) Testarea caracterului total al asocierii caracteristicilor A i B necesit verificarea influentei unei alte caracteristici C asupra asocierii acestora. Pentru aceasta se defineste asocierea partial a caracteristicilor A i B n raport cu C. Asocierea partial ca i cea total poate fi pozitiv dac se verific inegalitatea:

( ABC ) > ( AC )(BC )


C
(III.204) sau negativ dac:

( ABC ) < ( AC )(BC )


C
(III.205) Prin adaptarea formulelor (III.201), (III.202) i (III.203) se definesc coeficienii de asociere partial corespunztori:

Q AB.C =
(III.206)

( ABC )(C ) (BC )( AC ) ( ABC )(C ) + (BC )( AC )

1 YAB.C = 1+
(III.207)

( AC )(BC ) ( ABC )( C ) ( AC )(BC ) ( ABC )(C )

23

Modele cantitative statistice


rAB.C =

Daniel Scrdeanu

( ABC )(C ) (BC )( AC ) ( AC )(C )(BC )(C )

(III.208) Testarea influentei caracteristicii C asupra asocierii caracteristicilor A i B se bazeaz pe compararea coeficienilor calculati pentru asociere n raport att cu caracteristica C ct i cu caracteristica nonC (= ). Egalitatea

Q AB.C = Q AB indic independenta asocierii caracteristicilor A i B n raport cu


caracteristica C, altfel spus, ntre caracteristicile A i B este o asociere total. Proportional cu cresterea numrului de caracteristici luate n studiu creste numrul asociatiilor partiale care se pot analiza pentru precizarea ansamblului de corelaii din sistemul studiat.

3.1.4. Coeficieni de corelaie temporal


n cercetarea ecologic se opereaz frecvent cu serii de valori ale unor variabile vij ( i = 1,2,3,..., nv ; j = 1,2,3,..., ni ; nv - numrul de variabile; ni numrul de valori pentru fiecare variabil) obtinute prin determinari realizate la intervale mai mult sau mai putin egale. Astfel de serii de valori cunoscute sub denumirea generic de serii de timp pot fi constituite din:
H(1) H(3) H(2) H(2) H(4) H(4)

cote acvifer (Fig.62),

ale

nivelului ale unui la

piezometric

msurate

intervale de timp egale succesiunea t litologic a unei secvente sedimentare separat n intervale egale ca grosime (Fig.63), numr

t1 t2 t3 t4

Fig. 62 Serie de timp a nivelurilor piezometrice msurate ntr-un acvifer freatic

de microfosile identificate pe o directie oarecare de probare (Fig.64).

24

Modele cantitative statistice

Daniel Scrdeanu

X
NF(1) NF(2) NF(3)

Y Fig. 64 Numr de microfosile identificate n puncte de probare plasate pe o direcie oarecare de probare

a)

v1

v2

b)

v3 t1 t2 t3 . . .

tn-1 tn Fig. 63 Serii de timp rezultate din cercetarea unei succesiuni sedimentare a) serie de timp litologic univariat; b) serie de timp multivariat ( v1 = , v2 = PS ; v3 = ) obinut din diagrafia geofizic complex

Timpul, ntr-o astfel de serie de valori sau stri ale procesului studiat este echivalent fie cu grosimea stratigrafic, fie cu adncimea msurat ntrun foraj, fie cu distanta de-a lungul unei directii oarecare din spatiu. Studiul seriilor de timp beneficiaz de o ampl i sofisticat metodologie (Tertisco M.et.al.,1985) care nu poate fi utilizat cu eficient maxim n geologie din dou motive principale:

25

Modele cantitative statistice

Daniel Scrdeanu

a)volumul mare de date necesar calculului parametrilor caracteristici analizei seriilor de timp univariate, cu semnificatie relativ redus n studiul proceselor geologice complexe, multivariate; b)complexitatea metodologiei care introduce dificultti de interpretare n analiza seriilor de timp multivariate, adecvate studiului proceselor geologice complexe.

a) Formalizarea stocastic a seriilor de timp

Existenta unui volum minim de date pentru studiul unei serii de timp n scopul estimrii stocastice a corealtiilor presupune o formalizare care asociaz caracteristicii studiate (ex.: litologia, nivelul piezometric, numrul de fosile identificate etc.) o variabil aleatoare de obicei discret (caracterul discret fiind determinat de modul de colectare a datelor i nu de natura variabilei studiate), iar continutului variabilei, un ansamblu de stri (ex.: variate tipuri litologice: calcar, argil, gresie; sensul evolutiei: ascendent, descendent, constant). O serie de timp este din punct de vedere formal o succesiune se stri exclusive, iar instrumentul operational care permite identificarea probabilist a ponderii componentei deterministe (=corelaionale) a procesului este matricea de tranzitie. Matricea de tranzitie sacrific toate informatiile referitoare la pozitia strilor n secventa de date, n favoarea identificrii tendintei unei stri de a fi urmat sau precedat de alta. Exist dou tipuri principale de matrici de tranzitie: matrici de tranzitie unitar (de un pas) i matrici de tranzitie multipl, fiecare dintre ele putnd fi exprimate numeric n trei forme diferite: 1) matricea frecventelor de tranzitie, 2) matricea proportiei perechilor de tranzitii, 3) matricea proportiilor de tranzitie. 1) Matricea frecventelor de tranzitie este format din numrul tranzitiilor de la o stare la alta determinat pe baza seriei de observatii disponibile.

26

Modele cantitative statistice Pentru seria de n = 31 stri: ABACDCDABCBADCDCBACABDABCDBACDA matricea frecventelor celor n 1 = 30 tranzitii ( MFT ) este: A B C D Total

Daniel Scrdeanu

A B MFT = C D
(III.209)

0 4 1 3

4 0 2 1

3 2 0 3

1 1 5 0

8 7 8 7

30 Total 8 7 8 7 2) Matricea proporiei perechilor de tranziii ( MPPT ) se obine din MFT prin divizarea fiecrei valori cu numrul total de tranzitii i exprim ponderea unei tranzitii n totalul acestora: A; B; C; D; Total

A B MPPT = C D
(III.210)

0,00 0,13 0,03 0,10

0,13 0,00 0,07 0,03

0,10 0,07 0,00 0,10

0,03 0,03 0,17 0,00

0,26 0,23 0,27 0,23

1,00 Total 0,26 0,23 0,27 0,23 3) Matricea proporiilor de tranziie ( MPT ) exprim proporia n care o stare poate fi urmat de alta fr a ine seama de ponderea strii iniiale n totalul acestor tranzitii. Ea se calculeaz prin divizarea fiecrui element dintr-un rnd al MFT prin suma frecventelor din rndul respectiv.

27

Modele cantitative statistice A B C D

Daniel Scrdeanu

Total

A B MPT = C D
(III.211)

0,000 0,571 0,125 0,428

0,500 0,000 0,250 0,143

0,375 0,286 0,000 0,428

0,125 0,143 0,625 0,000

1,000 1,000 1,000 1,000

Cele trei forme de exprimare ale matricii de tranzitie pot fi construite pentru o tranzitie unitar cnd procesul studiat opereaz la momente consecutive, exprimate formal de indicele superscris al probabilittii de tranzitie de la starea "j" la starea "k".
1) p (jk = P{ Vm+1 = k Vm = j}

(III.212) Pentru o tranzitie multipl ( n pai), probabilitatea de tranzitie de la starea "j" la starea "k" se scrie:
n) p (jk = P{ Vm+n = k Vm = j}

(III.213) n cazul n care probabilittile p jk depind numai de pasul n i sunt independente de pozitia initial "m" (situatie valabil pentru un lan Markov omogen) matricea de tranzitie multipl se calculeaz pe baza matricilor de tranziie unitar. Relaia de recurent a "moment" este: prognozei strii sistemului pentru orice

p ( m ) = p (0 ) P ( m )
(III.214)

28

Modele cantitative statistice

Daniel Scrdeanu

n care P (m ) este matricea constituit din probabilittile de tranzitie multipl


m) p (jk .

Aplicatie.Pentru matricea proportiei de tranzitie unitar:


GRESIE 0,70 0,20 0,10 MPT 1 = ARGILA 0,16 0,50 0,34 CALCAR 0,50 0,25 0,25

se obine prin calcule succesive:


0,57 0,27 0,16 = 0,36 0,37 0,27 0,52 0,29 0,11 0,50 0,30 0,20 = 0,48 0,31 0,21 0,50 0,30 0,20

MPT 1

(2 )

MPT 1

(4 )

0,50 0,30 0,20 MPT 1 = 0,50 0,30 0,20 0,50 0,30 0,20
(6 )

0,50 0,30 0,20 MPT 1 = 0,50 0,30 0,20 0,50 0,30 0,20
(8 )

o matrice de echilibru, care nu se modific peste o anumit valoare a exponentului i care prin structura numeric exprim intensitatea corelaiilor care exist n seria de timp analizat. Pentru exemplificarea modului n care se reflect gradul de determinare n structura unei matrici de tranzitie prezentm n continuare: a) matricea unui proces determinist de tipul MPTD: ...ABCDABCDAABCDABCD... A B C D

A B MPTD = C D

0 0 0 1

1 0 0 0

0 1 0 0

0 0 1 0
D C

cu exprimarea grafic a tranzitiilor n fig. 65. Fig. 65 Tranziiile ntr-un proces determinist

29

Modele cantitative statistice

Daniel Scrdeanu

b) matricea unui proces aleator de tip MPDA: ...DBABCDCABCABDCDCBCDBAD...

A 0,000 B 0,360 MPDA = C 0,370 D 0,150

0,390 0,000 0,100 0,460

0,450 0,320 0,000 0,390

0,160 0,320 0,530 0,000

C Fig. 66 Tranziiile n MPDA

cu exprimarea grafic a tranzitiilor n fig. 66. La un numr mare de valori ale unei serii de timp aleatoare, probabilittile devin egale (ex.: P ( A B ) = P( A C ) = P( A D ) = 1 / 3 ) n cazul unui sistem cu patru stri distincte A,B,C,D). ntre cele dou extreme (model determinist i aleator) exist o infinitate de variante diferentiate prin intensitatea corelaiilor. Descrierea statistic a seriilor de timp este realizat prin patru functii elementare: dispersia, densitatea de probabilitate, coeficientul de autocorelaie sau intercorelaie i densitatea spectral. Dac primele dou sunt utilizate pentru orice variabil cu comportament aleator, ultimele dou sunt specifice seriilor de timp.

b) Coeficientul de autocorelaie

Autocovarianta este covarianta a dou realizri ale aceleiai variabile ( V ) care este determinat n dou puncte separate prin intervalul h . Covarianta, ca o functie de h poate fi scris sub forma:
CV (h ) = E (Vn ,Vn+h ) = lim 1 Vn Vn+h
N N

(III.215)

30

Modele cantitative statistice n care

Daniel Scrdeanu

h - "distanta" dintre cele dou valori ( h = 0,1,2,..., N 1 );


N - numrul de valori ale seriei de timp.

Functia de covariant este simetric n jurul valorii zero:

CV ( h ) = CV (h )
(III.216) iar dac h = 0 covarianta se reduce la dispersie (=variant) i se poate scrie :

CV (0) = var(V ) =
(III.217)

1 N

V
n =1

2 n

Coeficientul de autocorelaie se obine prin divizarea covariantei la variant i poate fi scris sub forma:

RV (h ) =
(III.218)

CV (h ) CV (0)

Estimatorul coeficientului de corelaie se calculeaz cu relaia:

rV (h ) =

(N h )iN=1h vi vi+h iN=1h vi iN=1h vi+h (N h ) vi2 ( vi )2 (N h ) vi2+h ( vi+h )2

(III.219) Valorile coeficientului de autocorelaie sunt cuprinse n intervalul [ 1,1] i evident Rv (0) = 1 este valoarea care indic o corelaie maxim. Valoarea

Rv (0) = 1

indic o corelaie maxim invers. Valorile estimate ale

31

Modele cantitative statistice

Daniel Scrdeanu

coeficientului de autocorelaie permit identificarea ciclicitilor dintr-o serie de timp. Reprezentarea

Rv (h )
+1 Nivel semnificaie minim 3 1 2 4 5 6 7 8

grafic

variatiei de

coeficientului

autocorelaie n functie de

h poart denumirea de
corelogram (Fig. 67) i
h ilustreaz sintetic

ntr-o

form

semnificatia

-1

Nivel semnificaie minim Fig. 67 Corelograma unei serii de timp

statistic a componentelor ciclice ale seriei studiate. Selectarea

componentelor cu semnificatie statistic se face prin alegerea unui nivel de semnificatie minim care filtreaz valorile coeficientului de autocorelaie. Intrun model pentru reproducerea i prognoza seriei de timp sunt reprezentate numai componentele al cror coeficient de autocorelaie depseste nivelul de semnificatie minim. Aplicatie. Ca un exemplu simplu se poate calcula corelograma unui proces geologic de tip markovian descris printr-o matrice de tranzitie. Acest lucru se poate realiza prin asocierea unei valori numerice fiecrei stri a sistemului . Pentru un proces cu dou stri distincte, asociind unei stri valoarea unu i celei de-a doua valoarea zero matricea de tranzitie va fi notat:
p MPT = 00 p10 p01 p11

n care p01 , p01 , p10 i p11 sunt probabilittile de tranzitie din sistemul studiat. Conform relaiei (III.215):
CV (h ) = E (Vn = Vn+h = 1) = P(Vn = 1) P(Vn+h = 1Vn = 1)

32

Modele cantitative statistice

Daniel Scrdeanu

i deoarece

P(Vn = 1) = E (Vn ) = p1

n care p0 , p1 sunt probabilittile stabile ale matricii MPT:


h CV (h ) = p1 p11

i
h RV (h ) = p11

Corelograma unui astfel de proces markovian corespunde puterilor probabilittilor de tranzitie p11 i n general, pentru orice lan markov va fi o functie simpl de MPT (h ) . Dac se calculeaz corelograma uni proces aleator "pur" n care

E (Vn ) = 0 , atunci RV (h ) = 0 pentru h = 1,2,3,... avnd un singur maxim de RV (h ) = 1 pentru h = 0 . Acest lucru este n acord cu definitia unui proces
aleator n care se presupune c nu exist corelaii ntre Vn i Vn+h pentru orice
n i orice h diferit de zero.

c) Coeficientul de intercorelaie

U, V ul U este V dou 0 Fig. 68 Variaia n timp a dou caracteristici geologice cu comportament aleator t

Coeficient de intercorelaie utilizat intensittii corelaiei dintre de serii pentru evaluarea

timp ce msoar

33

Modele cantitative statistice

Daniel Scrdeanu

variatia a dou variabile disticte U ,V (ex.: U =precipitatiile, V =cota nivelului piezometric al unui acviferului freatic); U =porozitatea, V =valoarea PS-ului corespunztor nregistrat ntr-un carotaj etc.) (Fig. 68).

Relaia de calcul pentru coeficientul de intercorelaie este:

rUV (h ) =

(N h ) vi2 ( vi )2 (N h )U i2+h (U i+ h )2

(N h )iN=1hViU i+h iN=1hVi iN=1hU i+h

(III.220) Domeniul de variatie i semnificatia coeficientului de intercorelaie sunt analoage cu cele ale coeficientului de autocorelaie. Referindu-se la dou variabile RUV (0) este identic cu coeficientul lui Pearson i numai n cazul unei corelaii liniare perfecte ntre U i V va avea valoarea unitar, pozitiv sau negativ dup cum corelaia este direct respectiv invers. Corelograma coeficientului de intercorelaie este utilizat n scopul identificrii periodicittii seriilor de timp multivariate, a decalajelor cu semnificatie statistic pentru cupluri de dou variabile. Prin analiza corelaiei dintre variatia precipitatiilor i a nivelului piezometric din acviferele freatice se poate evalua, spre exemplu, cu ajutorul coeficientului de intercorelaie, durata de tranzit a apei prin zona de aerare i implicit vulnerabilitatea la poluare a acviferelor. *** Att pentru coeficientul de autocorelaie ct i pentru cel de intercorelaie seriile de timp sunt presupuse lineare i stationare. Dac aceste condiii nu sunt ndeplinite, evaluarea corelaiilor temporare presupune o preprocesare care s realizeze:

34

Modele cantitative statistice

Daniel Scrdeanu

a ) linearizarea datelor (prin logaritmare, ridicare la putere, extragerea rdacinii de un ordin oarecare) sau separarea datelor ntr-un numr oarecare de subdomenii pe care s se comporte linear; b) eliminarea tendintelor neperiodice care mascheaz componentele ciclice ale seriilor de timp. Aceast operatiune se realizeaz prin identificarea modelului analitic al tendintei i eliminarea ei din datele brute. Evaluarea coeficienilor se opereaz asupra valorilor "reziduale" (M.Tertisco et.al., 1985).

35

Modele cantitative statistice

Daniel Scrdeanu

3.2. Factorizarea corelaiilor


Rezultat din complexitatea proceselor ecologice, necesitatea

identificrii factorilor principali care determin evolutia fenomenelor este obiectivul final al descrierii multivariate a proceselor ecologice. Unul din cele mai adaptate instrumente pentru soluionarea acestei probleme este analiza factorial. Analiza factorial a fost privit n general ca o metod misterioas de o mare complexitate. O parte din misterul care o nconjoar provine din bogata terminologie utilizat. Analiza factorial a fost dezvoltat de psihologii experimentalisti n anii 1930-1940 i mare parte din terminologie are semnificatie numai n contextul acestui domeniu. Obiectivul original al analizei factoriale a fost s dea un sistem corect de evaluare a inteligentei prin corelarea punctajelor obtinute din diferite teste relative la abilitatea mental. Este n general acceptat faptul c punctajul dintrun singur test nu poate da o msur real a inteligentei unei persoane. O persoan bine nzestrat intelectual va obine rezultate mai bune la majoritatea testelor de inteligent dect o persoan considerat inferioar mental. Diferentele la testele specifice nu reflect diferentele mentale ci de educatie, cultur general i circumstantiale, legate de condiiile n care se desfsoar testele. Psihologii au considerat analiza factorial capabil s extrag coeficientul corect de evaluare a inteligentei din rezultatele tuturor testelor chiar dac nici unul dintre aceste teste, individual, nu este capabil s o fac corect. Aplicat n cercetri biologice i geologice analiza factorial studiaz relatiile dintre un numr mare de variabile msurabile, cu scopul evidentierii unor noi variabile, teoretice, numite factori. Aceste noi variabile (=teoretice =factori) sunt ntr-un numr mai mic dect variabilele msurabile i sunt n acelai timp functii lineare de variabilele msurabile. Noile variabile sunt astfel stabilite nct s explice ntr-un procent ct mai mare varianta variabilelor originale. Se caut prin analiza factorial 36

Modele cantitative statistice

Daniel Scrdeanu

gsirea unui numr ct mai mic de factori (=variabile teoretice) care s exprime variabilitatea observat pin intermediul valorilor msurate. Variabilitatea rezidual, rmas neexprimat este o pierdere de informatie compensat prin numrul redus de variabile teoretice cu care se opereaz n continuare pentru modelarea procesului studiat. Variabilele teoretice (=factorii) vor putea reflecta fenomene naturale care sunt la originea variabilittii observate i astfel se vor putea interpreta ntr-o optic naturalist rezultatele calculelor cantitative. Fundamentate pe aceleai principii, factorizarea corelaiilor sistemelor multivariate poate fi abordat prin trei variante ale analizei factoriale: analiza n componeni principali, analiza factorial R-MOD i analiza factorial QMOD. Separarea tipurilor de sedimente pe baza variabilittii compozitiei granulometrice i identificarea fractiunilor caracteristice diferitelor tipuri de sedimente pot fi realizate prin aplicarea analizei componentilor principali. Dac se studiaz un corp plutonic, pentru stabilirea numrului factorilor care condiioneaz distributia elementelor chimice i mineralelor se utilizeaz analiza factorial R-MOD. Gruparea taxonomic a unui lot de esantioane prelevate din diferite tipuri de roci (ex.: sienit, monzonit, diorit, quartit, gabrou, norit, diabaz) pe baza oxizilor continuti (ex.: SiO2, Al2O3, Fe2O3, FeO, MgO, CaO, Na2O, K2O) se poate realiza printr-o analiz factorial Q-MOD. Toate variantele analizei factoriale vor fi luate n studiu n acest capitol, punctul de plecare fiind obligatoriu analiza n componenti principali. Obiectivul operational al analizei factoriale este interpretarea structurii matricilor de varian-covarian pentru un ansamblu multivariat de date. Tehnica utilizat este extragerea valorilor proprii i a vectorilor proprii din aceste matrici care exprim sintetic ansamblul de relatii dintre variabilele msurate.

37

Modele cantitative statistice

Daniel Scrdeanu

3.2.1. Valori proprii i vectori proprii


Determinarea valorilor proprii i vectorilor proprii este privit ca fiind cea mai dificil operatie n algebra matricial. Dificultatea nu const n metoda de calcul, care nu este mai dificil dect alte procedee matematice, ci n perceperea semnificatiei acestor instrumente n mod intuitiv. Pentru o clar percepere a acestor semnificatii vom utiliza o interpretare geometric deosebit de clar aplicabil matricei coordonatelor a dou puncte plasate ntr-un spatiu bidimensional i vom interpreta valorile propprii, vectorii proprii i functiile asociate ca proprietti geometrice ale aranjamentului acestor puncte. Aceast abordare ne limiteaz la matrici mici (2X2) dar rezultatele obtinute pot fi extrapolate la sisteme mai mari chiar dac calculul manual devine impracticabil. Trebuie notat cu acest prilej c suntem ntr-un domeniu n care puterea de calcul chiar a celor mai moderne calculatoare deseori este inadecvat pentru soluionarea problemelor reale. a) Valori proprii Considerm sistemul matricial ipotetic:

[A][X ] = [X ]
(III.258) care formal este similar cu

[A][X ] = [B] n care [B] = [X ]


(III.259) Ecuaia poate fi rescris sub forma:

([A] [I ])[X ] = [O]


(III.260)

38

Modele cantitative statistice n care I este matricea identitate.

Daniel Scrdeanu

Pentru matrici [2X2], ecuaia matricial (III.260) poate fi scris sub forma sistemului:
( A11 )X 1 + A12 X 2 = 0 A21 X 1 + ( A22 )X 2 = 0

(III.261) Presupunnd c sistemul are i alte soluii dect cea banal


X 1 = X 2 = 0 atunci trebuie ca:

det A I = 0
(III.262) care prin dezvoltare devine ecuaia:

2 2 ( A11 + A22 ) + A11 A22 A21 A12 = 0


(III.263) cu dou soluii reale n cazul unei matrici A simetrice. Aplicatie. Pentru dou puncte P1 (4,8) i P2 (8,4 ) matricea coordonatelor este:

4 8 A= 8 4
iar matricea pentru calculul valorilor proprii

4 A= 8

8 4

Soluiile ecuaiei de gradul doi care rezult prin dezvoltarea determinantului sunt:

1 = 4 i 2 = 12

39

Modele cantitative statistice

Daniel Scrdeanu

Punctele P1 i P2 pot fi imaginate ca fiind plasate pe conturul unei elipse al crei centru este plasat n centrul sistemului de referint. Elipsa este ca o anvelop care cuprinde ambele puncte iar valorile proprii pot fi interpretate ca semiaxele elipsei. Raportul axelor poate fi o expresie numeric a gradului de mprstiere a punctelor. Cu ct punctele sunt mai apropiate, lungimea axelor difer mai mult i elipsa tinde spre o dreapt. Dac cele dou puncte se afl pe doi vectori perpendiculari elipsa devine cerc. Ca exemplificare se calculeaz valorile proprii pentru matricile coordonatelor a dou puncte situate pe dou axe care fac un unghi de: a) 90o; b) 45o; c) 30o; d) 0o (Fig. 69).
P1 4 8 P ; a) 8 4 2 4 8 4 8

4 8 b) 8 4

6 8 c) 8 6

d)

a) 1 = 8,95 1 = 12 2 = 8,95
y O

b) 1 = 12

c) 1 = 14

d)

2 = 4
y P2(4;8) P1(8;4) O

2 = 2
y O P1(8;4) x O O P1(6;8) O

2 = 0
y O P(4;8)

P2(-4;8) O O

P2(8;6) x O;O x

Fig. 69 Semnificaia geometric a valorilor proprii i vectorilor proprii Ca regul de verificare a corectitudinii calculului valorilor proprii se retine c suma valorilor proprii este egal cu urma matricii initiale (suma valorilor de pe diagonala principal). Valorile proprii reprezint lungimile celor dou semiaxe ale elipsei pe care sunt plasate cele dou puncte sau, generaliznd, la "n" dimensiuni, "n" semiaxe ale elipsoidului care nglobeaz toate punctele ntr-un spatiu cu "n" dimensiuni.

40

Modele cantitative statistice b) Vectori proprii Revenind la ecuaia

Daniel Scrdeanu

([A] [I ])[X ] = [O] ,

dac dup calculul valorilor

proprii acestea sunt utilizate pentru calculul soluiei nebanale, se obin vectorii proprii ai matricii iniiale. Pentru matricea [2X2] dezvoltnd ecuaia (III.260) se obine:
A11 A 21 A12 X 1 0 = A22 X 2 0

(III.264) Vectorul

[X 1 , X 2 ]

se numeste vector propriu (=caracteristic proprie

=caracteristic latent =vector principal) asociat valorii proprii. Pentru a concluziona relativ la partea operational, trebuie mentionat c pentru a afla vectorii proprii i valorile proprii ale unei matrici [n n ] trebuie s-i gsim determinantul, rdcinile ecuaiei polinomiale caracteristice i s soluionm un set de n ecuaii cu n necunoscute. Aplicatie. Revenind pentru interpretare la matricea

4 8 A= 8 4
ecuaia de calcul pentru vectorul propriu al valorii proprii 1 = 12 este:
8 X 1 0 4 12 = 8 4 12 X 2 0

cu soluia
X 1 1 X = 1 2

Pentru ecuaie exist o infinitate de vectori proprii pentru c sistemul este satisfcut de

41

Modele cantitative statistice


X1 1 X = 1 2

Daniel Scrdeanu

unde este o constant oarecare. Practic este insuficient s ne limitm la

= 1 deoarece, aa cum se va vedea, suntem interesai de valorile


rapoartelor dintre elementele vectorului care nu se schimb prin multiplicare cu o constant. Pentru cea de-a doua valoare proprie 2 = 4 , soluia pentru al doilea vector propriu este:
X1 1 X = 1 2

Revenind la figura 69, vectorii proprii pot fi interpretati ca pantele celor dou axe ale elipsei. Primul vector propriu defineste bisectoarea unghiului determinat de cele dou puncte i centrul elipsei i a crei lungime este egal cu prima valoare proprie ( 1 = 12 ), iar ce-l de-al doilea vector propriu definete axa ortogonal cu prima. De retinut c matricile simetrice au toate valori proprii reale iar vectorii proprii corespondenti sunt ortogonali.

3.2.2. Standardizarea

Analiza factorial este deseori confruntat cu interpretarea unei matrici de varian-covarian obtinut dintr-o colectie de caracteristici geologice exprimate n unitti de msur diferite. Valorile exprimate n unitti de msur diferite nu pot fi comparate direct necesitnd o transformare a datelor originale prin standardizare. Standardizarea se realizeaz prin extragerea din fiecare valoare original a valorii medii a variabilei i divizarea diferentei prin abaterea standard. Se obine astfel un nou set de valori cu media zero i dispersia unu . 42

Modele cantitative statistice

Daniel Scrdeanu

Standardizarea permite compararea variabilelor exprimate n unitti de msur diferite, altfel spus permite compararea "merelor" cu "perele". Dac se opereaz cu matricea de corelaie a variabilelor studiate, cum este cazul n analiza factorial Q-MOD sau R-MOD, nu este necesar s se standardizeze valorile pentru c de fapt matricea de corelaie este matricea de varian-covarian a datelor standardizate. Standardizarea poate avea o influent determinant asupra structurii matricii de variant-covariant i n consecint asupra rezultatelor analizei factoriale dac amplitudinile de selectie ale variabilelor difer semnificativ i distributiile sunt puternic asimetrice. Cnd unittile de msur nu difer se recomand din acest evitarea standardizrii. Pentru ilustrarea efectului standardizrii s considerm reprezentrile grafice ale datelor brute (Fig. 70) i ale celor standardizate (Fig. 71) pentru care au fost calculate separat matricile de covariant, valorile proprii i vectorii proprii. Efectul standardizrii este extinderea ambelor variabile pe acelai interval valoric cu modificarea raportului de mprstiere a valorilor pe cele dou axe i rotirea axelor principale cu 45o (cu 45o pentru toate matricile binare i cu valori diferite n cazul matricilor mai mari). De asemenea, se remarc o reducere slab a variantei de-a lungul primului vector propriu (de la 96% la 93%), reducere care se accentueaz proportional cu diferenta dintre domeniile de variatie ale variabilelor originale.

Tabelul III.32 Elementele de standardizare Valori nestandardizate Valori standardizate MEDIA m( X 1 ) = 5 m( XS1 ) = 0 m( X 2 ) = 10 m( XS 2 ) = 0 VARIANA 2 s ( X 1 ) = 6,08 s 2 ( XS1 ) = 1 s 2 ( X 2 ) = 27,54 s 2 ( XS 2 ) = 1 MATRICE DE COVARIAN MATRICE DE CORELAIE 6,08 11,08 1,00 0,86 cov = R= 11,08 27,54 0,86 1,00 43

Modele cantitative statistice VALORI PROPRII

Daniel Scrdeanu

1 = 32,23 (96% ) 2 = 1,39 (4% )


V1 [0,39;0,92] V2 [0,92;0,39]
20

1 = 1,86 (93% ) 2 = 0,14 (7% )


V1 [0,707;0,707] V2 [ 0,707;0,707]
2

VECTORI PROPRII

15

1
-2

-1 1 -1
-2

10

0 0

10

15

20

Fig. 70 Reprezentarea grafic a datelor nestandardizate

Fig. 71 Reprezentarea grafic a datelor standardizate

3.2.3. Analiza n componeni principali


Analiza n componenti principali const n transformarea liniar a m variabile msurabile corelate, n n variabile teoretice care sunt combinatii linerare ale celor vechi. Fiecare nou variabil este astfel creat nct s nglobeze ct mai mult din varianta total a datelor originale. Componentii principali nu sunt altceva dect vectorii proprii ai matricii de varian-covarian. n calcule nu este implicat nici o ipotez probabilist sau testare astfel nct A.C.P., strict vorbind, este doar o prelucrare matematic i nu o procedur statistic. Utilitatea A.C.P. este apreciat dup performante i nu dup consideratii teoretice.

a) Metodologia de lucru

44

Modele cantitative statistice

Daniel Scrdeanu

Presupunnd c dispunem de o colectie de 25 de exemplare de brahiopode i msurm pentru fiecare exemplar lungimea X 1 i ltimea X 2 (tabelul III.32) matricea de varian-covarian obinut prin calcul este

20,3 15,60 cov = 15,60 24,10


Reprezentnd grafic aceast matrice, considernd-o ca fiind alctuit din coordonatele a dou puncte cu abscisele pe prima linie i cu ordonatele pe a doua, se obine o reprezentare vectorial care exprim grafic corelaia dintre cele dou variabile X 1 i X 2 (Fig. 72 i 73). Calculul vectorilor proprii i al valorilor proprii conduc la obinerea elementelor elipsei ce nglobeaz toate cele 20 de puncte din tabelul III.32:
VectorI = [0,66;0,75], VectorII = [0,75;0,66] cu I = 37,9 i II = 6,5 (Fig. 74).

Tabelul

III.32

Elemente

ale

analizei DATELE

componenti principali VALORILE SELECTIEI Nr. 1 2 3 4 5 6 7 8 9 10 11 12


X1 X2

VALORILE FACTORIZATE
Y1 Y2

ORDONATE
X1 X2

3 4 6 6 6 7 7 8 9 9 9 10

2 10 5 8 10 2 13 9 5 8 14 7

3.49 10.14 7.72 9.97 11.46 6.14 14.37 12.04 9.71 11.96 16.45 11.87

0.92 -3.64 1.18 -0.81 -2.14 3.91 -3.38 3.32 3.42 1.43 -2.45 2.84

3 4 6 6 6 7 7 8 9 9 9 10

2 2 5 5 6 7 7 8 8 9 10 10

45

Modele cantitative statistice 13 14 15 16 17 18 19 20 21 22 23 24 25 11 12 12 13 13 13 13 14 15 17 17 18 20 12 10 11 16 14 15 17 7 13 13 17 19 20 16.28 15.44 16.19 13.11 19.1 19.85 21.35 14.52 19.68 21 24 26.16 28.23 0.28 2.35 1.69 5.75 0.45 -0.22 -1.54 5.84 2.6 4.1 1.45 0.87 1.7 11 12 12 13 13 13 13 14 15 17 17 18 20

Daniel Scrdeanu 10 11 12 13 13 13 14 14 15 17 17 19 20

Se poate defini variana total a setului de date ca sum a varianelor individuale i deoarece valorile acestor variane se afl pe diagonala principal a matricii de varian-covarian ea va fi numeric egal cu urma acestei matrici i implicit cu suma valorilor proprii ale matricii: Variana total = 20,3 + 24,1 = 44,4

46

Modele cantitative statistice


30

Daniel Scrdeanu

20

Cov X1

Var X2

Var X1 0 10 20 30

Fig. 72 & 73 Reprezentarea grafic a matricii de varian-covarian

Fig. 74 Elipsa definit de variana i covariana datelor din tabelul III.32 La aceast varian total variabila X 1 contribuie cu 20,3/44,4 = 46% iar X 1 cu 24,1/44,4 = 54%. Variana total fiind egal cu suma valorilor proprii ale matricii de varian-covarian rezult c axele elipsei ce nglobeaz toate perechile ( X i , Yi ) reprezint variana total, iar fiecare ax exprim o anumit parte din ea. Pentru matricea utilizat, axa principal reprezint 37,9/44,4 = 86% din variana total n timp ce a doua ax, corespunztoare celei de-a doua valori proprii ( 2 = 6,5 ) 6,5/44,4 = 14%. Astfel spus, dac msurm variana setului de date de-a lungul primei axe principale putem reprezenta 86% din totalul varianei totale. Este evident 47

Cov X2

10

Modele cantitative statistice

Daniel Scrdeanu

c cel putin una din axele principale va fi mai eficient n exprimarea varianei dect oricare din axele originale i implicit, printre celelalte axe principale se va gsi una mai puin eficient dect oricare din axele originale. Dac se realizeaz transformrile liniare de forma:
Y1 (i ) = V11 X 1 (i ) + V12 X 2 (i )Y2 (i ) = V21 X 1 (i ) + V22 X 2 (i )

n care V11 ,V12 ,V21 ,V22 sunt elementele celor doi vectori proprii, se creaz dou noi variabile factorizate: Y1 care reprezint 37,9/44,4 = 86% i Y2 numai

6,5/44,4 = 14% din variana total (Tabelul III.32) Deoarece noile variabile proprii Y1 i Y2 sunt msurate de-a lungul celor doi vectori, ortogonali, corelaia dintre ele va fi zero. Componentele vectorilor proprii ( V11 ,V12 ,V21 ,V22 ), coeficienii numerici ai ecuaiilor liniare de generare a noilor variabile sunt ponderile fiecrei variabile pe un anumit factor (ex.: V11 este ponderea variabilei X 1 pe "factorul" Y1 ). Dac este obligatoriu din considerente de eficient a prelucrrii datelor s reducem sistemul nostru la numai o variabil: dac renuntm la una din variabilele originale X 1 sau X 2 pierdem 46% sau 56% din variana total. Dac convertim variabilele originale prin proiectarea pe axele componentilor principali, opernd cu Y1 pstrm 86% din variana total pierznd doar 14%.

b) Influenta covariantei asupra A.C.P.

Eficiena repartizrii varianei totale pe un numr de factori mai mic dect cel al variabilelor originale este determinat de intensitatea corelaiei dintre ele. Pentru exemplificare, n setul de date brute se realizeaz o ordonare i o randomizare a valorilor (Tabelul III.32). Se obin dou noi serii de 20 de perechi de valori fiecare cu aceeai varian dar cu covariane diferite.

48

Modele cantitative statistice

Daniel Scrdeanu

Reprezentrile grafice ale celor dou serii de valori ilustreaz n raport cu seria iniial a valorilor cresterea corelaiei n cazul ordonrii i reducerea ei n cazul randomizrii (Fig. 75 i 76).

R ez ult ate le cal cul ulu


X1 Fig. 75 Datele ordonate X1 Fig. 76 Datele randomizate X2 X2

i pentru cele dou noi seturi de date conduc la urmtoarele rezultate: VALORI ORDONATE VALORI RANDOMIZATE

20,3 21,9 cov = 21,9 24,1


VALORI PROPRII

20,3 0,05 cov = 0,05 24,1

1 = 44,2(99% ) 2 = 0,2(1% )
VECTORI PROPRII
V1 = [0,68;0,74] V2 = [0,74;0,68]

1 = 24,3(54,7% ) 2 = 20,1(45,3% )
V1 = [ 0,22;0,98] V2 = [0,98;0,22]

49

Modele cantitative statistice

Daniel Scrdeanu

Reprezentrile grafice sunt sugestive pentru ilustrarea eficientei cu care componentii principali pot exprima variana n cele dou cazuri (fig. 77 i
30 20 10

X2 Vector 1 I

30

II
10 20 30

X1

30

Vector 2

Fig. 77 Elipsa valorilor ordonate 78).

Fig. 78 Cercul valorilor randomizate

n cazul valorilor ordonate (Fig. 77), axa principal poate exprima 99% din variana total, cea de-a doua fiind asa de scurt nct practic este imposibil de reprezentat grafic. Dac renuntm la ceast a doua component pierderea de varian a datelor originale este foarte mic. Se poate reduce deci dimensionalitatea setului de date originale de la doi la unu prin proiectarea pe prima ax principal cu o pierdere de varian total de 1%, utiliznd relaia: Y1 (i ) = V11 X 1 (i ) + V12 X 2 (i ) . In cazul valorilor randomizate (Fig. 78), cele dou valori proprii sunt practic identice, elipsa devenind cerc. Nici una din axele principale, n aceste condiii, nu va capta mai bine variana total n comparatie cu variabilele originale. n aceast situatie A.C.P. nu i gseste utilitatea i factorizarea corelaiei nu i are obiect, corelaia lipsind ntre variabile.

c) Aplicatie

50

Modele cantitative statistice

Daniel Scrdeanu

Aplicarea analizei n componenti principali este exemplificat prin separarea tipurilor de sedimente pe baza analizelor granulometrice realizate pe 50 de probe recoltate din cinci domenii distincte (I, II, II, IV, V) pentru care s-au determinat apte fractiuni granulometrice ( x1 , x2 , x3 , x4 , x5 , x6 , x7 ). Calculul matricii de varian-covariant se face pe date originale, nestandardizate deoarece toate sunt msurate n aceleai unitti de msur. Deoarece matricea de covariant este supradeterminat (suma tuturor fractiunilor granulometrice este 100), una din valorile proprii teoretic trebuie s fie nul. Practic ea va fi foarte mic i nu nul deoarece nu n toate probele suma fractiunilor componente dau 100 din cauza erorilor de determinare. Tabelul III.33 Matricea de varian-covarian a celor 7 fraciuni
x1 x1 x2 x2

x3

x4

x5

x6

x7

4,8443 -2,6234 -0,0011 -1,5449 -0,5972 -0,3805 -0,0222 468,848 81,3941 -200,2109 -84,2597 -71,2097 -57,8578 353,1255 -84,6165 -73,0435 -65,5433 -56,1533 130,2741 44,7616 34,9927 23,9136 30,4350 23,7565 19,3907 22,4189 17,967

x3
x4

x5 x6 x7

Tabelul III.34 Valorile proprii ale matricii de variancovarian Vector I II III IV V VI Valoare proprie 659,7759 318,4384 35,1959 6,7528 3,8193 2,3763 Varian total Varian total cumulat % 64,18 30,98 3,42 0,66 0,37 0,23 64,19 95,17 98,59 99,25 99,62 99,85

51

Modele cantitative statistice VII 1,5540 0,15

Daniel Scrdeanu 100,00

Tabelul III.35 Vectori proprii Var


x1 x2

I -0,0019 0,7710 0,4167 -0,3907 -0,1895 -0,1618 -0,1308

II 0,0039 -0,4777 0,8647 0,0761 -0,0794 -0,0813 -0,0735

III -0,0689 0,3194 0,0531 0,8844 -0,0775 -0,1629 -0,2750

IV -0,5829 0,1885 0,2119 0,0704 0,6308 0,3330 0,2570

V 0,7554 0,1169 0,1123 0,0490 0,6255 0,0526 -0,0815

VI 0,2793 0,1581 0,1294 0,2280 -0,3240 0,2510 0,8107

VII 0,0818 0,0326 0,0421 0,0028 -0,2401 0,8723 -0,4146

x3
x4

x5 x6 x7

Pe baza elementelor calculate n tabelele III.33, III.34, III.35 se deduc elemetele necesare interpretrii. Primii doi componeni principali acumuleaz 95,17% din variana total, ncrcarea principal aparinnd fraciunii fine i foarte fine (factorul I: ( x2 ), ( x3 ) i ( x4 ); factorul II: ( x2 ) i ( x3 )). Diferena dintre cele cinci medii de sedimentare poate fi complet descris prin numai doi factori principali. Prin reprezentarea variabilelor transformate n sistemul de referin al factorilor I i II separarea lor este evident (Fig. 79).

52

Modele cantitative statistice


20

Daniel Scrdeanu

10

-10

-20

II

-30

-40

-50

-60

I Fig. 79 Reprezentarea valorilor funcie de factorii I, II

-70 -70

-50

-30

-10

10

30

Relaiile de transformare sunt: 1)pentru factorul I:

YI (i ) = 0,0019 X 1 (i ) + 0,7710 X 2 (i ) + 0,4167 X 3 (i ) 0,3907 X 4 (i ) 0,1895 X 5 (i ) 0,1618 X 6 (i ) 0,1308 X 7 (i ) 2)pentru factorul II:
YII (i ) = 0,0039 X 1 (i ) 0,4777 X 2 (i ) + 0,8647 X 3 (i ) + 0,0761X 4 (i ) 0,0794 X 5 (i ) 0,0813 X 6 (i ) 0,0735 X 7 (i )
2,25 2,0 1,75 1,50 1,25 1,0 0,75 0,5 0,25 3 4 5 6 7

Eficiena

celor

doi

factori poate fi comparat cu puterea de separare a tipurilor de sedimente pe baza medianei i gradului de sortare (Fig. 80) sau a procentajului de nisip i raportului dintre nisip fin i nisip foarte fin (Fig. 81). Fiecare din aceste diagrame sunt aproximativ

Fig. 80 Separarea funcie de median (OX) i gradul de sortare (OY)

la fel de eficiente n separarea tipurilor de sedimente.

53

Modele cantitative statistice

Daniel Scrdeanu

Avantajul A.C.P este implicat de faptul c din analiza ncrcrilor factorilor pentru fiecare variabil se poate concluziona c sedimentele analizate pot fi considerate o mixtur de material nisipos i silt argilos. Aceast observatie sugereaz nu numai un alt mod de a privi sedimentele dar indic i o posibilitate de reducere a fractiunilor granulometrice la trei, suficiente pentru a permite separarea clar a celor cinci tipuri de sedimente.

3,5 3,0 2,5 2,0 1,5 1,0 0,5 0 20 40 60 80 100

Analiza componeni mod pentru

n principali testarea n de altor media,

poate fi utilizat n acest eficientei separarea sedimente statistici sortare). relative tipurilor i (ex.: a

coeficieni sau parametri mediana, coeficientul de

Fig. 81 Separarea tipurilor de sedimente funcie de coninutul n nisip (OX) i raportul nisip fin/nisip foarte fin (OY)

54

Modele cantitative statistice

Daniel Scrdeanu

3.2.4. Analiza factorial R-MOD

n analiza factorial R-MOD (R este simbolul matematic al matricii de corelaie) relatiile dintre m variabile msurabile sunt privite ca o reflectare a corelaiei acestora cu p factori necorelai. Presupunerea uzual este c

p < m.
Rezult c variana total are dou componente: una determinat de

p factori comuni i alta individual/specific fiecrei variabile.


Modelul matematic poate fi exprimat sub forma:

X j = l jr f r + j
r =1

(III.264) n care:
f r - factorul comun;

p - numrul de factori; l jr - ncrcarea factorului r pe variabila j ;

j - variaia aleatoare specific variabilei X j ;


Presupunnd o distributie normal multivariat a variabilelor X j , variana i covariana formeaz o matrice [m m] ale crei elemente diagonale sunt de forma:
2 s2 jr = l jr + var j r =1 p

(III.265) iar restul elementelor de forma:

55

Modele cantitative statistice

Daniel Scrdeanu

cov jk = l jr lkr
r =1

(III.266) Dac notm matricea varian-covarian cu s 2 , cu L matricea [m p ] a ncrcrilor factoriale i cu var( j ) matricea diagonal [m m] cu variantele aleatoare specifice fiecrei variabile, avem relaia:

[s ] = [L] [L] + [var( )]


2 T j

(III.267) Produsul [L ] [L]


T

conduce la o matrice [m m] cu p valori proprii

pozitive i cu vectorii proprii asociai. Dac p = m , matricea var( j ) = 0 i problema este echivalent cu Analiza n Componeni Principali. Analiza Factorial cere ca numrul de factori s fie mai mic dect numrul de variabile i s fie cunoscut nainte de nceperea analizei. Acest lucru presupune deinerea unor informaii suplimentare fa de datele numerice ce vor fi prelucrate i din care s rezulte numrul de factori ce trebuie extrai. Dac p nu este cunoscut, mprtirea variantei ntre factorii comuni i factorii specifici poate fi rezolvat ntr-un numr practic nelimitat de variante.

a) Diferenta operational dintre A.C.P. i A.F.R.-MOD

Calculul valorilor proprii i vectorilor proprii n analiza factorial R-MOD se face plecnd de la matricea de corelaie. Acest lucru implic transformarea componentelor principale ale vectorilor n factori. Vectorii proprii obtinuti din matricea de corelaie sunt normalizati (adic suma ponderilor este unitar) i pentru a putea realiza analiza factorial trebuie convertit valorea unitar a vectorului ntr-o valoare a crei lungime s reprezinte valoarea proprie corespunztoare. Acest lucru se face prin multiplicarea fiecrei componente a vectorului propriu normalizat cu rdcina

56

Modele cantitative statistice

Daniel Scrdeanu

ptrat a valorii proprii corespunztoare. Rezultatul este un factor, adic un vector care este ponderat proportional cu mrimea varianei totale pe care o reprezint. Pentru matricea de corelaie:

1,00 0,86 COV = 0,86 1,00


cu valorile i vectorii proprii:

1 = 1,86 i V1 = [0,707 0,707] 2 = 0,14 i V1 = [ 0,707 0,707]


factorii ce nglobeaz variana ansamblului sunt:

0,707 1,86 0,964 FACTOR1 = = 0 , 707 1 , 86 0,964 0,707 0,14 0,264 FACTOR 2 = = 0 , 707 0 , 14 0,264
Verificarea corectitudinii convertirii vectorilor proprii standardizati n factori se face prin nsumarea ptratelor ponderilor factoriale care trebuie s fie egale cu valorile proprii: 0,9642 + 0,9642 = 1,86 Primul factor reprezint i (-0,264) 2 + 0,2642 = 0,14 1,86/2,00=93% din variana total a

variabilelor originale. Din aceast varian 0,9642/1,86=50% este ponderea variabilei 1 i 0,9642/1,86=50% este ponderea variabilei 2. Al doilea factor reprezint 0,14/2,0=7% din variana total a datelor cu (-0,264)2/0,14=50% pentru a doua. Cei doi factori redau 100% din variana total iar scrierea matricial utilizat pentru exprimarea ponderilor factoriale este: FACTORI 57 pondere pentru prima variabil i 0,2642/0,14=50%

Modele cantitative statistice I VARIABILE: II

Daniel Scrdeanu

1 0,964 0,264 2 0,964 0,264

Prin nsumarea ptratelor ponderilor factoriale pentru fiecare variabil se obine mrimea total a varianei retinut de factori care poart numele de comunalitate. Pentru matricea [2 2] luat ca exemplu, comunalittile pentru ambele variabile sunt unitare: Variabila 1: h 21 = (0,964) + ( 0,264) = 1
2 2

Variabila 2: h 2 2 = (0,964 ) + (0,264) = 1


2 2

Dac numrul factorilor extrai coincide cu numrul variabilelor, comunalittile sunt egale cu variana original i pentru c se lucreaz cu variabile standardizate ea va fi egal cu unitatea. Dac se extrag mai putin de m factori ( m = nr. variabile) comunalittile vor fi subunitare i vor fi un coeficient al eficientei setului de factori relativ la exprimarea varianei setului original de date. Spre exemplu, dac se retine numai primul factor comunalittile matricii factorilor sunt:

h 21 = 0,9642 = 0,93 pentru variabila 1; h 2 2 = 0,9642 = 0,93 pentru variabila 2.


Mrimea comunalittii este dependent de numrul de factori alei i aceasta ridic marile probleme ale analizei factoriale.

b) Cti factori trebuie alei?

Problema alegerii factorilor nu are soluie unic fiind o problem de optiune: a) psihologii experimentalisti extrag attia factori ct cere teoria accceptat pentru studiul esantonului de date; b) se extrag attia factori ct pot fi reprezentati grafic (2 sau 3); c) se extrag toti factorii proprii care au valori proprii mai mari ca 1, adic factorii care contin variane mai mari dect cele ale variabilelor standardizate. 58

Modele cantitative statistice

Daniel Scrdeanu

Dac pentru retinerea unei mari prti din variana total a sistemului este nevoie de multi factori, modelul analizei factoriale se consider neadecvat analizei esantionului de date disponibil.

c) Aplicatii

Un exemplu clasic pentru aplicarea analizei factoriale R-MOD este separarea a 25 prisme rectangulare (Tabelul III.35) dup form i mrime (cei doi factori) pe baza unui numr de 7 variabile: X1 = axa lung; X2 = axa intermediar; X3 = axa scurt; X4 = cea mai lung diagonal; X5 = (raza sferei circumscrise)/(raza sferei nscrise) X6 = (axa lung +axa intermediar)/(axa scurt) X7 = (aria total/volumul) n tabelele III.35b i III.36 sunt prezentate matricea de corelaie, valorile proprii i matricea vectorilor proprii, pentru prelucrare i interpretare fiind retinuti doar primii doi factori (corespunztori formei i mrimii) pentru care valorile proprii corespunztoare sunt supraunitare. Etapele de prelucrare ale cror rezultate intermediare sunt sintetizate n tabelele III.35, 36 i 37 sunt: Tabelul III.35 Dimensiunile a 25 de prisme generate aleator Nr.crt. 1 2 3 4 5 X1 3,760 9,840 8,390 4,940 7,230 X2 3,660 9,270 4,920 4,380 2,300 X3 0,540 1,510 2,540 1,030 1,770 X4 5,275 13,604 10,053 6,678 7,790 X5 9,768 9,017 3,956 6,494 4,393 X6 13,741 12,668 5,237 9,059 5,374 X7 4,782 1,745 1,432 2,807 2,274

59

Modele cantitative statistice 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 9,460 9,550 4,940 8,210 9,410 5,900 1,660 5,510 4,690 7,120 8,590 9,730 9,640 8,740 3,270 5,510 9,030 7,570 6,220 8,590 7,310 5,350 4,520 3,080 6,440 5,760 1,610 1,340 3,010 5,490 2,980 1,330 9,490 7,000 0,620 3,980 7,080 7,280 6,140 4,990 1,040 4,250 4,500 2,420 5,110 1,550 1,570 1,270 2,170 3,680 1,170 1,000 1,030 3,310 0,440 1,300 2,590 7,070 4,520 1,340 11,999 11,742 8,067 9,097 12,495 8,388 2,799 5,808 5,983 9,716 9,170 9,871 13,567 11,675 3,357 6,924 11,762 12,662 9,842 10,022 11,579 2,766 1,793 3,753 2,446 5,395 1,783 4,566 2,760 2,642 7,851 9,871 13,133 3,529 7,629 5,326 4,539 1,791 2,175 7,500

Daniel Scrdeanu 16,182 3,509 2,103 4,657 3,103 7,497 2,087 5,382 3,554 3,430 9,909 11,064 18,519 4,757 8,838 7,304 6,217 2,101 2,732 10,162 2,415 1,054 1,292 1,719 0,914 1,973 3,716 3,427 2,013 1,189 2,616 3,704 2,354 1,119 8,389 2,403 1,276 0,822 1,089 2,130

Tabelul III.35b Matricea de corelaie Variabilele X1 X2 X3 X4 X5 X6 X7 X1 1,000 0,580 0,201 0,911 0,283 0,287 -0,533 1,000 0,364 0,834 0,166 0,261 -0,609 1,000 0,439 -0,704 -0,681 -0,649 1,000 0,163 0,202 -0,676 1,000 0,990 0,427 1,000 0,357 1,000 X2 X3 X4 X5 X6 X7

Tabelul III.36 Valorile proprii

60

Modele cantitative statistice Vector I II III IV V VI VII Valoare proprie 3,3946 2,805 0,4373 0,2779 0,0810 0,0034 0,0003 Varian total 48,4949 40,0783 6,2473 3,9707 1,1565 0,0487 0,0037

Daniel Scrdeanu Var.cumulat [%] 48,4949 88,5731 94,8204 98,7911 99,9476 99,9963 100,0000

Tabelul III.37 Vectorii proprii Variabile X1 X2 X3 X4 X5 X6 X7 1. I 0,4053 0,4316 0,3854 0,4939 -0,1277 -0,0968 -0,4809 II -0,2224 0,3559 -0,5751 -0,5800 -0,1303 III 0,6980 0,1477 0,0294 0,1743 0,0176 IV 0,0888 -0,0338 0,6276 0,2103 0,1108 -0,0061 0,7353 V -0,2267 -0,4366 0,5121 -0,1054 0,3890 0,3549 -0,4553 VI 0,4098 0,1443 0,1875 -0,5878 0,5003 0,0332 VII -0,2782 -0,2540 -0,1081 0,5359 0,4975 0,0489 ponderilor -0,2929 -0,6674

-0,2323 -0,1186

-0,4232 -0,5562

Calculul

ponderilor X1

factorilor X2 X3

comuni X4

prin X5

multiplicarea X6 X7

normalizate cu radicalul valorilor proprii:

[L]T

FactI 0,747 0,795 0,710 0,910 0,235 0,178 0,886 = 0,971 0,218 FactII 0,491 0,373 0,596 0,389 0,963

2. Calculul comunalitilor prin nsumarea ptratelor ponderilor factoriale pentru fiecare variabil prin luarea n considerare a primilor doi factori conduce la:

61

Modele cantitative statistice

Daniel Scrdeanu

0,747 2 + 0,4912 0,798 X 1 X 2 0,771 2 2 0,795 + 0,373 0,710 2 + ( 0,596 )2 0,860 X 3 2 2 2 H = 0,910 + 0,389 = 0,979 pentru X 4 ( 0,235)2 + 0,9632 0,983 X 5 2 2 ( 0,178) + 0,971 0,976 X 6 2 ( 0,886 ) + 0,2182 0,833 X 7

3. Calculul varianei reziduale care exprim ponderea componentei specifice ( j ):


l H12 0,202 X 1 X 2 2 l H 2 0,229 l H 32 0,140 X 3 2 Re z = l H 4 = 0,021 pentru X 4 l H 2 0,017 X 5 5 2 l H 6 0,024 X 6 l H 2 0,167 X 7 7

Dac sunt retinuti m factori dintr-un set de m variabile matricea de covarian original s 2 poate fi generat prin multiplicarea tuturor perechilor de ponderi factoriale i nsumarea acestora pentru toti factorii. Cnd p < m matricea original nu poate fi reprodus exact. Pentru variabilele j i k covariana reproductibil este dat de relaia:
s2 jk = l j1 lk 1 + l j 2 lk 2 + ... + l jp lkp

[ ]

(III.268) n care l j1 este ncrcarea variabilei j pe factorul 1. Notnd cu L matricea ncrcrilor factoriale rezult c matricea reproductibil pe baza celor p factori se poate calcula prin:

[s ] = [L] [L]
'2

Reziduul matricii varian-covarian poate fi calculat prin diferenta:

62

Modele cantitative statistice

Daniel Scrdeanu

[s ] [L] [L] = [s
2
T

rezidual

(III.269) Analiza factorial este aplicat cu eficient n separarea faciesurilor calcaroase. Toomey (1966) a determinat pentru calcarele de Leavenworth (Pensilvanian superior =Carbonifer superior) din nordul regiunii Midcontinet 19 tipuri de constituenti petrografici: calcit spatic, micrit, pellete, trilobiti, ostracode, fusulinide, moluste, brachiopode, mobile, spiculi de spongieri, ncrustate, echinoderme, Tubiphytes, foraminifere foraminifere

Epimastopore, alge cu structur laminar, granule cu nvelis algal i particule de schelete necunoscute. Datele au fost determinate n 33 de probe i pe baza lor au fost delimitate cinci grupuri bine individualizate: grupul fusulinide calcit, grupul micrit, grupul foraminifere mici, grupul cochilii-briozoare i grupul granulelor cu nvelis algal, din care primele patru formeaz un cluster cu coeziunea intern mai mare. Analiza factorial R-MOD poate fi utilizat pentru separarea cu eficient maxim i total obiectivitate a tipurilor de crbune pe baza parametrilor fizico-chimici care se determin n mod clasic: grosime, greutate specific, cenus, umiditate, substante volatile, sulf, continut n carbon, putere calorific etc.

3.2.5. Rotatia factorilor


Dei analiza factorial poate reduce dimensionalitatea unei probleme pentru a o face mai usor de studiat, semnificatia factorilor poate fi dificil de dedus. Aceast dificultate poate fi determinat de faptul c pozitia a p axe factoriale ortogonale ntr-un spatiu m dimensional ( p < m ) sunt fortate de

m p axe inutile care de asemenea trebuie plasate ortogonal n spatiul de


probare.

63

Modele cantitative statistice

Daniel Scrdeanu

Deoarece avem nevoie numai de p axe factoriale, dup eliminarea axelor inutile pare posibil i avantajos s rotim axele factoriale pentru a gsi o pozitie care s maximizeze variana ncrcrilor factoriale. Metoda KAISER-VARIMAX are ca obiectiv rotirea fiecrei axe n pozitia n care proiectia fiecrei variabile s se plaseze n vecintatea extremittii sau originii sistemului de axe factoriale. Metoda opereaz prin ajustarea ncrcrilor factoriale astfel nct ele s fie ori aproape de 1 , ori aproape de zero. n acest mod pentru fiecare factor vor fi cteva ponderi semnificative iar restul aproximativ nule. Totui, n unele cazuri, rotirea rigid a axelor prin pstrarea ortogonalittii nu va mbuntti sau chiar poate conduce la rezultate confuze. Aceste situatii pot indica o corelare a factorilor (factori oblici) sau neadecvarea modelului factorial pentru analiza sistemului. Criteriul VARIMAX implic maximizarea varianei ncrcrilor factoriale. Se poate defini variana ncrcrilor pe factorul k sub forma:
l2 m l2 jp p j =1 jp 2 2 h j =1 h j j sk2 = p2
m

(III.270) Cantitatea care trebuie minimizat este:

V = sk2
k =1

(III.271) Variana este calculat din ncrcrile factoriale l jp care sunt corectate prin divizarea lor cu comunalitatile h 2 j , astfel nct numai partea comun a varianei fiecrei variabile este luat n considerare ndeprtnd constrngerile impuse de cele m p componente (necesare pentru luarea n considerare a ntregii variane a sistemului). Maximizarea varianei implic mrirea domeniului ncrcrilor care conduce la "extremizarea" ponderilor.

64

Modele cantitative statistice

Daniel Scrdeanu

Rotatia factorilor se face iterativ. Dou axe sunt ajustate simultan considernd restul axelor stationare. Dup ce toate axele au fost ajustate procesul este reiterat pn cnd cresterea varianei ncrcrilor la fiecare iteratie rmne sub o anumita valoare. Aplicatie. Rotatia axelor cu metoda Varimax. Considerm cazul ponderilor factoriale pentru cei doi factori utilizati n separarea prismelor (notate cu 1,2,...) pe baza formei i mrimii. Dup rotatie, pozitia relativ a variabilelor nu se schimb ci numai raportul fa de axele factoriale. Lungimea vectorilor este functie de proportia i variana original a fiecarei variabile preluat de axele factoriale. n
56

1,0

1,0
1 2

56

II
0,5
7

II
4 7

0,5
1 24

-1,0

-0,5 -0,5

0,5

1,0

-1,0

-0,5 -0,5

0,5

1,0

-1,0

-1,0

Fig. 82 ncrcrile factoriale nainte de Fig. 83 ncrcrile factoriale dup rotirea axelor rotirea axelor exemplul prezentat, cei doi factori prelund 88,59% din variana sistemului, lungimea vectorilor de pozitie este aproape unitar. Reprezentarea grafic a proieciilor factoriale (rotite sau nerotite) este mult mai complicat dect proiectarea pe axele componenilor principali. Componenii principali sunt transformri liniare i deci putem proiecta datele originale pe axele principale. n analiza factorial proiectiile datelor originale (=variabile msurabile) pe axele factoriale reprezint estimrile contributiilor diferitilor factori asupra fiecrei observatie (=proba n care se execut determinarea celor m

65

Modele cantitative statistice

Daniel Scrdeanu

variabile). Deoarece factorii nii sunt estimai din aceleai date, calculul proiectiilor factoriale este un proces circular, iar rezultatele nu sunt unice. Calculul proieciilor factoriale este esenial pentru studiile geologice. Pentru explicitarea modului de calcul ne vom referi la setul iniial de date [ X ] care este o matrice [m n] ( m - numr variabile; n - numr de probe). n cazul ACP se poate calcula o matrice a proieciilor factoriale [F ] prin multiplicarea matricii de date [ X ] cu matricea ncrcrilor factoriale [L ] :

[X ] [L] = [F ]
Dac reinem p factori, matricea ncrcrilor matricea proiectiilor va fi [n p ] .

(III.272)

[L]

va fi [m p ] , iar

Se tie c variabilele originale nu reprezint numai efectul factorilor comuni dar au i o component specific ( j ) . Matricea proieciilor calculat n acest mod va reflecta parial structura covarianei datelor originale, n msura n care factorii preiau aceast covarian. Influenta variatiei specifice ( j ) trebuie eliminat pentru realizarea proieciilor factoriale. Acest lucru se realizeaz prin multiplicarea ecuaiei (III.273) cu inversul matricii de covarian:

[X ] [s 2 ]1 [L] = [F ']

(III.273)

Deoarece inversarea matricii de covarian este laborioas calculul nu se realizeaz direct din aceast ecuaie. Se calculeaz n primul rnd matricea [s ] prin nmultirea matricii ncrcrilor factoriale cu transpusa ei:

[L]T [L] = [S ]
(III.274) Matricea obtinut se inverseaz i se multiplic cu [L ] obtinndu-se matricea coeficienilor proiectiilor factoriale [B ] :

[L] [S ]1 = [B]
(III.275)

66

Modele cantitative statistice

Daniel Scrdeanu

Matricea proiectiilor factoriale se obine din produsul cu matricea datelor originale:

[X ] [B ] = [F ']
(III.276) Sintetiznd n termenii matricilor ncarcrilor factoriale, operaia se poate scrie:

[X ] [B ] = [F ']
(III.277)

[X ] [L] [S ]1 = [F ']
(III.278)

[X ] [L] ([L]T [L])


(III.279)

= [F ']

Aceeai procedur este utilizat pentru a obine proieciile factoriale n cazul axelor rotite sau nerotite. De retinut c matricea [ X ] contine variabilele standardizate i nu pe cele initiale din selectia de valori ca n A.C.P., deoarece A.C.P. calculeaz ncrcrile componentilor principali plecnd de la matricea de varian-covarian n timp ce ncrcrile factoriale se calculeaz plecnd de la matricea de corelaie. Problema specificrii numrului de factori p care trebuie retinuti este critic. Numrul lor afecteaz mrimea matricii reproduse i reziduale, comunalittile i ncrcrile factoriale specifice ( j ). ncrcrile factoriale comune nu sunt afectate. Astfel, dac p = 2 i factorii sunt extrai din datele originale, ncrcrile pe factorii I i II nu sunt modificate dac se extrage i un al treilea factor. Totui, dac extragem i rotim doi factori, ponderile factoriale pot fi radical diferite de cele obtinute dac extragem i rotim trei factori din setul de date. Cnd sunt extrai doi factori ei nu introduc constrngeri la rotatie ca atunci cnd sunt extrai trei. Metoda Varimax pstreaz orogonalitatea factorilor. Exist metode de rotatie a axelor factoriale care nu pstrez ortogonalitatea, conducnd la rezultate mai uor de prelucrat deoarece se pot obine mai multe ponderi factoriale extreme. Din punct de vedere interpretativ apar contradicii cu principiile metodei care presupune c factorii comuni sunt

67

Modele cantitative statistice

Daniel Scrdeanu

necorelai, adic ortogonali. Renunnd la restricia ortogonalitii se admite intercorelaia dintre factori. Dac factorii sunt corelai ntre ei, relatiile ntre variabilele originale i factorii identificati sunt mult mai complexe dect n modelul adoptat deoarece interactiunile sunt att ntre perechile de variabile ct i ntre perechile de factori. Prezenta corelaiilor ntre factori conduce la ideea c exist alti SUPERFACTORI independenti care actioneaz asupra variabilelor msurate i factorilor comuni separai la primul nivel. Soluiile de rotatie oblic introduc mai mult subiectivitate n interpretare i trebuie abordate cu mult atenie.

3.2.6. Analiza factorial Q-MOD


Analiza factorial Q-MOD, introdus n geologie de Imbrie i Purdy (1962), este o a doua form de analiz factorial n care rolul valorilor (sau probelor) i al variabilelor se schimb. Prin aceast analiz se urmarete evidenierea corelaiilor dintre probe, avnd ca obiectiv gruparea lor ntr-o structur dendritic din care s poat fi deduse relaiile dintre ele. n 1962, cnd au introdus analiza Q-MOD n cercetarea geologic, Imbrie i Purdy au utilizat-o pentru realizarea unui sistem obiectiv de clasificare a sedimentelor carbonatice actuale din Great Bahama Bank. Metoda a mai fost utilizat de Harbaugh i Demirmen (1964) pentru a discerne limitele de facies din calcarele de Americus. Primul pas n analiza factorial Q-MOD este crearea unei matrici de similaritate

[n n]

n care n este numrul de probe n care se face

determinarea diferitelor m caracteristici geologice, calitative sau cantitative. Msura similaritii poate fi oricare dintre coeficienii de similaritate definii in capitolul III.2. cu valori cuprinse n intervalul [ 1,+1]. Cel mai utilizat coeficient de similaritate n analiza Q-MOD este coeficientul cosinus . Analiza hiperelipsoid n-dimensional care este definit prin corelaiile dintre cei n vectori care factorial Q-MOD are ca obiectiv identificarea unui

68

Modele cantitative statistice

Daniel Scrdeanu

reprezint cele n probe. Fiecare vector este determinat prin cele m variabile care au fost msurate n fiecare prob i din acest motiv dimensionalitatea problemei nu depeste numrul variabilelor ( m ). Al doilea pas este identificarea principalelor axe ale hiperelipsoidului prin extragerea valorilor i vectorilor proprii. Deoarece vor fi reinute, de fiecare dat, mai puini factori dect numrul probelor, nu este necesar extragerea tuturor valorilor i vectorilor proprii, acest lucru reducnd mult din timpul de calcul. n al treilea pas se realizeaz maximizarea ncrcrilor factoriale prin rotaia axelor factoriale. Rotaia axelor se poate face pn ce fiecare factor coincide cu una din probele ce alctuiesc selecia de date. Pe lng tehnicile ce pstreaz ortogonalitatea axelor factoriale dup rotaie, analiza factorial Q-MOD apeleaz i la rotaia ce conduce la oblicitatea axelor factoriale cu implicaiile semnalate n paragraful anterior. Aplicaie. Ca un exemplu al aplicrii analizei Q-MOD, prezentm n continuare o analiz petrografic. Tabelul II.37 conine componenii chimici majori a 20 de eantioane (1-Sienit, 2-Sienit, 3-Sienit, 4-Monzonit, 5-Diorit, 6Diorit, 7-Diorit, 8-Diorit cuaritic, 9-Gabrou, 10-Gabrou, 11-Norit, 12-Norit, 13Gabrou cu hipersten, 14-Gabrou cu hipersten, 15-Sienit, 16-Sienit cuaritic, 17-Sienit alterat, 18-Monzonit, 19-Monzonit, 20-Diabaz). Prin analiza Q-MOD se urmrete plasarea ficrei probe n poziia proprie a seriei difereniate de roci magmatice. Plasarea probelor n succesiunea fireasc, determinat de compoziia chimic, se realizeaz prin utilizarea ncrcrilor factoriale ce exprim variana ansamblului petrografic probat. Deoarece valorile vor fi standardizate, vectorii definii vor avea lungimi unitare i probele vor fi plasate pe circumferina unui cerc cu raz unitar. Unghiurile dintre aceti vectori sunt o msur a similaritii dintre probe. Pentru evaluarea matricii de similaritate, ca rezultat al primei etape de prelucrare se utilizeaz coeficientul de cos , rezultatul fiind consemnat n tabelul III.38 (ANEXA 1).

69

Modele cantitative statistice

Daniel Scrdeanu

Identificarea axelor este limitat la primii doi factori care asigur n etapa final o reprezentare grafic simpl. ncrcrile factoriale pentru fiecare prob sunt sintetizate n tabelul III.39. Tabelul III.39 ncrcrile factoriale pentru primii doi factori (I i II) Proba 1 2 3 4 5 6 7 8 9 10 I 0,9948 0,9918 0,9958 0,9989 0,9963 0,9904 0,9959 0,9996 0,9983 0,9978 II -0,0910 -0,1223 -0,0587 -0,0126 -0,0191 0,1188 -0,0838 0,0010 0,0204 0,0223 Proba 11 12 13 14 15 16 17 18 19 20 I 0,9833 0,9890 0,9721 0,9561 0,9918 0,9844 0,9866 0,9950 0,9945 0,9981 II 0,1202 0,1259 0,1719 0,02323 -0,1257 -0,1665 0,0783 -0,0870 -0,0946 -0,0161

Rotirea axelor prin metoda Varimax maximizeaz variana ncrcrilor factoriale (Tabel III.40) care permit reprezentarea grafic cea mai sugestiv a gruprii celor 20 de probe funcie de afinitile lor chimice (Fig. 84). Tabelul III.40 ncrcrile factoriale dup rotaie (pentru factorii I i II) Proba 1 2 3 4 5 6 7 8 9 10 I 0,7851 0,8044 0,7636 0,7342 0,7368 0,6377 0,7809 0,7254 0,7111 0,7094 II 0,6177 0,5959 0,6418 0,6774 0,6709 0,7671 0,6236 0,6878 0,7009 0,7020

h2
0,9980 0,9986 0,9950 0,9980 0,9929 0,9950 0,9988 0,9993 0,9970 0,9960

Proba 11 12 13 14 15 16 17 18 19 20

I 0,6316 0,6319 0,5879 0,5348 0,8068 0,8295 0,6628 0,7825 0,7873 0,7360

II 0,7632 0,7712 0,7930 0,8259 0,5904 0,5556 0,7350 0,6207 0,6148 0,6744

h2
0,9814 0,9940 0,9745 0,9681 0,9995 0,9968 0,9796 0,9976 0,9979 0,9965

70

Modele cantitative statistice

Daniel Scrdeanu

n final trebuie remarcat c analiza factorial Q-MOD are acelai obiectiv ca orice analiz a gruprilor ns cu o eficien mai mare datorat reducerii timpului de calcul, n condiiile n care se apeleaz la mijloacele automate. Eficiena metodei este sporit i de faptul c ea este aplicabil i n condiiile n care matricea de similaritate conine i coeficieni negativi, caz n care analiza factorial R-MOD nu este utilizabil. Tabel III.37 Principalii oxizi din 20 de eantioane recoltate dintr-o serie magmatic Nr. prob 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X1=SiO2 X2=Al2O3 X3=Fe2O3 X4=FeO X5=MgO X6=CaO X7=Na2O X8=K2O 61,7 58,3 51,2 54,4 58,0 46,6 58,0 55,5 55,4 55,9 47,2 48,2 44,8 47,0 59,8 15,1 17,9 17,6 14,3 15,7 15,9 17,3 16,5 15,3 13,5 14,5 18,3 18,8 14,1 17,3 2,0 3,2 3,5 3,3 0,7 2,9 2,2 1,7 2,7 2,7 1,6 1,3 2,2 0,8 3,6 2,3 1,7 4,3 4,1 2,8 10,0 3,8 4,6 5,5 5,9 13,8 6,1 4,7 15,0 1,6 3,7 1,5 3,2 6,1 5,0 7,0 2,2 6,7 5,8 6,5 5,2 10,8 11,3 16,0 1,2 4,6 3,7 4,5 7,7 10,9 9,6 4,3 6,7 9,9 8,9 8,1 9,4 14,6 2,3 3,8 4,4 5,9 5,7 3,4 3,0 2,7 4,3 3,2 2,9 2,4 3,1 1,3 0,9 0,4 5,0 4,5 5,3 4,4 4,2 3,2 0,7 4,1 2,5 1,5 1,7 1,2 0,7 0,1 1,7 5,1

71

Modele cantitative statistice 16 17 18 19 20 66,2 50,0 57,4 59,8 52,2 16,2 9,9 18,5 15,3 18,2 2,0 3,5 3,7 3,8 3,3 0,2 5,0 2,1 3,3 4,4 0,8 11,9 1,7 2,2 4,7

Daniel Scrdeanu 1,3 8,3 6,8 3,9 6,5 6,5 2,4 4,5 3,0 4,6 5,8 5,0 3,7 4,4 1,9

72

Modele cantitative statistice

Daniel Scrdeanu

3.3. Modelarea matematic a corelaiilor substaniale


Exprimarea ntr-o form sintetic a sistemului de corelaii ntre caracteristicile unui proces este obiectivul final al oricrei cercetri sistematice. Modelul operational rezultat din formalizarea matematic a sistemului de corelaii este o constructie intelectual care nlocuieste "vizibilul complicat" (procesele fizico-chimice studiate) cu "invizibilul" (ecuaii, sisteme etc.) uor de manevrat. n funcie de calitatea descrierii (complet sau de tendint), scara modelului (atomic, macroscopic), caracterul intrinsec (determinist, probabilist, linear, nelinear), structura matematic (algebric, n diferene finite sau element finit, diferenial) exist o diversitate de modele aplicabile studierii proceselor geolgice. n continuitate imediat cu demersul statistic de prelucrare a informatiilor geologice prezentm cea mai simpl modalitate de formalizare empiric a relaiilor dintre variabilele unui proces geologic complex: modelarea linear a corelaiilor substaniale.

3.3.1. Model liniar de o singur variabil independent

Cel mai simplu model pentru corelaia ntre dou variabile geologice este cel liniar, n care se presupune c dependena poate fi descris prin ecuaia unei drepte:

y = 0 + 1 x + e
(III.277) n care

y - variabila dependent (= rezultativ);


x - variabila independent (= factorial);

0 , 1 - parametrii modelului;

73

Modele cantitative statistice


e - eroarea de estimare a modelului.

Daniel Scrdeanu

Exist dou modele liniare limit pentru dependena dintre dou variabile geologice x i y : a) ambele variabile ( x i y ) sunt afectate de erori ntmpltoare (Fig. 85); b) variabila independent ( x ) este cunoscut riguros, iar variabila dependent ( y ) este afectat de erori distribuite normal (Fig. 86). Modelul a) este adecvat studierii corelaiei coninuturilor de Au i Ag dintr-un zcmnt sau dintre granulozitate i porozitate ntr-un acvifer nisipos, iar modelul b) se recomand pentru studiul corelaiei ntre adncime ( x ) i coninutul n Au ( y ) sau ntre adncimea ( x ) i gradul de saturare ( y ) din zona de aerare a unui acvifer freatic. Pentru studiul complet al corelaiei liniare ntre dou variabile este necesar parcurgerea unui numar de patru etape de prelucrare.
a) Reprezentarea grafica

Reprezentarea grafic analizate calitativ corelaiei. analiza diagrama corelaie. n a este a Ea trei de repartiiei cea mai bidimensionale a variabilelor rapid form de identificare existenei se poate variante:

ni

mprtiere,

stereograma i dreapta de

y
Fig. 86 Model liniar cu o singur variabil (y) afectat de erori

74

Modele cantitative statistice

Daniel Scrdeanu
x

nxy

x2 x1

y1 y2

y
Fig. 85 Model liniar cu ambele variabile (x,y) afectate de erori aleatoare

a)Diagrama de mprtiere Diagrama de mprtiere este cea mai simpl form de reprezentare grafic n care utiliznd un sistem de referin rectangular, fiecare pereche de valori msurat ( xi , yi ) se materializeaz printr-un punct. Se obine n acest mod o mulime de puncte a crei configuraie geometric sugereaz prezena 9 8 7 6 PLUMB 5 4 3 2 1 0 0 2 4 6 8 10 ZINC Fig. 87 Diagrame de mprtiere 75 12 14 16 18 20

Modele cantitative statistice sau absena corelaiei ntre cele dou variabile (Fig. 87).

Daniel Scrdeanu

Punctele pot avea o distribuie: haotic - corelaia ntre cele dou variabile fiind nul, concentrat pe o zon alungit rectilinie - corelaia fiind de tip liniar sau concentrat pe o zon alungit curbilinie, situaie n care se presupune existena unei corelaii neliniare ntre cele dou variabile. Diagrama de corelaie poate fi realizat i cu valori standardizate, variant recomandat atunci cnd valorile sunt exprimate n uniti de msur diferite i au amplitudini de selecie disproporionate. Stereograma Stereograma este o reprezentare tridimensional care se bazeaz pe gruparea bidimensional a valorilor celor dou variabile dup aranjarea n ordine cresctoare a variabilei independente. Intervalele de grupare care formeaz compartimentele tabelului de corelaie (Tabel III.41), pentru ambele variabile se stabilesc dup aceleai criterii ca cele stabilite pentru descrierea univariat. Tabelul III.41 Tabel de corelaie pentru dou variabile ( x, y )
y1 y2

...

yk

...

yn

y
x x1 x2

nx1 y1 nx2 y1
...

nx1 y2 nx2 y2
...

... ... ... ... ...

nx1 yk nx2 yk
...

... ... ... ... ...

nx1 nx2
...

...

xl xy

nxl y1 n y1

nxl y2 n y2

nxl yk n yk

nxl
n

n tabelul de corelaie apar trei tipuri de frecvene: 1) frecvena valorilor perechi ( nxi yi ) reprezint numrul de perechi pentru fiecare interval de grupare. 2) frecvene pariale dup variabila X ( nxi ) care reprezint numrul de valori ale variabilei Y corespunztoare unei valori xi sau valorii centrale a 76

Modele cantitative statistice

Daniel Scrdeanu

intervalului i, xci , care se calculeaz nsumnd frecventele perechilor de valori de pe un rnd al tabelului III.41.
nxi = nxi y j
j =1 k

(i = 1,2,..., l )

(III.278) 3) frecvenele pariale dup variabila Y ( n yi ) se evalueaz n mod analog pe coloanele tabelului III.41.
n yi = nx j yi
j =1 l

(i = 1,2,..., k )

(III.279) Stereograma se obine prin construirea pentru fiecare compartiment al tabelului de corelaie a unui paralelipiped avnd nlimea proporional cu frecvenele perechilor de valori. Suprafaa care mbrac stereograma poart denumirea de suprafa de frecven i ofer o imagine global a corelaiei ntre cele dou variabile ntr-un spatiu tridimensional. Dreapta de corelaie Dreapta de corelaie reprezint grafic tendina pe care o urmeaz media unei variabile n comparaie cu valorile celeilalte variabile. Se construiesc dou drepte de corelaie pentru fiecare cuplu de dou variabile ( x, y ): a) dreapta de corelaie corespunztoare modelului y = f ( x ) n care pentru fiecare xi se determin i se reprezint valoarea medie (Fig. 89). b) dreapta de corelaie corespunztoare modelului x = f ( y ) n care pentru fiecare valoare yi se calculeaz i se reprezint grafic (Fig. 90).

77

Modele cantitative statistice

Daniel Scrdeanu

x1

xk

xk

Linia n jurul creia se grupeaz punctele se numete linie de regresie i pentru foarte multe caracteristici geologice este rectilinie. Raporturile spaiale dintre cele dou drepte de regresie ( x = f ( y ) i y = f ( x ) ) exprim intensitatea corelaiei dintre variabilele analizate: 1) independena, dac cele dou linii de regresie sunt ortogonale (Fig. 91a); 2) dependena total, dac cele dou linii de regresie coincid (Fig. 91b); 3) dependena intermediar, dac cele dou linii de regresie formeaz un anumit unghi, unghi a crui mrime este invers proporional cu intensitatea corelaiei (nul cnd unghiul este de 90o).

Cele trei modele de reprezentare grafic a distribuiei bidimensionale a unui cuplu de variabile geologice exprim doar calitativ intensitatea corelaiei, care poate fi cuantificat prin intermediul unor parametri. 78

Modele cantitative statistice

Daniel Scrdeanu

b) Evaluarea intensitii corelaiei liniare

Din reprezentrile grafice se pot deduce la nivel calitativ inexistena corelaiei sau existenta unei corelaii directe sau inverse. Cele dou variabile sunt corelate direct dac valorile mari ale uneia tind s se asocieze cu cele mari ale celeilalte. In rocile poroase, porozitatea i permeabilitatea sunt un exemplu tipic de variabile pozitiv corelate. Dou variabile geologice sunt corelate negativ dac valorile mari ale uneia tind s se asocieze cu valorile mici ale celeilalte. Corelaii negative se stabilesc de obicei ntre concentratiile a dou elemente majore, de exemplu n rocile dolomitice continutul n calciu este n mod normal corelat negativ cu continutul de magneziu. Sub aspect cantitativ, intensitatea corelaiei lineare se poate cuantifica prin intermediul coeficientului de corelaie Pearson i a coeficentului de corelaie a rangurilor. a)Coeficientul de corelaie Pearson Coeficientul de corelaie este cel mai utilizat parametru pentru cuantificarea intensittii corelaiei liniare a dou variabile i se calculeaz cu relaia:

= xy xy
(III.280)

(x m )(y m ) (x m ) (y m )
n i =1 i i x i y n

=r

i =1

i =1

Coeficientul de corelaie ( ) are valori cuprinse ntre -1 i +1, indiferent de amplitudinea seleciei de date. Valorile extreme ale coeficientului de corelaie liniar indic o aliniere perfect a punctelor ntr-o diagram de mprstiere de-a lungul unei drepte fie cu panta pozitiv ( = 1 ; corelaie pozitiv), fie cu panta negativ ( = 1 ; corelaie negativ.

79

Modele cantitative statistice

Daniel Scrdeanu

Pentru valori r < 1 ( r fiind estimatorul lui ), distribuia punctelor se abate de la linia dreptei devenind din ce n ce mai difuz cu ct r descrete de la 1 spre 0. Valoarea coeficientului de corelaie este puternic influentat de existenta perechilor aberante de puncte. O bun aliniere a ctorva valori extreme poate creste foarte mult valoarea coeficientului de corelaie pentru dou variabile slab corelate i invers, o bun corelaie poate fi "distrus" de slaba aliniere a ctorva valori extreme. Aplicatie. Pentru analiza corelaiei ntre continuturile n Au i Ag din zcmntul Cavnic filonul 80 s-a evaluat un coeficient de corelaie r1 = 0,64 cu luarea n cosiderare a tuturor valorilor selectiei n care era inclus i o pereche de valori afectat de erori de msurare (Fig. 92). Prin eliminarea acestei singure perechi de valori i recalcularea coeficientului de corelaie s-a obinut r2 = 0,84 .

Dac relaia dintre dou variabile nu este linear, coeficientul de corelaie ( r ) poate avea o valoare foarte mic. Din acest motiv este deseori util s se suplimenteze utilizarea lui cu cea a coeficientului de corelaie a rangurilor. b)Coeficientul de corelaie a rangurilor Coeficientul de corelaie a rangurilor

( r )

se calculeaz aplicnd

formula de calcul a coeficienilor de corelaie Pearson rangurilor valorilor variabilelor.

80

Modele cantitative statistice

Daniel Scrdeanu

R xy r = R x R
y

(R
n i =1

(R
n i =1 xi

xi

mRx Ryi mRy

mRx

) (R
2
n i =1

)(

yi

mR y

= ri

(III.281) n care:

Rxi , Ryi - rangul valorii xi respectiv yi ;

R , R - abaterea standard a rangurilor valorilor variabilelor x , respectiv y ;


x y

mRx , mRy - media rangurilor valorilor Rx1 ,..., Rx n , respectiv Ry1 ,..., Ryn .

O mare diferent ntre r i poate fi deseori determinat de prezena unei perechi de valori extreme. Spre deosebire de coeficientul de corelaie ( r ), coeficientul de corelaie a rangurilor ( rr ) nu este att de sensibil la perechi extreme de valori. O valoare mare a coeficientului de corelaie a rangurilor i una mic a coeficientului de corelaie Pearson poate fi datorat faptului c un numr redus de perechi aberante afecteaz buna corelaie a variabilelor studiate. Dac coeficientul de corelaie a rangurilor este mare i coeficientul de corelaie Pearson mic este posibil o "mbuntire" fals a corelaiei prin prezenta ctorva valori extreme bine "aliniate". Pentru situatia prezentat anterior valorile corespunztoare ale coeficientului de corelaie a rangurilor sunt: rr1 = 0,80 nainte de eliminarea valorii extreme i rr2 = 0,79 , eliminarea valorii aberante avand o influenta mult mai mic asupra coeficientului de corelaie a rangurilor dect asupra coeficientului de corelaie r . Diferenta dintre r i rr poate fi revelatoare i asupra altui aspect al corelaiei ntre cele dou variabile: cel al liniarittii. Dac rr = +1 , adic rangurile celor dou variabile sunt identice, valorilor mari ale variabilei x le corespund valori mari ale variabilei y , corelaia are intensitate maxim dar ea nu este obligatoriu de tip linear. Neliniaritatea corelaiei este evidentiat de valorile mici ale ale coeficientului de corelaie ( r ).

81

Modele cantitative statistice


c)Testarea adecvrii modelului liniar

Daniel Scrdeanu

Adecvarea unui model liniar este sintetizat n evaluarea semnificatiei statistice a coeficientului de corelaie care se poate realiza n dou etape succesive: cea a acceptrii (functie de valoarea calculat) existentei unei corelaii liniare i cea de evaluare a incertitudinii asupra intensittii acesteia. Testarea statistic a existentei corelaiei liniare se poate realiza cu ajutorul testului STUDENT aplicat ipotezelor statistice:
H0 : = 0 H1 : 0

(absenta corelatiei liniare ) ( prezenta corelatiei liniare )


texp = n 2 r 1 r2

Pentru testarea inexistentei corelaiei ( = 0 ) se calculeaz valoarea:

(III.282) care se compar cu valorile repartiiei STUDENT t ( , ) cu = n 2 . n alternativ texp < t ( , ) se accept ipoteza absenei corelaiei liniare ntre cele dou variabile. Dac texp > t ( , ) , din punct de vedere statistic se admite existena unei corelaii liniare ntre cele dou variabile i se trece la etapa de evaluare a incertitudinii asupra valorii r calculate. Calculul intervalului de ncredere pentru valoarea coeficientului de corelaie se poate realiza utiliznd variabila cu repartiie normal propus de Fisher:

z=
(III.283)

1 1+ r ln 2 1 r

Pentru calculul intervalului de ncredere al coeficientului de corelaie ( ) se utilizeaz relaiile:

rinf =
(III.284) n care:
z1 = z nps z

e 2 z1 1 e 2 z1 1 < < r = sup e 2 z2 + 1 e 2 z2 + 1

(III.285)

82

Modele cantitative statistice


z2 = z + nps z

Daniel Scrdeanu

(III.286)

np - argumentul funciei inverse Laplace ( 1 ) pentru o anume probabilitate


( p ) de verificare a ipotezei testate.

sz =

1 - abaterea standard a variabilei z . n3


Pe baza abaterii standard a coeficientului de corelaie
sr =

1 r2 n

(III.287) intervalul de ncredere al coeficientului de corelaie pentru o probabilitate p se calculeaz cu relaia:


1 r2 1 r2 r np < < r + np n n

(III.288)

d) Parametrii modelului

Evaluarea parametrilor modelului statistic liniar parcurge cele dou etape clasice de calcul al parametrilor pe baza eantionului de date disponibile i de evaluare a incertitudinii acestor parametri. a) Calculul parametrilor Calculul parametrilor a0 i a1 ca estimaii de selecie ale parametrilor ( 0 i 1 ) se realizeaz prin metoda celor mai mici ptrate care const n minimizarea sumei ptratelor abaterii valorilor seleciei de la ecuaia general. Notnd suma ptratelor abaterilor de la modelul liniar:

SPA = [ yi (a0 a1 xi )]
i =1

(III.289) prin derivare n raport cu a0 i a1 se obine sistemul de ecuaii normale 83

Modele cantitative statistice


n n a r a x yi + = 1 i 0 i =1 i =1 n n n 2 a 0 xi + a1 xi = xi yi i =1 i =1 i=1

Daniel Scrdeanu

(III.290) Prin rezolvarea sistemului (III.290 ) se obin soluiile:


s xy a0 = m y s mx xx a = s xy 1 s xx

(III.291) n care:

mx - media valorilor variabilei x : mx xi / n


i =1 n

m y - media valorilor variabilei y : mx xi / n


i =1

??

s xy = xi2
i =1

n 1 n xi yi n i=1 i=1

(III.292)
1 n s xx = x xi n i=1 i =1
n 2 i 2

(III.293) b) Evaluarea incertitudinii Evaluarea intervalului de ncredere pentru parametrii modelului ( , 1 ) se bazeaz pe amploarea fluctuaiilor variabilei determinat de parametrii calculai a0 i a1 :
2 2 y sy =

n jurul modelului

1 n (yi my )2 n 1 i=1

(III.294) Parametrul a0 , ce estimeaz parametrul necunoscut 0 , are o distribuie N ( 0 , 0 ) n care:

84

Modele cantitative statistice


n

Daniel Scrdeanu
2 2 =y xi2 / n (xi mx )2
0

i =1

i =1

(III.295) Variabila:

texp = ( 0 a0 ) / s0
(III.296) are o distributie t cu = n 2 grade de libertate n care
n n 2 2 2 (xi mx )2 s s x / n = y i 0 i =1 i=1

(III.297)

Pentru un nivel de semnificaie , intervalul de incredere pentru parametrul 0 se scrie:

a0 t 1 ; s 0 < 0 < a0 + t s0 1 ; 2 2
(III.298) n condiiile acelorai ipoteze, valoarea 0 nu se accept ca o estimaie a valorii 0 dac

texp > t 1 ; 2
(III.299) Parametrul a1 ce estimeaz parametrul necunoscut 1 are o distribuie

N 1 , 1 n care:

= y 2 / ( xi mx )2
1

i=1

(III.300) Variabila

t exp = (a1 1 ) / s1
(III.301) are deci o distribuie t cu = n 2 grade de libertate, abaterea standard de estimaie calculndu-se cu relaia:
n 2 2 2 s s / = y ( xi m x ) 1 i =1

(III.302) 85

Modele cantitative statistice

Daniel Scrdeanu

Intervalul de ncredere pentru parametrul a1 corespunztor unui nivel de semnificaie este deci:

a1 t 1 ; s1 < 1 < a1 + t 1 ; s1 2 2
(III.303) n mod analog, valoarea a1 este acceptat ca estimaie a parametrului

1 numai n cazul n care:


t exp < t 1 ; 2
(III.304)

e) Aplicaie

Diagrama de mprtiere pentru masa n stare umed ( M w ) i masa n stare uscat ( M d ) a depozitelor recoltate din iazul de decantare Baia Sprie sugereaz o corelaie linear ntre aceti doi parametri (Fig. 93).

340 335 330 325 320 315 310 305 300 295 290 285 280 275 270 265 245 250 255 260 265 270 275 280 285 290 295 300 305

Fig. 93 Diagrama de mprtiere pentru M w i M d

86

Modele cantitative statistice

Daniel Scrdeanu

Pe baza celor 49 de valori prelucrate se vor parcurge n continuare principalele etape ale obinerii modelului:

Mw = + Md
Realizarea stereogramei evideniaz ntr-un mod sugestiv dou aspecte determinante pentru strategia aplicrii metodologiei clasice: - existena unui numr de valori extreme aberante ce trebuie eliminate naintea evalurilor numerice; - caracterul normal al repartiiei bidimensionale a variabilelor M w i M d care asigur interpretarea corect att a valorilor coeficientului de corelaie ct i a parametrilor modelului. Intensitatea corelaiei ntre cele dou variabile este evaluat prin intermediul coeficientului de corelaie: 1) naintea eliminrii valorilor extreme: r1 = 0,32 , valoare care contrazice flagrant aspectul diagramei de mprtiere i al stereogramei; 2) dup eliminarea a opt valori extreme: r2 = 0,889 . Testarea adecvrii modelului devine formal la o valoare a coeficientului de corelaie r2 = 0,889 i ntr-adevr prin calcul se obine:

t ( = 0,05; = 39) = 0,021 < t exp = 12,12


criteriu care confirm din punct de vedere statistic adecvarea modelului linear. Intervalul de ncredere al coeficientului corelaiei lineare este:

0,81 < < 0,93


Parametrii modelului estimai n condiiile aceleiai precizii sunt:

20,36 < < 40,68 cu estimatorul a = 18,17 0,812 < < 1,217 cu estimatorul b = 0,781
Modelul estimat al corelaiei lineare este deci:

M w = 18,17 + 0,781 M d
Acest model poate fi utilizat cu o bun aproximare pentru deducerea unuia dintre parametrii pe baza celuilalt reducnd la jumtate efortul de determinare realizat n laborator pentru depozitele iazului Baia Sprie. Desigur

87

Modele cantitative statistice

Daniel Scrdeanu

c pentru alte amplasamente coeficienii i poate chiar structura modelului vor fi alii deoarece acest model este un model empiric valabil doar pentru domeniul valor (valoric??) al seleciei pe baza creia a fost construit.

3.3.2.Model liniar multiplu

Complexitatea proceselor geologice implic frecvent analiza influenei simultane a mai multor variabile, aparent independente, asupra unei variabile considerat dependent (rezultativ) de aciunea acestora. Modelarea linear a cestei corelaii multiple este cea mai simpl soluie adoptat ntr-o etap preliminar de studiu. Formal ea se exprim prin ecuaia:

y = 0 + 1 x1 + 2 x2 + ... + n xn + ei
(III.304) n care:

y - variabila rezultativ (independent); x1 , x2 ,..., xn - variabilele factoriale;

1 , 2 ,..., n - parametrii modelului;


ei - eroarea de estimare.
Din punct de vedere metodologic, utilizarea acestui model pune dou probleme specifice aplicrii ei n studiul variabilelor geologice: 1) alegerea variabilei rezultative; 2) stabilirea numrului de variabile factoriale. Caracterul rezultativ sau factorial al unei variabile poate fi bine precizat n contextul geologic n care se realizeaz studiul sau rezult dup rularea tuturor variabilelor sistemului pe poziia variabilei rezultative. Dac spre exemplu, caracterul rezultativ al cotei nivelului piezometric ntr-un acvifer freatic, n raport cu variabilele factoriale: precipitaii, grad de acoperire cu vegetaie, modul de infiltrare i porozitate, pare evident, nu acelai lucru se poate spune despre analiza corelaiei dintre coninuturile de Au, Ag, Pb, Zn, Cu dintr-un zcmnt polimetalic. n acest al doilea caz 88

Modele cantitative statistice

Daniel Scrdeanu

stabilirea variabilei rezultative poate fi aleas dup criterii statistice pe baza valorii maxime a coeficientului corelaiei multiple sau pragmatice, de exemplu, necesitatea prognozrii coninutului unui anumit metal (Au) funcie de coninutul celorlalte. Numrul variabilelor factoriale ale modelului este controlat de criterii operaionale (capacitatea de prelucrare a instrumentului de calcul) precum i de necesitile interpretrii rezultatelor. De cele mai multe ori n modelarea statistic se prefer un numr minim de variabile pentru ca efectele numerice s nu estompeze caracteristicile intrinseci ale procesului modelat. Precizarea configuraiei modelului liniar multiplu este obligatoriu s fie precedat de o analiz factorial care s simplifice i s ierarhizeze la nivel statistic importana variabilelor n reflectarea ansamblului de corelaii propriu sistemului studiat.

a) Analiza grafic a corelaiei multiple

Diagrama de mprtiere este singura dintre reprezentrile grafice utilizate n cazul modelului liniar de o singur variabil independent care poate fi generalizat pentru cazul a trei dimensiuni, corespunztor unei corelaii multiple cu dou caracteristici independente i una factorial. n cazul a trei variabile X 1, X 2 i X 3 , tripletele ( x1, x 2, x3 ) pot fi considerate ca determinnd un punct ale crei coordonate sunt valorile x1, x 2 i x3 . Reprezentate ntr-un sistem de referin ortogonal, toate punctele vor forma o mulime cu o anumit dispoziie geometric n raport cu diferite "suprafee de corelaie". Gruparea punctelor n vecintatea unei astfel de suprafee poate fi o msur calitativ a intensitii corelaiei ntre cele trei variabile. Pentru mai mult de trei variabile, reprezentri grafice care s rezume n mod sugestiv corelaia ntre variabile nu se poate realiza dect dup prelucrri speciale de tipul celor prezentate n cadrul analizei factoriale. Datele brute nu mai pot fi examinate prin aceleai procedee prezentate la modelul liniar de o singur variabil independent (stereograma, dreapta de 89

Modele cantitative statistice

Daniel Scrdeanu

regresie) dect formnd perechi din variabila rezultativ i fiecare variabil factorial, metod care ignor ns tocmai efectul ansamblului de intercorelaii pe care tinde s-l exprime modelul corelaiei multiple.

b) Evaluarea intensitii corelaiei

Calitatea modelului liniar multiplu se evalueaz sub dou aspecte: a) intensitatea corelaiei ntre variabila rezultativ i toate variabilele factoriale, cuantificat cu ajutorul raportului corelaiei multiple i coeficientului corelaiei multiple; b) intensitatea corelaiei ntre variabila rezultativ i fiecare variabil factorial, exprimat prin coeficientul de corelaie parial. a) Raportul corelaiei multiple Raportul corelaiei multiple se calculeaz cu formula:

R y ( x1... xn ) = 1

(y y
k i =1

2 * x1... xn

(y
k i =1

(III.305) n care

yi - valoarea msurat a variabilei rezultative; y* x1 x 2... xn - valoarea estimat a variabilei rezultative; y - media valorilor msurate ale variabilei rezultative;
k - numrul de probe n care se msoar cele n variabile.

Valoarea R y ( x 2,..., xn ) depinde deci de raportul dintre dispersia valorilor determinate pe baza ecuaiei de regresie linear i dispersia valorilor msurate ale variabilei rezultative. Cu ct valorile msurate se abat mai puin de la valorile calculate, cu att coeficientul de corelaie are o valoare mai mare i ca atare corelaia este mai intens.

90

Modele cantitative statistice Evaluarea intensitii corelaiei multiple

Daniel Scrdeanu

Coeficientul corelaiei multiple ntre variabilele y, x1, x 2,..., xn msoar gradul de precizie cu care y poate fi reprezentat prin modelul liniar multiplu. Relaia de calcul a coeficientului corelaiei multiple este:
1 k a 0 yi + a1 x1i yi + ... + an xni yi yi n i =1 i =1 i =1 i =1
k k k 2

R y ( x1x 2... xn ) =

1 k y yi n i =1 i =1
k 2 i

(III.306) utilizabil dup evaluarea parametrilor modelului prin intermediul coeficienilor

a0, a1, a 2,..., an .


Coeficientul corelaiei multiple se poate calcula i cu formula:
2 R y ( x1x 2... xn ) = 1 1 ry21 1 ry22.1 ... 1 ryn .12...( n 1)

)(

)(

(III.307)
2 n care ry21 , ry22.1 ,..., ryn .12...( n 1) sunt coeficienii de corelaie parial.

Dac R y ( x1x 2... xn ) = 1 , variabila rezultativ y poate fi perfect reprezentat prin modelul liniar multiplu. Se poate demonstra c R y ( x1x 2... xn ) este mai mare dect coeficientul de corelaie ntre y i orice funcie liniar de x1, x 2,..., xn diferit de cea din expresia (III.304). Coeficientul corelaiei multiple este mai mare sau egal cu zero i deci n mod evident este mai mare (sau egal) dect oricare din coeficienii de corelaie parial care aparin modelului. Ca o consecin a acestui fapt, dac

R y ( x1x 2... xn ) = 0 toi coeficienii de corelaie referitori la y sunt zero i deci y


este independent fa de toate variabilele factoriale ale modelului.

Coeficienii de corelaie partial Coeficienii de corelaie parial exprim intensitatea corelaiei ntre variabila rezultativ ( y ) i o variabil factorial oarecare ( x1, x 2,..., xn ) cnd restul variabilelor modelului rmn constante.

91

Modele cantitative statistice

Daniel Scrdeanu

Pentru un model liniar multiplu cu n variabile calculul coeficienilor de corelaie parial se face funcie de coeficienii de ordin inferior cu relaia de recuren:
ry1.23...n = ry1.23...(n1) ryn.23...(n1) r1n.23...(n1)

(1 r

2 yn.23...( n 1)

)(1 r

2 1n.23...( n 1)

(III.308) Pentru un model liniar cu dou variabile independente:

y = a0 + a1x1 + a 2 x 2
(III.309) aplicnd formula (III.308) se obine relaia de calcul a coeficientului corelaiei pariale ntre y i x1 :

ry1.2 =
(III.310)

(1 r )(1 r )
2 y2 2 12

ry1 ry 2 r12

n care ry1 , ry 2 i r12 sunt coeficienii de corelaie binar calculai cu formula (III.280) utilizat pentru evaluarea intensitii modelului liniar cu o singur variabil independent. Coeficienii corelaiei pariale au valori cuprinse ntre -1 i +1 semnificaia fiind cea a coeficientului de corelaie Pearson analizat n detaliu la paragraful IV.2.1.

c) Testarea adecvrii modelului liniar multiplu

Adecvarea modelului liniar multiplu este condiionat de semnificaia statistic a coeficientului corelaiei multiple. Pentru modelul liniar multiplu, suma ptratelor abaterilor valorilor observate ale lui y fa de media lor este egal prin definiie cu
2 k sy

(III.311) avnd = k 1 grade de libertate i dou componente:

92

Modele cantitative statistice

Daniel Scrdeanu

a) suma ptratelor abaterilor valorilor msurate fa de cele date de ecuaia modelului i care este egal cu:
2 2 k sy 1 Ry ( x1 x 2... xn )

(III.312) cu k n grade de libertate; b) suma ptratelor abaterilor valorilor calculate prin ecuaia modelului fa de media valorilor msurate:
2 2 k sy Ry ( x1 x 2... xn )

(III.313) cu n 1 grade de libertate. Dac y (valoarea msurat) i y * (valoarea estimat prin model) sunt complet necorelate, abaterile lui y fa de valorile modelului ( y * ), vor fi independente de abaterile valorilor calculate fa de media valorilor msurate i deci dispersiile celor dou componente vor fi practic identice ( R = 0 ). Testarea semnificaiei statistice a diferenei celor dou componente poate fi realizatat cu ajutorul repartiiei Z calculnd factorul experimental:
2 Ry 1 k n ( x1 x 2... xn ) Z exp = ln 2 z 1 R y ( x1x 2... xn ) n 1

(III.314) cu = n 1 i 2 = k = n grade de libertate. Dac

Z exp < Z ( , 1 , 2 )
(III.315) valoarea coeficientului de corelaie R y ( x1x 2,..., xn ) este nesemnificativ i modelul liniar multiplu nu este adecvat modelrii corelaiei ntre n + 1 variabile. n caz contrar, din punct de vedere statistic, corespunztor nivelului de semnificaie ales, modelul liniar multiplu este adecvat modelrii relaiei ntre variabila rezultativ ( y ) i variabilele factoriale: x1, x 2,..., xn . Semnificaia coeficientului corelaiei multiple este puternic afectat de numrul de valori disponibile ( k ) i numrul de variabile ale modelului ( n ). n cazul limit n care numrul de variabile este egal cu numrul de observaii

93

Modele cantitative statistice

Daniel Scrdeanu

disponibile, toate corelaiile pariale de cel mai ridicat grad posibil vor fi egale cu valoarea unitar i n consecin R va indica o corelaie total indiferent de ansamblul real de corelaii din sistemul studiat.

d) Parametrii modelului

Evaluarea parametrilor modelului corelaiei multiple parcurge aceleai dou etape cu cele prezentate n paragraful precedent pentru modelul liniar cu o singur variabil independent. Calculul parametrilor Evaluarea parametrilor a0, a1,..., an se face prin aplicarea modelului

y = a0 + a1x1 + a1x 2 + ... + anxn


(III.316) n mod analog cu procedeul aplicat modelului liniar de o singur variabil independent se minimizeaz suma abaterii ptratelor:

SPA = [ yi (a0 + a1x1i + a 2 x 2 i + ... + anxni )]


i =1

(III.317) prin derivare n raport cu a0, a1,..., an obinndu-se sistemele :


k SPA [ yi (a0 + a1x1i + ... + anxni )]2 = 0 2 = a 0 i =1 k SPA 2 2 x1i [ yi (a0 + a1x1i + ... + anxni )] = 0 = i =1 a1 k SPA 2 = 2 xni [ yi (a0 + a1x1i + ... + anxni )] = 0 i =1 an

(III.318)

94

Modele cantitative statistice

Daniel Scrdeanu

k k k a 0 k a 1 x 1 ... an xn yi + + + = i i i =1 i =1 i =1 k k k k 2 a 0 x 1 a 1 x 1 ... an xn x 1 x1yi + + + = i i = = = = 1 1 1 1 i i i i k k k k 2 a 0 xn a 1 x 1 xn ... an xn xnyi + + + = i i i =1 i =1 i =1 i =1

(III.319) prin a cror rezolvare se obin valorile parametrilor. Fiecare dintre parametrii modelului ( a1, a 2,..., an ) reprezint variaia medie a variabilei rezultative ( y ) corespunztoare unei variaii unitare a variabilei factoriale, considerndu-le pe celelalte constante. Termenul liber ( a 0 ) reprezint nivelul de referin al variabilei rezultative fr a avea o semnificaie geologic precizat. b) Evaluarea incertitudinii Pentru parametrii modelului corelaiei multiple intervalul de ncredere se evalueaz pe baza inegalitii:
a j t ( , ) s yyi n < j < a j + t ( , ) s yyi n

(III.320) pentru coeficienii variabilelor factoriale ( j = 1,2,..., n ) iar pentru termenul liber pe baza inegalitii:
a0 t ( , ) s yyi n < 0 < a0 + t ( , ) s yyi n

(III.321) n care

s yyi - abaterea medie ptratic a valorilor observate fa de valorile calculate


prin model:

s yyi =
(III.321)

(y
k i =1

yi*

k n 1

s a j - abaterea standard introdus de fiecare variabil factorial:

95

Modele cantitative statistice

Daniel Scrdeanu

sa j =

s yyi

(x
k i =1

ij

m xj )

(III.322)

e) Aplicatie

Dintr-un acvifer freatic s-a exploatat pe o perioad de 10 ani un debit ce variaz de la 1000 la 6000 m3/zi. Acviferul este alimentat prin infiltraii rezultate din precipitaii care n zon au valoarea medie de 350 mm/an. Pentru optimizarea regimului de funcionare a forajelor de drenaj s-a elaborat un model statistic de tip linear pe baza valorilor medii lunare ale debitelor exploatate i precipitaiilor pe perioada 1970 - 1980. Elaborarea modelului a cuprins trei etape: identificarea variabilelor modelului, evaluarea parametrilor i evaluarea performanelor. a) Identificarea variabilelor modelului s-a realizat pe baza corelogramelor calculate pentru cele dou variabile principale (Q-debit i P-precipitaii). Din corelogramele calculate se remarc o autocorelare important a debitului de

RQQ
+1 +1

RQP

3 0 1 2 3 4 5 6
t

5 4 6 7 t

-1

-1

Fig. 96 Autocorelograma Q-Q Fig. 97 Autocorelograma Q-P exploatare pentru un decalaj de 1 lun i 4 luni (Fig. 96) i o corelare important ntre precipitaii i debitul de exploatare cu un decalaj de o lun (Fig. 97). n aceste condiii modelul identificat optim este de forma:

96

Modele cantitative statistice


Q(t ) = a 0 + a1Q(t 1) + a 2Q(t 4 ) + a3P(t 1)

Daniel Scrdeanu

b) Evaluarea parametrilor modelului prin minimizarea abaterilor a condus la coeficienii: a 0 = 2077,5; a1 = 0,3299; a 2 = 0,2128; a3 = 0,9648 .
m3 Q zi

c) coeficientul

Performanele corelaiei

modelului exprimate prin multiple i a coeficienilor de corelaie parial sunt:

7000

5000

corelaia

total

ntre

QQ(t 1)Q(t 4 )P(t 1) :


3000

R = 0,65
corelaia parial ntre Q
Q(t 1) :

1000 0 1975 1980

rQQ (t 1) = 0,16 ;
corelaia parial ntre Q
Q(t 4 ) :

Fig. 98 Relaia dintre debitul calculat (modelat) i i cel msurat

rQQ (t 4 ) = 0,14 ;
corelaia parial ntre Q i P(t 1) :

rQP (t 1) = 0,63 .

Grafic relaia dintre valorile observate i cele calculate prin model (Fig. 98) exprim o bun adecvare a modelului pentru corelaiile ntre debitul de exploatare i precipitaii.

Bibliografie
Andrews, D.J.& Hanks, T.C., Scarp degraded by linear diffusion : inverse solution for age, J.Geophys.Res.90, 10193-208, 1985. Bailey, N.T.J., The elements of stochastic processes with applications to the natural sciences, John Wiley & Sons, Inc., New York, 1964. Berg, P., Poneau, Y.& Vidal, C., Order within chaos, John Wiley and sons, New York, 1986. Bomboe, P., Geologie matematic (vol. I, Analiza statistic a datelor

97

Modele cantitative statistice geologice), Editura Universittii din Bucuresti, 1979.

Daniel Scrdeanu

Brown, S.R., A note on the description of surface roughness using fractal dimension, Geophys. Res. Lett. 14, 1095-8, 1987. Cennini, C., Tratatul de pictur, Ed.Meridiane, 1977. Chauvet, P., Aide memoire de Geostatistique Lineare, Fascicule 2, Cahiers de Geostatistique, Centre de Geostatistique, Ecole de Mines de Paris, 1991. Cheeney, R.F., Statistical methods in geology, George Allen & Unwin (publishers) Ltd, London, 1983. Clarke, G.P.Y. and Dane, J.H., A simplified theory of point kriging and its extension to cokriging and sampling optimization, Bulletin 609, Alabama Agricultural Experiment Station, Auburn University, Alabama, february 1991. Craiu, V., Enache, R., Bsc, O., Teste de concordanta cu programe n Fortran, Editura stiintific si enciclopedic, Bucuresti, 1986. Daccord, G. & Lenormand, R., Fractal patterns from chemical dissolution, Nature 325, 41-3, 1987. David, M., Handbook of applied advanced geostatistical ore reserve estimation, Elsevir, Amsterdam, 1988. David, M., Geostatistical ore reserve estimation, Elsevier, Amsterdam, 1977. Davis, J. C., and McCullagh, M. J., Display of analysis data, Wiley, New York, 1975. Delfiner, P., Matheron, G., Les fonction Aleatoires Intrinseques d'ordre k,Les Cahiers du Centre de Morphologie Mathematique de Fontainebleau, Ecole de Mines de Paris, 1980. Delhomme, J.P., Les variables regionalisees dans les sciences de l'eau, B.R.G.M., Deuxieme serie, no4, Section III, Hydrogeologie-geologie de l'ingeneur, Paris, 1978. Deutsch, C.V., Journel, A.G., GSLIB: Geostatistical Software Library, New York, Oxford University Press, 1992. Deverle, P., H., Mineral resources appraisal, Calderon Press, Oxford, 1984. Dick O., Fractalvision : Put fractals to work, Bucuresti, Teora, 1995. Dubuc, B., Quiniou, J.F., Roques-Carmes, C., Tricot, C. & Zucker, S.W., 98

Modele cantitative statistice

Daniel Scrdeanu

Evaluating the fractal dimension of profiles, Phys.Rev. A39, 1500-2, 1989. Fabbri, A.G., Image processing of geological data, New York, Van Nostrand reinhold Company, 1984. Fabbri, A.G., and Kasvand, T., Image processing for detection of twodimensional markovian prpperties as functions of distances from crystal profiles, in Proc. 3rd European symposium dor stereology , Ljubliana, Yugoslavia, June 22-26, 1981, Stereologia Iugoslavica, v. 3, (suppl. 1), Fouquet, Ch.De, Simulation conditionnelle de fonctions aleatoires: cas gaussien stationnaire et schema lineaire, Centre de Geostatistique, Ecole des mines de Paris, 1993. Guillaume, A., Analyse des variables regionalise, Doin Editeur, Paris, 1977. Hirata, T., Satoh, T. & Ito, K., Fractal structure of spatial distribution of microfracturing in rock, Geophys. J. Roy. Astron. Doc. 90, 369-74, 1987. Houlding, S.W., Practical Geostatistics, Modeling and Spatial Analysis, Springer,-Verlag Berlin Heidelboerg, 2000 Isaaks, E.H., Srivasrava, M.R., Un introduction to Applied Geostatistics, New York, Oxford University Press, 1989. Journel, A.G., Huijbregts, Ch.J., Mining Geostatistics, Academic Press, London, 1978. Journel, A.G., Exploitation des mines.Guide pratique de geostatistique, Ecole des mines d'Ales, 1975. Kasvand, T., Fabbri, A.G. and Nel, L.D., Digitization and processing of large regional geological maps, Nat. Res. Council Can., Elec. Eng. Division, Report, ERB938, 1981. Kecs, W., Complemente de matematic cu aplicatii n tehnic, Editura tehnic, Bucuresti, 1989. Kruhl, J.H., Fractals and dynamic systems in geoscience, Springler-Verlag, Berlin Heidelberg New York., 1994. 99

Modele cantitative statistice

Daniel Scrdeanu

Laffite, P., Trait dinformatique gologique, Masson et Cie Editeurs, Paris. Marsily, G.De, Quantitative Hydrogeology, New York, London, Academic Press,INC, 1986. Matheron, G., Traite de Geostatistique Appliquee, (tome I), Technip, Paris, 1976. Matheron, G., Traite de Geostatistique Appliquee, (tome II), Technip, Paris, 1963. Matheron, G., La theorie des variables rgionnalises, et ses applications, Les Cahiers du Centre de Morphologie Mathematique de Fontainebleau, Fascicule 5, Ecole de Mines de Paris, 1970. Matheron, G., Le ch oix des modles en gostatistique, in Advanced Geostatistics for mining industry., Guaracio et al., Reidel, 1976. Matheron, G., Estimer et choisir, Les Cahiers du Centre de Morphologie Mathematique de Fontainebleau, Fascicule 7, Ecole de mines de Paris, 1978. McCall, J., and Marker, B. (editors), Earth science mapping, Graham &Trotman, London, 1989. Mihoc, G.m Bergthaller, C., Urseanu, V., Procese stocastice, Editura stiintific si enciclopedic, Bucuresti, 1978. Mont, OL., Lippert, R. H., Spitz, O.T., Fortran IV and map program for computation and plotting of trend surgfaces degrees 1 through 6, Michigan, 1979. Murgu,M., Analiza retelelor de explorare si valorificarea optim a zcmintelor minerale, Tipografia Univ.Bucuresti, 1979. Onicescu, O., Stefnescu, V., Elemente de statistic informational cu aplicatii, Editura tehnic, Bucuresti, 1979. Preston, F.W., and Davis, J.C., Sedimentary porous materials as a realization of stochastic processes, in Random Processes in Geology, D.R.Merriam, ed., Springer-Verlag, New-York, 1976. Rivoirard, J., Introduction au krigeage disjonctif et a la geostatistique non lineaire, Centre de Geostatistique, Ecole des mines de Paris, 1991. Rosenfeld, A., & Kak, A.C., Digital picture processing, Academic press, New york, 1976. 100

Modele cantitative statistice

Daniel Scrdeanu

Rousseau, J.J., Scrieri despre art, B.P.T., Bucuresti, 1981. Schwarzacher, W., Sedimentation models and quantitative stratigraphy, Elsevier scientific publishing company, Amsterdam, 1975. Scrdeanu, D., Mihnea, G., L'etude de variationes spatiales de grandeurs hydrogeologique a l'aide du krigeage, Analele Univ.Bucuresti, 1987. Scrdeanu, D., Optimizarea metodelor de explorare a zcmintelor de lignit, Tez de doctorat, Univ.Buc, 1993. Scrdeanu, D., Informatic geologic, Editura Univ.Bucuresti, 1995. Scrdeanu, D., Modele geostatistice n Hidrogeologie, vol.I, Editura didactic si Pedagogic, R.A.-Bucuresti, 1996. Shakeel, A., Estimation des transmissivites des aquifers par methodes geostatistique mulrivariables et resolution indirecte du probleme inverse, These presentee a l'Ecole Nationale Superieure des Mines de Paris, 1987. Silasi, I., Geostatistic aplicat n cercetarea zcmintelor si evaluarea rezervelor, Multiplicat n atelierele C.P.P.G. al M.M.P.G.,Bucuresti, 1975. Srivastava, G. S., Optical processing of structural contour maps, J. Math. Geol. 9, 1975. Strang, G., Linear algebra and its applications, Academic Press, New York, 1980. Teodorescu, D., Modele stohastice optimizate, Editura Academiei R.S.R, Bucuresti, 1982. Trescott, P.C. at. al., Finite-difference model for aquifer simulation in two dimensions with results of nuerical experiments, Geological Survey, Washington, 1976. Turcotte D.L., Fractals chaos in geology and geophysics, Cambridge University Press, 1992. Wackernagel, H., Cours de geostatistique multivariable, Centre de Geostatistique, Ecole des mines de Paris, 1993. Wiener, U., Isaic-Maniu, A., Vod, V., Aplicatii ale retelelor probabiliste n tehnic, Editura tehnic, Bucuresti, 1983. Tatarkiewicz,W., Istoria esteticii, Editura meridiane, Bucuresti, 1978. Zorilescu, D., Prognoza resurselor de materii prime minerale, Editura 101

Modele cantitative statistice tehnic, Bucuresti, 1975.

Daniel Scrdeanu

Zorilescu, D., Modele operationale ale problemelor miniere, Editura tehnic. Bucuresti, 1981. Zorilescu, D., Introducere n geostatistica informational, Editura Academiei, Bucuresti, 1990.

102

S-ar putea să vă placă și