Documente Academic
Documente Profesional
Documente Cultură
3. Modele cantitative statistice .........................................................................1 3.1. Cuantificarea intensitii corelaiilor .......................................................1 3.1.1. Coeficienii de corelaie...................................................................3 3.1.2. Coeficienii de corelaie a rangurilor..............................................13 3.1.3. Coeficieni de asociere..................................................................19 3.1.4. Coeficieni de corelaie temporal .................................................24 3.2. Factorizarea corelaiilor .......................................................................36 3.2.1. Valori proprii i vectori proprii........................................................38 3.2.2. Standardizarea .............................................................................42 3.2.3. Analiza n componeni principali ...................................................44 3.2.4. Analiza factorial R-MOD .............................................................55 3.2.5. Rotatia factorilor............................................................................63 3.2.6. Analiza factorial Q-MOD .............................................................68 3.3. Modelarea matematic a corelaiilor substaniale................................73 3.3.1. Model liniar de o singur variabil independent ..........................73 3.3.2.Model liniar multiplu .......................................................................88 Bibliografie .....................................................................................................97
Daniel Scrdeanu
componentele ecosistemelor i sunt construite pe baza prelucrrii unui mare numr de msurtori experimentale realizate pe parcursul unui program complex de monitorizare. Elaborarea modelelor statistice se realizeaz n trei etape principale: Cuantificarea intensitii corelaiilor de diferite tipuri prin intermediul coeficienilor de corelaie, coeficieni difereniai n funcie de tipul variabilelor factoriale i al variabilelor independente (x,y, t); Factorizarea corelaiilor care are ca scop ierarhizarea i selectarea corelaiilor reprezentative din punct de vedere statistic. Modelarea matematic a corelaiilor de diferite tipuri. Modelele statistice au un domeniu de aplicare restrans la spaiul i intervalul de timp n care s-a realizat programul de monitorizare pe baza cruia s-au obinut datele necesare elaborrii acestora.
Daniel Scrdeanu
Natura corelaiilor n ecologie este determinat de structura fizicochimic i bilogic a obiectelor de studiu care este constituit dintr-un ansamblu de variabile care formeaz biotopul i biocenoza. De aici rezult natura substantial a corelaiilor care se realizeaz pe baza compozitiei fizice, chimice, pe baza speciilor sau a calittii fizico-chimice a cmpurilor terestre (magnetic, gravimetric etc). Ecologia se ocup, de asemenea, cu analiza proceselor ce se desfsoar n timp i spaiu; n acest fel se completeaz spectrul naturii corelaiilor ecologice cu trei componente principale: corelaii substantiale; corelaii temporale. corelaii spaio-temporale sau topo-probabiliste;
Cercetarea corelaiilor poate fi realizat cu instrumente diferite n functie de dimensiunea i natura fenomenelor studiate. n literatura exist nc o mare confuzie n terminologia utilizat pentru instrumentele cu ajutorul crora evalum intensitatea legturilor/corelaiilor dintre caracteristicile ecologice. Vom adopta n continuare pentru instrumentele de cuantificare a intensittii corelaiilor substaniale dintre dou variabile urmtoarele categorii: coeficient de corelaie utilizat pentru variabile cantitative (numerice) i adaptabil, n anumite circumstane, pentru variabile calitative (alfanumerice); coeficient de corelaie a rangurilor utilizai pentru variabile ordonabile (numerice/alfanumerice); coeficie de asociere utilizai pentru variabile calitative (alfanumerice) Cuantificarea corelaiilor temporale se bazeaz pe o formalizare particular a serilor de timp se exprim prin: coeficieni de autocorelaie coeficieni de intercorelaie
Cuantificarea corelaiilor spaio-temporale presupune o prelucrare complex i un volum mare de date cu o structur spaial i temporal
Daniel Scrdeanu
complex. Metodologia de evaluare a acestor corelaii este de o deosebit complexitate constituind o direcie special ( Scrdeanu, D., 2003, Geostatistic aplicat).
a) Raportul de corelaie
Raportul de corelaie permite evaluarea intensittii i sensului corelaiei dintre dou variabile geologice
( y, x )
Raportul de corelaie realizeaz aceast evaluare prin intermediul gradului de mprtiere al valorilor yi msurate n jurul mediilor condiionate y xi . Analiznd intensitatea dependenei variabilei y (rezultative) n raport de variabila x (factorial), dispersia acesteia poate fi exprimat sub forma:
2 2 2 sy = sy (x ) + s y0
(III.169)
n care
2 sy - dispersia total a variabilei y n raport cu toti factorii cunoscuti sau
necunoscuti;
2 sy ( x ) - dispersia condiionat a variabilei y n raport cu variabila x ; 2 sy 0 - dispersia rezidual a variabilei y n raport cu celelalte variabile care-i
Daniel Scrdeanu
Separarea dispersiei totale n cele dou componente necesit gruparea datelor ntr-un tabel de corelaie a crui configuratie este condiionat de sensul corelaiei. Pentru evaluarea gradului de dependent al variabilei y n raport cu variabila x , tabelul de corelaie (Tabelul III.19) contine:
m yxi - mediile variabilei y pentru fiecare interval xi ; n xi - frecventele marginale ale valorilor yi pentru fiecare interval xi ;
n timp ce tabelul de corelaie al variabilei x n raport cu y ( x = f ( y ) ) (Tabelul III.20):
m xyi - mediile variabilei x pentru fiecare interval yi ; n yi - frecventele marginale ale variabilei xi pentru fiecare interval yi .
Tabelul III.19 Corelaie y = f (x )
x
ydependent
var.
n xi
m yxi
x-
var.
n yi
m xyi
dependent
x1 x2
n x1 nx 2
. . .
m yx1 m yx 2
. . .
y1 y2
n y1 ny2
. . .
m xy1 m xy 2
. . .
. . .
. . .
xk
y k 1 , y k 2 ,..., y knk
n xk
m yxk
yk
n yk
m xyk
2 y
(y =
k i =1 k
my )
k 1
(III.170)
2 y(x)
i =1
n xi (m yxi m y ) k 1
(III.171)
Daniel Scrdeanu
relaiile:
2 x
(x =
k i =1
mx )
k 1 n yi (m xyi m x ) k 1
(III.172)
2 x( y )
i =1
(III.173)
pentru analiza intensitii corelaiei x = f ( y ) . Intensitatea corelaiei dintre cele dou variabile se msoar cu ajutorul raportului dintre dispersia ( s y ( x ) sau s x ( y ) ) i dispersia total ( s 2 y sau s 2 x ). Pentru exprimarea cantitativ a acestei corelaii se defineste corelaie cu: raportul de
y(x ) =
2 sy (x ) 2 sy
(III.174)
x( y ) =
2 sx (y) 2 sx
(III.175)
Valoarea maxim a raportului de corelaie este 1 i exprim o corelaie maxim ntre cele dou variabile, iar lipsa de corelaie dintre cele dou variabile corespondente valorii zero, valoarea minim a raportului de corelaie. n analiza corelaiei dintre dou variabile geologice, nu ntotdeauna este evident care din variabile este rezultativ i care este factorial, motiv pentru care este necesar s se determine valoarea raportului de corelaie n ambele variante (III.174) i (III.175). Analiza ambelor valori poate conduce la urmtoarele variante extreme de interpretare: a) variabila y este dependent de x iar x este independent;
y ( x ) = 1 i x ( y ) = 0
(III.176)
y ( x ) = 0 i x ( y ) = 1
b) variabilele x i y sunt independente; c)
y ( x ) = 0 i x ( y ) = 0
d) variabilele
x i
(III.178)
y ( x ) = 1 i x ( y ) = 1
(III.179)
n practica analizei corelaiilor dintre variabilele geologice, raportul de corelaie ia valori cuprinse ntre 0 i 1 iar semnificatia lor statistic se poate testa cu ajutorul factorului F pe baza inegalittii:
Fexp
2 nk > F ( , 1 ; 2 ) = 2 k 1 1
(III.180)
n care 1 = k 1 , 2 = n k ( n = perechi de valori, k = numr de intervale de grupare, = nivelul de semnificaie al testului). Verificarea inegalittii (III.180) indic o valoare semnificativ statistic a raportului de corelaie, deci existenta unei corelaii ntre variabilele analizate.
Coeficientul corelaiei lineare este cel mai des ntlnit n cercetarea ecologic a corelaiilor i din nefericire este utilizat n general fr absolut nici o precautie legat de caracteristicile statistice ale variabilelor implicate. Definit pentru dou variabile cu repartiie normal ( x, y ), coeficientul corelaiei lineare (= coef. lui PEARSON = coeficientul corelaiei totale) este definit cu relaia: 6
Daniel Scrdeanu
rxy =
(III.181)
(x m )(y m ) (x m ) (y m )
n i =1 i x i y n
2
i =1
Valorile coeficientului de corelaie linear sunt cuprinse ntre 1 i 1 iar dac x i y sunt independente, rxy = 0 . Abaterea de la repartitia normal a variabilelor x i y antreneaz modificri ale interpretrii valorilor coeficientului de corelaie linear. Valoarea minim a coeficientului Pearson ( rxy = 0 ) nu este un indicator al independentei celor dou caracteristici, ci numai de necorelare liniar a lor. Acestea pot fi corelate printr-o relatie functional de tip parabolic, logaritmic etc. Pentru interpretarea valorilor nenule ale coeficienilor de corelaie, o explicare grafic este mult mai sugestiv pentru cei neacomodati cu statistica matematic. Valoarea coeficientului de corelaie linear este n dependen direct cu distribuia perechilor de valori ( xi , yi ) ntr-un sistem rectangular de referint
XOY .
Corespunztor
configuratiei
geometrice
distributiei
punctelor, se disting urmtoarele cazuri: a) alinierea perfect a punctelor de-a lungul unei drepte - fie ascendent ( rxy = 1 ; Fig. 58a), fie descendent ( rxy = 1 ; Fig. 58b) - care indic o dependen linear perfect ntre cele dou variabile. O astfel de situaie este foarte rar ntlnit n studiul unor relatii functionale ntre dou caracteristici geologice; b) punctele sunt dispersate aleator, norul de puncte neavnd nici o orientare preferential (Fig. 58c). n circumstanele amintite anterior, cele dou variabile sunt independente sau necorelate ( rxy = 0 );
Daniel Scrdeanu
c) configuraia tranzitorie ntre cele dou extreme, n care norul de puncte are o orientare preferenial corespunztoare valorilor lui aparinnd intervalului [ 1,1] (Fig. 58d). a
y y
rxy
b
y
c
y
x
r =0
x
0 < r <1
r 1
r 1
O analiz mai detaliat a coeficientului de corelaie linear este reluat la analiza modelului liniar de o singur variabil independent . Valorile coeficientului de corelaie linear, n cazul n care repartitia celor dou variabile se abate de la cea normal, nu mai exprim n mod obligatoriu intensitatea corelaiei lineare ntre cele dou variabile x i y . n cazul frecvent al pentru repartitiilor calculul
x1 F1 A1
lognormale,
x2
A2
c) Coeficientul cosinus
1
F2 y1 y2
pentru estimarea similarittii ntre obiecte geologice de studiu (ex.: aflorimente, zcminte, bazine de sedimentare, acvifere etc), reprezentate n
granulometric,
parametri
hidrogeologici
Estimarea
ortogonalitatea axelor sistemului de referint, motiv pentru care este preferat n analiza factorial Q - MOD. ntr-un spatiu bidimensional definirea coeficientului cosinus se bazeaz pe relatiile trigonometrice elementare ale cosinusului unghiului unei diferente de unghiuri (Fig.59):
cos A1 A2 = cos(1 2 ) =
(x
x1 y1 + x2 y 2
2 1
2 2 ) + y12 )(x2 + y2
(III.183)
Generaliznd pentru n dimensiuni ( n factori independenti F1 , F2 ,..., Fn , spre exemplu n aflorimente probate n cazul analizei Q-MOD) se obine formula:
cos A1 A2 =
(III.183)
xy x
k i =1 i k 2 i =1 i
i =1
yi2
Acest coeficient de corelaie indic o similaritate complet ntre dou obiecte geologice A1 i A2 pentru cos = 1 i o disimilaritate total pentru
cos = 0 (corespunztor unui unghi = 90 o echivalent cu ortogonalitatea
vectorilor de poziie).
Ca msur a similarittii ntre dou obiecte geologice, coeficientul distantei taxonomice i are originea n modelul geometric al distantei euclidiene ntre dou puncte A i B ntr-un spatiu n -dimensional. Distanta taxonomic ntre cele dou obiecte geologice este invers proportional cu similaritatea, n fiind numrul de caracteristici proprii celor dou obiecte geologice studiate. 9
Daniel Scrdeanu
n cazul distanei taxonomice dintre dou eantioane A i B reprezentate prin dou caracteristici x1 i x2 (Fig.60) formula de calcul este:
D AB =
(III.184)
n care:
x1 A - caracteristica x1 determinat n eantionul A (ex.: coninutul n
zinc);
x1B - caracteristica x1 determinat n eantionul B; x2 A
- caracteristica n eantionul
x2
determinat
x1 x1 A
- caracteristica
x2 x1B
determinat n eantionul B.
Dac
pentru
cele
dou
x2 A x2B x2
obiecte geologice (A i B) se determin mai multe caracteristici ( x1 , x2 ,..., xn ) generalizare taxonomice: se a utilizeaz o Fig. 60 Distana taxonomic n spaiu bidimensional
distanei
D AB =
(X
n i =1
iA
X iB )
(III.185)
Creterea numrului de caracteristici utilizate reduce posibilitatea interpretrii valorii distantei taxometrice n comparatie cu a altor coeficieni de corelaie datorit diversittii unittilor de msur i a amplitudinilor de selectie. Eliminarea acestor inconveniente se realizeaz prin standardizarea valorilor caracteristicilor msurate, normarea lor pe intervalul coeficientului distanei taxonomice:
[0,1]
i definirea
10
Daniel Scrdeanu
d AB = 1
(III.186)
n care:
XS iA - valoarea standardizat i normat a caracteristicii "i" din eantionul A; XS iB - valoarea standardizat i normat a caracteristicii "i" din eantionul B.
n aceste condiii, valorile extreme ale coeficientului de distan sunt: zero, cnd cele dou esantioane sunt identice, deci similaritatea este maxim i unu, cnd cele dou eantioane A i B sunt total diferite.
Coeficientul corelaiei binare ( rD ) a fost propus de Derec, Sarcia i Troly (1964) pentru cercetri metalogenetice i este definit prin relaia:
neab ab
rD = n a b
ab(n a )(n b )
(III.188) n care:
n
e ab
Fig. 61 Relaia dintre elementele coeficientului de corelaie binar
11
Daniel Scrdeanu
pozitive) legtura este mai puternic. Valorile negative indic o "respingere" a caracteristicilor, iar valoarea nul o independen total. Interpretarea naturalist a valorilor lui
rD
permite ierarhizarea
corelaiilor ntr-un sistem multivariat pe baza coeficienilor corelaiei binare calculati pentru toate perechile de caracteristici msurabile. Asamblate ntr-o matrice de similaritate, toate valorile coeficientului de corelaie pot forma o imagine sintetic a ierarhiilor corelaionale din sistemul studiat. n tabelul III.21 este prezentat configuratia unei astfel de matrici ce va constitui obiectul unor prelucrri ulterioare n scopul factorizrii corelaionale. Tabelul III.21 Matricea coeficienilor rD pentru mineralele caracteristice ale pegmatitelor cu beril din Madagascar i Mozambic (dup P. Lafitte, 1972)
1 1 2 3 4 5 6 7 8 9 10 11
1 0.31 0.34 -0.16 0.18 0.31 0.17 0.18 -0.06 -0.57 0.26
2
0.31 1 -0.17 -0.46 0.13 0.1 0.05 0.13 0.13 -0.55 -0.19
3
0.34 -0.17 1 -0.16 0.18 -0.28 -0.31 -0.06 0.18 0.01 0.26
4
-0.16 -0.46 -0.16 1 0 0.14 -0.11 0.29 0 0.14 0.15
5
0.18 0.13 0.18 0 1 -0.24 -0.13 -0.07 -0.33 0.08 0.24
6
0.31 0.1 -0.28 0.14 -0.14 1 0.55 0.08 0.08 -0.18 0.06
7
0.17 0.05 -0.31 -0.11 -0.13 0.55 1 -0.13 -0.13 -0.1 -0.28
8
0.18 0.13 -0.06 0.29 -0.07 0.08 -0.13 1 0.73 -0.24 0
9
-0.06 0.13 0.18 0 -0.33 0.08 -0.13 0.73 1 -0.24 0
10
-0.57 -0.55 0.01 0.14 0.08 -0.18 -0.1 -0.24 -0.24 1 -0.23
11
0.26 -0.19 0.26 0.15 0.24 0.06 -0.29 0 0 -0.23 1 1 - minereuri de Nb i Ta; 2 - mic litinifier; 3 - amfibolit i spodumen; 4 - fosfati de Mn i Fe; 5 - minerale de Bi; 6 - casiterit i wolframit; 7 - molibdenit; 8 - minerale de U; 9 pmnturi rare; 10 - minerale de Cs; 11 - granat.
12
Daniel Scrdeanu
Ordonarea valorilor unei caracteristici geologice ntr-o succesiune ascendent sau descendent este realizabil att pentru caracteristicile cantitative ct i pentru cele calitative. Operatiune extrem de ieftin din punct de vedere al prelucrrii, ordonarea asociaz fiecrei valori a caracteristicii studiate un numr natural, cunoscut sub denumirea de rang. Analiza corelaiei rangurilor este o tehnic neparametric pentru studiul legturilor dintre variabilele geologice care nu tine seama de diferenta dintre valorile numerice ale propriettilor, ci numai de ordinea lor. Coeficienii definiti pentru cuantificarea intensittii corelaiei rangurilor au valori cuprinse n intervalul [ 1,1] i permit analiza corelaiilor pentru dou sau mai multe variabile. Ei pot fi utilizati cu deosebit succes pentru corelarea secventelor sedimentare investigate prin carotaj geologic complex n structuri sedimentare cu numeroase alternane litologice pe unitatea de adncime.
Coeficientul lui Spearman ( SP ) este definit pe baza coeficientului corelaiei lineare al lui Pearson ntre dou variabile v1 , v2 i are formula:
SP = 1
n care:
6i =1 d i2
n
n(n 2 1)
(III.189)
13
Daniel Scrdeanu
Aplicatie. Analiza corelaiei ntre valoarea economic a unei roci i indicele ei de duritate pe baza valorilor din tabelul III.22 conduce la o valoare a coeficientului lui Spearman:
SP = 1
Valorile SP sunr cuprinse n intervalul [ 1,1] iar interpretarea este similar cu a coeficientului lui Pearson din care este dedus. Pentru aplicaia precedent se poate concluziona pe baza valorii SP = 0,9 c exist o bun concordan ntre valoarea economic a rocii i tria ei rezultat dintr-un ansamblu de proprieti elementare (compoziie mineralogic, structur, textur etc.). Tabelul III.22 Calculul coeficientului lui Spearman Nr. crt. 1 2 3 4 5 6 7 8 9 10 P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 Proba Rangul Valoare economic 10 2 3 1 5 4 6 7 8 9 5 3 1 10 8 2 9 4 6 7 5 -1 2 -9 -3 2 -3 3 2 2 25 1 4 81 9 4 9 9 4 4 Trie
di
d i2
14
Daniel Scrdeanu
Coeficientul lui Kendall ( k ) are aceleai proprieti cu coeficientul Spearman, fiind egal cu zero cnd cele dou variabile analizate sunt independente i cu +1 i -1 cnd dependena dintre cele dou variabile este maxim, pozitiv sau negativ. Relaia de definitie este:
k =
(III.190) n care:
2S n(n 1)
n - numrul de perechi de valori ordonate; S - suma concordantelor posibile, calculate prin consemnarea cu +1 a
"consensului" i cu -1 a variaiei inverse. Aplicatie. Pentru o serie de n = 5 perechi de valori [densitate ( ), coeziune ( c )] (Tabelul III.23a), succesiunea operaiunilor necesare calculului coeficientului k este: Tabelul III.23 Elementele de calcul pentru coeficientul Kendall a) Proba 1 2 3 4 5 Rangul b) Proba 3 2 4 5 1 Rangul
5 2 1 3 4
1 2 3 4 5
4 1 3 2 5
3 1 2 5 4
1. Ordonarea probelor dup rangul unei caracteristici, de exemplu (Tabelul III.23b). 2. Realizarea perechilor de ranguri prin combinarea probelor disponibile (Tabelul III.24). 15
Daniel Scrdeanu
3. Calculul lui S prin nsumarea algebric a variaiilor relative. 4. Calculul lui k cu formula (III.190):
k =
24 = 0,4 5(5 1)
12 13 14 15 23 24 25 34 35 45
Consens +1 Contrasens -1 -1 -1 +1 +1 +1 +1 +1 +1 +1 -1 4
31 32 35 34 12 15 14 25 24 54
S=
n practic, frecvent, seleciile de date conin grupuri de k valori cu acelai rang. Pentru astfel de situaii se calculeaz un rang mediu prin media aritmetic a rangurilor celor k valori. Vor apare astfel n seria ordonat a selectiei k valori cu acelai rang. Tranzitiile ntre valori cu acelai rang sunt consemnate cu valoarea zero n calculul parametrului S . Aplicatie. Dac ordonarea a n = 5 probe dup gradul de alterare este realizat de doi specialisti (A, B) obtinndu-se situatia din tabelul III.25, rangul mediu al probelor P3 i P4 dup clasificarea obtinut de specialistul A este:
rangAP 3 = rangAP 4 =
2+3 = 2,5 2
16
Daniel Scrdeanu
k =
Tabelul III.25 Coef. Kendall Proba P1 P2 P3 P4 P5 RANG A 1 4 2-3 2-3 5 RANG A 1 2,5 2,5 4 5 B 3 2 4 1 5 B 3 1 2 4 5
2 1 = 0,1 5(5 1)
Tabelul III.27 Coef. Kendall Nr. crt. 1 2 3 4 5 6 7 8 9 10 A 1 2,5 1 2,5 14 15 2,5 2,5 2,5 4 2,5 5 2,5 4 2,5 5 45 B 32 34 31 35 24 21 25 41 45 15 +1/-1 -1 1 -1 1 0 -1 1 -1 1 1
S =1
c) Coeficientul OMEGA-Kendall
Corelarea simultan a rangului mai multor variabile poate fi cuantificat prin coeficientul definit cu relaia:
K =
12 S m n3 n
2
(III.191)
17
Daniel Scrdeanu
S = i =1 S i S
m
(III.192)
Aplicatie. Analiza corelaiei rangurilor a trei variabile V1, V2 i V3, a cror clasificare este consemnat n tabelul III.28a, conduce la urmtoarele etape de calcul (Tabelul III.28b): 1 - media concordanelor binare
S=
4+0+2 =2 3
S = (4 2) + (0 2) + (2 2) = 8
2 2 2
3 - coeficientul K
K =
12 8 = 0,1 3 53 5
2
Valoarea 0,1 indic o corelaie nesemnificativ ntre cele trei variabile (V1, V2 i V3).
Tabelul III.28 Elementele de calcul pentru coeficientul OMEGA-Kendall b) Nr. a) Nr. prob P1 V1 1 Rang V2 2 V3 3 crt. 1 2 3 V1 Tranziii V2 V3 12 21 32 13 24 35 14 25 31 -1 +1 +1 +1/-1 V1:V2 V1:V3 V2:V3 -1 +1 -1 +1 +1 -1
18
Daniel Scrdeanu +1 +1 +1 +1 +1 +1 -1 +1 +1 -1 +1 -1 -1 +1 +1 +1 -1 +1 -1 +1 -1
Dac n seleciile analizate exist i valori identice, deci cu acelai rang, formula (III.191) se modific sub forma:
K =
m 2 n 3 n mi =1 t i3 t i
n
12 S
Asocierea caracteristicilor calitative este o problem de importan deosebit n cercetarea geologic fundamental. Compararea rocilor pe baza asociatiilor mineralogice, a nivelurilor stratigrafice pe baza speciilor fosile determinate, a zcmintelor pe baza caracteristicilor petrografice, toate solicit existenta unui instrument pentru ierarhizarea asocierii caracteristicilor calitative functie de intensitatea ei. Aproape jumtate din datele obtinute prin prospectiune i explorare geologic sunt de natur calitativ i ignorarea acestora n etapa de analiz corelaional echivaleaz cu pierderea contactului cu ambianta geologic a fenomenului studiat. Coeficienii de asociere permit descrierea cantitativ a celor dou tipuri de relatii fundamentale ce se stabilesc ntre dou caracteristici calitative A i B
19
Daniel Scrdeanu
(ex.: A=tipul petrografic: granit, dacit, bazalt etc.; B=caracterul mineralogic: ortoz, albit, olivin etc.): independenta i asocierea . Independenta a dou caracteristici calitative A i B este exprimat cantitativ prin identificarea aceleiai proportii de elemente A, att printre elementele B ct i nonB. Exprimat prin intermediul frecventelor de grup, forma clasic a criteriului de independent pentru cele dou caracteristici A i B este:
( AB ) = ( A ) (B )
(III.194) Pentru identificarea comod a independentei, indiferent de forma n care au fost sistematizate datele din cele N puncte de probare, criteriul exprimat prin relaia (III.194) poate fi formulat n diferite variante echivalente :
( AB ) = ( A) (B ) N
(III.195)
( AB ) = (B ) ( A) N
(III.196)
( AB ) = ( A)(B )
N
(III.197)
( AB ) = ( A) (B )
N N N
(III.198) Ecuaia independentei: "Dac caracteristicile calitative A i B sunt independente, proportia elementelor ( AB ) este egal cu proportia elementelor A nmultit cu proportia elementelor B." (III.198) exprim simbolic regula fundamental a
20
Daniel Scrdeanu
Asocierea exprim existenta unei legturi ntre caracteristicile calitative, iar functie de sensul, intensitatea i numrul de variabile implicate poate fi: pozitiv sau negativ, complet sau incomplet, total sau partial. Asocierea pozitiv a dou caracteristici A i B atrage cresterea numrului de elemente B o dat cu cresterea numrului de elemente A i este exprimat de inegalitatea:
( AB ) > ( A)(B )
N
(III.199) Asocierea negativ, opus celei pozitive, exprim dezasocierea caracteristicilor comparate, adic reducerea numrului de elemente B proportional cu cresterea numrului de elemente A, i este exprimat de inegalitatea:
( AB ) < ( A)(B )
N
(III.200) Proporional cu creterea intensitii legturii ntre cele dou caracteristici calitative implicate, asocierea pozitiv i negativ tind s devin complete ((A)=(B) - asociere complet; (AB)=0 dezasociere = asociere negativ complet). Analiza corelaional a unui sistem geologic, fie el bazin de sedimentare, zcmnt polimetalic sau de petrol, implic n mod obligatoriu studiul simultan al mai multor variabile calitative. Numai din considerente operationale, n anumite etape ale prelucrrii datelor se ignor ansamblul de corelaii, lunndu-se n considerare numai informatiile referitoare la dou caracteristici calitative A i B, definindu-se asocierea total ntre acestea. Definirea asocierii totale, presupune ipoteza c n sistemul studiat nu exist o alt variabil care s condiioneze variabilele luate n studiu. Pentru cuantificarea intensittii asocierii, presupuse totale, se utilizeaz n mod uzual coeficientul de asociere ( Q ), coeficientul de interdependent ( Y ) i coeficientul de corelaie calitativ ( rAB ).
21
Daniel Scrdeanu
Q=
(III.201)
( AB )( ) (B )( A ) ( AB )( ) + (B )( A )
Coeficientul de asociere Q este zero cnd cele dou caracteristici A i B sunt independente, +1 cnd exist asociere pozitiv complet i -1 cnd cele dou caracteristici sunt dezasociate (= asociere complet negativ). Coeficientul de asociere Q este independent de proportiile relative ale elementelor A i n selectia de date, proprietate ce-l face adecvat cazurilor n care proportiile sunt arbitrare.
b) Coeficientul de interdependen
1 Y= 1+
(III.202)
( A )(B ) ( AB )( ) ( A )(B ) ( AB )( )
Coeficientul de corelaie asociativ ( rAB ) este definit (Sarapov, 1968) pe structura coeficientului corelaiei lineare, avnd aceleai proprietti cu acesta : 22
Daniel Scrdeanu
rAB =
(III.203) Testarea caracterului total al asocierii caracteristicilor A i B necesit verificarea influentei unei alte caracteristici C asupra asocierii acestora. Pentru aceasta se defineste asocierea partial a caracteristicilor A i B n raport cu C. Asocierea partial ca i cea total poate fi pozitiv dac se verific inegalitatea:
Q AB.C =
(III.206)
1 YAB.C = 1+
(III.207)
23
Daniel Scrdeanu
(III.208) Testarea influentei caracteristicii C asupra asocierii caracteristicilor A i B se bazeaz pe compararea coeficienilor calculati pentru asociere n raport att cu caracteristica C ct i cu caracteristica nonC (= ). Egalitatea
ale
piezometric
msurate
intervale de timp egale succesiunea t litologic a unei secvente sedimentare separat n intervale egale ca grosime (Fig.63), numr
t1 t2 t3 t4
24
Daniel Scrdeanu
X
NF(1) NF(2) NF(3)
Y Fig. 64 Numr de microfosile identificate n puncte de probare plasate pe o direcie oarecare de probare
a)
v1
v2
b)
v3 t1 t2 t3 . . .
tn-1 tn Fig. 63 Serii de timp rezultate din cercetarea unei succesiuni sedimentare a) serie de timp litologic univariat; b) serie de timp multivariat ( v1 = , v2 = PS ; v3 = ) obinut din diagrafia geofizic complex
Timpul, ntr-o astfel de serie de valori sau stri ale procesului studiat este echivalent fie cu grosimea stratigrafic, fie cu adncimea msurat ntrun foraj, fie cu distanta de-a lungul unei directii oarecare din spatiu. Studiul seriilor de timp beneficiaz de o ampl i sofisticat metodologie (Tertisco M.et.al.,1985) care nu poate fi utilizat cu eficient maxim n geologie din dou motive principale:
25
Daniel Scrdeanu
a)volumul mare de date necesar calculului parametrilor caracteristici analizei seriilor de timp univariate, cu semnificatie relativ redus n studiul proceselor geologice complexe, multivariate; b)complexitatea metodologiei care introduce dificultti de interpretare n analiza seriilor de timp multivariate, adecvate studiului proceselor geologice complexe.
Existenta unui volum minim de date pentru studiul unei serii de timp n scopul estimrii stocastice a corealtiilor presupune o formalizare care asociaz caracteristicii studiate (ex.: litologia, nivelul piezometric, numrul de fosile identificate etc.) o variabil aleatoare de obicei discret (caracterul discret fiind determinat de modul de colectare a datelor i nu de natura variabilei studiate), iar continutului variabilei, un ansamblu de stri (ex.: variate tipuri litologice: calcar, argil, gresie; sensul evolutiei: ascendent, descendent, constant). O serie de timp este din punct de vedere formal o succesiune se stri exclusive, iar instrumentul operational care permite identificarea probabilist a ponderii componentei deterministe (=corelaionale) a procesului este matricea de tranzitie. Matricea de tranzitie sacrific toate informatiile referitoare la pozitia strilor n secventa de date, n favoarea identificrii tendintei unei stri de a fi urmat sau precedat de alta. Exist dou tipuri principale de matrici de tranzitie: matrici de tranzitie unitar (de un pas) i matrici de tranzitie multipl, fiecare dintre ele putnd fi exprimate numeric n trei forme diferite: 1) matricea frecventelor de tranzitie, 2) matricea proportiei perechilor de tranzitii, 3) matricea proportiilor de tranzitie. 1) Matricea frecventelor de tranzitie este format din numrul tranzitiilor de la o stare la alta determinat pe baza seriei de observatii disponibile.
26
Modele cantitative statistice Pentru seria de n = 31 stri: ABACDCDABCBADCDCBACABDABCDBACDA matricea frecventelor celor n 1 = 30 tranzitii ( MFT ) este: A B C D Total
Daniel Scrdeanu
A B MFT = C D
(III.209)
0 4 1 3
4 0 2 1
3 2 0 3
1 1 5 0
8 7 8 7
30 Total 8 7 8 7 2) Matricea proporiei perechilor de tranziii ( MPPT ) se obine din MFT prin divizarea fiecrei valori cu numrul total de tranzitii i exprim ponderea unei tranzitii n totalul acestora: A; B; C; D; Total
A B MPPT = C D
(III.210)
1,00 Total 0,26 0,23 0,27 0,23 3) Matricea proporiilor de tranziie ( MPT ) exprim proporia n care o stare poate fi urmat de alta fr a ine seama de ponderea strii iniiale n totalul acestor tranzitii. Ea se calculeaz prin divizarea fiecrui element dintr-un rnd al MFT prin suma frecventelor din rndul respectiv.
27
Daniel Scrdeanu
Total
A B MPT = C D
(III.211)
Cele trei forme de exprimare ale matricii de tranzitie pot fi construite pentru o tranzitie unitar cnd procesul studiat opereaz la momente consecutive, exprimate formal de indicele superscris al probabilittii de tranzitie de la starea "j" la starea "k".
1) p (jk = P{ Vm+1 = k Vm = j}
(III.212) Pentru o tranzitie multipl ( n pai), probabilitatea de tranzitie de la starea "j" la starea "k" se scrie:
n) p (jk = P{ Vm+n = k Vm = j}
(III.213) n cazul n care probabilittile p jk depind numai de pasul n i sunt independente de pozitia initial "m" (situatie valabil pentru un lan Markov omogen) matricea de tranzitie multipl se calculeaz pe baza matricilor de tranziie unitar. Relaia de recurent a "moment" este: prognozei strii sistemului pentru orice
p ( m ) = p (0 ) P ( m )
(III.214)
28
Daniel Scrdeanu
MPT 1
(2 )
MPT 1
(4 )
0,50 0,30 0,20 MPT 1 = 0,50 0,30 0,20 0,50 0,30 0,20
(6 )
0,50 0,30 0,20 MPT 1 = 0,50 0,30 0,20 0,50 0,30 0,20
(8 )
o matrice de echilibru, care nu se modific peste o anumit valoare a exponentului i care prin structura numeric exprim intensitatea corelaiilor care exist n seria de timp analizat. Pentru exemplificarea modului n care se reflect gradul de determinare n structura unei matrici de tranzitie prezentm n continuare: a) matricea unui proces determinist de tipul MPTD: ...ABCDABCDAABCDABCD... A B C D
A B MPTD = C D
0 0 0 1
1 0 0 0
0 1 0 0
0 0 1 0
D C
cu exprimarea grafic a tranzitiilor n fig. 65. Fig. 65 Tranziiile ntr-un proces determinist
29
Daniel Scrdeanu
cu exprimarea grafic a tranzitiilor n fig. 66. La un numr mare de valori ale unei serii de timp aleatoare, probabilittile devin egale (ex.: P ( A B ) = P( A C ) = P( A D ) = 1 / 3 ) n cazul unui sistem cu patru stri distincte A,B,C,D). ntre cele dou extreme (model determinist i aleator) exist o infinitate de variante diferentiate prin intensitatea corelaiilor. Descrierea statistic a seriilor de timp este realizat prin patru functii elementare: dispersia, densitatea de probabilitate, coeficientul de autocorelaie sau intercorelaie i densitatea spectral. Dac primele dou sunt utilizate pentru orice variabil cu comportament aleator, ultimele dou sunt specifice seriilor de timp.
b) Coeficientul de autocorelaie
Autocovarianta este covarianta a dou realizri ale aceleiai variabile ( V ) care este determinat n dou puncte separate prin intervalul h . Covarianta, ca o functie de h poate fi scris sub forma:
CV (h ) = E (Vn ,Vn+h ) = lim 1 Vn Vn+h
N N
(III.215)
30
Daniel Scrdeanu
CV ( h ) = CV (h )
(III.216) iar dac h = 0 covarianta se reduce la dispersie (=variant) i se poate scrie :
CV (0) = var(V ) =
(III.217)
1 N
V
n =1
2 n
Coeficientul de autocorelaie se obine prin divizarea covariantei la variant i poate fi scris sub forma:
RV (h ) =
(III.218)
CV (h ) CV (0)
rV (h ) =
(III.219) Valorile coeficientului de autocorelaie sunt cuprinse n intervalul [ 1,1] i evident Rv (0) = 1 este valoarea care indic o corelaie maxim. Valoarea
Rv (0) = 1
31
Daniel Scrdeanu
Rv (h )
+1 Nivel semnificaie minim 3 1 2 4 5 6 7 8
grafic
variatiei de
coeficientului
autocorelaie n functie de
h poart denumirea de
corelogram (Fig. 67) i
h ilustreaz sintetic
ntr-o
form
semnificatia
-1
componentelor cu semnificatie statistic se face prin alegerea unui nivel de semnificatie minim care filtreaz valorile coeficientului de autocorelaie. Intrun model pentru reproducerea i prognoza seriei de timp sunt reprezentate numai componentele al cror coeficient de autocorelaie depseste nivelul de semnificatie minim. Aplicatie. Ca un exemplu simplu se poate calcula corelograma unui proces geologic de tip markovian descris printr-o matrice de tranzitie. Acest lucru se poate realiza prin asocierea unei valori numerice fiecrei stri a sistemului . Pentru un proces cu dou stri distincte, asociind unei stri valoarea unu i celei de-a doua valoarea zero matricea de tranzitie va fi notat:
p MPT = 00 p10 p01 p11
n care p01 , p01 , p10 i p11 sunt probabilittile de tranzitie din sistemul studiat. Conform relaiei (III.215):
CV (h ) = E (Vn = Vn+h = 1) = P(Vn = 1) P(Vn+h = 1Vn = 1)
32
Daniel Scrdeanu
i deoarece
P(Vn = 1) = E (Vn ) = p1
i
h RV (h ) = p11
Corelograma unui astfel de proces markovian corespunde puterilor probabilittilor de tranzitie p11 i n general, pentru orice lan markov va fi o functie simpl de MPT (h ) . Dac se calculeaz corelograma uni proces aleator "pur" n care
E (Vn ) = 0 , atunci RV (h ) = 0 pentru h = 1,2,3,... avnd un singur maxim de RV (h ) = 1 pentru h = 0 . Acest lucru este n acord cu definitia unui proces
aleator n care se presupune c nu exist corelaii ntre Vn i Vn+h pentru orice
n i orice h diferit de zero.
c) Coeficientul de intercorelaie
U, V ul U este V dou 0 Fig. 68 Variaia n timp a dou caracteristici geologice cu comportament aleator t
timp ce msoar
33
Daniel Scrdeanu
variatia a dou variabile disticte U ,V (ex.: U =precipitatiile, V =cota nivelului piezometric al unui acviferului freatic); U =porozitatea, V =valoarea PS-ului corespunztor nregistrat ntr-un carotaj etc.) (Fig. 68).
rUV (h ) =
(N h ) vi2 ( vi )2 (N h )U i2+h (U i+ h )2
(III.220) Domeniul de variatie i semnificatia coeficientului de intercorelaie sunt analoage cu cele ale coeficientului de autocorelaie. Referindu-se la dou variabile RUV (0) este identic cu coeficientul lui Pearson i numai n cazul unei corelaii liniare perfecte ntre U i V va avea valoarea unitar, pozitiv sau negativ dup cum corelaia este direct respectiv invers. Corelograma coeficientului de intercorelaie este utilizat n scopul identificrii periodicittii seriilor de timp multivariate, a decalajelor cu semnificatie statistic pentru cupluri de dou variabile. Prin analiza corelaiei dintre variatia precipitatiilor i a nivelului piezometric din acviferele freatice se poate evalua, spre exemplu, cu ajutorul coeficientului de intercorelaie, durata de tranzit a apei prin zona de aerare i implicit vulnerabilitatea la poluare a acviferelor. *** Att pentru coeficientul de autocorelaie ct i pentru cel de intercorelaie seriile de timp sunt presupuse lineare i stationare. Dac aceste condiii nu sunt ndeplinite, evaluarea corelaiilor temporare presupune o preprocesare care s realizeze:
34
Daniel Scrdeanu
a ) linearizarea datelor (prin logaritmare, ridicare la putere, extragerea rdacinii de un ordin oarecare) sau separarea datelor ntr-un numr oarecare de subdomenii pe care s se comporte linear; b) eliminarea tendintelor neperiodice care mascheaz componentele ciclice ale seriilor de timp. Aceast operatiune se realizeaz prin identificarea modelului analitic al tendintei i eliminarea ei din datele brute. Evaluarea coeficienilor se opereaz asupra valorilor "reziduale" (M.Tertisco et.al., 1985).
35
Daniel Scrdeanu
identificrii factorilor principali care determin evolutia fenomenelor este obiectivul final al descrierii multivariate a proceselor ecologice. Unul din cele mai adaptate instrumente pentru soluionarea acestei probleme este analiza factorial. Analiza factorial a fost privit n general ca o metod misterioas de o mare complexitate. O parte din misterul care o nconjoar provine din bogata terminologie utilizat. Analiza factorial a fost dezvoltat de psihologii experimentalisti n anii 1930-1940 i mare parte din terminologie are semnificatie numai n contextul acestui domeniu. Obiectivul original al analizei factoriale a fost s dea un sistem corect de evaluare a inteligentei prin corelarea punctajelor obtinute din diferite teste relative la abilitatea mental. Este n general acceptat faptul c punctajul dintrun singur test nu poate da o msur real a inteligentei unei persoane. O persoan bine nzestrat intelectual va obine rezultate mai bune la majoritatea testelor de inteligent dect o persoan considerat inferioar mental. Diferentele la testele specifice nu reflect diferentele mentale ci de educatie, cultur general i circumstantiale, legate de condiiile n care se desfsoar testele. Psihologii au considerat analiza factorial capabil s extrag coeficientul corect de evaluare a inteligentei din rezultatele tuturor testelor chiar dac nici unul dintre aceste teste, individual, nu este capabil s o fac corect. Aplicat n cercetri biologice i geologice analiza factorial studiaz relatiile dintre un numr mare de variabile msurabile, cu scopul evidentierii unor noi variabile, teoretice, numite factori. Aceste noi variabile (=teoretice =factori) sunt ntr-un numr mai mic dect variabilele msurabile i sunt n acelai timp functii lineare de variabilele msurabile. Noile variabile sunt astfel stabilite nct s explice ntr-un procent ct mai mare varianta variabilelor originale. Se caut prin analiza factorial 36
Daniel Scrdeanu
gsirea unui numr ct mai mic de factori (=variabile teoretice) care s exprime variabilitatea observat pin intermediul valorilor msurate. Variabilitatea rezidual, rmas neexprimat este o pierdere de informatie compensat prin numrul redus de variabile teoretice cu care se opereaz n continuare pentru modelarea procesului studiat. Variabilele teoretice (=factorii) vor putea reflecta fenomene naturale care sunt la originea variabilittii observate i astfel se vor putea interpreta ntr-o optic naturalist rezultatele calculelor cantitative. Fundamentate pe aceleai principii, factorizarea corelaiilor sistemelor multivariate poate fi abordat prin trei variante ale analizei factoriale: analiza n componeni principali, analiza factorial R-MOD i analiza factorial QMOD. Separarea tipurilor de sedimente pe baza variabilittii compozitiei granulometrice i identificarea fractiunilor caracteristice diferitelor tipuri de sedimente pot fi realizate prin aplicarea analizei componentilor principali. Dac se studiaz un corp plutonic, pentru stabilirea numrului factorilor care condiioneaz distributia elementelor chimice i mineralelor se utilizeaz analiza factorial R-MOD. Gruparea taxonomic a unui lot de esantioane prelevate din diferite tipuri de roci (ex.: sienit, monzonit, diorit, quartit, gabrou, norit, diabaz) pe baza oxizilor continuti (ex.: SiO2, Al2O3, Fe2O3, FeO, MgO, CaO, Na2O, K2O) se poate realiza printr-o analiz factorial Q-MOD. Toate variantele analizei factoriale vor fi luate n studiu n acest capitol, punctul de plecare fiind obligatoriu analiza n componenti principali. Obiectivul operational al analizei factoriale este interpretarea structurii matricilor de varian-covarian pentru un ansamblu multivariat de date. Tehnica utilizat este extragerea valorilor proprii i a vectorilor proprii din aceste matrici care exprim sintetic ansamblul de relatii dintre variabilele msurate.
37
Daniel Scrdeanu
[A][X ] = [X ]
(III.258) care formal este similar cu
38
Daniel Scrdeanu
Pentru matrici [2X2], ecuaia matricial (III.260) poate fi scris sub forma sistemului:
( A11 )X 1 + A12 X 2 = 0 A21 X 1 + ( A22 )X 2 = 0
det A I = 0
(III.262) care prin dezvoltare devine ecuaia:
4 8 A= 8 4
iar matricea pentru calculul valorilor proprii
4 A= 8
8 4
Soluiile ecuaiei de gradul doi care rezult prin dezvoltarea determinantului sunt:
1 = 4 i 2 = 12
39
Daniel Scrdeanu
Punctele P1 i P2 pot fi imaginate ca fiind plasate pe conturul unei elipse al crei centru este plasat n centrul sistemului de referint. Elipsa este ca o anvelop care cuprinde ambele puncte iar valorile proprii pot fi interpretate ca semiaxele elipsei. Raportul axelor poate fi o expresie numeric a gradului de mprstiere a punctelor. Cu ct punctele sunt mai apropiate, lungimea axelor difer mai mult i elipsa tinde spre o dreapt. Dac cele dou puncte se afl pe doi vectori perpendiculari elipsa devine cerc. Ca exemplificare se calculeaz valorile proprii pentru matricile coordonatelor a dou puncte situate pe dou axe care fac un unghi de: a) 90o; b) 45o; c) 30o; d) 0o (Fig. 69).
P1 4 8 P ; a) 8 4 2 4 8 4 8
4 8 b) 8 4
6 8 c) 8 6
d)
a) 1 = 8,95 1 = 12 2 = 8,95
y O
b) 1 = 12
c) 1 = 14
d)
2 = 4
y P2(4;8) P1(8;4) O
2 = 2
y O P1(8;4) x O O P1(6;8) O
2 = 0
y O P(4;8)
P2(-4;8) O O
P2(8;6) x O;O x
Fig. 69 Semnificaia geometric a valorilor proprii i vectorilor proprii Ca regul de verificare a corectitudinii calculului valorilor proprii se retine c suma valorilor proprii este egal cu urma matricii initiale (suma valorilor de pe diagonala principal). Valorile proprii reprezint lungimile celor dou semiaxe ale elipsei pe care sunt plasate cele dou puncte sau, generaliznd, la "n" dimensiuni, "n" semiaxe ale elipsoidului care nglobeaz toate punctele ntr-un spatiu cu "n" dimensiuni.
40
Daniel Scrdeanu
proprii acestea sunt utilizate pentru calculul soluiei nebanale, se obin vectorii proprii ai matricii iniiale. Pentru matricea [2X2] dezvoltnd ecuaia (III.260) se obine:
A11 A 21 A12 X 1 0 = A22 X 2 0
(III.264) Vectorul
[X 1 , X 2 ]
=caracteristic latent =vector principal) asociat valorii proprii. Pentru a concluziona relativ la partea operational, trebuie mentionat c pentru a afla vectorii proprii i valorile proprii ale unei matrici [n n ] trebuie s-i gsim determinantul, rdcinile ecuaiei polinomiale caracteristice i s soluionm un set de n ecuaii cu n necunoscute. Aplicatie. Revenind pentru interpretare la matricea
4 8 A= 8 4
ecuaia de calcul pentru vectorul propriu al valorii proprii 1 = 12 este:
8 X 1 0 4 12 = 8 4 12 X 2 0
cu soluia
X 1 1 X = 1 2
Pentru ecuaie exist o infinitate de vectori proprii pentru c sistemul este satisfcut de
41
Daniel Scrdeanu
Revenind la figura 69, vectorii proprii pot fi interpretati ca pantele celor dou axe ale elipsei. Primul vector propriu defineste bisectoarea unghiului determinat de cele dou puncte i centrul elipsei i a crei lungime este egal cu prima valoare proprie ( 1 = 12 ), iar ce-l de-al doilea vector propriu definete axa ortogonal cu prima. De retinut c matricile simetrice au toate valori proprii reale iar vectorii proprii corespondenti sunt ortogonali.
3.2.2. Standardizarea
Analiza factorial este deseori confruntat cu interpretarea unei matrici de varian-covarian obtinut dintr-o colectie de caracteristici geologice exprimate n unitti de msur diferite. Valorile exprimate n unitti de msur diferite nu pot fi comparate direct necesitnd o transformare a datelor originale prin standardizare. Standardizarea se realizeaz prin extragerea din fiecare valoare original a valorii medii a variabilei i divizarea diferentei prin abaterea standard. Se obine astfel un nou set de valori cu media zero i dispersia unu . 42
Daniel Scrdeanu
Standardizarea permite compararea variabilelor exprimate n unitti de msur diferite, altfel spus permite compararea "merelor" cu "perele". Dac se opereaz cu matricea de corelaie a variabilelor studiate, cum este cazul n analiza factorial Q-MOD sau R-MOD, nu este necesar s se standardizeze valorile pentru c de fapt matricea de corelaie este matricea de varian-covarian a datelor standardizate. Standardizarea poate avea o influent determinant asupra structurii matricii de variant-covariant i n consecint asupra rezultatelor analizei factoriale dac amplitudinile de selectie ale variabilelor difer semnificativ i distributiile sunt puternic asimetrice. Cnd unittile de msur nu difer se recomand din acest evitarea standardizrii. Pentru ilustrarea efectului standardizrii s considerm reprezentrile grafice ale datelor brute (Fig. 70) i ale celor standardizate (Fig. 71) pentru care au fost calculate separat matricile de covariant, valorile proprii i vectorii proprii. Efectul standardizrii este extinderea ambelor variabile pe acelai interval valoric cu modificarea raportului de mprstiere a valorilor pe cele dou axe i rotirea axelor principale cu 45o (cu 45o pentru toate matricile binare i cu valori diferite n cazul matricilor mai mari). De asemenea, se remarc o reducere slab a variantei de-a lungul primului vector propriu (de la 96% la 93%), reducere care se accentueaz proportional cu diferenta dintre domeniile de variatie ale variabilelor originale.
Tabelul III.32 Elementele de standardizare Valori nestandardizate Valori standardizate MEDIA m( X 1 ) = 5 m( XS1 ) = 0 m( X 2 ) = 10 m( XS 2 ) = 0 VARIANA 2 s ( X 1 ) = 6,08 s 2 ( XS1 ) = 1 s 2 ( X 2 ) = 27,54 s 2 ( XS 2 ) = 1 MATRICE DE COVARIAN MATRICE DE CORELAIE 6,08 11,08 1,00 0,86 cov = R= 11,08 27,54 0,86 1,00 43
Daniel Scrdeanu
VECTORI PROPRII
15
1
-2
-1 1 -1
-2
10
0 0
10
15
20
a) Metodologia de lucru
44
Daniel Scrdeanu
Presupunnd c dispunem de o colectie de 25 de exemplare de brahiopode i msurm pentru fiecare exemplar lungimea X 1 i ltimea X 2 (tabelul III.32) matricea de varian-covarian obinut prin calcul este
Tabelul
III.32
Elemente
ale
analizei DATELE
VALORILE FACTORIZATE
Y1 Y2
ORDONATE
X1 X2
3 4 6 6 6 7 7 8 9 9 9 10
2 10 5 8 10 2 13 9 5 8 14 7
3.49 10.14 7.72 9.97 11.46 6.14 14.37 12.04 9.71 11.96 16.45 11.87
0.92 -3.64 1.18 -0.81 -2.14 3.91 -3.38 3.32 3.42 1.43 -2.45 2.84
3 4 6 6 6 7 7 8 9 9 9 10
2 2 5 5 6 7 7 8 8 9 10 10
45
Modele cantitative statistice 13 14 15 16 17 18 19 20 21 22 23 24 25 11 12 12 13 13 13 13 14 15 17 17 18 20 12 10 11 16 14 15 17 7 13 13 17 19 20 16.28 15.44 16.19 13.11 19.1 19.85 21.35 14.52 19.68 21 24 26.16 28.23 0.28 2.35 1.69 5.75 0.45 -0.22 -1.54 5.84 2.6 4.1 1.45 0.87 1.7 11 12 12 13 13 13 13 14 15 17 17 18 20
Daniel Scrdeanu 10 11 12 13 13 13 14 14 15 17 17 19 20
Se poate defini variana total a setului de date ca sum a varianelor individuale i deoarece valorile acestor variane se afl pe diagonala principal a matricii de varian-covarian ea va fi numeric egal cu urma acestei matrici i implicit cu suma valorilor proprii ale matricii: Variana total = 20,3 + 24,1 = 44,4
46
Daniel Scrdeanu
20
Cov X1
Var X2
Var X1 0 10 20 30
Fig. 74 Elipsa definit de variana i covariana datelor din tabelul III.32 La aceast varian total variabila X 1 contribuie cu 20,3/44,4 = 46% iar X 1 cu 24,1/44,4 = 54%. Variana total fiind egal cu suma valorilor proprii ale matricii de varian-covarian rezult c axele elipsei ce nglobeaz toate perechile ( X i , Yi ) reprezint variana total, iar fiecare ax exprim o anumit parte din ea. Pentru matricea utilizat, axa principal reprezint 37,9/44,4 = 86% din variana total n timp ce a doua ax, corespunztoare celei de-a doua valori proprii ( 2 = 6,5 ) 6,5/44,4 = 14%. Astfel spus, dac msurm variana setului de date de-a lungul primei axe principale putem reprezenta 86% din totalul varianei totale. Este evident 47
Cov X2
10
Daniel Scrdeanu
c cel putin una din axele principale va fi mai eficient n exprimarea varianei dect oricare din axele originale i implicit, printre celelalte axe principale se va gsi una mai puin eficient dect oricare din axele originale. Dac se realizeaz transformrile liniare de forma:
Y1 (i ) = V11 X 1 (i ) + V12 X 2 (i )Y2 (i ) = V21 X 1 (i ) + V22 X 2 (i )
n care V11 ,V12 ,V21 ,V22 sunt elementele celor doi vectori proprii, se creaz dou noi variabile factorizate: Y1 care reprezint 37,9/44,4 = 86% i Y2 numai
6,5/44,4 = 14% din variana total (Tabelul III.32) Deoarece noile variabile proprii Y1 i Y2 sunt msurate de-a lungul celor doi vectori, ortogonali, corelaia dintre ele va fi zero. Componentele vectorilor proprii ( V11 ,V12 ,V21 ,V22 ), coeficienii numerici ai ecuaiilor liniare de generare a noilor variabile sunt ponderile fiecrei variabile pe un anumit factor (ex.: V11 este ponderea variabilei X 1 pe "factorul" Y1 ). Dac este obligatoriu din considerente de eficient a prelucrrii datelor s reducem sistemul nostru la numai o variabil: dac renuntm la una din variabilele originale X 1 sau X 2 pierdem 46% sau 56% din variana total. Dac convertim variabilele originale prin proiectarea pe axele componentilor principali, opernd cu Y1 pstrm 86% din variana total pierznd doar 14%.
Eficiena repartizrii varianei totale pe un numr de factori mai mic dect cel al variabilelor originale este determinat de intensitatea corelaiei dintre ele. Pentru exemplificare, n setul de date brute se realizeaz o ordonare i o randomizare a valorilor (Tabelul III.32). Se obin dou noi serii de 20 de perechi de valori fiecare cu aceeai varian dar cu covariane diferite.
48
Daniel Scrdeanu
Reprezentrile grafice ale celor dou serii de valori ilustreaz n raport cu seria iniial a valorilor cresterea corelaiei n cazul ordonrii i reducerea ei n cazul randomizrii (Fig. 75 i 76).
i pentru cele dou noi seturi de date conduc la urmtoarele rezultate: VALORI ORDONATE VALORI RANDOMIZATE
1 = 44,2(99% ) 2 = 0,2(1% )
VECTORI PROPRII
V1 = [0,68;0,74] V2 = [0,74;0,68]
1 = 24,3(54,7% ) 2 = 20,1(45,3% )
V1 = [ 0,22;0,98] V2 = [0,98;0,22]
49
Daniel Scrdeanu
Reprezentrile grafice sunt sugestive pentru ilustrarea eficientei cu care componentii principali pot exprima variana n cele dou cazuri (fig. 77 i
30 20 10
X2 Vector 1 I
30
II
10 20 30
X1
30
Vector 2
n cazul valorilor ordonate (Fig. 77), axa principal poate exprima 99% din variana total, cea de-a doua fiind asa de scurt nct practic este imposibil de reprezentat grafic. Dac renuntm la ceast a doua component pierderea de varian a datelor originale este foarte mic. Se poate reduce deci dimensionalitatea setului de date originale de la doi la unu prin proiectarea pe prima ax principal cu o pierdere de varian total de 1%, utiliznd relaia: Y1 (i ) = V11 X 1 (i ) + V12 X 2 (i ) . In cazul valorilor randomizate (Fig. 78), cele dou valori proprii sunt practic identice, elipsa devenind cerc. Nici una din axele principale, n aceste condiii, nu va capta mai bine variana total n comparatie cu variabilele originale. n aceast situatie A.C.P. nu i gseste utilitatea i factorizarea corelaiei nu i are obiect, corelaia lipsind ntre variabile.
c) Aplicatie
50
Daniel Scrdeanu
Aplicarea analizei n componenti principali este exemplificat prin separarea tipurilor de sedimente pe baza analizelor granulometrice realizate pe 50 de probe recoltate din cinci domenii distincte (I, II, II, IV, V) pentru care s-au determinat apte fractiuni granulometrice ( x1 , x2 , x3 , x4 , x5 , x6 , x7 ). Calculul matricii de varian-covariant se face pe date originale, nestandardizate deoarece toate sunt msurate n aceleai unitti de msur. Deoarece matricea de covariant este supradeterminat (suma tuturor fractiunilor granulometrice este 100), una din valorile proprii teoretic trebuie s fie nul. Practic ea va fi foarte mic i nu nul deoarece nu n toate probele suma fractiunilor componente dau 100 din cauza erorilor de determinare. Tabelul III.33 Matricea de varian-covarian a celor 7 fraciuni
x1 x1 x2 x2
x3
x4
x5
x6
x7
4,8443 -2,6234 -0,0011 -1,5449 -0,5972 -0,3805 -0,0222 468,848 81,3941 -200,2109 -84,2597 -71,2097 -57,8578 353,1255 -84,6165 -73,0435 -65,5433 -56,1533 130,2741 44,7616 34,9927 23,9136 30,4350 23,7565 19,3907 22,4189 17,967
x3
x4
x5 x6 x7
Tabelul III.34 Valorile proprii ale matricii de variancovarian Vector I II III IV V VI Valoare proprie 659,7759 318,4384 35,1959 6,7528 3,8193 2,3763 Varian total Varian total cumulat % 64,18 30,98 3,42 0,66 0,37 0,23 64,19 95,17 98,59 99,25 99,62 99,85
51
x3
x4
x5 x6 x7
Pe baza elementelor calculate n tabelele III.33, III.34, III.35 se deduc elemetele necesare interpretrii. Primii doi componeni principali acumuleaz 95,17% din variana total, ncrcarea principal aparinnd fraciunii fine i foarte fine (factorul I: ( x2 ), ( x3 ) i ( x4 ); factorul II: ( x2 ) i ( x3 )). Diferena dintre cele cinci medii de sedimentare poate fi complet descris prin numai doi factori principali. Prin reprezentarea variabilelor transformate n sistemul de referin al factorilor I i II separarea lor este evident (Fig. 79).
52
Daniel Scrdeanu
10
-10
-20
II
-30
-40
-50
-60
-70 -70
-50
-30
-10
10
30
YI (i ) = 0,0019 X 1 (i ) + 0,7710 X 2 (i ) + 0,4167 X 3 (i ) 0,3907 X 4 (i ) 0,1895 X 5 (i ) 0,1618 X 6 (i ) 0,1308 X 7 (i ) 2)pentru factorul II:
YII (i ) = 0,0039 X 1 (i ) 0,4777 X 2 (i ) + 0,8647 X 3 (i ) + 0,0761X 4 (i ) 0,0794 X 5 (i ) 0,0813 X 6 (i ) 0,0735 X 7 (i )
2,25 2,0 1,75 1,50 1,25 1,0 0,75 0,5 0,25 3 4 5 6 7
Eficiena
celor
doi
factori poate fi comparat cu puterea de separare a tipurilor de sedimente pe baza medianei i gradului de sortare (Fig. 80) sau a procentajului de nisip i raportului dintre nisip fin i nisip foarte fin (Fig. 81). Fiecare din aceste diagrame sunt aproximativ
53
Daniel Scrdeanu
Avantajul A.C.P este implicat de faptul c din analiza ncrcrilor factorilor pentru fiecare variabil se poate concluziona c sedimentele analizate pot fi considerate o mixtur de material nisipos i silt argilos. Aceast observatie sugereaz nu numai un alt mod de a privi sedimentele dar indic i o posibilitate de reducere a fractiunilor granulometrice la trei, suficiente pentru a permite separarea clar a celor cinci tipuri de sedimente.
poate fi utilizat n acest eficientei separarea sedimente statistici sortare). relative tipurilor i (ex.: a
Fig. 81 Separarea tipurilor de sedimente funcie de coninutul n nisip (OX) i raportul nisip fin/nisip foarte fin (OY)
54
Daniel Scrdeanu
n analiza factorial R-MOD (R este simbolul matematic al matricii de corelaie) relatiile dintre m variabile msurabile sunt privite ca o reflectare a corelaiei acestora cu p factori necorelai. Presupunerea uzual este c
p < m.
Rezult c variana total are dou componente: una determinat de
X j = l jr f r + j
r =1
(III.264) n care:
f r - factorul comun;
55
Daniel Scrdeanu
cov jk = l jr lkr
r =1
(III.266) Dac notm matricea varian-covarian cu s 2 , cu L matricea [m p ] a ncrcrilor factoriale i cu var( j ) matricea diagonal [m m] cu variantele aleatoare specifice fiecrei variabile, avem relaia:
pozitive i cu vectorii proprii asociai. Dac p = m , matricea var( j ) = 0 i problema este echivalent cu Analiza n Componeni Principali. Analiza Factorial cere ca numrul de factori s fie mai mic dect numrul de variabile i s fie cunoscut nainte de nceperea analizei. Acest lucru presupune deinerea unor informaii suplimentare fa de datele numerice ce vor fi prelucrate i din care s rezulte numrul de factori ce trebuie extrai. Dac p nu este cunoscut, mprtirea variantei ntre factorii comuni i factorii specifici poate fi rezolvat ntr-un numr practic nelimitat de variante.
Calculul valorilor proprii i vectorilor proprii n analiza factorial R-MOD se face plecnd de la matricea de corelaie. Acest lucru implic transformarea componentelor principale ale vectorilor n factori. Vectorii proprii obtinuti din matricea de corelaie sunt normalizati (adic suma ponderilor este unitar) i pentru a putea realiza analiza factorial trebuie convertit valorea unitar a vectorului ntr-o valoare a crei lungime s reprezinte valoarea proprie corespunztoare. Acest lucru se face prin multiplicarea fiecrei componente a vectorului propriu normalizat cu rdcina
56
Daniel Scrdeanu
ptrat a valorii proprii corespunztoare. Rezultatul este un factor, adic un vector care este ponderat proportional cu mrimea varianei totale pe care o reprezint. Pentru matricea de corelaie:
0,707 1,86 0,964 FACTOR1 = = 0 , 707 1 , 86 0,964 0,707 0,14 0,264 FACTOR 2 = = 0 , 707 0 , 14 0,264
Verificarea corectitudinii convertirii vectorilor proprii standardizati n factori se face prin nsumarea ptratelor ponderilor factoriale care trebuie s fie egale cu valorile proprii: 0,9642 + 0,9642 = 1,86 Primul factor reprezint i (-0,264) 2 + 0,2642 = 0,14 1,86/2,00=93% din variana total a
variabilelor originale. Din aceast varian 0,9642/1,86=50% este ponderea variabilei 1 i 0,9642/1,86=50% este ponderea variabilei 2. Al doilea factor reprezint 0,14/2,0=7% din variana total a datelor cu (-0,264)2/0,14=50% pentru a doua. Cei doi factori redau 100% din variana total iar scrierea matricial utilizat pentru exprimarea ponderilor factoriale este: FACTORI 57 pondere pentru prima variabil i 0,2642/0,14=50%
Daniel Scrdeanu
Prin nsumarea ptratelor ponderilor factoriale pentru fiecare variabil se obine mrimea total a varianei retinut de factori care poart numele de comunalitate. Pentru matricea [2 2] luat ca exemplu, comunalittile pentru ambele variabile sunt unitare: Variabila 1: h 21 = (0,964) + ( 0,264) = 1
2 2
Dac numrul factorilor extrai coincide cu numrul variabilelor, comunalittile sunt egale cu variana original i pentru c se lucreaz cu variabile standardizate ea va fi egal cu unitatea. Dac se extrag mai putin de m factori ( m = nr. variabile) comunalittile vor fi subunitare i vor fi un coeficient al eficientei setului de factori relativ la exprimarea varianei setului original de date. Spre exemplu, dac se retine numai primul factor comunalittile matricii factorilor sunt:
Problema alegerii factorilor nu are soluie unic fiind o problem de optiune: a) psihologii experimentalisti extrag attia factori ct cere teoria accceptat pentru studiul esantonului de date; b) se extrag attia factori ct pot fi reprezentati grafic (2 sau 3); c) se extrag toti factorii proprii care au valori proprii mai mari ca 1, adic factorii care contin variane mai mari dect cele ale variabilelor standardizate. 58
Daniel Scrdeanu
Dac pentru retinerea unei mari prti din variana total a sistemului este nevoie de multi factori, modelul analizei factoriale se consider neadecvat analizei esantionului de date disponibil.
c) Aplicatii
Un exemplu clasic pentru aplicarea analizei factoriale R-MOD este separarea a 25 prisme rectangulare (Tabelul III.35) dup form i mrime (cei doi factori) pe baza unui numr de 7 variabile: X1 = axa lung; X2 = axa intermediar; X3 = axa scurt; X4 = cea mai lung diagonal; X5 = (raza sferei circumscrise)/(raza sferei nscrise) X6 = (axa lung +axa intermediar)/(axa scurt) X7 = (aria total/volumul) n tabelele III.35b i III.36 sunt prezentate matricea de corelaie, valorile proprii i matricea vectorilor proprii, pentru prelucrare i interpretare fiind retinuti doar primii doi factori (corespunztori formei i mrimii) pentru care valorile proprii corespunztoare sunt supraunitare. Etapele de prelucrare ale cror rezultate intermediare sunt sintetizate n tabelele III.35, 36 i 37 sunt: Tabelul III.35 Dimensiunile a 25 de prisme generate aleator Nr.crt. 1 2 3 4 5 X1 3,760 9,840 8,390 4,940 7,230 X2 3,660 9,270 4,920 4,380 2,300 X3 0,540 1,510 2,540 1,030 1,770 X4 5,275 13,604 10,053 6,678 7,790 X5 9,768 9,017 3,956 6,494 4,393 X6 13,741 12,668 5,237 9,059 5,374 X7 4,782 1,745 1,432 2,807 2,274
59
Modele cantitative statistice 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 9,460 9,550 4,940 8,210 9,410 5,900 1,660 5,510 4,690 7,120 8,590 9,730 9,640 8,740 3,270 5,510 9,030 7,570 6,220 8,590 7,310 5,350 4,520 3,080 6,440 5,760 1,610 1,340 3,010 5,490 2,980 1,330 9,490 7,000 0,620 3,980 7,080 7,280 6,140 4,990 1,040 4,250 4,500 2,420 5,110 1,550 1,570 1,270 2,170 3,680 1,170 1,000 1,030 3,310 0,440 1,300 2,590 7,070 4,520 1,340 11,999 11,742 8,067 9,097 12,495 8,388 2,799 5,808 5,983 9,716 9,170 9,871 13,567 11,675 3,357 6,924 11,762 12,662 9,842 10,022 11,579 2,766 1,793 3,753 2,446 5,395 1,783 4,566 2,760 2,642 7,851 9,871 13,133 3,529 7,629 5,326 4,539 1,791 2,175 7,500
Daniel Scrdeanu 16,182 3,509 2,103 4,657 3,103 7,497 2,087 5,382 3,554 3,430 9,909 11,064 18,519 4,757 8,838 7,304 6,217 2,101 2,732 10,162 2,415 1,054 1,292 1,719 0,914 1,973 3,716 3,427 2,013 1,189 2,616 3,704 2,354 1,119 8,389 2,403 1,276 0,822 1,089 2,130
Tabelul III.35b Matricea de corelaie Variabilele X1 X2 X3 X4 X5 X6 X7 X1 1,000 0,580 0,201 0,911 0,283 0,287 -0,533 1,000 0,364 0,834 0,166 0,261 -0,609 1,000 0,439 -0,704 -0,681 -0,649 1,000 0,163 0,202 -0,676 1,000 0,990 0,427 1,000 0,357 1,000 X2 X3 X4 X5 X6 X7
60
Modele cantitative statistice Vector I II III IV V VI VII Valoare proprie 3,3946 2,805 0,4373 0,2779 0,0810 0,0034 0,0003 Varian total 48,4949 40,0783 6,2473 3,9707 1,1565 0,0487 0,0037
Daniel Scrdeanu Var.cumulat [%] 48,4949 88,5731 94,8204 98,7911 99,9476 99,9963 100,0000
Tabelul III.37 Vectorii proprii Variabile X1 X2 X3 X4 X5 X6 X7 1. I 0,4053 0,4316 0,3854 0,4939 -0,1277 -0,0968 -0,4809 II -0,2224 0,3559 -0,5751 -0,5800 -0,1303 III 0,6980 0,1477 0,0294 0,1743 0,0176 IV 0,0888 -0,0338 0,6276 0,2103 0,1108 -0,0061 0,7353 V -0,2267 -0,4366 0,5121 -0,1054 0,3890 0,3549 -0,4553 VI 0,4098 0,1443 0,1875 -0,5878 0,5003 0,0332 VII -0,2782 -0,2540 -0,1081 0,5359 0,4975 0,0489 ponderilor -0,2929 -0,6674
-0,2323 -0,1186
-0,4232 -0,5562
Calculul
ponderilor X1
factorilor X2 X3
comuni X4
prin X5
multiplicarea X6 X7
[L]T
FactI 0,747 0,795 0,710 0,910 0,235 0,178 0,886 = 0,971 0,218 FactII 0,491 0,373 0,596 0,389 0,963
2. Calculul comunalitilor prin nsumarea ptratelor ponderilor factoriale pentru fiecare variabil prin luarea n considerare a primilor doi factori conduce la:
61
Daniel Scrdeanu
0,747 2 + 0,4912 0,798 X 1 X 2 0,771 2 2 0,795 + 0,373 0,710 2 + ( 0,596 )2 0,860 X 3 2 2 2 H = 0,910 + 0,389 = 0,979 pentru X 4 ( 0,235)2 + 0,9632 0,983 X 5 2 2 ( 0,178) + 0,971 0,976 X 6 2 ( 0,886 ) + 0,2182 0,833 X 7
Dac sunt retinuti m factori dintr-un set de m variabile matricea de covarian original s 2 poate fi generat prin multiplicarea tuturor perechilor de ponderi factoriale i nsumarea acestora pentru toti factorii. Cnd p < m matricea original nu poate fi reprodus exact. Pentru variabilele j i k covariana reproductibil este dat de relaia:
s2 jk = l j1 lk 1 + l j 2 lk 2 + ... + l jp lkp
[ ]
(III.268) n care l j1 este ncrcarea variabilei j pe factorul 1. Notnd cu L matricea ncrcrilor factoriale rezult c matricea reproductibil pe baza celor p factori se poate calcula prin:
[s ] = [L] [L]
'2
62
Daniel Scrdeanu
[s ] [L] [L] = [s
2
T
rezidual
(III.269) Analiza factorial este aplicat cu eficient n separarea faciesurilor calcaroase. Toomey (1966) a determinat pentru calcarele de Leavenworth (Pensilvanian superior =Carbonifer superior) din nordul regiunii Midcontinet 19 tipuri de constituenti petrografici: calcit spatic, micrit, pellete, trilobiti, ostracode, fusulinide, moluste, brachiopode, mobile, spiculi de spongieri, ncrustate, echinoderme, Tubiphytes, foraminifere foraminifere
Epimastopore, alge cu structur laminar, granule cu nvelis algal i particule de schelete necunoscute. Datele au fost determinate n 33 de probe i pe baza lor au fost delimitate cinci grupuri bine individualizate: grupul fusulinide calcit, grupul micrit, grupul foraminifere mici, grupul cochilii-briozoare i grupul granulelor cu nvelis algal, din care primele patru formeaz un cluster cu coeziunea intern mai mare. Analiza factorial R-MOD poate fi utilizat pentru separarea cu eficient maxim i total obiectivitate a tipurilor de crbune pe baza parametrilor fizico-chimici care se determin n mod clasic: grosime, greutate specific, cenus, umiditate, substante volatile, sulf, continut n carbon, putere calorific etc.
63
Daniel Scrdeanu
Deoarece avem nevoie numai de p axe factoriale, dup eliminarea axelor inutile pare posibil i avantajos s rotim axele factoriale pentru a gsi o pozitie care s maximizeze variana ncrcrilor factoriale. Metoda KAISER-VARIMAX are ca obiectiv rotirea fiecrei axe n pozitia n care proiectia fiecrei variabile s se plaseze n vecintatea extremittii sau originii sistemului de axe factoriale. Metoda opereaz prin ajustarea ncrcrilor factoriale astfel nct ele s fie ori aproape de 1 , ori aproape de zero. n acest mod pentru fiecare factor vor fi cteva ponderi semnificative iar restul aproximativ nule. Totui, n unele cazuri, rotirea rigid a axelor prin pstrarea ortogonalittii nu va mbuntti sau chiar poate conduce la rezultate confuze. Aceste situatii pot indica o corelare a factorilor (factori oblici) sau neadecvarea modelului factorial pentru analiza sistemului. Criteriul VARIMAX implic maximizarea varianei ncrcrilor factoriale. Se poate defini variana ncrcrilor pe factorul k sub forma:
l2 m l2 jp p j =1 jp 2 2 h j =1 h j j sk2 = p2
m
V = sk2
k =1
(III.271) Variana este calculat din ncrcrile factoriale l jp care sunt corectate prin divizarea lor cu comunalitatile h 2 j , astfel nct numai partea comun a varianei fiecrei variabile este luat n considerare ndeprtnd constrngerile impuse de cele m p componente (necesare pentru luarea n considerare a ntregii variane a sistemului). Maximizarea varianei implic mrirea domeniului ncrcrilor care conduce la "extremizarea" ponderilor.
64
Daniel Scrdeanu
Rotatia factorilor se face iterativ. Dou axe sunt ajustate simultan considernd restul axelor stationare. Dup ce toate axele au fost ajustate procesul este reiterat pn cnd cresterea varianei ncrcrilor la fiecare iteratie rmne sub o anumita valoare. Aplicatie. Rotatia axelor cu metoda Varimax. Considerm cazul ponderilor factoriale pentru cei doi factori utilizati n separarea prismelor (notate cu 1,2,...) pe baza formei i mrimii. Dup rotatie, pozitia relativ a variabilelor nu se schimb ci numai raportul fa de axele factoriale. Lungimea vectorilor este functie de proportia i variana original a fiecarei variabile preluat de axele factoriale. n
56
1,0
1,0
1 2
56
II
0,5
7
II
4 7
0,5
1 24
-1,0
-0,5 -0,5
0,5
1,0
-1,0
-0,5 -0,5
0,5
1,0
-1,0
-1,0
Fig. 82 ncrcrile factoriale nainte de Fig. 83 ncrcrile factoriale dup rotirea axelor rotirea axelor exemplul prezentat, cei doi factori prelund 88,59% din variana sistemului, lungimea vectorilor de pozitie este aproape unitar. Reprezentarea grafic a proieciilor factoriale (rotite sau nerotite) este mult mai complicat dect proiectarea pe axele componenilor principali. Componenii principali sunt transformri liniare i deci putem proiecta datele originale pe axele principale. n analiza factorial proiectiile datelor originale (=variabile msurabile) pe axele factoriale reprezint estimrile contributiilor diferitilor factori asupra fiecrei observatie (=proba n care se execut determinarea celor m
65
Daniel Scrdeanu
variabile). Deoarece factorii nii sunt estimai din aceleai date, calculul proiectiilor factoriale este un proces circular, iar rezultatele nu sunt unice. Calculul proieciilor factoriale este esenial pentru studiile geologice. Pentru explicitarea modului de calcul ne vom referi la setul iniial de date [ X ] care este o matrice [m n] ( m - numr variabile; n - numr de probe). n cazul ACP se poate calcula o matrice a proieciilor factoriale [F ] prin multiplicarea matricii de date [ X ] cu matricea ncrcrilor factoriale [L ] :
[X ] [L] = [F ]
Dac reinem p factori, matricea ncrcrilor matricea proiectiilor va fi [n p ] .
(III.272)
[L]
va fi [m p ] , iar
Se tie c variabilele originale nu reprezint numai efectul factorilor comuni dar au i o component specific ( j ) . Matricea proieciilor calculat n acest mod va reflecta parial structura covarianei datelor originale, n msura n care factorii preiau aceast covarian. Influenta variatiei specifice ( j ) trebuie eliminat pentru realizarea proieciilor factoriale. Acest lucru se realizeaz prin multiplicarea ecuaiei (III.273) cu inversul matricii de covarian:
[X ] [s 2 ]1 [L] = [F ']
(III.273)
Deoarece inversarea matricii de covarian este laborioas calculul nu se realizeaz direct din aceast ecuaie. Se calculeaz n primul rnd matricea [s ] prin nmultirea matricii ncrcrilor factoriale cu transpusa ei:
[L]T [L] = [S ]
(III.274) Matricea obtinut se inverseaz i se multiplic cu [L ] obtinndu-se matricea coeficienilor proiectiilor factoriale [B ] :
[L] [S ]1 = [B]
(III.275)
66
Daniel Scrdeanu
[X ] [B ] = [F ']
(III.276) Sintetiznd n termenii matricilor ncarcrilor factoriale, operaia se poate scrie:
[X ] [B ] = [F ']
(III.277)
[X ] [L] [S ]1 = [F ']
(III.278)
= [F ']
Aceeai procedur este utilizat pentru a obine proieciile factoriale n cazul axelor rotite sau nerotite. De retinut c matricea [ X ] contine variabilele standardizate i nu pe cele initiale din selectia de valori ca n A.C.P., deoarece A.C.P. calculeaz ncrcrile componentilor principali plecnd de la matricea de varian-covarian n timp ce ncrcrile factoriale se calculeaz plecnd de la matricea de corelaie. Problema specificrii numrului de factori p care trebuie retinuti este critic. Numrul lor afecteaz mrimea matricii reproduse i reziduale, comunalittile i ncrcrile factoriale specifice ( j ). ncrcrile factoriale comune nu sunt afectate. Astfel, dac p = 2 i factorii sunt extrai din datele originale, ncrcrile pe factorii I i II nu sunt modificate dac se extrage i un al treilea factor. Totui, dac extragem i rotim doi factori, ponderile factoriale pot fi radical diferite de cele obtinute dac extragem i rotim trei factori din setul de date. Cnd sunt extrai doi factori ei nu introduc constrngeri la rotatie ca atunci cnd sunt extrai trei. Metoda Varimax pstreaz orogonalitatea factorilor. Exist metode de rotatie a axelor factoriale care nu pstrez ortogonalitatea, conducnd la rezultate mai uor de prelucrat deoarece se pot obine mai multe ponderi factoriale extreme. Din punct de vedere interpretativ apar contradicii cu principiile metodei care presupune c factorii comuni sunt
67
Daniel Scrdeanu
necorelai, adic ortogonali. Renunnd la restricia ortogonalitii se admite intercorelaia dintre factori. Dac factorii sunt corelai ntre ei, relatiile ntre variabilele originale i factorii identificati sunt mult mai complexe dect n modelul adoptat deoarece interactiunile sunt att ntre perechile de variabile ct i ntre perechile de factori. Prezenta corelaiilor ntre factori conduce la ideea c exist alti SUPERFACTORI independenti care actioneaz asupra variabilelor msurate i factorilor comuni separai la primul nivel. Soluiile de rotatie oblic introduc mai mult subiectivitate n interpretare i trebuie abordate cu mult atenie.
[n n]
determinarea diferitelor m caracteristici geologice, calitative sau cantitative. Msura similaritii poate fi oricare dintre coeficienii de similaritate definii in capitolul III.2. cu valori cuprinse n intervalul [ 1,+1]. Cel mai utilizat coeficient de similaritate n analiza Q-MOD este coeficientul cosinus . Analiza hiperelipsoid n-dimensional care este definit prin corelaiile dintre cei n vectori care factorial Q-MOD are ca obiectiv identificarea unui
68
Daniel Scrdeanu
reprezint cele n probe. Fiecare vector este determinat prin cele m variabile care au fost msurate n fiecare prob i din acest motiv dimensionalitatea problemei nu depeste numrul variabilelor ( m ). Al doilea pas este identificarea principalelor axe ale hiperelipsoidului prin extragerea valorilor i vectorilor proprii. Deoarece vor fi reinute, de fiecare dat, mai puini factori dect numrul probelor, nu este necesar extragerea tuturor valorilor i vectorilor proprii, acest lucru reducnd mult din timpul de calcul. n al treilea pas se realizeaz maximizarea ncrcrilor factoriale prin rotaia axelor factoriale. Rotaia axelor se poate face pn ce fiecare factor coincide cu una din probele ce alctuiesc selecia de date. Pe lng tehnicile ce pstreaz ortogonalitatea axelor factoriale dup rotaie, analiza factorial Q-MOD apeleaz i la rotaia ce conduce la oblicitatea axelor factoriale cu implicaiile semnalate n paragraful anterior. Aplicaie. Ca un exemplu al aplicrii analizei Q-MOD, prezentm n continuare o analiz petrografic. Tabelul II.37 conine componenii chimici majori a 20 de eantioane (1-Sienit, 2-Sienit, 3-Sienit, 4-Monzonit, 5-Diorit, 6Diorit, 7-Diorit, 8-Diorit cuaritic, 9-Gabrou, 10-Gabrou, 11-Norit, 12-Norit, 13Gabrou cu hipersten, 14-Gabrou cu hipersten, 15-Sienit, 16-Sienit cuaritic, 17-Sienit alterat, 18-Monzonit, 19-Monzonit, 20-Diabaz). Prin analiza Q-MOD se urmrete plasarea ficrei probe n poziia proprie a seriei difereniate de roci magmatice. Plasarea probelor n succesiunea fireasc, determinat de compoziia chimic, se realizeaz prin utilizarea ncrcrilor factoriale ce exprim variana ansamblului petrografic probat. Deoarece valorile vor fi standardizate, vectorii definii vor avea lungimi unitare i probele vor fi plasate pe circumferina unui cerc cu raz unitar. Unghiurile dintre aceti vectori sunt o msur a similaritii dintre probe. Pentru evaluarea matricii de similaritate, ca rezultat al primei etape de prelucrare se utilizeaz coeficientul de cos , rezultatul fiind consemnat n tabelul III.38 (ANEXA 1).
69
Daniel Scrdeanu
Identificarea axelor este limitat la primii doi factori care asigur n etapa final o reprezentare grafic simpl. ncrcrile factoriale pentru fiecare prob sunt sintetizate n tabelul III.39. Tabelul III.39 ncrcrile factoriale pentru primii doi factori (I i II) Proba 1 2 3 4 5 6 7 8 9 10 I 0,9948 0,9918 0,9958 0,9989 0,9963 0,9904 0,9959 0,9996 0,9983 0,9978 II -0,0910 -0,1223 -0,0587 -0,0126 -0,0191 0,1188 -0,0838 0,0010 0,0204 0,0223 Proba 11 12 13 14 15 16 17 18 19 20 I 0,9833 0,9890 0,9721 0,9561 0,9918 0,9844 0,9866 0,9950 0,9945 0,9981 II 0,1202 0,1259 0,1719 0,02323 -0,1257 -0,1665 0,0783 -0,0870 -0,0946 -0,0161
Rotirea axelor prin metoda Varimax maximizeaz variana ncrcrilor factoriale (Tabel III.40) care permit reprezentarea grafic cea mai sugestiv a gruprii celor 20 de probe funcie de afinitile lor chimice (Fig. 84). Tabelul III.40 ncrcrile factoriale dup rotaie (pentru factorii I i II) Proba 1 2 3 4 5 6 7 8 9 10 I 0,7851 0,8044 0,7636 0,7342 0,7368 0,6377 0,7809 0,7254 0,7111 0,7094 II 0,6177 0,5959 0,6418 0,6774 0,6709 0,7671 0,6236 0,6878 0,7009 0,7020
h2
0,9980 0,9986 0,9950 0,9980 0,9929 0,9950 0,9988 0,9993 0,9970 0,9960
Proba 11 12 13 14 15 16 17 18 19 20
I 0,6316 0,6319 0,5879 0,5348 0,8068 0,8295 0,6628 0,7825 0,7873 0,7360
II 0,7632 0,7712 0,7930 0,8259 0,5904 0,5556 0,7350 0,6207 0,6148 0,6744
h2
0,9814 0,9940 0,9745 0,9681 0,9995 0,9968 0,9796 0,9976 0,9979 0,9965
70
Daniel Scrdeanu
n final trebuie remarcat c analiza factorial Q-MOD are acelai obiectiv ca orice analiz a gruprilor ns cu o eficien mai mare datorat reducerii timpului de calcul, n condiiile n care se apeleaz la mijloacele automate. Eficiena metodei este sporit i de faptul c ea este aplicabil i n condiiile n care matricea de similaritate conine i coeficieni negativi, caz n care analiza factorial R-MOD nu este utilizabil. Tabel III.37 Principalii oxizi din 20 de eantioane recoltate dintr-o serie magmatic Nr. prob 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X1=SiO2 X2=Al2O3 X3=Fe2O3 X4=FeO X5=MgO X6=CaO X7=Na2O X8=K2O 61,7 58,3 51,2 54,4 58,0 46,6 58,0 55,5 55,4 55,9 47,2 48,2 44,8 47,0 59,8 15,1 17,9 17,6 14,3 15,7 15,9 17,3 16,5 15,3 13,5 14,5 18,3 18,8 14,1 17,3 2,0 3,2 3,5 3,3 0,7 2,9 2,2 1,7 2,7 2,7 1,6 1,3 2,2 0,8 3,6 2,3 1,7 4,3 4,1 2,8 10,0 3,8 4,6 5,5 5,9 13,8 6,1 4,7 15,0 1,6 3,7 1,5 3,2 6,1 5,0 7,0 2,2 6,7 5,8 6,5 5,2 10,8 11,3 16,0 1,2 4,6 3,7 4,5 7,7 10,9 9,6 4,3 6,7 9,9 8,9 8,1 9,4 14,6 2,3 3,8 4,4 5,9 5,7 3,4 3,0 2,7 4,3 3,2 2,9 2,4 3,1 1,3 0,9 0,4 5,0 4,5 5,3 4,4 4,2 3,2 0,7 4,1 2,5 1,5 1,7 1,2 0,7 0,1 1,7 5,1
71
Modele cantitative statistice 16 17 18 19 20 66,2 50,0 57,4 59,8 52,2 16,2 9,9 18,5 15,3 18,2 2,0 3,5 3,7 3,8 3,3 0,2 5,0 2,1 3,3 4,4 0,8 11,9 1,7 2,2 4,7
Daniel Scrdeanu 1,3 8,3 6,8 3,9 6,5 6,5 2,4 4,5 3,0 4,6 5,8 5,0 3,7 4,4 1,9
72
Daniel Scrdeanu
Cel mai simplu model pentru corelaia ntre dou variabile geologice este cel liniar, n care se presupune c dependena poate fi descris prin ecuaia unei drepte:
y = 0 + 1 x + e
(III.277) n care
0 , 1 - parametrii modelului;
73
Daniel Scrdeanu
Exist dou modele liniare limit pentru dependena dintre dou variabile geologice x i y : a) ambele variabile ( x i y ) sunt afectate de erori ntmpltoare (Fig. 85); b) variabila independent ( x ) este cunoscut riguros, iar variabila dependent ( y ) este afectat de erori distribuite normal (Fig. 86). Modelul a) este adecvat studierii corelaiei coninuturilor de Au i Ag dintr-un zcmnt sau dintre granulozitate i porozitate ntr-un acvifer nisipos, iar modelul b) se recomand pentru studiul corelaiei ntre adncime ( x ) i coninutul n Au ( y ) sau ntre adncimea ( x ) i gradul de saturare ( y ) din zona de aerare a unui acvifer freatic. Pentru studiul complet al corelaiei liniare ntre dou variabile este necesar parcurgerea unui numar de patru etape de prelucrare.
a) Reprezentarea grafica
Reprezentarea grafic analizate calitativ corelaiei. analiza diagrama corelaie. n a este a Ea trei de repartiiei cea mai bidimensionale a variabilelor rapid form de identificare existenei se poate variante:
ni
mprtiere,
stereograma i dreapta de
y
Fig. 86 Model liniar cu o singur variabil (y) afectat de erori
74
Daniel Scrdeanu
x
nxy
x2 x1
y1 y2
y
Fig. 85 Model liniar cu ambele variabile (x,y) afectate de erori aleatoare
a)Diagrama de mprtiere Diagrama de mprtiere este cea mai simpl form de reprezentare grafic n care utiliznd un sistem de referin rectangular, fiecare pereche de valori msurat ( xi , yi ) se materializeaz printr-un punct. Se obine n acest mod o mulime de puncte a crei configuraie geometric sugereaz prezena 9 8 7 6 PLUMB 5 4 3 2 1 0 0 2 4 6 8 10 ZINC Fig. 87 Diagrame de mprtiere 75 12 14 16 18 20
Modele cantitative statistice sau absena corelaiei ntre cele dou variabile (Fig. 87).
Daniel Scrdeanu
Punctele pot avea o distribuie: haotic - corelaia ntre cele dou variabile fiind nul, concentrat pe o zon alungit rectilinie - corelaia fiind de tip liniar sau concentrat pe o zon alungit curbilinie, situaie n care se presupune existena unei corelaii neliniare ntre cele dou variabile. Diagrama de corelaie poate fi realizat i cu valori standardizate, variant recomandat atunci cnd valorile sunt exprimate n uniti de msur diferite i au amplitudini de selecie disproporionate. Stereograma Stereograma este o reprezentare tridimensional care se bazeaz pe gruparea bidimensional a valorilor celor dou variabile dup aranjarea n ordine cresctoare a variabilei independente. Intervalele de grupare care formeaz compartimentele tabelului de corelaie (Tabel III.41), pentru ambele variabile se stabilesc dup aceleai criterii ca cele stabilite pentru descrierea univariat. Tabelul III.41 Tabel de corelaie pentru dou variabile ( x, y )
y1 y2
...
yk
...
yn
y
x x1 x2
nx1 y1 nx2 y1
...
nx1 y2 nx2 y2
...
nx1 yk nx2 yk
...
nx1 nx2
...
...
xl xy
nxl y1 n y1
nxl y2 n y2
nxl yk n yk
nxl
n
n tabelul de corelaie apar trei tipuri de frecvene: 1) frecvena valorilor perechi ( nxi yi ) reprezint numrul de perechi pentru fiecare interval de grupare. 2) frecvene pariale dup variabila X ( nxi ) care reprezint numrul de valori ale variabilei Y corespunztoare unei valori xi sau valorii centrale a 76
Daniel Scrdeanu
intervalului i, xci , care se calculeaz nsumnd frecventele perechilor de valori de pe un rnd al tabelului III.41.
nxi = nxi y j
j =1 k
(i = 1,2,..., l )
(III.278) 3) frecvenele pariale dup variabila Y ( n yi ) se evalueaz n mod analog pe coloanele tabelului III.41.
n yi = nx j yi
j =1 l
(i = 1,2,..., k )
(III.279) Stereograma se obine prin construirea pentru fiecare compartiment al tabelului de corelaie a unui paralelipiped avnd nlimea proporional cu frecvenele perechilor de valori. Suprafaa care mbrac stereograma poart denumirea de suprafa de frecven i ofer o imagine global a corelaiei ntre cele dou variabile ntr-un spatiu tridimensional. Dreapta de corelaie Dreapta de corelaie reprezint grafic tendina pe care o urmeaz media unei variabile n comparaie cu valorile celeilalte variabile. Se construiesc dou drepte de corelaie pentru fiecare cuplu de dou variabile ( x, y ): a) dreapta de corelaie corespunztoare modelului y = f ( x ) n care pentru fiecare xi se determin i se reprezint valoarea medie (Fig. 89). b) dreapta de corelaie corespunztoare modelului x = f ( y ) n care pentru fiecare valoare yi se calculeaz i se reprezint grafic (Fig. 90).
77
Daniel Scrdeanu
x1
xk
xk
Linia n jurul creia se grupeaz punctele se numete linie de regresie i pentru foarte multe caracteristici geologice este rectilinie. Raporturile spaiale dintre cele dou drepte de regresie ( x = f ( y ) i y = f ( x ) ) exprim intensitatea corelaiei dintre variabilele analizate: 1) independena, dac cele dou linii de regresie sunt ortogonale (Fig. 91a); 2) dependena total, dac cele dou linii de regresie coincid (Fig. 91b); 3) dependena intermediar, dac cele dou linii de regresie formeaz un anumit unghi, unghi a crui mrime este invers proporional cu intensitatea corelaiei (nul cnd unghiul este de 90o).
Cele trei modele de reprezentare grafic a distribuiei bidimensionale a unui cuplu de variabile geologice exprim doar calitativ intensitatea corelaiei, care poate fi cuantificat prin intermediul unor parametri. 78
Daniel Scrdeanu
Din reprezentrile grafice se pot deduce la nivel calitativ inexistena corelaiei sau existenta unei corelaii directe sau inverse. Cele dou variabile sunt corelate direct dac valorile mari ale uneia tind s se asocieze cu cele mari ale celeilalte. In rocile poroase, porozitatea i permeabilitatea sunt un exemplu tipic de variabile pozitiv corelate. Dou variabile geologice sunt corelate negativ dac valorile mari ale uneia tind s se asocieze cu valorile mici ale celeilalte. Corelaii negative se stabilesc de obicei ntre concentratiile a dou elemente majore, de exemplu n rocile dolomitice continutul n calciu este n mod normal corelat negativ cu continutul de magneziu. Sub aspect cantitativ, intensitatea corelaiei lineare se poate cuantifica prin intermediul coeficientului de corelaie Pearson i a coeficentului de corelaie a rangurilor. a)Coeficientul de corelaie Pearson Coeficientul de corelaie este cel mai utilizat parametru pentru cuantificarea intensittii corelaiei liniare a dou variabile i se calculeaz cu relaia:
= xy xy
(III.280)
(x m )(y m ) (x m ) (y m )
n i =1 i i x i y n
=r
i =1
i =1
Coeficientul de corelaie ( ) are valori cuprinse ntre -1 i +1, indiferent de amplitudinea seleciei de date. Valorile extreme ale coeficientului de corelaie liniar indic o aliniere perfect a punctelor ntr-o diagram de mprstiere de-a lungul unei drepte fie cu panta pozitiv ( = 1 ; corelaie pozitiv), fie cu panta negativ ( = 1 ; corelaie negativ.
79
Daniel Scrdeanu
Pentru valori r < 1 ( r fiind estimatorul lui ), distribuia punctelor se abate de la linia dreptei devenind din ce n ce mai difuz cu ct r descrete de la 1 spre 0. Valoarea coeficientului de corelaie este puternic influentat de existenta perechilor aberante de puncte. O bun aliniere a ctorva valori extreme poate creste foarte mult valoarea coeficientului de corelaie pentru dou variabile slab corelate i invers, o bun corelaie poate fi "distrus" de slaba aliniere a ctorva valori extreme. Aplicatie. Pentru analiza corelaiei ntre continuturile n Au i Ag din zcmntul Cavnic filonul 80 s-a evaluat un coeficient de corelaie r1 = 0,64 cu luarea n cosiderare a tuturor valorilor selectiei n care era inclus i o pereche de valori afectat de erori de msurare (Fig. 92). Prin eliminarea acestei singure perechi de valori i recalcularea coeficientului de corelaie s-a obinut r2 = 0,84 .
Dac relaia dintre dou variabile nu este linear, coeficientul de corelaie ( r ) poate avea o valoare foarte mic. Din acest motiv este deseori util s se suplimenteze utilizarea lui cu cea a coeficientului de corelaie a rangurilor. b)Coeficientul de corelaie a rangurilor Coeficientul de corelaie a rangurilor
( r )
se calculeaz aplicnd
80
Daniel Scrdeanu
R xy r = R x R
y
(R
n i =1
(R
n i =1 xi
xi
mRx
) (R
2
n i =1
)(
yi
mR y
= ri
(III.281) n care:
mRx , mRy - media rangurilor valorilor Rx1 ,..., Rx n , respectiv Ry1 ,..., Ryn .
O mare diferent ntre r i poate fi deseori determinat de prezena unei perechi de valori extreme. Spre deosebire de coeficientul de corelaie ( r ), coeficientul de corelaie a rangurilor ( rr ) nu este att de sensibil la perechi extreme de valori. O valoare mare a coeficientului de corelaie a rangurilor i una mic a coeficientului de corelaie Pearson poate fi datorat faptului c un numr redus de perechi aberante afecteaz buna corelaie a variabilelor studiate. Dac coeficientul de corelaie a rangurilor este mare i coeficientul de corelaie Pearson mic este posibil o "mbuntire" fals a corelaiei prin prezenta ctorva valori extreme bine "aliniate". Pentru situatia prezentat anterior valorile corespunztoare ale coeficientului de corelaie a rangurilor sunt: rr1 = 0,80 nainte de eliminarea valorii extreme i rr2 = 0,79 , eliminarea valorii aberante avand o influenta mult mai mic asupra coeficientului de corelaie a rangurilor dect asupra coeficientului de corelaie r . Diferenta dintre r i rr poate fi revelatoare i asupra altui aspect al corelaiei ntre cele dou variabile: cel al liniarittii. Dac rr = +1 , adic rangurile celor dou variabile sunt identice, valorilor mari ale variabilei x le corespund valori mari ale variabilei y , corelaia are intensitate maxim dar ea nu este obligatoriu de tip linear. Neliniaritatea corelaiei este evidentiat de valorile mici ale ale coeficientului de corelaie ( r ).
81
Daniel Scrdeanu
Adecvarea unui model liniar este sintetizat n evaluarea semnificatiei statistice a coeficientului de corelaie care se poate realiza n dou etape succesive: cea a acceptrii (functie de valoarea calculat) existentei unei corelaii liniare i cea de evaluare a incertitudinii asupra intensittii acesteia. Testarea statistic a existentei corelaiei liniare se poate realiza cu ajutorul testului STUDENT aplicat ipotezelor statistice:
H0 : = 0 H1 : 0
(III.282) care se compar cu valorile repartiiei STUDENT t ( , ) cu = n 2 . n alternativ texp < t ( , ) se accept ipoteza absenei corelaiei liniare ntre cele dou variabile. Dac texp > t ( , ) , din punct de vedere statistic se admite existena unei corelaii liniare ntre cele dou variabile i se trece la etapa de evaluare a incertitudinii asupra valorii r calculate. Calculul intervalului de ncredere pentru valoarea coeficientului de corelaie se poate realiza utiliznd variabila cu repartiie normal propus de Fisher:
z=
(III.283)
1 1+ r ln 2 1 r
rinf =
(III.284) n care:
z1 = z nps z
(III.285)
82
Daniel Scrdeanu
(III.286)
sz =
1 r2 n
(III.288)
d) Parametrii modelului
Evaluarea parametrilor modelului statistic liniar parcurge cele dou etape clasice de calcul al parametrilor pe baza eantionului de date disponibile i de evaluare a incertitudinii acestor parametri. a) Calculul parametrilor Calculul parametrilor a0 i a1 ca estimaii de selecie ale parametrilor ( 0 i 1 ) se realizeaz prin metoda celor mai mici ptrate care const n minimizarea sumei ptratelor abaterii valorilor seleciei de la ecuaia general. Notnd suma ptratelor abaterilor de la modelul liniar:
SPA = [ yi (a0 a1 xi )]
i =1
Daniel Scrdeanu
(III.291) n care:
??
s xy = xi2
i =1
n 1 n xi yi n i=1 i=1
(III.292)
1 n s xx = x xi n i=1 i =1
n 2 i 2
(III.293) b) Evaluarea incertitudinii Evaluarea intervalului de ncredere pentru parametrii modelului ( , 1 ) se bazeaz pe amploarea fluctuaiilor variabilei determinat de parametrii calculai a0 i a1 :
2 2 y sy =
n jurul modelului
1 n (yi my )2 n 1 i=1
84
Daniel Scrdeanu
2 2 =y xi2 / n (xi mx )2
0
i =1
i =1
(III.295) Variabila:
texp = ( 0 a0 ) / s0
(III.296) are o distributie t cu = n 2 grade de libertate n care
n n 2 2 2 (xi mx )2 s s x / n = y i 0 i =1 i=1
(III.297)
a0 t 1 ; s 0 < 0 < a0 + t s0 1 ; 2 2
(III.298) n condiiile acelorai ipoteze, valoarea 0 nu se accept ca o estimaie a valorii 0 dac
texp > t 1 ; 2
(III.299) Parametrul a1 ce estimeaz parametrul necunoscut 1 are o distribuie
N 1 , 1 n care:
= y 2 / ( xi mx )2
1
i=1
(III.300) Variabila
t exp = (a1 1 ) / s1
(III.301) are deci o distribuie t cu = n 2 grade de libertate, abaterea standard de estimaie calculndu-se cu relaia:
n 2 2 2 s s / = y ( xi m x ) 1 i =1
(III.302) 85
Daniel Scrdeanu
Intervalul de ncredere pentru parametrul a1 corespunztor unui nivel de semnificaie este deci:
a1 t 1 ; s1 < 1 < a1 + t 1 ; s1 2 2
(III.303) n mod analog, valoarea a1 este acceptat ca estimaie a parametrului
e) Aplicaie
Diagrama de mprtiere pentru masa n stare umed ( M w ) i masa n stare uscat ( M d ) a depozitelor recoltate din iazul de decantare Baia Sprie sugereaz o corelaie linear ntre aceti doi parametri (Fig. 93).
340 335 330 325 320 315 310 305 300 295 290 285 280 275 270 265 245 250 255 260 265 270 275 280 285 290 295 300 305
86
Daniel Scrdeanu
Pe baza celor 49 de valori prelucrate se vor parcurge n continuare principalele etape ale obinerii modelului:
Mw = + Md
Realizarea stereogramei evideniaz ntr-un mod sugestiv dou aspecte determinante pentru strategia aplicrii metodologiei clasice: - existena unui numr de valori extreme aberante ce trebuie eliminate naintea evalurilor numerice; - caracterul normal al repartiiei bidimensionale a variabilelor M w i M d care asigur interpretarea corect att a valorilor coeficientului de corelaie ct i a parametrilor modelului. Intensitatea corelaiei ntre cele dou variabile este evaluat prin intermediul coeficientului de corelaie: 1) naintea eliminrii valorilor extreme: r1 = 0,32 , valoare care contrazice flagrant aspectul diagramei de mprtiere i al stereogramei; 2) dup eliminarea a opt valori extreme: r2 = 0,889 . Testarea adecvrii modelului devine formal la o valoare a coeficientului de corelaie r2 = 0,889 i ntr-adevr prin calcul se obine:
20,36 < < 40,68 cu estimatorul a = 18,17 0,812 < < 1,217 cu estimatorul b = 0,781
Modelul estimat al corelaiei lineare este deci:
M w = 18,17 + 0,781 M d
Acest model poate fi utilizat cu o bun aproximare pentru deducerea unuia dintre parametrii pe baza celuilalt reducnd la jumtate efortul de determinare realizat n laborator pentru depozitele iazului Baia Sprie. Desigur
87
Daniel Scrdeanu
c pentru alte amplasamente coeficienii i poate chiar structura modelului vor fi alii deoarece acest model este un model empiric valabil doar pentru domeniul valor (valoric??) al seleciei pe baza creia a fost construit.
Complexitatea proceselor geologice implic frecvent analiza influenei simultane a mai multor variabile, aparent independente, asupra unei variabile considerat dependent (rezultativ) de aciunea acestora. Modelarea linear a cestei corelaii multiple este cea mai simpl soluie adoptat ntr-o etap preliminar de studiu. Formal ea se exprim prin ecuaia:
y = 0 + 1 x1 + 2 x2 + ... + n xn + ei
(III.304) n care:
Daniel Scrdeanu
stabilirea variabilei rezultative poate fi aleas dup criterii statistice pe baza valorii maxime a coeficientului corelaiei multiple sau pragmatice, de exemplu, necesitatea prognozrii coninutului unui anumit metal (Au) funcie de coninutul celorlalte. Numrul variabilelor factoriale ale modelului este controlat de criterii operaionale (capacitatea de prelucrare a instrumentului de calcul) precum i de necesitile interpretrii rezultatelor. De cele mai multe ori n modelarea statistic se prefer un numr minim de variabile pentru ca efectele numerice s nu estompeze caracteristicile intrinseci ale procesului modelat. Precizarea configuraiei modelului liniar multiplu este obligatoriu s fie precedat de o analiz factorial care s simplifice i s ierarhizeze la nivel statistic importana variabilelor n reflectarea ansamblului de corelaii propriu sistemului studiat.
Diagrama de mprtiere este singura dintre reprezentrile grafice utilizate n cazul modelului liniar de o singur variabil independent care poate fi generalizat pentru cazul a trei dimensiuni, corespunztor unei corelaii multiple cu dou caracteristici independente i una factorial. n cazul a trei variabile X 1, X 2 i X 3 , tripletele ( x1, x 2, x3 ) pot fi considerate ca determinnd un punct ale crei coordonate sunt valorile x1, x 2 i x3 . Reprezentate ntr-un sistem de referin ortogonal, toate punctele vor forma o mulime cu o anumit dispoziie geometric n raport cu diferite "suprafee de corelaie". Gruparea punctelor n vecintatea unei astfel de suprafee poate fi o msur calitativ a intensitii corelaiei ntre cele trei variabile. Pentru mai mult de trei variabile, reprezentri grafice care s rezume n mod sugestiv corelaia ntre variabile nu se poate realiza dect dup prelucrri speciale de tipul celor prezentate n cadrul analizei factoriale. Datele brute nu mai pot fi examinate prin aceleai procedee prezentate la modelul liniar de o singur variabil independent (stereograma, dreapta de 89
Daniel Scrdeanu
regresie) dect formnd perechi din variabila rezultativ i fiecare variabil factorial, metod care ignor ns tocmai efectul ansamblului de intercorelaii pe care tinde s-l exprime modelul corelaiei multiple.
Calitatea modelului liniar multiplu se evalueaz sub dou aspecte: a) intensitatea corelaiei ntre variabila rezultativ i toate variabilele factoriale, cuantificat cu ajutorul raportului corelaiei multiple i coeficientului corelaiei multiple; b) intensitatea corelaiei ntre variabila rezultativ i fiecare variabil factorial, exprimat prin coeficientul de corelaie parial. a) Raportul corelaiei multiple Raportul corelaiei multiple se calculeaz cu formula:
R y ( x1... xn ) = 1
(y y
k i =1
2 * x1... xn
(y
k i =1
(III.305) n care
yi - valoarea msurat a variabilei rezultative; y* x1 x 2... xn - valoarea estimat a variabilei rezultative; y - media valorilor msurate ale variabilei rezultative;
k - numrul de probe n care se msoar cele n variabile.
Valoarea R y ( x 2,..., xn ) depinde deci de raportul dintre dispersia valorilor determinate pe baza ecuaiei de regresie linear i dispersia valorilor msurate ale variabilei rezultative. Cu ct valorile msurate se abat mai puin de la valorile calculate, cu att coeficientul de corelaie are o valoare mai mare i ca atare corelaia este mai intens.
90
Daniel Scrdeanu
Coeficientul corelaiei multiple ntre variabilele y, x1, x 2,..., xn msoar gradul de precizie cu care y poate fi reprezentat prin modelul liniar multiplu. Relaia de calcul a coeficientului corelaiei multiple este:
1 k a 0 yi + a1 x1i yi + ... + an xni yi yi n i =1 i =1 i =1 i =1
k k k 2
R y ( x1x 2... xn ) =
1 k y yi n i =1 i =1
k 2 i
)(
)(
(III.307)
2 n care ry21 , ry22.1 ,..., ryn .12...( n 1) sunt coeficienii de corelaie parial.
Dac R y ( x1x 2... xn ) = 1 , variabila rezultativ y poate fi perfect reprezentat prin modelul liniar multiplu. Se poate demonstra c R y ( x1x 2... xn ) este mai mare dect coeficientul de corelaie ntre y i orice funcie liniar de x1, x 2,..., xn diferit de cea din expresia (III.304). Coeficientul corelaiei multiple este mai mare sau egal cu zero i deci n mod evident este mai mare (sau egal) dect oricare din coeficienii de corelaie parial care aparin modelului. Ca o consecin a acestui fapt, dac
Coeficienii de corelaie partial Coeficienii de corelaie parial exprim intensitatea corelaiei ntre variabila rezultativ ( y ) i o variabil factorial oarecare ( x1, x 2,..., xn ) cnd restul variabilelor modelului rmn constante.
91
Daniel Scrdeanu
Pentru un model liniar multiplu cu n variabile calculul coeficienilor de corelaie parial se face funcie de coeficienii de ordin inferior cu relaia de recuren:
ry1.23...n = ry1.23...(n1) ryn.23...(n1) r1n.23...(n1)
(1 r
2 yn.23...( n 1)
)(1 r
2 1n.23...( n 1)
y = a0 + a1x1 + a 2 x 2
(III.309) aplicnd formula (III.308) se obine relaia de calcul a coeficientului corelaiei pariale ntre y i x1 :
ry1.2 =
(III.310)
(1 r )(1 r )
2 y2 2 12
ry1 ry 2 r12
n care ry1 , ry 2 i r12 sunt coeficienii de corelaie binar calculai cu formula (III.280) utilizat pentru evaluarea intensitii modelului liniar cu o singur variabil independent. Coeficienii corelaiei pariale au valori cuprinse ntre -1 i +1 semnificaia fiind cea a coeficientului de corelaie Pearson analizat n detaliu la paragraful IV.2.1.
Adecvarea modelului liniar multiplu este condiionat de semnificaia statistic a coeficientului corelaiei multiple. Pentru modelul liniar multiplu, suma ptratelor abaterilor valorilor observate ale lui y fa de media lor este egal prin definiie cu
2 k sy
92
Daniel Scrdeanu
a) suma ptratelor abaterilor valorilor msurate fa de cele date de ecuaia modelului i care este egal cu:
2 2 k sy 1 Ry ( x1 x 2... xn )
(III.312) cu k n grade de libertate; b) suma ptratelor abaterilor valorilor calculate prin ecuaia modelului fa de media valorilor msurate:
2 2 k sy Ry ( x1 x 2... xn )
(III.313) cu n 1 grade de libertate. Dac y (valoarea msurat) i y * (valoarea estimat prin model) sunt complet necorelate, abaterile lui y fa de valorile modelului ( y * ), vor fi independente de abaterile valorilor calculate fa de media valorilor msurate i deci dispersiile celor dou componente vor fi practic identice ( R = 0 ). Testarea semnificaiei statistice a diferenei celor dou componente poate fi realizatat cu ajutorul repartiiei Z calculnd factorul experimental:
2 Ry 1 k n ( x1 x 2... xn ) Z exp = ln 2 z 1 R y ( x1x 2... xn ) n 1
Z exp < Z ( , 1 , 2 )
(III.315) valoarea coeficientului de corelaie R y ( x1x 2,..., xn ) este nesemnificativ i modelul liniar multiplu nu este adecvat modelrii corelaiei ntre n + 1 variabile. n caz contrar, din punct de vedere statistic, corespunztor nivelului de semnificaie ales, modelul liniar multiplu este adecvat modelrii relaiei ntre variabila rezultativ ( y ) i variabilele factoriale: x1, x 2,..., xn . Semnificaia coeficientului corelaiei multiple este puternic afectat de numrul de valori disponibile ( k ) i numrul de variabile ale modelului ( n ). n cazul limit n care numrul de variabile este egal cu numrul de observaii
93
Daniel Scrdeanu
disponibile, toate corelaiile pariale de cel mai ridicat grad posibil vor fi egale cu valoarea unitar i n consecin R va indica o corelaie total indiferent de ansamblul real de corelaii din sistemul studiat.
d) Parametrii modelului
Evaluarea parametrilor modelului corelaiei multiple parcurge aceleai dou etape cu cele prezentate n paragraful precedent pentru modelul liniar cu o singur variabil independent. Calculul parametrilor Evaluarea parametrilor a0, a1,..., an se face prin aplicarea modelului
(III.318)
94
Daniel Scrdeanu
(III.319) prin a cror rezolvare se obin valorile parametrilor. Fiecare dintre parametrii modelului ( a1, a 2,..., an ) reprezint variaia medie a variabilei rezultative ( y ) corespunztoare unei variaii unitare a variabilei factoriale, considerndu-le pe celelalte constante. Termenul liber ( a 0 ) reprezint nivelul de referin al variabilei rezultative fr a avea o semnificaie geologic precizat. b) Evaluarea incertitudinii Pentru parametrii modelului corelaiei multiple intervalul de ncredere se evalueaz pe baza inegalitii:
a j t ( , ) s yyi n < j < a j + t ( , ) s yyi n
(III.320) pentru coeficienii variabilelor factoriale ( j = 1,2,..., n ) iar pentru termenul liber pe baza inegalitii:
a0 t ( , ) s yyi n < 0 < a0 + t ( , ) s yyi n
(III.321) n care
s yyi =
(III.321)
(y
k i =1
yi*
k n 1
95
Daniel Scrdeanu
sa j =
s yyi
(x
k i =1
ij
m xj )
(III.322)
e) Aplicatie
Dintr-un acvifer freatic s-a exploatat pe o perioad de 10 ani un debit ce variaz de la 1000 la 6000 m3/zi. Acviferul este alimentat prin infiltraii rezultate din precipitaii care n zon au valoarea medie de 350 mm/an. Pentru optimizarea regimului de funcionare a forajelor de drenaj s-a elaborat un model statistic de tip linear pe baza valorilor medii lunare ale debitelor exploatate i precipitaiilor pe perioada 1970 - 1980. Elaborarea modelului a cuprins trei etape: identificarea variabilelor modelului, evaluarea parametrilor i evaluarea performanelor. a) Identificarea variabilelor modelului s-a realizat pe baza corelogramelor calculate pentru cele dou variabile principale (Q-debit i P-precipitaii). Din corelogramele calculate se remarc o autocorelare important a debitului de
RQQ
+1 +1
RQP
3 0 1 2 3 4 5 6
t
5 4 6 7 t
-1
-1
Fig. 96 Autocorelograma Q-Q Fig. 97 Autocorelograma Q-P exploatare pentru un decalaj de 1 lun i 4 luni (Fig. 96) i o corelare important ntre precipitaii i debitul de exploatare cu un decalaj de o lun (Fig. 97). n aceste condiii modelul identificat optim este de forma:
96
Daniel Scrdeanu
b) Evaluarea parametrilor modelului prin minimizarea abaterilor a condus la coeficienii: a 0 = 2077,5; a1 = 0,3299; a 2 = 0,2128; a3 = 0,9648 .
m3 Q zi
c) coeficientul
Performanele corelaiei
7000
5000
corelaia
total
ntre
R = 0,65
corelaia parial ntre Q
Q(t 1) :
rQQ (t 1) = 0,16 ;
corelaia parial ntre Q
Q(t 4 ) :
rQQ (t 4 ) = 0,14 ;
corelaia parial ntre Q i P(t 1) :
rQP (t 1) = 0,63 .
Grafic relaia dintre valorile observate i cele calculate prin model (Fig. 98) exprim o bun adecvare a modelului pentru corelaiile ntre debitul de exploatare i precipitaii.
Bibliografie
Andrews, D.J.& Hanks, T.C., Scarp degraded by linear diffusion : inverse solution for age, J.Geophys.Res.90, 10193-208, 1985. Bailey, N.T.J., The elements of stochastic processes with applications to the natural sciences, John Wiley & Sons, Inc., New York, 1964. Berg, P., Poneau, Y.& Vidal, C., Order within chaos, John Wiley and sons, New York, 1986. Bomboe, P., Geologie matematic (vol. I, Analiza statistic a datelor
97
Daniel Scrdeanu
Brown, S.R., A note on the description of surface roughness using fractal dimension, Geophys. Res. Lett. 14, 1095-8, 1987. Cennini, C., Tratatul de pictur, Ed.Meridiane, 1977. Chauvet, P., Aide memoire de Geostatistique Lineare, Fascicule 2, Cahiers de Geostatistique, Centre de Geostatistique, Ecole de Mines de Paris, 1991. Cheeney, R.F., Statistical methods in geology, George Allen & Unwin (publishers) Ltd, London, 1983. Clarke, G.P.Y. and Dane, J.H., A simplified theory of point kriging and its extension to cokriging and sampling optimization, Bulletin 609, Alabama Agricultural Experiment Station, Auburn University, Alabama, february 1991. Craiu, V., Enache, R., Bsc, O., Teste de concordanta cu programe n Fortran, Editura stiintific si enciclopedic, Bucuresti, 1986. Daccord, G. & Lenormand, R., Fractal patterns from chemical dissolution, Nature 325, 41-3, 1987. David, M., Handbook of applied advanced geostatistical ore reserve estimation, Elsevir, Amsterdam, 1988. David, M., Geostatistical ore reserve estimation, Elsevier, Amsterdam, 1977. Davis, J. C., and McCullagh, M. J., Display of analysis data, Wiley, New York, 1975. Delfiner, P., Matheron, G., Les fonction Aleatoires Intrinseques d'ordre k,Les Cahiers du Centre de Morphologie Mathematique de Fontainebleau, Ecole de Mines de Paris, 1980. Delhomme, J.P., Les variables regionalisees dans les sciences de l'eau, B.R.G.M., Deuxieme serie, no4, Section III, Hydrogeologie-geologie de l'ingeneur, Paris, 1978. Deutsch, C.V., Journel, A.G., GSLIB: Geostatistical Software Library, New York, Oxford University Press, 1992. Deverle, P., H., Mineral resources appraisal, Calderon Press, Oxford, 1984. Dick O., Fractalvision : Put fractals to work, Bucuresti, Teora, 1995. Dubuc, B., Quiniou, J.F., Roques-Carmes, C., Tricot, C. & Zucker, S.W., 98
Daniel Scrdeanu
Evaluating the fractal dimension of profiles, Phys.Rev. A39, 1500-2, 1989. Fabbri, A.G., Image processing of geological data, New York, Van Nostrand reinhold Company, 1984. Fabbri, A.G., and Kasvand, T., Image processing for detection of twodimensional markovian prpperties as functions of distances from crystal profiles, in Proc. 3rd European symposium dor stereology , Ljubliana, Yugoslavia, June 22-26, 1981, Stereologia Iugoslavica, v. 3, (suppl. 1), Fouquet, Ch.De, Simulation conditionnelle de fonctions aleatoires: cas gaussien stationnaire et schema lineaire, Centre de Geostatistique, Ecole des mines de Paris, 1993. Guillaume, A., Analyse des variables regionalise, Doin Editeur, Paris, 1977. Hirata, T., Satoh, T. & Ito, K., Fractal structure of spatial distribution of microfracturing in rock, Geophys. J. Roy. Astron. Doc. 90, 369-74, 1987. Houlding, S.W., Practical Geostatistics, Modeling and Spatial Analysis, Springer,-Verlag Berlin Heidelboerg, 2000 Isaaks, E.H., Srivasrava, M.R., Un introduction to Applied Geostatistics, New York, Oxford University Press, 1989. Journel, A.G., Huijbregts, Ch.J., Mining Geostatistics, Academic Press, London, 1978. Journel, A.G., Exploitation des mines.Guide pratique de geostatistique, Ecole des mines d'Ales, 1975. Kasvand, T., Fabbri, A.G. and Nel, L.D., Digitization and processing of large regional geological maps, Nat. Res. Council Can., Elec. Eng. Division, Report, ERB938, 1981. Kecs, W., Complemente de matematic cu aplicatii n tehnic, Editura tehnic, Bucuresti, 1989. Kruhl, J.H., Fractals and dynamic systems in geoscience, Springler-Verlag, Berlin Heidelberg New York., 1994. 99
Daniel Scrdeanu
Laffite, P., Trait dinformatique gologique, Masson et Cie Editeurs, Paris. Marsily, G.De, Quantitative Hydrogeology, New York, London, Academic Press,INC, 1986. Matheron, G., Traite de Geostatistique Appliquee, (tome I), Technip, Paris, 1976. Matheron, G., Traite de Geostatistique Appliquee, (tome II), Technip, Paris, 1963. Matheron, G., La theorie des variables rgionnalises, et ses applications, Les Cahiers du Centre de Morphologie Mathematique de Fontainebleau, Fascicule 5, Ecole de Mines de Paris, 1970. Matheron, G., Le ch oix des modles en gostatistique, in Advanced Geostatistics for mining industry., Guaracio et al., Reidel, 1976. Matheron, G., Estimer et choisir, Les Cahiers du Centre de Morphologie Mathematique de Fontainebleau, Fascicule 7, Ecole de mines de Paris, 1978. McCall, J., and Marker, B. (editors), Earth science mapping, Graham &Trotman, London, 1989. Mihoc, G.m Bergthaller, C., Urseanu, V., Procese stocastice, Editura stiintific si enciclopedic, Bucuresti, 1978. Mont, OL., Lippert, R. H., Spitz, O.T., Fortran IV and map program for computation and plotting of trend surgfaces degrees 1 through 6, Michigan, 1979. Murgu,M., Analiza retelelor de explorare si valorificarea optim a zcmintelor minerale, Tipografia Univ.Bucuresti, 1979. Onicescu, O., Stefnescu, V., Elemente de statistic informational cu aplicatii, Editura tehnic, Bucuresti, 1979. Preston, F.W., and Davis, J.C., Sedimentary porous materials as a realization of stochastic processes, in Random Processes in Geology, D.R.Merriam, ed., Springer-Verlag, New-York, 1976. Rivoirard, J., Introduction au krigeage disjonctif et a la geostatistique non lineaire, Centre de Geostatistique, Ecole des mines de Paris, 1991. Rosenfeld, A., & Kak, A.C., Digital picture processing, Academic press, New york, 1976. 100
Daniel Scrdeanu
Rousseau, J.J., Scrieri despre art, B.P.T., Bucuresti, 1981. Schwarzacher, W., Sedimentation models and quantitative stratigraphy, Elsevier scientific publishing company, Amsterdam, 1975. Scrdeanu, D., Mihnea, G., L'etude de variationes spatiales de grandeurs hydrogeologique a l'aide du krigeage, Analele Univ.Bucuresti, 1987. Scrdeanu, D., Optimizarea metodelor de explorare a zcmintelor de lignit, Tez de doctorat, Univ.Buc, 1993. Scrdeanu, D., Informatic geologic, Editura Univ.Bucuresti, 1995. Scrdeanu, D., Modele geostatistice n Hidrogeologie, vol.I, Editura didactic si Pedagogic, R.A.-Bucuresti, 1996. Shakeel, A., Estimation des transmissivites des aquifers par methodes geostatistique mulrivariables et resolution indirecte du probleme inverse, These presentee a l'Ecole Nationale Superieure des Mines de Paris, 1987. Silasi, I., Geostatistic aplicat n cercetarea zcmintelor si evaluarea rezervelor, Multiplicat n atelierele C.P.P.G. al M.M.P.G.,Bucuresti, 1975. Srivastava, G. S., Optical processing of structural contour maps, J. Math. Geol. 9, 1975. Strang, G., Linear algebra and its applications, Academic Press, New York, 1980. Teodorescu, D., Modele stohastice optimizate, Editura Academiei R.S.R, Bucuresti, 1982. Trescott, P.C. at. al., Finite-difference model for aquifer simulation in two dimensions with results of nuerical experiments, Geological Survey, Washington, 1976. Turcotte D.L., Fractals chaos in geology and geophysics, Cambridge University Press, 1992. Wackernagel, H., Cours de geostatistique multivariable, Centre de Geostatistique, Ecole des mines de Paris, 1993. Wiener, U., Isaic-Maniu, A., Vod, V., Aplicatii ale retelelor probabiliste n tehnic, Editura tehnic, Bucuresti, 1983. Tatarkiewicz,W., Istoria esteticii, Editura meridiane, Bucuresti, 1978. Zorilescu, D., Prognoza resurselor de materii prime minerale, Editura 101
Daniel Scrdeanu
Zorilescu, D., Modele operationale ale problemelor miniere, Editura tehnic. Bucuresti, 1981. Zorilescu, D., Introducere n geostatistica informational, Editura Academiei, Bucuresti, 1990.
102