Sunteți pe pagina 1din 73

Investete n oameni!

FONDUL SOCIAL EUROPEAN


Titlul proiectului: Burse doctorale i postdoctorale pentru cercetare de excelen
Numrul de identificare al contractului: POSDRU/159/1.5/S/134378

DEZVOLTARE DURABIL: METODE I MIJLOACE DE ANALIZEVALUARE-MONITORIZARE A DEZVOLTRII SUSTENABILE A


SISTEMELOR TEHNICO-ECONOMICE
prof. George Savii
2014

1. INTRODUCERE
"Dezvoltarea durabil este dezvoltarea care satisface nevoile
prezente fr a compromite capacitatea generaiilor viitoare
de a-i satisface propriile nevoi" (World Commission on
Environment & Development, 1987).
Summit-ul mondial 2005 asupra dezvoltrii sociale a identificat
obiectivele de dezvoltare durabil: dezvoltarea economic,
dezvoltarea social i protecia mediului.
Dezvoltarea durabil const n eforturile locale i globale pentru
satisfacerea nevoilor de baz fr distrugerea sau degradarea
mediului natural.

INTRODUCERE (cont.)
Dezvoltarea durabil implic un consum de resurse cu impact
negativ intern sau extern minim. Un sistem sau un proces este
durabil (sustenabil) dac intrrile i ieirile sale au impact
negativ minim asupra mediului su. Un sistem care nu este
sustenabil duce adesea la eecul (uneori catastrofal) al
sistemului n sine sau al altor sisteme din mediul su.
Abordrile de mediu iau n considerare faptul c ecosistemele
sntoase ofer bunuri i servicii vitale pentru oameni i alte
organisme. Exist dou moduri principale de reducere a
impactului negativ asupra omului i de mbuntire a
serviciilor legate de ecosistem: managementul de mediu
(atmosfera, apa dulce i oceanele i utilizarea terenului) i
gestionarea consumului uman (energie, ap, alimente,
materiale, substane toxice i deeuri).

INTRODUCERE (cont.)
Abordrile inginereti msoar procesele tehnice n locuri
diverse, distribuite, pentru a reduce la minim consumul de
resurse. Pe lng cantitatea mare de date i distribuia lor,
procesul de msurare trebuie s fie neles, administrat i
controlat. Coleciile de date din abordrile de mediu i cele
inginereti referitoare la sustenabilitate sunt provocri pentru
prelucrrile de tip data mining (minerit de date) prin diverse
aspecte: scalabilitatea, integrarea, distribuia, predicia n
timp real, date spaio-temporale, inteligibilitatea (Morik et al.,
2012).
O economie verde este definit ca una care duce la creterea
bunstrii umane i a echitii sociale, n timp ce reduce
semnificativ riscurile de mediu i problemele ecologice.

2. MSURAREA

Msurarea sustenabilitii este un termen care indic metodele


folosite ca baz cantitativ pentru gestionarea informaiei de
sustenabilitate.
Metricile
folosite
pentru
msurarea
sustenabilitii (care implic domeniile mediu, social i
economic, att individual, ct i n diverse combinaii) sunt n
evoluie: acestea includ indicatori, repere, audituri, standarde de
sustenabilitate i sisteme de certificare.

2.1 INDICI DE SUSTENABILITATE COMPOZI


Environmental Performance Index (EPI): se bazeaz pe o abordare
de tip proximitate-la-int, care msoar performana unei ri
raportat la o int absolut stabilit prin acorduri internaionale,
standarde naionale sau consens
European Sustainability Index: descrie situaia dezvoltrii unui ora
avnd n vedere o serie de elemente reprezentative i o compar
cu situaia din anii anteriori
Sustainable Process: combin factori obiectivi, n special costurile
(costurile pe ciclul de via, Life cycle cost - LCC) mpreun cu
problemele subiective precum eficiena resurselor, beneficii de
performan, eficiena deeurilor, beneficii sociale i impactul
asupra mediului

Procedurile statistice ofer un set de instrumente care permite


cercettorilor s sumeze constatrile lor empirice ntr-un mod
care poate fi cu uurin prezentat audienei avute n vedere i
poate fi neles fr dificultate. Analiza multivariat cuprinde
un set de tehnici dedicate examinrii de relaii ntre mai mult
de dou variabile, care sunt aleatoare, dar interdependente,
astfel nct efectele lor diferite nu pot fi interpretate n mod
semnificativ separat (Roman, 2012).

- Etape

1. Stabilirea contextului decizional


2. Definirea opiunilor
3. Definirea criteriilor
4. Construirea matricei de decizie
5. Standardizarea valorilor (notelor/punctajelor)
6. Stabilirea ponderilor criteriilor
7. Calcularea scorurilor sintetice ale opiunilor
8. Stabilirea clasamentului (ierarhiei) opiunilor
9. Analiza rezultatelor i prezentarea lor

(cont.)
Metodele descrise n general ca analiza criteriilor multiple
(MCA), care au baza n cercetarea operaional, au sugerat
un cadru teoretic capabil de a capta esena dezvoltrii
durabile, n timp ce rmn operaionale i implementabile
(Munda et al., 1994).
Metoda selectat pentru formularea criteriilor de compunere
trebuie s permit sumarea ponderat a indicatorilor
cantitativi individuali, ceea ce impune ca metoda s fie
bazat pe utilitate sau valori, cantitativ n format i s ofere
o msur cardinal a diferenelor ponderate ntre indicatori,
nu doar diferene ordinale (Nijkamp et al., 1990).

Implementare
Au aprut numeroase tehnici pentru luarea deciziilor utiliznd
criterii multiple. Unele dintre tehnicile mai simple i utile
includ Scoring Multi-Attribute Analysis (analiza multi-atribut cu
notare - SMAA), Multi-attribute utility theory (teoria utilitii
multi-atribut - MAUT), regresia multipl (MR), programarea
liniar (LP), analiza clusterelor (CA), Multivariate Discriminant
Analysis (analiza multivariat discriminant - MDA), metoda
sumei ponderate (WSM), analiza componentelor principale
(PCA) i Analytical Hierarchy Process (procesul ierarhiei
analitice - AHP).

Metoda

simple aditive (SAW)

Este o versiune clasic a metodei valorii multi-atribut. Este


stabilit o funcie numeric bazat pe simpla sumare a
scorurilor care reprezint realizarea obiectivului conform
fiecrui criteriu, nmulite cu ponderile particulare (Qin et
al., 2008). Factorii de decizie pot s declare o funcie
unidimensional normalizat, de obicei, pe intervalul [0, 1],
cel mai bun scor la fiecare criteriu primind o valoare de
utilitate de 1, iar cel mai slab primete 0. Cu ct este mai
mare suma ponderat a valorilor de utilitate, cu att mai
bun este opiunea. n aceast metod, este posibil o
compensare complet ntre criterii i este intuitiv pentru
factorii de decizie.

Analiza multi-atribut cu notare (SMAA)


Se realizeaz n urmtorii pai (Deelstra, 1998):
a. Creeaz o list de criterii ce urmeaz a fi luate n considerare.
b. Atribuie o pondere fiecrui criteriu, care descrie importana
relativ a criteriului.
c. Atribuie o not pentru fiecare criteriu care arat ct de bine
ndeplinete criteriul fiecare opiune.
d. Calculeaz punctajul pentru fiecare opiune ca sum ponderat
a notelor pe criterii.
e. Ordoneaz opiunile de la cel mai mare scor la cel mai mic scor
pentru a obine clasamentul opiunilor pentru decizie conform
modelului de notare/evaluare adoptat. Opiunea cu cel mai
mare scor este cea recomandat pentru luarea deciziei.
n cea mai simpl form, toate ponderile sunt considerate egale.

multi-atribut (MAUT)
Este similar cu SMAA, cu excepia faptului c utilizeaz "utilitatea"
pentru a cuantifica componentele subiective ale atributelor.

Este o tehnic statistic folosit pentru a dezvolta un model pentru


observarea i estimarea efectului unui numr de variabile
independente asupra unei variabile dependente.
n general, un model de regresie multipl pentru estimarea unui
rezultat este exprimat ca o funcie convenabil de variabile
independente (de exemplu polinomial sau exponenial).

Programarea
Este un instrument de optimizare pentru identificarea valorii
maxime sau minime a unei funcii lineare numit funcie
obiectiv, supus unei serii de restricii lineare.

Analiza cluster (CA)


Este un instrument pentru gruparea obiectelor de tip similar n
categorii sau n clase. Pot fi descoperite asociaii i structurri n
date, care pn atunci nu au fost evidente.
Pentru luarea deciziilor, nti este folosit un algoritm de clasificare
pentru a grupa opiunile/obiectele ntr-un numr de grupuri
(clustere), astfel nct opiunile dintr-un cluster sunt
asemntoare i deosebite de cele din alte clustere. Acest lucru
reduce mulimea iniial de opiuni n submulimi cu elemente
asemntoare, mai uor de manipulat.

Analiza
(MDA)

discriminant

Este o tehnic de analiz statistic, ce se ocup cu separarea de


mulimi distincte de obiecte (sau observaii), pe baza
variabilelor lor independente observate (Aczel, 2009). Tehnica
ncepe prin a gsi cea mai discriminatorie variabil (ce are cea
mai mare entropie informaional), care este apoi combinat,
pe rnd, cu fiecare din celelalte variabile, pn este gsit
urmtoarea variabil care contribuie cel mai mult la
discriminarea ntre grupuri. Procesul continu n mod similar,
pn n momentul n care discriminarea dobndit prin
includerea oricrei alte variabile suplimentare este neglijabil.

Metoda sumei ponderate (WSM)


Evalueaz fiecare opiune cu privire la fiecare criteriu i apoi
multiplic nota de la evaluare cu un factor de importan a
criteriului. Acest produs este nsumat pentru toate criteriile
pentru respectiva opiune, pentru a genera scorul opiunii,
utilizat pentru ordonare.
n combinarea diferitelor dimensiuni i, prin urmare, a diferitelor
uniti de msur, ipoteza aditivitii utilitii ar putea fi
nclcat, astfel nct aplicarea la problemele decizionale
multidimensionale ar putea fi dificil.

Analiza componentelor principale (PCA)


Ideea central este de a reduce dimensionalitatea unui set de date
constnd dintr-un numr mare de variabile interdependente,
pstrnd n acelai timp ct mai mult posibil variaia prezent n
setul de date.
Acest lucru este realizat prin transformarea la un nou set de
variabile, componentele principale (PC), care sunt necorelate i
care sunt ordonate astfel nct primele cteva pstreaz cele
mai multe variaii prezente n toate variabilele originale
(Jolliffe, 2002).

Procesul ierarhiei analitice (AHP)


Esena procesului este descompunerea unei probleme complexe
ntr-o ierarhie cu scopul (obiectivul) la partea de sus a ierarhiei,
criteriile i sub-criteriile la nivelurile i sub-nivelurile ierarhic
inferioare, i opiunile pentru decizie la partea inferioar a ierarhiei.
Elementele de la un nivel dat al ierarhiei sunt comparate pe perechi
pentru a evalua preferina lor relativ fa de fiecare din elementele
de la nivelul imediat superior. Sunt folosite scri de rapoarte de valori
i comparaii verbale/lingvistice pentru evaluarea elementelor
cuantificabile i necuantificabile.
Metoda calculeaz i agregheaz vectorii proprii ai matricelor cu
rapoarte de note pn cnd se obine vectorul final compozit cu
coeficienii de pondere ai opiunilor. Elementele vectorului final cu
coeficienii de pondere reflect importana relativ a fiecrei opiuni
relativ la scopul declarat n partea superioar a ierarhiei.

ELECTRE (Elimination Et Choix Traduisant


la Ralit)
Este o metod de surclasare n care clasamentul opiunilor este
realizat prin comparaii n pereche. Pentru fiecare pereche de
opiuni, sunt combinate msuri de concordan i discordan
pentru a crea o msur a surclasrii. Rezult o matrice denumit i
matricea de credibilitate, care indic tria afirmaiei c ''a este cel
puin la fel de bun ca a' ''.
Un clasament al opiunilor obinut din matricea de credibilitate
nglobeaz conceptele de distilare ascendent i descendent i
calificarea proiectelor.
Avantajul metodei ELECTRE este c compromisurile ntre mai multe
atribute sunt compensatorii i informaia coninut n matricea de
decizie este utilizat n totalitate.

TOPSIS
(The Technique Ordered Preference by
Similarity to the Ideal Solution)

Metoda este o abordare pentru a identifica opiunea


care este cea mai apropiat de soluia ideal
(favorabil) i cea mai deprtat de soluia ideal
negativ ntr-un spaiu de calcul multidimensional.
Metoda necesit un numr minim de date de la utilizator
i rezultatul produs este uor de neles.

PROMETHEE (Preference Ranking


Organization Method for Enrichment
Evaluation )
Importana relativ a unei opiuni fa de alta este
modelat ca unul din cele ase tipuri de criterii
generalizate: obinuit (punct), cvasi-criteriu (n form
de U - zon de indiferen), preferin linear
(triunghiular), platou (cu doua niveluri), preferin
linear i zon de indiferen, respectiv gaussian.

MACBETH (Measuring Attractiveness


through a Category Based Evaluation
Technique )
Metoda necesit doar judeci calitative despre diferena
de atractivitate ntre dou elemente la un moment
dat, pentru a genera scoruri numerice pentru opiuni
conform fiecrui criteriu i pentru a calcula ponderile
criteriilor.
Scorurile numerice ale opiunilor sunt ulterior agregate
aditiv pentru a calcula scorurile de ansamblu, care
reflect atractivitatea lor innd cont de toate
criteriile.

Uneltele de analiz decizional multicriterial (MCDA)


pot fi personalizate pentru a include judeci de
valoare ale factorilor de decizie individuali sau a
judectorilor multiplii. Cele mai multe metodologii de
analiz pentru decizii au pai similari de organizare a
datelor ntr-o matrice de decizie (numit i matricea
performanelor), dar acestea difer n sintetizarea
informaiilor n matrice i n ordonarea opiunilor
(Khalili i Duecker, 2013).

Raporturile ntre obiective, sub-obiective i criterii pot fi


fcute explicite ntr-un "arbore al criteriilor".
Pot fi adoptate mai multe proceduri de agregare n
analiza multicriterial (MCA), i anume: agregare
compensatorie (ca cele aplicate n AHP), teoria multiatribut valoare-utilitate (MAVT/MAUT i MACBETH),
abordri de surclasare (ca cele aplicate n PROMETHEE
i ELECTRE) i abordri non-compensatorii (ca cele
aplicate n metodele de dominan i cele
lexicografice) (De Brucker et al., 2013).

Principalele etape de analiz multicriterial sunt de obicei (Boggia i Cortina,


2010):
1. construirea unui tabel de decizie X (matricea performanelor Roman, 2012),
cu dimensiuni m x n, avnd n vedere m opiuni i n
indicatori/criterii/atribute;
2. implementarea unui sistem de ponderi {w1, w2,..., wn} care furnizeaz
informaii cu privire la importana atribuit diferitelor criterii.
Valorile din X de obicei trebuie s fie normalizate, datorit gamei largi de valori
ale atributelor (n funcie de criterii). Cele mai folosite metode de
normalizare sunt:
1. scalare Min-Max la intervalul [0, 1]: x (x-xmin) / (xmax-xmin); uneori este
folosit intervalul [0, 100] (procent): x 100(x-xmin) / (xmax-xmin);
2. scorul standard (Z-score): fiecare coloan este transformat pentru a avea
media zero i variana unitar: x (x ) / , unde este media aritmetic
a valorilor i este deviaia standard a setului de valori;
3. o transformare nelinear n interval normalizat (de obicei [0, 1]).

Aplicaiile software suport pentru decizii, cum ar fi


PROMETHEE (Macharis et al., 1998), ELECTRE
(Elimination Et Choix Traduisant la Ralit) (Ishizaka i
Nemery, 2013), KNIME (Berthold et al., 2008), GaBi
(www.gabi-software.com) i MACBETH (Bana e Costa
i Vansnick, 1999) au fost studiate ntr-o gam larg de
probleme concrete.

Criteriile de utilizat n luarea deciziei pot fi identificate


folosind un chestionar pentru a obine opiniile
profesionitilor n domeniu.
Opiniile participanilor sunt statistic semnificative,
deoarece acestea reprezint punctele de vedere ale
proiectanilor cu calificri academice n domeniu i
experien practic n producie.
Opiniile lor pot oferi un spectru larg de cunotine,
experiena i expertiza din puncte de vedere
economice, sociale, tehnice i de mediu, i sunt
valoroase pentru dezvoltarea modelelor de decizie
multicriteriale.

3 PROCESUL IERARHIEI ANALITICE (AHP)

Etapele principale coninute n formularea modelului


sunt:
1. Stabilirea unei ierarhii structurale
ntr-o ierarhie tipic, opiunile sunt la partea de jos.
Scopul sau obiectivul general al deciziei este poziionat
la nivelul superior al ierarhiei. Criteriile i sub-criteriile
ce contribuie la luarea deciziei sunt reprezentate la
nivelurile intermediare.

PROCESUL IERARHIEI ANALITICE (AHP) Etape


2. Comparaiile pe perechi i calculul ponderilor criteriilor
Comparaiile sunt efectuate ntre perechi de elemente n fiecare ramur a fiecrui nivel
al ierarhiei pentru a determina valoarea relativ a unui element fa de altul, n
raport cu elementul imediat superior. Compararea se face prin utilizarea unei scri de
preferine.
Comparaiile pereche pe fiecare ramur la fiecare nivel al ierarhiei sunt nregistrate ntr-o
matrice i utilizate pentru a determina un vector de ponderi de prioritate. Numai
acele elemente care se refer la un obiectiv comun sunt comparate cu altele.
Desfacerea unui sistem complex ntr-un set de comparaii pe perechi este o
caracteristic major a AHP.
Cele dou cele mai comune metode de obinere a ponderilor atributelor sunt utilizarea
vectorilor proprii i metoda celor mai mici ptrate. n primul caz, ponderile
atributelor sunt obinute prin gsirea vectorului propriu corespunztor celei mai mari
valori proprii a matricei comparaiilor n pereche. Elementele vectorului propriu sunt
normalizate la sum unitar, pentru a face posibil ponderarea echilibrat ntre
ramurile ierarhiei n cazul n care numrul de elemente comparate este diferit.

PROCESUL IERARHIEI ANALITICE (AHP) Etape


3. Scalarea atributelor

Dup ce s-au fcut comparaiile pe perechi i au fost calculate ponderile


prioritilor pentru fiecare element n cadrul ierarhiei, datele de
intrare pentru fiecare alternativ trebuie transformate n valori
utilizabile nainte ca opiunile s poat fi comparate.
Un avantaj major al AHP este capacitatea sa de a ncorpora atribute care
sunt msurate pe scri diferite, la intensiti diferite, i pot include
date att numerice, descriptive, ct i categoriale. Acest lucru este
realizat prin conversia tuturor datelor la valori relative. Valorile
relative pot fi create fie prin compararea valorilor atributelor cu cele
de la alte opiuni sau prin compararea atributelor cu cele ale unei
opiuni "ideale".

PROCESUL IERARHIEI ANALITICE (AHP) Etape


4. Sinteza prioritilor
Dup ce au fost calculate valorile relative pentru fiecare din
criteriile fiecrei opiuni, aceste scoruri ale criteriilor sunt
combinate cu ponderile criteriilor din comparaiile pe perechi
pentru a determina clasamentul general al opiunilor. Produsele
fiecrui atribut cu ponderea sa sunt nsumate pe fiecare ramur
a ierarhiei. Aceast sum devine valoarea atributului pentru
nodul direct superior i procesul se repet la urmtorul nivel al
ierarhiei.

PROCESUL IERARHIEI ANALITICE (AHP)


Pa
1. Selectarea opiunilor dintre care se va alege ctigtoarea
2. Selectarea de experi care s evalueze opiunile
3. Descompunerea problemei de decizie
Pentru o selectare eficient a opiunilor, utilizatorul trebuie s
defineasc criteriile de decizie. Ierarhia coboar de la scopul din
primul nivel, la criterii mai generale n al doilea nivel i subcriterii n nivelurile urmtoare, pn la opiunile din nivelul de
baz.

PROCESUL IERARHIEI ANALITICE (AHP)


Pa
4. Efectuarea de comparri pe perechi
Comparrile pe perechi sunt efectuate n mod sistematic pentru a
include toate combinaiile de relaii ntre criterii i sub-criterii. Criterii
i sub-criteriile sunt comparate n funcie de importana lor relativ
fa de elementul printe din nivelul superior adiacent. Dup
efectuarea tuturor comparaiilor n pereche de ctre factorii de
decizie, judecile individuale sunt agregate folosind media
geometric sau media ponderat.
Atunci cnd sunt efectuate mai multe comparaii pe perechi, pot aprea
unele neconcordane. AHP ncorporeaz o tehnic eficient pentru
coerena evalurilor realizate de factorii de decizie la construirea
matricelor cu perechile de comparat implicate n proces.

PROCESUL IERARHIEI ANALITICE (AHP)


Pa
5. Ponderea final a fiecrui criteriu
Vectorii principali cu ponderile sunt nmulii cu vectorii ponderilor
sub-criteriilor corespunztoare pentru a obine ponderea
criteriilor globale.
6. Compararea pe perechi a opiunilor
Pasul final n compararea pe perechi implic compararea fiecrei
perechi de opiuni relativ la fiecare sub-criteriu.

PROCESUL IERARHIEI ANALITICE (AHP)


Pa
7. Sintetizarea rezultatelor
Ponderile prioritilor locale normalizate ale criteriilor i opiunilor
sunt combinate mpreun pentru a obine ponderile compuse
ale prioritilor globale. Ponderile globale ale fiecrei opiuni
pentru fiecare criteriu sunt obinute prin nmulirea lanului de
ponderi locale. Prioritatea general (ponderea) fiecrei opiuni
este obinut prin nsumarea ponderilor corespunztoare la
nivel global pentru toate criteriile. Atunci cnd se evalueaz
sustenabilitatea, analiza se face, de obicei, la nivelul
componentelor (ex. economice, ecologice i sociale), iar
indicatorul de sustenabilitate la nivel global poate fi obinut ca
o norm euclidian (Monein et al., 2013).

4 ANALIZA COMPONENTELOR PRINCIPALE


(PCA)
Analiza componentelor principale (Principal Component Analysis PCA) este o metod matematic, dezvoltat de Karl Pearson n
1901, pentru transformarea observaiilor asupra unor variabile
posibil corelate, n variabile independente, care sunt numite
componente principale, folosind o transformare ortogonal
(Pearson, 1901).
n prezent, PCA este folosit larg ca instrument n analiza datelor
experimentale i pentru a crea modele predictive (Li et al.,
2012).

ANALIZA COMPONENTELOR PRINCIPALE


(PCA) (cont.)
PCA poate fi realizat prin metodele calculului valorilor i
vectorilor proprii, sau prin calculul valorilor singulare ale
matricei de covarian a datelor, de obicei dup normalizarea
datelor (atributelor) la varian nul i medie unitar.
Rezultatele PCA sunt procesate, de obicei, bazat pe scorurile
componentelor
(valorile
variabilelor
transformate
corespunztor unui anumit caz din date) i pe ponderi
(loadings, cu care fiecare variabil original normalizat ar
trebui multiplicat pentru a obine scorul componentei) (Shaw,
2003).

ANALIZA COMPONENTELOR PRINCIPALE


(PCA) (cont.)
O prim soluie algebric pentru PCA poate fi obinut utiliznd
algebra linear. Aceast soluie se bazeaz pe o proprietate
important a descompunerii n vectori proprii. Setul de date
este X, o matrice m n, unde m este numrul de criterii i n
este numrul de opiuni. Scopul PCA este de a gsi o matrice
ortonormal P, cu Y = PX , astfel nct CY 1/(n1).AAT este
matrice diagonal. Liniile matricei P sunt componentele
principale ale matricei date X. CY este matricea de covarian a
matricei Y. Matricea P este selectat pentru a fi o matrice n
care fiecare linie pi este un vector propriu al matricei XXT.

ANALIZA COMPONENTELOR PRINCIPALE


(PCA) (cont.)
O alt soluie algebric pentru PCA se bazeaz pe descompunerea
n valori singulare (SVD). Matricea Y poate fi definit ca o
matrice n x m: Y 1 / (n-1)1/2XT, n care fiecare coloan a
matricei Y are media aritmetic nul. Matricea Y poate fi
descompus sub forma: Y = UVT, n care U i V sunt matrice
ortogonale, iar este o matrice diagonal. Coloanele matricei V
conin vectorii proprii ai matricei YTY = CX (matricea de
covarian a matricei X), prin urmare, coloanele matricei V sunt
componentele principale ale matricei X. Diagonala matricei
conine valorile singulare.

5 DATA MINING

Data mining (mineritul de date) este o clas de aplicaii (de baze


de date) care caut modele ascunse ntr-un grup de date care
pot fi folosite pentru a prezice comportamentul viitor.
Data mining descoper cunotine n bazele de date, relaii noi
ntre date.
Scopul general al procesului de minerit de date este de a extrage
informaii de la un set de date i a le transforma ntr-o structur
uor de neles pentru utilizarea ulterioar.

DATA MINING - Tehnici

1. Mainile cu vectori suport (Support vector machines - SVM)


sunt module de nvare supervizat cu algoritmi de nvare
asociai care analizeaz datele i recunosc modele/tipare,
utilizate pentru clasificare i analiz de regresie.
Un model SVM este o reprezentare a datelor (exemplelor) ca
puncte n spaiu, mapate astfel nct datele din categorii
diferite sunt separate de un spaiu gol ct mai larg posibil. Noi
exemple sunt apoi mapate n acelai spaiu i prezise s
aparin unei categorii pe baza poziiei fa de spaiul de
separare. Este un clasificator liniar binar non-probabilistic.

DATA MINING - Tehnici

2. Arborii decizionali (DT) utilizeaz un arbore (sau graf de decizie)


i concluziile posibile, inclusiv rezultatele evenimentelor
probabilistice, costurile resurselor i utilitatea. Un nod intern
reprezint un test pe un atribut, fiecare ramur reprezint un
rezultat al testului i fiecare nod terminal reprezint o etichet
de clas. Fiecare cale de la rdcin la un nod terminal
reprezint cte o regul de clasificare.

DATA MINING - Tehnici


3. Analiza componentelor principale (PCA) este o procedur statistic ce
utilizeaz transformarea ortogonal pentru a converti un set de
observaii asupra unor variabile posibil corelate ntr-un set de valori
de variabile linear necorelate, numite componente principale.
Numrul de componente principale este mai mic sau egal cu numrul
variabilelor originale. Aceast transformare este definit astfel nct
prima component principal are variana cea mai mare (adic este
responsabil de cea mai mare parte posibil din variabilitatea
datelor), i fiecare component succesiv la rndul su are variaia
cea mai mare posibil sub restricia c este ortogonal (adic
necorelat) cu componentele precedente. Ideea central a PCA este
de a reduce dimensionalitatea unui set de date constnd dintr-un
numr mare de variabile interdependente, pstrnd n acelai timp
ct mai mult posibil din variaia prezent n setul de date iniial, cum
este cazul n evaluarea sustenabilitii.

DATA MINING - Tehnici


4. Reele neuronale artificiale (ANN): sunt modele computaionale, de
obicei prezentate ca sisteme de uniti interconectate ("neuronii")
care pot calcula valori de ieire din cele de intrare bazat pe informaii
ce parcurg reeaua, capabile de nvare i de recunoatere de forme.
ANN proceseaz vectori numerici, deci impun ca formele (vectorii) de
intrare s fie reprezentate folosind doar caracteristici cantitative. Ele
sunt n mod inerent arhitecturi paralele i distribuite de prelucrare.
ANN pot nva ponderile de interconectare adaptiv i pot aciona ca
normalizatoare de modele i ca selectoare de caracteristici prin
alegerea corespunztoare a ponderilor. n nvarea competitiv,
modelele similare sunt grupate de ctre reea. Aceast grupare se
face automat pe baza corelaiilor datelor (Kohonen, 1989).
Arhitecturile acestor ANN sunt simple: au un singur strat. Formele
sunt prezentate la intrare i sunt asociate cu nodurile de ieire.
Ponderile ntre nodurile de intrare i cele de ieire se schimb iterativ.

DATA MINING - Tehnici

5. Clasificri Bayes naive: clasificri simple probabilistice bazate pe


aplicarea teoremei lui Bayes cu ipoteze de independen
puternice (naive).

DATA MINING - Tehnici


6. Scalare multidimensional (MDS) este un mijloc de vizualizare a
nivelului de similitudine a cazurilor individuale dintr-un set de
date. Un algoritm MDS are scopul de a plasa fiecare obiect n
spaiul N-dimensional astfel nct distanele ntre obiecte sunt
conservate ct mai bine posibil. Fiecare obiect va avea atribuite
coordonate pe fiecare din cele N dimensiuni. Este definit o
funcie de distan (metric) pe o colecie de obiecte n setul de
date, i matricea de neasemnare este construit avnd ca
elemente distanele calculate.
De obicei, MDS este folosit pentru maparea datelor dintr-un
spaiu nalt dimensional ntr-un spaiu cu mai puine dimensiuni
prin aplicarea maprii Sammon (Sammon, 1969), care ncearc
s pstreze structura distanelor ntre puncte din spaiul de
dimensiuni superioare n cel n care se realizeaz proiecia.

DATA MINING - Tehnici


7. Analiza cluster realizeaz gruparea obiectelor dintr-o mulime
astfel nct obiectele din acelai grup (numit cluster) sunt mai
similare ntre ele dect cu cele din alte grupuri. Principalii
algoritmi de grupare folosii n mineritul de date sunt: k-means,
fuzzy c-means i algoritmul arborelui de auto-organizare (Jain et
al., 1999). Metodele cluster sunt folosite n mineritul de date
pentru segmentarea bazei de date n grupuri omogene. Kmeans efectueaz o grupare clar, care asociaz un vector de
date unui singur cluster. Algoritmul se termin atunci cnd
atribuirile ctre clustere nu se mai schimb. Algoritmul K-means
utilizeaz distana euclidian a punctelor la centroidele
clusterelor pe atributele selectate i selecteaz clusterul cu
distana minim. Fuzzy clustering asociaz fiecare form cu
fiecare cluster folosind funcii de apartenen (Zadeh, 1965).

DATA MINING - Tehnici

8. Analiza de regresie multipl, prezentat la analiza decizional


multicriterial, este, de asemenea, util pentru mineritul de
date n evaluarea sustenabilitii (Shaheen et al., 2012).

DATA MINING - Tehnici

9. Inducia de reguli fuzzy nva un model de regul fuzzy pe date


numerice etichetate. n primul rnd, este colectat din mediu un
set de date de antrenament.
Datele colectate sunt grupate i difuzate (fuzzificate),
sunt definite funcii de apartenen iniiale pentru atributele de
intrare,
este construit un tabel de decizie iniial, apoi este simplificat,
sunt reconstruite funciile de apartenen i, n cele din urm,
sunt create regulile de decizie din tabelul de decizie.

DATA MINING - Tehnici


10. Algoritmi genetici: sunt abordri evolutive, fcnd uz de operatori
evolutivi i o populaie de soluii pentru a obine partiionarea global
optim a datelor. Soluiile candidat ale problemei de grupare sunt
codate ca cromozomi. Operatorii evolutivi cel mai frecvent utilizai
sunt: selecia, recombinarea i mutaia. Fiecare transform unul sau
mai muli cromozomi de intrare ntr-unul sau mai muli cromozomi de
ieire. O funcie de adecvare (fitness) aplicat unui cromozom
determin probabilitatea de supravieuire (participare la crearea de
urmai) n generaia urmtoare a cromozomului respectiv. Selecia
folosete un sistem probabilistic, astfel nct soluiile cu fitness mai
mare au o probabilitate mai mare de a avea descendeni. Operatorul
de recombinare cel mai folosit este ncruciarea (crossover). Mutaia
transform cromozomul de intrare n cromozom de ieire prin
complementarea valorii unui bit sau modificarea valorii numerice la o
poziie selectat aleatoriu n cromozomul de intrare.

DATA MINING (cont.)


Principalele sarcini ale mineritului de date pentru
dezvoltare durabil sunt:
explorarea i vizualizarea datelor,
descoperirea de tipare,
detectarea de anomalii,
predicia i prognoza (bazat pe arborele decizional)
(Morik et al., 2012), i
generarea iniial a regulilor fuzzy (Shaheen et al.,
2012).
Mineritul de date pentru sustenabilitate poate fi gndit
n termenii unei matrice cu subiecte ale abordrilor
ecologice i inginereti pe coloane i sarcinile
mineritului de date ca linii (Morik et al., 2012).

6 SISTEME EXPERT
Un sistem expert este un sistem informatic care emuleaz
activitatea decizional a unui expert uman. Este un instrument
de decizie interactiv, bazat pe calculator, care utilizeaz att
fapte ct i euristica pentru a rspunde la problemele dificile de
decizie bazat pe cunotinele obinute de la un expert. Un
sistem expert este mprit n dou sub-sisteme principale: (1)
motorul (mecanismul) de inferen i (2) baza de cunotine.
Baza de cunotine conine aseriuni (fapte) i reguli. Motorul
de inferen aplic regulile asupra faptelor cunoscute pentru a
deduce fapte noi. Motoarele de inferen pot include, de
asemenea, capabiliti pentru explicare i pentru depanare
(Leondes, 2002).

SISTEME EXPERT (cont.)


Dei sistemele expert utiliznd modele euristice sunt utile n
caracterizarea tipurilor diferite de cunotine, acestea sunt
insuficiente pentru a aborda problemele de proiectare
inginereti ntr-un mod ncorporat (pek i colab. , 2013).
Proiectarea inginereasc, de obicei, urmeaz o abordare de
tipul generare-i-testare, n care sunt produse rspunsuri
(soluii) i apoi estimate pe baza unor criterii de conformitate.
Producerea i evaluarea simultan a unei explicaii nu poate fi o
abordare de succes n multe situaii, n cazul n care cantitatea
de soluii poteniale care pot fi generate este foarte mare.

SISTEME EXPERT (cont.)


Sistemul expert prezint fazele de:
dobndire (achiziie) a cunotinelor,
reprezentarea cunotinelor i
aplicarea mecanismului de inferen.
Baza de cunotine este compus din cunotine ale
experilor specializai ntr-un anumit domeniu. Inginerul
de cunotine transform informaiile primite de la
experii umani, n conformitate cu structura sistemului
expert, n baza de cunotine.

SISTEME EXPERT (cont.)

Cunoaterea este, de obicei reprezentat sub form de


reguli DACATUNCI (IFTHEN). n cazul volumelor
mari de informaii, sunt utilizate baze de date pentru
depozitare i sunt definite reguli prototip, care sunt
instaniate folosind informaiile din baza de date.
Pentru fiecare nregistrare din baza de date este
generat o regul atunci cnd este necesar, utiliznd
coninutul cmpurilor din nregistrare.

SISTEME EXPERT (cont.)


Inferena este folosit pentru a obine comportamentul sistemului
analizat pe baza strii, sau pentru obinerea strii pe baza
comportamentului. Asemenea inferene sunt numite cu
nlnuire nainte (atunci cnd partea DAC antecedentul
este cunoscut a fi adevrat i trebuie aflat valoarea de
adevr a prii ATUNCI consecventul ), respectiv nlnuire
napoi (atunci cnd consecventul este cunoscut a fi adevrat i
trebuie aflat valoarea de adevr a antecedentului).
Transpunerea cunotinelor dobndite de la experi ntr-un model
conceptual necesit identificarea de entiti (elemente de
informaie), de relaii ntre aceste elemente, i a proceselor
(fluxului de informaii).

7 SINTEZA INSTRUMENTELOR
I METODELOR
O analiz a rezultatelor obinute prin utilizarea diferitelor
instrumente i metode prezentate n literatura de specialitate
pentru evaluarea proceselor de dezvoltare sustenabil a
evideniat urmtoarele opiuni:
1) pentru normalizarea datelor:
a) normalizare 0-1 (Min-Max, scalare la [0, 1], metoda
intervalului): x (x xmin) / (xmax xmin); uneori este folosit
intervalul [0, 100] (procentual): x 100 (x xmin) / (xmax xmin);
b) scorul standard (Z-score): fiecare coloan a matricei datelor este
transformat pentru a avea variana unitar i media nul: x
(x ) / , unde este media aritmetic a valorilor i este
deviaia standard a setului de valori;
c) raportul fa de maxim (criteriu de maxim): x x / xmax .

SINTEZA INSTRUMENTELOR I
METODELOR (cont.)
2) Pentru a obine ponderile criteriilor i opiunilor:
a) oferite de ctre experi;
b) vectorii proprii corespunztori celei mai mari valori proprii a matricei comparaiilor pe
perechi, pentru AHP;
c) primul vector singular al matricei normalizate a datelor;
d) vectorul propriu corespunztor celei mai mari valori proprii a matricei de covarian a
datelor;
e) suma ponderat a vectorilor singulari dreapta ai matricei de date normalizate, cu
raportul dintre valorilor proprii corespunztoare i suma tuturor valorilor proprii
respective, ca ponderi; valorile proprii sunt calculate din valorile singulare prin
ridicare la ptrat;
f) suma ponderat a vectorilor singulari dreapta ai matricei de date normalizate, cu
raportul dintre rdcinile ptrate ale valorilor proprii corespunztoare i suma
tuturor rdcinilor ptrate ale valorilor proprii corespunztoare, ca ponderi; valorile
proprii sunt calculate din valorile singulare prin ridicare la ptrat;
g) suma elementelor din fiecare linie a produsului matricei de date normalizate i
matricea vectorilor proprii dreapta;
h) raportul dintre elementul cel mai mare al unui vector singular dreapta i valoarea
proprie corespunztoare.

SINTEZA INSTRUMENTELOR I
METODELOR (cont.)

3) Pentru a gsi proprietile matricelor:


a) vectorii proprii i valorile proprii (pentru matrice ptrate);
b) vectorii singulari i valorile singulare.

8 UTILIZAREA I ANALIZA
PERFORMANELOR
INSTRUMENTELOR
Pentru a putea compara performanele diferitelor instrumente de
evaluare a sustenabilitii, aceeai problem a fost rezolvat
utiliznd un numr mare de abordri diferite. Problema a fost
aleas pentru a fi una care a fost subiectul unui articol publicat
n domeniu (Chatzimouratidis i Pilavachi, 2012): pentru a
evalua 10 tipuri majore de sisteme de producere a energiei
electrice sub 12 criterii, din punct de vedere al calitii vieii.
Scorurile opiunilor pentru fiecare din cele 12 criterii sunt luate
din aceast surs.

8.1 VISUAL PROMETHEE


Software-ului Visual PROMETHEE (http://www.prometheegaia.net/vpa.html) a fost folosit pentru a crea un tabel de
scoruri pentru 10 opiuni pentru generarea de energie electric:
crbune/lignit( Coal), produse petroliere lichide (Oil), gaz
natural (NGT), gaz natural n ciclu combinat (NGCC), nuclear
(Nuc), hidro (Hydro), eolian (Wind), fotovoltaic (Photo),
biomas (Bio), i geotermal (Geo), avnd n vedere 12 criterii:
decese prin accidente (Acc), compui organici volatili, alii dect
metanul (NVOCs), echivalent CO2 (CO2), NOx (NOx), SO2 (SO2),
pulberi n suspensie (Part), radioactivitate (Radio), necesarul de
teren (Land), echilibrul ecosistemului (Eco), raportul
rezerve/producie (Res), crearea de locuri de munc (Job) i
acceptarea social (Soc), utilizate n (Chatzimouratidis i
Pilavachi 2008, 2012).

VISUAL PROMETHEE (cont.)


Au fost create dou scenarii: unul cu ponderi egale i unul cu
ponderi calculate folosind descompunerea valorilor singulare
(SVD) ale matricei de date.
Figura urmtoare prezint datele iniiale pentru problema de
decizie n cazul ponderilor calculate folosind descompunerea
valorilor singulare ale matricei de date. Pentru a obine
ponderile, n primul rnd coloanele din matricea de date sunt
normalizate prin scalare la intervalul [0, 1]. Apoi este efectuat
descompunerea valorilor singulare ale matricei de date
normalizate. La urm, primul vector singular este scalat la sum
unitar, rezultnd vectorul ponderilor.
Odat ce au fost stabilite aciunile, criteriile i parametrii
preferinei (funciile de preferin i ponderile), se poate
construi clasamentul (ordonarea) opiunilor utiliznd metoda
PROMETHEE.

VISUAL PROMETHEE (cont.)


Datele de intrare

VISUAL PROMETHEE (cont.)

O comparaie a
scenariilor este
prezentat n figura
alturat, evideniind
modificarea ierarhiei
din cauza modificrii
ponderilor. n ambele
scenarii, cele mai
bune trei opiuni sunt
aceleai, n aceeai
ordine.
Fig. 7

8.2 M-MACBETH
Aplicaia software M-MACBETH (www.m-macbeth.com) a fost
folosit pentru a rezolva aceeai problem ca i n cazul Visual
PROMETHEE.
Utilizarea M-MACBETH presupune, la un nivel simplu, c opiunile
sunt sortate de ctre utilizator n funcie de atractivitatea lor
pentru fiecare criteriu, iar criteriile sunt sortate n funcie de
importana lor. Pentru a putea compara rezultatele cu cele
obinute n condiii mai complexe, ponderile opiunilor au fost
calculate utiliznd scalarea 0-100 pe datele disponibile
(Chatzimouratidis i Pilavachi, 2008, 2012).

M-MACBETH (cont.)

Agregarea rezultatelor pentru fiecare criteriu pentru obinerea


scorurilor globale pentru opiuni. Agregarea se realizeaz
utiliznd sume ponderate. Ponderile sunt stabilite de analist.
O prim analiz a fost realizat lund n considerare ponderi egale
ale criteriilor. Scorurile obinute pentru fiecare criteriu i
scorurile globale sunt prezentate n figura urmtoare.
Opiunile cu scorurile mai mici sunt de preferat. Pentru problema
dat, cea mai bun soluie este generarea de energie electric
folosind energia geotermal, iar soluia cel mai proast este
generarea de energie din hidrocarburi lichide.

M-MACBETH (cont.)

Scorurile globale i pe criterii

M-MACBETH (cont.)

O a doua analiz a fost efectuat folosind ponderi calculate pe


baza descompunerii n valori singulare a matricei criteriilor de
comparaie.
Cu ponderile astfel calculate, a fost obinut un nou clasament al
opiunilor, prezentat n figura urmtoare. Cele mai bune dou
opiuni i cele mai proaste sunt n aceleai poziii ca n cazul
ponderilor egale.

M-MACBETH (cont.)

Scorurile calculate utiliznd M-MACBETH cu ponderi pentru criterii calculate


utiliznd SVD al matricei de date

9 REFERINE BIBLIOGRAFICE
Aczel, A. D. (2009), Complete Business Statistics, Irwin Professional Pub.
Bana e Costa, C. & Vansnick, J. (1999), The MACBETH approach: Basic ideas, software and
an application, in N. Meskens & M. Roubens, ed., 'Advances in Decision Analysis',
Kluwer Academic Publishers, Dordrecht, , 131-157.
Berthold, M. R.; Cebron, N.; Dill, F.; Gabriel, T. R.; Ktter, T.; Meinl, T.; Ohl, P.; Sieb, C.; Thiel,
K. & Wiswedel, B. (2008), KNIME The Konstanz Information Miner, in Christine
Preisach; Hans Burkhardt; Lars Schmidt-Thieme & Reinhold Decker, ed., 'Data Analysis,
Machine Learning and Applications', Springer, Berlin Heidelberg, 319-326.
Berthold, M. R.; Cebron, N.; Dill, F.; Gabriel, T. R.; Ktter, T.; Meinl, T.; Ohl, P.; Thiel, K. &
Wiswedel, B. (2009) KNIME The Konstanz Information Miner. ACM SIGKDD
Explorations Newsletter, 11(1), 26-31.
Boggia, A. & Cortina, C. (2010), 'Measuring sustainable development using a multi-criteria
model: A case study', Journal of Environmental Management 91, 2301-2306.
Chatzimouratidis, A. & Pilavachi, P. (2008) 'Multicriteria evaluation of power plants impact
on the living standard using the analytic hierarchy process', Energy Policy, 36, 1074
1089.
Chatzimouratidis, A. I. & Pilavachi, P. A. (2012), 'Decision support systems for power plants
impact on the living standard', Energy Conversion and Management, 2012, 64, 182198.

REFERIN

(cont.)

De Brucker, K.; Macharis, C. & Verbeke, A. (2013), 'Multi-criteria analysis and the resolution
of sustainable development dilemmas: A stakeholder management approach',
European Journal of Operational Research 224, 122-131.
Deelstra, T. (1998), Towards Ecological Sustainable Cities: Strategies, Models and Tools, in
Jrgen Breuste; Hildegard Feldmann & Ogarit Uhlmann, ed., 'Urban Ecology', Springer,
Berlin Heidelberg, 17-22.
Ishizaka, A. & Nemery, P. (2013), Multi-Criteria Decision Analysis, John Wiley & Sons Ltd.
pek, M.; Selvi, h. H.; Findik, F.; Torkula, O. & Cedimolu, I. (2013), 'An expert system based
material selection approach to manufacturing', Materials & Design 47, 331-340.
Jolliffe, I. T. (2002), Principal component analysis, Springer, New York.
Khalili, N. R. & Duecker, S. (2013), 'Application of multi-criteria decision analysis in design
of sustainable environmental management system framework', Journal of Cleaner
Production 47, 188-198.
Kohonen, T. (1989), Self-Organization and Associative Memory, Springer, New York.
Leondes, C. T., (Ed.) (2002), Expert Systems, Elsevier.
Li, T.; Zhang, H.; Yuan, C.; Liu, Z. & Fan, C. (2012), 'A PCA-based method for construction of
composite sustainability indicators', Int J Life Cycle Assess 17, 593-603.
Macharis, C.; Brans, J.-P. & Marechal, B. (1998), 'The GDSS PROMETHEE Procedure', Journal
of Decision Systems 7, 283-307.

REFERIN

(cont.)

Mitchell, B. (2002), Resource and Environmental Management, Prentice Hall PTR.


Moneim, A. F. A.; Galal, N. M. & El Shakwy, M. (2013), 'Sustainability manufacturing
indicators', Global Climate Change. Biodiversity and Sustainability. GCCCBS2013
Conference, 1-12.
Morik, K.; Bhaduri, K. & Hillol, K. (2012), 'Introduction to data mining for sustainability',
Data Mining and Knowledge Discovery 24(2), 311-324.
Munda, G.; Nijkamp, P. & Rietveld, P. (1994), 'Qualitative multicriteria evaluation for
environmental management', Ecological Economics 10(2), 97-112.
Nijkamp, P.; Rietveld, P. & Voogd, H. (1990), Multicriteria evaluation in physical planning,
North-holland, New York, USA.
Pearson, K. (1901), 'On lines and planes of closest fit to systems of points in space.', Philos
Mag. 2, 559-572.
Qin, X.; Huang, G.; Chakma, A.; Nie, X. & Lin, Q. (2008) A MCDM-based expert system for
climate-change impact assessment and adaptation planning A case study for the
Georgia Basin, Canada Expert Systems with Applications, 34, 2164-2179

REFERIN

(cont.)

Roman, M. (2012) 'Analiza multi-criterial. Manual', Proiectul 'Dezvoltarea capacitii


pentru Analiza Cost-Beneficiu', FEDR POAT 2007-2013, Academia de Studii Economice,
Facultatea de Cibernetic, Statistic i Informatic Economic, disponibil la:
http://www.fonduri-ue.ro/res/ filepicker_users/cd25a597fd62/Documente_Suport/Studii/0_Studii_Instrumente_Structurale/
Pag.3_ACB/19_Analiza_Multicriteriala.pdf
Sammon, J. W. (1969). 'A nonlinear mapping for data structure analysis'. IEEE Transactions
on Computers 18, 401409.
Shaheen, M.; Shahbaz, M. & Afsar Khan Jadoon, K. (2012) 'Data Mining For Wind Energy
Site Selection', in Proceedings of the World Congress on Engineering and Computer
Science 2012 Vol I WCECS 2012, October 24-26, 2012, San Francisco, USA'.
Shaw, P. J. A. (2003), Multivariate Statistics for the Environmental Sciences, Hodder Arnold,
London.
Singh, R. K.; Murty, H.; Gupta, S. & Dikshit, A. (2007), 'Development of composite
sustainability performance index for steel industry', Ecological Indicators 7(3), 565-588.
WCED (1987) World Commission on Environment & Development: Our Common Future,
Oxford University Press, Oxford, UK.
Zadeh, L. A. (1965), Fuzzy sets, Information Control, 8, 338-353.

S-ar putea să vă placă și