Documente Academic
Documente Profesional
Documente Cultură
Introduccin
Revisadas los principales teoras referidas a la modelizacin de la sostenibilidad,
as como a su medicin en base al uso de indicadores, en los siguientes captulos se trata
de avanzar en la opcin de la definicin de un indicador sinttico de calidad del
desarrollo urbano aplicado a las ciudades ms pobladas de Andaluca.
A la hora de elaborar ndices o indicadores sintticos existe una larga tradicin en
materia de prediccin y anlisis de ciclos econmicos232. De las mltiples posibilidades
metodolgicas existentes, tras una serie de comentarios generales referidos al uso de
tcnicas multivariantes, en este captulo se exponen sucintamente los tres mtodos de
anlisis estadstico que se aplicarn seguidamente para la obtencin de dicho ndice. Se
han seleccionado bsicamente tres mtodos de anlisis multivariante:
a) Anlisis de Componentes Principales (ACP). Se trata de la tcnica con mayor
aceptacin en la elaboracin de ndices aplicados ampliamente a todos los
mbitos de las ciencias sociales y ambientales.
b) Anlisis de la Distancia P2 (ADP2). Como mtodo representativo del grupo de
tcnicas referidas a la medicin de distancias, el ndice DP2 se ha aplicado a la
elaboracin de indicadores sintticos en Economa.
c) Agregacin de Conjuntos Difusos (ACD). Esta tcnica se basa en la teora de
los conjuntos difusos (fuzzy sets theory) como forma para salvar la vaguedad
e imprecisin de la informacin estadstica disponible y del concepto a medir,
el desarrollo.
Finalmente, se enuncian los principales condicionantes derivados de un enfoque
basado en el uso de indicadores como medida del desarrollo a partir de sus
componentes, as como las propiedades que ha de cumplir un buen ndice.
Entre otras referencias clsicas, destacan Burns y Mitchell (1946), Hymans (1973), Auerbach (1982) y
Lahiri y Moore (1991), as como Maravall (1989), Melis (1983) e INE (1994) en Espaa. No obstante,
autores como Koopmans (1947) critican abiertamente la construccin de indicadores sintticos sin la
adecuada base terica previa.
232
257
258
valor se define como una combinacin lineal de la realizacin de las variables aleatorias
(Xj) con ponderaciones (wj) determinadas empricamente por la tcnica multivariante
especfica:
Valor Terico: w1 X1 + w2 X2 + ...+ wj Xj+ ... + wp Xp
Dependiendo de la tcnica multivariante, el valor terico tendr una funcin
definida en base al tipo de anlisis realizado: de dependencia o de interdependencia. Por
ejemplo, en el Anlisis Factorial, tcnica para el anlisis de la interdependencia, el valor
terico trata de representar las estructuras subyacentes o la dimensionalidad de las
variables tal y como se representan en sus correlaciones.
Los pasos genricos de todo anlisis multivariante suelen ser los siguientes
(Anderson, 1984):
1. Definicin del objetivo de la investigacin, as como de la tcnica
multivariante conveniente.
2. Desarrollo y planificacin del anlisis, formulando los supuestos bsicos del
anlisis multivariante.
3. Evaluacin de los supuestos bsicos y su incidencia en la capacidad para
representar las relaciones multivariantes.
4. Estimacin del modelo multivariante y valoracin del ajuste del modelo.
5. Interpretacin del valor terico para identificar la evidencia emprica de las
relaciones multivariantes de los datos.
Una cuestin previa a la aplicacin de la tcnica multivariante es el anlisis de los
datos, hecho que redundar en un mejor conocimiento de las relaciones entre las
variables as como una mejor fiabilidad en los resultados obtenidos. Para ello puede
realizarse el siguiente procedimiento (Hair et al., 1999):
1. Descripcin de los datos. Mediante el habitual anlisis estadstico de medidas
descriptivas, etc.
2. Identificacin y tratamiento de los datos ausentes y atpicos. Estableciendo las
posibles causas, lo que llevar a distintos procedimientos en cada caso, tales
como el mantenimiento de las variables o casos con este tipo de problemas,
aplicar tcnicas de imputacin, o bien la eliminacin del anlisis.
3. Verificacin de los supuestos del anlisis multivariante sobre las variables
individuales, su distribucin conjunta y el valor terico final. Estos supuestos
259
Hiptesis II. Bondad de los indicadores simples. Se acepta que los indicadores
parciales o simples son buenos en el sentido de que miden adecuadamente
los estados en que se encuentra cada componente en el momento del tiempo a
que se refiere (se minimizan los errores de medicin).
Siguiendo a Pena (1977), es importante definir las condiciones que a priori han de
exigirse a un indicador sinttico genrico I:
Postulado III. Unicidad. El ndice ha de ser nico para una situacin dada.
La importancia de estas hiptesis es clara dado que el instrumento de las dos primeras tcnicas es el
anlisis de la correlacin existente entre las variables consideradas.
233
260
Postulado VI. Transitividad. Si (a), (b) y (c) son tres situaciones distintas del
objetivo medible por el ndice, e I(a), I(b) e I(c) son los valores del indicador
correspondiente a esas tres situaciones, debe verificarse que:
Los ndices elaborados mediante el DP2 cumplen estas condiciones, sin embargo,
los indicadores basados en el Anlisis Factorial no cumplen las propiedades siguientes
(Zarzosa, 1996):
a) El postulado III (si la extraccin de los factores no es mediante el mtodo de
los componentes principales),
b) El postulado IV (se han de estandarizar previamente los indicadores),
c) El postulado V, pues no se derivan medidas cardinales, slo ordinales.
d) El postulado VI, pues al modificar la matriz inicial y aadir un nuevo
elemento o variable puede afectar a las ordenaciones finales en las
puntuaciones de los factores.
Considerando como objetivo el establecimiento de una medida sinttica del
desarrollo234, diversas crticas pueden efectuarse sobre las metodologas seleccionadas,
tanto sobre los ndices elaborados a partir de componentes principales como en las
medidas de distancia. La principal se centra en el no cumplimiento de alguna de las
hiptesis de partida arriba comentadas, lo que sumado a la asignacin de ponderaciones
en base a correlaciones empricas, puede llevar a resultados alejados a la realidad. Si no
se realiza una seleccin correcta de los indicadores simples, o si sta no abarca las
principales dimensiones del objeto de estudio, difcilmente el ndice final indicar algo
representativo acerca de la cuestin principal.
Muchas son las crticas sobre el uso de medidas sintticas del desarrollo centradas en los problemas
que conlleva la seleccin correcta de los indicadores, su comparabilidad, la generalizacin excesiva, los
efectos compensatorios, la mayor importancia de factores como el crecimiento econmico o la renta, etc.
234
261
Estas tcnicas son desarrolladas inicialmente por Pearson (1901), Spearman (1904), Hotelling (1933) y
Rao (1965), siendo muy utilizadas en anlisis psicosociales por la Escuela de Chicago, con Thurstone
(1947) o Vernon (1950) entre otros. Se pueden citar numerosas referencias, entre las que destacan desde
una perspectiva metodolgica: Kendall (1975), Harman (1976), Lebart et al. (1977), Anderson (1984),
Comrey (1985), Dillon y Goldstein (1984), Johnson y Wichern (1998) y Hair et al. (1999). En Espaa son
importantes las referencias a Cuadras (1981), Snchez (1984), Mallo (1985), Batista y Martnez (1989) y
Uriel (1995), entre otros. De entre las aplicaciones del ACP al mbito de estudio de este trabajo destacan
King (1974), Ram (1982), Slottje et al. (1991), Young (1999), Lai (2000) y en Espaa INE (1986;1991),
Somarriba y Lpez (2000), entre otros.
235
262
Se recuerda que un supuesto bsico de esta tcnica es la existencia de relaciones lineales entre las
variables, hecho que, como argumenta Pena (1977), no resulta excesivamente restrictivo en anlisis
centrados en el desarrollo socioeconmico a la hora de identificar relaciones causa-efecto.
237 Lgicamente, ello supondr una menor correlacin observada entre las variables as como la posible
inconsistencia posterior al aplicar test estadsticos de significacin sobre los factores, hecho no obstante
poco frecuente (Hair et al., 1999).
238 De hecho puede aplicarse un contraste de esfericidad de Bartlett (1950) para verificar la hiptesis de
correlacin entre cada par de variables. No obstante, ante la presencia de medidas con cierto grado de
heterogeneidad y muy diferentes escalas se opta por el uso de las variables estandarizadas (ACP normado).
239 En este sentido, Uriel (1995) aboga directamente por el uso de variables ratio, dado que eliminan el
problema de magnitud o escala que enmascara otras caractersticas ms profundas (Op. cit. pg. 333). No
obstante, esta prctica acarrea otro tipo de problemtica, modificando la forma de la distribucin y
236
263
concediendo quizs demasiada importancia a casos que en trminos absolutos estaran localizados en las
colas de la distribucin de cada variable.
240 Como sealan Garca et al. (2000), cuando se trabaja con variables categricas o dicotmicas el
coeficiente de correlacin de Pearson pierde validez siendo necesarios otros coeficientes basados en la
Chi-cuadrado (C de Contingencia, V de Cramer) o los coeficientes phi respectivamente. No obstante en
esos casos es recomendable el uso de otras tcnicas multivariantes como el Escalamiento
Multidimensional, el Anlisis de Correspondencias o el Anlisis de Conglomerados jerrquico.
241 La mayora de autores constatan cierto grado de confusin entre el ACP y el Anlisis Factorial comn,
a pesar de las diferencias en sus objetivos, sus caractersticas y su grado de formalizacin (Uriel, 1995). Sin
duda, a ello contribuye el hecho de que el ACP sea una de las posibles tcnicas aplicables para la
definicin de la primera matriz factorial en el Anlisis Factorial. Sin embargo, el objetivo del presente
trabajo no pasa por el anlisis exhaustivo de ambos mtodos. El ACP es la tcnica de uso generalizado
dado que no presenta los problemas prcticos del Anlisis Factorial comn tales como indeterminacin de
factores (las puntuaciones u ordenaciones resultado del anlisis no son nicas para cada caso) o la
dificultad en el clculo emprico de la variancia comn. No obstante, diversas investigaciones apuntan a la
convergencia de ambos resultados (Velicer y Jackson, 1990).
264
x n1
x12
x 22
...
xn 2
... x1 p
... x 2 p
... ...
... x np
S
V = 21
...
S p1
S12
2
2
S
...
S p2
... S1 p
... S 2 p
... ...
... S p2
Si se parte de variables con las mismas unidades de medida, se puede realizar el anlisis en base a la
matriz de covariancias, no obstante las variables con variancias muy elevadas introducirn un sesgo
dominando los componentes iniciales (Jolliffe, 1986). Por ello es preferible extraer los componentes a
partir de R, lo que equivale a hacerlo a partir de la matriz inicial con los valores estandarizados,
concediendo a todas las variables la misma importancia (ACP normado). Una tercera alternativa pasa por
el ACP ponderado, en el que a cada variable o grupo de stas se le asignan distintos pesos relativos (p.e.:
la inversa de la raz de la desviacin tpica de los valores propios obtenidos en un ACP previo).
242
265
1
r
21
R=
...
rp1
r12
1
...
rp 2
... r1 p
... r2 p
... ...
... 1
Z 11 x11
Z x
12 = 12
... ...
Z 1n x1n
x 21
x 22
...
x2n
... x p1 u11
... x p 2 u12
... ... ...
... x pn u1 p
266
u
j =1
2
1j
= u1u1 = 1
Var ( z1 ) =
Z
i =1
2
1i
1
1
1
z1 z1 = u1 X Xu1 = u1 X X u1
n
n
n
u
j =1
2
1i
= u1u1 = 1 , se conforma
el langrangiano a maximizar:
L = u1Vu1 (u1u1 1)
Derivando respecto a u1 e igualando a cero:
L
= 2Vu1 2u1 = 0 ; (V I )u1 = 0
u1
Al resolver esa expresin se obtienen races caractersticas o autovalores
(eigenvalues). El vector u1 es el vector caracterstico (eigenvector) correspondiente a la
raz caracterstica mayor (1 ) de la matriz V .
267
Traza (V ) = h
h =1
268
h
Traza (V )
Resulta habitual determinar las covariancias y las correlaciones entre las variables
originales y los componentes principales. La covariancia entre la variable X j y la
componente Z h es:
Cov( X j , Z h ) = huhj
La correlacin entre la variable tipificada X j y la componente Z h es:
r jh =
h u hj
var( X j ) h
= u hj h
244
Ph =
h
.
p
269
j =1
Se trata de los dos mtodos ms importantes, sin embargo pueden mencionarse otros tales como el de
Mxima Verosimilitud, Mnimos Cuadrados No Ponderados, Mnimos Cuadrados Generalizados,
Factorizacin Alfa y Factorizacin Imagen.
246 Otras tcnicas vienen recogidas en Cuadras (1996:286-291).
247 Jolliffe (1972) propone, en base a simulaciones, que el valor lmite para seleccionar un componente
puede llegar a ser 0,7. No obstante, este hecho repercute en una menor explicabilidad de la variancia total
del componente en cuestin, que ni siquiera explica la variancia contenida en una variable.
245
270
El tipo de rotacin ms usada es la ortogonal al mantener independientes los componentes finales. Por
su parte, la rotacin oblicua muestra una mayor interpretabilidad, permitiendo que los componentes estn
relacionados entre s. Dentro de los mtodos de rotacin ortogonal se encuentran distintas tcnicas como
VARIMAX, EQUAMAX y QUARTIMAX. El mtodo VARIMAX es el ms utilizado, consistente en la
maximizacin de la suma de variancias de la matriz de factores. En referencia a la rotacin oblicua, no
existe un consenso que permita sealar la tcnica ms frecuente, dependiendo en la mayora de los casos
del paquete de anlisis estadstico que se maneje (para SPSS 10.0 se incluyen OBLIMIN directo y
PROMAX) y del grado de explicabilidad finalmente obtenido.
248
271
asignar el mismo peso a todos los componentes y combinar las variables suplentes
mediante la media aritmtica simple249.
En el caso del clculo de las puntuaciones factoriales, se parte de la matriz de
coeficientes de puntuaciones de los componentes o factores250, la cual muestra los valores de u hi
para calcular el valor del componente h-simo para el caso i.
Z hi = u h1 X 1i + u h 2 X 2i + + u hp X pi
h = 1,2, , p
i = 1,2, , n
As, todas las variables influyen en alguna medida en la puntuacin final del caso.
Lo habitual es presentar las puntuaciones de forma tipificada:
Z hi
h
u h1
h
X 1i +
uh2
h
X 2i + +
u hp
h
X pi
h = 1,2, , p
i = 1,2, , n
272
273
d (i, i*) =
(x
j =1
ij
xi* j ) 2
En notacin matricial:
d 2 (i, i*) = ( xi xi* )( xi xi* )
O bien tambin se normaliza253, dividindose entre las variancias de cada variable:
p
En notacin matricial:
d e2 (i, i*) = ( xi xi* ) Dx1 ( xi xi* )
Como se seala en Hair et al. (1999: 504) el uso de datos no estandarizados implica una inconsistencia
en las medidas de distancias derivada del cambio de la escala de las variables.
253
274
En forma matricial:
d m2 (i, i*) = ( xi xi* )C x1 ( xi xi* )
Donde Cx es la matriz de covariancias.
La distancia d m frente a la distancia eucldea aporta las ventajas de tener en cuenta
la escala de medida de las variables y considerar adems la correlacin entre las mismas
( d m se hace mxima cuando stas son incorrelacionadas). Se trata en realidad de la
distancia eucldea ponderada por la matriz de covariancias. Sin embargo, no cumple la
propiedad de desigualdad triangular, por lo que no es una distancia en un espacio
mtrico.
Por otra parte, si se deja de lado momentneamente su interpretacin anglosajona,
el ACP no resulta un mtodo ajeno al concepto de distancia segn la mtrica eucldea
(Lebart et al., 1995). De hecho, ya desde las bases para su formulacin inicial (Pearson,
1901) se trata de encontrar la forma de ajustar hiperplanos segn el criterio de mnimos
cuadrados ortogonales. Por ello, el ACP tambin puede contemplarse como un mtodo
geomtrico de distancias254 en el que se evalan las similaridades o distancias entre casos
(o variables) considerando el grado de correlacin entre las variables de una amplia
matriz de datos. De hecho, en el ACP, la distancia entre dos casos (i, i*) se puede definir
como la distancia de Mahalanobis (Cuadras, 1981) que define la inercia de la nube de
puntos.
En palabras de Batista y Martnez (1989:34): la tcnica determina un subespacio de dimensin m
(m<p<N), que en cierta manera optimiza el ajuste de una nube de puntos, de manera que las distancias
medidas en este subespacio, reflejen de la mejor forma posible las distancias reales entre las variables y
entre los objetos y sus representaciones respectivas en los espacios RN y RP.
254
275
Sin embargo, esta distancia puede plantear problemas al partir del supuesto de
incorrelacin entre las variables.
Variaciones sobre este tipo de distancias basadas son:
a) La distancia de Chebishev es:
d C (i, i*) = max xij xi* j ; j
b) La distancia F de Frechet:
p
xij xi* j
j =1
d F (i, i*) =
d M (i, i*) = r
x
j =1
ij
xi * j
; r = 1,2,3,...
276
xij xi* j
j =1
d I (i, i*) =
j 1
(1 r
ij .1, 2 ,...,i 1
), i < j
i =1
Donde rij .1, 2,...,i 1 es el coeficiente de correlacin parcial entre el componente isimo y el j-simo.
En su representacin matricial:
d I (i, i*) = r xi xi*
Donde r es el vector de ponderaciones definido sobre la base del conjunto de
correlaciones parciales, y es la matriz diagonal con los inversos de las desviaciones
tpicas de las variables. Dado que el resultado del ndice vara si se cambia el orden de
introduccin de las variables, es necesario establecer el orden de incorporacin idneo
de cada componente, en funcin a su aportacin de informacin. Para ello, Ivanovic
describe un mtodo de aproximacin iterativo, basado en el uso del coeficiente de
correlacin entre el resultado anterior del ndice calculado para cada caso (partiendo de
la distancia de Frechet
xij xi* j
j =1
255
277
en la situacin de
referencia:
xi = (xi1 , xi2 , , xi j , , xi p )
El ndice P2 para comparar los vectores xi , xi* es definido de la siguiente forma:
x ij x i* j
j =1
DP2 =
(1 R
2
j j 1, j 2 , ...1
xij xi* j
j
. Dividiendo la distancia
278
DP2 =
xi1 xi*1
1
xi 2 xi*2
2
(1 R )+ x
2
21
i3
xi*3
3
(1 R )+ ... +
2
32 ,1
xip xi* p
p
(1 R
2
p p 1, p 2 ,...1
La distancia P2 puede calcularse tambin por etapas, se trata del caso concreto en
que es posible dividir la matriz inicial de indicadores en dos submatrices ortogonales que
daran lugar a sendos ndices cuya agregacin ser la distancia P2 final.
256
Un criterio de los existentes (Zarzosa, 1996) para eliminar los indicadores simples innecesarios consiste
279
280
Por otra parte, se produce un elevado grado de incertidumbre sobre los efectos a
largo plazo apareciendo problemas de irreversibilidad de los efectos derivados de la
decisin adoptada, as como de aquellos otras implicaciones sobre el resto de
ecosistemas o la calidad/cantidad de los recursos no renovables y la biodiversidad
(problema de la complejidad). No slo se desconoce el abanico de posibles situaciones
futuras y sus probabilidades, sino que adems, los daos ambientales producidos en el
proceso de toma de decisiones pueden ser irreversibles, dado el grado de complejidad de
las relaciones entre los subsistemas socioeconmico y ambiental257. Los agentes
decisores carecen de una definicin clara del espacio probabilstico dado que no
conocen los posibles sucesos resultantes necesarios para asignar probabilidades. La
irreversibilidad invalida la posibilidad de aprendizaje o perfeccionamiento258 en la
asignacin de probabilidades, dado que no es posible repetir la regla de decisin si el
recurso natural (p.e.: biodiversidad) ha desaparecido.
Por regla general la toma de decisiones de gestin ambiental maximizando el valor
esperado se realiza no slo desconociendo las probabilidades de determinados sucesos
posibles, sino tambin la evolucin futura de los efectos de las actividades humanas
sobre la calidad y disponibilidad de los recursos naturales. Este hecho justifica el uso de
instrumentos como el valor de opcin (Smith, 1983) para descontar los efectos de
irreversibilidad ambiental de determinada inversin (p.e.: transformar vs. conservar un
bosque), o la inclusin de los proyectos-sombra (Pearce et al., 1989) en el anlisis costebeneficio tradicional a la hora de computar los gastos por deterioro ambiental. La
consideracin desde una perspectiva prxima al principio de precaucin tambin ofrece
un marco axiomtico vlido a la hora de modelizar la toma de decisiones con
incertidumbre ambiental259.
En definitiva, desde muy diversos foros se seala que el uso clsico de la
probabilidad no resuelve satisfactoriamente la toma de decisiones con problemas de
Idea que sustenta, como se ha comentado, la teora de la Coevolucin, basada en la consideracin del
sistema global viviente (Gaia) como un sistema complejo en sentido estricto y no simplemente como
sistema complicado cuya representacin completa es slo un problema de capacidad de gestionar
suficiente informacin.
258 No obstante, en el anlisis economtrico aplicado a la toma de decisiones ambientales resulta habitual
el uso de tcnicas de simulacin (modelos de Monte Carlo) con aprendizaje modelizado en procesos de
Markov.
259 Acerca del establecimiento de ahorros de precaucin, resulta muy interesante la aportacin que
desde la teora de conjuntos difusos se hace en este sentido (Hauenschild y Stahlecker, 2001).
257
281
260
282
283
284
si
x A
si
x A
La Lgica Difusa (Zadeh, 1979, 1996; Mandami, 1977; Sugeno, 1985) se aplica profusamente al mbito
de la toma de decisiones para lo que pueden consultarse Bellman y Zadeh (1970), Jain (1976), Yager
(1977), Dubois y Prade (1979), Zadeh y Kacprzyk (1992), Altrock (1995) o Lootsma (1997), entre otros.
269 Esta aproximacin a los conceptos bsicos de la teora de los conjuntos difusos se basa en Morillas
(1994) y Zimmermann (1996).
268
285
= {x X , ( x )}
Donde ( x) : X M es la funcin de pertenencia de los puntos x X que
indica los distintos grados de pertenencia ( x) agrupados de forma ordenada en el
conjunto de pertenencia M, normalmente acotado entre [0,1] (Figura 4.1). Mediante esta
funcin se define completamente un conjunto difuso, donde x pertenece a con un
cierto grado270. Si la funcin de pertenencia devuelve valores nicos entre 0 y 1, se trata
de un conjunto difuso de tipo 1, cuando sta es a su vez un conjunto difuso, entonces se
trata de un conjunto difuso de tipo 2. Si la funcin de pertenencia es un conjunto difuso
de tipo 2, el conjunto ser difuso de tipo 3271. De igual forma, es posible definir
conjuntos difusos sobre intervalos, es decir, que la funcin de pertenencia arroje valores
comprendidos en forma de intervalo.
Conjunto Preciso
270
Xi
Xj
Conjunto Difuso
Xi
Xj
~
A
Zadeh (1978) interpreta el valor de pertenencia A~ ( x ) como la posibilidad de que el parmetro cuyo
valor es quasi-desconocido y que viene descrito por el conjunto difuso A tome el valor x. Este valor
fluctuar entre 0 (totalmente imposible) y 1 (totalmente posible).
271 No obstante, este tipo de conjuntos difusos entraan una mayor problemtica a la hora de realizar
operaciones entre ellos, complicando su interpretabilidad ante el mayor nmero de dimensiones que
comprenden (Zimmerman, 1996).
286
Por otra parte, tambin es necesario definir una serie de conceptos bsicos antes
de pasar a referir las principales operaciones entre conjuntos difusos:
Si la altura o mayor grado de pertenencia alcanzado por algn elemento es la
unidad, sup x ( x) = 1 , entonces se dice que el conjunto difuso es normal. Se puede
normalizar cualquier conjunto difuso dividiendo ( x) entre sup x ( x) , este
procedimiento simplifica bastante las posteriores operaciones entre conjuntos difusos.
El soporte de un conjunto difuso , S(), es el conjunto no difuso de todos los
valores de x X tales que ( x) > 0 . Si nicamente hay un nico punto dentro del
soporte, cuyo valor de pertenencia adems es 1, se dice que el conjunto difuso es un
singleton, es decir, un conjunto preciso o en sentido clsico con slo un elemento.
Una generalizacin del concepto de soporte es el -corte: Se trata del conjunto no
difuso de elementos que pertenecen al conjunto difuso al menos al nivel .
A = {x X ( x ) }
La familia formada por todos los -cortes contiene toda la informacin acerca del
conjunto difuso.
El -corte fuerte es asimismo definido como el conjunto A> tal que:
A> = {x X (x ) > }
El -nivel de un conjunto difuso es el conjunto A= tal que:
A= = {x X ( x ) = }
Se denominan puntos de cruce (crossover points) a los puntos tales que:
~
Puntos de Cruce (A) = {x X ( x ) = 0.5}
287
~
Ncleo (A) = {x X ( x ) = 1}
La cardinalidad de un conjunto difuso se refiere a su tamao y viene definida por
Un conjunto difuso se dice que es convexo sii para cualquier par x1, x2 se cumple:
( x1 + (1 ) x 2 ) min{ ( x1 ), ( x 2 )}, x1 , x 2 X , [0,1]
De igual forma, la convexidad implica que todos los -corte sean convexos.
~
~ ~
~
Un conjunto A es un subconjunto difuso de B , es decir, A B , si:
x X : A~ ( x) B~ ( x)
~ ~
Y si existe al menos un punto x X tal que A~ ( x) B~ ( x) , entonces: A B .
Se denomina nmero difuso a aquel conjunto difuso que est normalizado y sea
convexo. Se trata de la generalizacin del concepto clsico de nmero, gracias a la cual,
operaciones aritmticas como la suma y la multiplicacin entre nmeros reales pueden
aplicarse a este tipo de conjuntos difusos. Cualquier nmero real puede por tanto
considerarse un nmero difuso, denominndose nmero rgido (crisp number). Las formas
ms simples de nmero difuso son los nmeros difusos triangulares, caracterizados por una
funcin de pertenencia de tipo triangular. A continuacin se enumeran los tipos
principales de nmeros difusos en base a su funcin de pertenencia272:
Adems de las explicitadas, otras funciones de pertenencia muy utilizadas son la funcin-, la funcin
de tipo gaussiana y la funcin exponencial.
272
288
0
x a
( x) = b a
cx
c b
0
xa
a xb
bxc
cx
( x)
1
A~ ( x) =
0
xa
ba
1
; si x a
; si a x b
; si b < x
289
A~ ( x)
1
A~ ( x) =
; si x b
1
cx
cb
0
; si b x c
; si c < x
A~ ( x)
1
290
xa
0
xa
b a
( x) = 1
d x
d c
0
a xb
b xc
c xd
d x
A~ ( x)
1
X
a
c) Funcin-S.
0
x a 2
2
ba
( x) =
2
1 2 x b
b a
; xa
; a<xm
; m< xb
291
; x>b
A~ ( x)
1
El punto m =
a+b
es el punto de cruce (crossover point) de la funcin-S.
2
d) Tipo L-R.
~
Un nmero difuso A = (a, b, c) con a b c es un nmero difuso L-R (LeftRight) si su funcin de pertenencia es del tipo:
b x
L b a ; si a x b
A~ ( x) = R
; si b x c
c
0
en otro caso
292
respectivamente.
L( x) = R ( x) =
Si
para
se
elige
por
ejemplo
la
funcin:
1
(cos(x ) + 1) , se obtiene una figura campaniforme:
2
A~ ( x)
1
293
Otras propuestas importantes de familia de operadores para la interseccin y la unin son las realizadas
por Hamacher (1978), Sugeno (1977) y Schweizer y Sklar (1963). Para profundizar en el anlisis de
operadores es necesaria la referencia a Dubois y Prade (1980; 1988), Yager (1991; 1994), Klir y Yuan
(1995) y Zimmerman (1996), entre otros.
274 Entre los criterios definidos por Zimmerman (1996) para la seleccin del operador idneo para cada
caso estn los de: potencia axiomtica, ajuste emprico, adaptabilidad, eficiencia numrica, compensacin,
rango de compensacin, comportamiento agregativo, compatibilidad con la escala de la funcin de
pertenencia.
273
294
No es el objeto de este trabajo el profundizar en el marco axiomtico para estas operaciones difusas,
simplemente sealar que normalmente se trata de extender las operaciones clsicas a partir de los axiomas
de los conjuntos clsicos, aunque en el caso difuso no se constituye un lgebra de Boole pues no se
275
~C
~C
295
Mximo.
C~ ( x) = max{ A~ ( x), B~ ( x)}
Como se ha comentado ms arriba se trata del operador usado en la modelizacin
del o lgico en la unin, siendo el nico que puede considerarse como operador
completamente compensatorio.
Suma algebraica o probabilstica
C~ ( x) = A~ ( x) + B~ ( x) A~ ( x) B~ ( x)
Este operador, sin embargo, es del tipo mximo-compensatorio, es decir, que
permite cierto grado de compensacin al realizar la unin de conjuntos difusos.
Otros operadores de este tipo destacables son la suma drstica, la suma limitada,
la suma ponderada, la suma de Einstein y el operador-mximo o suma de Hamacher.
4.4.2.2.3. Operadores de Dubois y Prade.
Dubois y Prade (1984) proponen unos operadores alternativos a los tradicionales
para la interseccin y la unin. Estos operadores permiten la compensacin parcial entre
los valores de las funciones de pertenencia.
Operador-mnimo compensatorio.
C~ ( x) =
A~ ( x) B~ ( x)
; (0,1)
Este operador disminuye con respecto a . Cuando =0, este operador es igual a
operador-mnimo clsico. Cuando =1, se obtiene el operador producto algebraico.
296
Operador-mximo compensatorio.
C~ ( x) =
A~ ( x) + B~ ( x) A~ ( x) B~ ( x) min(1 , A~ ( x), B~ ( x) )
; (0,1)
max(, ,1 A~ ( x),1 B~ ( x) )
{[
1/ p
{[
D~ p ( x) = min 1, A~ ( x) p + B~ ( x) p
1 / p
297
};
p 1
~
~
~
Si p es infinito, D p ( x) = max A( x), B ( x) , coincide con el operador O clsico
para la unin (operador-mximo). Si p=1, entonces D~ p ( x) = min{1, A~ ( x) + B~ ( x)},
que es el operador suma limitada.
4.4.2.2.5. Operadores-promedio, simtricos y compensatorios.
Los operadores-promedio276 se utilizan para agregar conjuntos difusos y se encuentran
en una situacin intermedia entre los operadores mnimo y mximo. Este tipo de
operadores cuenta con numerosas aplicaciones a la toma de decisiones, especialmente
en el anlisis multicriterio, donde la unin o la interseccin no siempre satisfacen las
necesidades de agregacin de los conjuntos difusos277. Ejemplos de este tipo de
operadores son la media aritmtica, la media aritmtica ponderada y la media
geomtrica, entre otros.
Operador media ponderada.
~ ~
~
Si el objetivo es calcular la media de una serie de nmeros difusos X 1 , X 2 , , X n
ponderados por unos pesos especficos que a su vez son nmeros difusos
~ ~
~
W1 , W2 , , Wn , esta media ponderada puede definirse, siguiendo el principio de
extensin, como:
n
~
Y =
~ ~
W X
i =1
n
~
Wi
i =1
En Dubois y Prade (1984; 1985), Grabisch (1995), Klir y Yuan (1995), Yager (1994), entre otros, se
hace una revisin de los operadores de agregacin para integrar valores de pertenencia a conjuntos
difusos.
277 Los operadores promedio forman parte de la familia de operadores agregativos. En un intento de
clasificarlos, se pueden diferenciar dos grandes grupos: por un lado los operadores aditivos (p.e.: suma
aritmtica) o k-aditivos, los cuales cuentan con mayor nmero de aplicaciones; y por otra parte, los
operadores no aditivos, basados en el uso de las integrales difusas (Sugeno, 1977) y relacionados con las
integrales de Choquet (1953), son muy aplicados al anlisis multicriterio (Grabisch, 1996).
276
298
Y~ ( y ) = sup min W~ ( wi ), X~ ( xi ), i = 1, 2, , n y = wi xi
x,w
i =1
w
i =1
Por otra parte, se pueden definir operaciones para la agregacin de los conjuntos
difusos a partir de los grados de pertenencia obtenidos. Por ejemplo:
Operador media geomtrica.
( x) = [1 ( x) 2 ( x) 3 ( x) n ( x)]
1/ n
(1 ) = [1 (1 1 )] [ 2 (1 2 )] [ 3 (1 3 )]
A
1 ( A+ B + C +)
~p ( x) = i
i wi
1/
; > 0
299
= ( A~ ( x) B~ ( x) )
(1 (1
~
A
( x)) (1 B~ ( x)) )
1 (1 i ) wi
i =1
; 0 1;
=n
, xr ) de X a un universo Y, el
~
Principio de Extensin permite la definicin de un conjunto difuso B en Y de la forma:
~
B = {( y, B~ ( y )) y = f ( x1 , x2 , x3 ,
xr ); ( x1 , x2 , x3 ,
xr ) X }
donde:
sup
min{ A~ ( x1 ), A~ ( x2 ), A~ ( x3 ),
B~ ( y ) = ( x1 , x2 , x3 , xr ) f 1 ( y )
300
, A~ ( xr )} ; si f 1 ( y )
; en otro caso
0
; en otro caso
4.4.2.4. Distancias entre conjuntos difusos.
El Principio de Extensin difuso permite, entre otras aplicaciones, la definicin de
medidas de distancias entre nmeros difusos278. La utilidad de las distancias difusas es
variada, destacndose como uno de los mtodos ms aplicados a la hora de establecer
jerarquas u ordenaciones entre los conjuntos difusos resultado de un anlisis
multicriterio con informacin difusa. De esta manera se puede evaluar qu resultado es
mejor y las distancias relativas al resto de soluciones del modelo difuso.
~
~ ~
La pseudo-mtrica d , distancia difusa entre dos conjuntos difusos A y B puede
definirse como:
d~ ( A~ , B~ ) ( z ) = sup min{ A~ ( x), B~ ( y )}
x y = z
Si
se
opera
con
dos
nmeros
difusos
triangulares
~
A = (a1 , a 2 , a3 ) y
~
B = (b1 , b2 , b3 ) , Diamond (1988) sugiere una distancia en trminos de la mtrica
eucldea:
~ ~
2
2
2
d 2 ( A, B ) = (a1 b1 ) + (a 2 b2 ) + (a 3 b3 )
Por otro lado, Yager (1979) sugiere la formulacin del concepto de distancia
~
~
como promedio de las distancias entre dos conjuntos difusos A y B (o entre sus
En Dubois y Prade (1980) y Gupta y Sanchez (1982), entre otros, se exponen medidas de distancias
difusas.
278
301
1/ p
; p = 1,2,3,....
1/ 2
1/ 2
302
obtenido por procedimientos de lgica difusa. Este proceso recibe el nombre de aclarado
o perfilado (defuzzification)279.
A la luz del comentario anterior resulta evidente que no se trata de un paso
obligatorio, sino todo lo contrario. Como seala Silvert (1997), se ha de realizar un
balance previo entre la necesidad de un dato rgido (crisp) y la consiguiente prdida de
informacin que se produce en el proceso de aclarado, pues el conjunto difuso ofrece
informacin importante referida a la ambigedad implcita en el problema inicial de
clasificacin de los elementos en determinadas categoras.
Por otra parte, si se ha desarrollado un modelo difuso en base a la agregacin de
conjuntos difusos, el resultado final (el valor de pertenencia agregada) ya de por s es un
valor entre (0,1) que no necesita de aclarado. No obstante, conocida la forma funcional
del conjunto final, es posible deshacer el proceso de difuminado inicial y obtener una
medida en la escala de medida de la variable base.
Siguiendo el trabajo de Driankov et al., (1996), de entre los mtodos ms usuales
para realizar el perfilado destacan el mtodo del centroide del rea, la mediana, la media
del mximo, el menor del mximo y el mayor del mximo:
a) Mtodo del centroide o centro de gravedad del rea. Segn este mtodo, de
amplia difusin, el valor rgido se obtiene, en el caso habitual en que el
dominio de la funcin sea discreto o compacto280 como:
~
Aclarado ( A) =
x (x )
(x )
i
En Yager y Filev (1993) y Driankov et al. (1996) se hace una revisin de los principales mtodos para el
paso de una medida difusa a otra rgida.
279
303
~
Aclarado ( A) = x
xM
( x ) dx = ( x ) dx
i
xm
~
Aclarado ( A) =
x
j =1
; A~ ( x j ) = M
~
d) Mtodo del menor de los mximos. El representante del conjunto difuso A
es el menor valor de los xj que tengan A~ ( x) mximo.
~
Aclarado ( A) = min x j A~ ( x j ) = M
e) Mtodo del mayor de los mximos. En este caso es el mayor valor de los xj
que tienen la mxima valoracin en la funcin de pertenencia.
~
Aclarado ( A) = max x j A~ ( x j ) = M
Puede determinarse asimismo para el caso continuo en funcin del tipo de anlisis que estemos
304
D~ ( x) = min A~ ( x), A~ ( x),, A~ ( x) con la que se obtiene, para cualquier alternativa x, el grado
1
~ ~
305
indicadores de
sostenibilidad, se pueden distinguir dos tipos de anlisis para construir ndices difusos de
sostenibilidad:
a) En primer lugar, una lnea de trabajo viene dada por la construccin de ndices
difusos a partir de la agregacin de conjuntos difusos. Silvert (1997; 2000)
propone un intuitivo mtodo que sigue los pasos habituales en la elaboracin
de ndices pero aplicados a un entorno difuso. Seleccionados los indicadores
iniciales en base a criterios cientficos y polticos, as como la importancia
relativa de cada uno de ellos, se calculan los valores de pertenencia de cada
indicador a los valores lingsticos definidos para la variable (p.e.: no
306
307
308
Con el instrumento del razonamiento aproximado es posible adems realizar otro tipo de anlisis
centrados, por ejemplo, en el estudio de conflictos en la toma de decisiones medioambientales (conservar
vs. explotar) mediante teora de juegos difusos, etc.
285
309
310
A~ (N ( x1 j ) )
A~ (N ( x2 j ) )
...
A~ (N ( x1 j ) )
A~ (N ( x2 j ) )
...
~
A : Sostenibilidad
A~ al conjunto difuso
Valores Lingsticos:
Funcin Pertenencia:
A~ (N ( xnj ) )
A~ (N ( xnj ) )
~
~
A1 : Sostenible, A2 : Insostenible
, A~ ( x )
A~ ( x)
1
Indicadores Normalizados
N (X1j)
N (X2j)
...
N (Xnj)
Valores de Referencia
X1*
X2*
...
Xn*
X1j
X2j
...
Xnj
Indicador de Sostenibilidad
IS1*
IS2*
...
ISn*
311
Sobre las cuestiones no directamente relacionadas con el modelo difuso, en concreto la definicin de
los componentes del modelo, la seleccin de indicadores y la justificacin de los valores de referencia, se
ocupa en profundidad el primer apartado del siguiente captulo.
286
312
313
N ( xi ) =
b) N ( xi ) =
xi
x
xi x
100
x min
, o un intervalo x min
, x max
:
ciertos valores observados (eligindose as de referencia la mejor situacin observada) o con los niveles
crticos a mantener de determinados conceptos (p.e.: el verde urbano ha de superar los 5 m2/hab.).
314
xi x min
N ( xi ) = x max
x min
; xi < x max
; xi x max
x
N ( xi ) = max xi
x x
min
max
; xi x min
; xi > x min
, x max
),
c) Si el valor objetivo es un intervalo ( x min
xi x min
x x
min
min
N ( xi ) =
1
x max xi
x max x max
; xi x min
; xi ( x min
, x max
)
; xi x max
315
Una definicin operativa de los pasos a establecer en la toma de decisiones con informacin lingstica
puede encontrarse en Herrera y Herrera-Viedma (2000).
289 La diferenciacin de ms categoras o valores para el trmino lingstico ha de cumplir un compromiso
genrico de operatividad (Zadeh, 1975). La mayor especificacin de categoras lingsticas redunda en un
mayor refinamiento o desagregacin de la informacin resultante en el output del modelo. No obstante, el
anlisis planteado persigue una formulacin ms genrica propia de una primera aproximacin
metodolgica a la modelizacin de la sostenibilidad.
288
316
Para facilitar el clculo posterior y de acuerdo a su adecuacin lingstica, dado que ambos trminos
son complementarios, se definen las dos funciones de pertenencia tambin de forma complementaria.
290
317
Resulta habitual referirse a la funcin de pertenencia como el punto fuerte y dbil de la teora de los
conjuntos difusos.
292 No obstante, en estos casos se suele recurrir a la opinin de expertos, el uso de indicadores
aproximados o la simulacin previa de datos.
293 Vanse Civanlar y Trussel (1986), Dubois y Prade (1986) y Trksen (1991).
294 Una vez que se han especificado las funciones de pertenencia, es recomendable realizar un anlisis de
sensibilidad para perfeccionar dichas funciones (Brdossy y Duckstein, 1995), dado que el modelo difuso
es muy sensible al tipo de soporte o pendientes de las mismas.
291
318
~
Queda as definido el nmero triangular A = x , x*, x + . El intervalo x , x + es
el soporte del nmero difuso, fuera del cual la funcin de pertenencia es definida como
cero.
La justificacin de esta tcnica de obtencin de funciones de pertenencia es
igualmente intuitiva. En situaciones en las que no es posible implementar otras tcnicas
basadas en la probabilidad a priori o aquellas que determinen valores funcionales
(Trksen, 1991), la aproximacin del nmero difuso triangular permite satisfacer unos
requerimientos mnimos en trminos de compatibilidad con otras formas funcionales, es
decir, se trata de la mejor aproximacin posible a la mayora de funciones de pertenencia
(Pedrycz, 1994), mostrando tambin una mayor comodidad a la hora de su clculo.
En estas situaciones, la alternativa radica en el desarrollo de mtodos empricos
para la construccin de funciones de pertenencia basados en la opinin de expertos. En
este punto, Cornelissen et al. (2001) consideran tres aspectos fundamentales: a) definir
qu cualificacin han de cumplir estos expertos; b) cmo obtener el conocimiento
experto para construir la funcin de pertenencia; y c) establecer mtodos para medir la
fiabilidad de dicha funcin, hecho bsico para fundamentar el modelo difuso.
En el anlisis objeto de estudio existe cierta informacin, basada en la semntica
propia del concepto de desarrollo sostenible, que permite una primera seleccin
funcional que perfecciona la aproximacin triangular. En primer lugar, si se elige la
funcin triangular resultara muy difcil defender que slo un nico valor de la variable
tiene una pertenencia total al conjunto difuso sostenible.
319
A~ ( N ( x i ) )
i
1
Funcin- S
q-
triangular
295
xi
xi
xi
320
N ( xi )
A~ ( N ( xi ) )
1
A~ ( N ( xi ) )
~
A2 : No Sostenible
~
A1 :Sostenible
N ( xi )
El siguiente paso es el de borroseado en la que se pasa de la informacin rgida
a la informacin difusa en trminos lingsticos. Para ello se computa el grado de
pertenencia del valor normalizado de cada indicador a los conjuntos difusos definidos.
4.4.3.4. Agregacin. Seleccin de los operadores de agregacin de las
pertenencias parciales.
Calculados los valores de pertenencia para todos los indicadores referidos a cada
mbito de estudio, se procede a la agregacin de los mismos para obtener una medida
promedio difusa de los valores de pertenencia a los distintos trminos lingsticos
empleados para referirse al desarrollo global del mbito en cuestin.
No obstante, como paso intermedio, se puede diferenciar una agregacin previa
por subsistemas de indicadores, obteniendo as una medida del desarrollo especfica para
los mismos, mucho ms homognea internamente a la hora de interpretar la pertenencia
a los distintos valores lingsticos.
La agregacin de los indicadores referidos a subsistemas distintos ha de afrontar las
cuestiones referidas al balance o compensacin de la misma. Esta cuestin permite la
eleccin de uno de los enfoques de la sostenibilidad: fuerte o dbil, al poderse
321
(operador-mximo) o parcial
322
Al igual que los operadores de Yager, se trata de un operador paramtrico, donde la correcta seleccin
del valor del parmetro condiciona la evaluacin difusa. Por ejemplo, en Choi y Oh (2000) se desarrolla
una tcnica iterativa para estimar el valor de dicho parmetro.
296
323
pertenencia que sean menores a *. Cada mbito tendr una pertenencia dominante a
partir de un * dado.
Otra alternativa es la propuesta por Silvert (1997) que se basa en la obtencin de
una puntuacin S a partir de la suma ponderada de las pertenencias obtenidas en los
diversos subconjuntos que conforman un conjunto difuso:
S = w1 A~ + w2 B~ + + wk Z~
De esta forma se concede un mayor grado de importancia a determinados
conjuntos difusos as como a los distintos valores de pertenencia derivados y se obtiene
una nica medida para ordenar o jerarquizar los distintos mbitos en su situacin
agregada frente al concepto de sostenibilidad subyacente en el estudio.
4.5. Conclusiones.
Las conclusiones de un captulo dedicado especficamente a la descripcin de las
tcnicas estadsticas multivariante y el modelo difuso se concretan en el comentario
crtico sobre la utilidad y el alcance de las mismas en el anlisis especfico.
Se parte del objetivo principal de la reduccin o resumen de la informacin
contenida en la matriz de datos inicial, para obtener as una medida sinttica de la
evolucin conjunta definida por estos datos. Como se comenta en el siguiente captulo,
la base estadstica est referida a diversas dimensiones o mbitos que componen el
modelo de desarrollo del ecosistema urbano.
Las tres metodologas expuestas, el Anlisis de Componentes Principales, la
Distancia P2 y la Agregacin de Conjuntos Difusos, tratan de llegar a este objetivo final
desde tres vas distintas, aunque se ha de explicitar que comparten el hecho de analizar
relaciones lineales, propias del modelo causa-efecto referenciado en el enfoque PER de
la OCDE, a partir de la correlacin existente entre los indicadores iniciales o en
referencia a los ndices elaborados para los distintos subsistemas parciales.
324
325