Metodod de Analisis Aplicados Cap 4 (Pag 70) PDF

Captulo 4. Mtodos de Anlisis Aplicados.
Introduccin
Revisadas los principales teoras referidas a la modelizacin de la sostenibilidad,
as como a su medicin en base al uso de indicadores, en los siguientes captulos se trata
de avanzar en la opcin de la definicin de un indicador sinttico de calidad del
desarrollo urbano aplicado a las ciudades ms pobladas de Andaluca.
A la hora de elaborar ndices o indicadores sintticos existe una larga tradicin en
materia de prediccin y anlisis de ciclos econmicos232. De las mltiples posibilidades
metodolgicas existentes, tras una serie de comentarios generales referidos al uso de
tcnicas multivariantes, en este captulo se exponen sucintamente los tres mtodos de
anlisis estadstico que se aplicarn seguidamente para la obtencin de dicho ndice. Se
han seleccionado bsicamente tres mtodos de anlisis multivariante:
a) Anlisis de Componentes Principales (ACP). Se trata de la tcnica con mayor
aceptacin en la elaboracin de ndices aplicados ampliamente a todos los
mbitos de las ciencias sociales y ambientales.
b) Anlisis de la Distancia P2 (ADP2). Como mtodo representativo del grupo de
tcnicas referidas a la medicin de distancias, el ndice DP2 se ha aplicado a la
elaboracin de indicadores sintticos en Economa.
c) Agregacin de Conjuntos Difusos (ACD). Esta tcnica se basa en la teora de
los conjuntos difusos (fuzzy sets theory) como forma para salvar la vaguedad
e imprecisin de la informacin estadstica disponible y del concepto a medir,
el desarrollo.
Finalmente, se enuncian los principales condicionantes derivados de un enfoque
basado en el uso de indicadores como medida del desarrollo a partir de sus
componentes, as como las propiedades que ha de cumplir un buen ndice.
Entre otras referencias clsicas, destacan Burns y Mitchell (1946), Hymans (1973), Auerbach (1982) y
Lahiri y Moore (1991), as como Maravall (1989), Melis (1983) e INE (1994) en Espaa. No obstante,
autores como Koopmans (1947) critican abiertamente la construccin de indicadores sintticos sin la
adecuada base terica previa.
232
257
CAPTULO 4. M TODOS DE ANLISIS APLICADOS
4.1. Bases para la aplicacin de mtodos multivariantes en

la elaboracin de ndices de desarrollo.
En anlisis empricos centrados en la Economa Regional, para obtener una nica
medida explicativa del nivel de desarrollo o bienestar de un territorio, se recurre a
modelos que tratan de determinar estructuras latentes en un conjunto de variables
(Martn, 1988; Pulido y Cabrer, 1994). Bsicamente se puede distinguir entre tcnicas
basadas en el anlisis de la correlacin existente, o bien metodologas centradas en la
regresin mltiple y modelos economtricos.
Dentro de los modelos basados en el anlisis de la correlacin observada, el
procedimiento genrico que se sigue tras la definicin del modelo inicial es:
1. Identificacin y seleccin de las variables e indicadores relevantes. Definidas
las variables significativas del modelo a priori, se seleccionan los indicadores
que reflejen su valor, en base unas veces a la correlacin observada entre los
indicadores y el objetivo de medida, otras a la variancia explicada por las
mismos.
2. Normalizacin. La estandarizacin se realiza con el objetivo de salvar, en el
caso de variables cuantitativas, el problema derivado de la distinta unidad de
medida y la forma funcional de los indicadores.
3. Ponderacin. Como ya se ha comentado en el apartado referido a los
indicadores de sostenibilidad (epgrafe 3.3), se trata de la cuestin crucial en la
definicin del ndice final. Bsicamente pueden utilizarse como ponderaciones
los pesos implcitos en el modelo emprico, otros basados en hiptesis sobre
su importancia en trminos del objetivo final, o bien medidas subjetivas. En
este punto resulta importante la definicin de niveles crticos para la
sostenibilidad.
4. Agregacin y clculo.
5. Interpretacin o evaluacin.
Como aparece en la mayora de textos de referencia para el anlisis multivariante
clsico (Kendall, 1975; Lebart et al., 1977; Anderson, 1984), el objetivo principal del
mismo es el conocimiento del comportamiento colectivo de un conjunto de variables
interrelacionadas de forma que sus efectos no pueden interpretarse nicamente por
separado. El anlisis se centra en la definicin e interpretacin del valor terico. Este
258
valor se define como una combinacin lineal de la realizacin de las variables aleatorias
(Xj) con ponderaciones (wj) determinadas empricamente por la tcnica multivariante
especfica:
Valor Terico: w1 X1 + w2 X2 + ...+ wj Xj+ ... + wp Xp
Dependiendo de la tcnica multivariante, el valor terico tendr una funcin
definida en base al tipo de anlisis realizado: de dependencia o de interdependencia. Por
ejemplo, en el Anlisis Factorial, tcnica para el anlisis de la interdependencia, el valor
terico trata de representar las estructuras subyacentes o la dimensionalidad de las
variables tal y como se representan en sus correlaciones.
Los pasos genricos de todo anlisis multivariante suelen ser los siguientes
(Anderson, 1984):
1. Definicin del objetivo de la investigacin, as como de la tcnica
multivariante conveniente.
2. Desarrollo y planificacin del anlisis, formulando los supuestos bsicos del
anlisis multivariante.
3. Evaluacin de los supuestos bsicos y su incidencia en la capacidad para
representar las relaciones multivariantes.
4. Estimacin del modelo multivariante y valoracin del ajuste del modelo.
5. Interpretacin del valor terico para identificar la evidencia emprica de las
relaciones multivariantes de los datos.
Una cuestin previa a la aplicacin de la tcnica multivariante es el anlisis de los
datos, hecho que redundar en un mejor conocimiento de las relaciones entre las
variables as como una mejor fiabilidad en los resultados obtenidos. Para ello puede
realizarse el siguiente procedimiento (Hair et al., 1999):
1. Descripcin de los datos. Mediante el habitual anlisis estadstico de medidas
descriptivas, etc.
2. Identificacin y tratamiento de los datos ausentes y atpicos. Estableciendo las
posibles causas, lo que llevar a distintos procedimientos en cada caso, tales
como el mantenimiento de las variables o casos con este tipo de problemas,
aplicar tcnicas de imputacin, o bien la eliminacin del anlisis.
3. Verificacin de los supuestos del anlisis multivariante sobre las variables
individuales, su distribucin conjunta y el valor terico final. Estos supuestos
259
varan en cada tcnica, pasando por la normalidad, la linealidad, la

homoscedasticidad o la ausencia de correlacin en los errores.
4.1.1. Hiptesis y requisitos generales para los indicadores sintticos.

Adems de los supuestos derivados de la tcnica multivariante especfica es
necesario definir otro tipo de hiptesis por la naturaleza del anlisis en s. El hecho de
que se trate de medir la calidad del desarrollo mediante el anlisis de sus componentes
en base al uso de indicadores, hace tan necesario como evidente definir las siguientes
hiptesis iniciales233 (Pena, 1977):
Hiptesis I. Completitud. Se supone que el nmero de los componentes del

desarrollo es completo, en el sentido de que estn representadas todas las
propiedades relacionadas con el objetivo buscado por el ndice global.
Hiptesis II. Bondad de los indicadores simples. Se acepta que los indicadores
parciales o simples son buenos en el sentido de que miden adecuadamente
los estados en que se encuentra cada componente en el momento del tiempo a
que se refiere (se minimizan los errores de medicin).
Hiptesis III. Objetividad. Se acepta que la finalidad buscada por el indicador

sinttico puede ser debidamente alcanzada mediante indicadores simples
objetivos, no necesitndose, por tanto, la utilizacin de indicadores de
percepcin para el conocimiento del problema.
Siguiendo a Pena (1977), es importante definir las condiciones que a priori han de
exigirse a un indicador sinttico genrico I:
Postulado I. Existencia y Determinacin. La funcin matemtica que define el

ndice ha de existir y tener solucin.
Postulado II. Monotona. El ndice ha de responder positivamente a una

modificacin positiva de los componentes y negativamente a una
modificacin negativa. Ello obliga en algunos casos a cambiar el signo de los
indicadores cuya correlacin sea negativa con el objetivo a medir (desarrollo).
Postulado III. Unicidad. El ndice ha de ser nico para una situacin dada.
Postulado IV. Invariancia. El ndice ha de ser invariante respecto a un cambio

de origen o de escala de los componentes.
La importancia de estas hiptesis es clara dado que el instrumento de las dos primeras tcnicas es el
anlisis de la correlacin existente entre las variables consideradas.
233
260
Postulado V. Homogeneidad. La funcin matemtica que define el ndice

I = f ( I1 , I 2 ,..., I m ) ha de ser homognea de grado uno. Este postulado es
vital para la cardinalidad del ndice:
f (c I1 , c I 2 ,..., c I m ) = c f ( I1 , I 2 ,..., I m )
Postulado VI. Transitividad. Si (a), (b) y (c) son tres situaciones distintas del
objetivo medible por el ndice, e I(a), I(b) e I(c) son los valores del indicador
correspondiente a esas tres situaciones, debe verificarse que:
[I (a) > I (b) > I (c)] [I (a) > I (c)]
Postulado VII. Exhaustividad. El ndice debe ser tal que aproveche al

mximo y de forma til la informacin suministrada por los indicadores
simples.
Los ndices elaborados mediante el DP2 cumplen estas condiciones, sin embargo,
los indicadores basados en el Anlisis Factorial no cumplen las propiedades siguientes
(Zarzosa, 1996):
a) El postulado III (si la extraccin de los factores no es mediante el mtodo de
los componentes principales),
b) El postulado IV (se han de estandarizar previamente los indicadores),
c) El postulado V, pues no se derivan medidas cardinales, slo ordinales.
d) El postulado VI, pues al modificar la matriz inicial y aadir un nuevo
elemento o variable puede afectar a las ordenaciones finales en las
puntuaciones de los factores.
Considerando como objetivo el establecimiento de una medida sinttica del
desarrollo234, diversas crticas pueden efectuarse sobre las metodologas seleccionadas,
tanto sobre los ndices elaborados a partir de componentes principales como en las
medidas de distancia. La principal se centra en el no cumplimiento de alguna de las
hiptesis de partida arriba comentadas, lo que sumado a la asignacin de ponderaciones
en base a correlaciones empricas, puede llevar a resultados alejados a la realidad. Si no
se realiza una seleccin correcta de los indicadores simples, o si sta no abarca las
principales dimensiones del objeto de estudio, difcilmente el ndice final indicar algo
representativo acerca de la cuestin principal.
Muchas son las crticas sobre el uso de medidas sintticas del desarrollo centradas en los problemas
que conlleva la seleccin correcta de los indicadores, su comparabilidad, la generalizacin excesiva, los
efectos compensatorios, la mayor importancia de factores como el crecimiento econmico o la renta, etc.
234
261
Aplicando estas tcnicas, la medida del grado de desarrollo a partir de un conjunto

completo de indicadores representativos de las esferas social, econmica y ambiental no
provee una informacin directa sobre la sostenibilidad del mbito en cuestin. En este
trabajo se reconocen las limitaciones derivadas del uso de medidas sintticas para el
desarrollo cualificado como sostenible, as como aquellas otras especficas de las
metodologas multivariantes, todas centradas en el supuesto de linealidad en las
relaciones entre variables.
4.2. Anlisis de Componentes Principales (ACP).

4.2.1. Anlisis Factorial y Anlisis de Componentes Principales.
El Anlisis Factorial puede considerarse como un conjunto de tcnicas de
interdependencia cuyo principal objetivo es definir la estructura subyacente en una
matriz amplia de datos. Entre las mismas se encuentra el Anlisis de Componentes
Principales (ACP), uno de los procedimientos propios de la estadstica descriptiva ms
utilizados para sintetizar la informacin contenida en un nmero elevado de indicadores
sobre diversos factores determinantes del nivel de desarrollo, calidad de vida, bienestar,
etc235.
El objetivo especfico del ACP, en palabras de Uriel (1995:343), es explicar la
mayor parte de la variabilidad total observada en un conjunto de variables con el menor
nmero de componentes posibles. Se trata pues de reducir la dimensin original de un
conjunto de p variables observadas llamadas originales, correlacionadas entre s, en un
nuevo conjunto de m variables ortogonales (no correlacionadas), denominadas
componentes principales.
Estas tcnicas son desarrolladas inicialmente por Pearson (1901), Spearman (1904), Hotelling (1933) y
Rao (1965), siendo muy utilizadas en anlisis psicosociales por la Escuela de Chicago, con Thurstone
(1947) o Vernon (1950) entre otros. Se pueden citar numerosas referencias, entre las que destacan desde
una perspectiva metodolgica: Kendall (1975), Harman (1976), Lebart et al. (1977), Anderson (1984),
Comrey (1985), Dillon y Goldstein (1984), Johnson y Wichern (1998) y Hair et al. (1999). En Espaa son
importantes las referencias a Cuadras (1981), Snchez (1984), Mallo (1985), Batista y Martnez (1989) y
Uriel (1995), entre otros. De entre las aplicaciones del ACP al mbito de estudio de este trabajo destacan
King (1974), Ram (1982), Slottje et al. (1991), Young (1999), Lai (2000) y en Espaa INE (1986;1991),
Somarriba y Lpez (2000), entre otros.
235
262
A partir de las correlaciones observadas entre las variables originales, se definen

unas dimensiones subyacentes (los valores tericos), que son los componentes
principales, obtenidos como combinaciones lineales de las variables originales236.
Obtenidos los componentes o factores, mediante la observacin de las cargas
factoriales, se consigue una mayor interpretabilidad de las relaciones existentes entre los
datos, as como la definicin del grado de explicabilidad de cada variable, afrontndose
con todo ello el objetivo principal de este anlisis: el resumen y la reduccin de los datos
en un conjunto ms pequeo de variables con la menor prdida de informacin posible.
En referencia a los supuestos bsicos del ACP, gracias a que se trata de una
tcnica con una clara base geomtrica (Pearson, 1901), se pueden relajar o no considerar
en sentido estricto aquellos referidos a normalidad y homoscedasticidad237 (Snchez,
1984; Uriel, 1995). No obstante, dado que la clave del anlisis radica en la correlacin
lineal, resulta deseable cierto grado de multicolinealidad238.
Realizados los pasos previos de la investigacin multivariante arriba comentados,
se seleccionan las variables relevantes a incluir en el anlisis. Ha de puntualizarse que,
como sealan Hair et al. (1999), el ACP siempre producir componentes, por lo que ha
de minimizarse el nmero de variables a incluir y no proceder a seleccionar grandes
cantidades de variables de forma indiscriminada, lo que conducira a malos resultados (el
conocido problema de basura de entrada, basura de salida) y correlaciones
deshonestas.
Otra caracterstica de esta metodologa es la necesidad de trabajar con variables
medidas en una escala de intervalo o razn239. La existencia de variables con menos
Se recuerda que un supuesto bsico de esta tcnica es la existencia de relaciones lineales entre las
variables, hecho que, como argumenta Pena (1977), no resulta excesivamente restrictivo en anlisis
centrados en el desarrollo socioeconmico a la hora de identificar relaciones causa-efecto.
237 Lgicamente, ello supondr una menor correlacin observada entre las variables as como la posible
inconsistencia posterior al aplicar test estadsticos de significacin sobre los factores, hecho no obstante
poco frecuente (Hair et al., 1999).
238 De hecho puede aplicarse un contraste de esfericidad de Bartlett (1950) para verificar la hiptesis de
correlacin entre cada par de variables. No obstante, ante la presencia de medidas con cierto grado de
heterogeneidad y muy diferentes escalas se opta por el uso de las variables estandarizadas (ACP normado).
239 En este sentido, Uriel (1995) aboga directamente por el uso de variables ratio, dado que eliminan el
problema de magnitud o escala que enmascara otras caractersticas ms profundas (Op. cit. pg. 333). No
obstante, esta prctica acarrea otro tipo de problemtica, modificando la forma de la distribucin y
236
263
categoras o incluso dicotmicas reducir las correlaciones afectando al Anlisis

Factorial240. La justificacin a esta restriccin es la baja robustez del coeficiente de
correlacin de Pearson a la no linealidad y a la presencia de variables con observaciones
anmalas. Asimismo, es necesario trabajar con una base de datos completa, realizndose
por ello un tratamiento de valores ausentes previos en su caso.
Los siguientes pasos suponen la eleccin de unas tcnicas u otras, dentro del
Anlisis Factorial241, por lo que pueden variar en cada investigacin aplicada. No
obstante, en el anlisis emprico que sigue a este captulo, el procedimiento general a
seguir es el propio de un anlisis de componentes principales normado.
4.2.2. Aplicacin del ACP para la elaboracin de un indicador

sinttico.
Se ha comentado que para elaborar un indicador sinttico o ndice que resuma la
variabilidad observada en un conjunto de variables, definiendo as el comportamiento de
una variable latente (p.e.: el desarrollo), el Anlisis Factorial y en concreto su variante
ACP, constituye un instrumento de anlisis emprico muy til. Los pasos a seguir para
elaborar esta medida son los siguientes.
concediendo quizs demasiada importancia a casos que en trminos absolutos estaran localizados en las
colas de la distribucin de cada variable.
240 Como sealan Garca et al. (2000), cuando se trabaja con variables categricas o dicotmicas el
coeficiente de correlacin de Pearson pierde validez siendo necesarios otros coeficientes basados en la
Chi-cuadrado (C de Contingencia, V de Cramer) o los coeficientes phi respectivamente. No obstante en
esos casos es recomendable el uso de otras tcnicas multivariantes como el Escalamiento
Multidimensional, el Anlisis de Correspondencias o el Anlisis de Conglomerados jerrquico.
241 La mayora de autores constatan cierto grado de confusin entre el ACP y el Anlisis Factorial comn,
a pesar de las diferencias en sus objetivos, sus caractersticas y su grado de formalizacin (Uriel, 1995). Sin
duda, a ello contribuye el hecho de que el ACP sea una de las posibles tcnicas aplicables para la
definicin de la primera matriz factorial en el Anlisis Factorial. Sin embargo, el objetivo del presente
trabajo no pasa por el anlisis exhaustivo de ambos mtodos. El ACP es la tcnica de uso generalizado
dado que no presenta los problemas prcticos del Anlisis Factorial comn tales como indeterminacin de
factores (las puntuaciones u ordenaciones resultado del anlisis no son nicas para cada caso) o la
dificultad en el clculo emprico de la variancia comn. No obstante, diversas investigaciones apuntan a la
convergencia de ambos resultados (Velicer y Jackson, 1990).
264
4.2.2.1. Definicin de la matriz de correlaciones.

Se parte de la matriz de variables originales X que recoge la informacin inicial de
la muestra de n casos sobre p variables:
x11
x
21
X =
...
x n1
x12
x 22
...
xn 2
... x1 p
... x 2 p
... ...
... x np
La matriz de variancias y covariancias muestrales V queda definida como:

S12
S
V = 21
...
S p1
S12
2
2
S
...
S p2
... S1 p
... S 2 p
... ...
... S p2
Cuya diagonal principal est compuesta de variancias iguales a la unidad cuando

las variables estn tipificadas.
Asimismo, a partir de X se puede calcular la matriz de correlaciones muestral R .
Esta matriz informa sobre la concomitancia en la variacin observada entre pares de
variables que se tratar de explicar con el menor nmero de factores (variables
latentes)242. Las variables que muestran una muy baja correlacin son candidatas a ser
eliminadas del anlisis:
Si se parte de variables con las mismas unidades de medida, se puede realizar el anlisis en base a la
matriz de covariancias, no obstante las variables con variancias muy elevadas introducirn un sesgo
dominando los componentes iniciales (Jolliffe, 1986). Por ello es preferible extraer los componentes a
partir de R, lo que equivale a hacerlo a partir de la matriz inicial con los valores estandarizados,
concediendo a todas las variables la misma importancia (ACP normado). Una tercera alternativa pasa por
el ACP ponderado, en el que a cada variable o grupo de stas se le asignan distintos pesos relativos (p.e.:
la inversa de la raz de la desviacin tpica de los valores propios obtenidos en un ACP previo).
242
265
1
r
21
R=
...
rp1
r12
1
...
rp 2
... r1 p
... r2 p
... ...
... 1
4.2.2.2. Obtencin de las componentes principales.

El ACP trata de explicar la mayor parte de la variabilidad total observada en un
conjunto de variables con el menor nmero de componentes principales243. Los
componentes son una nueva clase de variables independientes entre s (ortogonales) y
funciones lineales de las variables originales, con la propiedad de tener la variancia
mxima. Estos componentes estn jerarquizados en base a la informacin que
incorporan, medida por el porcentaje de variancia total explicada de la matriz de datos
originales. La obtencin de los componentes es la que sigue (Uriel, 1995).
La primera componente principal Z 1i se expresa como combinacin lineal de las p
variables originales, donde u1 j son las ponderaciones:
Z 11 x11
Z x
12 = 12
... ...

Z 1n x1n
x 21
x 22
...
x2n
... x p1 u11
... x p 2 u12
... ... ...

... x pn u1 p
De forma matricial resumida, el componente z1 ser:

z1 = Xu1
La primera componente se obtiene maximizando su variancia Var ( z1 ) , sujeta a la
restriccin de que la suma de sus ponderaciones ( u1 j ) al cuadrado sea igual a la unidad:
La variancia total puede dividirse en tres partes diferenciadas: variancia comn, variancia especfica y
error. El ACP incluye las unidades en la diagonal de la matriz de correlacin para que la matriz factorial
considere la variancia completa. El Anlisis Factorial comn por el contrario incorpora en la diagonal
nicamente la variancia compartida. Los primeros componentes del ACP, a diferencia de los derivados del
Anlisis Factorial, contienen proporciones bajas de la variancia comn y de aquella derivada del error.
243
266
u
j =1
2
1j
= u1u1 = 1
La variancia del primer componente, considerando que su media es cero, viene

dada por:
n
Var ( z1 ) =
Z
i =1
2
1i
1
1
1
z1 z1 = u1 X Xu1 = u1 X X u1
n
n
n
Si las variables estn tipificadas, X X es la matriz de correlaciones R . Si las

n
variables estn expresadas en desviaciones respecto a la media, esa expresin es la matriz

de covariancias muestral V . Siguiendo la descripcin sobre la base de la matriz V, la
expresin de la variancia es:
Var ( z1 ) = u1Vu1
p
Para maximizar esa funcin sujeta a la restriccin
u
j =1
2
1i
= u1u1 = 1 , se conforma
el langrangiano a maximizar:
L = u1Vu1 (u1u1 1)
Derivando respecto a u1 e igualando a cero:
L
= 2Vu1 2u1 = 0 ; (V I )u1 = 0
u1
Al resolver esa expresin se obtienen races caractersticas o autovalores
(eigenvalues). El vector u1 es el vector caracterstico (eigenvector) correspondiente a la
raz caracterstica mayor (1 ) de la matriz V .
267
El resto de componentes se obtienen de forma anloga. Para el siguiente

componente z2 se impone adems de u 2 u 2 = 1 , la condicin de que no est
correlacionado con el anterior: u 2 u1 = 0 y as para todos los p componentes. Para el
componente genrico Zh :
u h u h = 1
u h u1 = u h u 2 = ... = u h u h 1 = 0
Es decir, que no estn correlacionados los componentes.
El vector de ponderaciones uh para el componente zh est asociado a la raz
caracterstica h , una vez ordenadas stas de mayor a menor.
Para considerar la proporcin de la variancia total explicada por cada
componente, es necesario determinar la variancia de las componentes. Dada la
condicin impuesta de que u h u h = 1 , la variancia del componente z h es precisamente la
raz caracterstica h a la que va asociada:
Var ( z h ) = u h Vu h = h
La variabilidad total observada en las variables originales puede definirse como la
suma de sus variancias, las cuales aparecen en la diagonal principal de la matriz V . La
traza, suma de los elementos de la diagonal principal, de la matriz V es precisamente esa
variancia total:
p
Traza (V ) = h
h =1
268
Por consiguiente, el componente z h explica una proporcin Ph de la variacin

total en los datos originales igual a244:
Ph =
h
Traza (V )
Resulta habitual determinar las covariancias y las correlaciones entre las variables
originales y los componentes principales. La covariancia entre la variable X j y la
componente Z h es:
Cov( X j , Z h ) = huhj
La correlacin entre la variable tipificada X j y la componente Z h es:
r jh =
h u hj
var( X j ) h
= u hj h
Este coeficiente es el que conforma la denominada matriz factorial, de componentes o

de cargas factoriales.
Por otro lado, el Anlisis Factorial propiamente dicho tiene una finalidad
inferencial ms acusada. Se plantea como objetivo explicar nicamente las
interrelaciones entre las variables, mediante el anlisis de la variancia comn compartida
por todas las variables objeto de anlisis (comunalidades). En este caso, las variables
originales son las variables dependientes y vienen explicadas por los factores comunes
no observables. A la hora de extraer la matriz de factores inicial se pueden aplicar
distintos mtodos alternativos. Los dos ms importantes son el mtodo de ejes
244
Si en vez de partir de la matriz V se trabaja con la matriz R , la Traza ( R ) = p , por lo que
Ph =
h
.
p
269
principales y el mtodo de componentes principales245, este ltimo muy similar al ACP

pues parte de la matriz de componentes resultante del mismo.
4.2.2.3. Seleccin del nmero de componentes.
Sobre la base de la informacin recogida en las races caractersticas (autovalores)
hay diversos criterios para decidir el nmero razonable de factores que permita definir la
estructura correcta de los datos y posibilite su posterior interpretacin. Los criterios ms
importantes son246:
a) Criterio de la media aritmtica o de la raz latente (Kaiser, 1958). Se basa en la
seleccin del nmero de factores cuya raz caracterstica j supere el valor
medio de las races caractersticas. En el caso de variables tipificadas (donde
p
j =1
= p ), este criterio se traduce en seleccionar las componentes cuya raz
caracterstica sea mayor que 1247.

b) Contraste de cada (Cattell, 1965). Este contraste parte de la representacin
grfica de las races caractersticas para cada componente en orden decreciente
(grfico de sedimentacin). Se escogen las componentes hasta el punto en que
la curva descendente comience a ser una lnea horizontal (zona de
sedimentacin), lo que indica que a partir de ese punto la proporcin de
variancia explicada no compartida es demasiado grande.
c) Porcentaje de variancia explicada. El criterio de la variancia explicada radica
precisamente en acumular el porcentaje de variancia explicada por las
componentes o factores hasta llegar a un nivel mnimo (en investigaciones
sociales suele ser en torno al 60-70%), en relacin con el nmero de variables
y observaciones. Otra alternativa consiste en escoger suficientes componentes
para explicar o discriminar entre subconjuntos muestrales que a priori se
puedan delimitar.
Se trata de los dos mtodos ms importantes, sin embargo pueden mencionarse otros tales como el de
Mxima Verosimilitud, Mnimos Cuadrados No Ponderados, Mnimos Cuadrados Generalizados,
Factorizacin Alfa y Factorizacin Imagen.
246 Otras tcnicas vienen recogidas en Cuadras (1996:286-291).
247 Jolliffe (1972) propone, en base a simulaciones, que el valor lmite para seleccionar un componente
puede llegar a ser 0,7. No obstante, este hecho repercute en una menor explicabilidad de la variancia total
del componente en cuestin, que ni siquiera explica la variancia contenida en una variable.
245
270
4.2.2.4. Interpretacin de los componentes.

En ocasiones, los componentes seleccionados inicialmente en la matriz de cargas
factoriales permiten una interpretacin clara de las variables que comprenden cada uno
de ellos y de cules son ms representativas dentro de los mismos. Bsicamente el ACP,
como tcnica de reduccin estadstica, concluye en este punto a falta de la aplicacin de
los resultados del anlisis.
Por otro lado, para facilitar la interpretacin, lo habitual es realizar la rotacin de
los factores consiguiendo soluciones factoriales menos ambiguas y ms significativas. La
rotacin de factores es una tcnica iterativa que supone girar en el origen los ejes de
referencia de los factores hasta alcanzar cierta posicin. Si la rotacin es ortogonal se giran
90 grados respecto a los de referencia. Si la rotacin es oblicua no se plantean
restricciones al ngulo de giro248. Identificadas las variables con mayor carga o influencia
sobre cada factor se puede proceder a etiquetar o nombrar el factor.
4.2.2.5. Aplicacin de los resultados del anlisis.
Bajo el objetivo final de la reduccin de datos, se pueden plantear diversos
procedimientos alternativos. Si bien no existe un consenso claro sobre este tema,
bsicamente se pueden agrupar en dos tipos de tcnicas: el uso de escalas aditivas o de
las puntuaciones en los componentes. Como sealan Hair et al. (1999), en la eleccin del
mtodo han de valorarse dos parmetros complementarios: el inters en conseguir una
medida que mantenga la ortogonalidad (puntuaciones de los componentes), frente a una
medida ms aplicable o extrapolable a otros mbitos (escala aditiva).
En la formulacin de escalas aditivas se trata de crear una medida compuesta o
sinttica a partir de las variables suplentes. stas son aquellas variables con mayor carga
para cada factor seleccionado, actuando como representantes del mismo. Lo habitual es
El tipo de rotacin ms usada es la ortogonal al mantener independientes los componentes finales. Por
su parte, la rotacin oblicua muestra una mayor interpretabilidad, permitiendo que los componentes estn
relacionados entre s. Dentro de los mtodos de rotacin ortogonal se encuentran distintas tcnicas como
VARIMAX, EQUAMAX y QUARTIMAX. El mtodo VARIMAX es el ms utilizado, consistente en la
maximizacin de la suma de variancias de la matriz de factores. En referencia a la rotacin oblicua, no
existe un consenso que permita sealar la tcnica ms frecuente, dependiendo en la mayora de los casos
del paquete de anlisis estadstico que se maneje (para SPSS 10.0 se incluyen OBLIMIN directo y
PROMAX) y del grado de explicabilidad finalmente obtenido.
248
271
asignar el mismo peso a todos los componentes y combinar las variables suplentes
mediante la media aritmtica simple249.
En el caso del clculo de las puntuaciones factoriales, se parte de la matriz de
coeficientes de puntuaciones de los componentes o factores250, la cual muestra los valores de u hi
para calcular el valor del componente h-simo para el caso i.
Z hi = u h1 X 1i + u h 2 X 2i + + u hp X pi
h = 1,2, , p
i = 1,2, , n
As, todas las variables influyen en alguna medida en la puntuacin final del caso.
Lo habitual es presentar las puntuaciones de forma tipificada:
Z hi
h
u h1
h
X 1i +
uh2
h
X 2i + +
u hp
h
X pi
h = 1,2, , p
i = 1,2, , n
En muchas ocasiones, la aplicacin de esta tcnica se suele limitar a la seleccin de

la primera componente251, identificando como indicador sinttico la puntuacin de los
casos para la misma. Otra alternativa es la agregacin directa de los primeros
componentes, ponderados, por ejemplo, por la desviacin tpica de cada uno (Peters y
Butler, 1970), o bien por el porcentaje de variancia explicada.
A partir de las puntuaciones obtenidas para cada componente tambin es posible
realizar escalas sumativas, agregando los distintos valores de las puntuaciones para cada
caso.
No obstante, sea cual sea el procedimiento elegido, resulta conveniente realizar un
anlisis posterior de la correlacin entre este ndice y los factores seleccionados, para en
cierta forma validar la bondad de los resultados. El paso final consiste en la valoracin
de la necesidad de cambios en el anlisis realizado, desde la eliminacin de variables al
Esta posibilidad es desarrollada por Jolliffe (1973), quien describe varios mtodos para seleccionar
subconjuntos de variables.
250 Al utilizar el ACP para la extraccin de factores se obtienen puntuaciones exactas de los factores para
cada observacin. En el resto de mtodos (salvo factorizacin imagen y alfa) se ha de realizar una
estimacin.
251 Siempre y cuando sta explique un porcentaje suficientemente elevado de la variancia total.
249
272
empleo de otros mtodos de seleccin de factores o rotacin. Si el inters del anlisis es

la generalizacin de los resultados muestrales se puede proceder por ejemplo a repetir el
mismo con una muestra adicional o, si la muestra es suficientemente grande, dividirla en
varias submuestras para analizar la robustez de los resultados obtenidos.
4.3. Anlisis de la Distancia P2 (ADP2).

4.3.1. Medidas de Distancia.
Las medidas de distancia o disimilitud constituyen un enfoque muy habitual para
el diseo de indicadores sintticos econmicos de coyuntura o medidas del desarrollo, la
pobreza y la desigualdad252. Como se argumenta en Pena (1977) y Zarzosa (1996), los
indicadores sintticos elaborados sobre la base de las medidas de distancia satisfacen una
serie de condiciones exigidas en un espacio mtrico:
a) No negatividad. La distancia es un nmero real nico no negativo, tomando
nicamente el valor cero cuando los dos vectores sean iguales.
dI (X,Z)=0; solamente si X=Z.
dI (X,Z)>0; para todo X Z
b) Conmutatividad. La distancia entre el vector X y el vector Z es igual a la
distancia entre el vector Z y el X.
dI (X,Z)= dI (Z,X).
c) Desigualdad triangular. Si se tienen tres vectores definidos en el mismo
espacio vectorial tales como X, Y, Z, debe verificarse que la suma de las
distancias de dos de ellos a un tercero ha de ser mayor o igual que la distancia
existente entre ambos.
dI (X,Z) < dI (X,Y) + dI (Y,Z).
Enfoque muy aplicado a la medida del desarrollo (Ivanovic,1963;1974) y la desigualdad entre

distribuciones de renta (vid. Beckenbach y Bellman, 1961; Atkinson, 1970; Dagum, 1980; Shorrocks, 1982;
Ebert, 1984; Chakravarty y Dutta, 1987, entre otros). En Fernndez (1992) se hace una revisin acerca de
ndices de pobreza.
252
273
Gracias a ello, estos indicadores pueden utilizarse para comparaciones entre

distintos mbitos y a lo largo del tiempo (siempre y cuando la base temporal sea la
misma), dado que se consigue la denominada propiedad del mantenimiento de orden. La
introduccin de nuevos casos no supone la alteracin de la ordenacin entre los casos
existentes, hecho que no ocurre en los indicadores elaborados a partir del ACP por
ejemplo.
Desde la perspectiva de la mtrica eucldea, la distancia entre dos vectores o casos
( i,i * ) se define como la raz de la suma cuadrtica de las distancias lineales proyectadas
sobre el eje de coordenadas para las p variables consideradas:
d (i, i*) =
(x
j =1
ij
xi* j ) 2
En ocasiones, como el anlisis multivariante cluster por ejemplo, se trabaja con la

distancia eucldea al cuadrado:
p
d 2 (i, i*) = ( xij xi* j ) 2

j =1
En notacin matricial:
d 2 (i, i*) = ( xi xi* )( xi xi* )
O bien tambin se normaliza253, dividindose entre las variancias de cada variable:
p
d 2 (i, i*) = ( xij xi* j ) 2 2j

j =1
En notacin matricial:
d e2 (i, i*) = ( xi xi* ) Dx1 ( xi xi* )
Como se seala en Hair et al. (1999: 504) el uso de datos no estandarizados implica una inconsistencia
en las medidas de distancias derivada del cambio de la escala de las variables.
253
274
Donde DX es la matriz diagonal con las variancias de las variables.

Una variante de medida de distancia basada en las diferencias al cuadrado se
encuentra en la distancia generalizada de Mahalanobis dm (1936):
p
d m2 (i, i*) = ( xij xi* j ) 2 ij

j =1
En forma matricial:
d m2 (i, i*) = ( xi xi* )C x1 ( xi xi* )
Donde Cx es la matriz de covariancias.
La distancia d m frente a la distancia eucldea aporta las ventajas de tener en cuenta
la escala de medida de las variables y considerar adems la correlacin entre las mismas
( d m se hace mxima cuando stas son incorrelacionadas). Se trata en realidad de la
distancia eucldea ponderada por la matriz de covariancias. Sin embargo, no cumple la
propiedad de desigualdad triangular, por lo que no es una distancia en un espacio
mtrico.
Por otra parte, si se deja de lado momentneamente su interpretacin anglosajona,
el ACP no resulta un mtodo ajeno al concepto de distancia segn la mtrica eucldea
(Lebart et al., 1995). De hecho, ya desde las bases para su formulacin inicial (Pearson,
1901) se trata de encontrar la forma de ajustar hiperplanos segn el criterio de mnimos
cuadrados ortogonales. Por ello, el ACP tambin puede contemplarse como un mtodo
geomtrico de distancias254 en el que se evalan las similaridades o distancias entre casos
(o variables) considerando el grado de correlacin entre las variables de una amplia
matriz de datos. De hecho, en el ACP, la distancia entre dos casos (i, i*) se puede definir
como la distancia de Mahalanobis (Cuadras, 1981) que define la inercia de la nube de
puntos.
En palabras de Batista y Martnez (1989:34): la tcnica determina un subespacio de dimensin m
(m<p<N), que en cierta manera optimiza el ajuste de una nube de puntos, de manera que las distancias
medidas en este subespacio, reflejen de la mejor forma posible las distancias reales entre las variables y
entre los objetos y sus representaciones respectivas en los espacios RN y RP.
254
275
Frente a estas distancias basadas en diferencias cuadrticas existen otro grupo de

medidas de las variaciones de las diferencias en trminos absolutos. La distancia
absoluta, de bloque, city-block, o tambin llamada de Manhattan (sus curvas de nivel son
cubos) es:
p
d B (i, i*) = xij xi* j

j =1
Sin embargo, esta distancia puede plantear problemas al partir del supuesto de
incorrelacin entre las variables.
Variaciones sobre este tipo de distancias basadas son:
a) La distancia de Chebishev es:
d C (i, i*) = max xij xi* j ; j
b) La distancia F de Frechet:
p
xij xi* j
j =1
d F (i, i*) =
En general, la mtrica de Minkowski, define la distancia genrica r-mtrica:
d M (i, i*) = r
x
j =1
ij
xi * j
; r = 1,2,3,...
Donde xij es el elemento j del vector i de tamao p, xi* j es el elemento j del

vector i* y r es el factor de Minkowski. Esta norma coincide con la distancia eucldea
cuando r=2 y con la distancia absoluta (mtrica de Hamming) cuando r=1.
La distancia I (dI) de Ivanovic (1963; 1974), es usada ampliamente para la
elaboracin de indicadores sintticos de pobreza, cuyo caso particular es la distancia de
Frechet La distancia I es aplicada como medida de disimilitud entre casos o respecto a
276
un caso estndar con relacin a un conjunto de p variables incluidas en el vector X,

ponderndolas por la inversa de la desviacin tpica de la variable y corrigiendo la
informacin redundante mediante la inclusin del coeficiente de correlacin parcial. La
distancia I entre dos vectores i, i*:
p
xij xi* j
j =1
d I (i, i*) =
j 1
(1 r
ij .1, 2 ,...,i 1
), i < j
i =1
Donde rij .1, 2,...,i 1 es el coeficiente de correlacin parcial entre el componente isimo y el j-simo.
En su representacin matricial:
d I (i, i*) = r xi xi*
Donde r es el vector de ponderaciones definido sobre la base del conjunto de
correlaciones parciales, y es la matriz diagonal con los inversos de las desviaciones
tpicas de las variables. Dado que el resultado del ndice vara si se cambia el orden de
introduccin de las variables, es necesario establecer el orden de incorporacin idneo
de cada componente, en funcin a su aportacin de informacin. Para ello, Ivanovic
describe un mtodo de aproximacin iterativo, basado en el uso del coeficiente de
correlacin entre el resultado anterior del ndice calculado para cada caso (partiendo de
la distancia de Frechet
xij xi* j
j =1
) y los valores de cada indicador parcial,
ordenndose stos atendiendo al valor absoluto de las correlaciones. Este proceso

concluye cuando el orden de inclusin se hace estable (solucin convergente).
4.3.2. Distancia P2.

La distancia P2 (DP2)255 desarrollada por Pena (1977) a partir de la distancia I de
Ivanovic, modifica el sistema de ponderaciones (factores correctores), basndose en el
uso del coeficiente de determinacin cuya interpretacin resulta ms directa que el uso
De entre las aplicaciones realizadas en base al DP2 se pueden citar Pena (1977, 1994), Sanz y Tern
(1988), Zarzosa (1996) e IEA (2000).
255
277
del coeficiente de correlacin en la distancia I.

Sea xi el vector de estado de los componentes (indicadores) en la situacin o caso
i, y xij el estado del componente j en la situacin i:
xi = (xi1 , xi 2 , , xij , , xip )
Sea entonces xi el vector norma o de referencia. Este vector puede referirse a
una situacin ideal donde xi j es el estado del componente j
en la situacin de
referencia:
xi = (xi1 , xi2 , , xi j , , xi p )
El ndice P2 para comparar los vectores xi , xi* es definido de la siguiente forma:
x ij x i* j
j =1
DP2 =
(1 R
2
j j 1, j 2 , ...1
Donde R 2j j 1, j 2,...1 es el coeficiente de determinacin en la regresin de x j sobre

x j 1 x j 2 x1 ; Este coeficiente es independiente de la unidad de medida de las
variables. R12 = 0 , dado que la primera variable contribuye con toda su informacin al no
existir una variable previa, por lo que la ponderacin que se le asigna es 1. La desviacin
estndar j corresponde a los valores mostrados por el componente o variable j.
Se realiza la normalizacin mediante el factor
xij xi* j
j
. Dividiendo la distancia
para el componente j entre j , el indicador es adimensional. Adems, esta distancia es

ponderada por la inversa de j , por lo que su contribucin al ndice es inversamente
proporcional a su dispersin.
Las ponderaciones principales vienen dadas por 1 R 2j j 1, j 2, ...1 . Estos factores
278
eliminan la informacin redundante de los indicadores, separando de los mismos la

variabilidad ya explicada por otros indicadores precedentes256.
El orden de introduccin de los componentes tambin hace variar el resultado
final. Para ello se aplica el proceso iterativo de Ivanovic arriba descrito. Cada indicador
es introducido de acuerdo con su correlacin lineal con el ndice previamente calculado,
partiendo de la distancia de Frechet como primera aproximacin. La distancia P2 final
para la situacin o caso i respecto a la referencia i* muestra el orden de inclusin
correcto para los indicadores:
DP2 =
xi1 xi*1
1
xi 2 xi*2
2
(1 R )+ x
2
21
i3
xi*3
3
(1 R )+ ... +
2
32 ,1
xip xi* p
p
(1 R
2
p p 1, p 2 ,...1
La distancia P2 puede calcularse tambin por etapas, se trata del caso concreto en
que es posible dividir la matriz inicial de indicadores en dos submatrices ortogonales que
daran lugar a sendos ndices cuya agregacin ser la distancia P2 final.
4.4. Modelo de Agregacin de Conjuntos Difusos (ACD).

4.4.1. Problemas derivados de la informacin imperfecta.
La informacin utilizada en la toma de decisiones referidas al bienestar o a la
sostenibilidad no es perfecta, dada, entre otras cuestiones, la cualidad de concepto
multidimensional a analizar. Este hecho cuestiona el llamado paradigma de la
mensurabilidad completa o perfecta que ha sido la base del desarrollo cientfico clsico.
Existen ciertas trabas en trminos de la calidad de la informacin que, sobre todo
en las ciencias sociales, imposibilitan la medida completa de conceptos como el
desarrollo. stos son, por orden de importancia, la concurrencia de incertidumbre e
irreversibilidad, y de otro lado, la vaguedad y la subjetividad. El tratamiento de la
256
Un criterio de los existentes (Zarzosa, 1996) para eliminar los indicadores simples innecesarios consiste
en excluir aquella Xj cuyo valor de 1 R j j 1, j 2, ...1 sea igual a la unidad.

2
279
informacin generada bajo estos elementos se ha realizado desde diversos enfoques

propios de teoras de la medida y decisin (Roberts, 1979).
Incertidumbre e irreversibilidad
En la toma de decisiones bajo incertidumbre, tradicionalmente se diferencian dos
tipos (Keynes, 1921): riesgo (dbil) e incertidumbre (fuerte). El riesgo se refiere a las
distribuciones de probabilidad basadas en clasificaciones de posibles eventos. La
incertidumbre alude a sucesos cuya distribucin de probabilidad no existe o no es
completamente definible ante la falta de criterios de clasificacin fiables. Frente a la
incertidumbre, el principal instrumento es la teora de la probabilidad, en todas sus
vertientes, desde la frecuencialista a la bayesiana.
La ortodoxia aplicada a la teora de la decisin bayesiana utiliza un mecanismo
basado en la racionalidad subjetiva. El agente decisor, en base a sus creencias o
conocimientos, genera probabilidades subjetivas de los estados de la naturaleza ms
relevantes, as como a los resultados de las acciones disponibles. De esta manera, no
existe diferencia analtica relevante entre riesgo e incertidumbre (Cyert y de Groot,
1987).
Sin embargo, esta solucin necesita de un proceso de perfeccionamiento o
aprendizaje siguiendo las reglas de decisin bayesianas. Dado que los individuos parten
de un concepto subjetivo de la probabilidad (al no conocer el espacio probabilstico
completo), se necesita establecer un proceso estocstico estacionario el suficiente
tiempo para que se ajuste la toma de decisiones al mismo, como seala la racionalidad
adaptativa (Lucas, 1986).
En la problemtica asociada con la sostenibilidad, la toma de decisiones referida a
la conservacin o explotacin de un recurso o ecosistema, va irremediablemente
asociada a riesgo e incertidumbre (Funtowicz y Ravetz, 1991). Por una parte, existe un
riesgo cierto que es afrontado asignando probabilidades a los posibles eventos que
aparecen en el corto plazo. De esta forma es posible maximizar el valor esperado
conocido el conjunto de posibles estados de la naturaleza: desarrollo econmico total
vs. conservacin total, as como todas las situaciones intermedias.
280
Por otra parte, se produce un elevado grado de incertidumbre sobre los efectos a
largo plazo apareciendo problemas de irreversibilidad de los efectos derivados de la
decisin adoptada, as como de aquellos otras implicaciones sobre el resto de
ecosistemas o la calidad/cantidad de los recursos no renovables y la biodiversidad
(problema de la complejidad). No slo se desconoce el abanico de posibles situaciones
futuras y sus probabilidades, sino que adems, los daos ambientales producidos en el
proceso de toma de decisiones pueden ser irreversibles, dado el grado de complejidad de
las relaciones entre los subsistemas socioeconmico y ambiental257. Los agentes
decisores carecen de una definicin clara del espacio probabilstico dado que no
conocen los posibles sucesos resultantes necesarios para asignar probabilidades. La
irreversibilidad invalida la posibilidad de aprendizaje o perfeccionamiento258 en la
asignacin de probabilidades, dado que no es posible repetir la regla de decisin si el
recurso natural (p.e.: biodiversidad) ha desaparecido.
Por regla general la toma de decisiones de gestin ambiental maximizando el valor
esperado se realiza no slo desconociendo las probabilidades de determinados sucesos
posibles, sino tambin la evolucin futura de los efectos de las actividades humanas
sobre la calidad y disponibilidad de los recursos naturales. Este hecho justifica el uso de
instrumentos como el valor de opcin (Smith, 1983) para descontar los efectos de
irreversibilidad ambiental de determinada inversin (p.e.: transformar vs. conservar un
bosque), o la inclusin de los proyectos-sombra (Pearce et al., 1989) en el anlisis costebeneficio tradicional a la hora de computar los gastos por deterioro ambiental. La
consideracin desde una perspectiva prxima al principio de precaucin tambin ofrece
un marco axiomtico vlido a la hora de modelizar la toma de decisiones con
incertidumbre ambiental259.
En definitiva, desde muy diversos foros se seala que el uso clsico de la
probabilidad no resuelve satisfactoriamente la toma de decisiones con problemas de
Idea que sustenta, como se ha comentado, la teora de la Coevolucin, basada en la consideracin del
sistema global viviente (Gaia) como un sistema complejo en sentido estricto y no simplemente como
sistema complicado cuya representacin completa es slo un problema de capacidad de gestionar
suficiente informacin.
258 No obstante, en el anlisis economtrico aplicado a la toma de decisiones ambientales resulta habitual
el uso de tcnicas de simulacin (modelos de Monte Carlo) con aprendizaje modelizado en procesos de
Markov.
259 Acerca del establecimiento de ahorros de precaucin, resulta muy interesante la aportacin que
desde la teora de conjuntos difusos se hace en este sentido (Hauenschild y Stahlecker, 2001).
257
281
incertidumbre e irreversibilidad, necesitando la formulacin de supuestos que suelen

suponer grandes restricciones en la realidad. Como alternativa al anlisis tradicional, se
aboga por el desarrollo de tcnicas basadas en la evaluacin de alternativas o escenarios,
y por tanto de valoracin, aspecto que en la Economa del Medio Ambiente ocupa gran
parte del discurso metodolgico260.
Vaguedad y subjetividad
Por otra parte, en el estudio de la interaccin entre los sistemas humanos y
ambientales aparece un grupo de problemas relativos a la vaguedad, la imprecisin y la
subjetividad, hechos que generan notable incertidumbre. No se trata, como antes, de un
problema de incertidumbre estocstica sobre sucesos al menos bien definidos, sino que
se trabaja con informacin que describe semnticamente de forma vaga los posibles
estados del fenmeno. La informacin incompleta (vaguedad) e imprecisa es una
caracterstica fundamental de los sistemas complejos (Klir, 1991) que tambin ha de
afrontarse en el anlisis de la sostenibilidad del desarrollo. Se pueden encontrar
indicadores incompletos o parciales referidos a la calidad del medio, el grado de
bienestar subjetivo, la disponibilidad de recursos ambientales o el valor intrnseco de los
mismos para diversos usos o entornos, por ejemplo.
Los juicios de valor son un ejemplo claro de informacin vaga y subjetiva,
especialmente en su forma lingstica, siendo expresiones subjetivas de determinadas
observaciones cognitivas. En la mayora de los casos, una representacin lingstica de
una observacin o percepcin cognitiva requiere una transformacin menos complicada
que otra representacin numrica y por tanto, menos distorsionada. En los modelos
tradicionales, las variables son precisas, pero en el lenguaje diario y en la toma de
decisiones, la imprecisin se manifiesta en la gran mayora de representaciones de la
realidad objeto de anlisis. La afirmacin "la calidad del agua es buena" encierra diversos
puntos de vista para cada individuo y cada nivel de exigencia o exactitud. Lo que para
una persona es considerado como "suficiente calidad de vida", para otra puede ser
"insuficiente" o incluso "deficiente", pues se trata de representaciones de un proceso de
percepcin subjetivo.
Otras tcnicas de valoracin econmica del activo ambiental en situaciones de incertidumbre e

irreversibilidad son las medidas indirectas como el Coste de Viaje, la valoracin contingente, etc.
(Freeman, 1992).
260
282
Tradicionalmente se ha despreciado la informacin vaga o difusa y la subjetiva

dentro de los patrones de la evaluacin del impacto ambiental (Glasson, 1995). Este
hecho constituye un error desde dos puntos de vista: por un lado, el olvido de la
informacin difusa parte de la no consideracin de la visin ecosistmica, donde la
cantidad de informacin y de entropa del sistema son referentes fundamentales para
describir la evolucin y grado de desarrollo del mismo261. Por otra parte, la informacin
subjetiva ofrece una perspectiva ms cercana a la verdadera percepcin social que del
recurso natural se tiene. Se da incluso el caso de que no existan indicadores cuantitativos
parecidos para significar ciertos mbitos o dimensiones (percepcin o satisfaccin del
medio, etc.)262.
La recogida y anlisis de este tipo de informacin es de difcil modelizacin, dado
que aparecen problemas derivados de la incertidumbre y la imprecisin de las medidas y
su comparabilidad, as como de su tratamiento junto a otras medidas cuantitativas
(Munda, 1993). La modelizacin de la vaguedad obliga a considerar distintos grados de
seguridad o significatividad para un mismo concepto como "bueno" o aceptable por
ejemplo.
4.4.2. Bases de la Teora de los Conjuntos Difusos.

La Teora de los Conjuntos Difusos o Borrosos (Fuzzy Sets Theory)263,
desarrollada inicialmente por Zadeh (1965), es una teora matemtica de la
incertidumbre para modelizar situaciones donde los instrumentos tradicionales no
conducen a resultados ptimos debido a la existencia de problemas de incertidumbre,
vaguedad en la definicin y caracterizacin de variables (no precisas) y subjetividad en la
representacin de los valores. Mediante la generalizacin de la idea clsica de conjunto,
esta teora traduce estos problemas a uno en trminos de incertidumbre difusa (Zadeh,
En el captulo referido al ecosistema urbano ya se ha hecho referencia a la importancia de las medidas
de la entropa o desorden del sistema (como el ndice de Shanon), caracterizada por la vaguedad y
borrosidad en trminos de informacin disponible. En los sistemas sociales tambin se pueden
implementar medidas de la borrosidad en la informacin.
262 Autores en lnea con el movimiento de los indicadores sociales apuestan por el uso de los indicadores
perceptivos o subjetivos definindolos como fundamentales para el anlisis de la calidad de vida o el
bienestar (Michalos, 1997). La lgica difusa es un instrumento idneo para este tipo de estudios en el que
se conjuga informacin precisa, con informacin vaga y subjetiva.
263 Para un anlisis ms detenido de esta teora es necesario referenciar Zadeh (1965, 1973a, 1978),
Zimmermann (1987;1996), Dubois y Prade (1980), Kaufmann (1975), Kaufmann y Gupta (1988), Yager
(1982), Kosko (1992), Klir y Yuan (1995) y Cox (1998), entre otros.
261
283
1965; Bellman y Zadeh, 1970), asociada no a la ocurrencia de un evento, sino al evento

en s mismo, el cual no puede describirse sin ambigedad264. Las principales aplicaciones
pueden especificarse cuando: la informacin es imprecisa, el concepto a medir es
impreciso, las reglas de decisin son imprecisas, o bien se desconocen los mecanismos
internos del sistema.
En el anlisis de sistemas sociales, ambientales (ecosistemas) o tecnolgicos, se
observa que las conclusiones y predicciones realizadas dejan de ser fiables cuando
aumenta el grado de complicacin del sistema. Ello es debido a que la complejidad del
sistema acarrea la necesidad de ingentes cantidades de informacin, no necesariamente
exacta o precisa a veces, hecho que dificulta la labor del investigador a la hora de
interpretar simultneamente las interrelaciones existentes. Para tratar de explicar el
fracaso relativo en el uso de las tcnicas matemticas tradicionales, Zadeh (1973a)
enuncia el Principio de Incompatibilidad265 en base a trminos como complejidad
(complexity) y vaguedad (vagueness) hechos que provocan imprecisin y borrosidad
(fuzziness266): "Al aumentar la complejidad de un sistema, nuestra capacidad de realizar
afirmaciones precisas y significativas sobre su comportamiento disminuye hasta un
umbral pasado el cual la precisin y la significacin aparecen como caractersticas
mutuamente excluyentes".
Zadeh (1973b) propone el llamado Enfoque Lingstico (Zadeh et al., 1975) para el
anlisis de los problemas y sistemas complejos. Una variable lingstica A (p.e.:
temperatura), toma una serie de valores lingsticos a1 , a 2 , a3 (fro, templanza, calor) que
son semnticamente equivalentes a determinados conjuntos difusos267. Una vez
definidos estos valores, es posible establecer las llamadas relaciones difusas entre variables
lingsticas (afirmaciones condicionales difusas) mediante una serie de reglas del tipo si
A=a1, entonces B=b2 por ejemplo. En el caso en que se quieran componer dos
relaciones difusas, para determinar el valor de la segunda variable lingstica se aplica la
Como apunta Kosko (1990), la borrosidad (fuzziness) describe el grado (o intensidad) en el que un
evento ocurre, no cuando ocurre el mismo. En esta teora se distingue claramente la posibilidad de un
suceso de la probabilidad asociada al mismo.
265 Claramente puede interpretarse como la traduccin del principio de incertidumbre enunciado en Fsica
por Heisenberg al anlisis de sistemas.
266 Zadeh (1978:395) diferencia entre informacin vaga, de la cual no se puede extraer ninguna
informacin dada su ambigedad (nos reuniremos prximamente), e informacin difusa, la cual da
cierta informacin pero de forma poco precisa (nos reuniremos a lo largo de esta semana).
267 Por tanto, los conjuntos difusos son usados para expresar los contenidos de una variable lingstica.
264
284
regla de inferencia compuesta o difusa que bsicamente corresponde a la regla max-min

entre relaciones difusas. Este tipo de aplicaciones de los conjuntos difusos ha dado lugar
al desarrollo de una importante disciplina llamada Lgica Difusa y razonamiento
aproximado268.
A partir de los conceptos bsicos de la teora de conjuntos difusos se han
desarrollado otras ramas especficas centradas en el anlisis de redes neuronales difusas,
algoritmos genticos, mapas cognitivos, etc. Las principales aplicaciones se encuentran
en ciencias de los mbitos de la ingeniera, tales como inteligencia artificial, sistemas
expertos y de control, robtica, enfoque de imagen, reconocimiento de patrones, etc.,
pero tambin tienen cabida las ciencias naturales (zoologa, botnica), medicina,
psicologa y las ciencias econmicas, en aspectos como la toma de decisiones, la
investigacin operativa y la gestin empresarial.
4.4.2.1. Conceptos bsicos269.
Los conjuntos difusos (fuzzy sets) estn basados en la idea de flexibilizar el
concepto de pertenencia de un elemento a un conjunto, mediante la definicin del grado
de
pertenencia. En la teora clsica de conjuntos, si llamamos X al universo de
situaciones en discurso (conjunto completo) y dado un subconjunto A de X, cada

elemento xX satisface la condicin de xA o la alternativa xA. El subconjunto A
est representado por la aplicacin: f A : X [0,1]
1
f A ( x) =
0
si
x A
si
x A
fA es la funcin caracterstica del conjunto clsico A, tambin llamado conjunto

rgido (crisp). En trminos de los conjuntos difusos se generaliza dicha funcin. Dado el
conjunto completo X, un conjunto difuso en U es un conjunto de pares ordenados:
La Lgica Difusa (Zadeh, 1979, 1996; Mandami, 1977; Sugeno, 1985) se aplica profusamente al mbito
de la toma de decisiones para lo que pueden consultarse Bellman y Zadeh (1970), Jain (1976), Yager
(1977), Dubois y Prade (1979), Zadeh y Kacprzyk (1992), Altrock (1995) o Lootsma (1997), entre otros.
269 Esta aproximacin a los conceptos bsicos de la teora de los conjuntos difusos se basa en Morillas
(1994) y Zimmermann (1996).
268
285
= {x X , ( x )}
Donde ( x) : X M es la funcin de pertenencia de los puntos x X que
indica los distintos grados de pertenencia ( x) agrupados de forma ordenada en el
conjunto de pertenencia M, normalmente acotado entre [0,1] (Figura 4.1). Mediante esta
funcin se define completamente un conjunto difuso, donde x pertenece a con un
cierto grado270. Si la funcin de pertenencia devuelve valores nicos entre 0 y 1, se trata
de un conjunto difuso de tipo 1, cuando sta es a su vez un conjunto difuso, entonces se
trata de un conjunto difuso de tipo 2. Si la funcin de pertenencia es un conjunto difuso
de tipo 2, el conjunto ser difuso de tipo 3271. De igual forma, es posible definir
conjuntos difusos sobre intervalos, es decir, que la funcin de pertenencia arroje valores
comprendidos en forma de intervalo.
Figura 4.1. Ejemplo de representacin grfica de un conjunto difuso.
Conjunto Preciso
270
Xi
Xj
Conjunto Difuso
Xi
Xj
~
A
Zadeh (1978) interpreta el valor de pertenencia A~ ( x ) como la posibilidad de que el parmetro cuyo
valor es quasi-desconocido y que viene descrito por el conjunto difuso A tome el valor x. Este valor
fluctuar entre 0 (totalmente imposible) y 1 (totalmente posible).
271 No obstante, este tipo de conjuntos difusos entraan una mayor problemtica a la hora de realizar
operaciones entre ellos, complicando su interpretabilidad ante el mayor nmero de dimensiones que
comprenden (Zimmerman, 1996).
286
Por otra parte, tambin es necesario definir una serie de conceptos bsicos antes
de pasar a referir las principales operaciones entre conjuntos difusos:
Si la altura o mayor grado de pertenencia alcanzado por algn elemento es la
unidad, sup x ( x) = 1 , entonces se dice que el conjunto difuso es normal. Se puede
normalizar cualquier conjunto difuso dividiendo ( x) entre sup x ( x) , este
procedimiento simplifica bastante las posteriores operaciones entre conjuntos difusos.
El soporte de un conjunto difuso , S(), es el conjunto no difuso de todos los
valores de x X tales que ( x) > 0 . Si nicamente hay un nico punto dentro del
soporte, cuyo valor de pertenencia adems es 1, se dice que el conjunto difuso es un
singleton, es decir, un conjunto preciso o en sentido clsico con slo un elemento.
Una generalizacin del concepto de soporte es el -corte: Se trata del conjunto no
difuso de elementos que pertenecen al conjunto difuso al menos al nivel .
A = {x X ( x ) }
La familia formada por todos los -cortes contiene toda la informacin acerca del
conjunto difuso.
El -corte fuerte es asimismo definido como el conjunto A> tal que:
A> = {x X (x ) > }
El -nivel de un conjunto difuso es el conjunto A= tal que:
A= = {x X ( x ) = }
Se denominan puntos de cruce (crossover points) a los puntos tales que:
~
Puntos de Cruce (A) = {x X ( x ) = 0.5}
287
El ncleo (kernel) de un conjunto difuso est formado por todos aquellos

elementos con nivel de pertenencia igual a la unidad, considerndose tambin como el
representante de dicho conjunto (equivalente a la probabilidad) a modo de esperanza
difusa:
~
Ncleo (A) = {x X ( x ) = 1}
La cardinalidad de un conjunto difuso se refiere a su tamao y viene definida por
la suma de todos los grados de pertenencia de todos los elementos en :

~
A = (x )
xX
Un conjunto difuso se dice que es convexo sii para cualquier par x1, x2 se cumple:
( x1 + (1 ) x 2 ) min{ ( x1 ), ( x 2 )}, x1 , x 2 X , [0,1]
De igual forma, la convexidad implica que todos los -corte sean convexos.
~
~ ~
~
Un conjunto A es un subconjunto difuso de B , es decir, A B , si:
x X : A~ ( x) B~ ( x)
~ ~
Y si existe al menos un punto x X tal que A~ ( x) B~ ( x) , entonces: A B .
Se denomina nmero difuso a aquel conjunto difuso que est normalizado y sea
convexo. Se trata de la generalizacin del concepto clsico de nmero, gracias a la cual,
operaciones aritmticas como la suma y la multiplicacin entre nmeros reales pueden
aplicarse a este tipo de conjuntos difusos. Cualquier nmero real puede por tanto
considerarse un nmero difuso, denominndose nmero rgido (crisp number). Las formas
ms simples de nmero difuso son los nmeros difusos triangulares, caracterizados por una
funcin de pertenencia de tipo triangular. A continuacin se enumeran los tipos
principales de nmeros difusos en base a su funcin de pertenencia272:
Adems de las explicitadas, otras funciones de pertenencia muy utilizadas son la funcin-, la funcin
de tipo gaussiana y la funcin exponencial.
272
288
a) Nmero difuso triangular.

~
Un nmero difuso A = (a, b, c) con a b c es un nmero difuso triangular si su
funcin de pertenencia es del tipo:
0
x a
( x) = b a
cx
c b
0
xa
a xb
bxc
cx
( x)
1
Su soporte es el intervalo (a,c).

Un caso especfico de nmero difuso triangular son los nmeros difusos semiinfinitos (a, b, + ) y ( , a, b) respectivamente:
A~ ( x) =
0
xa
ba
1
; si x a
; si a x b
; si b < x
289
A~ ( x)
1
A~ ( x) =
; si x b
1
cx
cb
0
; si b x c
; si c < x
A~ ( x)
1
b) Nmero difuso trapezoidal.

~
Un nmero difuso A = (a, b, c, d ) con a b c d es un nmero difuso
trapezoidal si su funcin de pertenencia es del tipo:
290
xa
0
xa
b a
( x) = 1
d x
d c
0
a xb
b xc
c xd
d x
Su soporte es el intervalo (a,d).
A~ ( x)
1
X
a
Los nmeros difusos triangulares son casos especficos de nmeros difusos

trapezoidales donde b=c.
c) Funcin-S.
0
x a 2
2
ba
( x) =
2
1 2 x b
b a
; xa
; a<xm
; m< xb
291
; x>b
A~ ( x)
1
El punto m =
a+b
es el punto de cruce (crossover point) de la funcin-S.
2
d) Tipo L-R.
~
Un nmero difuso A = (a, b, c) con a b c es un nmero difuso L-R (LeftRight) si su funcin de pertenencia es del tipo:
b x
L b a ; si a x b
A~ ( x) = R
; si b x c
c
0
en otro caso
Se trata de una generalizacin de nmero difuso (Dubois y Prade, 1980), dada su

funcin de pertenencia, la cual expresa muchas veces mejor la progresividad en la
transicin que un nmero difuso triangular o trapezoidal. L y R son funciones continuas
montonas decrecientes definidas en el intervalo (0,1). Por ejemplo, un nmero difuso
triangular es un caso especial de nmero difuso L-R con L( x) = R ( x) = 1 x . El valor
de c es el ncleo, mientras que L y R son las amplitudes a izquierda y derecha
292
respectivamente.
L( x) = R ( x) =
Si
para
se
elige
por
ejemplo
la
funcin:
1
(cos(x ) + 1) , se obtiene una figura campaniforme:
2
A~ ( x)
1
4.4.2.2. Operaciones entre conjuntos difusos

Zadeh (1965) sugiere las operaciones bsicas entre conjuntos difusos (la
interseccin, la unin y la complementacin) mediante los siguientes operadores. La
interseccin es interpretada como el Y lgico definida mediante el operador-mnimo.
La interseccin de conjuntos difusos es interpretada como el conjunto difuso ms
grande contenido a la vez en A y en B. La funcin de pertenencia C~ ( x) para la
~ ~ ~
interseccin C = A B queda de la siguiente manera:
C~ ( x) = min{ ( x), B~ ( x) x X }
El operador-mnimo es no compensatorio. No obstante, para la interseccin,
Zadeh (1965) tambin sugiere el producto algebraico, que permite cierto grado de
compensacin. El producto algebraico de dos conjuntos difusos determina a su vez un
~ ~ ~
conjunto difuso C = A B , cuya funcin de pertenencia es:
C~ = a~ ( x) B~ ( x) x X
293
La unin viene dada por el O lgico, mediante el operador-mximo. La funcin

~ ~ ~
de pertenencia D~ ( x) de la unin D = A B es:
D~ ( x) = max{ ( x), B~ ( x) x X }
Se trata del conjunto difuso ms pequeo conteniendo a la vez los otros dos
conjuntos difusos. El operador-mximo es el nico que permite una compensacin
completa entre las funciones de pertenencia consideradas.
~
~
Por otra parte, el conjunto difuso A C (complementario de A ) viene definido por
una funcin de pertenencia de la siguiente forma:
A~C ( x) = 1 ( x), x X
Se han descrito las operaciones de unin, interseccin y complementacin entre
conjuntos difusos usando los operadores clsicos dentro de la teora de conjuntos
difusos, pero es posible utilizar otro tipo de operadores. Este tipo de operaciones son
definidas generalmente a partir de las llamadas t-normas y t-conormas (entre las cuales
se incluyen los operadores clsicos referidos). Pero existen otro tipo de operadores273,
tales como los de Yager, Dubois y Prade, los operadores promedio (compensadores) y
el operador-. A pesar de tratarse de una disciplina muy reciente, ha de destacarse la
gran variedad de operadores matemticos existentes para realizar las operaciones entre
conjuntos difusos. Este hecho dificulta enormemente su sistematizacin (Zimmermann,
1996; Chen y Hwang, 1992), dependiendo su utilidad de las propiedades axiomticas que
se persigue cumplan los operadores274 (op. cit. pg. 38-42). A continuacin se realiza un
breve resumen de algunas de estas operaciones de cara a obtener una visin general de
los instrumentos ms utilizados a la hora de operar con conjuntos difusos.
Otras propuestas importantes de familia de operadores para la interseccin y la unin son las realizadas
por Hamacher (1978), Sugeno (1977) y Schweizer y Sklar (1963). Para profundizar en el anlisis de
operadores es necesaria la referencia a Dubois y Prade (1980; 1988), Yager (1991; 1994), Klir y Yuan
(1995) y Zimmerman (1996), entre otros.
274 Entre los criterios definidos por Zimmerman (1996) para la seleccin del operador idneo para cada
caso estn los de: potencia axiomtica, ajuste emprico, adaptabilidad, eficiencia numrica, compensacin,
rango de compensacin, comportamiento agregativo, compatibilidad con la escala de la funcin de
pertenencia.
273
294
4.4.2.2.1. t-normas o normas triangulares.

Las t-normas son funciones bivariantes t (a,b) que satisfacen ciertos axiomas
bsicos275. Los operadores t-norma son los que habitualmente se utilizan para el
operador Y de la interseccin. Ejemplos de stos son (Dubois y Prade, 1984;
Zimmermann, 1996):
Mnimo.
C~ ( x) = min{ A~ ( x), B~ ( x)}
~
Se considera el conjunto difuso C como el resultado de la operacin. Ya se ha
comentado que es el operador no compensatorio.
Producto algebraico.
C~ ( x) = A~ ( x) B~ ( x)
Se trata de un operador mnimo compensatorio, es decir, que permite cierto grado
de compensacin a la hora de realizar la interseccin de conjuntos difusos.
Otros operadores que han de mencionarse son el producto drstico, el producto
limitado, el producto de Einstein y el operador-mnimo o producto de Hamacher.
4.4.2.2.2. t-conormas, conormas triangulares o s-normas.
Las t-conormas caracterizan normalmente el operador O de la unin. Se trata de
funciones S(a,b) que cumplen una serie de propiedades. Como se recoge en
Zimmermann (1996), ejemplos de operadores del tipo t-conormas, considerando el
~
conjunto difuso C como resultado de la operacin concreta, son los siguientes
No es el objeto de este trabajo el profundizar en el marco axiomtico para estas operaciones difusas,
simplemente sealar que normalmente se trata de extender las operaciones clsicas a partir de los axiomas
de los conjuntos clsicos, aunque en el caso difuso no se constituye un lgebra de Boole pues no se
275
~C
~C
cumple la ley del medio excluido, ya que A A y A A X . Para un anlisis en este

sentido referido a las restricciones derivadas del uso de determinados operadores lgicos y, o, puede
consultarse Bellman y Giertz (1973).
295
Mximo.
C~ ( x) = max{ A~ ( x), B~ ( x)}
Como se ha comentado ms arriba se trata del operador usado en la modelizacin
del o lgico en la unin, siendo el nico que puede considerarse como operador
completamente compensatorio.
Suma algebraica o probabilstica
C~ ( x) = A~ ( x) + B~ ( x) A~ ( x) B~ ( x)
Este operador, sin embargo, es del tipo mximo-compensatorio, es decir, que
permite cierto grado de compensacin al realizar la unin de conjuntos difusos.
Otros operadores de este tipo destacables son la suma drstica, la suma limitada,
la suma ponderada, la suma de Einstein y el operador-mximo o suma de Hamacher.
4.4.2.2.3. Operadores de Dubois y Prade.
Dubois y Prade (1984) proponen unos operadores alternativos a los tradicionales
para la interseccin y la unin. Estos operadores permiten la compensacin parcial entre
los valores de las funciones de pertenencia.
Operador-mnimo compensatorio.
C~ ( x) =
A~ ( x) B~ ( x)
max( A~ ( x), B~ ( x), )
; (0,1)
Este operador disminuye con respecto a . Cuando =0, este operador es igual a
operador-mnimo clsico. Cuando =1, se obtiene el operador producto algebraico.
296
Operador-mximo compensatorio.
C~ ( x) =
A~ ( x) + B~ ( x) A~ ( x) B~ ( x) min(1 , A~ ( x), B~ ( x) )
; (0,1)
max(, ,1 A~ ( x),1 B~ ( x) )
Para =1 se obtiene la suma algebraica. El valor de C~ ( x) disminuye conforme

se aproxima a cero.
4.4.2.2.4. Operadores de Yager.
Yager (1991) propone una nueva clase de operadores para la unin y la
~
~
interseccin difusas: Sean A y B dos conjuntos difusos, la interseccin difusa
~
~
~
C p ( x) = A( x) B ( x) es definida mediante el operador-mnimo de Yager como:
{[
C~ ( x) = 1 min 1, (1 A~ ( x)) p + (1 B~ ( x)) p

p
1/ p
Donde el parmetro p toma valores mayores o iguales a la unidad. Cuanto mayor
sea, ms fuerza tendr la interseccin. Si p = , C~ ( x) = min{ A~ ( x), B~ ( x)},

p
coincidiendo con el operador Y clsico para la interseccin u operador-mnimo. En el

~
~
~
caso en que p = 1 , entonces C p ( x) = max 0, A( x) + B ( x) 1 , que es el operador
producto limitado. El parmetro p est relacionado inversamente con la potencia o

fuerza del operador lgico y. Este operador-mnimo de Yager permite por tanto cierta
compensacin, por lo que es considerado tambin como un operador mnimo
compensatorio.
De igual forma, la unin difusa de Yager viene definida como una funcin
~
~
~
D( x) = A( x) B ( x) donde aplica el operador-mximo de Yager:
{[
D~ p ( x) = min 1, A~ ( x) p + B~ ( x) p
1 / p
297
};
p 1
~
~
~
Si p es infinito, D p ( x) = max A( x), B ( x) , coincide con el operador O clsico
para la unin (operador-mximo). Si p=1, entonces D~ p ( x) = min{1, A~ ( x) + B~ ( x)},
que es el operador suma limitada.
4.4.2.2.5. Operadores-promedio, simtricos y compensatorios.
Los operadores-promedio276 se utilizan para agregar conjuntos difusos y se encuentran
en una situacin intermedia entre los operadores mnimo y mximo. Este tipo de
operadores cuenta con numerosas aplicaciones a la toma de decisiones, especialmente
en el anlisis multicriterio, donde la unin o la interseccin no siempre satisfacen las
necesidades de agregacin de los conjuntos difusos277. Ejemplos de este tipo de
operadores son la media aritmtica, la media aritmtica ponderada y la media
geomtrica, entre otros.
Operador media ponderada.
~ ~
~
Si el objetivo es calcular la media de una serie de nmeros difusos X 1 , X 2 , , X n
ponderados por unos pesos especficos que a su vez son nmeros difusos
~ ~
~
W1 , W2 , , Wn , esta media ponderada puede definirse, siguiendo el principio de
extensin, como:
n
~
Y =
~ ~
W X
i =1
n
~
Wi
i =1
Cuya funcin de pertenencia viene dada por:
En Dubois y Prade (1984; 1985), Grabisch (1995), Klir y Yuan (1995), Yager (1994), entre otros, se
hace una revisin de los operadores de agregacin para integrar valores de pertenencia a conjuntos
difusos.
277 Los operadores promedio forman parte de la familia de operadores agregativos. En un intento de
clasificarlos, se pueden diferenciar dos grandes grupos: por un lado los operadores aditivos (p.e.: suma
aritmtica) o k-aditivos, los cuales cuentan con mayor nmero de aplicaciones; y por otra parte, los
operadores no aditivos, basados en el uso de las integrales difusas (Sugeno, 1977) y relacionados con las
integrales de Choquet (1953), son muy aplicados al anlisis multicriterio (Grabisch, 1996).
276
298
Y~ ( y ) = sup min W~ ( wi ), X~ ( xi ), i = 1, 2, , n y = wi xi
x,w
i =1
w
i =1
Por otra parte, se pueden definir operaciones para la agregacin de los conjuntos
difusos a partir de los grados de pertenencia obtenidos. Por ejemplo:
Operador media geomtrica.
( x) = [1 ( x) 2 ( x) 3 ( x) n ( x)]
1/ n
Suma simtrica ponderada (Silvert, 1979).
(1 ) = [1 (1 1 )] [ 2 (1 2 )] [ 3 (1 3 )]
A
1 ( A+ B + C +)
Operador promedio ponderado generalizado (Dubois y Prade, 1985).

(wi i ( x) )
~p ( x) = i
i wi
1/
; > 0
En esta expresin, ampliamente utilizada como promedio, wi son los pesos

relativos para cada pertenencia. El resultado oscila desde el operador-mnimo, pasando
por la media geomtrica, a la media aritmtica (cuando 1 ) y el operador-mximo
de la unin difusa cuando + . Finalmente, se ha de mencionar tambin el
operador de agregacin media ponderada ordenada (OWA en ingls) desarrollado por
Yager (1988), que permite la compensacin entre las funciones de pertenencias.
En el operador- (operador y compensatorio) propuesto por Zimmermann y
Zysno (1980; 1983) es el parmetro el que determina el balance de informacin entre
la interseccin y la unin. Para un par de funciones de pertenencia A~ ( x), B~ ( x) , el
operador- se define como:
299
= ( A~ ( x) B~ ( x) )
(1 (1
~
A
( x)) (1 B~ ( x)) )
Donde para la interseccin se utiliza el producto algebraico y para la unin la

suma algebraica. indica la posicin del operador entre el y lgico y el o lgico. Si
=0, entonces = i , es decir, el operador y de la interseccin. Si =1, entonces
= 1 (1 i ) , la suma algebraica que caracteriza al operador o de la unin
clsica.
La expresin del operador usando distintas ponderaciones para las pertenencias
es:
n
w
= i i
i =1
1 (1 i ) wi
i =1
; 0 1;
=n
4.4.2.3. Principio de Extensin.

Este principio (Zadeh, 1965) delimita un marco terico general para traducir
cualquier tipo de operaciones entre conjuntos y nmeros reales al campo difuso. A la
formulacin inicial han seguido otras en las que se modifican los operadores usados. La
definicin recogida en Zimmerman (1996) es la siguiente:
Sea X el producto cartesiano de r universos X = X 1 X 2 X 3 X r , y
~ ~ ~
~
A1 , A2 , A3 , , Ar los r conjuntos difusos en X 1 , X 2 , X 3 , , X r respectivamente.
Entonces, dada la funcin rgida y = f ( x1 , x2 , x3 ,
, xr ) de X a un universo Y, el
~
Principio de Extensin permite la definicin de un conjunto difuso B en Y de la forma:
~
B = {( y, B~ ( y )) y = f ( x1 , x2 , x3 ,
xr ); ( x1 , x2 , x3 ,
xr ) X }
donde:
sup
min{ A~ ( x1 ), A~ ( x2 ), A~ ( x3 ),
B~ ( y ) = ( x1 , x2 , x3 , xr ) f 1 ( y )
300
, A~ ( xr )} ; si f 1 ( y )
; en otro caso
Si r=1 la expresin se simplifica notablemente:

~
B = {( y, B~ ( y )) y = f ( x); x X }
sup A~ ( x1 ) ; si f 1 ( y )
B~ ( y ) = x f 1 ( y )
0
; en otro caso
4.4.2.4. Distancias entre conjuntos difusos.
El Principio de Extensin difuso permite, entre otras aplicaciones, la definicin de
medidas de distancias entre nmeros difusos278. La utilidad de las distancias difusas es
variada, destacndose como uno de los mtodos ms aplicados a la hora de establecer
jerarquas u ordenaciones entre los conjuntos difusos resultado de un anlisis
multicriterio con informacin difusa. De esta manera se puede evaluar qu resultado es
mejor y las distancias relativas al resto de soluciones del modelo difuso.
~
~ ~
La pseudo-mtrica d , distancia difusa entre dos conjuntos difusos A y B puede
definirse como:
d~ ( A~ , B~ ) ( z ) = sup min{ A~ ( x), B~ ( y )}
x y = z
Si
se
opera
con
dos
nmeros
difusos
triangulares
~
A = (a1 , a 2 , a3 ) y
~
B = (b1 , b2 , b3 ) , Diamond (1988) sugiere una distancia en trminos de la mtrica
eucldea:
~ ~
2
2
2
d 2 ( A, B ) = (a1 b1 ) + (a 2 b2 ) + (a 3 b3 )
Por otro lado, Yager (1979) sugiere la formulacin del concepto de distancia
~
~
como promedio de las distancias entre dos conjuntos difusos A y B (o entre sus
En Dubois y Prade (1980) y Gupta y Sanchez (1982), entre otros, se exponen medidas de distancias
difusas.
278
301
funciones de pertenencia) en X = {x1 , x 2 , x n } , en trminos de una mtrica de

Minkowsky del tipo:
p
~ ~ n
d p ( A, B ) = A~ ( xi ) B~ ( xi )
i =1
1/ p
; p = 1,2,3,....
Si p = 1 , se obtiene la denominada mtrica o distancia de Hamming (Klir y Yuan,

1995), muy usada, que para el caso discreto viene definida como:
n
~ ~
d1 ( A, B ) = A~ ( xi ) B~ ( xi )
i =1
Si p = 2 , el resultado es la mtrica eucldea:

~ ~ n
2
d 2 ( A, B ) = ( A~ ( xi ) B~ ( xi ) )
i =1
1/ 2
La distancia eucldea normalizada viene dada por:

~ ~ 1 n
2
z 2 ( A, B ) = ( A~ ( xi ) B~ ( xi ) )
2 i =1
1/ 2
4.4.2.5. Aclarado de conjuntos difusos.

En la toma de decisiones con informacin difusa, el resultado obtenido es en
forma de conjunto difuso. Este hecho, si bien supone una ventaja al aportar un mayor
cantidad de informacin frente a la incertidumbre de tipo difusa, en ocasiones no resulta
til en primer trmino al no encajar directamente en la mayora de procesos de decisin
o gestin que buscan la consecucin de un dato o nmero rgido final. En definitiva,
en un medio dominado por la lgica precisa es necesario partir de unos parmetros muy
claros y por tanto traducir a trminos precisos el conjunto difuso normalmente
302
obtenido por procedimientos de lgica difusa. Este proceso recibe el nombre de aclarado
o perfilado (defuzzification)279.
A la luz del comentario anterior resulta evidente que no se trata de un paso
obligatorio, sino todo lo contrario. Como seala Silvert (1997), se ha de realizar un
balance previo entre la necesidad de un dato rgido (crisp) y la consiguiente prdida de
informacin que se produce en el proceso de aclarado, pues el conjunto difuso ofrece
informacin importante referida a la ambigedad implcita en el problema inicial de
clasificacin de los elementos en determinadas categoras.
Por otra parte, si se ha desarrollado un modelo difuso en base a la agregacin de
conjuntos difusos, el resultado final (el valor de pertenencia agregada) ya de por s es un
valor entre (0,1) que no necesita de aclarado. No obstante, conocida la forma funcional
del conjunto final, es posible deshacer el proceso de difuminado inicial y obtener una
medida en la escala de medida de la variable base.
Siguiendo el trabajo de Driankov et al., (1996), de entre los mtodos ms usuales
para realizar el perfilado destacan el mtodo del centroide del rea, la mediana, la media
del mximo, el menor del mximo y el mayor del mximo:
a) Mtodo del centroide o centro de gravedad del rea. Segn este mtodo, de
amplia difusin, el valor rgido se obtiene, en el caso habitual en que el
dominio de la funcin sea discreto o compacto280 como:
~
Aclarado ( A) =
x (x )
(x )
i
b) Mtodo de la bisectriz o mediana del rea. En el caso continuo, definidos el

menor y el mayor valor de X ( x m , x M ), el aclarado se realiza calculando el
punto mediano x tal que divida en dos mitades iguales el rea por debajo de
la curva de la funcin de pertenencia.
En Yager y Filev (1993) y Driankov et al. (1996) se hace una revisin de los principales mtodos para el
paso de una medida difusa a otra rgida.
279
303
~
Aclarado ( A) = x
xM
( x ) dx = ( x ) dx
i
xm
c) Mtodo de la media de los mximos. En el caso discreto por ejemplo, se

calcula el promedio con los k valores x j para los que la funcin de
pertenencia alcanza su valor mximo M .
k
~
Aclarado ( A) =
x
j =1
; A~ ( x j ) = M
~
d) Mtodo del menor de los mximos. El representante del conjunto difuso A
es el menor valor de los xj que tengan A~ ( x) mximo.
~
Aclarado ( A) = min x j A~ ( x j ) = M
e) Mtodo del mayor de los mximos. En este caso es el mayor valor de los xj
que tienen la mxima valoracin en la funcin de pertenencia.
~
Aclarado ( A) = max x j A~ ( x j ) = M
4.4.2.6. Aplicaciones de la Teora de Conjuntos Difusos a la Economa Ecolgica

y Regional.
En el mbito de las ciencias de la tierra, as como en la Economa Regional y
Ecolgica, cada vez son ms frecuentes aplicaciones de la teora de los conjuntos
difusos y la lgica difusa. Como sealan Bergh et al. (1995), los sistemas espacioambientales son sistemas complejos caracterizados por su subjetividad e imprecisin.
Este hecho da pie al uso de la teora de los conjuntos difusos a la ecologa (Bosserman y
Ragade, 1982) y en general a las ciencias de sistemas (Brdossy y Duckstein, 1995; Salski,
1992; Silvert, 2001), concretamente en aspectos tales como la definicin del nicho
ecolgico (Cao, 1995), la clasificacin de impactos ambientales (Silvert, 1997; Lehn y
280
Puede determinarse asimismo para el caso continuo en funcin del tipo de anlisis que estemos
304
Temme, 1996; Enea y Salemi, 2001), o la toma de decisiones medioambientales (Morillas

et al., 1997b; Geldermann et al., 2000; Despic y Simonovic, 2000).
Desde el trabajo inicial de Bellman y Zadeh (1970) donde se relaciona la teora de
los conjuntos difusos con la toma de decisiones multicriterio, han sido muchas las
aportaciones delimitando las tcnicas principales para el anlisis multicriterio difuso281.
Estos mtodos utilizan de forma conjunta informacin precisa, estocstica y difusa
(informacin lingstica y subjetiva), partiendo del modelo Bellman y Zadeh (1970)282
que sobre la base de las funciones de pertenencia define las decisiones en trminos de
agregacin de todos los conjuntos difusos delimitados para los objetivos y las
restricciones iniciales. Entre las aportaciones ms interesantes al campo de la toma de
decisiones medioambientales283 destaca la realizada por Munda (1995) denominada
NAIADE (Novel Approach to Imprecise Assessment and Decision Environments).
El Mtodo NAIADE realiza una evaluacin lingstica de las alternativas en base
a una medida de distancia semntica entre estas variables lingsticas en forma de
nmeros difusos. Este proceso se realiza en base a la nocin de relaciones difusas y
cuantificadores lingsticos. La agregacin de preferencias concede mucha importancia a
la cuestin de la heterogeneidad y diversidad de los criterios individuales, permitindose
la compensacin parcial entre los mismos y plantendose una medida de la entropa,
concepto asociado al grado de borrosidad del sistema. Finalmente, el modelo
multicriterio arroja una solucin que considera el conflicto entre los tres criterios
econmicos de eficiencia, equidad y sostenibilidad.
El enfoque difuso resulta idneo en el anlisis del desarrollo sostenible dada la
elevada ambigedad contenida en el trmino. El concepto difuso de la sostenibilidad
(Castro y Morillas, 1998) viene justificado por el elevado grado de incertidumbre de tipo
difusa manifestada en los siguientes hechos (op. cit. pg. 14):
realizando, calculndose entonces la correspondiente integral y viceversa.
281 Entre otras aportaciones cabe mencionar las de Yager (1977), Dubois y Prade (1984), Chen y Hwang
(1992), Fodor y Roubens (1994), Grabisch (1996) y Morillas et al. (1997a).
282
Estos autores utilizan el operador-mnimo para construir la funcin de decisin
D~ ( x) = min A~ ( x), A~ ( x),, A~ ( x) con la que se obtiene, para cualquier alternativa x, el grado
1
~ ~
en el que x cumple los criterios expresados por los conjuntos difusos A1 , A2 ,, An

Destacan las aportaciones de Smith (1994), Munda (1995), Munda et al. (1993; 1994; 1995) o Reilly
(1996), entre otros.
283
305
a) Ambigedad conceptual. Se ha podido comprobar que la lgica dual

tradicional se encuentra con la imposibilidad de clasificar sin ambigedad
ciertas situaciones como simplemente sostenibles o no sostenibles. Ello
es debido a que esta categorizacin no obedece a criterios estrictamente
objetivos y cuantificables, debido a una indefinicin manifiesta en el propio
concepto de sostenibilidad. El enfoque difuso permite, entre otras ventajas
conceptuales, el establecimiento de umbrales blandos (soft thresholds) o
progresivos entre ambos trminos lingsticos.
b) Calidad de la informacin de partida. En este tipo de anlisis, junto a la
informacin objetiva existen otras fuentes de informacin importantes de
naturaleza subjetiva. Asimismo, numerosas estadsticas son incompletas,
imprecisas o ambiguas en algunos casos, hecho que dificulta las
comparaciones entre mbitos distintos, sobre todo a escala urbana donde no
existe una base estadstica en materia de indicadores de desarrollo sostenible.
El enfoque difuso permite afrontar este tipo de problemticas asociadas a la
informacin subjetiva o ambigua, asignando distintos grados de pertenencia a
la misma.
c) Conflicto entre intereses. Si bien hay otras tcnicas para evaluar el conflicto
entre objetivos, la adopcin de un enfoque difuso aporta una mayor
flexibilidad en las soluciones obtenidas bien sea a partir de tcnicas
multicriterio, como a travs de medidas agregadas a partir de indicadores en
conflicto que necesitan de mecanismos compensadores.
En referencia a la elaboracin de medidas especficas de la sostenibilidad, son
escasas y muy recientes las referencias aplicables, destacando Silvert (2000), Phillis y
Andrian. (2001) y Cornelissen et al. (2001). Desde un enfoque difuso para la elaboracin
de medidas sintticas del desarrollo sostenible sobre la base de
indicadores de
sostenibilidad, se pueden distinguir dos tipos de anlisis para construir ndices difusos de
sostenibilidad:
a) En primer lugar, una lnea de trabajo viene dada por la construccin de ndices
difusos a partir de la agregacin de conjuntos difusos. Silvert (1997; 2000)
propone un intuitivo mtodo que sigue los pasos habituales en la elaboracin
de ndices pero aplicados a un entorno difuso. Seleccionados los indicadores
iniciales en base a criterios cientficos y polticos, as como la importancia
relativa de cada uno de ellos, se calculan los valores de pertenencia de cada
indicador a los valores lingsticos definidos para la variable (p.e.: no
306
aceptable, aceptable), considerando para ello los valores crticos u objetivo

planteados. La agregacin ponderada de estos valores de pertenencia mediante
un operador compensatorio, dan lugar a un conjunto final a modo de ndice
difuso. Si se parte de varias funciones de pertenencia, se puede implementar
un proceso de aclarado para llegar a una nica puntuacin rgida para cada
caso.
b) Una segunda posibilidad es la elaboracin de modelos de lgica difusa o
razonamiento aproximado (reglas if-then). Un ejemplo se encuentra en el
modelo SAFE (Sustainability Assessment by Fuzzy Evaluation) desarrollado
por Phillis y Andrian. (2001). En este modelo se parte de la definicin de unos
indicadores de sostenibilidad ecolgica y social agrupados segn el enfoque
PER de la OCDE, llegando finalmente a la formulacin de una medida difusa
de la sostenibilidad global. Las variables rgidas iniciales son normalizadas (en
referencia al valor objetivo para cada una de ellas) y transformadas a variables
lingsticas difusas. Mediante distintos operadores estas variables son
agregadas en varias fases siguiendo las reglas de inferencia difusa (Zadeh,
1979), configurando el ndice difuso de sostenibilidad. Finalmente, mediante el
proceso de aclarado (defuzzification) se pasa a una medida rgida de la
sostenibilidad.
En referencia a las aplicaciones difusas ms relevantes en el mbito de la
sostenibilidad urbana destaca, entre otros, el trabajo de Nijkamp y Pepping (1998),
quienes aplican el anlisis de conjuntos rugosos284 a la identificacin de pautas o
condiciones para el xito de la sostenibilidad urbana, en un ejercicio de meta-anlisis de
polticas urbanas en algunas ciudades europeas.
Por otra parte, son varias las aplicaciones de redes neuronales basadas en lgica
difusa que se centran en el anlisis espacial (Openshaw, 1993) y urbano (White, 1989).
Diappi et al. (1998) desarrollan una red neuronal difusa que modeliza el equilibrio entre
los diferentes subsistemas urbanos: el social, el econmico y el fsico o ambiental.
Mediante un aprendizaje utilizando una base de datos con 43 atributos para 95 ciudades
Un conjunto rugoso es una extensin del concepto bsico de conjunto difuso debida a Pawlak (1982;
1991). Se aplica como instrumento para transformar y clasificar datos cualitativos en distintas clases de
atributos (Bergh et al., 1997) cuando la informacin imprecisa no permite clasificarlos numricamente
mediante sus caractersticas en una categora, expresando los grados de pertenencia mediante el concepto
de aproximacin (Pawlak, 1982).
284
307
italianas, la red neuronal asigna las ponderaciones de las variables en funcin a la

optimizacin de grupos especficos de atributos. Finalmente se jerarquizan las ciudades
en base a las propiedades de estas variables, pero no se obtiene una medida sinttica
final.
En Diappi et al. (1999) se elaboran unos mapas de riesgo y oportunidades para la
sostenibilidad a escala urbana, manejando variables referidas a contaminacin, niveles
educativos, desempleo juvenil o calidad de las viviendas, entre otras. El modelo
implementado se apoya tambin en el desarrollo de una red neuronal difusa. Finalmente,
Buscema y Diappi (1999) estudian la complejidad de la estructura urbana a partir de una
red neuronal para caracterizar la especializacin cultural, tcnica y productiva de las
ciudades analizadas as como las interrelaciones socioeconmicas y ambientales.
4.4.3. Descripcin del modelo difuso.

A la hora de escoger el modelo difuso para determinar una medida de la calidad
del desarrollo a partir de un conjunto de indicadores, se han identificado dos grupos de
metodologas: la agregacin de conjuntos difusos y la lgica difusa. En este punto es
necesario recabar argumentos que fundamenten la eleccin de una alternativa u otra.
Con este objetivo resulta interesante la comparativa que Cornelissen et al. (2001) realizan
de las dos vas posibles.
Entre sus conclusiones (op. cit. pg. 183), destacan que la agregacin de conjuntos
difusos es una aplicacin robusta de la teora de conjuntos difusos que permite un
enfoque general del razonamiento humano. Desde el punto de vista de la toma de
decisiones, esta tcnica realiza una ordenacin de las actitudes frente al desarrollo
sostenible, partiendo de la conservadora hasta la liberal. Por otro lado, en referencia al
modelo de aplicacin de la lgica difusa, sealan que se trata de una aplicacin ms
refinada de la teora de los conjuntos difusos que permite un enfoque especfico del
razonamiento humano.
El modelo de lgica difusa, siguiendo la formulacin que se ha mencionado ms
arriba o cualquier otra apoyada en redes neuronales difusas para estimar las
ponderaciones entre las variables y la estructura de las reglas de razonamiento difuso,
resulta una alternativa ms enriquecedora desde el punto de vista de la medida del
308
desarrollo sostenible. Ya se ha comentado que la vaguedad presente en dicho

concepto es el principal obstculo para su evaluacin.
Desde la lgica difusa se pueden modelizar ms acertadamente las reglas de
decisin implcitas en la visin que los agentes decisores, la comunidad cientfica o la
sociedad tienen acerca del desarrollo sostenible. De esta forma se elude el paso previo
de la definicin del concepto de desarrollo sostenible, estableciendo en su lugar las
reglas de razonamiento implicadas y que subyacen en los juicios de valor referidos a las
decisiones en materia de desarrollo285 .
De forma resumida, son tres las principales trabas que justifican la no seleccin de
un modelo de lgica difusa en el presente trabajo:
a) La necesidad de construir las reglas de razonamiento difuso para realizar la
inferencia difusa. Desconocidas las reglas de forma total o parcial, dos son las
principales alternativas (Brdossy y Duckstein, 1995): contar con una serie de
opiniones de expertos que establezcan las relaciones entre los inputs y los
posibles outputs, o bien con una base de datos amplia que permita identificar
cules son las variables explicativas observadas y derivar el sistema de reglas
difusas.
b) El uso de un nmero elevado de indicadores complica exponencialmente las
reglas difusas, dada su naturaleza combinatoria, perdiendo transparencia el
anlisis. Este hecho obliga a la seleccin del menor nmero posible de
indicadores iniciales de cara a mantener la transparencia del modelo a costa de
una menor representatividad.
c) La robustez del modelo basado en lgica difusa depende de la amplitud y la
calidad de la base de datos. En ciertos casos no es posible la extrapolacin de las
reglas de razonamiento difuso a otros mbitos, mxime si se han elaborado
sobre la base de redes neuronales, pues en este caso se desconocen las
operaciones realizadas en la llamada caja negra para pasar del input al output,
perdiendo sentido el anlisis comparativo con otros mbitos no recogidos
inicialmente en el anlisis.
Con el instrumento del razonamiento aproximado es posible adems realizar otro tipo de anlisis
centrados, por ejemplo, en el estudio de conflictos en la toma de decisiones medioambientales (conservar
vs. explotar) mediante teora de juegos difusos, etc.
285
309
Por su parte, de forma complementaria, la seleccin del modelo difuso de

agregacin de conjuntos se basa en los siguientes puntos:
a) Supone un mtodo idneo para una primera aproximacin descriptiva de las
variables que componen el concepto de desarrollo. Por la propia estructura del
modelo, es posible determinar el peso relativo de cada variable y realizar anlisis
de sensibilidad especficos.
b) Facilita la consideracin de un mayor nmero de dimensiones a la hora de
cuantificar el desarrollo sostenible, manteniendo la transparencia interna del
modelo.
c) Partiendo de una definicin en trminos relativos de la sostenibilidad, permite la
comparacin directa entre anlisis de mbitos distintos, siempre y cuando hayan
seguido los mismos pasos en su formulacin, hecho no totalmente necesario en
los modelos de razonamiento aproximado.
En base a todo lo anterior, se propone en este epgrafe el marco general para
implementar un modelo difuso lingstico aplicado a la obtencin de un ndice de
desarrollo sostenible mediante la agregacin de conjuntos difusos (ACD). Los pasos a
seguir son (Figura 4.2):
a) Seleccin de los indicadores, definicin de los valores de referencia y
normalizacin.
b) Definicin de la variable lingstica difusa sostenibilidad parcial en base al
concepto operativo de desarrollo sostenible finalmente seleccionado.
c) Definicin de las funciones de pertenencia y de los valores de pertenencia
parciales.
d) Agregacin de las pertenencias parciales y obtencin del ndice difuso
sostenibilidad global.
e) Aclarado y obtencin de una medida rgida como ndice final no difuso.
La aproximacin que sobre la base de datos elaborada se realizar en el captulo
siguiente seguir este esquema, concretando en mayor medida las diversas opciones que
se plantean en este modelo general.
310
Figura 4.2. Modelo difuso para la agregacin de indicadores de desarrollo sostenible.

Valor de Pertenencia
Valor de Pertenencia Global
Sostenibilidad Global para el municipio j.
Definicin del Operador de

Agregacin Compensatoria
Valores de Pertenencia Parcial
Operador Difuso: Promedio Generalizado Ponderado
A~ (N ( x1 j ) )
A~ (N ( x2 j ) )
...
A~ (N ( x1 j ) )
A~ (N ( x2 j ) )
...
Definicin Variable Lingstica
~
A : Sostenibilidad
A~ al conjunto difuso
Valores Lingsticos:
Funcin Pertenencia:
A~ (N ( xnj ) )
A~ (N ( xnj ) )
~
~
A1 : Sostenible, A2 : Insostenible
, A~ ( x )
A~ ( x)
1
Indicadores Normalizados
N (X1j)
N (X2j)
...
N (Xnj)
Valores de Referencia
X1*
X2*
...
Xn*
Variable Base para municipio j
X1j
X2j
...
Xnj
Indicador de Sostenibilidad
IS1*
IS2*
...
ISn*
311
4.4.3.1. Seleccin de los indicadores de sostenibilidad y de los valores de

referencia.
La seleccin de los indicadores iniciales ha de partir de la base de un conocimiento
experto acerca de la informacin relevante para la medida del desarrollo. Para ello es
necesaria la formulacin previa de un modelo que presente las principales
interrelaciones entre los componentes, en este caso, del ecosistema urbano286.
Definido el modelo de partida, se establecen criterios para decidir qu tipo de
medida se desea obtener. Dada su principal utilidad (apoyo a la toma de decisiones), un
ndice de desarrollo ha de considerar aquellas dimensiones factibles para la posterior
gestin o actuacin sobre las mismas. No obstante, se han de aunar criterios tanto
cientficos como sociales para delimitar el concepto operativo de desarrollo.
En cada uno de los subsistemas del modelo de anlisis local se han de identificar
los ms indicadores relevantes para elaborar el ndice difuso. Para realizar esta seleccin
resulta pertinente partir de los resultados previos de otras tcnicas multivariantes, tales
como el anlisis de componentes principales, cuando los indicadores as lo permitan.
Tambin se ha comentado que el modelo difuso posibilita el uso de informacin
no necesariamente rgida o exacta. Gracias al uso del enfoque lingstico, entre los
indicadores se podrn incluir al mismo nivel valoraciones subjetivas (p.e.: percepciones
subjetivas de la calidad del medio ambiente), e informacin vaga o incompleta.
Seleccionados los indicadores iniciales en base a su incidencia directa sobre
cuestiones relativas al desarrollo, se pasa a la identificacin de los valores de referencia.
Otra caracterstica inherente al modelo difuso es la definicin de umbrales progresivos.
Este importante aspecto es destacado por Phillis y Andrian. (2001:436): el lmite entre
situaciones sostenibles e insostenibles es muy difuso, por lo que no es posible
determinar valores de referencia rgidos para la sostenibilidad. En funcin a los valores
de referencia, son diversas las posibilidades de anlisis de la sostenibilidad, destacando
las tres siguientes.
Sobre las cuestiones no directamente relacionadas con el modelo difuso, en concreto la definicin de
los componentes del modelo, la seleccin de indicadores y la justificacin de los valores de referencia, se
ocupa en profundidad el primer apartado del siguiente captulo.
286
312
En primer lugar, si se opta por la aplicacin de valores objetivo observados

(mximo, media, mnimo), el modelo difuso se aproxima al concepto de la sostenibilidad
relativa comentada en el epgrafe de ciudad y sostenibilidad. Los indicadores son
referidos a determinados valores observados en la muestra. Una elevada pertenencia al
conjunto Sostenible denotara una mejor evaluacin del indicador en relacin a los
valores observados en la muestra y por tanto una mejor posicin relativa del mbito de
estudio.
En segundo lugar, si se parte de valores de referencia absolutos (umbrales o
niveles crticos predefinidos), el concepto de desarrollo se puede considerar bajo el
enfoque de la sostenibilidad absoluta. Las distancias de los indicadores a los valores de
referencia aportan informacin acerca del margen que queda (o bien el dficit
producido) para alcanzar el lmite fsico o nivel crtico estimado. Una elevada
pertenencia de la evaluacin difusa de un indicador concreto al conjunto Sostenible
implicara que en gran medida se cumple el valor de referencia u objetivo definido para
el mismo y que por tanto, en trminos de la contribucin al desarrollo sostenible de
dicho indicador, se cumple el criterio de la sostenibilidad absoluta.
Una tercera alternativa es la derivada de que en el modelo difuso se pueden
utilizar valores de referencia orientados hacia la toma de decisiones, es decir, los
denominados valores o niveles objetivo (targets). Los mismos formulan un nivel a
alcanzar por la poltica de desarrollo implementada en el mbito de accin y que se
plasma en un determinado valor para el indicador.
Sobre la base de la matriz con las variables base para el modelo lingstico difuso,
se considera para cada valor xij en el mbito i y la dimensin j, un valor de referencia
x j * . Este valor cumple para todos los indicadores la misma funcin desde distintas
perspectivas. En unos casos se trata de un valor objetivo mnimo (p.e.: niveles de ruido
ambiental), de un valor objetivo mximo (p.e.: renta per capita), o de un valor objetivo en
forma de intervalo (p.e.: distancia temporal a zonas verdes). En trminos de la
evaluacin del desarrollo, se trata de delimitar para cada indicador el valor que
determine el sentido de su contribucin al desarrollo sostenible287.
En el captulo anterior ya se hizo referencia a la seleccin del valor de referencia entre alternativas
como el nivel objetivo, el umbral crtico, o los niveles observados (min, max, medio, mediano). El hecho
de seleccionar el nivel-objetivo no descarta los dems, dado que puede coincidir en algunos casos con
287
313
Seguidamente se procede a la normalizacin de los indicadores. Existen muchas

alternativas para conseguir una medida homognea comparable para todos los
indicadores. La normalizacin clsica parte de las siguientes expresiones:
a)
N ( xi ) =
b) N ( xi ) =
xi
x
xi x
La alternativa primera es la ms simple, donde slo se relativiza respecto al valor

medio, eliminando el efecto de la unidad de medida. La segunda es la ms utilizada, pues
las diferencias al valor medio relativas a la desviacin tpica observada consiguen
eliminar los efectos de unidad de medida y escala.
Otra posibilidad contemplada en la construccin de ndices agregados es la
definida por Drewnowski (1970) llamada punto de correspondencia utilizada en la
elaboracin del ndice de Desarrollo Humano (UNDP, 2000). Consiste en establecer
para cada indicador un intervalo limitado por un mnimo y un mximo empricos y
calcular el nivel alcanzado como tasa o porcentaje de dicho intervalo:
x x min
N ( xi ) = i
x max x min
100
Con esta alternativa se pretende normalizar el indicador en base a su distancia al

valor mnimo en relacin al recorrido total. Profundizando en esta idea, la normalizacin
se puede realizar respecto a los valores de referencia seleccionados para cada indicador,
considerndola como una estandarizacin en trminos de distancia respecto al valor
objetivo de cada indicador.
Siguiendo a Phillis y Andrian. (2001) se pueden definir las siguientes funciones de
normalizacin en base a que el valor objetivo sea un mximo x max

, un valor mnimo
x min
, o un intervalo x min
, x max
:
ciertos valores observados (eligindose as de referencia la mejor situacin observada) o con los niveles
crticos a mantener de determinados conceptos (p.e.: el verde urbano ha de superar los 5 m2/hab.).
314
a) Si el valor objetivo es un mximo x max

,
xi x min

N ( xi ) = x max
x min
; xi < x max
; xi x max
b) Si el valor objetivo es un mnimo x min

,
x
N ( xi ) = max xi
x x
min
max
; xi x min
; xi > x min
, x max
),
c) Si el valor objetivo es un intervalo ( x min
xi x min
x x
min
min
N ( xi ) =
1
x max xi
x max x max
; xi x min
; xi ( x min
, x max
)
; xi x max
Tras esta normalizacin, todos los indicadores son adimensionales, tomando

valores en el intervalo (0,1). Un valor prximo a cero indica que, en la dimensin
recogida por el indicador especfico, se est lejos del objetivo marcado. De forma
complementaria, un valor del indicador normalizado prximo a la unidad refleja que se
cumple el objetivo definido para la consecucin del desarrollo sostenible.
4.4.3.2. Definicin de la variable lingstica.
Bajo el enfoque lingstico, el principal instrumento de este modelo es la
definicin de una variable lingstica difusa. Cuatro son sus caractersticas:
a) El nombre de la variable (p.e.: la altura).
b) El valor o valores lingsticos (p.e.: bajo, mediano, alto). Cada uno de ellos
tiene un valor sintctico (etiqueta) y un valor semntico (significado).
c) Las funciones de pertenencia de los valores lingsticos (p.e.: funciones
matemticas como las derivadas de los nmeros triangulares).
315
d) El dominio de la variable base (p.e.: la escala de medida en centmetros).

La variable lingstica traducir a trminos difusos, mediante la funcin de
pertenencia, la informacin inicial de la variable base (Bonissone, 1982). Este proceso
recibe el nombre de difuminado o borroseado (fuzzification). La eleccin del
conjunto de trminos lingstico con sus semnticas respectivas, la granularidad
(granularity) de la variable lingstica (Jimnez, 1998), es el primer paso a realizar, de ah
la importancia de una correcta definicin del dominio de expresin lingstica (Zadeh,
1975)288.
De cara a evaluar el desarrollo sostenible, se define precisamente esta variable
~
lingstica A : Sostenibilidad cuyo mbito de aplicacin es la evaluacin difusa de la
distancia de un indicador especfico al nivel de referencia previamente definido.
Seguidamente se han de identificar los posibles valores lingsticos, para cada uno
~
de ellos su valor semntico vendr definido por un subconjunto difuso Ai en el
universo de discurso N ( xij ) [0,1] . Se podran definir tantos valores como fueran
necesarios para caracterizar o adjetivar a la variable nivel de desarrollo.
~
~
La definicin de dos valores lingsticos ( A1 : Sostenible y A2 : No sostenible),
supone una opcin vlida como primera aproximacin que no persigue ms que la
clasificacin de los municipios considerando que tiene caractersticas pertenecientes a
ambos conceptos con distintos grados de intensidad o posibilidad. La justificacin de
elegir dos valores lingsticos, frente a la posibilidad de definir ms valores289 se basa en
dos razones:
a) Adecuacin lingstica. En la literatura revisada en los captulos anteriores se
parte de la definicin de una nica variable: sostenibilidad, caracterizada en la
Una definicin operativa de los pasos a establecer en la toma de decisiones con informacin lingstica
puede encontrarse en Herrera y Herrera-Viedma (2000).
289 La diferenciacin de ms categoras o valores para el trmino lingstico ha de cumplir un compromiso
genrico de operatividad (Zadeh, 1975). La mayor especificacin de categoras lingsticas redunda en un
mayor refinamiento o desagregacin de la informacin resultante en el output del modelo. No obstante, el
anlisis planteado persigue una formulacin ms genrica propia de una primera aproximacin
metodolgica a la modelizacin de la sostenibilidad.
288
316
lgica clsica por dos trminos complementarios y excluyentes: sostenible

frente a no sostenible 290.
b) Adecuacin difusa. El hecho de considerar un modelo difuso en s permite
una pertenencia gradual y progresiva del valor del indicador al concepto de
desarrollo descrito por el conjunto difuso sostenible, por lo que en una
primera aproximacin se considera como suficiente. Este hecho no ocurre en
la lgica clsica donde dos valores frontera de un indicador se clasifican en
conjuntos complementarios a pesar de su mnima diferencia (problema de los
bordes rgidos en la teora clsica de conjuntos), lo que obligara en ese caso a
la redefinicin de ms conjuntos rgidos (ms granulacin) para evitar el efecto
de los valores frontera.
Si los indicadores son referenciados a determinados valores observados en la
muestra, se considera el enfoque de la sostenibilidad relativa. Una elevada pertenencia al
conjunto sostenible denotara una mejor evaluacin del indicador en relacin a los
valores observados en la muestra y por tanto una mejor posicin relativa del mbito de
estudio.
Si se parte de valores de referencia absolutos (enfoque de la sostenibilidad
objetiva), las distancias de los indicadores a los valores de referencia aportan
informacin acerca del margen que queda (o bien el dficit producido) para alcanzar el
lmite fsico o nivel crtico estimado. Una elevada pertenencia de la evaluacin difusa de
un indicador concreto al conjunto Sostenible implicara que en gran medida se cumple
el valor de referencia u objetivo definido para el mismo y que por tanto, en trminos de
la contribucin al desarrollo sostenible de dicho indicador, se cumple el criterio de la
sostenibilidad en sentido objetivo.
Los distintos valores lingsticos vienen definidos por unas funciones de
pertenencia especficas, las cuales se refieren y justifican en el siguiente epgrafe. De las
mismas se derivan una pertenencia parcial al conjunto difuso sostenible para cada
indicador normalizado.
Para facilitar el clculo posterior y de acuerdo a su adecuacin lingstica, dado que ambos trminos
son complementarios, se definen las dos funciones de pertenencia tambin de forma complementaria.
290
317
La variable lingstica final obtenida tras la agregacin de todos los indicadores

~
est definida semnticamente de la misma forma que la variable descrita ( A ). No
~
obstante, para reflejar el proceso de agregacin se denominar AGlobal : Sostenibilidad
Global.
4.4.3.3. Definicin de las funciones de pertenencia. Borroseado de la
informacin.
Asumiendo el uso de los conjuntos difusos para describir la semntica de los
trminos lingsticos, la correcta definicin de la funcin de pertenencia es la clave para
la obtencin de un modelo difuso que ofrezca respuestas tiles al problema de
incertidumbre difusa291. Esta funcin permite la definicin de un umbral suave (soft
threshold) en contraste con el umbral duro (hard threshold) de los conjuntos clsicos.
A la hora de su definicin en determinados mbitos de aplicacin, si no es posible
partir de una base amplia de datos reales y objetivos292 sobre los que aplicar una red
neuronal de aprendizaje prueba error (p.e.: ciencias sociales), puede producirse un
elevado grado de subjetividad, hecho que no suele ocurrir en el caso de las aplicaciones
realizadas en Ingeniera Industrial. En este sentido, al asociar un conjunto difuso a un
concepto lingstico, puede aparecer el obstculo aadido de la indefinicin en la
aplicacin, como sealan Brdossy y Duckstein (1995:14) en referencia precisamente al
ejemplo de los valores lingsticos buena o excelente calidad medioambiental.
Al revisar las tcnicas existentes para la caracterizacin de conjuntos difusos293 se
constata que no existe un nico mtodo de definicin de funciones de pertenencia. Su
eleccin est sin duda condicionada por el hecho de que la funcin de pertenencia
represente fielmente el cumplimiento progresivo de determinada caracterstica a
modelizar por el conjunto difuso en concreto294.
Resulta habitual referirse a la funcin de pertenencia como el punto fuerte y dbil de la teora de los
conjuntos difusos.
292 No obstante, en estos casos se suele recurrir a la opinin de expertos, el uso de indicadores
aproximados o la simulacin previa de datos.
293 Vanse Civanlar y Trussel (1986), Dubois y Prade (1986) y Trksen (1991).
294 Una vez que se han especificado las funciones de pertenencia, es recomendable realizar un anlisis de
sensibilidad para perfeccionar dichas funciones (Brdossy y Duckstein, 1995), dado que el modelo difuso
es muy sensible al tipo de soporte o pendientes de las mismas.
291
318
La manera ms genrica de realizar este proceso es mediante la definicin de un

~
nmero difuso triangular A con respecto a un parmetro x mediante la identificacin
de tres nmeros (Brdossy y Duckstein, 1995):
a) el valor ms creble x * , al que se le asigna el valor de pertenencia de 1.
b) el nmero x , que casi con total certeza es menor que el valor del parmetro,
asignndole un valor de pertenencia de 0.
c) el nmero x + , que casi con total certeza es mayor al valor del parmetro,
asignndole un valor de pertenencia de 0.
~
Queda as definido el nmero triangular A = x , x*, x + . El intervalo x , x + es
el soporte del nmero difuso, fuera del cual la funcin de pertenencia es definida como
cero.
La justificacin de esta tcnica de obtencin de funciones de pertenencia es
igualmente intuitiva. En situaciones en las que no es posible implementar otras tcnicas
basadas en la probabilidad a priori o aquellas que determinen valores funcionales
(Trksen, 1991), la aproximacin del nmero difuso triangular permite satisfacer unos
requerimientos mnimos en trminos de compatibilidad con otras formas funcionales, es
decir, se trata de la mejor aproximacin posible a la mayora de funciones de pertenencia
(Pedrycz, 1994), mostrando tambin una mayor comodidad a la hora de su clculo.
En estas situaciones, la alternativa radica en el desarrollo de mtodos empricos
para la construccin de funciones de pertenencia basados en la opinin de expertos. En
este punto, Cornelissen et al. (2001) consideran tres aspectos fundamentales: a) definir
qu cualificacin han de cumplir estos expertos; b) cmo obtener el conocimiento
experto para construir la funcin de pertenencia; y c) establecer mtodos para medir la
fiabilidad de dicha funcin, hecho bsico para fundamentar el modelo difuso.
En el anlisis objeto de estudio existe cierta informacin, basada en la semntica
propia del concepto de desarrollo sostenible, que permite una primera seleccin
funcional que perfecciona la aproximacin triangular. En primer lugar, si se elige la
funcin triangular resultara muy difcil defender que slo un nico valor de la variable
tiene una pertenencia total al conjunto difuso sostenible.
319
Para solucionar esta cuestin, en la toma de decisiones con informacin

lingstica, algunos autores consideran las funciones de pertenencia trapezoidales295
lineales como mejores aproximaciones a la evaluacin lingstica, dado que puede ser
imposible e innecesario obtener valores ms precisos (Herrera y Herrera-Viedma,
2000:70). Por otra parte, un nmero difuso semi-infinito ( q ), caso especfico de los
nmeros triangulares, resulta ms adecuado que un nmero triangular genrico, dado
que representa una mayor incertidumbre difusa en el clculo de la pertenencia al
objetivo de la sostenibilidad (Phillis y Andrian., 2001).
Un segundo aspecto en relacin al concepto de sostenibilidad es la progresividad.
La ganancia parcial de la sostenibilidad no es la misma para un indicador que mejora en
su posicin relativa partiendo desde valores mnimos o elevados. Resulta claro que a
partir de cierto nivel crtico se modifica la pendiente al alcanzar niveles de sostenibilidad
suficientemente elevados. En este sentido, un nmero difuso con funcinS aporta una
mayor flexibilidad que las anteriores formas funcionales (Figura 4.3), suavizando el
balance progresivo de la pertenencia de forma no lineal y aproximndose as a la lgica
humana a la hora de asignar valores de pertenencia a los conjuntos de sostenible y no
sostenible (Figura 4.4).
Figura 4.3. Comparacin entre formas funcionales de pertenencia difusa.
A~ ( N ( x i ) )
i
1
Funcin- S
q-
triangular
295
xi
xi
xi
Se ha de recordar que un nmero triangular es un caso especfico de nmero trapezoidal.
320
N ( xi )
Figura 4.4. Funcin de pertenencia.
A~ ( N ( xi ) )
1
A~ ( N ( xi ) )
~
A2 : No Sostenible
~
A1 :Sostenible
N ( xi )
El siguiente paso es el de borroseado en la que se pasa de la informacin rgida
a la informacin difusa en trminos lingsticos. Para ello se computa el grado de
pertenencia del valor normalizado de cada indicador a los conjuntos difusos definidos.
4.4.3.4. Agregacin. Seleccin de los operadores de agregacin de las
pertenencias parciales.
Calculados los valores de pertenencia para todos los indicadores referidos a cada
mbito de estudio, se procede a la agregacin de los mismos para obtener una medida
promedio difusa de los valores de pertenencia a los distintos trminos lingsticos
empleados para referirse al desarrollo global del mbito en cuestin.
No obstante, como paso intermedio, se puede diferenciar una agregacin previa
por subsistemas de indicadores, obteniendo as una medida del desarrollo especfica para
los mismos, mucho ms homognea internamente a la hora de interpretar la pertenencia
a los distintos valores lingsticos.
La agregacin de los indicadores referidos a subsistemas distintos ha de afrontar las
cuestiones referidas al balance o compensacin de la misma. Esta cuestin permite la
eleccin de uno de los enfoques de la sostenibilidad: fuerte o dbil, al poderse
321
considerar distintos ajustes en el grado de sustituibilidad entre el capital natural y

humano.
Desde la sostenibilidad dbil, reconociendo la existencia de un balance entre los
criterios (sobre todo el econmico y el ambiental), se puede elegir una regla que permita
compensar valores de pertenencia bajos de unos indicadores (p.e.: espacios protegidos)
con valores elevados de otros (p.e.: verde urbano). En trminos del modelo difuso, este
enfoque se traduce en la aplicacin de un operador para la agregacin que considere un
criterio de compensacin o sustituibilidad plena
(operador-mximo) o parcial
(operador- , la suma simtrica, la media aritmtica, etc.).

Zimmermann y Zysno (1980) constatan que el procedimiento de agregacin que
realiza el razonamiento humano es de naturaleza compensatoria, por lo que los
operadores mnimo y mximo no son vlidos para la agregacin, dado que se necesita
una solucin de compromiso entre los resultados del y lgico y del o lgico. Como
sealan Chen y Hwang (1992:60), es similar a tomar una decisin en base nicamente
al mejor y al peor de los valores del atributo considerado.
Partiendo del enfoque de la sostenibilidad en sentido fuerte, el modelo difuso no
ha de considerar la compensacin de valores mnimos por debajo de cierto umbral de
pertenencia o -corte. La evaluacin difusa global ser determinada por el indicador en
peor situacin respecto al valor de referencia absoluto, independientemente de que otras
variables s consigan valores de pertenencia elevados. Para ello se pueden usar
operadores no compensatorios como el operador-mnimo de la interseccin o la media
geomtrica.
En relacin con el concepto de balance o compensacin aparece tambin la
ponderacin. En este sentido, si se dispone de la informacin necesaria para su definicin,
resulta recomendable establecer unos pesos relativos para cada variable, de manera que
no todos los valores de pertenencia parciales se compensen de la misma manera (Silvert,
1997). No obstante, dado el grado de subjetividad en esta cuestin, se ha de realizar bajo
el prisma de la informacin de expertos y el posterior anlisis de sensibilidad de los
resultados obtenidos.
De entre las alternativas a la hora de seleccionar finalmente el tipo de operador de
agregacin, lo habitual es aplicar la media aritmtica, no obstante, Zimmermann y Zysno
(1980) muestran que este promedio, si bien supone una compensacin bsica, da lugar a
322
evaluaciones sesgadas porque este operador no tiene en cuenta la interaccin entre

criterios. Para ello, Dubois y Prade (1985) desarrollan el operador promedio ponderado
generalizado comentado anteriormente, de gran versatilidad y facilidad computacional,
razn por la cual se utilizar en la aplicacin propuesta al final de este trabajo.
Por otra parte, el operador- cuenta asimismo con gran aceptacin en los
modelos difusos de agregacin de conjuntos, dado que tambin permite ajustar su
posicin relativa entre el operador-mnimo y el operador-mximo296. Asimismo, el
operador suma simtrica (Silvert, 1979) tambin muestra una buena adecuacin al
anlisis de pertenencias en trminos de clases complementarias (sostenible y no
sostenible), as como su capacidad de combinar objetivamente, compensar, las
pertenencias parciales en caso de conflicto entre indicadores (Silvert, 1997).
El operador mnimo supone un grado de conservadurismo pleno, hecho que lo
hace idneo para anlisis desde el enfoque de la sostenibilidad fuerte al no permitir la
compensacin. De forma menos estricta, la media geomtrica es buena candidata para
ese tipo de anlisis, dado que permite cierta compensacin, pero si una pertenencia
parcial para un indicador es cero hace que la pertenencia global sea tambin cero,
independientemente del resto de indicadores (Silvert, 1997).
Tras la agregacin se obtiene para cada mbito un promedio ponderado de la
pertenencia parcial a los conjuntos difusos que caracterizan los valores lingsticos que
finalmente se hayan especificado. Si se ha utilizado un nico conjunto, el promedio
obtenido es el ndice difuso de desarrollo que se buscaba. Si se han definido por
ejemplo dos conjuntos difusos, para no tener que manejar dos cantidades para cada
municipio y poder establecer una clasificacin rgida en un nico conjunto difuso se
procede al proceso de aclarado (defuzzification).
En otros trminos, para poder clasificar en un nico conjunto difuso a cada
mbito o caso analizado lo habitual es recurrir al concepto de -corte referido
anteriormente. Definido un umbral crtico *, se pueden discriminar los valores de
Al igual que los operadores de Yager, se trata de un operador paramtrico, donde la correcta seleccin
del valor del parmetro condiciona la evaluacin difusa. Por ejemplo, en Choi y Oh (2000) se desarrolla
una tcnica iterativa para estimar el valor de dicho parmetro.
296
323
pertenencia que sean menores a *. Cada mbito tendr una pertenencia dominante a
partir de un * dado.
Otra alternativa es la propuesta por Silvert (1997) que se basa en la obtencin de
una puntuacin S a partir de la suma ponderada de las pertenencias obtenidas en los
diversos subconjuntos que conforman un conjunto difuso:
S = w1 A~ + w2 B~ + + wk Z~
De esta forma se concede un mayor grado de importancia a determinados
conjuntos difusos as como a los distintos valores de pertenencia derivados y se obtiene
una nica medida para ordenar o jerarquizar los distintos mbitos en su situacin
agregada frente al concepto de sostenibilidad subyacente en el estudio.
4.5. Conclusiones.
Las conclusiones de un captulo dedicado especficamente a la descripcin de las
tcnicas estadsticas multivariante y el modelo difuso se concretan en el comentario
crtico sobre la utilidad y el alcance de las mismas en el anlisis especfico.
Se parte del objetivo principal de la reduccin o resumen de la informacin
contenida en la matriz de datos inicial, para obtener as una medida sinttica de la
evolucin conjunta definida por estos datos. Como se comenta en el siguiente captulo,
la base estadstica est referida a diversas dimensiones o mbitos que componen el
modelo de desarrollo del ecosistema urbano.
Las tres metodologas expuestas, el Anlisis de Componentes Principales, la
Distancia P2 y la Agregacin de Conjuntos Difusos, tratan de llegar a este objetivo final
desde tres vas distintas, aunque se ha de explicitar que comparten el hecho de analizar
relaciones lineales, propias del modelo causa-efecto referenciado en el enfoque PER de
la OCDE, a partir de la correlacin existente entre los indicadores iniciales o en
referencia a los ndices elaborados para los distintos subsistemas parciales.
324
En particular, el Anlisis de Componentes Principales define un nuevo y reducido

conjunto de indicadores, combinaciones lineales de los iniciales, que tienen la
caracterstica de ser independientes entre s y mantener la mayor cantidad de
informacin de la matriz inicial. Esta tcnica se usa tambin como base para el Anlisis
Factorial, si bien en este caso se alude a su base geomtrica como ajuste entre los planos
creados por las nuevas medidas o componentes.
Para ganar en comparabilidad con las otras tcnicas, el Anlisis de Componentes
Principales se aplica en su versin normada, es decir, normalizando los indicadores de la
matriz inicial. Con este mismo objetivo, no se introduce un sistema de ponderaciones
especfico (lo que se denomina Anlisis de Componentes Principales ponderado),
hecho que redundara en una diferenciacin subjetiva en el peso relativo de indicadores
de determinado subsistema, o sobre los indicadores con mayor explicabilidad dentro de
cada subsistema (realizando previamente un anlisis slo para cada subsistema).
La elaboracin de un ndice mediante los resultados obtenidos del Anlisis de
Componentes Principales se puede afrontar de muy diversas maneras. En este caso se
opta por una combinacin de todos los componentes para con ello evitar mayores
prdidas de informacin y por tanto medidas menos significativas. Asimismo, se
consigue un ndice con un mayor grado de comparabilidad, dado que su elaboracin no
depende del mbito especfico de anlisis297 y por tanto los resultados obtenidos son
plenamente comparables.
En segundo lugar, el Anlisis de la Distancia P2 aporta varias ventajas, entre las
que destaca la obtencin directa de una medida sinttica o ndice. Esta distancia es un
promedio de las diferencias normalizadas y ponderadas para cada indicador con
referencia a un valor objetivo predefinido. Las ponderaciones se obtienen mediante un
proceso iterativo de ajuste en la introduccin de los indicadores, en base a la cantidad de
nueva informacin que aportan los mismos en relacin a los indicadores ya recogidos.
Frente a la tcnica del Anlisis de Componentes Principales, menos exigente en
estas cuestiones, este ndice cumple ciertas propiedades y axiomas exigibles para ser una
medida cardinal del desarrollo.
Como ocurrira si se eligiera como ndice nicamente el primer componente, independientemente de

los indicadores contenidos en el mismo y su grado de explicabilidad respecto a la variancia total.
297
325
Finalmente, la tcnica propuesta de Agregacin de Conjuntos Difusos, pretende

ser una aproximacin a la aplicacin de la Teora de Conjuntos Difusos a la medida de la
sostenibilidad mediante el uso de indicadores. Dado que esta teora es de reciente
aplicacin en Economa y en la Ciencia de la Sostenibilidad, es necesario dedicar algunos
apartados a describir los conceptos bsicos sobre los que se asienta.
De cara a la elaboracin de una medida sinttica, la principal ventaja de este
modelo es el elevado grado de flexibilidad que aporta frente al resto de tcnicas
descritas, gracias a la definicin de las funciones de pertenencia. En este ejercicio se trata
no obstante de obtener una medida final que sea muy similar a la derivada de las otras
dos metodologas. Este hecho, si bien redunda en una simplificacin excesiva, permite
una mayor comparacin entre las ordenaciones y resultados obtenidos para las tres
tcnicas empleadas. No obstante, en este captulo terico, se apuntan las principales
aportaciones y potencialidades que se derivan de este modelo para obtener ndices de
sostenibilidad, bsicamente:
Definicin operativa de la sostenibilidad utilizando lmites progresivos.
Definicin lingstica de la sostenibilidad, ms cercana al significado real del

trmino (cargado de un elevado grado de incertidumbre difusa ).
Conjugacin de indicadores objetivos junto a informacin subjetiva,

incompleta o vaga.
Definicin de un sistema de ponderacin junto al establecimiento de un

mecanismo de compensacin que permite aproximar el ndice obtenido hacia
una medida de la sostenibilidad en sentido fuerte (no compensacin) o sentido
dbil (elevada compensacin).
Definicin de procesos multicriterio difusos en base a la aplicacin de las

denominadas reglas de inferencia difusa a la toma de decisiones con conflicto
entre objetivos ambientales, econmicos y sociales.
En definitiva, este trabajo trata de aplicar tres metodologas alternativas de forma

que se obtengan resultados comparables en la medida de lo posible. Se reconoce que las
tres tcnicas permiten perfeccionamientos alternativos para obtener medidas finales ms
cercanas al objetivo de medida, si bien ello supone un importante detrimento de la
comparabilidad, dado que suponen decisiones en materia de normalizacin y
ponderacin que afectan notablemente al peso de los indicadores a la hora de analizar
las correlaciones observadas.
326

Metodod de Analisis Aplicados Cap 4 (Pag 70) PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Metodod de Analisis Aplicados Cap 4 (Pag 70) PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Captulo 4. Mtodos de Anlisis Aplicados.

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

4.1. Bases para la aplicacin de mtodos multivariantes en

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

varan en cada tcnica, pasando por la normalidad, la linealidad, la

4.1.1. Hiptesis y requisitos generales para los indicadores sintticos.

Hiptesis I. Completitud. Se supone que el nmero de los componentes del

Hiptesis III. Objetividad. Se acepta que la finalidad buscada por el indicador

Postulado I. Existencia y Determinacin. La funcin matemtica que define el

Postulado II. Monotona. El ndice ha de responder positivamente a una

Postulado IV. Invariancia. El ndice ha de ser invariante respecto a un cambio

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

Postulado V. Homogeneidad. La funcin matemtica que define el ndice

[I (a) > I (b) > I (c)] [I (a) > I (c)]

Postulado VII. Exhaustividad. El ndice debe ser tal que aproveche al

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

Aplicando estas tcnicas, la medida del grado de desarrollo a partir de un conjunto

4.2. Anlisis de Componentes Principales (ACP).

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

A partir de las correlaciones observadas entre las variables originales, se definen

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

categoras o incluso dicotmicas reducir las correlaciones afectando al Anlisis

4.2.2. Aplicacin del ACP para la elaboracin de un indicador

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

4.2.2.1. Definicin de la matriz de correlaciones.

La matriz de variancias y covariancias muestrales V queda definida como:

Cuya diagonal principal est compuesta de variancias iguales a la unidad cuando

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

4.2.2.2. Obtencin de las componentes principales.

De forma matricial resumida, el componente z1 ser:

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

La variancia del primer componente, considerando que su media es cero, viene

Si las variables estn tipificadas, X X es la matriz de correlaciones R . Si las

variables estn expresadas en desviaciones respecto a la media, esa expresin es la matriz

Para maximizar esa funcin sujeta a la restriccin

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

El resto de componentes se obtienen de forma anloga. Para el siguiente

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

Por consiguiente, el componente z h explica una proporcin Ph de la variacin

Este coeficiente es el que conforma la denominada matriz factorial, de componentes o

Si en vez de partir de la matriz V se trabaja con la matriz R , la Traza ( R ) = p , por lo que

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

principales y el mtodo de componentes principales245, este ltimo muy similar al ACP

= p ), este criterio se traduce en seleccionar las componentes cuya raz

caracterstica sea mayor que 1247.

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

4.2.2.4. Interpretacin de los componentes.

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

En muchas ocasiones, la aplicacin de esta tcnica se suele limitar a la seleccin de

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

empleo de otros mtodos de seleccin de factores o rotacin. Si el inters del anlisis es

4.3. Anlisis de la Distancia P2 (ADP2).

Enfoque muy aplicado a la medida del desarrollo (Ivanovic,1963;1974) y la desigualdad entre

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

Gracias a ello, estos indicadores pueden utilizarse para comparaciones entre

En ocasiones, como el anlisis multivariante cluster por ejemplo, se trabaja con la

d 2 (i, i*) = ( xij xi* j ) 2

d 2 (i, i*) = ( xij xi* j ) 2 2j

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

Donde DX es la matriz diagonal con las variancias de las variables.

d m2 (i, i*) = ( xij xi* j ) 2 ij

CAPTULO 4. M TODOS DE ANLISIS APLICADOS

d 2 (i, i) = ( xij xi j ) 2

d 2 (i, i) = ( xij xi j ) 2 2j

d m2 (i, i) = ( xij xi j ) 2 ij

d B (i, i) = xij xi j