Sunteți pe pagina 1din 25

Anlisis Discriminante

Debido a su gran extensin, este artculo se ha dividido en 5 partes.


parte 1 parte 2 parte 3 parte 4 parte 5
Esta es la primera parte del artculo, ndice y contenido :
Contenido
Hace casi tres meses se public el artculo Anlisis Cluster - Prctica. l !inal de dicho artculo se
propona un e"ercicio con el !ichero de datos 20010723.sav.
Este artculo ha tenido mucho #xito y nuestros lectores nos han pedido publicar el desarrollo del e"emplo
propuesto. Esta semana $1% &ov %''1( se publica la continuacin del e"emplo completo, basado en el
citado !ichero de datos 20010723.sav.
)ara m*s in!ormacin, consulte los siguientes manuales +ue esperamos sean de su agrado:
Estadstica !ultivariante "nvesti#aci$n de !ercados
"ndice
1. %ip$tess
2. "ntroducci$n &e$rica
3. Con'i#uraci$n del AD
4. E(ecuci$n del AD
5. "nterpretaci$n de las )alidas de un AD
1. %ip$tesis
Hiptesis +ue se pretende demostrar:
Esta es la se#unda parte del artculo, ndice y contenido :
Contenido
2. "ntroducci$n &e$rica
Desde un punto de vista de evolucin tecnolgica, se puede decir +ue los conceptos +ue constituyen
n*lisis Discriminante $lgoritmos ,en#ticos o -ayesianos(
2.1. Objetivos del Anlisis Discriminante en este artculo
.i se recuerda, el !ichero de datos trataba de encontrar un sistema para clasi!icar a los su"etos en una
serie de grupos lo m*s homog#neo posible a nivel interno$entre cada uno de los su"etos( y lo m*s
heterog#neo posible a nivel externo $entre cada uno de los grupos(.
El algoritmo m*s adecuado para ello era el an*lisis de conglomerados $clustering(, toda ve/ +ue no
exista de modo predeterminado una variable de agrupacin $esto es, una variable de clasi!icacin(. El
ob"etivo del algoritmo de clustering es crear una variable de clasi!icacin a partir del c*lculo de
distancias $es decir , seme"an/as o di!erencias( ptimas entre los su"etos.
*i#ura 1 0 lgoritmo del Anlisis Discriminante
.eg1n se recordar*, el algoritmo de clustering llamado t#cnicamente 2345.6E78, uno de los dos
algoritmos de clustering, creaba esa variable y, a la ve/, nos proporcionaba una serie de venta"as
gr*!icas $como, por e"emplo, el gr*!ico de car*mbanos o el de sedimentaciones(.
)or su parte, el algoritmo de clustering llamado t#cnicamente 295:3; 345.6E78, el otro de los dos
algoritmos de clustering, creaba esa variable y, a la ve/, compensaba la !alta de salidas gr*!icas con la
obtencin de una tabla de comparacin de la calidad clasi!icadora de las distintas variables participantes
$llamada tabla &<=(.
5na ve/ obtenida la variable clasi!icadora o de segmentacin, llegara el momento de utili/ar esa
variable para intentar reclasi!icar los grupos, lo +ue se conoce con el nombre t#cnico de discriminar. De
ah deviene el nombre del otro algoritmo de clasi!icacin, llamado n*lisis Discriminante $D(. 9uiere
esto decir +ue el D no pretende crear grupos de seme"an/a, sino +ue utili/a los ya existentes $creados
a partir de un algoritmo de clustering o ya preexistentes( para o!recer un an*lisis de la capacidad de las
variables del D $llamadas en este algoritmo 2variables discriminantes8( para clasi!icar o di!erenciar
$discriminar( entre los n su"etos de los > grupos. De este modo, se obtendra un es+uema de
clasi!icacin.
?3mo contempla el pa+uete estadstico .).. las t#cnicas de clasi!icacin de grupos@
.).. presenta las t#cnicas de clasi!icacin de grupos $ba"o el mismo grupo 23lassi!y8( en tres
procedimientos:
*i#ura 2 0 Distintas 6#cnicas de 3lasi!icacin de ,rupos
El D es una t#cnica +ue pretende, por un lado, explicar la pertenencia de un elemento a un grupo dado
en !uncin de las =: disponibles y, por otro, predecir a +u# grupo pertenecer* un elemento del +ue se
conocen los valores de una serie de variables.
Dicho de otro modo, el D pretende:
)or un lado, crear un modelo e+plicativo $expresado por la ecuacin de A!uncin
discriminanteA( compuesto por las =: capaces de discriminar de !orma signi!icativa entre los
casos pertenecientes a las categoras de la =D y
)or otro, calcular la pro,a,ilidad de +ue un caso sea incluido en una categora de la =D, en
!uncin de los valores de =:.
En el n*lisis de 3onglomerados $3( hay +ue de!inir los grupos, en el D, los grupos est*n ya
prede!inidos. El 3 es un paso previo al D: el 3 !orma los grupos para +ue, luego, el D determine
+u# variables in!luyen en la di!erenciacin de los mismos.
2.2. Tipos de AD
Anlisis *actorial Discriminante. Explica +u# =: contribuyen signi!icativamente a la di!erenciacin en
% o m*s grupos. )ermite predecir la pertenencia de un caso a cierto grupo y reali/ar predicciones,
asignando a cada su"eto al grupo m*s cercano a su puntuacin !actorial.
Anlisis de las *unciones Discriminantes. )redice la pertenencia de un individuo a un cierto grupo,
en !uncin de la probabilidad calculada, conocidos una serie de datos. 3alcula las probabilidades de
pertenecer a un determinado grupo, seg1n t#cnicas de decisin bayesianas.
2.3. Concepto de la Funcin Discriminante
El modelo del D viene de!inido por una combinacin lineal, llamada *unci$n Discriminante:
D = B0 + B1 X1 + B2 X2 + .... + Bk Xk + Eij
donde:
B1, B%,...B> 0 variables discriminantes,
-' 0 constante,
-1, -%, ..., -> 0 coe!icientes discriminantes no estandari/ados de variables,
Ei" 0 variable aleatoria +ue representa la parte del error del modelo.
El valor de la Cuncin Discriminante para un individuo dado se calcula sustituyendo en la ecuacin
discriminante los valores de las =ariables Discriminantes, como en cual+uier modelo de regresin. l
valor as obtenido se le llama Puntuaci$n Discriminante.
2.. Fases de un AD
a. .e calcula el valor de la puntuacin discriminante de todos los individuos de un #rupo $por
e"emplo, individuos en!ermos( y se calcula la media de ese #rupo.
b. .e calculan las puntuaciones discriminantes para el otro #rupo $individuos no en!ermos( y se
calcula tambi#n su media.
c. .e asigna un individuo al grupo cuyo centro est# m*s prximo.
d. .e estima la capacidad explicativa del modelo, calculando el porcenta"e de asignaciones
correctas.
Dic-o de otro modo.
a. .e determina el espacio de discriminaci$n.
b. .e obtienen las 'unciones discriminantes
c. .e calculan las coordenadas de cada centroide.
d. .e asigna cada dato al grupo m*s prximo.
El n1mero m*ximo de !unciones es el valor mnimo entre el n1mero de grupos menos 1 y el de
variables. $por de!ecto, este n1mero es de %(.
4as )untuaciones Discriminantes dependen de las unidades de medida. )or tanto, para comparar el
poder discriminante de cada /", slo puede hacerse calculando las !unciones discriminantes, de acuerdo
a los valores de las /", con coe!icientes estandari/ados o variables estandari/adas.
4os coe!icientes discriminantes estandari/ados permiten comparar el poder discriminante de cada /",
bas*ndose en la estandari/acin, aun+ue las =: no est#n expresadas en las mismas unidades. El m*ximo
poder corresponder* a la /" con mayor coe!iciente estandari/ado en las !unciones discriminantes
estandari/adas.
.e pretenden hallar las $>01( =ariables Discriminantes +ue me"or AseparenA las > poblaciones en las
categoras de la /D. El n1mero de tales =ariables se determina viendo la variabilidad de cada !actor
discriminante. 4a =ariabilidad 6otal de la Cuncin Discriminante se puede descomponer en =ariabilidad
Dentro0,rupos y =ariabilidad Entre0,rupos.
l ser el AD un n*lisis de la 7egresin, interesa encontrar las !unciones +ue maximicen el cociente
entre la =ariabilidad Entre0,rupos y la =ariabilidad Dentro0,rupos, es decir, el coe!iciente * $llamado as
por ser la inicial del estadstico C de la distribucin C de Cisher0.nedecor(.
4a !uncin discriminante elegida debe tener el m*ximo poder de discriminacin entre los grupos.
Esta es la tercera parte del artculo, ndice y contenido :
Contenido
3. Con'i#uraci$n del AD
D 4ocali/ar el !ichero de datos 20010723.sav y abrirlo.
D 7eali/ar el proceso de clustering explicado en los artculos publicados en nuestra p*gina Eeb
$empe/ando por el artculo inicial: Anlisis Cluster - Prctica(. Este paso es absolutamente necesario
e imprescindible. 7ecordar activar la opcin de guardar las variables del clusterFng, ya +ue ser*n
necesarias para reali/ar el AD.
D .eleccionar en la barra de men1: Anal01eGClassi'0GDiscriminant...
$nali/arG3lasi!icarGDiscriminante(.
23ota. En las versiones anteriores a la 4.
D .eleccionar en la barra de men1: )tatisticsGClassi'0GDiscriminant...
$EstadsticosG3lasi!icarGDiscriminante(.
parece el cuadro de di*logo Discriminant Anal0sis.
*i#ura 3 0 3uadro de Di*logo Discriminant Anal0sis
3.1. !eleccin de las "ariables
5roupin# /aria,le 2/aria,le de a#rupamiento6. Huestra la variable dependiente $/D(, +ue divide el
!ichero de traba"o en varios grupos, seg1n el n1mero de categoras +ue se utilicen. Estas categoras se
de!inen mediante el botn De'ine 7an#e $De!inir 7ango( +ue se habilita a tal e!ecto.
D .eleccionar la variable dicotmica #rupos en la lista de variables !uente.
D )ulsar el botn para introducirla en el cuadro 5roupin# /aria,le $=D(.
4a =: introducida en el cuadro 5roupin# /aria,le tiene la !orma #rupos28 86 y habilita el botn
, +ue permite especi!icar las categoras de la =D seleccionada.
D )ulsar el botn $De!inir 7ango(.
parece el cuadro de di*logo Discriminant Anal0sis. De'ine 7an#e $D: De!inir 7ango(.
*i#ura 4 0 3uadro de Di*logo Discriminant nalysis: De!ine 7ange
El cuadro de di*logo Discriminant Anal0sis. De'ine 7an#e permite delimitar las categoras de la =D.
.e necesitan un valor mnimo y uno m*ximo, ambos enteros, de la =D. El valor mnimo debe ser menor
+ue el m*ximo. 4os casos con valores !uera de este rango no se usar*n durante el an*lisis, pero se
clasi!icar*n en uno de los grupos existentes basados en los resultados.
D :ntroducir el valor 1 en el cuadro !inimum y el valor 3 en el cuadro !a+imum.
*i#ura 5 0 3uadro de Di*logo Discriminant nalysis: De!ine 7ange
D )ulsar el botn $3ontinuar(, para con!irmar las categoras de!inidas.
De este modo +ueda con!igurada la variable de agrupamiento o dependiente $=D(.
"ndependents 2/aria,les independientes6. Es imprescindible al menos una =: para la reali/acin de
un D.
D .eleccionar la =: divertid en la lista de variables !uente.
D )ulsar la tecla Ctrl $3ontrol( en el teclado y, manteni#ndola pulsada, seleccionar en la lista de
variables !uente las variables siguientes: presupu, com,ino, ,est,u0, noimport y a-orro.
D )ulsar el botn para introducirlas en la lista "ndependents $=:(.
.e va a reali/ar un D sobre los tres grupos de!inidos por las tres categoras de la =D #rupos. El
ob"etivo es detectar el poder discriminante de las =: sobre la =D.
4a lista "ndependents $=:( presenta dos opciones para de!inir el m#todo de introduccin y extraccin
de las =::
Enter "ndependents &o#et-er 2"ntroducir todas las /" (untas6. H#todo de introduccin
!or/ada de =:. .e introducen simult*neamente todas las =: +ue satis!acen los criterios de
entrada, con el !in de permitir la discriminacin entre las diversas categoras de la =D.
9se )tep:ise !et-od 2usar m;todo paso a paso6. .e utili/a para controlar la introduccin
y extraccin paulatinas de =:. 4a introduccin se reali/a en !uncin del nivel de signi!icatividad
de la =:.
D ctivar la opcin 9se )tep:ise !et-od $usar m#todo paso a paso(.
4a activacin de la opcin 9se )tep:ise !et-od $usar m#todo paso a paso( trae como consecuencia la
habilitacin del botn $H#todo(. Este botn permite acceder a un cuadro de di*logo donde se
de!inen las opciones del m#todo )tep:ise.
*i#ura < 0 3uadro de Di*logo 2Discriminant n*lisis8 3ompletado
3.2. De#inicin de "ariable de !eleccin
D )ulsar el botn $.eleccionar(.
.e despliega la parte ba"a del cuadro Discriminant Anal0sis y se inhabilita el botn .
*i#ura 7 0 3uadro de Di*logo Discriminant nalysis: .election =ariable
4a opcin )elect permite limitar el D a un subcon"unto de casos +ue tengan un valor num#rico
espec!ico para una variable llamada =ariable de .eleccin. Dicha variable puede ser tanto cuantitativa
$en cuyo caso tiene +ue especi!icarse una cantidad(, como categrica $en cuyo caso tiene +ue
especi!icarse una categora(.
D .eleccionar la variable caso en el cuadro de lista !uente.
D )ulsar el botn para introducirla en el cuadro )election /aria,le $=ariable de .eleccin(.
4a variable introducida en el cuadro )election /aria,le tiene la !orma caso=8 y habilita el botn
/alue, +ue permite especi!icar el valor de la variable de seleccin +ue se desea solicitar.
D )ulsar el botn $=alor(.
parece el cuadro de di*logo Discriminant Anal0sis. )et /alue $D: Establecer =alor(.
*i#ura > 0 3uadro de Di*logo Discriminant nalysis: .et =alue
4a variable elegida, caso, no es categrica $esto es, cualitativa(, por lo +ue no es v*lida para ser
utili/ada como variable de seleccin.
D )ulsar el botn para extraer la variable caso del cuadro )election /aria,le $=ariable de
.eleccin(, pas*ndola al cuadro de variables !uente, y anular as la con!iguracin establecida.
*i#ura 4 03uadro de Di*logo Discriminant nalysis
3.3. Con#i$uracin de %stadsticos
D )ulsar el botn $Estadsticos(.
parece el cuadro de di*logo Discriminant Anal0sis. )tatistics $D: Estadsticos(.
*i#ura 10 0 3uadro de Di*logo Discriminant nalysis: .tatistics
El cuadro Discriminant Anal0sis. )tatistics permite solicitar estadsticos descriptivos, coe!icientes de
!unciones discriminantes no estandari/adas o matrices de correlacinGcovarian/a.
Descriptives 2Descriptivos6. )ermite obtener tablas de estadsticos descriptivos:
!eans 2!edias6. )roporciona medias, desviacin tpica de cada variable discriminante para el
total de los datos y para cada grupo de la =D $,rouping =ariable( y el total de la muestra.
9nivariate A3?/As 2A3?/As 9nivariados6. 7eali/a y muestra un &<= de 5na va con
cada una de las variables discriminantes, en relacin con los grupos de!inidos por las =:. .u
!uncin es contrastar la hiptesis nula $H'( de +ue las medias de cada una de las =: son iguales
para todos los grupos.
@o+As ! 2&est de ! de @o+6. )ermite contrastar la H' de igualdad de Hatrices Entre0,rupos
$entre grupos de!inidos por las =:(, es decir, las matrices de covarian/a para cada grupo son
muestras extradas de la misma poblacin. )ara muestras su!icientemente grandes, un ApA no
signi!icativo indica +ue hay su!iciente evidencia de +ue las matrices di!ieren. Es sensible a
salidas de normalidad multivariada.
D .eleccionar las tres opciones del cuadro Descriptives $Descriptivos(.
*unction Coe''icients 2Coe'icientes de *unci$n6. )ermite valorar la !uer/a de la !uncin de
clasi!icacin.
*is-erAs 2coe'icientes estandari1ados de clasi'icaci$n de *is-er6. )ueden usarse
directamente para la clasi!icacin. )ermite obtener un con"unto de coe!icientes para cada
grupo, y se asigna un caso al grupo +ue tiene la mayor puntuacin discriminante.
9nstandardi1ed 2coe'icientes no estandari1ados de clasi'icaci$n6. Estos coe!icientes slo
pueden usarse para calcular las puntuaciones discriminantes no estandari/adas.
D .eleccionar las dos opciones del cuadro Cunction 3oe!!icients $3oe!icientes de Cuncin(.
!atrices. Huestra in!ormacin matricial de los coe!icientes discriminantes para las =:.
Bit-in-#roups correlation 2!atri1 de correlaciones dentro de #rupos6. Huestra una
matri/ con"unta de correlaciones a trav#s de todos los grupos. .e obtiene promediando las
matrices separadas de covarian/as de todos los grupos antes de calcular las correlaciones.
Bit-in-#roups covariance 2!atri1 de covarian1a dentro #rupos6. Huestra una matri/
con"unta a trav#s de todos los grupos, +ue podra di!erir de la matri/ total de covarian/as. .e
obtiene promediando las matrices separadas de covarian/as de todos los grupos.
)eparate-#roups covariance 2!atrices de covarian1as de #rupos separados6. Huestra
una matri/ de covarian/as para cada grupo.
&otal covariance 2!atri1 total de covarian1as6. Huestra una matri/ de covarian/as para
todos los casos de la muestra como un todo, es decir, como si !ueran una sola muestra.
D .eleccionar las cuatro opciones del cuadro !atrices $Hatrices(.
*i#ura 11 0 3uadro de Di*logo Discriminant nalysis: .tatistics
D )ulsar el botn $3ontinuar( para con!irmar las opciones seleccionadas.
=uelve a aparecer el cuadro de di*logo Discriminant Anal0sis.
3.. Con#i$uracin del &'todo del Anlisis
l haber activado la opcin 9se )tep:ise !et-od $5sar H#todo paso a paso( en el cuadro de di*logo
principal del D, el botn !et-od $H#todo( aparece habilitado.
D )ulsar el botn $H#todo(.
parece el cuadro Discriminant Anal0sis. )tep:ise !et-od $D: H#todo paso a paso(.
*i#ura 12 0 3uadro de Di*logo Discriminant nalysis: .tepEise Hethod
El cuadro Discriminant Anal0sis. )tep:ise !et-od permite elegir el m#todo del an*lisis paso a paso,
controlar los criterios de introduccin y extraccin de las =: y visuali/ar estadsticos de resumen. .e
debe seleccionar la utili/acin del m#todo Apaso a pasoA para elegir esta opcin.
!et-od 2!;todo6. )ermite especi!icar los criterios para la seleccin de las =:.
BilCsA Dam,da 2Dam,da de BilCs6. Es la opcin por de!ecto. .e eligen para el an*lisis las =:
+ue tengan el menor valor del estadstico 4ambda de Iil>s. En cada paso de este proceso, se
introduce de este modo la =: +ue minimi/a el 4ambda global de Iil>s.
9ne+plained variance 2/arian1a no e+plicada6. En cada paso, se introduce la =: +ue
minimi/a la suma de la variacin no explicada entre los grupos.
!a-alano,is distance 2Distancia de !a-alano,is6. En cada paso, se introduce la =: +ue
maximi/a la distancia de Hahalanobis para los grupos m*s cercanos. <!rece una medida del
grado de di!erencia de los valores de un caso respecto de la media de todos los casos. 5na
distancia de Hahalanobis identi!ica un caso +ue tenga valores extremos sobre una o m*s =:.
)mallest * ratio 2!nima 7a1$n de *6. En cada paso, se introduce la =: +ue maximi/a la
mnima ra/n de C entre cual+uier par de grupos. .e calcula a partir de la distancia de
Hahalanobis entre grupos.
7aoAs / 2/ de 7ao6. 6ambi#n llamada &ra1a de Da:le0-%otellin#, mide las di!erencias entre
las medias de los grupos. En cada paso, se introduce la =: +ue maximi/a el incremento de = de
7ao. l activar esta opcin se habilita el cuadro /-to-enter $=alor = a introducir( +ue especi!ica
el incremento mnimo de = para +ue una =: se introdu/ca en el an*lisis. El valor por de!ecto es
A'A.
D De"ar activada la opcion por de!ecto 0 BilCsA Dam,da $4ambda de Iil>s(.
Criteria 2Criterios6. )ermite especi!icar los criterios de introduccin de =:.
9se * value 29tili1ar valor de *6. Es la opcin por de!ecto. .e introduce la =: cuyo valor C
sea mayor +ue el especi!icado en Entr0 $:ntroducir(. .e extrae la =: cuyo C sea menor +ue el
especi!icado en 7emoval $Extraer(. El valor Entr0 debe ser mayor +ue el 7emoval.
9se pro,a,ilit0 o' * 29tili1ar pro,a,ilidad de *6. &o se introducir* ninguna =:, a menos
+ue su probabilidad de entrada sea menor +ue el valor de Entr0, ni extrada, a menos +ue su
probabilidad sea mayor +ue la especi!icada en 7emoval.
D De"ar activada la opcion por de!ecto 0 9se * value $5tili/ar valor de C(. simismo, se de"an como
est*n los valores AJ,KLA para Entr0 y A%,M1A para 7emoval.
Displa0 2!ostrar6. )ermite especi!icar la visuali/acin de la in!ormacin adicional del an*lisis:
)ummar0 o' steps 27esumen de pasos6. .eleccionada por de!ecto, proporciona tablas para
la 4ambda de Iil>s, las =: introducidasGextradas, las =: del an*lisis y las =: !uera del an*lisis.
Huestra la tolerancia de todas las =: y los estadsticos utili/ados para la seleccin de las =:. .e
muestran tambi#n los valores C, niveles de signi!icacin y la tolerancia mnima.
* 'or pair:ise distances 2* para distancias empare(adas6. Huestra una matri/ de ra/ones
de la C empare"adas de cada par de grupos. .on tests de signi!icacin de las distancias
Hahalanobis entre grupos.
D .eleccionar, adem*s de la opcin seleccionada por de!ecto 0 )ummar0 o' steps $7esumen de
pasos(, la opcin 0 * 'or pair:ise distances $C para las distancias empare"adas(.
*i#ura 13 0 3uadro de Di*logo Discriminant nalysis: .tepEise Hethod
D )ulsar el botn $3ontinuar(, para con!irmar las opciones seleccionadas.
=uelve a aparecer el cuadro de di*logo Discriminant Anal0sis.
3.(. Con#i$uracin de Criterios de Clasi#icacin
D )ulsar el botn $3lasi!icar(.
parece el cuadro de di*logo Discriminant Anal0sis. Classi'ication $D: 3lasi!icacin(.
*i#ura 14 0 3uadro de Di*logo Discriminant nalysis: 3lassi!ication
)roporciona el control de los criterios usados en la clasi!icacin de casos y de las salidas o!recidas a
partir de la !ase de clasi!icacin. )ermite controlar el c*lculo de probabilidades previas, obtener salidas
de resumen de clasi!icacin y controlar la clasi!icacin de casos con valores perdidos.
Prior Pro,a,ilities 2Pro,a,ilidades previas6. Establece las probabilidades previas: Estas se basan en
la proporcin muestral de caso de cada grupo $una ve/ suprimidos los casos con valores perdidos(.
All #roups eEual 2&odos #rupos i#uales6. 3onsidera iguales las probabilidades previas de
pertenencia al grupo son iguales.
Compute 'rom #roup si1es 2Calcular a partir de tamaFos de #rupos6. 3alcula las
probabilidades previas a partir de la proporcin muestral de casos de cada grupo $una ve/
suprimidos los casos con valores perdidos para cual+uier =:(. &o utili/ar esta opcin si hubiesen
!uertes di!erencias en los tamaNos muestrales.
D De"ar activada la opcin por de!ecto 0 All #roups eEual $6odos grupos iguales(.
Displa0 2!ostrar6. .e dispone de las siguientes opciones:
Case:ise results 27esultados se#Gn casos6. Huestra, para cada caso, cdigos del grupo
observado, el grupo predicho, las probabilidades posteriores y las puntuaciones discriminantes.
l activar esta opcin se habilitan las siguientes:
o Dimit cases to 'irst 2Dimitar casos a primeros6. 4imita la salida a los primeros n
casos. .e puede especi!icar un n1mero personali/ado de casos en el cuadro de texto
ad"unto.
)ummar0 ta,le 2&a,la resumen6. 6ambi#n llamada Hatri/ de 3on!usin, muestra los casos
correcta e incorrectamente clasi!icados para cada uno de los grupos basados en el D.
Deave-one-out classi'ication 2Clasi'icaci$n de(ar-uno-'uera6. 6ambi#n conocido como
m#todo 5, clasi!ica cada caso por las !unciones discriminantes derivadas de los dem*s casos.
D .eleccionar todas las opciones del cuadro Displa0 $Hostrar(, sin limitar el n1mero de casos.
9se Covariance !atri+ 29tili1ar la !atri1 de Covarian1as6. )ermite usar la matri/ de covarian/as
en el proceso.
Bit-in-#roups 2Dentro de #rupos6. 5tili/a matri/ de covarian/as dentro de grupos para
clasi!icar casos.
)eparate-#roups 25rupos separados6. 5tili/a las matrices de covarian/a de grupos
separados para clasi!icar los casos. 3omo la clasi!icacin se basa en las !unciones
discriminantes y no en las variables originales, esta opcin no es siempre e+uivalente a la
discriminacin cuadr*tica.
D De"ar activada la opcin por de!ecto 0 Bit-in-#roups $Dentro de ,rupos(.
Plots 25r'icos6. )ermite la presentacin de los siguientes gr*!icos:
Com,ined-#roups 2#rupos com,inados6. )resenta para todos los grupos "untos un
diagrama de dispersin para los valores de las dos primeras !unciones discriminantes, o un
histograma, si slo hay una !uncin discriminante.
)eparate-#roups 2#rupos separados6. )resenta diagramas de dispersin para cada grupo
por separado, para los valores de las dos primeras !unciones discriminantes, o histogramas, si
slo hay una !uncin.
&erritorial map 2!apa territorial6. Es un gr*!ico de !ronteras utili/ado para clasi!icar casos
en grupos basados en los valores de la !uncin discriminante. 4os n1meros mostrados
corresponden a los valores de los grupos en los +ue se intenta clasi!icar a los casos. 4a media
de cada grupo se indica mediante un asterisco dentro de sus lmites. El mapa no se muestra si
slo hay una !uncin discriminante.
D .eleccionar las tres opciones del cuadro Plots $,r*!icos(.
7eplace missin# values :it- mean 27eempla1ar valores perdidos con la media6.
)ermite clasi!icar casos de variables con valores perdidos, sustituyendo los valores perdidos por
la media de dicha variable.
D .eleccionar 7eplace missin# values :it- mean $7eempla/ar valores perdidos por la media(.
*i#ura 15 0 3uadro de Di*logo Discriminant nalysis: 3lassi!ication
D )ulsar el botn $3ontinuar( para con!irmar las opciones seleccionadas.
=uelve a aparecer el cuadro de di*logo Discriminant Anal0sis.
3.). Con#i$uracin de Almacenamiento de *uevas "ariables
D )ulsar el botn $,uardar(.
parece el cuadro de di*logo Discriminant Anal0sis. )ave 3e: /aria,les $D: ,uardar &uevas
=ariables(.
*i#ura 1< 0 3uadro de Di*logo Discriminant nalysis: .ave &eE =ariables
El cuadro Discriminant Anal0sis. )ave 3e: /aria,les permite guardar la in!ormacin del proceso o
de la puntuacin discriminante para cada caso, como nuevas variables discriminantes.
Predicted #roup mem,ers-ip 2Pertenencia al #rupo predic-o6. 3rea una sola variable
discriminante, +ue indica la pertenencia predicha de cada caso a uno de los grupos de la =D. Es
decir, el grupo con la mayor probabilidad posterior, en base a las puntuaciones discriminantes.
oDiscriminant scores 2Puntuaciones discriminantes6. 3rea una variable para cada !uncin
discriminante. Estas se calculan multiplicando los coe!icientes discriminantes no estandari/ados
por los valores de las =:, sumando estos productos y aNadiendo despu#s la constante. 4a
puntuacin media entre todos los casos es ' y la varian/a con"unta dentro de los grupos es 1.
Pro,a,ilities o' #roup mem,ers-ip 2Pro,a,ilidades de pertenencia al #rupo6. 3rea una
variable para cada uno de los grupos de la =D +ue indica la probabilidad con la +ue cada caso
ha sido asignado a un grupo de la =D. .on probabilidades condicionadas. 4a primera variable
contiene la probabilidad a posteriori de pertenencia al primer grupo, la segunda, la probabilidad
de pertenencia al segundo, etc.
D .eleccionar las tres opciones del cuadro )ave 3e: /aria,les $,uardar &uevas =ariables(.
4a opcin E+port model in'ormation to H!D 'ile $Exportar in!ormacin del modelo a BH4( permite
enviar la in!ormacin proporcionada por .).. a un !ichero de IindoEs BH4.
D Escribir 2salidas8 en el cuadro E+port model in'ormation to H!D 'ile $Exportar in!ormacin del
modelo a BH4(.
*i#ura 17 0 3uadro de Di*logo Discriminant nalysis: .ave &eE =ariables
*i#ura 1> 0 3uadro de Di*logo Discriminant nalysis: .ave &eE =ariables $versin .).. K.'(
D )ulsar el botn $3ontinuar( para con!irmar las opciones seleccionadas.
=uelve a aparece el cuadro de di*logo Discriminant Anal0sis.
Esta es la cuarta parte del artculo, ndice y contenido :
Contenido
4. E(ecuci$n del AD
)ara e"ecutar el AD con!igurado:
D )ulsar el botn $ceptar(.
)ara ver la sintaxis del AD con!igurado, antes de e"ecutarlo:
D )ulsar el botn $)egar(.
.e abre una ventana de sintaxis de .)...
*i#ura 14 0 .intaxis del procedimiento Discriminant Anal0sis
DISCRIMINANT
/GROUPS= grupos(1 3)
/VARIABLES= d!"r#d pr"supu $o%&'o &"s#&u( 'o%por# )*orro
/ANAL+SIS ALL
/OUT,ILE=MODEL(-s).d)s-)
/SAVE=CLASS SCORES PROBS
/MET/OD=0IL1S
/,IN= 3234
/,OUT= 5261
/PRIORS E7UAL
//ISTOR+
/STATISTICS=MEAN STDDEV UNIV, BO8M COE,, RA0 CORR
COV GCOV TCOV ,PAIR TABLE CROSSVALID
/PLOT=COMBINED SEPARATE MAP
/PLOT=CASES
/CLASSI,+=NONMISSING POOLED MEANSUB 2
D )ulsar el botn $7un 0 E"ecutar(.
)P)) genera las salidas correspondientes...
Esta es la cuarta parte del artculo, ndice y contenido :
Contenido
5. "nterpretaci$n de las )alidas de un AD
*i#ura 20 0 6abla 7esumen del )rocesamiento de 3asos
.e in!orma del n1mero de casos participantes y excluidos.
*i#ura 21 0 6abla de Estadsticos de ,rupos
.e muestra el n1mero de casos v*lidos de cada grupo de cada una de las categoras de la /D #rupos,
especi!icando el n1mero no ponderado de casos $un:ei#-ted( y ponderado $:ei#-ted(.
la ve/, se muestran estadsticos descriptivos $media y desviacin tpica( de cada una de las /" para
cada uno de los grupos de la /D.
*i#ura 22 0 6abla del 6est de :gualdad de Hedias de ,rupos
El test de igualdad de medias de grupos permite contrastar la %0 de +ue las medidas de los grupos del
an*lisis $de la /D( son id#nticas para las /" del AD. .e recha/ar* la %0 si el nivel de signi!icacin es
menor +ue ','5.
*i#ura 23 0 6abla de Hatrices 3on"untas dentro de ,rupos
4a 6abla de Hatrices de 3ovarian/a permite ver el grado de cohesin existente en el seno de los grupos
el an*lisis, in!ormacin consistente en una matri/ de covarian/as y otra de correlaciones. .i se
percibiesen ba"os valores de las covarian/as y de los coe!icientes de correlacin, ninguna de las /" de
esta matri/ o!recera visos de gran asociacin con las dem*s /". Este hecho podra ser interpretado
como !alta de colinealidad entre ellas.
*i#ura 24 0 6abla de Hatrices de 3ovarian/as
4a matri/ con"unta de covarian/as entre0grupos $separada para los grupos de la /D #rupos( evidencia
la hegemona de la relacin entre com,ino y divertid en la tasa de aportacin de in!ormacin al AD,
re!le"ada por una gran covarian/a. simismo, en la celda donde coincide una /" consigo misma se
muestra la varian/a, +ue para com,ino es mucho mayor +ue la varian/a de las dem*s /".
(.1. Test de +o, de la Calidad de las &atrices de las Covarian-as
4a 6abla de 7esultados del 6est de la ! de -ox es un test de la %0 de la :gualdad de las Hatrices de
3ovariables de ,rupos. Este contraste arro"ara la conclusin de +ue las varian/as no son
signi!icativamente iguales si la signi!icacin del valor * !uese menor +ue ','5.
*i#ura 25 0 6abla de 7esultados del 6est $H de -ox(
Este contraste arro"a la conclusin de +ue las varian/as son signi!icativamente iguales, pues la
signi!icacin del valor C es menor +ue ','5.
(.2. %stadsticos del AD .aso a .aso
*i#ura 2< 0 6abla de =ariables :ntroducidasGExtradas
.e presentan, despu#s, un test de la signi!icacin paso a paso de las /" introducidas o extradas,
utili/ando el estadstico Dam,da de Iil>s, y una prueba exacta de la *.
.e o!rece al usuario un mensa"e de +ue en cada paso se introduce la /" +ue minimi/a el lambda de
Iil>s global. .e aprecia +ue tanto las variables divertid como ,est,u0, presupu y com,ino superan
las pruebas de signi!icatividad $al tener valores del nivel de signi!icacin menores +ue ,'5(.
4a interpretacin de los resultados de este A3?/A de una va merece hacerse con prudencia. El hecho
de +ue las di!erencias sean signi!icativas al comparar individualmente las /", no signi!ica +ue, al
considerarlas de modo con"unto, lo sigan siendo, puesto +ue puede haber !enmenos de con!usin o
modi!icacin del e!ecto.
*i#ura 27 0 6abla de =ariables en el n*lisis
Esta tabla o!rece in!ormacin sobre la /" ya incluidas en el modelo paso a paso, en virtud de su
signi!icatividad.
.e in!orma, tras la inclusin de ,est,u0 "unto a divertid en el modelo, de sus valores de: 6olerancia: y
de la * para salir. .e aprecian la tolerancia, as como los valores de * to 7emove y de 4ambda.
*i#ura 2> 0 6abla de las =ariables Cuera del n*lisis
4a tabla de =ariables !uera del n*lisis explica el !uncionamiento el AD con 4ambda de Iil>s: .e extrae
la /" con el menor lambda de Iil>s $divertid(, +ue es la +ue tiene el mayor valor de * para entrar $C to
Enter(.
Esta tabla o!rece la siguiente in!ormacin:
)tep $)aso( del an*lisis y &ombre de la /".
&olerance $6olerancia( de una /" dada en un paso dado. 4a tolerancia es el porcenta"e de la
variabilidad de una /" no explicada por las otras /" $en este caso, las variables
discriminantes(. 4a tolerancia, en este paso, es m*xima, al no haberse incluido todava ninguna
/".
!inimum &olerance $6olerancia Hnima( es 1til para saber +ue si la tolerancia de una /" es
menor +ue '.'1 $opcin por de!ecto(, no se incluir* en el modelo, aun+ue cumpla otros criterios
de seleccin. .i la tolerancia de una =: es igual a la mnima, indica +ue puede ser incluida en el
modelo.
* to Enter y Iil>sO 4ambda, son estadsticos +ue dan el valor de la /", como criterio de
seleccin para +ue cada /" sea incluida en el modelo. Entrar* en el modelo, en primer lugar, la
/" cuyo lambda sea menor, siempre y cuando su * sea signi!icativa.
.e contrasta ahora la signi!icatividad de las /" dentro del modelo con el estadstico lambda de Iil>s,
+ue es muy signi!icativa para las variables OcbO y OtasO, al ser sus respectivos niveles de signi!icacin
menores +ue '.'5.
*i#ura 24 0 n*lisis de la .igni!icatividad de las =: del Hodelo $Iil>sO 4ambda(
*i#ura 30 0 6abla de 3omparaciones de ,rupos Empare"ado
En la 6abla de 3omparaciones de ,rupos Empare"ados se con!rontan Apor paresA las cargas explicativas
del modelo en cada paso para los grupos de la /D. El modelo discriminante conseguido tendr* tanta
mayor !uer/a, cuanto mayores sean los valores de * y mayor su signi!icatividad. En este caso, cada paso
es un nuevo avance en ganancia de la calidad del modelo discriminante.
(.3. /esumen de Funciones Discriminantes Cannicas
*i#ura 31 0 6abla de =alores )ropios $utovalores: Eigenvalues(
3omo una de las partes m*s importantes del 7esumen de Cunciones Discriminantes 3annicas, se o!rece
la 6abla de =alores )ropios $utovalores: Eigenvalues(, +ue in!orma de la calidad discriminante de las
dos !unciones discriminantes $P o! =ariance(, +ue entre ambas suman el 1''P. mbas !unciones son
!uertemente explicativas $5JP !rente a LMP(.
4a correlacin cannica $3anonical 3orrelation( de una !uncin discriminante es la ra/ 3uadrada de la
ra/n entre la suma de los cuadrados entre grupos $-etEeen0,roups .um <! .+uares( respecto de la
suma de cuadrados total $6otal .um <! .+uares(. Dicho de otro modo, es la proporcin de la variabilidad
total explicada por las di!erencias entre los grupos.
En este caso, ambas correlaciones cannicas son muy altas, lo +ue da a entender +ue ambas !unciones
discriminantes cannicas son buensimas en su desempeNo.
*i#ura 32 0 6abla de 4ambda de Iil>s
Esta tabla es un test de la calidad de la !uncin discriminante. poy*ndose en la distribucin chi0
cuadrado, el estadstico 4ambda obtiene un valor del estadstico chi0cuadrado, +ue proporciona un nivel
de signi!icacin, invitando a recha/ar o no recha/ar la %0 de +ue los su"etos anali/ados reaccionan por
igual ante el !enmeno estudiado $la /D(.
*i#ura 33 0 3oe!icientes Estandari/ados 3annicos de las Cunciones Discriminantes
Esta tabla in!orma del grado de importancia de las /" +ue han ingresado en el modelo sobre cada una
de las dos !unciones discriminantes. .e observa +ue en la !uncin 1 in!luyen mucho las variables +ue
imprimen un per!il de cac-onde1 $comportamiento "ovial y !estivo(, esto es, las variables divertid y
com,ino. )or el contrario, sobre la !uncin % in!luyen las variables +ue imprimen un per!il de pesete1
$comportamiento economi/ador(, esto es, las variables presupu ,est,u0.
3ota. <bs#rvese +ue los coe!icientes cannicos estandari/ados de las !unciones discriminantes no son
correlaciones, y pueden tener un valor superior a 1. 4a prueba es +ue la variable ,est,u0 tiene un valor
superior a 1.
*i#ura 34 0 Hatri/ Estructural
4a Hatri/ Estructural muestra los coe!icientes de correlacin de las /" con cada una de las dos !unciones
discriminantes. 3oe!icientes de correlacin de las /" cercanos a 1 indican una alta asociacin entre la /"
y la Cuncin DiscriminanteQ coe!icientes cercanos a ', indican escasa asociacin. Esta matri/ es de
interpretacin similar a la matri/ anterior $3oe!icientes Estandari/ados 3annicos de las Cunciones
Discriminantes(, salvo +ue en la matri/ estructural se muestran todas las variables, mientras +ue en la
anterior slo se muestran las /" del modelo.
*i#ura 35 0 6abla de 3oe!icientes 3annicos de las Cunciones Discriminantes
*i#ura 3< 0 6abla de Cunciones en los 3entroides de los ,rupos
4a 6abla de 3oe!icientes 3annicos de las Cunciones Discriminantes contiene los coe!icientes no
estandari/ados cannicos de cada una de las !unciones discriminantes, +ue son los coe!icientes de la
ecuacin discriminante, esto es del AD.
4a 6abla de Cunciones en los 3entroides de los ,rupos muestra las coordenadas de la proyeccin del
centroide de cada grupo sobre la Cuncin Discriminante. 4a nota al pie in!orma de +ue las !unciones no
estandari/adas cannicas discriminantes !ueron evaluadas en las medias de los grupos.
(.. %stadsticos de Clasi#icacin
*i#ura 37 0 6abla de 3oe!icientes de 3lasi!icacin de la Cuncin
4a 6abla de 3oe!icientes de 3lasi!icacin de la Cuncin in!orma de los coe!icientes de las ecuaciones
discriminantes, tambi#n llamadas !unciones discriminantes lineales de Cisher.
(.(. Funciones Discriminantes Cannicas
*i#ura 3> 0 Diagrama de Dispersin de 3ategora peseteros
El Diagrama de Dispersin de la 3ategora peseteros pone de mani!iesto un per!ecto centramiento del
centroide de este grupo.
*i#ura 34 0 Diagrama de Dispersin de 3ategora pasotas
El Diagrama de Dispersin de la 3ategora pasotas muestra +ue este grupo adolece de una ligera
dispersin a lo largo de ambas !unciones.
*i#ura 40 0 Diagrama de Dispersin de 3ategora cac-ondos
El Diagrama de Dispersin de la 3ategora cac-ondos muestra +ue este grupo adolece de una ligera
dispersin a lo largo de ambas !unciones.
*i#ura 41 0 Diagrama de Dispersin de 6odas las 3ategoras
El Diagrama de Dispersin de 6odas las 3ategoras muestra +ue los tres grupos se di!erencian muy bien,
pues cada uno de ellos ocupa una regin independiente y per!ectamente di!erenciada.
(.). &atri- de Con#usin
4a matri/ de con!usin muestra el n1mero de casos de cada grupo.
.e incluyen tambi#n tres columnas, +ue indican el n1mero de casos predichos de cada grupo. 4a celda
en la +ue se cru/a cada especie consigo misma es la m*s importante, pues si todos los casos observados
se predicen correctamente, sera una muestra de una buena prediccin. Rste es el caso de este e"ercicio.
4a !recuencia absoluta anterior se acompaNa de una relativa, +ue muestra +ue se predi"o correctamente
el 1''O'P de los casos. dem*s, se proporciona el porcenta"e total de casos correctamente clasi!icados,
+ue indica la e!ectividad de la !uncin discriminante $1''O'P(.
*i#ura 42 0 6abla de 7esultados de 3lasi!icacin
3omo resultado de la e"ecucin del AD, se guardan una serie de variable nuevas dentro del !ichero de
datos de traba"o:
disI1 0 identi!ica a cual de los J grupos pertenece cada individuo en !uncin del modelo
generado por la !uncin discriminante.
dis1I1 y dis2I1 0 son, respectivamente, los valores para cada individuo de las puntuaciones
discriminantes para las !unciones 1 y %.
dis1I2, dis2I2 y dis3I20 estas J variables indenti!ican, respectivamente, las probabilidades
para cada individuo de ser asignado al grupo 1, % y J en !uncin del modelo generado por el
D. Estas J variables son complementarias entre s, es decir, suman 1,'.
*i#ura 43 0 Cichero de Datos con las =ariables ,uardadas por el D
...

S-ar putea să vă placă și