Documente Academic
Documente Profesional
Documente Cultură
o Especificacin de las posibilidades de clasificacin para tamaos de grupos
distintos:
Para calcular correctamente la puntuacin de corte cuando los tamaos de
grupo son distintos, el investigador debe tambin determinar si los tamaos
de los grupos observados reflejan las proporciones poblacionales reales o si los
tamaos de los grupos poblacionales se deben considerar iguales.
El supuesto por defecto es que las probabilidades sean iguales, es
decir, se supone que cada grupo tiene una misma probabilidad de
ocurrir incluso aunque los tamaos de los grupos en la muestra sean
distintos. Si el investigador no est seguro de si las proporciones
observadas de la muestra son representativas de las proporciones
poblacionales en cada grupo, entonces la mejor estimacin de las
probabilidades anteriores no es la de igualdad, sino la de las
proporciones.
La influencia de especificar las anteriores probabilidades como iguales a
las proporciones muestrales va segn la diferencia que exista entre las
proporciones muestrales y las proporciones poblacionales. Pero el
investigador debera determinar las probabilidades en todos los anlisis
para asegurar que los supuestos adecuados estn presentes en los
procesos de clasificacin.
o Determinacin de la puntuacin de corte para grupos de tamao desigual:
Si los grupos no son de igual tamao y se supone que son representativos de
las proporciones de la poblacin, una media ponderada de los centroides de
los grupos proporcionar una puntuacin de corte ptima para una funcin
discriminante
Costes de la clasificacin errnea:
La puntuacin de corte ptima tambin debe tener en cuenta el coste de clasificar de forma
incorrecta in objeto dentro de un grupo errneo. Si los costes de clasificacin errnea son
distintos, la puntuacin de corte ptima ser aquella que minimice dichos costes.
Construccin de las matrices de clasificacin: la muestra debe dividirse aleatoriamente en dos
grupos:
a) Uno de los grupos se utiliza para calcular la funcin discriminante
b) El otro grupo se usa para la elaboracin de la matriz de clasificacin.
El proceso consiste en multiplicar las ponderaciones generadas por la muestra de anlisis por
las medidas de la variable primaria de la ampliacin de la muestra. Despus, las puntuaciones
discriminantes individuales para la ampliacin de la muestra se comparan con el valor de la
puntuacin de corte crtica
Captulo 3 Estadstica Superior
- GRUPO A: Z
n
<Z
ct
- GRUPO B: Z
n
>Z
ct
Los resultados del proceso de clasificacin se presentan de forma matricial. Los elementos de
la diagonal de la matriz representan el nmero de individuos correctamente clasificados. Los
nmeros fuera de la diagonal representan las clasificaciones incorrectas
- Los nmeros de la columna denominada tamao del grupo real representan el
nmero de individuos que realmente hay uno de los dos grupos. Los nmeros que
estn al final de las columnas representan el nmero de individuos asignados a los
grupos por la funcin discriminante.
Medicin de la capacidad predictiva mediante la aleatoriedad: la capacidad predictiva de la
funcin discriminante se mide con el ratio de aciertos, el cual se obtiene de la matriz de
clasificacin.
- Determinacin del criterio basado en la aleatoriedad: cuando los tamaos muestrales
son iguales, la determinacin de la clasificacin aleatoria es bastante simple; se
obtiene dividiendo 1 por el nmero de grupos. El establecimiento de la clasificacin
aleatoria en situaciones donde los tamaos de los grupos son distintos es algo ms
complicado.
o Determinar la clasificacin aleatoria basndose en el tamao muestral del
grupo ms grande se conoce como criterio de mxima aleatoriedad. Se
determina calculando el porcentaje de la muestra completa representado por
el ms grande de los grupos..
Si el ratio de aciertos para la funcin discriminante no excedi el 65%,
entonces no nos ayudara a predecir basarnos en este criterio
El criterio de mxima aleatoriedad debera utilizarse cuando el nico
objetivo del anlisis discriminante es maximizar el porcentaje
clasificado correctamente.
En casos donde los tamaos muestrales son distintos y el investigador
quiere clasificar a los miembros de los grupos, la funcin discriminante
desafa lo extrao clasificando a un sujeto en un grupo ms pequeo.
Pero el criterio de aleatoriedad no tiene este hecho en cuenta. Por lo
que otro criterio de aleatoriedad (criterio de aleatoriedad
proporcional) debe emplearse en tales situaciones.
Estos criterios de aleatoriedad son tiles slo cuando se calculan con ampliacin de la
muestra. Si los individuos utilizados para calcular la funcin discriminante son los que
estn siendo clasificados, el resultado estar sesgado al alza en su capacidad
predictiva. En tales casos, estos dos criterios tendran que ser ajustados a su vez al
alza para tener en cuenta el sesgo.
Captulo 3 Estadstica Superior
- Comparacin del ratio de aciertos con el criterio de aleatoriedad: si el porcentaje de
clasificaciones correctas es significativamente ms grande que el que cabra esperar de
forma aleatoria, se puede llevar a cabo un ejercicio de interpretacin de las funciones
discriminantes con la finalidad de elaborar perfiles de grupo. Sin embargo, si la
precisin clasificatoria no es ms grande que lo que se podra esperar aleatoriamente,
las diferencias en los perfiles de las puntuaciones no proporcionan una informacin
significativa para identificar la pertenencia a un grupo.
Un contraste estadstico para contrastar la capacidad discriminatoria de la matriz de
clasificacin cuando se compara con un modelo de aleatoriedad es el estadstico Q de Press.
Esta medida sencilla compara el nmero de clasificaciones correctas con el tamao muestral
total y el nmero de grupos. Se compara el valor hallado con un valor crtico. Si ste excede el
valor crtico, la matriz de clasificacin puede considerarse estadsticamente mejor que la
aleatoriedad.
Diagnosis mediante casos: se trata de entender qu observaciones han sido mal clasificadas, y
no son representativas del resto de los miembros del grupo
- Clasificacin errnea de casos individuales: la finalidad de identificar y analizar las
observaciones mal clasificadas es identificar cualesquiera caractersticas de estas
observaciones que podran incorporarse en el anlisis discriminante para mejorar su
capacidad predictiva.
5.- Interpretacin de los resultados:
Dentro de este proceso se examinan las funciones discriminantes para determinar la
importancia relativa de cada variable independiente en la discriminacin de los grupos. Se han
propuestos 3 mtodos para determinar la importancia relativa:
- Las ponderaciones discriminantes estandarizadas.
- Las cargas discriminantes (correlaciones de estructura)
- Los valores parciales de la F
a) Ponderaciones discriminantes: el enfoque tradicional para interpretar las funciones
discriminantes estudia el signo y la magnitud de la ponderacin discriminante
estandarizada (denominado coeficiente discriminante) asignada a cada variable para
calcular las funciones discriminantes. Cuando se ignora el signo, cada ponderacin
representa la contribucin relativa de su variable asociada a esa funcin.
a. las variables independientes con ponderaciones relativamente grandes
contribuyen ms a la capacidad discriminante de la funcin que las variables
con ponderaciones ms pequeas
b. el signo solamente denota que la variable ofrece una contribucin positiva o
negativa.
Captulo 3 Estadstica Superior
La interpretacin de las ponderaciones discriminantes es anloga a la interpretacin
de las ponderaciones beta en el anlisis de regresin y por ello est sujeta a las
mismas crticas.
Otro problema en la utilizacin de las ponderaciones discriminantes es que estn
sujetas a una considerable inestabilidad. Estos problemas implican que se tenga
precaucin en el uso de las ponderaciones para interpretar los resultados del anlisis
discriminante.
b) Cargas discriminantes: denominadas tambin correlaciones de estructura, miden la
correlacin lineal simple entre cada variable independiente y la funcin discriminante.
Las cargas discriminantes reflejan la varianza que las variables independientes
comparten con la funcin discriminante, y pueden ser interpretadas como cargas de
los factores para valorar la contribucin relativa de cada variable independiente a la
funcin discriminante.
Las cargas discriminantes pueden estar sujetas a inestabilidad. Se considera que las
cargas son relativamente ms vlidas que las ponderaciones como medio de
interpretacin de la capacidad discriminante de las variables independientes debido a
su naturaleza de correlacin.
c) Valores parciales de la F: cuando se selecciona el mtodo por etapas, se cuenta con un
nmero adicional de interpretar la capacidad discriminatoria de las variables
independientes por medio del uso de los valores parciales de la F.
a. Este se realiza examinando los tamaos absolutos de los valores significativos
de la F y clasificndolos. Valores de la F grandes indican una capacidad
discriminante mayor.
b. Las clasificaciones que emplean el enfoque de los valores de la F son las
mismas que la clasificacin derivada al utilizar las ponderaciones, pero los
valores F indican adems los niveles de significacin asociado a cada variable.
d) Rotacin de las funciones discriminantes: despus de haber construido funciones
discriminantes, stas pueden ser rotadas para redistribuir la varianza. La rotacin
mantiene la estructura original y la fiabilidad de la solucin discriminante mientras que
al mismo tiempo hace que las funciones sean ms fciles de interpretar de forma
sustancial. En la mayora de los casos, se hace uso de la rotacin VARIMAX como
fundamento de la rotacin.
e) ndice de potencia: es una medida relativa entre todas las variables que seala la
capacidad discriminante de cada variable. Incluye tanto la contribucin de la variable a
la funcin discriminante como la contribucin relativa de la funcin de solucin global.
La composicin es simplemente la suma de los ndices de potencia individuales entre
todas las funciones discriminantes significativas. Sin embargo, la interpretacin de la
medida compuesta esta limitada por el hecho de que es til solamente para describir
la posicin relativa de cada variable, y el valor absoluto no tiene un verdadero
significado. Etapas:
a. Etapa 1: calcular un valor de potencia para cada funcin significativa.
b. Etapa 2: calcular el ndice de potencia compuesto entre todas las funciones
significativas.