Sunteți pe pagina 1din 6

ANALISIS MULTIVARIANTE

Anlisis
multivariante
El anlisis multivariante es un mtodo estadstico utilizado para determinar la
contribucin de varios factores en un simple evento o resultado.
Los factores de estudio son los llamados factores de riesgo (bioestadstica),
variables
independientes
o
variables
explicativas.
El resultado estudiado es el evento, la variable dependiente o la variable
respuesta.
El anlisis multivariante mediante tcnicas de proyeccin sobre variables
latentes tiene muchas ventajas sobre los mtodos deregresin tradicionales:
se puede utilizar la informacin de mltiples variables de entrada, aunque stas
no
sean
linealmente
independientes
puede trabajar con matrices que contengan ms variables que observaciones
puede trabajar con matrices incompletas, siempre que los valores faltantes
estn
aleatoriamente
distribuidos
y
no
superen
un
10%
puesto que se basan en la extraccin secuencial de los factores, que extraen la
mayor variabilidad posible de la matriz de las X (variables explicativas, tienen
que ser dependientes) pueden separar la informacin del ruido. Se asume que
las
X
se
miden
con
ruido.
Tcnicas
Multivariantes
Anlisis
de
Componentes
principales
Anlisis
factorial
Anlisis
discriminante
Anlisis
de
Correlacin
Cannica
Anlisis
Cluster
Anlisis
de
Escalamiento
Dimensional
Anlisis
de
correspondencias
Anlisis
factorial
confirmatorio
Modelo
de
Ecuaciones
Estructurales
(SEM),
anlisis
causal.
Anlisis
conjunto
Escalamiento
ptimo
Regresin
Lineal
Mltiple
Regresin
Logit
y
Probit
Anlisis
Manova
Tres o ms variables. Estas relaciones pueden ser de diversos tipos.
Descriptivas como establecer perfiles, separacin de grupos, segmentacin,
determinar influencias eficientes entre varias variables, entre otras
En
general
se
las
clasifica
en
dos
grandes
grupos
1. Mtodos explicativos como regresin lineal, anlisis discriminante, regresin
logstica, modelos de respuesta probit, logic, modelos loglineales, entre otros
2. Mtodos descriptivos como anlisis de conglomerados, anlisis factorial,
anlisis de componentes principales, anlisis de correspondencias simples y
mltiples, etc. Este tipo de anlisis ha avanzado mucho y hoy ocupa el corazn
del anlisis estadstico avanzado. Desafortunadamente es exigente y poco
amigable en comprensin matemtica aunque lo es grficamente La gran virtud
de este tipo de anlisis es que sintetiza las relaciones entre las variables

estudiadas, que de otro modo, tendran que establecerse con los anlisis
anteriores, largos y que conllevan a equvocos Su difusin depende en gran
medida de la disposicin del profesional a adoptar nuevos enfoques.
TIPOS DE TECNICAS MULTIVARIANTES El anlisis multivariante es un
conjunto de tcnicas de anlisis de datos en expansin. Entre las tcnicas ms
conocidas expuestas en este texto tenemos (1) regresin mltiple y correlacin
mltiple; (2) anlisis discriminante mltiple; (3) componentes principales y
anlisis factorial comn; (4) anlisis multivariante de varianza y covarianza; (5)
correlacin cannica; (6) anlisis cluster; (7) anlisis multidimensional y (8)
anlisis conjunto. Entre las tcnicas emergentes tambin incluidas estn (9)
anlisis de correspondencias; (10) modelos de probabilidad lineal como logit y
probit; y (11) modelos de ecuaciones simultneas/estructurales. En este
apartado, introduciremos cada una de las tcnicas multivariantes, definiendo
brevemente
la
tcnica
y
el
objetivo
de
su
aplicacin.
COMPONENTES FACTORIALES Y ANALISIS FACTORIAL COMUNEl anlisis
factorial, que incluye variaciones tales como el anlisis de componentes y el
anlisis factorial comn, es una aproximacin estadstica que puede usarse
para analizar interrelaciones entre un gran nmero de variables y explicar estas
variables en trminos de sus dimensiones subyacentes comunes (factores). El
objetivo es encontrar un modo de condensar la informacin contenida en un
nmero de variables originales en un conjunto ms pequeo de variables
(factores) con una prdida mnima de informacin.Si se proporciona una
estimacin emprica de la estructura de las variables consideradas, el anlisis
factorial se convierte en una base objetiva para crear escalas aditivas.
REGRESION MULTIPLE La regresin mltiple es el mtodo de anlisis
apropiado cuando el problema del investigador incluye una nica variable
mtrica dependiente que se supone est relacionada con una o ms variables
mtricas independientes. El objetivo del anlisis de la regresin mltiple es
predecir los cambios en la variable dependiente en respuesta a cambios en
varias de las variables independientes. Este objetivo se consigue muy a
menudo a travs de la regla estadstica de los mnimos cuadrados. La
regresin mltiple es til siempre que el investigador est interesado en
predecir la cantidad o la magnitud de la variable dependiente. Por ejemplo, se
puede hacer la prediccin de los gastos mensuales de cenar fuera de casa
(variables dependientes) con informacin referente a la renta familiar, su
tamao y la edad del cabeza de familia (variables independientes). De la
misma forma. el investigador puede intentar predecir las ventas de una
compaa a partir de informacin sobre sus gastos en publicidad, el nmero de
vendedores y el nmero de tiendas que distribuyen sus productos.

ANALISIS DISCRIMANTE MULTIPLE Si la nica variable dependiente es


dicotmica (es decir, comprador-no comprador) o multidicotmica (es decir,
alto-medio-bajo) y por tanto no mtrica, la tcnica multivariante apropiada es un
anlisis discriminante mltiple (MDA). Como con la regresin mltiple, las
variables independientes se supone que son mtricas. El anlisis discriminante

es til en situaciones donde la muestra total puede dividirse en grupos


basndose en una variable dependiente caracterizada por varias clases
conocidas. Los objetivos primarios del anlisis discriminante mltiple son
entender las diferencias de los grupos y predecir la verosimilitud de que una
entidad (persona u objeto) pertenezca a una clase o grupo particular
basndose en varias variables mtricas independientes. Por ejemplo, el
anlisis discriminante puede usarse para distinguir innovadores de no
innovadores de acuerdo a sus perfiles demogrficos y psicogrficos. Otras
aplicaciones incluyen la distincin entre usuarios habituales u ocasionales de
un producto, compradores de marcas de mbito nacional o restringido y el
riesgo de crdito bueno del riesgo de crdito malo. Incluso la Agencia Tributaria
utiliza un anlisis discriminante para comparar las declaraciones seleccionadas
con las devoluciones compuestas hipotticas del contribuyente normal (para
distintos niveles de renta) con el fin de identificar las devoluciones y reas ms
prometedoras
para
la
auditoria.
ANALISIS MULTIVARIANTE DE LA VARIANZA Y COVARIANZA El anlisis
multivariante de la varianza (MANOVA) es una tcnica estadstica que puede
ser usada simultneamente para explorar las relaciones entre diversas
categoras de variables independientes (usualmente denominadas como
tratamientos) y dos o ms variables mtricas dependientes. Como tal,
representa una extensin del anlisis invariante de la varianza (ANOVA). El
anlisis multivariante de la covarianza {MANCOVA) puede usarse en
conjuncin con MANOVA para eliminar (despus del experimento) el efecto de
cualquier variable independiente no controlada sobre las variables
dependientes. El procedimiento es similar al que se encuentra en la correlacin
parcial vicariante. MANOVA es til cuando el investigador disea una situacin
experimental (manipulacin de varias variables de tratamiento no mtricas)
para comprobar hiptesis concernientes a la varianza de respuestas de grupos
sobre
dos
o
ms
variables
mtricas
dependientes.
ANALISIS CONJUNTO El anlisis conjunto es una tcnica de dependencia
emergente que ha introducido una nueva sofisticacin en la evaluacin de
objetos. Sean nuevos productos, servicios o ideas. La aplicacin ms directa
est en productos nuevos o desarrollo de servicios, permitiendo la evaluacin
de productos complejos mientras que mantiene un contexto de decisin realista
para el encuestado. El analista de mercado es capaz de evaluar la importancia
de atributos as como los niveles de cada atributo mientras que los
consumidores evalan slo los perfiles de unos pocos productos, que son combinaciones de niveles de producto. Por ejemplo, un concepto de un producto
que tiene tres atributos (precio, calidad y color), cada uno de los cuales a tres
niveles (por ejemplo, rojo, amarillo y azul). En lugar de tener que evaluar todas
las 27 combinaciones posibles (3 X 3 X 3), se puede evaluar un subconjunto (9
o ms) por su atractivo para los consumidores: y el investigador sabe no slo
cul es la importancia de cada atributo sino tambin la importancia de cada
nivel (el atractivo del rojo frente al amarillo y frente al azul). Ms aun, cuando se
completan las evaluaciones del consumidor, pueden usarse los resultados del
anlisis conjunto en simuladores del diseo del producto, que mostrarn la
aceptacin del cliente para cualquier nmero de formulaciones de producto y

ayudar
en
el
diseo
del
producto
ptimo.
CORRELACION CANONICA El anlisis de correlacin cannica puede verse
como una extensin lgica de un anlisis de regresin mltiple. Recordemos
que el anlisis de regresin mltiple implica una nica variable dependiente
mtrica y varias variables mtricas independientes. Con el anlisis cannico el
objetivo es correlacionar simultneamente varias variables dependientes
mtricas y varias variables mtricas independientes. Mientras que la regresin
mltiple implica una nica variable dependiente, la correlacin cannica implica
mltiples variables dependientes. El principio subyacente es desarrollar una
combinacin lineal de cada conjunto de variables (tanto independientes como
dependientes) para maximizar la correlacin entre los dos conjuntos. O dicho
de otra forma, el procedimiento implica obtener un conjunto de ponderaciones
para las variables dependientes e independientes que proporcione la
correlacin nica mxima entre el conjunto de variables dependientes y el
conjunto
de
variables
independientes.
ANALISIS CLUSTER El anlisis cluster es una tcnica analtica para
desarrollar subgrupos significativos de individuo u objetos. De forma especfica,
el objetivo es clasificar una muestra de. Entidades (personas u objetos) en un
nmero pequeo de grupos mutuamente excluyentes basados en similitudes
entre las entidades. En el anlisis cluster, a diferencia del anlisis
discriminante, los grupos no estn predefinidos. Por consiguiente, se usa la
tcnica para identificar los grupos. Habitualmente, el anlisis cluster implica al
menos dos etapas. La primera es la medida de alguna forma de similitud o
asociacin entre las entidades para determinar cuntos grupos existen en
realidad en la muestra. La segunda etapa es describir las personas o variables
pata determinar su composicin. Este paso puede llevarse a cabo aplicando el
anlisis discriminante a los grupos identificados por la tcnica cluster.
ANALISIS MULTIDIMENSIONAL En el anlisis multidimensional, el objetivo es
transformar los juicios de los consumidores de similitud o preferencia (por
ejemplo, preferencias por tiendas o marcas comerciales) en distancias.
Representadas en un espacio multidimensional. Si los objetos A y B son en
opinin de los encuestados ms similares que el resto de los pares posibles de
objetos, las tcnicas de anlisis multidimensional situarn a los objetos A y B de
tal forma que la distancia entre ellos en un espacio multidimensional es menor
que la distancia entre cualquier otro par de objetos. Los mapas perceptuales
resultantes muestran el posicionamiento relativo entre los objetos, pero es
necesario un anlisis adicional para evaluar qu atributos predicen la posicin
de
cada
objeto.
ANALISIS DE CORRESPONDENCIAS Para finalizar, el anlisis de
correspondencias es una tcnica de interdependencia recientemente
desarrollada que facilita tanto la reduccin dimensional de una clasificacin de
objetos (por ejemplo: productos, personas, etc.,) sobre un conjunto de atributos
y el mapa perceptual de objetos relativos a estos atributos. Los investigadores
se enfrentan constantemente a la necesidad de cuantificar datos cualitativos
que encuentran en variables nominales. El anlisis de correspondencias difiere
de otras tcnicas de interdependencia discutidas antes en su capacidad para
acomodar tanto datos no mtricos como relaciones no lineales. En su forma

ms bsica, el anlisis de correspondencias emplea una tabla de contingencia,


que es la tabulacin cruzada de dos variables categricas. A continuacin
transforma los datos no mtricos en un nivel mtrico y realiza una reduccin
dimensional (similar al anlisis factorial) y un mapa perceptual (similar al
anlisis multidimensional). A modo de ejemplo, las preferencias por una marca
de los encuestados pueden ser tabuladas de forma cruzada con variables
demogrficas (por ejemplo, gnero, categoras de renta, ocupacin) indicando
cunta gente que prefiere cada una de las marcas entra dentro de cada
categora de las variables demogrficas. A travs del anlisis de
correspondencias, la asociacin o correspondencia de marcas y las caractersticas distintivas de aquellos que prefieren cada marca se muestran en
un mapa bi o tridimensional, tanto de marcas como caractersticas de los
encuestados. Las marcas percibidas como similares estn localizadas en una
cercana proximidad unas de otras. De la misma forma, las caractersticas ms
distintivas de los encuestados que prefieren cada marca estn determinadas
tambin por la proximidad de las categoras de las variables demogrficas
respecto de la posicin de la marca. El anlisis de las correspondencias
proporciona una representacin multivariante de la interdependencia de datos
no mtricos que no es posible realizar con otros mtodos.
MODELOS DE PROBABILIDAD LINEAL Los modelos de probabilidad lineal, a
menudo llamados anlisis logit, consisten en una combinacin de regresin
mltiple y anlisis de discriminante mltiple. Esta tcnica es similar al anlisis
de regresin mltiple en que una o ms variables independientes se usan para
predecir una nica variable dependiente. Lo que distingue un modelo de
probabilidad lineal de la regresin mltiple es que la variable dependiente es no
mtrica, como en el anlisis discriminante. La escala no mtrica de la variable
dependiente requiere diferencias en el mtodo de estimacin y supuestos
sobre el tipo de distribucin subyacente, siendo en la mayora de sus otras
facetas similar a la regresin mltiple. Por tanto, una vez que la variable
dependiente est especificada correctamente y se emplea la tcnica de
estimacin apropiada, se usan igualmente los supuestos bsicos considerados
en la regresin mltiple. Los modelos de probabilidad lineal se distinguen del
anlisis discriminante en que acomodan todos los tipos de variables
independientes (mtricas y no mtricas) y no requieren el supuesto de
normalidad multivariante. Sin embargo, en muchos casos. particularmente con
ms de dos niveles de la variable dependiente, el anlisis discriminante es la
tcnica
ms
apropiada.
MODELOS DE ECUACIONES ESTRUCTURALES El modelo de ecuaciones
estructurales, a menudo denominado simplemente como LISREL (el nombre de
uno de los paquetes informticos ms populares), es una tcnica que permite
separar las relaciones para cada conjunto de variables dependientes. En su
acepcin ms simple, el modelo de ecuaciones estructurales proporciona la
tcnica de estimacin ms adecuada y eficiente para series de estimaciones de
ecuaciones simultneas mediante regresiones mltiples. Se caracteriza por dos
componentes bsicos: (1) el modelo estructural y (2) el modelo de medida. El
modelo estructural es el modelo gua, que relaciona variables independientes
y variables dependientes. En tales situaciones, la teora, antes que la

experiencia u otras directrices, permitir al investigador distinguir qu variables


independientes predicen cada variable dependiente. Los modelos previamente
discutidos que incluyen mltiples variables dependientes -anlisis multivariante
de la varianza y correlacin cannica- no son apropiados en esta situacin.
dado que permiten slo una nica relacin entre variables dependientes e
independientes. El modelo de medida permite al investigador usar varias
variables (indicadores), para una nica variable dependiente o independiente.
Por ejemplo, la variable dependiente puede ser un concepto representado por
una escala aditiva, tal como el amor propio. En el modelo de medida el
investigador puede evaluar la contribucin de cada tem de la escala as como
incorporar cmo la escala mide el concepto (fiabilidad) en la estimacin de las
variables dependientes e independientes. Este procedimiento es similar al
desarrollo del anlisis factorial (discutido en una seccin posterior) de los tems
de la escala y utiliza las cargas factoriales en la regresin.
OTRAS TECNICAS MULTIVARIANTES EMERGENTES El uso generalizado de
las herramientas informticas ayud a iniciar la era del anlisis multivariante tal
y como lo conocemos hoy, con un nmero de tcnicas especializadas que se
pueden aplicar a una gama amplia de situaciones. No obstante. Ahora nos
encontramos al principio de una era en la cual el anlisis multivariante
incorpora nuevos enfoques para identificar y representar las relaciones
multivariantes. Un rea de desarrollo en el anlisis multivariante es la bsqueda
de datos y las redes neuronales. La bsqueda de datos es el intento de
cuantificar las relaciones entre grandes cantidades de informacin con una
especificacin previa mnima de la naturaleza de las relaciones. Una tcnica
que se usa muchas veces junto con la bsqueda de datos son las redes
neuronales, una tcnica de anlisis flexible que es capaz de llevar a cabo una
identificacin de relaciones (parecida a la regresin mltiple o al anlisis
discriminante) o la reduccin de datos y el anlisis estructural (semejante al
anlisis factorial o cluster). Las redes neuronales son diferentes a las tcnicas
multivariantes ms tradicionales citadas previamente tanto en la formulacin
del modelo como en los tipos de relaciones ms complejos que se pueden
formular. Otra rea que incluye un distanciamiento de la teora estadstica
inferencial tradicional es el desarrollo de la tcnica de la muestra repetida o
arranque. Esta tcnica elimina la necesidad de cumplir determinados
supuestos estadsticos (como la normalidad), mediante el uso del ordenador
para replicar una muestra repetida de la muestra original, con el reemplazo y
la generacin de una estimacin emprica de la distribucin muestral.

S-ar putea să vă placă și