Documente Academic
Documente Profesional
Documente Cultură
Introduccin
Hasta hace pocos aos, el anlisis de correlacin cannica era una
tcnica estadstica relativamente desconocida (Badii et al., 2004, Badii et al.,
2006, Badii & castillo, 2007, Badii et al., 2007a, Badii et al., 2007b). La
disponibilidad de programas de computadora ha facilitado el aumento de su
utilizacin en problemas de investigacin. Es particularmente til en
situaciones donde se tienen mltiples variables dependientes como
satisfaccin, compra o volumen de ventas. Si las variables predictoras fueran
Correlacin cannica
406
407
Correlacin cannica
408
409
410
411
con
N= nmero de casos
kx= nmero de variables en el grupo de VI
ky= nmero de variables en el grupo de VD
DF = (kx)(ky)
m = nmero de correlaciones cannicas
Para probar la significancia de una correlacin cannica, se utiliza la
prueba de Bartlett de la lambda de Wilks. La lambda vara de 0 a 1 y muestra
la varianza del error, la varianza no contabilizada por las variables
independientes. Entonces se interpreta de forma opuesta al cuadrado de la
correlacin mltiple R2. Obtener un 1.0 significa que las variables
independientes no estn contabilizando nada de la varianza en la variable
dependiente, y un 0 significa que las variables independientes estn
contabilizando toda la varianza. Para una lambda menor, una varianza
mayor. 1- ser equivalente a R2. La prueba de chi cuadrada se usa para
probar la significancia de lambda.
La redundancia de las variables se menciona frecuentemente cuando
se tienen resultados de correlacin cannica. A mayor redundancia, o
correlacin entre un grupo de variables, mejor ser la habilidad para predecir
de un grupo a otro.
Dos grupos de coeficientes cannicos son necesarios para cada
correlacin cannica uno para combinar las VDs y otro para combinar las
VIs.
Para las VDs la ecuacin es:
Correlacin cannica
412
donde
By = matriz normalizada de eigenvectores
R = matriz de correlaciones
Las dos matrices de coeficientes cannicos se utilizan para estimar el puntaje
en las variantes cannicas:
X = ZxBx
Y = ZyBy
Los puntajes en las variantes cannicas (X, Y) son el producto de los
puntajes de las variantes originales y los coeficientes cannicos usados para
ponderarlas. La suma de los puntajes cannicos para cada variante es igual
a cero. El llenado de las matrices (A) se realiza por la multiplicacin de la
matriz de las correlaciones entre variables con la matriz de coeficientes
cannicos. Estas matrices A son usadas para interpretar las variantes
cannicas.
Ax = RxxBx
Ay = RyyBy
Qu tanta varianza explica cada variante cannica? La proporcin de la
varianza para VIs es:
a = correlaciones llenas
k = nmero de variables en un grupo
M.H. Badii et al.
413
Supuestos bsicos
La generalidad del anlisis de correlacin cannica tambin se
extiende a sus supuestos estadsticos bsicos. El supuesto de linealidad
afecta a dos aspectos de los resultados de la correlacin cannica, primero,
el coeficiente de correlacin entre cualquiera de dos variables esta basado
en una relacin lineal. Si la relacin no es lineal, entonces se debe
transformar una ambas variables si esto fuera posible. Segundo, la
correlacin cannica es la relacin lineal entre los valores tericos.
Si los valores tericos se relacionan de una manera no lineal, la
relacin no ser reflejada por la correlacin cannica. De esta manera,
aunque el anlisis de correlacin cannica es el mtodo multivariante ms
extendido, esta restringido ha la identificacin de relaciones lineales.
El anlisis de correlacin cannica puede emplear cualquier variable
mtrica sin que cumpla el estricto supuesto de normalidad. La normalidad es
deseable porque estandariza una distribucin que nos permite una mayor
correlacin entre las variables. Pero en un estricto sentido, el anlisis de
correlacin cannica puede utilizar incluso variables no normales si la forma
de las distribuciones altamente simtrica no disminuye la correlacin con
otras variables ficticias, tambin sin embargo, se requiere normalidad
multivariante para los contrastes de significacin de inferencia estadstica de
cada funcin cannica. Dado que los contrastes de normalidad multivariantes
no se estn disponibles fcilmente, la lnea a seguir que prevalece es
asegurar que cada variable presenta una normalidad univariante. De este
modo, aunque estrictamente no se requiere normalidad, es altamente
recomendable que se compruebe la normalidad de todas las variables y que
se transformen si fuese necesario.
Funciones y ajustes
Esta seccin corresponde a la obtencin de una ms funciones
cannicas. Cada funcin est formada por un par de valores tericos, uno
que representa las variables independientes y el otro que representa las
variables independientes. El nmero de variables es igual al nmero de
variables que hay en el conjunto de datos menor, ya sea dependiente o
independiente. Por ejemplo, cuando en un problema de investigacin incluye
Correlacin cannica
414
415
416
417
418
419
Interpretacin y visualizacin
Nuestro problema final es sobre la interpretacin de los resultados.
Tratamos de encontrar mtodos grficos que nos ayudaran a entender y
explicar los patrones multidimensionales encontrados por el ACC. Estos
patrones son importantes porque ayudan al analista a definir, en una forma
de vista de datos, las condiciones ambientales ms importantes y sus
correspondientes efectos en las acciones humanas. Una de las sugerencias
ms tiles fue encontrada por Cliff (1987), que sugiri interpretar la estructura
de las correlaciones ms que las ponderaciones. Las correlaciones
estructurales son las correlaciones de la variante cannica X con cada una
de las variables independientes originales, y la de la variante cannica Y con
cada una de las variables dependientes originales. De esta forma, algunas
veces misteriosas variantes cannicas pueden ser interpretadas en trminos
de su correlacin con las variables originales. Despus usamos dos mtodos
grficos para pintar el patrn de la estructura de las correlaciones y enfatizar
las desviaciones del patrn y los atpicos (outliers, ver Figura 1).
Correlacin cannica
420
Conclusiones
El ACC es el mtodo de seleccin cuando se tienen variables
multivariantes dependientes en un contexto de otra forma adecuado para
regresin mltiple. El ACC se utiliza mejor como parte de un grupo de
mtodos analticos. Todo el paquete debe incluir anlisis de celdas, estado
de transicin (Markov) y modelos dinmicos, mtodos grficos, y otros
mtodos estadsticos (Degani, 1996; Degani, Shafto, & Kirlik,; Degani & Kirlik,
1995). Los mtodos de premuestreo pueden ser utilizados para computar
intervalos de confianza y niveles de significacin de correlaciones cannicas.
Las correlaciones estructurales son tiles para interpretar los resultados del
ACC, y las tcnicas de grficas simples pueden ser utilizadas para entender y
explicar los resultados. El ACC es capaz de describir en una forma objetiva
(con datos) algunos de los patrones complejos en los datos de los estudios
de campo, simulaciones, y experimentos controlados en la interaccin del
hombre-mquina. Dirige la atencin del analista a los patrones principales de
los datos, as como tambin a las desviaciones importantes de dichos
patrones. La correlacin cannica se utiliza para analizar la correlacin entre
dos grupos de variables cuando hay un grupo de VIs (variables
independientes) y otro grupo de VDs (variables dependientes). Es un
procedimiento ms bien descriptivo que analtico para probar hiptesis, y
existen varias formas en las que la informacin puede ser combinada en este
procedimiento. El trmino cannica indica que la tcnica se extrae de una
matriz. Se extraern tantas funciones como el menor nmero de variables,
por ejemplo, si hay 5 variables independientes y 3 variables dependientes, se
tendr un total de 3 funciones. Cada funcin describe una cantidad menor de
variacin, por ejemplo, la primera funcin describir la mayor parte de ella,
despus se computar otra funcin en la varianza residual, y as
sucesivamente.
Generalmente, las funciones secundarias son de uso y valor
cuestionable. Se pueden obtener y el programa lo hace, pero eso no significa
que sean de utilidad o que tengan significado. Cada una tiene un coeficiente
de determinacin asociado a ella, y en general ste caer rpidamente
despus del primero.
Son varias las preguntas que pueden ser contestadas con la
Correlacin Cannica. 1. Cuntos pares de variables confiables hay en el
grupo de datos? 2. Qu tan fuerte es la correlacin entre las variables en un
M.H. Badii et al.
421
par? 3. Cmo deben ser interpretadas las dimensiones que relacionan a las
variables? La Correlacin Cannica esta sujeta a varias limitantes. 1. Es
matemticamente elegante pero difcil de interpretar porque las respuestas
no son nicas. 2. La relacin entre variables debe ser linear; si la informacin
esta correlacionada de manera no-linear, entonces otros anlisis sern ms
apropiados. 3. Pequeos cambios en donde las variables estn incluidas en
el anlisis pueden causar grandes diferencias en los resultados, y esto puede
confundir la interpretacin posterior.
Normalmente, no es necesario realizar la Correlacin Cannica, pero
esto aumenta el poder estadstico de una prueba. Como se mencion antes,
es esencial la relacin linear entre las variables. Adems, la homogeneidad
(varianzas muy semejantes) aumenta la potencia de la prueba. La
Correlacin Cannica es muy sensible a datos faltantes en la matriz
analizada y en los datos atpicos. Debe probarse que toda la informacin est
presente y debe resolverse ese problema antes de conducir una Correlacin
Cannica.
Referencia
Alpert, M.I, y R.A. Peterson, 1972. On the interpretation of Canonical Analysis. Journal of
marketing Research, 187.
Alpert, M.I, R.A. Peterson y W.S. Marti, 1975. Testing the significance of canonical
correlations. American Marketing Association 37: 117-119.
Ashley D.A., 1996. Canonical Correlation Procedure for Spreadsheets, 27th Annual Meeting
of Decision Sciences Institute USA.
Badii, M.H., A.R. Pazhakh, J.L. Abreu & R. Foroughbakhch. 2004. Fundamentos del mtodo
cientfico. InnOvaciOnes de NegOciOs 1(1): 89107.
Badii, M.H., J. Castillo & A. Wong. 2006. Diseos de distribucin libre. InnOvaciOnes de
NegOciOs, 3(1): 141-174.
Badii, M.H. & J. Castillo (eds.). 2007. Tcnicas Cuantitativas en la Investigacin. UANL,
Monterrey.
Badii, M.H., R. Ramrez & J. Castillo. 2007a. Papel de estadstica en la investigacin
cientfica. InnOvaciOnes de NegOciOs, 4(1): 107-145.
Badii, M.H., J. Castillo, J. Rositas & G. Alarcn. 2007b. Uso de un mtodo de pronstico en
investigacin. Pp. 137-155. In: M.H. Badii & J. Castillo (eds.). Tcnicas
Cuantitativas en la Investigacin. UANL, Monterrey.
Dillon, W.R, y M. Goldstein, 1984. Multivariate analysis: Methods and applications. New York:
Wiley.
Lambert, Z., y R. Durand, 1975. Some precautions in using canonical analysis. Journal of
Marketing Research 12:468-475.
Correlacin cannica
422
Stewwart, D., y W. Love 1968. A general canonical correlation index. Psychological Bulletin
70: 160-163.
Hair J, Anderson R, Tatham R, Black W. Anlisis Multivariante. Prentice Hall, 2000.