Sunteți pe pagina 1din 10

La validez discriminante como criterio

de evaluación de escalas: ¿teoría o estadística?*


Discriminant Validity as a Scale Evaluation Criterion:
Theory or Statistics?
Recibido: julio 8 de 2008 Revisado: noviembre 20 de 2008 Aceptado: diciembre 10 de 2008

José Antonio Martínez-García** Universidad Politécnica de Cartagena, España


Laura Martínez-Caro Universidad Politécnica de Cartagena, España

Resumen
La validez discriminante es uno de los criterios habituales para evaluar las
escalas de medida de constructos latentes en ciencias sociales. Este artículo
muestra como se pueden obtener resultados contradictorios si se aplican
diferentes procedimientos estadísticos, por lo que se recomienda evaluar
de forma teórica la divergencia entre escalas que representan conceptos.
De este modo, la validez de contenido actúa como criterio robusto frente a
determinados análisis estadísticos basados en covarianzas.
Palabras clave autores
Validez discriminante, validez de contenido, escalas de medida.
Palabras clave descriptores
Diseño experimental, escalas, análisis de varianza.

Abstract
Discriminant validity is one of the usual criteria for evaluating measurement
scales that define latent constructs in social sciences. This article shows how
different statistical procedures frequently used for accomplishing this aim
*
Artículo teórico en psicometría. can yield misleading results. Authors recommend a theoretical judgement
**
Dirigir la correspondencia al Departamento de Eco- about divergence among scales that are manifestation of latent concepts.
nomía de la Empresa. Área de Comercialización e Therefore, content validity represents a robust condition against certain
Investigación de Mercados. Facultad de Ciencias de covariance statistical based analysis.
la Empresa. Universidad Politécnica de Cartagena. Key words authors
Paseo Alfonso XIII, 50 – 30203. Cartagena. Tlf. 968 Discriminant Validity, Content Validity, Measurement Scales.
32 59 39. Fax. 968 32 57 74. Correo electrónico: Key words plus
josean.martinez@upct.es. Experimental Design, Scales, Analysis of Variance.

Univ. Psychol. Bogotá, Colombia V. 8 No. 1 PP. 27-36 ene-abr 2009 ISSN 1657-9267 27
J osé A ntonio M artínez -G arcía , L aura M artínez -C aro

Introducción las corrientes en disputa, establece una forma de


actuar, y es precisamente esa forma de proceder
La validez de las mediciones de los constructos o la que ponemos bajo análisis, y no la filosofía sub-
variables utilizados en Psicología, marketing y otras yacente.
disciplinas afines, es una condición indispensable
para el desarrollo y contraste de teorías científicas
en estos campos de conocimiento. No es de extra- Escenario de análisis
ñar, por tanto, la gran importancia que se le otorga
a los métodos de validación en la literatura de las Vamos a centrar el análisis en las situaciones en las
ciencias sociales, sobre todo a raíz de los trabajos que el investigador plantea varias mediciones por
de Cattel (1946), Cronbach y Meehl (1955), y variable utilizando un método común. ­Asimismo
Campbell y Fiske (1959). suponemos un marco conceptual que requiere
Tradicionalmente, se afirma que la forma de una interpretación realista sobre causalidad (Bors­
medir un constructo es válida si las medidas imple- boom, Mellenbergh & Heerden van, 2003); es
mentadas miden realmente lo que pretenden medir decir, que cambios en el valor de la variable de in-
(Cook & Campbell, 1979). A lo largo de la litera- terés deben reflejarse en cambios en las mediciones
tura se han propuesto diversos criterios para llevar implementadas y que, además, esas mediciones son
a cabo ese proceso de validación (p.ej., Steenkamp agregadas para finalmente hallar el valor del cons-
& Trijp van, 1991), siendo la validez convergente tructo subyacente. Este escenario es el más común
y discriminante dos de los más utilizados, y que en los estudios en los que se recoge información del
tal vez se han ligado más estrechamente a la idea mercado (consumidores, empresas, etc.), ­aunque
de validez de constructo. De este modo, y a par- lógicamente no refleja todas las situaciones, que-
tir de los argumentos de Campbell & Fiske (1959), dando excluidos, por ejemplo, los estudios que
se afirma que, para que unas medidas sean válidas, utilizan matrices multirasgo-multimétodo o los
las de un mismo constructo deben correlacionar que defienden una concepción formativa sobre
altamente entre ellas (validez convergente), y que la medición.
esa correlación debe ser mayor que la que exista Para ilustrar nuestro razonamiento vamos a
con respecto a las medidas propuestas para otro considerar un clásico ejemplo de Psicología del
constructo distinto (validez discriminante). Consumo, donde el investigador está interesado
No obstante, existe un amplio debate en la li- en estudiar el efecto de la calidad percibida por el
teratura sobre el propio concepto de validez y las consumidor de un producto X sobre las intencio-
diferentes visiones acerca de la importancia de la nes futuras de mantener una relación comercial
red nomológica en la validación de mediciones, así con la empresa Y (p.ej., Zeithaml, Parasuraman &
como sobre la prevalencia de la perspectiva causal Berry, 1996; Brady, Cronin & Brand, 2002). Para
y las implicaciones que ello conlleva en la metodo- ello tomamos como referencia el estudio de Mar-
logía utilizada por el investigador (p.ej., Bagozzi, Yi tínez, Flores y Martínez (2006) en el contexto de
& Phillips., 1991; Markus, 1998; Hayduk & Glaser, servicios financieros, donde se analiza una muestra
2000; Hancock & Mueller, 2001; Borsboom, Me- de 207 consumidores. En este estudio se utilizan
llenbergh & Heerden van, 2004). El objetivo de cuatro indicadores para el constructo “calidad”
nuestro artículo no es, sin embargo, participar de y tres para la variable “lealtad”, medidos en una
esa discusión ni deliberar acerca de las diferentes escala de intervalo (método común), siendo la
posturas, sino reflexionar sobre las diferentes for- media de esos indicadores el valor de referencia de
mas que habitualmente se utilizan para estudiar la ambas variables. De esta forma podemos plantear
validez discriminante de las mediciones; es decir, un enfoque sencillo de ecuaciones estructurales
una vez que el investigador se posiciona por una de (Figura 1).

28 U n i v e r s i ta s P s yc h o l o g i c a V. 8 No. 1 enero-abril 2009


La validez discriminante como criterio de evaluación de escalas : ¿ teoría o estadística ?

Tabla 1
γ ζ Intervalos de confianza al 95% para las correlaciones
X Y
entre los indicadores

λx1 λx2 λx3 λx4 λy1 λy2 λy3 X1 X2 X3 X4 Y1 Y2 Y3

x1 x2 x3 x4 y1 y2 y3
X1 1
(0.56;
θx1 θx2 θx3 θx4 θy1 θy2 θy3 X2 1
0.72)
(0.58; (0.64;
Figura 1 X3 1
0.73) 0.78)
Modelo de investigación
(0.44; (0.63; (0.60;
Nota. X4 1
0.63) 0.77) 0.75)
λ coeficiente de regresión entre el constructo y cada indi-
cador
X varianza de error de cada indicador (0.43; (0.52; (0.46; (0.55;
Y1 1
0.62) 0.69) 0.65) 0.71)
Y coeficiente de regresión entre las variables latentes
(0.35; (0.49; (0.40; (0.45; (0.51;
θ varianza de error de la variable dependiente Y2 1
0.57) 0.67) 0.60) 0.64) 0.69)
Fuente: elaboración propia.
(0.42; (0.56; (0.50; (0.54; (0.61; (0.68;
Y3 1
0.62) 0.72) 0.68) 0.71) 0.76) 0.80)

Formas de evaluar la validez Fuente: elaboración propia.


discriminante
Rápidamente se constata que, aunque todas
Llegados a este punto, y tras analizar la consistencia las correlaciones intravariables (Rxx;Ryy) son am-
interna (validez convergente) de los indicadores de pliamente diferentes de cero, los intervalos de
las dos variables, el investigador suele proceder al confianza se solapan con los de las correlaciones
estudio de la validez discriminante a través de los intervariables (Rxy) en un gran número de casos.
siguientes métodos. Sin embargo, y dado que entran en juego com-
paraciones entre correlaciones dependientes, en
Comparación entre las correlaciones este caso, deberían analizarse 72 comparaciones
de los indicadores (6 x 12) entre Rxx y Rxy , y 36 comparaciones (3 x
12) entre Ryy y Rxy. Para ello, habría que calcular
Según las recomendaciones de Campbell & Fiske la significación de las comparaciones a través de
(1959), como las variables X y Y son indicadores de la Z de Steiger (Steiger, 1980) para el caso de co-
constructos distintos, existe validez discriminante rrelaciones superpuestas, o del estadístico ZPF
si todas las correlaciones entre los indicadores de X (Steiger, 1980) para el caso de correlaciones no
(Rxx) y Y (Ryy) son significativas y cada una de esas superpuestas. Dado el tedioso procedimiento de
correlaciones es mayor que todas las correlaciones cálculo (108 comparaciones), nos limitamos a mos-
entre indicadores de ambas variables (Rxy). trar cuatro ocasiones en las que las correlaciones
Para ver la precisión de las correlaciones cons- no pueden considerarse diferentes y cuatro en que
truimos los intervalos de confianza al 95% usando sí lo son (Tabla 2).
el método de la transformada de Fisher (Rosnow Por tanto, según este criterio, los indicadores
& Rosenthal, 1996) tal como se muestra en la de ambas variables no cumplen de manera plena
Tabla 1. con uno de los criterios de validez discriminante
exigidos.

U n i v e r s i ta s P s yc h o l o g i c a V. 8 No. 1 enero-abril 2009 29


J osé A ntonio M artínez -G arcía , L aura M artínez -C aro

Tabla 2 Tabla 3
Muestra de comparación de correlaciones Varianza compartida (IC al 95%) y varianza media
extraída
Z de Steiger ZPF
X Y
Rx1x4 ; Rx1y1 0.21 Rx1x4 ; Rx3y2 0.49
R2XY (0.59; 0.74)
Ry1y3 ; Ry1x4 1.20 Ry1y2 ; Rx4y3 0.80
ρvc 0.654 0.685
Rx1x2 ; Rx1y1 2.32 Rx31x4 ; Rx1y2 3.90
Fuente: elaboración propia
Ry1y3 ; Ry1x1 3.20 Ry2y3 ; Rx4y1 2.23
Valor crítico (95%) de Z y ZPF para el test de una cola: Intervalo de confianza entre
1.65.
las correlaciones
Fuente: elaboración propia.
Anderson & Gerbing (1988) proponen que si el in-
Comparación entre la varianza compartida tervalo de confianza al 95% para las correlaciones
y la varianza extraída entre constructos no incluye el 1, se puede afirmar
que existe validez discriminante. Este criterio es,
Fornell y Larcker (1981) proponen que existe va- por supuesto, mucho menos restrictivo que los an-
lidez discriminante entre dos variables latentes, si teriores y de muy fácil cumplimiento, ya que es bas-
la varianza compartida (R2XY) entre pares de cons- tante improbable que dos medidas correlacionen
tructos es menor que la varianza extraída (ρvc) para perfectamente, sobre todo cuando el tamaño de la
cada constructo individual. Este último indicador muestra es grande. En el caso de nuestro ejemplo,
hace referencia a la cantidad de varianza captura- la correlación entre las dos variables latentes es de
da por el constructo en relación a la cantidad de 0.82, con un intervalo de confianza aproximado
varianza debida al error de medida: al 95% de (0.77; 0.86) Sin embargo, bajo nuestra
perspectiva, este criterio no debe evaluarse tenien-
p
2
do en cuenta la “distancia estadística”, sino la “dis-
� �λ
i =1
i tancia práctica”; es decir, considerar el tamaño del
ρvc ( constructo ) =
� p p efecto frente a la significación estadística (Cohen,
� �λi2 + � Var (�θi )
i =1 i =1
1994). Podríamos considerar, de esta forma, dos
alternativas de evaluación. La primera de ellas es
tomar como referencia las convenciones de Cohen
siendo λi el coeficiente de regresión estandari- sobre la importancia de los tamaños de efecto. Para
zado entre el constructo y cada indicador y, θi los el caso de la correlación, Cohen (1988) propone
errores de medida de cada indicador. En nuestro que tamaños de efecto superiores a 0.5 se pueden
ejemplo, analizamos el modelo factorial confirma- considerar de gran relevancia. Por tanto, niveles
torio (S-BX2: 25.60; gl: 13; p: 0.019) y, tras calcular tan altos de correlación indicarían una elevada
el intervalo de confianza para el coeficiente de co- semejanza de la variabilidad conjunta. La segunda
rrelación múltiple usando el software R2 (Steiger opción es convertir la distribución asimétrica del
& Fouladi, 1992), obtenemos que R2XY no puede coeficiente de correlación en simétrica, a través
considerarse diferente a ρvc(X) y ρvc(Y) (Tabla 3), por de la transformada de Fisher y calcular el percentil
lo que de nuevo no se cumple el criterio propuesto de la distribución que se corresponde con el límite
sobre la validez discriminante de las medidas. superior del intervalo de confianza de la correla-

30 U n i v e r s i ta s P s yc h o l o g i c a V. 8 No. 1 enero-abril 2009


La validez discriminante como criterio de evaluación de escalas : ¿ teoría o estadística ?

ción. Esa operación da un percentil del 90,5%, 1994) nos indica que la evidencia de que la correla-
lo que indica la pequeña distancia (menos de 10 ción sea cero es la misma de que sea de 0.137, por
puntos porcentuales) entre la perfecta correlación lo cual podemos afirmar que a nivel de tamaño de
y la obtenida en la muestra y, por tanto, cuestiona efecto existe una pequeña asociación no explicada
la divergencia de las medidas. por el método común de medición. Por tanto, los
resultados son totalmente contradictorios a los
Correlaciones en presencia de método común obtenidos en los epígrafes anteriores.

Las covarianzas entre las medidas de las dos va- Tabla 4


riables podrían ser explicadas por un efecto siste­ Partición de la varianza
mático no deseado provocado por el método de
recogida de información (Podsakoff, MacKenzie, Carga Carga Varian- Varianza Varianza
Lee & Podsaoff, 2003); de este modo la correlación factorial factorial za de debida a la debida al
variable método error variable método
entre las variables latentes podría verse afectada
una vez controlado el efecto método (Figura 2). X1 1.830 1.00 0.373* 14.52 42.25
X2 1.000 1.08* 0.181* 5.81 66.26
X3 2.315 0.99* 0.137 28.94 51.27
X Y X4 0.699 1.20* 0.268* 2.25 64.64
Y1 0.458 1.39* 0.472* 4.33 57.15
Y2 1.000 1.17* 0.402* 21.81 43.43
x1 x2 x3 x4 y1 y2 y3
Y3 1.138* 1.38* 0.179 27.14 57.91
p< 0.05.
Fuente: elaboración propia
Método
Diferencia entre valores medios

Figura 2 Por último, una fórmula simple es comparar los


Efecto del método común valores medios de las escalas de medida propuestas.
Fuente: elaboración propia Aunque dos variables estén muy relacionadas y me-
didas con el mismo método, pueden tener valores
El análisis del modelo con la presencia de un medios sustantivamente diferentes, lo que cuestio-
efecto método latente mostró un ajuste adecuado: naría que las escalas de medida no fueran capaces
S-BX2: 7.088; gl: 6; p: 0.313. Como puede obser- de discriminar entre conceptos. Para ello se halló
varse en la Tabla 4, la mayor parte de la variación el tamaño de efecto d de Cohen (1977) usando las
de los ítems se debe al efecto del método común, indicaciones metodológicas de Dunlap, Cortina,
lo que hace cuestionar la validez de la información Vaslow y Burke (1996) para muestras relacionadas,
obtenida (sobre todo la fiabilidad de los indica- y considerando el coeficiente de correlación pro-
dores). Es más, tras esta corrección por método, veniente del análisis factorial confirmatorio, con
los resultados muestran que la correlación entre el fin de tener en cuenta el error de medida1. Los
la calidad percibida y la lealtad es no significativa resultados (Tabla 5) muestran cómo se pueden dar
(0.07), por lo que ambas variables son completa-
mente independientes, aunque el cálculo del valor
contranulo de la correlación (Rosenthal & Rubin, 1 d=tc[2(1-r)/n]1/2 donde tc es el valor t para la diferencia de medias
pareadas y r el coeficiente de correlación

U n i v e r s i ta s P s yc h o l o g i c a V. 8 No. 1 enero-abril 2009 31


J osé A ntonio M artínez -G arcía , L aura M artínez -C aro

interpretaciones muy diferentes de la similitud de 2. La validez de contenido


las variables, atendiendo a si se considera o no los La respuesta a los problemas derivados de los análi-
efectos del método de medición. Así, la alta co- sis estadísticos es la apropiada solidez teórica de las
rrelación entre las variables latentes obtenida sin escalas propuestas. La validez de contenido hace
efectos del método produce un tamaño de efecto referencia a la adecuada selección de las medidas
pequeño, mientras que esta magnitud es más que de la variable de interés. Esa selección tiene que ser
duplicada en caso contrario2. Evidentemente, esta realizada en forma deductiva (Cronbach & Meehl,
disparidad de magnitudes puede llevar a interpre- 1955) y requiere un profundo conocimiento de la
taciones bastante divergentes sobre la capacidad materia en cuestión. Es decir, la definición de las
discriminante de las escalas. variables del estudio condiciona la elección de sus
indicadores en el cuestionario (Hayduk, 1996). Por
Tabla 5 tanto, si dos variables son conceptualmente dife-
Tamaños de efecto entre los valores medios de las rentes y sus respectivas escalas de medición están
variables dependientes
justificadas suficientemente bien a nivel teórico,
los análisis estadísticos basados en covarianzas o
Valor medio Valor medio correlaciones no deben desembocar en conclusio-
d d*
(Calidad) (Lealtad)
nes ambiguas. Si ambos conceptos son diferentes
3.05 3.28 0.21a 0.48 en su definición y las medidas propuestas son ca-
* Tamaño de efecto al considerar la correlación corregida
paces de ser sensibles a las variaciones en esos con-
por el efecto método. ceptos, no importa la magnitud de la correlación
a
Convenciones de Cohen (1988) sobre el tamaño de efecto entre ellos. Ésta es una de las aseveraciones que
d: pequeño (0,20), mediano (0,50), grande (0,80). discuten perfectamente Borsboom et al. (2003), y
Fuente: elaboración propia que plantea un nuevo camino en la metodología
sobre validación de escalas.
1. Test del modelo causal En el caso de nuestro ejemplo, la calidad es defi-
El análisis del modelo de investigación proporciona nida como la evaluación que realiza el consumidor
funciones de ajuste y parámetros estimados idénti- sobre la excelencia o superioridad de un servicio
cos al modelo factorial confirmatorio (son modelos (Zeithaml, 1988) y la lealtad es entendida como
equivalentes) sin tener en cuenta el efecto método, una actitud de favorabilidad hacia el servicio, que
por lo que se puede afirmar que la calidad ejerce puede manifestarse en recomendar y hablar positi-
una gran influencia sobre la lealtad (explica entre vamente de él y tener la intención de mantenerse
un 59 y un 74% de la variabilidad). Sin embargo, las fiel a la compañía (Zeithaml et al., 1996). Ambos
dudas sobre la idoneidad de las escalas de medida son conceptos claramente diferenciados, y las esca-
propuestas son evidentes tras los análisis previos las propuestas reflejan teóricamente esa divergen-
de validez, por lo que el investigador necesitaría cia (Tabla 6). Además, los indicadores de la escala
una muy buena justificación para defender su de lealtad hacen referencia a comportamientos
propuesta. futuros; es decir, en un tiempo t+1, en oposición
a los indicadores de calidad donde la evaluación
es realizada por el encuestado en un momento t y
en cuyo juicio intervienen las experiencias en t-1.
Esta condición es crucial a la hora del diseño de
estudios causales con datos de corte transversal
2 En este caso, el cálculo del valor medio de la escala como repre-
(Kline, 2005) y evita los problemas filosóficos y
sentativo del concepto latente quedaría bastante cuestionado, ya
que la mayor parte de la varianza de esos indicadores es explicada metodológicos derivados del planteamiento de re-
por el efecto método y no por la variable latente, por lo que se laciones no recursivas (Kaplan, Harik, & Hotchkiss,
podría afirmar que esos indicadores no son lo suficientemente
adecuados. 2000; Kline, 2006).

32 U n i v e r s i ta s P s yc h o l o g i c a V. 8 No. 1 enero-abril 2009


La validez discriminante como criterio de evaluación de escalas : ¿ teoría o estadística ?

Tabla 6 por tanto, ser susceptibles de estar sujetas a los


Escalas de medida criterios descritos anteriormente sobre la validez
discriminante.
Fuentes
3. Conclusión
Calidad
Hemos tratado de mostrar con un ejemplo real,
x1. Diría que esta entidad finan- Brady y Cronin cómo los criterios más utilizados para analizar la
ciera provee un servicio superior (2001)
validez discriminante de las escalas de medida pro-
x2. Creo que esta entidad finan- Brady y Cronin puestas para conceptos latentes, pueden llevar a
ciera ofrece un excelente servicio (2001) conclusiones engañosas sobre la idoneidad de esas
x3. Esta entidad financiera da Cronin, Brady y escalas. Operativamente los investigadores suelen
altos estándares de calidad del Hult (2000); Teas realizar, muchas veces de forma mecánica, los aná-
servicio (1993) lisis estadísticos para testar la validez discriminante
x4. Comparadas con otros ban- una vez justificada la definición de los conceptas y
cos o cajas, esta entidad financie- Olsen (2002) elección de los indicadores. Además, resulta muy
ra ofrece un excelente servicio complicado encontrar (nosotros no lo hemos he-
Lealtad cho) algún investigador que se replantee su estudio
porque estadísticamente exista poca evidencia de
y1. Recomiendo mi entidad fi- Nguyen y Leblanc
nanciera a otras personas (1998) divergencia entre escalas. Normalmente, se suele
continuar la investigación reconociendo que las
y2. Ante cualquier nueva necesi- Rodríguez, Cama- medidas tienen poca validez discriminante pero
dad financiera acudiré sin duda a rero y Gutiérrez
esta entidad (2002)
que otros criterios de validez y la propia definición
de los conceptos justifican esa debilidad estadística.
y3. Si tuviera que elegir otra vez, Cronin et al. Pero entonces, ¿por qué se siguen realizando esos
elegiría esta misma entidad (2000)
análisis estadísticos? Bajo nuestro punto de vista,
Fuente: adaptación de los autores con base en los trabajos no es necesario embarcarse en esos procedimientos
mencionados
estadísticos para defender la validez discriminante
de las escalas, simplemente basta con la correcta
Por tanto, la validez divergente no debe ser, bajo delimitación de las variables.
nuestro punto de vista, evaluada de forma esta- Los problemas de sesgo por método común son
dística, o al menos, la estadística no debería pesar una realidad en la investigación sobre comporta-
más que la propia definición de los conceptos y sus miento del consumidor, aunque se han propuesto
mediciones. Así, por ejemplo, en determinadas in- diferentes procedimientos para paliar esa deficien-
vestigaciones que analizan los gastos familiares en cia (Podsakoff et al., 2003). Sin embargo, a nivel
función de los ingresos, podríamos encontrarnos operativo el investigador no tiene muchas veces
con patrones de correlaciones muy parecidos a los los recursos suficientes para implementar esos
mostrados en nuestro estudio. Pero a ninguno de métodos y únicamente puede plantear diseños de
nosotros se nos ocurriría cuestionar la validez de investigación como el ilustrado en este artículo. A
las medidas porque no existiera divergencia a ni- este respecto, tampoco los resultados estadísticos
vel de covarianzas entre ingresos y gastos, ya que que devienen de tener en cuenta el método común
éstos son dos variables conceptualmente opuestas. deben interpretarse sin estar sujetos a crítica. En el
Lo mismo ocurre, por ejemplo, entre el peso y la ejemplo propuesto Rxx ,Ryy y Rxy son muy similares.
altura de los individuos, cuya correlación ronda el Pero hay que plantearse en qué medida se debe ello
valor 0.80 en la población (Borsboom et al., 2004), al efecto del método común o a la propia relación
que representan realidades totalmente diferentes, real entre indicadores. No es muy lógico pensar
pudiendo ser planteadas en un mismo modelo y, que dos variables como la calidad y la lealtad, que

U n i v e r s i ta s P s yc h o l o g i c a V. 8 No. 1 enero-abril 2009 33


J osé A ntonio M artínez -G arcía , L aura M artínez -C aro

teóricamente están en mayor o menor medida aso- aún más la defensa de la justificación teórica frente
ciadas, no correlacionen casi nada cuando se tiene a la estadística.
en cuenta los efectos del método común. De este
modo, como argumentan Podsakoff et al. (2003), el
investigador se enfrenta a un verdadero desafío me- Referencias
todológico a la hora de analizar si las asociaciones
obtenidas entre las variables están contaminadas Anderson, J. C. & Gerbing, D. W. (1988). Structural
por el sesgo de método común. Procedimientos Equation Modeling in Practice: A review and
metodológicos avanzados basados en ecuaciones recommended two-step approach. Psychological
estructurales como las matrices multirasgo-mul- Bulletin, 103, 411-423.
timétodo, el análisis factorial confirmatorio de Bagozzi, R. P., Yi, Y. & Phillips, L. W. (1991). Assessing
segundo orden, el análisis factorial confirmatorio construct validity in organizational research. Ad-
jerárquico, el modelo de primer orden múltiple ministrative Science Quarterly, 36, 421-458.
informante múltiítem o el modelo de producto di- Borsboom, D., Mellenbergh, G. J. & Heerden van, J.
recto pueden ser herramientas que ayuden a tomar (2003). The theoretical status of latent variables.
decisiones sobre la validez de constructo (Bagozzi Psychological Review, 110(2), 203-219.
et al., 1991), aunque están sujetos a diferentes Borsboom, D., Mellenbergh, G. J. & Heerden van, J.
limitaciones (Podsakoff et al., 2003). (2004). The concept of validity. Psychological Re-
Muchos de los inconvenientes estadísticos de- view, 111(4), 1061-1071.
rivados de los procesos de validación de las escalas Brady, M. K. & Cronin, J. J. Jr. (2001). Some new
multiítem podrían en parte subsanarse, reduciendo thoughts on conceptualizing perceived service
el número de indicadores a uno o dos por concepto quality: A hierarchical approach. Journal of Mar-
(Hayduk, 1996). Nuestra recomendación es que keting, 65, 34-49.
si el investigador está interesado en analizar rela- Brady, M. K., Cronin, J. J. & Brand, R. R. (2002). Per-
ciones causales, se plantee entonces la reducción formance-only measurement of service quality:
de indicadores, y de esta forma se evitarían coefi- A replication and extension. Journal of Business
cientes de fiabilidad artificialmente engordados y Research, 55, 17-31.
disminuirían los problemas de presencia de efectos Campbell, D. T. & Fiske, D. W. (1959). Convergent and
halo y el sesgo de método común. Además, habría discriminant validation by the multitrait-multime-
muchas menos restricciones de covarianza por thod matrix. Psychological Bulletin, 56, 81-105.
explicar y en consecuencia sería más fácil obtener Cattel, R. B. (1946). Description and measurement of per-
modelos con buen ajuste. sonality. New York: World Book Company.
Determinar la validez de las medidas propuestas Cohen, J. (1977). Statistical power analysis for the beha-
sigue siendo un debate candente, en la literatura vioral sciences. New York: Academic Press.
de las ciencias sociales. Como se indicó al co- Cohen, J. (1988). Statistical power analysis for the beha-
mienzo, el investigador debe posicionarse por una vioural sciences (2nd ed.). Hillsdale, NJ: Lawrence
de las diferentes corrientes metodológicas. Pero Elbaum.
sea cual sea su decisión, creemos más oportuno Cohen, J. (1994). The earth is round (p < .05). Ameri-
justificar de forma teórica la divergencia entre can Psychologist, 49(12), 997-1003.
escalas que representan conceptos y no apoyarse Cook, T. & Campbell, D. (1979). Quasi-experimentation:
en procedimientos estadísticos, que, tal y como Design and analysis issues for field settings. Boston:
hemos mostrado, pueden desembocar en resulta- Houghton Mifflin.
dos contradictorios. Finalmente, las asunciones de Cronbach, L. J. & Meehl, P. E. (1955). Construct va-
linealidad y simetría entre las relaciones de este lidity in psychological test. Psychological Bulletin,
tipo de conceptos es muchas veces cuestionable 52, 218-302.
(Mittal, Ross & Baldasare, 1998), lo que refuerza

34 U n i v e r s i ta s P s yc h o l o g i c a V. 8 No. 1 enero-abril 2009


La validez discriminante como criterio de evaluación de escalas : ¿ teoría o estadística ?

Cronin, J. J., Brady, M. K. & Hult, G. T. M. (2000). As- determinación de la lealtad. XVIII Encuentro de
sessing the effects of quality, value, and customer Profesores Universitarios de Marketing, Almería,
satisfaction on consumer behavioral intentions in España.
service environments. Journal of Retailing, 76(2), Mittal, V., Ross Jr., W. T. & Baldasare, P. M. (1998).
193-218. The asymmetric impact of negative and positive
Dunlap, W. P., Cortina, J. M., Vaslow, J. B. & Burke, attribute-level performance on overall satisfaction
M. J. (1996). Meta-analysis of experiments with and repurchase intentions. Journal of Marketing,
matched groups or repeated measures designs. 62, 33-47.
Psychological Methods, 1, 170–177. Nguyen N. & Leblanc G. (1998). The mediating role of
Fornell, C. & Larcker, D. F. (1981). Evaluating structural corporate image on customers’ retention decisions:
equation models with unobservable variables and An investigation in financial services. International
measurement error. Journal of Marketing Research, Journal of Bank Marketing, 16(2), 52-65.
27, 39-50. Olsen, S. O. (2002). Comparative Evaluation and the
Hancock, G. R. & Mueller, R. (2001). Rethinking Relationship between Quality, Satisfaction, and
construct reliability within latent variable sys- Repurchase Loyalty. Journal of the Academy of
tems. En R. Cudeck, S. du Toit & D. Sörbom Marketing Science, 30(3), 240-249.
(Eds.), Structural equation modeling: Present and Podsakoff, P. M., MacKenzie, S. B., Lee, J. Y. & Podsakoff,
future-A Festschrift in honor of Karl Jöreskog (pp. N. P. (2003). Common method biases in behavio-
195-216). Lincolnwood, IL: Scientific Software ral research: A critical review of the literature
International. and recommended remedies. Journal of Applied
Hayduk, L. A. (1996). LISREL Issues, Debates and Psychology, 88, 879-903.
Strategies. Baltimore: Johns Hopkins University Rodríguez, S., Camarero C. & Gutiérrez J. (2002, sep-
Press. tiembre). Lealtad y valor en la relación del consumi-
Hayduk, L. A. & Glaser, D. N. (2000). Jiving the four- dor. Una aplicación al caso de los servicios financieros.
step, waltzing around factor analysis, and other XIV Encuentro de Profesores Universitarios de
serious fun. Structural Equation Modeling, 7, 1-35. Marketing. Granada, España.
Kaplan, D., Harik, P. & Hotchkiss, L. (2000). Cross- Rosenthal, R. & Rubin, D. B. (1994). The counternull
sectional estimation of dynamic structural equa- value of an effect size: A new statistic. Psychological
tion models in disequilibrium. En R. Cudeck, S. Science, 5, 329-334.
du Toit & D. Sörbom (Eds.), Structural equation Rosnow, R. L. & Rosenthal, R. (1996). Computing
modeling: Present and future-A Festschrift in honor contrasts, effect sizes, and counternulls on other
of Karl Jöreskog (pp. 315-340). Lincolnwood, IL: people’s published data: General procedures for
Scientific Software International. research consumers. Psychological Methods, 1, 331-
Kline, R. B. (2005). Principles and practice of structural 340.
equation modeling (2nd ed.). New York: Guildford Steenkamp, J. B. E. M. & Trijp van, H. C. M. (1991).
Press. The Use of LISREL in Validating Marketing Cons-
Kline, R. B. (2006). Reverse arrow dynamics. En G. tructs. International Journal of Research in Marke-
R. Hancock & R. O. Mueller (Eds.), A second ting, 8, 283-99.
course in structural equation modelling (pp. 43-68). Steiger, J. H. (1980). Test for Comparing Elements of
Greenwich, CT: Information Age Publishing. a Correlation Matrix. Psychological Bulletin, 87,
Markus, K. A. (1998). Science, measurement, and va- 245-281.
lidity: Is completion of Samuel Messick’s synthesis Steiger, J. H. & Fouladi, R. T. (1992). R2: A Computer
possible? Social Indicators Research, 45, 7-34. program for interval estimation, power calcu-
Martínez, J. A., Flores, E. & Martínez, L.  (2006, lation, and hypothesis testing for the squared
­septiembre). La relación causal entre la calidad multiple correlation. Behavior Research Methods,
­percibida, satisfacción e imagen corporativa en la Instruments, and Computers, 4, 581-582.

U n i v e r s i ta s P s yc h o l o g i c a V. 8 No. 1 enero-abril 2009 35


J osé A ntonio M artínez -G arcía , L aura M artínez -C aro

Teas, R. (1993). Expectations, performance evaluation,


and consumer’s perceptions of quality. Journal of
Marketing, 57, 18-31.
Zeithaml, V. A. (1988). Consumer perceptions of price,
quality, and value: A means-end model and syn-
thesis of evidence. Journal of Marketing, 52, 2-22.
Zeithaml, V., Berry, L. & Parasuraman, A. (1996). The
behavioral consequences of service quality. Journal
of Marketing, 60, 31-46.

36 U n i v e r s i ta s P s yc h o l o g i c a V. 8 No. 1 enero-abril 2009

S-ar putea să vă placă și