Sunteți pe pagina 1din 30

Revista de Psicología del Trabajo y de las

Organizaciones
ISSN: 1576-5962
revistas_copm@cop.es
Colegio Oficial de Psicólogos de Madrid
España

RODRÍGUEZ GONZÁLEZ, JORGE


La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas Internacional
Revista de Psicología del Trabajo y de las Organizaciones, vol. 20, núm. 2, 2004, pp. 169-197
Colegio Oficial de Psicólogos de Madrid
Madrid, España

Disponible en: http://www.redalyc.org/articulo.oa?id=231317999004

Cómo citar el artículo


Número completo
Sistema de Información Científica
Más información del artículo Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Página de la revista en redalyc.org Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
Revista de Psicología del Trabajo y de las Organizaciones - 2004
Volumen 20, n.º 2 - Págs. 169-197. ISSN: 1576-5962

Artículo
La tecnología de evaluación ipsativa y el sistema APP-APT de
Thomas International

Ipsative Assessment Technology and the Personal Profile


Assessment by Thomas International
JORGE RODRÍGUEZ GONZÁLEZ
Thomas International Spain

RESUMEN

El objetivo fundamental del presente artículo es aportar más información para diferenciar
entre las distintas pruebas a fin de que los profesionales de RRHH podamos elegir para eva-
luar al personal. Para ello es necesario ahondar en la distinción entre pruebas normativas e
ipsativas, que son las pruebas más frecuentes en nuestro ámbito de actuación. Por ultimo, y
como objetivo final, este articulo pretende presentar los informes de validez del Análisis del
Perfil Personal© de Thomas International®.
Las pruebas de elección múltiple y las pruebas de elección forzosa son distintas a varios
niveles. El objetivo de ambas es común, evaluar a la persona, la diferencia es cómo cada una
responde al criterio de rentabilidad (para los que es crítica la validez).
Las pruebas normativas funcionan de manera muy eficiente cuando cumplen los supues-
tos; pero veremos que en determinadas situaciones, y especialmente en contextos de selec-
ción, estos supuestos pueden llegar a distorsionar las puntaciones de una persona en una des-
viación típica. Esta diferencia es más que suficiente para incluir en la siguiente fase a un mal
candidato o excluir a uno bueno.
Por otro lado, las pruebas ipsativas no requieren supuestos tan rígidas, por lo que la infor-
mación intraindividual que obtenemos corre menos riesgo de sufrir variaciones graves. Sin
embargo, las pruebas ipsativas son más débiles en la comparación interindividual cuando
analizamos dimensiones aisladas. En el caso de la selección de personal, implica que la com-
paración entre personas incluye siempre todo el perfil.
El uso de pruebas ipsativas nos asegura disponer como mínimo de la misma validez que
las pruebas normativas, e incluso superior, a la vista de cómo resuelve la comparación entre
individuos.

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 169
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

Por último, los datos del Análisis del Perfil Personal (APP) de Thomas International
demuestran que los datos de validez, tanto para población mundial como para la población en
España, son altos y estadísticamente significativos. Esto era esperable por la ausencia de
fuentes de error tan acusadas en las pruebas ipsativas en general y el APP en particular.

ABSTRACT

In order to help human resources professionals differentiate among the wide range of
selection tests, this paper provide them with useful information. A first differentiation is bet-
ween normative and ipsative tests. This paper also reports about validity of Personal Profile
Assessment (PPA) by Thomas International®.
Multiple choice tests are different from forced choice tests in a number of ways. Both
types of tests share the goal of individual assessment, but they differ in how they meet cost-
benefit standards, where validity is critical. Normative tests are very efficient when they meet
assumptions, although these may distort an individual outcome by a standard deviation. This
difference might lead to a wrong decision, i.e. accept a bad candidate or reject a good one.
On the other hand, ipsative tests do not require such rigid assumptions and hence intra-indivi-
dual information is less likely to vary abruptly. Nevertheless, for separate dimensions ipsati-
ve tests are weaker in inter-individual comparisons. In personnel selection, this means that
between-person comparisons always include the whole profile. The use of ipsative tests ensu-
res at least the same validity as normative tests or even higher in view of the way they mana-
ge between-individual comparison.
Lastly, data from Thomas International PPA show high and significant validity indices
both for the world population and for the Spanish population. This was something to be
expected thanks to the lack of marked error sources in ipsative tests, particularly in Personal
Profile Analysis.

PALABRAS CLAVE

Selección de tests, Evaluación normativa, Evaluación


ipsativa, APP, Validación.

KEY WORDS

Selection Tests, Normative Tests, Ipsative Tests, PPA,


Validity.

170 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

INTRODUCCIÓN que nosotros consideramos que la validez no


es un fin en sí mismo sino un medio. El ver-
El objetivo fundamental del presente dadero objetivo es optimizar el proceso de
artículo es aportar más información entre evaluación de las personas. Dicho de otro
las diferentes pruebas que cualquier profe- modo, el objetivo es llegar una solución que
sional de RRHH puede elegir para evaluar brinde la más alta calidad en los resultados,
a su personal. Para ello es necesario ahon- con los menores recursos posibles.
dar en la distinción entre pruebas normati-
vas e ipsativas, que son las pruebas más El mejor modo que tenemos ahora para
frecuentes en nuestro ámbito. evaluar en qué medida las características
técnicas aportan valor a esa optimación es
Seguramente todo el mundo esta de la validez. Sin embargo, no es el único cri-
acuerdo en que el criterio central en el que terio que consideramos que es relevante.
nos debemos de fijar es la validez. Pero Volvamos a poner un ejemplo extremo.
para llegar a ella es necesario recorrer un Supongamos que tenemos que elegir entre
camino previo que nos permita poner en dos pruebas para un proceso de selección.
contexto cada prueba. La validez, como Podríamos optar por la prueba B, que tiene
cualquier índice matemático, tiene una una validez real para nuestro grupo objeti-
serie de características y asunciones que es vo de 0.70 pero que requiere un alto coste
necesario tener en cuenta. Dicho de otro de licencia, tener a los candidatos y a los
modo, estos índices se calculan en unas evaluadores 5 horas trabajando (y por tanto
condiciones determinadas y con una pobla- espacios físicos) y que además requiere
ción determinada. En la medida en la que tener formadas a las personas que realizan
las condiciones en que nosotros utilizamos las pruebas (recordemos que cuando extra-
esa pruebas sean idénticas a las descritas polamos los índices de validez suponemos
en los estudios, podemos confiar más en el que todo el mundo esta igual de formado
valor matemático. A modo de ejemplo, para aplicar, corregir e interpretar las prue-
imaginemos un proceso de selección en bas). Por otro lado, podemos optar por la
España en el año 2004, de poco o nada nos prueba C, que tiene una validez de 0.60,
sirve saber que una determinada prueba A, implica gastos en función de cada persona
tiene una validez de .99 si el estudio se que evaluamos, se puede aplicar en 1 hora
hizo en el año 1967 con población japone- (incluso vía Internet) y tanto la aplicación
sa que vive en Perú. como la interpretación las realiza un pro-
grama de ordenador (por lo que no depen-
Este ejemplo es tan extremo que resulta demos que personal especializado en el
evidente que la validez que nosotros obten- uso de esa prueba). La pregunta es: ¿Cuál
gamos al realizar un proceso de selección es la prueba que maximiza la eficacia de
en nuestra empresa cuando menos será dis- nuestro proceso de selección?
tinta.
El problema es que no hay una respues-
No obstante, la concepción de este docu- ta única a este dilema. En general podemos
mento es el desarrollo y análisis de las tec- decir que hay dos posibles afrontamientos.
nologías de evaluación está aplicada a reali- Las personas más “academicistas” segura-
dad empresarial española, lo cual implica mente estarán convencidas de la bondad y

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 171
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

superior calidad de la primera; mientras jas e inconvenientes que presentan. Ade-


que las personas más “pragmáticas”, cuan- más, para completar el análisis describire-
do menos considerarán si una diferencia de mos las relaciones que hay entre ambos
0.10 justifica la diferencia en costes. tipos de medidas. Dicho de otro modo, si
el carácter normativo o ipsativo depende
Estamos tratando de evaluar el coste sólo del instrumento o también si hay
que supone equivocarse en un proceso de cuestiones estadísticas y de tratamiento de
selección ya que el problema se basa en las puntuaciones. Lo que no vamos a
cómo nosotros podemos relacionar indica- hacer, es una revisión de los índices de
dores de RRHH con la cuenta de resulta- validez encontrados para cada prueba
dos o con la creación de valor. concreta, el autor interesado puede encon-
trarlo en (Baron, 1995; Irvine, Mettam y
Para intentar responder a ambos grupos Syrad, 1994).
de personas, y a diferencias de las revisio-
nes de la literatura, nuestra revisión de las Tras la necesaria revisión teórica, plan-
características de cada tipo de prueba, tearnos los datos obtenidos por el Análisis
incluirá ambos tipos de elementos. De este del Perfil Personal© (a partir de ahora
modo, ambos grupos de profesionales se APP) de Thomas International®. Dentro
podrán hacer una imagen completa de de este apartado abordaremos tanto los
todas las diferencias. aspectos más técnicos, es decir índices de
fiabilidad y validez, como los aspectos
Hemos considerado que el mejor modo más pragmáticos de su utilización.
de responder a este objetivo es revisar en
detalle los dos tipos de pruebas más usua- Si al final de de este documento, el lec-
les y aplicadas en el mundo del trabajo. tor considera que tiene una idea más clara
Estas pruebas son las normativas y las de la diferencia entre los dos tipos de prue-
ipsativas (Véase Michell, 1990; para una bas y un mayor conocimiento estadístico
lista completa todos los tipos de pruebas). del APP podremos considerar que hemos
cumplido nuestro propósito.
De igual modo, debemos limitar nuestra
revisión a parte del espectro de caracterís- PRUEBAS NORMATIVAS
ticas personales relevantes a la hora de
evaluar a una persona. En concreto, este El primer tipo de pruebas que vamos a
trabajo se centra exclusivamente en la revi- analizar son las pruebas normativas. Este
sión de las pruebas de personalidad y/o es el tipo de pruebas más comunes en la
comportamiento. La mayoría de las con- evaluación de RRHH.
clusiones son aplicables al resto de áreas,
pero presentan algunas peculiaridades Siendo fieles a nuestro esquema vamos
(Michell, 1990). a comenzar por definir de manera más
precisa que es una prueba normativa y
Para cada tipo de prueba, revisaremos: generar nuestra propia prueba con datos
las definiciones que están más extendidas, ficticios, que después nos servirán para
el nivel de medida que emplean, qué hacer un análisis de las posibles fuentes
supuestos hacen y, por último, las venta- de error.

172 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

Definición un cuestionario de evaluación de la perso-


nalidad. Nuestro cuestionario tendrá sólo
Las pruebas normativas se caracterizan ocho cuestiones, porque para nosotros el
por emplear una tarea de evaluación, nor- tiempo es importante, y el candidato tendrá
malmente una cuestión o una frase descrip- cinco opciones de respuesta. Tras pensar
tiva, ante la que la persona tiene que elegir razonablemente cada una de las preguntas
en que grado es aplicable a sí mismo o en nuestro cuestionario es el que se muestra
que grado esta de acuerdo. Para ello dispo- en la tabla 1.
ne de distintas alternativas que se gradúan
progresivamente entre estos dos extremos. Como puede fácilmente apreciar el lec-
tor, todas preguntas han sido inventadas.
Una característica fundamental de este Sin embargo, otras se podrían parecer a
tipo de pruebas es que, desde el punto de algún test. Se han elegido esas preguntas
vista del candidato, cada ítem o pregunta porque en nuestra práctica profesional son
es independientemente entre si. Yo puedo las que algunos profesionales de RRHH
contestar lo que considero oportuno en han considerado más “sorprendentes”. No
cada pregunta. Será después cuando com- vamos a entrar a analizar su validez apa-
binemos el conjunto de preguntas en cons- rente en este documento pero sin duda es
tructos o con la escala de sinceridad. otro elemento importante a analizar en la
eficacia de un proceso de evaluación y en
A modo de ejemplo, vamos a realizar la venta de la imagen de la empresa.

Tabla 1
EJEMPLO FICTICIO DE PRUEBA DE ELECCIÓN MÚLTIPLE

Muy Bajo Medio Alto Muy


bajo alto

1. En qué medida se considera usted


respetuoso con la gente
2. Me relaciono con facilidad con la gente
3. Siempre ayudo a la gente que me
encuentro
4. Prefiero estar en el salón que en el
dormitorio
5. Conozco mucha gente
6. Hago amigos con facilidad
7. Siempre contesto de manera simpática
a la gente
8. Trabajo bien en equipo

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 173
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

Como se puede imaginar el lector la Supongamos que hemos aplicado esta


realidad nunca es tan sencilla. Por el con- prueba a cuatro candidatos. Tras las fases
trario, lo habitual es tener un modelo teóri- iniciales de análisis y de desarrollo teóri-
co que sirva de soporte a la evaluación, co, hemos llegado a la conclusión de que
aunque en algunos casos, este modelo el modo adecuado de agrupar los ítems es
surge de los datos recogidos. La repercu- el que se muestra en la tabla 2. Aquí tene-
sión en RRHH de esta diferencia, sería otra mos ahora cuatro constructos, factores o
interesente discusión que no podemos tra- rasgos representados por las letras A, B, C
tar en este momento. y D. Para la corrección sustituimos el
valor muy bajo por 1, el bajo por 2; y así
En cualquiera de los dos casos, el sucesivamente hasta muy alto que corres-
modelo dicta los criterios para el análisis ponde con 5.
de los ítems, y en concreto para su agrupa-
ción. Véase Kline (1998) para una referen- Esta tabla muestra para cada uno de las
cia completa de la diferencia entre comen- personas (en las columnas) las puntuacio-
zar desde un modelo teórico o hacerlo de nes que han marcado en cada uno de los
manera empírica. ítems (filas) y la posterior agrupación en
factores (filas en negrita).
Podemos dar un paso más para facilitar
la comprensión de las pruebas normativas. Para completar el análisis de estas res-

Tabla 2.
RESULTADOS DE CUATRO CANDIDATOS A NUESTRA PRUEBA
DE ELECCIÓN MÚLTIPLE

Persona A Persona B Persona C Persona D Suma por


rasgo

Ítem 1 Rasgo A 1 2 3 6 5 6 5 10 14
Ítem 5 1 3 1 5

Ítem 2 Rasgo B 1 2 3 6 5 6 5 10 14
Ítem 6 1 3 1 5

Ítem 3 Rasgo C 1 2 3 6 5 6 5 10 14
Ítem 7 1 3 1 5

Ítem 4 Rasgo D 1 2 3 6 5 6 5 10 14
Ítem 8 1 3 1 5

Suma 8 24 24 40
por
persona

174 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

puestas, hemos calculado la suma total de bios; mientras que la segunda mediante
las puntuaciones para cada columna y para adjetivos.
cada fila. La primera nos indica la suma de
todas las puntuaciones de cada uno de los En principio no hay límite para la canti-
candidatos, mientras que las filas nos dicen dad de dimensiones o constructos que se
la suma para cada factor de todas las per- pueden evaluar con una prueba de tipo
sonas. normativo, ya que cada una de las evalua-
ciones se hace de manera independiente.
Un análisis típico de una prueba norma- Sin embargo, hay numerosos estudios
tiva incluiría una comparación con los (Lord y Novick, 1968) que demuestran que
datos normativos; es decir la población de no manejamos más allá de 9 dimensiones,
referencia. La puntuación de 2 de la perso- siendo lo normal 5. Lo cual muestra una
na A en el rasgo 1, no significa nada en si evidente relación teórica y empírica con la
mismo; depende de la puntuación del amplitud de la memoria de trabajo.
grupo de referencia. De este modo contes-
tamos a la siguiente pregunta: ¿En qué A este problema debemos agregar que
parte del continuo de puntuaciones de todo en realidad sabemos que las evaluaciones
el grupo situamos esa puntuación? en cada una de las dimensiones no son
independientes, sino que varían en el grado
de relación entre ellas. La solución que ha
Nivel de medida dado la teoría de la evaluación psicológica
es la utilización del análisis factorial. El
El nivel de medida de una prueba propósito de esta técnica es agrupar dimen-
depende del formato de respuesta y de las siones muy relacionadas para facilitar su
variables medidas. Como se puede apreciar compresión y poder dotarlas de significado
en nuestro ejemplo, el formato de respues- psicológico.
ta usado aquí es mediante elección múlti-
ple. Para cada uno de los ítems la persona
dispone de varias opciones de respuesta Supuestos
(en nuestro caso 5). Lo más habitual es que
esta elección múltiple sea del tipo Likert, El nivel de medida es lo que más fácil
de 5 ó de 7 opciones (Véase Michell, 1990, se puede apreciar en cualquier prueba, y es
para un referencia completa de sobre el accesible incluso para el candidato que
concepto de nivel de medida). hace nuestras pruebas. Pero elegir un tipo
de nivel de medida condiciona una serie de
Este modo de recoger la información supuestos. Esta suposiciones previas de
esta asociado con un nivel de medida de partida determinan en que grado nuestras
intervalo. Las características psicológicas, conclusiones son validas.
medidas de esta forma, tienen validez eco-
lógica ya que nos permite medir o bien la La primera suposición de las pruebas
cantidad o fuerza de un sentimiento, idea, normativas es que las categorías son conti-
predisposición hacia una persona, cosa o nuas. Dicho de otro modo que a cualquier
acción o la calidad de esa fuerza. La pri- candidato cuando haga nuestra prueba le
mera se evalúa mediante el uso de adver- resultará igual de fácil pasar del muy bajo

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 175
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

al bajo, que del bajo al medio. Hay una menos frecuente). Cualquier persona habi-
abundante investigación sobre la dificultad tuada a trabajar con este colectivo sabe que
que supone asumir que esto es cierto en términos de personalidad es poco fre-
(Baron, 1996), por lo que se estudia el cuente encontrar tantas personas caóticas,
efecto real que produce. desorganizadas como personas ordenadas,
precisas, sistemáticas.
La segunda suposición que hacemos al
emplear una prueba de tipo normativa es La segunda consideración a realizar
que la escala de medida es de intervalo. sobre este punto se refiere al propósito del
Este supuesto es la operativización mate- proceso de selección. En términos globales
mática del primero, pero tiene grandes el objetivo es predecir conducta, pero de
implicaciones respecto al uso de las herra- manera pragmática es diferenciar entre
mientas estadísticas, por ejemplo el análi- candidatos. No nos basta saber si dos per-
sis factorial paramétrico. sonas tienen el potencial, sino entre ellas
cuál se adaptará más rápido o cuál aguan-
Tan importante como el anterior es la tará la presión o cuál se ajustara al equipo
suposición de la existencia de independen- y a la cultura. ¿Es la distribución normal lo
cia entre las varianza error. Lo que nos más adecuado para dar respuesta a ese
equivocamos en cada una de las dimensio- objetivo?
nes no esta relacionado entre si. Dicho de
otro modo, no habrá factores que afecten Como se puede suponer estos criterios
de manera consistente y relacionada a tienen un increíble peso en la validez. Los
todas las dimensiones. índices de validez solo se pueden extrapo-
lar cuando se cumplen todos estos requisi-
Por último, algunas pruebas asumen un tos. Un índice de 0.99 puede no ser aplica-
tipo determinado de distribución. Las per- ble a nuestra situación si no tenemos la
sonas, cuando consideramos la población certeza de que cumplimos esas característi-
de manera global, mostrarán puntuaciones cas.
agregadas ajustadas a una distribución nor-
mal (pocos en los extremos y muchos en el
medio). Inconvenientes

Más tarde analizaremos en detalle las Los principales inconvenientes de este


repercusiones de estos supuestos en el uso tipo de pruebas se refieren a su aplicación
de las pruebas normativas en un contexto práctica. De manera resumida la literatura
laboral, pero antes de avanzar es necesario recoge tres inconvenientes:
hacer al menos dos consideraciones sobre
la última de las suposiciones. ¿Cree • Son muy sensibles al engaño.
alguien que la distribución en una dimen- • Más largos en tiempo.
sión de personalidad concreta de los candi- • En selección no cumplen las supues-
datos que se presentan a un proceso de tos.
selección es normal? Por ejemplo, selec-
cionamos personas para un puesto de inge- Cuando decimos que son más sensibles
niero (por usar un tópico que cada vez es al engaño, significa que la persona cons-

176 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

ciente o inconscientemente puede engañar mismos de manera más positiva, acorde


o falsear los datos. La diferencia entre con la imagen socialmente deseable. En
ambos tipos de engaños son la intenciona- nuestro pequeño ejemplo, podría ser la
lidad de la persona y no el grado de auto- persona D. La misma persona puede estar
conocimiento o consciencia. en ambos tipos de engaño porque nosotros
no hemos realizado un equilibrado de las
Dentro del engaño no intencional, los respuestas.
principales problemas con los que se
enfrentan este tipo de pruebas son la ten- Por último, y en oposición al anterior
dencia central, la aquiescencia, la desea- hay personas que tiene tendencia a infrava-
bilidad social y la tendencia a infravalo- lorase. Estas personas se puntúan muy
rarse. bajo. En algunos casos está asociado a una
baja autoestima. Nuestro ejemplo se
Cuando hablamos de problemas deno- corresponde con el ejemplo A.
minados de tendencia central, nos referi-
mos a la inclinación que tienen ciertas per- Es difícil estimar el efecto que tiene
sonas de evitar usar puntaciones extremas. estas fuentes de error. Lo que si sabemos
Es el ejemplo de las persona B de la Tabla (Baron, 1996) es que pueden modificar la
1. Con personas de este tipo podemos puntación de las personas en un factor,
encontrarnos con dimensiones diferencia- entre media y una desviación típica (Ones,
das e incluso extremas en función de la Viswesvaran y Korbin, 1995; Viswesvaran
población de referencia. Supongamos que y Ones, 1999).
la persona B obtiene un percentil de 70 en
la dimensión A, ¿cómo debemos interpre- Es de esperar que en un contexto de tra-
tar ese dato teniendo que cuenta que la per- bajo a estas fuentes de engaño inconsciente
sona contestó a todas las preguntas como haya que sumar la predisposición de la
medio? persona de dar una imagen más positiva de
sí misma. Lo cual seguramente tiene un
La segunda fuente de error es la aquies- aspecto muy positivo, asociado con la
cencia, que se define como la tendencia a motivación por adquirir el puesto, pero es
mostrarse de acuerdo con la dirección de la de esperar que incremente el riesgo de que
frase. En nuestro caso podría ser la persona aparezcan estas fuentes de engaño, e inclu-
D. Sus puntuaciones demuestran que está so, la presencia de engaño intencionado. A
siempre de acuerdo en grado máximo con nadie se le escapa que hay academias y
la dirección de las preguntas. Normalmen- centros de formación que entrenan a la
te el diseño de una buena prueba debe gente para contestar a las pruebas de forma
equilibrar los enunciados formulados posi- intencionada.
tiva y negativamente. Nuestra prueba no lo
tiene. El segundo inconveniente es que este
tipo de pruebas requieren más tiempo, en
En tercer lugar, según su relevancia en parte para paliar estas fuentes de errores y,
la literatura, se han encontrado problemas en parte, porque emplean muchas escalas.
de deseabilidad social. Hay personas que Sea cual sea la causa, implica que en un
al contestar a la prueba se perciben a sí contexto laboral se incrementan los costes,

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 177
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

tanto de la organización como del candida- textos sus debilidades se hacen más paten-
to evaluado. tes.

Finalmente, hay dudas (Baron, 1995) de Es evidente que este tipo de pruebas
que este tipo de pruebas cumplan todos los tiene aspectos positivos y negativos; y que
requisitos matemáticos y metodológicos en el equilibrio entre ellos varía según los
un contexto de selección de personal. El contextos de utilización. La siguiente pre-
ejemplo más claro es el nivel de medida gunta es: si no uso pruebas normativas,
por intervalos. No parece cierto que la dis- ¿qué uso?
tancia entre el valor 1 y el 2 de la escala
sea igual a la distancias entre el 4 y el 5,
por poner un ejemplo. PRUEBAS IPSATIVAS

Una de las posibles respuestas a esta


Ventajas pregunta es usar pruebas de tipo ipsativo.
Pero antes de saber para qué contexto y de
Después de leer lo expuesto anterior- qué modos es rentable este tipo de pruebas
mente, uno puede preguntarse: ¿Por qué es necesario hacer una revisión de sus
razón se emplean todavía pruebas de tipo características.
normativo? En primer lugar debemos
decir, que estas dificultades no se aplican
en igual grado a todas las pruebas normati- Definición
vas. Son características asociadas al para-
digma de medida. La diferencia entre prue- Por ipsativa entendemos aquella prueba
bas estará en el grado en que solventan que recurre a puntuaciones forzadas, es
estas dificultades a priori y el coste que decir, que todas las escalas de medida en
esto implica (por ejemplo: en tiempo, res- esa prueba, son constantes para todas las
tricciones de aplicación, etc.). personas. Dicho de otro modo, la persona
tiene una serie de elecciones o de puntos
No obstante, las pruebas normativas que repartir entre varias opciones, pero
también tienen características positivas. asignar una puntuación a una de las opcio-
Las más destacadas son: nes implica no poder hacerlo con las otras.
De manera más formal, podemos decir que
• Son fáciles de interpretar. las pruebas ipsativas son medidas multies-
• Especialmente cuando queremos cala que restringen la varianza intraindivi-
compara sujetos entre si. dual (Cattell, 1988).
• Hay gran cantidad de literatura a nivel
internacional. Hay dos modos de llegar a una restric-
• Algunos modelos acumulan abundan- ción de este tipo: mediante un cuestiona-
te investigación (por ejemplo, el Big rio específico o a través del tratamiento
Five). matemático de los datos. En este aparta-
do consideramos puntuaciones ipsativas
La cuestión no es si es adecuada o no, sólo a aquellas que se derivan directa-
que es obvio que lo sea, sino en que con- mente de las respuestas del candidato, y

178 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

dejaremos el análisis de las puntaciones bas ipsativas, porque este adjetivo es una
ipsativizadas para el siguiente apartado. característica de los datos y de la medida.
El motivo de esta distinción es que los Como después veremos se pueden obtener
datos parecen indicar que no tienen las datos ipsativos de pruebas de elección
mismas propiedades ambos tipos de datos múltiple.
ipsativos.
A título de ejemplo, si dejáramos que el
El modo directo de obtener puntuacio- candidato eligiera tantos adjetivos sin lími-
nes ipsativas es mediante cuestionarios de te como quisiera no sería ipsativo. Cattell
elección forzosa. El grado de elaboración (1988) diferencia un tipo de medidas como
de estos cuestionarios varia notablemente, parcialmente ipsativo si se establece res-
pero el más fácil que nos podemos imagi- tricciones de otro tipo. Las pruebas que no
nar sería forzar al sujeto a que repartiera lo hace no son ni ipsativas ni normativas,
10 puntos entre una lista restringida de sino de tipo idemórfico.
vinos, según su preferencia. Independien-
temente del resultado y de la elección indi- Un ejemplo de prueba de elección for-
vidual, la suma total de los puntos asigna- zosa se muestra en la Tabla 3. En este caso
dos por cada uno de nosotros será la hemos ideado un ejemplo relativamente
misma, ya que era un restricción de la simple de prueba con sólo cuatro cuestio-
tarea. nes. El candidato debe marcar en cada una
de las casillas el adjetivo que considera
Si lo complicamos en el sentido de que es más aplicable para describirse en un
introducir varias escalas en lugar de una ambiente de trabajo.

Tabla 3
CUESTIONARIO DE ELECCIÓN FORZOSA

cortés influenciable Jovial minucioso

persuasivo Audaz preciso obediente

modesto Leal valiente inconquistable

original encantador ecuánime travieso

sola, nos vamos progresivamente aproxi- Este tipo de cuestionario es de elec-


mando a cuestionarios multiescala de elec- ción forzosa porque de los cuatro adjeti-
ción forzada. En este caso, se estable una vos, sólo se puede elegir uno de ellos.
restricción para cada escala. Dicho de otro modo, la elección de cada
una de las preguntas no es libre sino que
A modo de precisión purista se habla de ordena las opciones según la calidad de
pruebas de elección forzosa y no de prue- la preferencia. Podría ser que las cuatro

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 179
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

lo fueran o que ninguna lo fuera, pero el más elaborados y mayor profundidad de


candidato esta forzado a elegir en cada los análisis.
columna.
Supongamos que hemos aplicado nues-
Hay cuestionarios más elaborados que tra mini prueba a cuatro candidatos, la
le obligan al candidato a elegir la caracte- matriz de datos resultante podría ser la que
rística que más se aplica y la que menos. se muestra en la tabla 4.

Tabla 4
RESULTADOS DE CUATRO CANDIDATOS A NUESTRA PRUEBA
DE ELECCIÓN FORZOSA

Persona 1 Persona 2 Persona 3 Persona 4 Suma por


Dimensión
Audaz Dimensión 1 + + 8
Cortés + +
Ecuánime + +
inconquistable + +
Encantador Dimensión 2 + 3
Valiente +
Minucioso
Modesto
Obediente Dimensión 3 + 2
Influenciable
Jovial
persuasivo +
Original Dimensión 4 + 4
preciso +
travieso +
Leal +
Suma por persona 4 4 4 4

En términos conceptuales no hay diferen- La suma de las filas define la puntua-


cia, las puntuaciones siguen siendo ipsati- ción de cada persona en cada una de nues-
vas. Sin embargo, disponemos de dos pun- tras cuatro dimensiones. Esta información
tuaciones por dimensión en lugar de una; varía para cada dimensión. Sin embargo, la
lo cual permite un tratamiento de los datos suma por columnas nos informa de las pre-

180 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

guntas contestadas por cada persona; pero fija un cero absoluto para la interpretación
es igual para todas las personas evaluadas. de cada una de las escalas, sino que refe-
rencia el cero relativo en cada factor al
Como se puede apreciar en estos resul- resto.
tados, si analizamos a las personas tene-
mos que el primer candidato ha concentra- Una de las primeras conclusiones de
do todas sus respuestas en el dimensión 1, esta diferencia es la validez ecológica. Las
mientras que en el resto no tiene ninguna pruebas de elección forzada reproducen de
respuesta. Por el contrario, el resto de los manera más ecológica la necesidad de ele-
candidatos han repartido sus respuestas de gir entre los distintos tipos de comporta-
manera diferente. Así los candidatos 2 y 4 mientos disponibles en el repertorio con-
han repartido por igual todas sus respues- ductual de una persona. De este modo, nos
tas, pero eligiendo diferente adjetivos. Por acercamos más a cuáles pueden ser los
último el candidato 3 se ha centrado única- comportamientos más característicos de
mente en dos dimensiones. cada persona

Algunos estudios afirman que este tipo


Nivel de medida de prueba está más cercana a la realidad,
es decir explican mejor el comportamiento
Cuando empleamos una prueba de elec- que queremos predecir, en la medida en
ción forzosa debemos tener en cuenta que que las opciones están relacionadas con
las dimensiones están relacionadas entre si. una situación real (Closs, 1996).
Nuestra medida obliga al candidato a ele-
gir entre las distintas opciones. Si marca La idea que subyace es que no se puede
una no podrá marcar las otras. Esto implica medir todo simultáneamente y por tanto
que los factores de una prueba de este tipo hay que elegir. Es más, algunos de los fac-
siempre muestran una correlación media. tores o sentimientos que en las pruebas
normativas se miden de manera indepen-
El grado de relación entre las escalas diente podrían ser contradictorios, y por
depende tanto del modelo teórico en el que tanto excluyentes.
se basa como de la propiedad psicométrica
de la propia prueba. Pero en cualquier
caso, serán unas características a tener en Asunciones
cuenta en los análisis y en la interpretación
posterior. El primer supuesto implícito que hace-
mos al emplear una prueba de elección for-
Las puntuaciones que obtenemos en zosa es que estamos en un nivel de medida
cada una de las dimensiones son relativas. ordinal. Esto es, podemos ordenar punta-
Dicho de otro modo, no decimos que esta ciones, pero no hacer cálculos sobre la dis-
persona tiene un 4 en la dimensión 1, sino tancia entre ellas.
que esta persona participa más de este fac-
tor que de los demás. El motivo de esta Si a esta primera asunción le sumámos
diferencia con las pruebas de elección múl- que consideramos que las dimensiones
tiple es que en las pruebas ipsativas no se están relacionadas entre sí, seguramente

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 181
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

veremos claro porque no necesitamos es incompatible con la comparación de dos


hacer supuestos sobre la distribución o la personas en factores aislados. Dicho de
independencia de la varianza de error otro modo, nosotros no podemos decir que
(Véase la Karpatschof y Elkjaer, 1999, el candidato 1 tiene más orientación a
para una referencia completa de la métri- comportarse según el factor 1 de muestro
ca de la medida ipsativa frente la normati- ejemplo, que el resto de los candidatos. En
va). palabras de Horst (1965):

Excepto el nivel de medida, las pruebas “…las medidas ipsativas, ya sea que
ipsativas no necesitan hacer supuestos para se deriven de procedimientos experimen-
poder evaluar personas. Esto es muy útil tales o de computación, no pueden ser
en la medida en que es aplicable a gran normativas en el sentido de que una per-
variedad de contextos y resistentes a los sona puede ser comparada con otra con
requerimientos más exigentes, como puede relación a una variable única. Por
ser la situación de evaluación en un proce- supuesto, esto es así porque alguna cons-
so de selección. tante arbitraria ha sido añadida o sustraí-
da de todas las puntuaciones de cada
Aunque no sean propiamente supuestos, individuo medido. Puesto que no es la
la medida con pruebas de elección forzosa misma constante para todos los indivi-
encuentra que los factores que se emplean duos, las medidas resultantes no son
son casi siempre de carácter bipolar. Es comparables de un individuo a otro. A
decir, que podemos claramente identificar menudo se pasa por alto esta limitación.
dos polos cualitativamente diferentes en la Con frecuencia, se compara erróneamen-
interpretación del comportamiento de una te a las personas por lo que respecta a las
persona en la misma dimensión. medidas ipsativas”.

Por otro lado, prácticamente la totalidad Las implicaciones de esta diferencia son
de las pruebas de elección forzosa mues- muy importantes, y es especialmente seria
tran altas correlaciones entre los factores en el caso de la evaluación de personas en
medidos. Estas características no condicio- el contexto laboral. Trabajos clásicos
nan la utilidad de la prueba ni la calidad de demuestran que cuando se emplean indis-
las conclusiones; pero sí impone condicio- criminadamente en decisiones sobre perso-
nes sobre utilización e interpretación, tal y nal tienen una utilidad limitada (Johnson,
como veremos en el análisis de los incon- Wood y Blinkhorn, 1988).
venientes y de las ventajas.
Dada la ausencia de supuestos mate-
máticos sobre los datos, los análisis esta-
Inconvenientes dísticos son más complicados. No pode-
mos emplear los mismos estadísticos
El mayor inconveniente del uso de las para analizar ambos tipos de pruebas.
pruebas de elección forzosa es que se Como veremos más adelante, esta con-
interpretan y se emplean de manera dife- clusión se debe de matizar por el número
rente. En concreto, una prueba de elección de factores y por la correlación entre los
forzosa que genera puntuaciones ipsativas factores.

182 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

Ventajas tos de la definición de ipsativo, forzar a


que la suma sea igual.
A pesar de las dos limitaciones ante-
riores, sin duda, hace pensar seriamente Las datos (Cross, 1996) parecen indicar
el hecho de que, las pruebas ipsativas que estas variables no tienen significado
deben tener grandes ventajas objetivas psicológico. Para las personas más criticas
para que haya una gran cantidad de per- con la estadística y sobre todo con el signi-
sonas y organizaciones que las sigan ficado psicológico de la media, esta con-
empleando. clusión no será en grado alguno sorpren-
dente.
El propósito de este apartado es mostrar
esas ventajas y la relación que hay con las Una de las mayores diferencias que
limitaciones previamente señalados. hemos visto entre ambos tipos de pruebas
es el punto de referencia. En las puntacio-
Pero en lugar de hacerlo de manera nes normativas esta forzado a cada varia-
general y sin fundamentos estadísticos, lo ble y en la ipsativas es relativa a las otras
referiremos a un ejemplo concreto de prue- variables. Lo que no se puede interpretar
ba ipsativa que es el APP © de Thomas es la mezcla de ambos.
International. Todas las descripciones de
las ventajas y características se mostrarán Por este motivo, nosotros hemos insisti-
en el último apartado. do en la distinción entre pruebas de elec-
ción forzosa, que dan puntuaciones ipsati-
vas “naturales” y puntuaciones ipsativas,
RELACIONES ENTRE AMBOS que pueden ser forzadas estadísticamente.
TIPOS DE MEDIDAS
Lo que no podemos hacer es convertir
Las relaciones entre ambos tipos de una puntación ipsativa en normativa, por-
medidas tiene un importante componente que hemos forzado una serie de grados de
estadístico, lo que implica que se pueden libertad y nos faltaría información para
hacer transformaciones entre uno y otro hacerlo correctamente.
tipo de puntuaciones.
En resumen, aunque el empleo de las
Nosotros haremos una rápida revisión medidas del Análisis del Perfil Personal
de estas transformaciones, pero pondremos (APP) exige precaución, la elección forzo-
el énfasis en los aspectos de la interpreta- sa no es una vía inválida para valorar a
ción psicológica. Que las puntaciones sean individuos aislados, en tanto lo que se haya
transformables no significa que sean igual- medido sea fiable y válido para ese indivi-
mente interpretables. duo. Por supuesto, este es el aspecto crítico
con el que se enfrentan todos los diseñado-
Tal y como hemos visto, hacer ipsativa res de escalas, ya sean éstas ipsativas o
una puntación originalmente normativa es referidas a la norma. Teniendo presentes
muy fácil. Sólo tenemos que restarle la estas precauciones y limitaciones ahora
medida de ese ítem. De este modo, tene- podemos dedicarnos a lo que el Análisis de
mos puntaciones que cumplen los requisi- Perfil Personal se propone medir, al modo

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 183
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

en que lo hace y al éxito demostrado mas como una prueba ipsativa de referen-
durante más de 25 años de aplicación. cia.

EL SISTEMA APP/APT DE THOMAS El APP de Thomas International,


INTERNATIONAL fundamento teórico

En esta sección, se describe brevemente El modelo teórico que guía todo el desa-
el Análisis del Perfil Personal de Thomas rrollo del APP es la teoría biopsicosocial
International, pero hay que recordar que no de William Marston. Esta teoría holística
es un instrumento de evaluación excluyen- poco conocida, percibe la conducta como
te. En realidad, debe incluirse dentro de un la respuesta biosocial necesaria de cual-
proceso conjunto que hace que tanto el quier individuo a los medios creados por
candidato como el entrevistador traten el las circunstancias externas y por otros indi-
problema de qué características laborales viduos. A su vez, estas respuestas modifi-
deben ser satisfechas por un trabajador efi- can lo que se percibe a continuación en las
ciente en un trabajo particular dentro de la interacciones humanas.
organización, con un jefe particular (por
extensión el equipo) y con una cultura Marston consideró que la conducta sur-
determinada. gía de la naturaleza intrínseca del medio,
que puede ser percibida por los seres
En las organizaciones, normalmente el humanos orientados hacia una meta como
superior inmediato y el responsable de un continuo, antagónico en un extremo y
RR.HH, contribuyen al proceso rellenando favorable en el otro. Estas percepciones
consensuadamente Formulario de Análisis producen lo que Marston denomina “fuer-
del Puesto de Trabajo (APT). Por otra zas vitales” o emociones. En medios anta-
parte, el candidato rellena el Análisis del gónicos, ya sean ecológicos o sociales, se
Perfil Personal (APP). Una vez que el necesitan formas de adaptación particula-
entrevistador ha compilado un perfil de las res para sobrevivir. En medios favorables,
cualidades ideales para el trabajo del APT, predominan otras conductas de adaptación.
éste se contrasta con el perfil aportado por Estas formas de adaptación son ajustadas
el candidato con el APP. más o menos por el organismo a través de
una dimensión conductual actividad –
Thomas International trabaja con la pasividad preferida o habitual, mediada
congruencia del perfil completo en lugar por emociones.
de puntuaciones aisladas para predecir,
mediante la evaluación de las personas, la A partir de la interacción de medios
probabilidad de éxito y satisfacción en el favorables – antagónicos con las reaccio-
trabajo de lo empleados o candidatos eva- nes de disposición actividad – pasividad
luados. de los individuos, Marston postuló cuatro
estrategias de supervivencia de adaptación
El objetivo de este documento es ana- básica, que resultan de los conjuntos car-
lizar la diferencia entre pruebas normati- tesianos formados por el continuo ambien-
vas e ipsativas, utilizando el APP de Tho- tal antagonista – favorable y la dimensión

184 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

conductual actividad – pasividad. Por representado esta formulación teórica en


definición, estas son adaptaciones activas la figura 1, donde se muestran los dos
y pasivas a medios rígidos y limitadores, ejes, las motivaciones y algunos de los
por una parte, y a circunstancias favora- adjetivos asociados con cada uno de los
bles y gratificantes, por otra. Hemos cuatro cuadrantes.

Ilustración 1
MODELO TEORICO DE MARSTON
SITU A CI N PER C IB ID A

H ostil,no am igable,antagonista
Imp ulsor Conformista

Com petitivo Cuidadoso

En rgico Sistem atico


D om inancia Preciso
Inquisitivo
C onformidad
Directo Exacto

Emp rendedor (+ PODER) (+POLITICA /NO R M A S ) Perfeccionista

Asertivo L gico

A DO PTA UN A POS TURA ACTIVA Y PO SITIVA


D A UN A RESPUESTA IN D ECISA Y CAUTELOS A
EN U N AM BIENTE HO STIL Y DE SF AVORABLE
AN TE UN A M BIEN TE ANTA G O N ISTA CO N E L
S E ENFREN TA A LA S S ITU ACIO NES CO N EL O BJETIVO DE AN U LAR LO S GRAD O S DE
O BJ ETIVO DE S UPERARLAS Y A SI EVITAR AN T A G O N ISM O Y ASI EVITAR PRO BLEM S
EL FRA CAS O O CON FLICT O S

ACTIVA PASIVA
PAS IVA

AD O PTA UN A POSTU RA ACTIVA Y PO SITIVA D A UN A RESPUESTA PASIVA ANTE UN A


CO N EL O BJETIVO D E SALIR DE UN A SITUA CIO N HO S TIL.INTEN T A M A N T ENERSE
SITUA CIO N DES FAV O RABLE Y LLEGAR A ESTA SITUA CIO N H A STA Q UE LA HO STILID AD
M S PRO PICIA Y FA V O RABLE UTILIZAN D O ACA BA Y DE ESTA FO RMA E VITAR LA
PERSU ASIO N Y EVITA N D O A SI EL RECH A ZO IN SEG URID AD

Influyente
E stabilidad Fiable
Persuasivo Influencia Prudente
(- RIT M O )
Am istoso (+PERSO N AS ) A mable
Locuaz Persistente
Comunicativo Buen oyente
Positivo Atento

A m igable, favorable

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 185
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

La psicología intercultural ha aportado, ducta presente tiene su explicación en la


un sólido núcleo de investigación que defi- inconsciencia pasada. Consideró que era
ne las estructuras ecológicas para la adqui- mejor buscar explicaciones de los motivos
sición de las habilidades sociales y cognos- en función de las situaciones y sentimien-
citivas, Berry y la mayoría de los tos contemporáneos.
psicólogos interculturales (para una visión
panorámica adecuada, véase Berry e Irvi- De esto se deduce que cualquier res-
ne, 1986) han apoyado y preparado duran- puesta inmediata a un conjunto de estímu-
te muchos años esta postura ecológica los estructurados, como los adjetivos que
general. describen a una persona en función de
características o cualidades que son comu-
El elemento critico diferenciador de esta nes a muchas personas, aportará una com-
teoría es la distinción en la elaboración de prensión de las respuestas actuales del
perfiles personales es la distinción entre el individuo sobre el rol percibido en este
“parecer” y el “ser”. En cuestionarios, contexto. El trabajo que Allport hizo sobre
declaraciones o informes propios, hechos los nombre de las cualidades fue investiga-
en respuesta de elección forzosa al estímu- do extensamente por los creadores del APP
lo, las palabras muestran más de lo que la para las descripciones de cualidades que
persona pueda imaginarse. conforman las cuatro dimensiones de
Marston. Esto no quiere decir que todas las
En síntesis, los creadores de los formu- cualidades que puedan haber sido medidas
larios trataron de combinar dos ideas bási- fueron incluidas en las cuatro interacciones
cas. En primer lugar, surgirían diferentes emocionales – ambientales básicas.
modelos de acuerdo con las percepciones
de los climas. Los ambientes hostiles evo- Puede consultarse (Thomas Internatio-
can una conducta diferente de la que evo- nal, 1981a) para una revisión completa del
can los ambientes amistosos. En segundo modelo y los trabajos posteriores para el
lugar, lo que los entrevistados dicen acerca análisis de los datos históricos de validez y
de sus percepciones de sí mismos y del fiabilidad (Thomas International, 1983b, c,
ambiente no siempre puede revelar la pro- d; 1986a, b; 1987a, b, c).
fundidad de su propio conocimiento de sí
mismo. Las respuestas a las preguntas pue- Mucho más importante que el marco
den estar influidas tanto por el deseo social teórico es la interpretación práctica que
como por el autoengaño y otros mecanis- nos puede ofrecer el sistema. El sistema
mos para ocuparse de las emociones. APP/APT ofrece tres gráficos, cada uno
nos da información.
Las ideas de Allport son importantes
para la comprensión de la razón fundamen- El sistema nos da información sobre la
tal que subyace al APP. Para Allport, exis- persona en tres escenarios. Por un lado
ten cualidades que son comunes a todos, y nos informa de cómo la persona está en la
conjuntos de cualidades que son específi- situación actual, en una situación de pre-
cas de los individuos. De acuerdo con este sión y la autoimagen de la persona. Esta
acento sobre la plasticidad del individuo, triple información es de gran utilidad para
se opuso a los que postulaban que la con- poder diferenciar qué elementos del com-

186 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

portamiento de la persona son estables Como hemos vista la utilidad potencial


(en el tiempo) y consistentes (recurrentes del sistema es grande en la medida que nos
en distintas situaciones). La Ilustración 2 aporta gran cantidad de información con
muestra un ejemplo real de una persona variedad de perspectiva temporal. Decimos
evaluada en estos tres escenarios, median- utilidad potencial porque antes será nece-
te las cuatro dimensiones de nuestro siste- sario verificar que la validez del sistema es
ma. la adecuada.

Ilustración 2
EJEMPLO DE GRAFICO

D iSC D iSC D iSC


20 17 19 15 0 0 0 0 20 17 19 15
12 1 1 16 9 11 7
16 10 9
15 9 11 1 1 2 2 15 8 10 6
8 9
14 5
14 8 10 13 7 8 4
12 7 3 3 6 7
12 3
10 7 9 2 10 5 5
6 2 4 4 2
8 4 9
9 4 8 3 3 1
6 7 5 2
3 3 7 2 0
8 5 1 1
5 6 5 5 -1
3 0
7 5 4 4 6 0
5 4 6 1 -1 -2
4
6 6 5 7 7 -1 -2 -3
4 0
3 3 7 8 -2 -3 -4
-2 -4 -5
5 3 8 8 -3 -3
4 9 6 -4 -5 -6
9 -4
3 2 10 -6 -5 -6 -7
2 9 -7
2 11 7 10 -7 -6 -8
1 10 -8 -9
2 12 -9 -7
1 1 13 8 11 -10 -8 -9 -10
0 9 11 -10
14 -11 -9 -11
1 15 10 -13 -11
0 11 12 12 -10 -12
16 -14 -12
0 0 13 13 -21 -19 -19 -16
21 19 19 16

La existencia de estos tres gráficos con- Datos psicométricos


cede una gran potencia predictiva a esta
prueba ipsativa porque como hemos visto Disponer de datos Psicométricos rele-
uno de sus puntos fuertes es la compara- vantes del Sistema APP/APT es una
ción intraindividual. Esta comparación no dimensión importante de este apartado. Se
se realiza únicamente entre las escalas, trata de poder confirmar estadísticamente,
como veíamos en nuestro ejemplo inicial, lo que los clientes están viviendo día a día,
sino que el caso exclusivo del APP además ya que cada uno de los países en los que
se puede hacer entre momentos temporales está operativa esta herramienta, puede ava-
y entre situaciones. lar, para tranquilidad de los usuarios, que

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 187
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

se han realizado los pertinentes análisis Esta característica, como hemos visto, es
para adaptarla a su población laboral. A propia de los modelos ipsativos ya que la
veces los análisis estadísticos se repiten en respuesta en un factor condiciona el resul-
el tiempo una vez que he transcurrido un tado en los factores restantes.
tiempo considerado como prudencial, para
repetir tales estudios matemáticos. Por ultimo, es relevante que se demues-
tre también el carácter bipolar de las
En la medida en que el objetivo de este dimensiones del APP. Los valores de la D
apartado es informar de los datos psicomé- y la I están correlacionados negativamente
tricos de la prueba, consideramos que es con la S y la C. Tal y como hemos visto en
necesario hacer un breve recorrido por los el modelo, la D y la I son activos en su
datos de otros países más relevantes. En polo positivo, en tanto que la S y la C son,
segundo lugar, presentaremos de manera pasivos, es decir negativos en el continuo
más extensa los datos propios para la bipolar.
población española.
Un análisis especialmente importante en
cualquier prueba se refiere a la fiabilidad
Otros países de la misma. En este caso, y para facilitar
la lectura sólo vamos a presentar los datos
Los primeros datos que vamos a mos- referidos al Reino Unido. Los datos com-
trar deben necesariamente estar referidos a pletos de todos los países se pueden con-
la estructura interna. Hemos descrito el sultar en (REF).
modelo teórico, pero ahora es necesario
demostrar que los datos confirman estos Los análisis de fiabilidad que vamos a
supuestos. presentar son los habituales, con cada fac-
tor analizado independientemente. Este
En la siguiente tabla se muestra las tipo de análisis no suele beneficiar a los
correlaciones entre las cuatro variables del valores que obtenemos de una prueba ipsa-
modo, para el grafico 3, para 6 muestras de tiva, pero no obstante nos permite compa-
países distintos. rar los datos con el resto de las pruebas.
Un análisis más fino de la fiabilidad de una
Tal y como se presentan en la tabla prueba ipsativa debería de considerar el
estos datos muestran que la estructura perfil conjunto en lugar de un análisis dife-
interna de la prueba es constante para renciado.
todos los países. Esto es de gran impor-
tancia a la hora de conceder credibilidad a En la Tabla 6 se ofrecen los resultados
la prueba, especialmente en aplicaciones de la fiabilidad para población inglesa.
internacionales o para uso su internacio- Estos datos demuestran que cada una de
nal en el caso de un tratamiento intercul- las escalas cumple los requisitos impuestos
tural de la información psicométrica reco- para las pruebas normativas. Hay que
gida. recordar que analizar la fiabilidad de esta
manera implica hacer una serie de asuncio-
Otro elemento a tener en cuenta es que nes que distorsionan e infravaloran la fia-
las variables están relacionadas entre si. bilidad real de las escalas ipsativas.

188 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

Tabla 5
TABLA DE CORRELACIONES ENTRE LOS FACTORES DEL DISC
EN SEIS PAÍSES

D I S C

Dominancia .03 -.65 -.51


Influencia -.50 -.58
Estabilidad .47
Conformidad
RUSIA: 600 sujetos

D I S C
Dominancia .11 -.70 -.60
Influencia -.31 -.57
Estabilidad .38
Conformidad
HOLANDA: 127 sujetos

D I S C
Dominancia .04 -.72 -.47
Influencia -.32 -.52
Estabilidad .28
Conformidad
TURQUIA: 214

D I S C
Dominancia -.09 -.73 -.50
Influencia -.31 -.44
Estabilidad .32
Conformidad
DINAMARCA: 539

D I S C
Dominancia .05 -.78 -.54
Influencia -.45 -.61
Estabilidad .46
Conformidad
USA: 1512

D I S C
Dominancia -.15 -.75 -.49
Influencia -.21 -.40
Estabilidad .24
Conformidad
REINO UNIDO: 4083

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 189
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

Tabla 6
RESULTADOS DE FIABILIDAD PARA LA POBLACIÓN INGLESA

Escala compuesta D I S C
Media APP -.2 1.9 .1 0
Desviación Típica APP 4.2 4.1 4.5 3.4

Media APP .8 1.2 .3 -.5


Desviación Típica APP 4.4 4.2 4.7 3.6

Test – Retest .78 .64 .64 .52

Nota: N= 1323.

Los datos se obtuvieron de población Además de estos datos, Thomas dispo-


británica, de un total de 123 empresas. ne a nivel internacional de datos sobre la
validez de constructo y la validez de cri-
Para nuestro propósito de predicción en terio. Son especialmente relevantes los
el contexto de RRHH es más la validez, ya estudios que correlacionan el APP con el
que requiere una fiabilidad previa. En 16PF y el OPQ que por razones obvias no
nuestro contexto de trabajo, la validez pre- reproducimos en este documento ya que
dictiva referida al rendimiento es el paso exceden el propósito de este trabajo en
previo inicial para determinar si una prue- particular.
ba es útil para su uso en un contexto labo-
ral determinado (tabla 7).

Tabla 7
VALIDEZ PREDICTIVA

Escala D I S C
El total de 1323 individuos .39 .25 .44 .14

798 con APT en la entrevista .48 .29 .56 .24

N=1323; 0.05, P<0.17


N=798; 0.05, P<0.22

190 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

Población española les eran mujeres), pertenecientes a 12


empresas (tabla 9).
Los datos españoles sobre la estructura
interna se muestran en la siguiente tabla. Las pruebas se aplicaron a personas que
Los resultados muestran que mantiene la llevaban en el mismo puesto un tiempo no
misma estructura que los datos internacio- inferior a un año y la diferencia entre el
nales (tabla 8). primer APP y el segundo, se realizó al

Tabla 8
TABLA DE CORRELACIONES ENTRE FACTORES PARA POBLACIÓN
ESPAÑOLA

D I S C
Dominancia -.05 -.69 -.53
Influencia -.37 -.51
Estabilidad .35
Conformidad
N= 3723 sujetos

Fiabilidad: cabo de 3 meses. Las muestras pertenecían


a empresas de Madrid y Barcelona prefe-
Los datos de fiabilidad están divididos rentemente.
en dos estudios. El primero fue llevado a
cabo entre los años 1992-1993. El numero En el segundo estudio los datos fueron
total de persona es de 84 (23% de los cua- obtenidos entre 1999 y el año 2000. El

Tabla 9
FIABILIDAD EN POBLACIÓN ESPAÑOLA

D I S C

Momento 1 Media .4 1.1 .2 .1


Desviación típica 4.1 4.2 4.3 3.6

Momento 2 Media .1 1.3 .4 0


Desviación típica 4.3 4.3 4.7 3.8

Test – Retest .81 .67 .62 .54

N= 84

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 191
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

número total de personas es de 375, de los sustantivos de cierta complejidad semánti-


cuales el 25% son mujeres; pertenecientes ca por frases descriptivas.
a 25 empresas (tabla 10).

Tabla 10
FIABILIDAD EN POBLACIÓN ESPAÑOLA

D I S C

Momento 1 Media -.73 .21 -.85 -.81


Desviación típica 4.59 3.20 4 3.29

Momento 2 Media .07 .14 -.04 -.58


Desviación típica 4.84 3.4 3.79 3.41

Test – Retest .89 .74 .76 .77

N= 375

Pruebas paralelas Los resultados obtenidos se muestran en


la tabla siguiente. Estos datos fueron obte-
Un segundo tipo de estudios se refiere a nidos en el estudio de validación llevado a
las pruebas paralelas de las que dispone cabo en el año 2000 (tabla 11).
Thomas Internacional. La primera de estas
pruebas es el APP PLUS. Este cuestiona- Las pruebas se aplicaron a personas que
rio se usa cuando a la persona le cuesta llevaban en el mismo puesto un tiempo no
entender los adjetivos empleados habitual- inferior a un año y la diferencia entre el
mente, sustituyendo algunos adjetivos o primer APP y el segundo, se realizó al

Tabla 11
CORRELACIÓN APP Y APP PLUS

D I S C

APP Media -.08 .57 .13 .23


Desviación típica 5,11 3,53 4,07 3,27

APP Plus Media -.43 -.34 .43 .05


Desviación típica 5.03 3.58 3.40 3.22

Test – Retest .78 .78 .74 .73

192 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

Tabla 12
CORRELACIÓN APP CASTELLANO Y APP EUSKERA

D I S C

Castellano Media -0.16 -2.16 .49 1.86


Desviación típica 3.44 2.88 3.09 3.14

Euskera Media -.83 -1.4 -.38 1.02


Desviación típica 3.89 3.27 3.9 3.28

N=113

cabo de 3 meses. Las muestras pertenecían partir del APT hicieron una escala likert,
a empresas de Madrid y Barcelona prefe- previamente reajustada y después de
rentemente. realizar la entrevista se procedió a su
evaluación, a la vez que se aplicaba el 2º
La segunda prueba desarrolla es el APP APP.
en euskera. Este estudio se llevo a cabo
durante el año 2004. Los resultados se Todos los sujetos, a la vez que se hacía
muestran en la tabla 2. la 2ª aplicación re-test, fueron evaluados
por observación en su trabajo usando las
descripciones del APT. Estos resultados,
Validez en principio, superan a los valores de la
Tabla 7.
La primera estimación de la validez es
la Observación Conductual. Los resultados
obtenidos se muestran en la Tabla 13.
Conclusiones
Respecto a los 84 personas entrevis-
tados (23% mujeres, 77% hombres) per- De acuerdo con los resultados de los
tenecientes a 12 empresas, los jefes a puntos anteriores, se puede concluir:

Tabla 13
VALIDEZ APP-ENTREVISTA EN POBLACION ESPAÑOLA

ESCALAS D I S C

Sobre toda la muestra 84 sujetos .38 .31 .42 .23

N= 84; 0.05 p < 0.19

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 193
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

Tabla 14
VALIDEZ APP-OBSERVACIÓN EN POBLACIÓN ESPAÑOLA

ESCALAS D I S C

Sobre 46 sujetos con APT y entrevista .49 .32 .60 .28

N= 46

a) Que la validez y la fiabilidad son de ambas es común, evaluar a la persona,


estadísticamente significativas para la la diferencia radica en como cada una res-
muestra española, e incluso superan los ponde al criterio de rentabilidad (dentro de
valores de otros países. la cual es crítica la validez).

b) Que el concepto DISC de Thomas Las pruebas normativas funcionan de


International a través de los análisis manera muy eficiente cuando cumplen los
APP/APT, son perfectamente transferibles supuestos que hemos analizado (las cate-
a la población española. gorías son continuas, nivel de medida de
intervalo, independencia de las varianzas
c) En consecuencia se puede considerar error y nivel de distribución), pero hemos
que la comercialización del sistema visto que en determinadas situaciones, y
APP/APT cumple con los estándares de especialmente en contextos de selección,
calidad psicométricos requeridos para estos supuestos pueden llegar a distorsio-
pruebas de este tipo nar las puntaciones de una persona en una
desviación típica. Esta diferencia es más
que suficiente para incluir en la siguiente
Conclusiones fase a un mal candidato o excluir a uno
bueno.
Llegados a este punto es bueno hacer
una revisión crítica del significado que Esto no quiere decir, que siempre que
tiene para nosotros la información presen- empleamos pruebas normativas comete-
tada y comentada en este articulo. Espe- mos sistemáticamente errores, sino que
cialmente porque seguro que queda en el debemos de ser conscientes de que en cier-
aire la siguiente reflexión: “Estas teorías tas ocasiones el riesgo es alto, y puede
están muy bien, pero ¿cómo contribuye a inducir a pérdidas de precisión de una des-
solucionar mis problemas de evaluación de viación típica.
las personas?”. Vamos a intentar resumir
nuestra posición. En cambio, las pruebas ipsativas, como
el APP, no hacen supuestos tan rígidos,
Las pruebas de elección múltiple y las por lo que la información intraindividual
pruebas de elección forzosa son claramen- que obtenemos corre menos riesgo de
te distintas. Ambas tienen áreas de aplica- sufrir variaciones graves; lo que evita que
ción, formas de utilización y por tanto cometamos errores estadísticamente signi-
modos de utilización distintas. El objetivo ficativos aunque no se cumplan los supues-

194 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

tos de las pruebas normativas. No obstante, que ver entre sí, que disponer del mismo
las pruebas ipsativas son algo más frágiles número de escalas y además relacionadas.
en la comparación interindividual cuando Para el análisis de las puntaciones lo ideal
analizamos dimensiones aisladas. Afortu- es mejor que las escalas sean pocas, muy
nadamente en el caso de la selección de relacionadas y bipolares.
personal, la toma de decisiones siempre
implica que la comparación de todo el per- Para maximizar los beneficios de una
fil de varias personas, por lo que no se prueba ipsativa debemos de analizar en
muestran perdidas de potencia en las prue- detalle el modo en que ha resuelto la
bas ipsativas. mayor dificultad de este paradigma de eva-
luación, que es la comparación entre indi-
Si consideramos que la situación en la viduos. Para poder confiar plenamente en
cual vamos a evaluar puede tener el riesgo una prueba de elección forzosa requiere
de cometer errores o poner en peligro los que tenga resuelta las herramientas de
supuestos de las pruebas normativas, ento- comparación intraindividual.
ces es recomendable emplear pruebas de
tipo ipsativo, pero que hayan probado Por último, hemos mostrado como el
poseer las siguientes características. sistema APP/APT cumple los requisitos
exigidos a las pruebas ipsativas y puede
En primer lugar, la prueba ipsativa debe resolver esos problemas en términos de
tener al menos la misma validez que las validez, rentabilidad de la inversión y
pruebas normativas, sino más. De nada nos características psicométricas de las escalas.
sirve una prueba que no incumpla ningún
supuesto si luego no dispone de validez Con respecto a los datos de fiabilidad y
suficiente, porque jamás alcanzaremos validez, tanto para población española
nuestro objetivo de rentabilidad. como para la población internacional,
demuestra que los valores son altos y sig-
El segundo criterio crítico es el número nificativos. Esto era esperable por la
de escalas. Es deseable que la prueba tenga ausencia de fuentes de error, pero era nece-
un numero bajo de escalas. Cuando el sario probarlo. Este dato todavía cobra más
número es alto, se pierden las ventajas valor tendiendo en cuenta que las muestras
estadísticas propias de las pruebas de elec- utilizadas se han obtenido en situaciones
ción forzosa. Tener más escalas no mejora cotidianas de procesos de selección, eva-
la predicción, como hemos visto la puede luación y desarrollo análogas a las que
incluso perjudicar en ambos tipos de prue- hace todos los días cualquier profesional
bas. Además es probable que la presencia de RRHH. Todos sabemos, aunque sólo se
de un mayor número de escalas reduzca la por simple observación, que esos candida-
ventaja de tiempo que supone hacer una tos poco o nada tienen que ver con los
prueba de elección forzosa. estudiantes de cualquier universidad o
escuela de negocios donde son utilizados
El análisis del número de escalas es per- casi como un grupo experimental.
tinente ligarlo a la correlación que hay
entre las distintas escalas. No es lo mismo En definitiva, creemos que el sistema
contar con cuatro escalas que no tiene nada APP/APT de Thomas International es una

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 195
La tecnología de evaluación ipsativa y el sistema APP-APT de Thomas International

prueba ipsativa de elección forzosa, sólida, Irvine, S.H.; Mettam, D. y Syrad, T.


rápida con una excelente capacidad predic- (1994). Valid or more valid? Keys to
tiva y que ha sido desarrollada para servir understanding personal appraisal practices
de apoyo eficaz a la gestión racional de los al work. Current Psychology, Spring 1994,
recursos humanos en las organizaciones. Vol 13, nº1, 27-59.

Johnson, C.E., Wood, R. y Blikhorn, S.F.


REFERENCIAS BIBLIOGRÁFICAS (1988). Spuriouser and spuriouser: the use
of Occupational Psychology. 57: 67-76.
Baron, H. (1995). Strengths and limita-
tions of Ipsative Measurement. Journal of Karpatschof, B. y Elkjaer, H. (1999).
Occupational and Organisational Psycho- The reliability of Ipsative scores- Exami-
logy. ned by espiral data and simulation study.
Research report number 1. Departament of
Barrett, P. (1999). Test Design, Measu- Psychology. Universty of Copenhagen.
rement and Assessment. En http://www.
liv.ac.uk/pbarrett/paulhome.htm Kline, P. (1983). Personality: measure-
ment and theory. London. Hutchinson.
Bartram, D. (1996). The relationship
between ipsatized and normative measures Kline, P. (1998). The new Psychome-
of personality. Journal of Occupational and trics: Science, Psychology and Measure-
Organisational Psychology, 69, 25-39. ment. Routledge.

Berry, J.W. y Irvine, S.H. (1986). Bri- Lord, F. M. y Novick, M. R. (1968) Sta-
colage: savages do it daily. In R.J. Stern- tistical Theories of Mental Test Scores.
berg y R.K. Wagner, (Eds.). Practical Inte- Reading, Mass.: Addison-Wesley.
lligence. New York: Cambridge.
Marston, W.M. (1928). Emotions of
Catell, R. B. (1988) The data box: Its normal people. New York: Harcourt,
ordering of total resources in terms of pos- Brace.
sible relational systems. In J.R. Nesselroa-
de y R. B. Catell (Eds.) Handbook of mul- Michell, J. (1990). An introduction to
tivariate experimental psychology. NY: the logic of Psychological Measurement.
Plenum Press. Lawrence Erlbaum.

Closs, S. J. (1996). On the factoring and Ones, D. S., Viswesvaran, C. y Korbin,


interpretation of ipsative data. Journal of W. P. (1995) Meta-analyses of fakability
Occupational and Organisational Psycho- estimates: Between subjects versus within
logy, 69, 41-47. subjects designs. Paper presented at the
10th annual meeting of the Society of
Hendrickson, T.M. (Undated). Personal Industrial and Organisational Psychology,
profile analysis: a technical manual: Mar- Orlando, FL.
low: Thomás International Management
Systems (Europe) Ltd. Thomas International (1981a). Personal

196 Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2
J. Rodríguez González

Profile Analysis (Revised) Marlow: Tho- tional Management Systems (Europe)


mas International Management Systems Ltd.
(Europe) Ltd.
Thomas International (1986b). TIRR-3.
Thomas International (1981b). Human Concurrent validity among instruments
Job Analysis (Revised) Marlow: Thomas used by industry for personnel purposes,
International Management Systems (Euro- 16 PF, OPQ and PPA Part.2 (B. Cripps y
pe) Ltd. E. Geelhoed). Marlow: Thomas Internatio-
nal Management Systems (Europe) Ltd.
Thomas International (1983a). Intervie-
wing and screening guide. Marlow: Tho- Thomas International (1987a). TIRR-2.
mas International Management Systems Description of 4083 PPA results: correla-
(Europe) Ltd. tions and distributions (B. Cripps y E.
Geelhoed). Marlow: Thomas International
Thomas International (1983b). Advan- Management Systems (Europe) Ltd.
ced analysis course manual. Marlow: Tho-
mas International Management Systems Thomas International (1987b). TIRR-4.
(Europe) Ltd. Description of 5242 PPA results: correla-
tions and distributions (B. Cripps y E.
Thomas International (1983c). Selecting Geelhoed). Marlow: Thomas International
effective people. Marlow: Thomas Interna- Management Systems (Europe) Ltd.
tional Management Systems (Europe) Ltd.
Thomas International (1987c). TIRR-6.
Thomas International (1983d). PPA Predictive validity, illusion or reality (B.
advanced profile guide. Marlow: Thomas Cripps y E. Geelhoed). Marlow: Thomas
International Management Systems (Euro- International Management Systems (Euro-
pe) Ltd. pe) Ltd.

Thomas International (1986a). TIRR-1. Viswesvaran, C. y Ones D. S. Meta-


Concurrent validity among instruments Analyses of Fakability Estimates: Implica-
used by industry for personnel purposes, tions for Personality Measurement Educa-
16 PF, OPQ and PPA Part.1 (B. Cripps y tional and Psychological Measurement.
E. Geelhoed). Marlow: Thomas Interna- 1999; 59: 197-210.

Revista de Psicología del Trabajo y de las Organizaciones, 2004, vol. 20 n.º 2 197

S-ar putea să vă placă și