Sunteți pe pagina 1din 39

TEMA 1.

INTRODUCCIN AL CONCEPTO DE PSICOMETRA


Constante de Weber
Umbral mnimo dap Desarroll los mtodos psicofsicos indirectos Su funcin representa la relacin entre los 2 continuos a los que se refiere el escalamiento: fsico y psicolgico

Funcin de Fechner

MTODOS DE ESCALAMIENTO PSICOFSICO

Introduce los concpetos umbral absoluto y umbral diferencial

Mtodo de los lmites o cambios mnimos: el experimentador modifica la intensidad Mtodo de ajuste o error promedio: el sujeto modifica la intensidad Mtodo de los estmulos constantes: el umbral absoluto es la magnitud percibida el 50% de las ocasiones

Mtodos:

Desarroll los mtodos directos Trata de encontrar una fucnin que relacione estmulos y respuestas
Emparejamiento de magnitudes Emparejamiento de razones Emparejamiento de intervalos Escalas de categoras o clasificacin

Funcin potencial de Stevens

Mtodos

Ley del juicio comparativo o mtodo de las comparaciones binarias Thurstone Ley del juicio categrico o mtodo de intervalos sucesivos, aparentemente iguales y de ordenacin de rasgos

MTODOS DE ESCALAMIENTO PSICOLGICO

Guttman Nuevas formas de escalamiento psicolgico Coombs

Escalamiento de respuestas: escala de entrelazamiento

T del despliegue

ORGENES Y DESARROLLO DE LOS TESTS

Primeros tests mentales


Binet y Simon

Primeros tests de inteligencia

Tests colectivos

Bateras de aptitud mltiple


Batera de aptitudes mentales primarias de Thurstone

Tests de personalidad

Cattell

Terman

Stern

Yerkes

Kraepelin

Rorschach

1 escala de inteligencia

EM

CI = EM/EC x 100

Tests alpha y beta

Test de asociacin libre

Test proyectivo de las manchas de tinta

T clsica

Modelo lineal de Spearman X = V + E

TEORAS DE LOS TESTS

T de la generalizabilidad de Cronbach

Tiene en cuenta todas las posibles fuentes de error e intenta diferenciarlas mediante ANOVA

T de la respuesta al tem

Sujetos e tems son independientes

TEMA 2. PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA


Dominio de conductas

Contenido

Dominio de contenido (en los TRC)


Dos alternativas Eleccin mltiple EMparejami ento Formato cloze o incompleto Escalas de clasificacin Listados

tems de eleccin

ESPECIFICACIN DE LAS CARACTERSTICAS DEL TEST

Formato de los tems


Longitud del test
tems de construccin
Test de velocidad

Desrespue sta corta De respuesta extensa o ensayo

Caracterstica s psicomtricas de los tems

Nivel de dificultad Homogenei dad

Test de ejecucin mxima (de potencia) Test de ejecucin tpica

Capacidad de discriminacin

TEMA 3. TCNICAS PARA LA CONSTRUCCIN DE ESCALAS DE ACTITUDES


Variabilidad perceptual de los sujetos

Se basa en
Limitaciones para percibir las diferencias de magnitud entre 2 estmulos Existe un cotinuo psicolgico subjetivo, se origina un proceso discriminante, un estmulo presentado varias veces no origina siempre el mismo proceso discriminante, se puede hacer una distribucin de los valores subjetivos ajustada a la distribucin normal

Supuestos bsicos

MODELO ESCALAR DE THURSTONE

Ley del juicio comparativo o mtodo de las comparaciones binarias

Diferencia discriminante: comparar cada estmulo con todos los dems t decir cul es el preferido

Asignar cada estmulo a una categora en funcin del grado de atributo

Ley del juicio categrico


Mtodo de los intervalos aparentemente iguales
Calcular valores escalares de los estmulos (mediana)

Mide el significado connotativo (afectivo o subjetivo) de los estmulos


Conceptos: estmulos ha evaluar

Formato de la escala
Escalas bipolares: para evaluar el significado de los conceptos. Se suelen dividir en 7 categoras
Si se clasifica el concepto en la categora media: no hay asociacin i relacin semntica entre el concepto y la escala

DIFERENCIAL SEMNTICO DE OSGOOD

Criterio de la composicin factorial

Que cada factor est representado, al menos, por 4 o 6 escalas bipolares

Espacio semntico: cirerios de seleccin de escalas

Criterio del grado de relevancia para la evaluacin del concepto

No incluir escalas poco relevantes

Criterio de la estabilidad semntica de la escala

ESCALOGRAMA DE GUTTMAN

Ordenacin de sujetos y estmulos en un continuo (escala de entrelazamiento )

Mtodo centrado en la respuesta

Permite establecer la unidimensionali dad del conjunto de datos mediante una escala acumulativa perfecta (matriz triangular)

Evaluacin del error

Este modelo no lleva implcita ninguna T del error

Uso del Coeficiente de reproductividad: grado de ajuste entre los datos obtenidos empricamente y el modelo terico

Si CR igual o mayor que 0'90 los datos se ajustan al modelo

TEMA 4. LA FIABILIDAD DE LAS PUNTUACIONES

10

TESTS PARALELOS: CONDICIONES DE PARALELISMO

1er supuesto: las puntuaciones verdaderas son iguales en ambos tests

2 supuesto: la varianza de los errores de medida es la misma en ambos tests

Deducciones

La media de las puntuaciones de 2 tests paralelos es la misma

Las varianzas de las puntuaciones son iguales

La correlacin entre las puntuaciones empricas de los 2 tests es igual al cuadrado de la correlacin entre puntuaciones empricas y verdaderas

En 2 o ms tests paralelos las intercorrelaciones entre cada 2 de ellos son iguales

11

Error de medida

Diferencia entre las puntuaciones empricas y verdaderas

Error de estimacin de la puntuacin verdadera

Diferencia entre la puntuacin verdadera y la pronosticada por la regresin.

TIPOS DE ERRORES DE MEDIDA


Error de sustitucin
Error que se comete al sustituir las puntuaciones del test X1 por las obtenidas en un test paralelo X2 Diferencia entre puntuaciones obtenidas en un test (X1) y las pronosticadas en ese mismo test (X1) a partir de una forma paralela X2

Error de prediccin

12

Longitud del test

Ecuacin SpearmanBrown (cuando se quiere aumentar la longitud del test n veces) Cuanto ms homogneo el grupo, menor es el coeficiente de fiabilidad y la desviacin tpica de las puntuaciones empricas

FACTORES QUE AFECTAN A LA FIABILIDAD

Variabilidad de la muestra

Caractersticas de los tems

13

FIABILIDAD COMO EQUIVALENCIA Y COMO ESTABILIDAD DE LAS MEDIDAS

Mtodos basados en la estabilidad para calcular el coeficiente de fiabilidad

Mtodo de las formas paralelas

Mtodo testretest

Se calcula el coeficiente de correlacin de Pearson entre 2 formas paralelas

El coeficiente de fiabilidad obtenido se llama coeficiente de equivalencia

Se aplica el mismo test en 2 momentos diferentes

El coeficiente de fiabilidad obtenido se llama coeficiente de estabilidad

14

LA FIABILIDAD COMO CONSISTENCIA INTERNA

Mtodos basados en la divisin del test en 2 mitades

Mtodos basados en la covariacin de los tems

Coeficientes basados en el anlisis factorial de los tems


Coeficientes Theta y Omega: son indicadores de la consistencia interna de los tems de un test y una aproximacin al coeficiente Alfa

Ecuacin de SpearmanBrown de 2 mitades paralelas

Frmula de Rulon: cuando, no siendo las 2 mitades estrictamente paralelas, podemos considerarlas equivalentes

Frmula de GuttmanFlanagan: equivalente a Rulon pero ms sencilla

Coeficiente Alfa de Cronbach: indicador de la consistencia interna. Expresa la fiabilidad en funcin del n de tems y de la proporcin de la varianza total del test debida a la covariacin entre los tems. A mayor covariacin mayor fiabilidad.

KR20 y KR21
Ecuaciones de KuderRichardson: cuando los tems son dicotmicos

Coeficiente Beta de Raju: para tests compuestos por subtests, se aplica cuando no se conocen las puntuacion es en los tems

15

Desigualdad de Chebychev

Cuando no se hace ningn supuesto sobre la distribucin de las puntuaciones empricas o de los errores Asume una distribucin normal de los errores de medida (con media 0 y varianza S2e) y de las puntuaciones empricas condicionadas a un determinado valor de V Mientras que la correlacin entre las puntuaciones verdaderas y los errores de medida es igual a cero (rVE = 0); la correlacin entre las puntuaciones empricas y los errores de medida se ve afectada por los errores Valor mximo cuando la fiabilidad del test es nula (rXX = 0) Puntuaciones empricas = Errores

ESTIMACIN DE LA PUNTUACIN VERDADERA DE LOS SUJETOS EN EL ATRIBUTO DE INTERS

No se puede calcular la puntuacin verdadera exacta pero s establecer el intervalo confidencial

Distribucin normal de los errores

Modelo de regresin
Valor mnimo cuando la fiabilidad del test es perfecta (rXX = 1) Punt. Empricas = Punt. Verdaderas

El intervalo de confianza se hace sobre la puntuacin verdadera estimada por regresin lineal

16

TEMA 5. LA FIABILIDAD EN LOS TESTS REFERIDOS AL CRITERIO

MTODOS PARA CALCULAR LA FIABILIDAD DE LOS TRC

Mtodos que requieren 2 aplicaciones del test

Mtodos que requieren una sla aplicacin del test

Coeficiente de Hambleton y Novick

Coeficiente Kappa de Cohen

ndice de Crocker y Algina

Mtodo de Huynh

Mtodo de Subkoviak

Coeficiente de Livingston

17

LONGITUD DEL TEST

Modelo de Millman

Modelo binomial. Considera la proporcin esperada de tems que un sujeto puede contestar correctamente para ser considerado apto y el error mximo a tolerar.

Muestra aleatoria de tems dicotmicos

La probabilidad de una respuesta correcta por parte de un sujeto es constante para todos los tems del test Las respuestas a los tems son independientes unas de otras

Supuestos del modelo:

Los errores se ajustan al modelo binomial.

18

Coeficiente de Hambleton y Novick

Supone la utilizacin de la proporcin de sujetos que consistentemente son clasificados dentro del grupo de maestra o no maestra como un ndice de fiabilidad de un test. Elimina del valor de la proporcin de sujetos clasificados consistentemente el valor de la proporcin de clasificacin consistente esperada por azar

NDICES DE ACUERDO CON 2 APLICACIONES DEL TEST (CLCULO DE FIABILIDAD)

Coeficiente Kappa de Cohen

Proporciona una medida de la consistencia de clasificacin de los sujetos independientemente del posible valor esperado por azar Este valor oscila: Entre 1 (fiabilidad perfecta) y 0 (atribuida al azar) Puede expresarse en funcin de las frecuencias absolutas Alternativa al Coeficiente Kappa

ndice de Crocker y Algina

Se basa en que la probabilidad mnima de una decisin consistente es 0.50 Tiene lugar si las puntuaciones del test son estadsticamente independientes y el punto de corte est en la mediana

19

Un solo test y una sola aplicacin: procedimiento matemtico sofisticado para estimar la consistencia de clasificacin.

Mtodo de Huynh
Este mtodo presupone que la distribucin de puntuaciones es aproximadamente normal y es adecuado cuando el nmero de tems es superior a 8 y la razn entre la media de las puntuaciones de los sujetos en el test y el nmero de tems oscila entre 0,15 0,85.

NDICES DE ACUERDO CON UNA SLA APLICACIN DEL TEST

Mtodo de Subkoviak

Procedimiento con una sola aplicacin cuando no es posible establecer una forma paralela de un test, por lo que simulan las puntuaciones de una segunda forma paralela al test.

Coeficiente de Livingston

A diferencia de los anteriores, considera los errores cometidos al clasificar a un sujeto en el grupo que no le corresponde. Estima ms importantes los errores de clasificacin de los sujetos ms distanciados del punto de corte de aquellos que estn ms cerca del punto de corte

20

MTODOS PARA ESTIMAR EL PUNTO DE CORTE EN LOS TRC

Mtodos valorativos

Mtodos combinados

Mtodos de compromiso

Mtodo Nedelsky

Mtodo Angoff

Mtodo Ebel

Mtodo Jaeger

Mtodo del grupo lmite (Zieky y Livingstone)

Mtodo de los grupos de contraste

Mtodo de Beuk

Mtodo de Hofstee

Se utiliza para fijar el punto de corte en los test de competencia mnima. Se utiliza en el mbito acadmico con test compuestos por tems de eleccin mltiple

Variante del mtodo Nedelsky, se puede aplicar a toda clase de tems (no slo a los de eleccin mltiple)

Similar al mtodo Angof. Los jueces evalan globalmente desde una doble perspectiva: la dificultad del tem (fcil, medio y difcil) y su relevancia (esencial, importante, aceptable y dudoso)

Otra variante del mtodo Angoff

Los jueces, por acuerdo, definen tres niveles de competencia (competente, lmite y no competente). Despus los jueces seleccionan a los sujetos lmite y se les aplica el test.

Los jueces clasifican a los sujetos en dos grupos (los que son competentes y los que no lo son) y se les administra el test

21

TEMA 6. VALIDEZ DE LAS INFERENCIAS I


Un test era vlido en la medida en que existiera correlacin entre las puntuaciones obtenidas por los sujetos en el test y las obtenidas en el criterio externo

Validez predictiva

Validez relacionada con criterios externos

Validez concurrente

La recogida de la informacin tanto del test como del criterio se hace simultneamente

CONCEPTO DE VALIDEZ

Validez retrospectiva

Cuando se puede obtener la medida del criterio con anterioridad a la del test

Validez de contenido

El test en s mismo constituye su propio criterio

Validez relacionada con criterios internos


Validez de constructo
Para garantizar que las conductas elegidas como indicadores del constructo, lo son realmente

22

VALIDACIN DEL CONTENIDO

Objetivo: Analizar hasta qu punto los elementos o tems que componen un test son una muestra relevante y representativa

En los TRC y tests de rendimiento acadmico, las puntuaciones se suelen utilizar para hacer inferencias sobre el grado en que los sujetos dominan un campo de conocimientos (dominio), no para hacer inferencias sobre conductas externas al test o sobre el constructo medido

La forma tpica de llevar a cabo un estudio de validacin de contenido, es utilizando un grupo de expertos (juicio subjetivo)

Representatividad: grado en que se han cubierto las especificaciones del dominio, en cuanto a contenidos y a objetivos propuestos

23

VALIDACIN DEL CONSTRUCTO

Proceso que permitir obtener evidencia acerca de la capacidad del test para medir el constructo

Trata de garantizar cientficamente que la variable que el test pretende medir es una variable aceptable y consistente en el mbito terico

Es necesario estudiar las relaciones entre: el constructo y las conductas observables representativas del constructo, el constructo y otros constructos y las conductas tomadas como indicadores del constructo y las puntuaciones obtenidas por los sujetos en el test

Los estudios de validacin de constructo se centran en el anlisis de la estructura del test

24

Matriz multimtodomultirrasgo

Permite el anlisis de la estructura externa del test). Se intenta medir un mismo constructo mediante distintos procedimientos y distintos constructos mediante el mismo procedimiento Tcnica ms utilizada para poner a prueba las hiptesis planteadas a cerca de la estructura externa del constructo y las relaciones del mismo con otras variables
Exploratorio (no se establecen hiptesis previas acerca del nmero de dimensiones, es la propia tcnica la que nos aportar esta informacin) Confirmatorio (se establecen a priori hiptesis, y mediante las tcnicas oportunas se comprueba si se pueden aceptar las hiptesis propuestas)

MTODOS PARA LA VALIDACIN DEL CONSTRUCTO

Anlisis Factorial

Enfoques

Validez convergente: cuando en un mismo factor se agrupan mltiples indicadores del constructo

Validez divergente: cuando en el anlisis se han obtenido medidas de otros constructos y estas aparecen agrupadas en distintos factores

25

Objetivo: evaluar la hiptesis de relacin entre test y criterio


Medidas correlacionales (coeficiente de validez, de determinacin, de alineacin, etc.) Medidas de error en la prediccin (errores de estimacin) Validez predictiva (los tests se van a utilizar para la seleccin, clasificacin o colocacin de personas en determinados puestos) Validez concurrente (utilizar los test para hacer un diagnstico. La medida del criterio se obtiene a la vez que la del test) Un nico test predictor y un solo indicador del criterio: la correlacin y el modelo de la regresin lineal simple. Segn la medida (Pearson, biserial, coeficiente phi, etc.) Varios predictores y un solo indicador de criterio (cuando se utiliza una batera de tests para un nico criterio): la correlacin y la regresin lineal mltiple Varios predictores cuantitativos y varios indicadores del criterio cuantitativos: la regresin lineal mltiple y la correlacin cannica (dificultad para interpretar resultados) Procedimientos basados en la teora de decisin (validez y utilidad en las decisiones): Se basan en diferentes mtodos para optimizar las decisiones realizadas con el test: Teora de la utilidad multiatributo

ndices utilizados

VALIDACIN REFERIDA AL CRITERIO

Perspectivas

Procedimientos estadsticos

26

Correlacin de Pearson Correlacin Biserial Correlacin Biserial puntual Coeficiente Coeficiente Biserial

X e Y variables continuas

X continua e Y dicotomizada

X continua e Y dicotmica

El coeficiente de validez

X dicotmica e Y dicotmica

X dicotomizada e Y dicotmica Tanto X como Y son variables continuas que se han dicotomizado artificialmente. Clculo muy laborioso Conocido el grado de asociacin entre el test y el criterio, se puede utilizar el modelo de regresin para hacer pronsticos Mediante el modelo de regresin se intenta buscar una ecuacin lineal que haga mnimos los errores de pronstico Varianza comn o asociada entre el test y el criterio Alude a la inseguridad o el azar que afecta a los pronsticos Representa la proporcin de seguridad en los pronsticos (o el porcentaje si se multiplica por 100)

VALIDACIN CON UN NICO PREDICTOR Y UN SOLO INDICADOR DEL CRITERIO

Correlacin Tetracrica

Modelo de regresin lineal

Coeficiente de determinacin (CD) Interpretacin de la evidencia obtenida Coeficiente de alienacin (CA)

Coeficiente de valor predictivo (CVP)

27

TEMA 7. VALIDEZ DE LAS INFERENCIAS II

El coeficiente de validez mltiple

Correlacin Mltiple entre las puntuaciones obtenidas por la muestra en la variable criterio y las obtenidas en el conjunto de las variables predictoras

Se traduce en ecuaciones de un plano (no de una recta como en la simple) o hiperplano si son ms de dos variables predictoras

Puntuaciones directas y diferenciales: planos paralelos Puntuaciones diferenciales y tpicas: pasan por el origen de las coordenadas
Error de estimacin: diferencia entre la puntuacin obtenida en el criterio y la pronosticada mediante la ecuacin de regresin (Y Y) Intervalos de confianza: la distribucin de los errores de estimacin se ajusta a una distribucin normal, cuya desviacin tpica viene dada por el error tpico de estimacin mltiple

VALIDACION CON VARIOS PREDICTORES Y UN SOLO INDICADOR DEL CRITERIO

Modelo de regresin lineal mltiple


Varianza residual o varianza error y error tpico Coeficiente de determinacin mltiple (CD)
Cuanto ms alto sea el coeficiente de validez, ms exacta es la estimacin. Pero el coeficiente de validez no es perfecto y est afectada por el error de estimacin Varianza comn o asociada entre el criterio y las variables predictoras Representa las puntuaciones en el criterio que no se puede predecir a partir de las variables predictoras Proporcin o porcentaje de seguridad con que se hacen los pronsticos

Interpretacin del coeficiente de validez mltiple

Coeficiente de alienacin mltiple (CA) Coeficiente de valor predictivo mltiple (CVP)

28

Coeficiente Kappa de Cohen

Evala la consistencia o acuerdo entre las decisiones adoptadas a partir de las puntuaciones en el predictor (test) y el criterio (rendimiento)

Proporcin clasificaciones correctas

ndices de validez

Sensibilidad

Proporcin de sujetos seleccionados en el test respecto al total que tuvieron xito en el criterio

Especificidad

Proporcin de sujetos correctamente rechazados en el test respecto al total de no aptos en el criterio (valor mximo 1)

VALIDEZ Y UTILIDAD DE LAS DECISIONES

Razn de eficacia

Proporcin de aspirantes seleccionados en el test con buen rendimiento en el criterio

Razn de idoneidad

Proporcin de sujetos que rinden bien en el criterio

ndices de seleccin
Razn de seleccin
Proporcin de sujetos aptos en el test

29

Modelo Compensatorio (aditivo): a cada sujeto se le asigna una nica puntuacin global (los sujetos pueden compensar las bajas puntuaciones). La forma adecuada de otorgar una puntuacin global es mediante el modelo de regresin

MTODOS DE SELECCIN

Modelo conjuntivo: se fijan de antemano unos mnimos en cada una de las pruebas. Slo se seleccionan los sujetos que hayan superado esos mnimos en todas las pruebas

Modelo disyuntivo: slo se exige superar un determinado nivel de competencia en algn de los predictores

Modelo conjuntivo compensatorio: se aplica el modelo conjuntivo y se seleccionan los sujetos que superan los mnimos en cada uno de los predictores. A continuacin se les aplica el modelo compensatorio de forma que queden ordenados segn su puntuacin global. Para efectuar la seleccin, se puede elegir a los mejores o establecer un PC

Modelo disyuntivo compensatorio (despus de aplicar el modelo disyuntivo se aplica el compensatorio)

30

ESTIMAR LA EFICACIA DE UNA SELECCIN

Mediante la razn de eficacia (proporcin de personas seleccionadas que tienen xito en el criterio)

Mediante el modelo de regresin (si se verifican los supuestos, permite determinar la probabilidad de que los seleccionados tengan xito en el criterio)

31

TEMA 8. ANLISIS DE LOS TEMS

DIFICULTAD DE LOS TEMS

Para cuantificar la dificultad de los tems dicotmicos o dicotomizados se utiliza la proporcin de sujetos que han respondido correctamente al tem (depende de la muestra utilizada): ID = A / N (Oscila entre 0 y 1) A = nmero de sujetos que aciertan el tem. N = nmero de personas que intentan responder el tem. Cero indica que ningn sujeto lo ha acertado (difcil) / Uno que todos lo ha acertado (fcil)

El ndice de dificultad est directamente relacionado con la media y la varianza del test

Correccin de los aciertos por azar En tems de eleccin mltiple, se debe hacer una correccin en el clculo de la dificultad del tem que controle las respuestas al azar. A mayor nmero de distractores (alternativas incorrectas) menos probables son los aciertos por azar

Los tems no deben tener dificultades por debajo de 0,20 no por encima de 0,80

32

ndice de discriminacin basado en los grupos extremos D = pS pi

pS = proporcin aciertos grupo superior pi = proporcin aciertos grupo inferior La discriminacin tambin se puede definir como la correlacin entre las puntuaciones de los sujetos en el tem y sus puntuaciones en el test. La puntuacin total de los sujetos en el test se calcula descontando la puntuacin del tem y el ndice de correlacin debe ser coherente con el tipo de puntuaciones del tem y del test
ndice de Homogeneidad (IH)

Correlacin Correlacin biserialpuntual Correlacin biserial

PODER DISCRIMINATIVO DE LOS TEMS

ndices de discriminacin basados en la correlacin

tems de actitudes
ndice de discriminacin (grupos extremos)

33

Variabilidad de los tems (si no hay variabilidad en las respuestas el tem no discrimina)

Fiabilidad del test (tems con poco poder discriminativo se asocian a tests poco fiables)

FACTORES QUE AFECTAN A LA DISCRIMINACIN

Dificultad del tem (con dificultad media, p = 0,5, el tem alcanza mximo poder discriminativo)

Dimensionalidad del test (el test debe medir un nico concepto; unidimensional)

34

NDICES DE FIABILIDAD Y VALIDEZ DE LOS TEMS

ndice de Fiabilidad de los tems (criterio interno) se utiliza para cuantificar el grado que el tem en cuestin est midiendo con precisin el atributo de inters

ndice de Validez de los tems (criterio externo) Implica correlacionar las puntuaciones obtenidas por una muestra de sujetos en el tem con las puntuaciones obtenidas por los mismos sujetos en algn criterio externo de inters

35

ANLISIS DE LOS DISTRACTORES

Equiprobabilidad de los distractores Los distractores son equiprobables si son seleccionados por un nmero mnimo de sujetos y son igualmente atractivos para los que no conocen la respuesta correcta. Se comprueba mediante la prueba Chi-Cuadrado de Independencia

Poder discriminativo de los distractores (basado en la correlacin biserial puntual) Si, normalmente, esperamos que la correlacin entre el test y la opcin correcta sea alta y positiva; en el caso de los distractores, lo esperable es que su correlacin sea negativa (cuando aumenta la aptitud de los sujetos, disminuye la proporcin de sujetos que elige la opcin incorrecta). Para cuantificar el poder discriminativo de los distractores recurrimos a la correlacin que ser biserial, biserial puntual o de Pearson en funcin de las variables

36

Sesgo (sujetos igualmente hbiles no tienen la misma probabilidad de acertar el tem por el hecho de pertenecer a subpoblaciones distintas). El sesgo est relacionado con la validez de constructo e indica que est actuando alguna variable extraa

FUNCIONAMIENTO DIFERENCIAL DE LOS TEMS

FDI (detecta que un tem est funcionando de manera distinta en dos grupos con el mismo nivel de aptitud). Detectada la circunstancia, no apunta posibles causas

Impacto (diferencias reales entre grupos que se deben a diferencias en el nivel de competencia de las subpoblaciones).Mientras que en el FDI las diferencias se deben a motivos distintos al nivel de competencia, en el impacto hay un grupo de sujetos ms competente

37

TEMA 9. ASIGNACIN, TRANSFORMACIN Y EQUIPARACIN DE LAS PUNTUACIONES

38

Diseos de un slo grupo Diseos de grupos equivalentes

Se administran las dos formas del test, cuyas puntuaciones queremos equiparar, al mismo grupo de sujetos; ambas formas deben medir la misma caracterstica y presentar el mismo grado de dificultad Se extraen dos muestras de la poblacin y a cada una se le administra una forma del test (tambin se pueden alternar las formas dentro de cada grupo) A cada grupo se le administra una sola forma del test y, como a priori no son equivalentes, adems se les aplica un test comn (test de anclaje) que permite establecer las equivalencias entre los test equiparar

Diseos de equiparacin

EQUIPARACIN DE LAS PUNTUACIONES

Diseos de grupos no equivalentes con tems comunes o diseo de anclaje Mtodo de la media

Se asume que las puntuaciones de uno de los test difieren, en una cuanta constante, de las puntuaciones del otro test (la diferencia entre las puntuaciones obtenidas por los sujetos en ambos test es constante)
Las diferencias entre las puntuaciones pueden variar. Se contemplan procedimientos para: Consiste en equiparar aquellas puntuaciones cuyos percentiles son iguales
Diseos de un slo grupo Diseos de grupos equivalentes Diseo de anclaje

Mtodos de equiparacin

Mtodo lineal

Mtodo equipercentil

39

S-ar putea să vă placă și