Documente Academic
Documente Profesional
Documente Cultură
Funcin de Fechner
Mtodo de los lmites o cambios mnimos: el experimentador modifica la intensidad Mtodo de ajuste o error promedio: el sujeto modifica la intensidad Mtodo de los estmulos constantes: el umbral absoluto es la magnitud percibida el 50% de las ocasiones
Mtodos:
Desarroll los mtodos directos Trata de encontrar una fucnin que relacione estmulos y respuestas
Emparejamiento de magnitudes Emparejamiento de razones Emparejamiento de intervalos Escalas de categoras o clasificacin
Mtodos
Ley del juicio comparativo o mtodo de las comparaciones binarias Thurstone Ley del juicio categrico o mtodo de intervalos sucesivos, aparentemente iguales y de ordenacin de rasgos
T del despliegue
Tests colectivos
Tests de personalidad
Cattell
Terman
Stern
Yerkes
Kraepelin
Rorschach
1 escala de inteligencia
EM
CI = EM/EC x 100
T clsica
T de la generalizabilidad de Cronbach
Tiene en cuenta todas las posibles fuentes de error e intenta diferenciarlas mediante ANOVA
T de la respuesta al tem
Contenido
tems de eleccin
Capacidad de discriminacin
Se basa en
Limitaciones para percibir las diferencias de magnitud entre 2 estmulos Existe un cotinuo psicolgico subjetivo, se origina un proceso discriminante, un estmulo presentado varias veces no origina siempre el mismo proceso discriminante, se puede hacer una distribucin de los valores subjetivos ajustada a la distribucin normal
Supuestos bsicos
Diferencia discriminante: comparar cada estmulo con todos los dems t decir cul es el preferido
Formato de la escala
Escalas bipolares: para evaluar el significado de los conceptos. Se suelen dividir en 7 categoras
Si se clasifica el concepto en la categora media: no hay asociacin i relacin semntica entre el concepto y la escala
ESCALOGRAMA DE GUTTMAN
Permite establecer la unidimensionali dad del conjunto de datos mediante una escala acumulativa perfecta (matriz triangular)
Uso del Coeficiente de reproductividad: grado de ajuste entre los datos obtenidos empricamente y el modelo terico
10
Deducciones
La correlacin entre las puntuaciones empricas de los 2 tests es igual al cuadrado de la correlacin entre puntuaciones empricas y verdaderas
11
Error de medida
Error de prediccin
12
Ecuacin SpearmanBrown (cuando se quiere aumentar la longitud del test n veces) Cuanto ms homogneo el grupo, menor es el coeficiente de fiabilidad y la desviacin tpica de las puntuaciones empricas
Variabilidad de la muestra
13
Mtodo testretest
14
Frmula de Rulon: cuando, no siendo las 2 mitades estrictamente paralelas, podemos considerarlas equivalentes
Coeficiente Alfa de Cronbach: indicador de la consistencia interna. Expresa la fiabilidad en funcin del n de tems y de la proporcin de la varianza total del test debida a la covariacin entre los tems. A mayor covariacin mayor fiabilidad.
KR20 y KR21
Ecuaciones de KuderRichardson: cuando los tems son dicotmicos
Coeficiente Beta de Raju: para tests compuestos por subtests, se aplica cuando no se conocen las puntuacion es en los tems
15
Desigualdad de Chebychev
Cuando no se hace ningn supuesto sobre la distribucin de las puntuaciones empricas o de los errores Asume una distribucin normal de los errores de medida (con media 0 y varianza S2e) y de las puntuaciones empricas condicionadas a un determinado valor de V Mientras que la correlacin entre las puntuaciones verdaderas y los errores de medida es igual a cero (rVE = 0); la correlacin entre las puntuaciones empricas y los errores de medida se ve afectada por los errores Valor mximo cuando la fiabilidad del test es nula (rXX = 0) Puntuaciones empricas = Errores
Modelo de regresin
Valor mnimo cuando la fiabilidad del test es perfecta (rXX = 1) Punt. Empricas = Punt. Verdaderas
El intervalo de confianza se hace sobre la puntuacin verdadera estimada por regresin lineal
16
Mtodo de Huynh
Mtodo de Subkoviak
Coeficiente de Livingston
17
Modelo de Millman
Modelo binomial. Considera la proporcin esperada de tems que un sujeto puede contestar correctamente para ser considerado apto y el error mximo a tolerar.
La probabilidad de una respuesta correcta por parte de un sujeto es constante para todos los tems del test Las respuestas a los tems son independientes unas de otras
18
Supone la utilizacin de la proporcin de sujetos que consistentemente son clasificados dentro del grupo de maestra o no maestra como un ndice de fiabilidad de un test. Elimina del valor de la proporcin de sujetos clasificados consistentemente el valor de la proporcin de clasificacin consistente esperada por azar
Proporciona una medida de la consistencia de clasificacin de los sujetos independientemente del posible valor esperado por azar Este valor oscila: Entre 1 (fiabilidad perfecta) y 0 (atribuida al azar) Puede expresarse en funcin de las frecuencias absolutas Alternativa al Coeficiente Kappa
Se basa en que la probabilidad mnima de una decisin consistente es 0.50 Tiene lugar si las puntuaciones del test son estadsticamente independientes y el punto de corte est en la mediana
19
Un solo test y una sola aplicacin: procedimiento matemtico sofisticado para estimar la consistencia de clasificacin.
Mtodo de Huynh
Este mtodo presupone que la distribucin de puntuaciones es aproximadamente normal y es adecuado cuando el nmero de tems es superior a 8 y la razn entre la media de las puntuaciones de los sujetos en el test y el nmero de tems oscila entre 0,15 0,85.
Mtodo de Subkoviak
Procedimiento con una sola aplicacin cuando no es posible establecer una forma paralela de un test, por lo que simulan las puntuaciones de una segunda forma paralela al test.
Coeficiente de Livingston
A diferencia de los anteriores, considera los errores cometidos al clasificar a un sujeto en el grupo que no le corresponde. Estima ms importantes los errores de clasificacin de los sujetos ms distanciados del punto de corte de aquellos que estn ms cerca del punto de corte
20
Mtodos valorativos
Mtodos combinados
Mtodos de compromiso
Mtodo Nedelsky
Mtodo Angoff
Mtodo Ebel
Mtodo Jaeger
Mtodo de Beuk
Mtodo de Hofstee
Se utiliza para fijar el punto de corte en los test de competencia mnima. Se utiliza en el mbito acadmico con test compuestos por tems de eleccin mltiple
Variante del mtodo Nedelsky, se puede aplicar a toda clase de tems (no slo a los de eleccin mltiple)
Similar al mtodo Angof. Los jueces evalan globalmente desde una doble perspectiva: la dificultad del tem (fcil, medio y difcil) y su relevancia (esencial, importante, aceptable y dudoso)
Los jueces, por acuerdo, definen tres niveles de competencia (competente, lmite y no competente). Despus los jueces seleccionan a los sujetos lmite y se les aplica el test.
Los jueces clasifican a los sujetos en dos grupos (los que son competentes y los que no lo son) y se les administra el test
21
Validez predictiva
Validez concurrente
La recogida de la informacin tanto del test como del criterio se hace simultneamente
CONCEPTO DE VALIDEZ
Validez retrospectiva
Cuando se puede obtener la medida del criterio con anterioridad a la del test
Validez de contenido
22
Objetivo: Analizar hasta qu punto los elementos o tems que componen un test son una muestra relevante y representativa
En los TRC y tests de rendimiento acadmico, las puntuaciones se suelen utilizar para hacer inferencias sobre el grado en que los sujetos dominan un campo de conocimientos (dominio), no para hacer inferencias sobre conductas externas al test o sobre el constructo medido
La forma tpica de llevar a cabo un estudio de validacin de contenido, es utilizando un grupo de expertos (juicio subjetivo)
Representatividad: grado en que se han cubierto las especificaciones del dominio, en cuanto a contenidos y a objetivos propuestos
23
Proceso que permitir obtener evidencia acerca de la capacidad del test para medir el constructo
Trata de garantizar cientficamente que la variable que el test pretende medir es una variable aceptable y consistente en el mbito terico
Es necesario estudiar las relaciones entre: el constructo y las conductas observables representativas del constructo, el constructo y otros constructos y las conductas tomadas como indicadores del constructo y las puntuaciones obtenidas por los sujetos en el test
24
Matriz multimtodomultirrasgo
Permite el anlisis de la estructura externa del test). Se intenta medir un mismo constructo mediante distintos procedimientos y distintos constructos mediante el mismo procedimiento Tcnica ms utilizada para poner a prueba las hiptesis planteadas a cerca de la estructura externa del constructo y las relaciones del mismo con otras variables
Exploratorio (no se establecen hiptesis previas acerca del nmero de dimensiones, es la propia tcnica la que nos aportar esta informacin) Confirmatorio (se establecen a priori hiptesis, y mediante las tcnicas oportunas se comprueba si se pueden aceptar las hiptesis propuestas)
Anlisis Factorial
Enfoques
Validez convergente: cuando en un mismo factor se agrupan mltiples indicadores del constructo
Validez divergente: cuando en el anlisis se han obtenido medidas de otros constructos y estas aparecen agrupadas en distintos factores
25
ndices utilizados
Perspectivas
Procedimientos estadsticos
26
Correlacin de Pearson Correlacin Biserial Correlacin Biserial puntual Coeficiente Coeficiente Biserial
X e Y variables continuas
X continua e Y dicotomizada
X continua e Y dicotmica
El coeficiente de validez
X dicotmica e Y dicotmica
X dicotomizada e Y dicotmica Tanto X como Y son variables continuas que se han dicotomizado artificialmente. Clculo muy laborioso Conocido el grado de asociacin entre el test y el criterio, se puede utilizar el modelo de regresin para hacer pronsticos Mediante el modelo de regresin se intenta buscar una ecuacin lineal que haga mnimos los errores de pronstico Varianza comn o asociada entre el test y el criterio Alude a la inseguridad o el azar que afecta a los pronsticos Representa la proporcin de seguridad en los pronsticos (o el porcentaje si se multiplica por 100)
Correlacin Tetracrica
27
Correlacin Mltiple entre las puntuaciones obtenidas por la muestra en la variable criterio y las obtenidas en el conjunto de las variables predictoras
Se traduce en ecuaciones de un plano (no de una recta como en la simple) o hiperplano si son ms de dos variables predictoras
Puntuaciones directas y diferenciales: planos paralelos Puntuaciones diferenciales y tpicas: pasan por el origen de las coordenadas
Error de estimacin: diferencia entre la puntuacin obtenida en el criterio y la pronosticada mediante la ecuacin de regresin (Y Y) Intervalos de confianza: la distribucin de los errores de estimacin se ajusta a una distribucin normal, cuya desviacin tpica viene dada por el error tpico de estimacin mltiple
28
Evala la consistencia o acuerdo entre las decisiones adoptadas a partir de las puntuaciones en el predictor (test) y el criterio (rendimiento)
ndices de validez
Sensibilidad
Proporcin de sujetos seleccionados en el test respecto al total que tuvieron xito en el criterio
Especificidad
Proporcin de sujetos correctamente rechazados en el test respecto al total de no aptos en el criterio (valor mximo 1)
Razn de eficacia
Razn de idoneidad
ndices de seleccin
Razn de seleccin
Proporcin de sujetos aptos en el test
29
Modelo Compensatorio (aditivo): a cada sujeto se le asigna una nica puntuacin global (los sujetos pueden compensar las bajas puntuaciones). La forma adecuada de otorgar una puntuacin global es mediante el modelo de regresin
MTODOS DE SELECCIN
Modelo conjuntivo: se fijan de antemano unos mnimos en cada una de las pruebas. Slo se seleccionan los sujetos que hayan superado esos mnimos en todas las pruebas
Modelo disyuntivo: slo se exige superar un determinado nivel de competencia en algn de los predictores
Modelo conjuntivo compensatorio: se aplica el modelo conjuntivo y se seleccionan los sujetos que superan los mnimos en cada uno de los predictores. A continuacin se les aplica el modelo compensatorio de forma que queden ordenados segn su puntuacin global. Para efectuar la seleccin, se puede elegir a los mejores o establecer un PC
30
Mediante la razn de eficacia (proporcin de personas seleccionadas que tienen xito en el criterio)
Mediante el modelo de regresin (si se verifican los supuestos, permite determinar la probabilidad de que los seleccionados tengan xito en el criterio)
31
Para cuantificar la dificultad de los tems dicotmicos o dicotomizados se utiliza la proporcin de sujetos que han respondido correctamente al tem (depende de la muestra utilizada): ID = A / N (Oscila entre 0 y 1) A = nmero de sujetos que aciertan el tem. N = nmero de personas que intentan responder el tem. Cero indica que ningn sujeto lo ha acertado (difcil) / Uno que todos lo ha acertado (fcil)
El ndice de dificultad est directamente relacionado con la media y la varianza del test
Correccin de los aciertos por azar En tems de eleccin mltiple, se debe hacer una correccin en el clculo de la dificultad del tem que controle las respuestas al azar. A mayor nmero de distractores (alternativas incorrectas) menos probables son los aciertos por azar
Los tems no deben tener dificultades por debajo de 0,20 no por encima de 0,80
32
pS = proporcin aciertos grupo superior pi = proporcin aciertos grupo inferior La discriminacin tambin se puede definir como la correlacin entre las puntuaciones de los sujetos en el tem y sus puntuaciones en el test. La puntuacin total de los sujetos en el test se calcula descontando la puntuacin del tem y el ndice de correlacin debe ser coherente con el tipo de puntuaciones del tem y del test
ndice de Homogeneidad (IH)
tems de actitudes
ndice de discriminacin (grupos extremos)
33
Variabilidad de los tems (si no hay variabilidad en las respuestas el tem no discrimina)
Fiabilidad del test (tems con poco poder discriminativo se asocian a tests poco fiables)
Dificultad del tem (con dificultad media, p = 0,5, el tem alcanza mximo poder discriminativo)
Dimensionalidad del test (el test debe medir un nico concepto; unidimensional)
34
ndice de Fiabilidad de los tems (criterio interno) se utiliza para cuantificar el grado que el tem en cuestin est midiendo con precisin el atributo de inters
ndice de Validez de los tems (criterio externo) Implica correlacionar las puntuaciones obtenidas por una muestra de sujetos en el tem con las puntuaciones obtenidas por los mismos sujetos en algn criterio externo de inters
35
Equiprobabilidad de los distractores Los distractores son equiprobables si son seleccionados por un nmero mnimo de sujetos y son igualmente atractivos para los que no conocen la respuesta correcta. Se comprueba mediante la prueba Chi-Cuadrado de Independencia
Poder discriminativo de los distractores (basado en la correlacin biserial puntual) Si, normalmente, esperamos que la correlacin entre el test y la opcin correcta sea alta y positiva; en el caso de los distractores, lo esperable es que su correlacin sea negativa (cuando aumenta la aptitud de los sujetos, disminuye la proporcin de sujetos que elige la opcin incorrecta). Para cuantificar el poder discriminativo de los distractores recurrimos a la correlacin que ser biserial, biserial puntual o de Pearson en funcin de las variables
36
Sesgo (sujetos igualmente hbiles no tienen la misma probabilidad de acertar el tem por el hecho de pertenecer a subpoblaciones distintas). El sesgo est relacionado con la validez de constructo e indica que est actuando alguna variable extraa
FDI (detecta que un tem est funcionando de manera distinta en dos grupos con el mismo nivel de aptitud). Detectada la circunstancia, no apunta posibles causas
Impacto (diferencias reales entre grupos que se deben a diferencias en el nivel de competencia de las subpoblaciones).Mientras que en el FDI las diferencias se deben a motivos distintos al nivel de competencia, en el impacto hay un grupo de sujetos ms competente
37
38
Se administran las dos formas del test, cuyas puntuaciones queremos equiparar, al mismo grupo de sujetos; ambas formas deben medir la misma caracterstica y presentar el mismo grado de dificultad Se extraen dos muestras de la poblacin y a cada una se le administra una forma del test (tambin se pueden alternar las formas dentro de cada grupo) A cada grupo se le administra una sola forma del test y, como a priori no son equivalentes, adems se les aplica un test comn (test de anclaje) que permite establecer las equivalencias entre los test equiparar
Diseos de equiparacin
Diseos de grupos no equivalentes con tems comunes o diseo de anclaje Mtodo de la media
Se asume que las puntuaciones de uno de los test difieren, en una cuanta constante, de las puntuaciones del otro test (la diferencia entre las puntuaciones obtenidas por los sujetos en ambos test es constante)
Las diferencias entre las puntuaciones pueden variar. Se contemplan procedimientos para: Consiste en equiparar aquellas puntuaciones cuyos percentiles son iguales
Diseos de un slo grupo Diseos de grupos equivalentes Diseo de anclaje
Mtodos de equiparacin
Mtodo lineal
Mtodo equipercentil
39