Tarea IV Teoria de Los Test y Fundamento de Medicion

UNIVERSIDAD ABIERTA PARA ADULTOS
UAPA
ESCUELA DE PSICOLOGIA
LICENCIATURA EN PSICOLOGIA EDUCATIVA
PRESENTADO POR:
JOHELY ALEXANDRA BONIFACIO DE LEÓN
MATRICULA:
12-0189
ASIGNATURA:
TEORIA DE LOS TEST Y FUNDAMENTO DE MEDICION
FACILITADORA:
WENDY FRIAS
SANTIAGO DE LOS CABALLEROS

República Dominicana
12/10/2019
Introducción
Esta tarea estará debidamente desarrollada a través de ensayo, mapa

conceptual, etc., con finalidad de descubrir y conocer cómo podemos obtener
confiabilidad y validez en una prueba psicométrica.
El presente ensayo pretende orientar sobre el procedimiento para elaborar un

instrumento adecuado para la recolección de datos, válido y confiable, que
proporcione un basamento relevante para ello gro de los objetivos planteados y
sustente los hallazgos que realicen con sus investigaciones. Se describe la
validez y la confiabilidad de un instrumento. Cómo se realiza el cálculo de la
confiabilidad y cuáles son los instrumentos que requieren de este
procedimiento, ya que no todos los instrumentos para recoger datos ameritan
se realice una prueba piloto con esta finalidad.
Redacta de un ensayo con un mínimo de tres páginas sobre la
confiabilidad y validez, respetando los conceptos básicos que emiten su
opinión en el texto básico.
La estandarización es un paso importante en el diseño y la evaluación de

pruebas psicológicas y otros instrumentos de evaluación, pero no es el último
paso. Antes de que una prueba pueda utilizarse con cierta seguridad, debe
obtenerse información acerca de su confiabilidad y validez por lo que a sus
propósitos específicos concierne.
CONFIABILIDAD
Ningún instrumento psicométrico puede considerarse de valor a menos que sea
una medida consistente, o confiable. En consecuencia, una de las primeras
cosas que será necesario determinar acerca de una prueba de elaboración
reciente es si resulta lo suficientemente confiable como para medir lo que fue
diseñada para medir. Si, en ausencia de cualquier cambio permanente en una
persona debido al crecimiento, al aprendizaje, a alguna enfermedad o lesión,
las puntuaciones en una prueba varían con la ocasión o la situación, es
probable que la prueba no sea lo suficientemente confiable como para ser
usada en describir y evaluar a la gente y hacer predicciones sobre su conducta.
Hablando en términos estrictos, más que ser una característica de una prueba,
la confiabilidad es una propiedad de las puntuaciones obtenidas cuando se
administra la prueba a un grupo particular de personas en una ocasión
particular y bajo condiciones específicas (Thompson, 1994),
Note que confiabilidad no es lo mismo que estabilidad: al determinar la

confiabilidad se asume que la prueba mide una característica relativamente
estable. A diferencia de la inestabilidad, la falta de confiabilidad es resultado de
errores de medición producidos por estados internos temporales, como la baja
motivación o la falta de disposición, o de condiciones externas como un
ambiente de prueba incómodo o con distracciones.
Teoría clásica de la confiabilidad

En la teoría clásica de los tests se supone que la calificación observada de una
persona en una prueba está compuesta por una puntuación “real” más algún
error no sistemático de medición.
La puntuación real de una persona en una prueba particular se define como el

promedio de las puntuaciones que obtendría si presentara la prueba un número
infinito de veces. Es obvio que la puntuación real de una persona nunca puede
medirse de manera exacta; tiene que ser estimada
En la prueba, las instrucciones de aplicación, las condiciones ambientales

(temperatura, iluminación, ruido) en que se aplica la prueba, y las idiosincrasias
y estados físicos o psicológicos temporales de los examinados pueden afectar
la confiabilidad estimada de una prueba. Cualquiera de esas condiciones, o
todas, puede contribuir a la varianza de error, simbolizada en la fórmula clásica
de la varianza de la prueba. Los procedimientos matemáticos de análisis
factorial (vea el apéndice A) proporcionan una forma de dividir la varianza de la
calificación real en la fórmula en varianzas común y de factor específico, pero
la fórmula no distingue entre varias fuentes de error que contribuyen a la
varianza de error.
La falta de confiabilidad de un test psicométrico esta en relación con la

intervención del error. Se considera que el error es cualquier efecto irrelevante
para los fines o resultados de la medición que influye sobre la falta de
confiabilidad de tal medición. El error es de dos tipos: a) Error constante
(sistemático), que se produce cuando las mediciones que se obtienen con una
escala son sistemáticamente mayores o menores que lo que realmente deben
ser. b) Error causal (al azar o no sistemático), que se produce cuando las
medidas son alternativamente mayores o menores de lo que realmente deben
ser. Este último tipo de error interviene cuando se afecta la confiabilidad de un
test psicométrico. Este error tiene que ver con la salud, fatiga, motivación,
tensión emocional, fluctuaciones de la memoria, condiciones externas de luz,
humedad, ventilación, calor, distracción por problemas del momento,
familiaridad con la prueba, que presenta el examinado al momento de dar el
test (Rey, 1972; Brown).
Fuentes de error en la medición en psicología La primera fuente de error en la
evaluación psicológica es la selección de los reactivos. El autor de una prueba,
una vez que elabora un conjunto de reactivos para medir el atributo meta, debe
decidirse por seleccionar una muestra de ellos; ¿cómo elegirlos para que
realmente sea representativa, para que sea equitativa en cuanto a los
diferentes rubros que su prueba tiene? Por ejemplo, si una prueba de aritmética
tiene más reactivos de sumas que de restas y un alumno estuvo ejercitándose
más en sumas que en restas, su calificación será más alta que la que hubiera
obtenido si se hubiera ejercitado más en restas que en sumas, o bien, si la
prueba tuviera igual número de reactivos de ambas operaciones aritméticas.
Una prueba bien diseñada y construida, debe asegurar que la muestra de
reactivos contenga todos los tipos de contenidos que intenta medir, y de
manera equitativa. Otra fuente de error es la aplicación de la prueba. Los
manuales de las pruebas presentan las condiciones estandarizadas de
aplicación de la misma, así como las instrucciones que se les deben dar a los
sujetos. Sin embargo, a veces hay facto - res que no se pueden controlar: un
espacio no muy bien iluminado, libre de ruidos y distractores, mesa y silla
cómodas, etc., así como las condiciones físicas del que está tomando la
prueba: cansancio, falta de motivación, ansiedad, preocupación, hambre, en
general, los estados emocionales.
La calificación de la prueba constituye otra fuente de error. Si bien existen

claves o plantillas de corrección de las pruebas, en algunas de ellas hay
reactivos cuya respuesta tiene que valorar y calificar el evaluador; por ejemplo,
en las pruebas de inteligencia, cuando existen preguntas abiertas como: ¿qué
harías si te encontraras una mochila tirada en el patio de tu escuela?, el
evaluador tiene que decidir, de acuerdo con la respuesta dada por el evaluado,
si le otorga la calificación de 0, 1 ó 2 puntos. Los constructores de las pruebas
reducen este tipo de error al proporcionar en los manuales de las mismas
muchos ejemplos de los posibles tipos de respuesta para que cualquier
evaluador tenga más certeza en otorgar alguna puntuación.
La validez de un test indica el grado de exactitud con el que mide el constructo
teórico que pretende medir y si se puede utilizar con el fin previsto. Es decir, un
test es válido si "mide lo que dice medir". Es la cualidad más importante de un
instrumento de medida. Un instrumento puede ser fiable pero no válido; pero si
es válido ha de ser también fiable.
Se puede decir, que la validez tiene tres grandes componentes:
Validez de contenido
Validez de criterio o criterial
Validez de constructo
Las tres se refieren a aspectos diferentes y la utilización de uno u otro concepto

de validez dependen del tipo de test.
VALIDEZ DE CONTENIDO
Se refiere al grado en que el test presenta una muestra adecuada de los

contenidos a los que se refiere, sin omisiones y sin desequilibrios de contenido.
La validez de contenido se utiliza principalmente con tests de rendimiento, y

especialmente con los tests educativos y tests referidos al criterio. En este tipo
de tests se trata de comprobar los conocimientos respecto a una materia o un
curso.
La validez de contenido descansa generalmente en el juicio de expertos

(métodos de juicio). Se define como el grado en que los ítems que componen el
test representan el contenido que el test trata de evaluar. Por tanto, la validez
de contenido se basa en (a) la definición precisa del dominio y (b) en el juicio
sobre el grado de suficiencia con que ese dominio se evalúa.
A pesar de que no se utiliza un índice de correlación para expresar la validez

de contenido, existen procedimientos para cuantificarlo. Algunos de estos
procedimientos son:
a) Cálculo de descriptivos: Consiste en calcular la media y la desviación típica
de todos los ítems. A continuación, se determinará una puntuación de corte (o
índice de validez de contenido) que refleje, en base a la evaluación de los
expertos (método de juicio), que la puntuación del ítem es demasiado baja en
relevancia como para ser incluido en la escala. No hay reglas. La decisión
dependerá del juicio propio. Por este motivo, se han de tener en cuenta las
siguientes cuestiones:
• Ser capaz de justificar la decisión sobre la puntuación corte.
• Usar la misma puntuación de corte para todos los ítems de la escala, incluso
si la escala es multidimensional.
• No poner una puntuación de corte tan alta que implique eliminar muchos
ítems. (Se podrán eliminar más ítems con el cálculo de la fiabilidad y el análisis
factorial).
b) Índice de validez de contenido (IVC): Lawshe (1975) propuso un índice de

validez basado en la valoración de un grupo de expertos de cada uno de los
ítems del test como innecesario, útil y esencial.
VALIDEZ DE CRITERIO O CRITERIAL
Se refiere al grado en que el test correlaciona con variables ajenas al test

(criterios) con lo que se espera por hipótesis que debe correlacionar de
determinado modo. Un criterio es una variable distinta del test que se toma
como referencia, que se sabe que es un indicador de aquello que el test
pretende medir o que se sabe que debe presentar una relación determinada
con lo que el test pretende medir. Se denomina coeficiente de validez a la
correlación del test con un criterio externo.
La elección del criterio es el aspecto crítico en este procedimiento de

determinación de la validez, ya que es muy difícil obtener buenos criterios. Un
mismo test puede tener más de un tipo de validez, es decir puede estar
validado con respecto a varios criterios y los diferentes coeficientes de validez
que resultan pueden tener valores diferentes.
Dentro del concepto de validez de criterio cabe distinguir a su vez entre:
- Validez externa y validez interna
- Validez concurrente y validez predictiva
a) Hablamos de validez externa si el test se ha validado con respecto a un

criterio externo, como por ejemplo, una evaluación de rendimiento. La
correlación del test con el criterio da lugar al coeficiente de validez externa.
Hace referencia a la posibilidad de generalización.
Sin embargo, hablaremos de validez interna si se correlaciona un test con otro

con validez reconocida que mide el mismo rasgo; los coeficientes de validez
interna suelen ser menores que los de validez externa y su interpretación es
difícil. Para evitar errores de interpretación se suele correlacionar un test con
todos los tests ya validados que miden lo mismo y calcular un coeficiente de
correlación múltiple. Este coeficiente de validez interna suele alcanzar el valor
del coeficiente de validez. Hace referencia a la validez del resultado de la
investigación para los sujetos estudiados.
b) La distinción entre validez concurrente y predictiva se emplea según se

utilice un criterio disponible en el momento (validez concurrente) o cuando se
pretenda predecir la conducta futura de un individuo (validez predictiva). Este
tipo de validez se exige especialmente para los instrumentos que se utilizan en
selección y orientación académica o profesional.
Cálculo del coeficiente de validez
Los procedimientos estadísticos utilizados en la validación referida a un criterio

varían según el número de predictores utilizados (uno o más tests) y el número
de criterios empleados (criterio único y criterio compuesto o múltiple). Martínez
Arias (1995) distingue los siguientes casos:
Un único test y un solo criterio: se emplearían los procedimientos de

correlación y regresión lineal simple.
 Varios predictores (tests) y un solo criterio: se emplea la correlación y
regresión lineal múltiple o el análisis discriminante.
 Varios predictores y varios criterios: regresión lineal multivariante y la

correlación canónica.
VALIDEZ DE CONSTRUCTO
Es un concepto más complejo. Se refiere al grado en que el instrumento de

medida cumple con las hipótesis que cabría esperar para un instrumento de
medida diseñado para medir precisamente aquello que deseaba medir. Se
puede considerar un concepto general que abarcaría los otros tipos de validez.
El término constructo hace referencia a un concepto teórico psicológico

inobservable (ej. la inteligencia, cada factor de personalidad, las aptitudes, las
actitudes, etc.) La definición operativa de estos constructos presenta
considerables dificultades en la práctica, ya que no son directamente
observables. Debido a esto, la validación de un constructo es un proceso
laborioso y difícil.
1. Elabora de un mapa conceptual sobre el tema de La Validez.
Validez
Concepto
La validez se refiere a la
pertinencia de tales
inferencias.
Sus tipos se clasifican
Estimación de validez
en:
Validez de contenido Valor máximo del Validez y longitud del

coeficiente de validez test
Equivale a la validación de las
teorías científicas
Muestra adecuada y
representativa de los
contenidos que se pretende Validez de constructo
evaluar con él.
Validez predictiva
se refiere a la recogida de
Se refiere al grado de
evidencia empírica sobre la
eficacia con el que se
existencia de que tal constructo
puede predecir una variable
existe realmente.
de interés
Conclusión
Finalizado este importante tema se determina que validez se refiere al grado en

que una prueba proporciona información que es apropiada a la decisión que se
toma. Tiene varios tipos: validez de contenido, validez de constructo, y
predictiva
. La confiabilidad tiene que ver con la exactitud y precisión del procedimiento de

medición. La confiabilidad proporciona una indicación de la extinción, en que
una medida es consistente y reproducible. La confiabilidad proporciona una
indicación está relacionada con factores, tales como, economía, convivencia e
interpretación para determinar si una prueba es práctica para usarla
ampliamente.

Tarea IV Teoria de Los Test y Fundamento de Medicion

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Tarea IV Teoria de Los Test y Fundamento de Medicion

Încărcat de

Drepturi de autor:

Formate disponibile

UNIVERSIDAD ABIERTA PARA ADULTOS

JOHELY ALEXANDRA BONIFACIO DE LEÓN

TEORIA DE LOS TEST Y FUNDAMENTO DE MEDICION

SANTIAGO DE LOS CABALLEROS

Esta tarea estará debidamente desarrollada a través de ensayo, mapa

El presente ensayo pretende orientar sobre el procedimiento para elaborar un

La estandarización es un paso importante en el diseño y la evaluación de

Note que confiabilidad no es lo mismo que estabilidad: al determinar la

Teoría clásica de la confiabilidad

La puntuación real de una persona en una prueba particular se define como el

En la prueba, las instrucciones de aplicación, las condiciones ambientales

La falta de confiabilidad de un test psicométrico esta en relación con la

La calificación de la prueba constituye otra fuente de error. Si bien existen

Se puede decir, que la validez tiene tres grandes componentes:

Validez de criterio o criterial

Las tres se refieren a aspectos diferentes y la utilización de uno u otro concepto

Se refiere al grado en que el test presenta una muestra adecuada de los

La validez de contenido se utiliza principalmente con tests de rendimiento, y

La validez de contenido descansa generalmente en el juicio de expertos

A pesar de que no se utiliza un índice de correlación para expresar la validez

• Ser capaz de justificar la decisión sobre la puntuación corte.

b) Índice de validez de contenido (IVC): Lawshe (1975) propuso un índice de

VALIDEZ DE CRITERIO O CRITERIAL

Se refiere al grado en que el test correlaciona con variables ajenas al test

La elección del criterio es el aspecto crítico en este procedimiento de

- Validez externa y validez interna

- Validez concurrente y validez predictiva

a) Hablamos de validez externa si el test se ha validado con respecto a un

Sin embargo, hablaremos de validez interna si se correlaciona un test con otro

b) La distinción entre validez concurrente y predictiva se emplea según se

Cálculo del coeficiente de validez

Los procedimientos estadísticos utilizados en la validación referida a un criterio

Un único test y un solo criterio: se emplearían los procedimientos de

 Varios predictores y varios criterios: regresión lineal multivariante y la

Es un concepto más complejo. Se refiere al grado en que el instrumento de

El término constructo hace referencia a un concepto teórico psicológico

1. Elabora de un mapa conceptual sobre el tema de La Validez.

Validez de contenido Valor máximo del Validez y longitud del

Finalizado este importante tema se determina que validez se refiere al grado en

. La confiabilidad tiene que ver con la exactitud y precisión del procedimiento de

S-ar putea să vă placă și