Sunteți pe pagina 1din 18

ndice

Contenido Pgina

Introduccin 1

Objetivo General 2

Objetivos Especficos 2

Concepto de Confiabilidad 3

Estimaciones de Confiabilidad 3

Uso e interpretacin del coeficiente de confiabilidad 4

Confiabilidad y puntuaciones individuales 4

Concepto de Validez 5

Validez de contenido. 6

Validez relacionada con criterio. 6

Validez de constructo. 6

Validez, sesgo e imparcialidad de la prueba. 6

Actividades de Autoaprendizaje 7

Reflexin 8

Bibliografa 10
Introduccin

El rigor y la calidad para evaluar el aprendizaje dependen, fundamentalmente, de cmo se

aborde la validez y la confiabilidad, cualidades esenciales que deben estar presentes en el

desarrollo del proceso de recoger y analizar la informacin conducente a garantizar una mayor

confianza sobre las conclusiones emitidas, de manera individual y compartida, por el evaluador.

En el siguiente informe trataremos sobre el tema de Validez y Confiabilidad, que a su vez a lo

largo del trabajo expondremos para que nos sirven estas aplicaciones en nuestra carrera y la vida

social.

De igual manera sern herramientas de vital importancia para cualquier momento que se nos

presente bien sea en la universidad o en nuestro lugar de trabajo.

Es muy importante saber de qu trata la validez y la confiabilidad para poderlas aplicar de

manera correcta y sin tener que pasar por un ensayo y un error.

Tanto la validez como la confiabilidad se conjugan para coadyuvar al evaluador a ser objetivo

en el proceso de describir la realidad derivada de un aprendizaje especfico, el cual est inmerso

en un discurso privado y que pretende ser pblico a travs de la comunicacin.

En el caso de la evaluacin del aprendizaje, se asocian a cun seguro est el evaluador al

calificar o cualificar el aprendizaje que se alcanza sobre determinado conocimiento y si se

corresponde con la realidad en la cual se desarroll ese aprendizaje.

El efecto de seleccin se minimiza determinando el grado de ajuste entre las categoras

diseadas y la realidad del evaluador y la del evaluado. El efecto de escenario y de la historia,

como amenazas al efectuar interpretaciones, disminuyen en la medida que la dinmica

interactiva y las experiencias histricas se identifican con la mayor claridad.


Objetivo General

Determinar la importancia de la confiabilidad y la validez en la evaluacin de instrumentos de

medicin y sus respectivos resultados en procesos de investigacin.

Objetivos Especficos

1. Conceptualizar los aspectos bsicos relativos a la confiabilidad de los instrumentos de

medicin.

2. Conceptualizar los aspectos bsicos relativos a la validez de los instrumentos de

medicin.

3. Desarrollar una actividad de verificacin del aprendizaje.

4. Reflexionar con respecto al contenido abordado.


Confiabilidad y Validez de los Instrumentos de Recoleccin de Datos

Concepto de Confiabilidad

La confiabilidad del cuestionario est representada por la capacidad de obtener idnticos

resultados cuando se aplican las mismas preguntas en relacin a los mismos fenmenos.

Estimaciones de Confiabilidad

Un instrumento que resulta consistente o confiable puede considerarse como un instrumento

verdaderamente de valor. La confiabilidad resulta ser una propiedad de las puntuaciones que se

obtienen despus de haber aplicado la prueba o instrumento a un grupo determinado de personas

en una ocasin particular y bajo condiciones especficas. La confiabilidad tiene como objetivo

determinar probabilsticamente, el grado de variacin que puede atribuirse a los errores

aleatorios o causales contenidos en la medida, porque no se encuentran relacionados con factores

pertenecientes a la construccin del instrumento. Lo que la fiabilidad garantiza en sus propios

trminos es consistencia expresada en la determinacin del grado de error contenido en la

aplicacin de una escala, y por lo tanto, en la medicin del fenmeno.

Los procedimientos para la estimacin de la confiabilidad son variados, las diferencias que

emergen en ellos se explican en base a la aplicabilidad de cada instrumento, los objetivos que

persigue el investigador respecto a la bsqueda de una profundidad analtica, as como el tiempo

y los recursos disponibles para el desarrollo de los instrumentos. Los procedimientos que ms se

conocen actualmente para llevar a cabo las estimaciones son los referidos a la estabilidad,

equivalencia y consistencia.
Uso e interpretacin del coeficiente de confiabilidad

El coeficiente de confiabilidad es un nmero comprendido entre 0 y 1 y representa la

proporcin de la varianza de los puntajes observados que le corresponde a la varianza de los

puntajes verdaderos.

Por ejemplo, si se sabe que la confiabilidad de un test es igual a 0,85, entonces se cumple que

85 % de la varianza de los puntajes observados se debe a la varianza de los puntajes verdaderos.

En las aplicaciones para evaluar la confiabilidad es necesario disponer de un valor estimado

del parmetro definido en la igualdad. Este es uno de los problemas bsicos de la teora y

prctica de los test.

En algunas reas (antropometra, laboratorios clnicos), es tpico evaluar la confiabilidad a

partir de repeticiones, en el mismo objeto de procedimientos de medicin de inters, o sea, la

confiabilidad se concibe como la consistencia de las mediciones cuando se hacen repeticiones.

Segn Cronbach, este era el punto de vista sostenido por varios investigadores durante las

primeras dcadas del siglo XX. Durante ese tiempo, algunos aplicaban 2 veces el mismo test y

evaluaban la consistencia de los puntajes obtenidos mediante el clculo de un coeficiente de

correlacin; pero este proceder suscitaba dudas porque el resultado de la primera medicin poda

influir en el de la segunda. Debido a esto se hizo habitual la aplicacin de 2 test diferentes pero

que, en cierto sentido, exploraban los mismos atributos. Estos son los llamados test paralelos,

cuyas variantes de diseo, conducen a diferentes frmulas para evaluar la confiabilidad.

Confiabilidad y puntuaciones individuales

Las puntuaciones obtenidas por un sujeto en cualquier test est compuesto por la puntuacin

verdadera ms el error de medicin. Debido a que la puntuacin verdadera es una puntuacin


terica solo podemos estimar, con trminos probabilsticos, la ubicacin del puntaje verdadero

con un cierto grado de confianza. Para estimar su ubicacin probable partimos del supuesto de

que si el sujeto realizara una cantidad infinita de pruebas equivalentes, las puntuaciones en esos

test tenderan a distribuirse de manera normal, y la puntuacin verdadera del individuo seria la

media de esa distribucin. La desviacin estndar de esa distribucin se denomina error estndar

de medicin (EEM). El EEM es fundamental para poder estimar la ubicacin aproximada de la

puntuacin verdadera y permite interpretar las puntuaciones individuales de un test. Eso se logra

a partir del establecimiento de intervalos de confianza, vale decir, un rasgo de puntuaciones que

probablemente contengan la puntuacin verdadera. El error estndar de medicin (EEM) est en

relacin inversa con el coeficiente de confiabilidad, por lo que: mayor coeficiente de

confiabilidad trae aparejada una disminucin en el error estndar y una menor amplitud en los

intervalos de confianza, lo cual implica en definitiva una mayor precisin en la medicin.

Comunicar solamente el coeficiente de confiabilidad sin referencia a estimaciones del error de

las mediciones no aporta demasiada informacin al usuario de un test. El error estndar de la

medicin se conceptualiza de manera diferente en el contexto de la teora de respuesta al tem, lo

que significa que no es el mismo para todas las personas evaluadas por un test, depender del

nivel en el atributo del individuo evaluado.

Validez

Concepto de Validez

La validez en trminos generales, se refiere al grado en que un instrumento realmente mide la

variable que pretende medir.


Validez de contenido.

Est representada por el grado en que una prueba representa el universo de estudio. Por tal

motivo, debern seleccionarse los indicadores e tems de tal manera que estos respondan a las

caractersticas peculiares del objeto de estudio.

Validez relacionada con criterio.

Llamada tambin validez concurrente es ms fcil de estimar, lo nico que se debe hacer es

correlacionar su medicin con el criterio, y este coeficiente se toma como coeficiente de validez.

La validez de criterio es una medida del grado en que una prueba est relacionada con algn

criterio. Es de suponer que el criterio con el que se est comparando la prueba tiene un valor

intrnseco como medida de algn rasgo o caracterstica.

Validez de constructo.

Es el grado en que una prueba mide los significados que esta da. En el modelo clsico

de validez, la validez de constructores uno de los tres tipos principales de evidencia de validez,

junto a la validez de contenido y validez de criterio.

Validez, sesgo e imparcialidad de la prueba.

El sesgo de seleccin es un error sistemtico con un sentido definido y predecible, ya que no

depende del azar, sino de una causa definida. Su presencia provoca falta de validez/exactitud

interna del estudio, por lo que sus conclusiones son errneas.


Actividades de Autoaprendizaje

Coloca los nmeros de la columna izquierda en la de la derecha segn corresponda.


1. Confiabilidad Grado en que un instrumento realmente

mide la variable que pretende medir.


____
2. Sesgo de seleccin Nmero comprendido entre 0 y 1 y

representa la proporcin de la varianza de

los puntajes observados que le corresponde a

la varianza de los puntajes verdaderos.


____
3. Validez Est representada por la capacidad de
obtener idnticos resultados cuando se
aplican las mismas preguntas en relacin con
____ los mismos fenmenos.
4. Coeficiente de Confiabilidad Es un error sistemtico con un sentido
definido y predecible, ya que no depende del
____ azar, sino de una causa definida

Escribe V si es verdadero o F si es falso los siguientes enunciados:


1- Un instrumento que resulta consistente o confiable puede considerarse

como un instrumento verdaderamente de valor? _______

2- Los procedimientos que ms se conocen actualmente para llevar a cabo


las estimaciones de confiabilidad son los referidos a la zona, color y
contextura? _______
3- La confiabilidad tiene como objetivo determinar probabilsticamente, el
grado de variacin? _______
4- El error estndar de medicin (EEM) est en relacin directa con el
_______
coeficiente de confiabilidad?
Desarrollo de Pruebas

Concepto de Prueba

Cosa material, hecho, suceso, razn o argumento con que se intenta probar que algo es de una

determinada manera y no de otra.

Accin de probar a alguien o algo para conocer sus cualidades, verificar su eficacia, saber

cmo funciona o reacciona, o qu resultado produce.

Estudio Piloto.

Un estudio piloto es una herramienta cientfica estndar para una investigacin "suave", lo

que permite que los cientficos lleven a cabo un anlisis preliminar antes de iniciar un

experimento o estudio a gran escala.

Medicin.

Significa asignar nmeros u otros smbolos a las caractersticas de los objetos de acuerdo con

ciertas reglas preestablecidas. En la investigacin, los nmeros se asignan por una de dos

razones:

Permiten un anlisis estadstico de los datos resultantes.

Los nmeros facilitan la comunicacin de reglas de mediciones y resultados.

El aspecto ms importante es realizar una asignacin que permita tener correspondencia

univoca entre los nmeros y las caractersticas que se miden, no debe cambiar con las unidades o

el tiempo.

La elaboracin de escalas puede considerarse como una extensin de la medicin.


Escalas.

Son la generacin de un continuum sobre el cual se localizan los objetos que son medidos.

Redaccin de Reactivos.

En la redaccin de reactivo es importante tomar en cuenta que una reserva de reactivos es el

depsito o provisin de dnde se seleccionarn o descartarn los reactivos para la versin final a

utilizar. Por su parte, a las variables tales como la forma, plan, estructura, arreglo y disposicin

de los reactivos de pruebas individuales, se les llama en forma colectiva formato de reactivos.

Elementos del Diseo de la prueba

a) Comprobacin: Verificar la concordancia de los hechos observados con la hiptesis

b) Diseo de la prueba: Eleccin del tipo de investigacin adecuada para la comprobacin de

la hiptesis investigacin cualitativa, investigacin cuantitativa, o ambas

c) Prueba: Proceso de aplicacin de las tcnicas elegidas para comprobar una hiptesis

Normas

El antecedente inmediato para el diseo de la prueba es la hiptesis.

El diseo de la prueba deber ser congruente con la tcnica de investigacin adoptada.

Tcnicas

1. Documental o bibliogrfica

2. De campo

3. Estadstica

Mtodos

1. Inductivo
2. Deductivo

3. Dialctico

4. Matemtico

Las Pruebas Estadsticas.

Cuando se analizan datos medidos por una variable cuantitativa continua, las pruebas

estadsticas de estimacin y contraste frecuentemente empleadas se basan en suponer que se ha

obtenido una muestra aleatoria de una distribucin de probabilidad de tipo normal o de Gauss.

Pero en muchas ocasiones esta suposicin no resulta vlida, y en otras la sospecha de que no

sea adecuada no resulta fcil de comprobar, por tratarse de muestras pequeas.

En estos casos disponemos de dos posibles mecanismos:

Los datos se pueden transformar de tal manera que sigan una distribucin normal.

O bien se puede acudir a pruebas estadsticas que no se basan en ninguna suposicin en

cuanto a la distribucin de probabilidad a partir de la que fueron obtenidos los datos, y por ello

se denominan pruebas no paramtricas, mientras que las pruebas que suponen una distribucin

de probabilidad determinada para los datos se denominan pruebas paramtricas.

Pruebas no Paramtricas:

Las pruebas estadsticas no paramtricas son las que, a pesar de basarse en determinadas

suposiciones, no parten de la base de que los datos analizados adoptan una distribucin normal.

Tcnica estadstica que no presupone ninguna distribucin de probabilidad terica de la

distribucin de nuestros datos.


Se denominan pruebas no paramtricas aquellas que no presuponen una distribucin de

probabilidad para los datos, por ello se conocen tambin como de distribucin libre (distribucin

free).

En la mayor parte de ellas los resultados estadsticos se derivan nicamente a partir de

procedimientos de ordenacin y recuento, por lo que su base lgica es de fcil comprensin.

Cuando trabajamos con muestras pequeas (n < 10) en las que se desconoce si es vlido

suponer la normalidad de los datos, conviene utilizar pruebas no paramtricas, al menos para

corroborar los resultados obtenidos a partir de la utilizacin de la teora basada en la normal.

En estos casos se emplea como parmetro de centralizacin la mediana, que es aquel punto

para el que el valor de X est el 50% de las veces por debajo y el 50% por encima.

Las pruebas no paramtricas no requieren asumir normalidad de la poblacin y en su mayora

se basan en el ordenamiento de los datos, la poblacin tiene que ser continua.

El parmetro que se usa para hacer las pruebas estadsticas es la Mediana y no la Media.

Son tcnicas estadsticas que no presuponen ningn modelo probabilstico terico.

Pruebas Paramtricas.

Las pruebas estadsticas paramtricas, como la de la t de Student o el anlisis de la varianza

(ANOVA), se basan en que se supone una forma determinada de la distribucin de valores,

generalmente la distribucin normal, en la poblacin de la que se obtiene la muestra

experimental.

En contraposicin de la tcnicas no paramtricas, las tcnicas paramtricas si presuponen una

distribucin terica de probabilidad subyacente para la distribucin de los datos.

Son ms potentes que las no paramtricas.


Dentro de las pruebas paramtricas, las ms habituales se basan en la distribucin de

probabilidad normal, y al estimar los parmetros del modelo se supone que los datos constituyen

una muestra aleatoria de esa distribucin, por lo que la eleccin del estimador y el clculo de la

precisin de la estimacin, elementos bsicos para construir intervalos de confianza y contrastar

hiptesis, dependen del modelo probabilstico supuesto.

Cuando un procedimiento estadstico es poco sensible a alteraciones en el modelo

probabilstico supuesto, es decir que los resultados obtenidos son aproximadamente vlidos

cuando ste vara, se dice que es un procedimiento robusto.

Anlisis de la Varianza (Anova)

ANOVA son siglas para el anlisis de la Variacin (ANalysis Of VAriance).

Un ANOVA segrega diversas fuentes de la variacin vistas en resultados experimentales.

Conjunto de tcnicas estadsticas para conocer el modo en que el valor medio de una variable

es afectado por diferentes tipos de clasificaciones de los datos.

Con el anlisis de la varianza se pueden ajustar las estimaciones del efecto de un tratamiento

segn otros factores como sexo, edad, gravedad, etc.

Es una tcnica estadstica que sirve para decidir/determinar si las diferencias que existen entre

las medias de tres o ms grupos (niveles de clasificacin) son estadsticamente significativas.

Las tcnicas de ANOVA se basan en la particin de la varianza para establecer si la varianza

explicada por los grupos formados es suficientemente mayor que la varianza residual o no

explicada.

El anlisis de la varianza (ANOVA) es una tcnica estadstica de contraste de hiptesis.


Tradicionalmente estas tcnicas, conjuntamente con las tcnicas de regresin lineal mltiple,

de las que prcticamente son una extensin natural, marcan el comienzo de las tcnicas

multivariantes.

Con estas tcnicas se manejan simultneamente ms de dos variables, y la complejidad del

aparato matemtico se incrementa proporcionalmente con el nmero de variables en juego.

El anlisis de la varianza de un factor es el modelo ms simple: una nica variable nominal

independiente, con tres o ms niveles, explica una variable dependiente continua.

Otra alternativa, que aparentemente es ms lgica e intuitiva, consiste en comparar, en todas

las posibles combinaciones de dos en dos, las medias de todos los subgrupos formados.

En el ANOVA se comparan medias, no varianzas: medias de los subgrupos o estratos

originados por los factores de clasificacin estudiados.

Un ANOVA entonces prueba si la variacin asociada a una fuente explicada es grande

concerniente a la variacin inexplicada.

Si ese cociente (la estadstica de F) es tan grande que la probabilidad que ocurri por

casualidad es baja (por ejemplo, P<=0.05), podemos concluir (en ese nivel de la probabilidad)

que esa fuente de la variacin tena un efecto significativo.


Actividades de Autoaprendizaje

Coloca los nmeros de la columna izquierda en la de la derecha segn corresponda.


5. Medicin Las variables tales como la forma, plan,

estructura, arreglo y disposicin de los

reactivos de pruebas individuales.


____
6. Formato de reactivos Son la generacin de un continuum sobre

el cual se localizan los objetos que son

medidos.
____
7. Escala Permite que los cientficos lleven a cabo

un anlisis preliminar antes de iniciar un

experimento o estudio a gran escala.


____
8. Estudio Piloto Significa asignar nmeros u otros
smbolos a las caractersticas de los objetos
de acuerdo con ciertas reglas
____ preestablecidas.

Escribe V si es verdadero o F si es falso los siguientes enunciados:


1- Los reactivos descartados miden la confiabilidad? _______

2- La elaboracin de escalas puede considerarse como una extensin de la


medicin? _______
3- En la medicin se puede realizar una asignacin que evite la
_______
correspondencia entre los nmeros y las caractersticas que se miden?

4- El antecedente inmediato para el diseo de la prueba es la hiptesis? _______


Reflexin

La validez y confiabilidad se darn en la medida que el evaluador tenga conciencia plena del

proceso de investigacin y las caractersticas que lo definen, la claridad y esteticismo en el

tratamiento del aprendizaje construido y la capacidad de analizarlo de manera crtica, su

insercin en el contexto y su participacin sensible en el aprendizaje y en la intuicin,

interpretacin, y convencimiento de las teoras emergentes y cambiantes.

La confiabilidad y la validez son cualidades esenciales que deben estar presentes en todos los

instrumentos de carcter cientfico para la recogida de datos, si el instrumento o instrumentos

renen estos requisitos habr cierta garanta de los resultados obtenidos en un determinado

estudio y, por lo tanto, las conclusiones pueden ser crebles y merecedoras de una mayor

confianza.

Uno de los mayores problemas que se debe evitar, es que la informacin obtenida no le

permita responder a los objetivos de la investigacin. Si los instrumentos no son validados, podr

encontrar una variada informacin pero sin ninguna articulacin con los propsitos y

compromisos asumidos en la investigacin.

La informacin insuficiente obtenida en las investigaciones est vinculada a la elaboracin

incoherente e inconsistente de los instrumentos de recopilacin de datos. Muy probablemente, no

fueron diseados con agudeza y pensando en todo momento en los objetivos y propsitos de la

investigacin

Un buen instrumento de recoleccin de datos o medicin debe tener las siguientes cualidades:

confiabilidad y validez.
Si se miden fenmenos o eventos una y otra vez con el mismo instrumento de medicin, Se

obtienen los mismos resultados u otros muy similares? Si la respuesta es afirmativa, se puede

decir que el instrumento es confiable.

Adicionalmente a la confiabilidad de un instrumento, se debe buscar la validez del mismo. En

este sentido, el investigador realizar un esfuerzo dirigido a la elaboracin de un instrumento que

mida lo que se desea medir.


Bibliografa

Balestrini (1997) Metodologa de la Investigacin.

Hernndez, S. (1998) Metodologa de la Investigacin.

Tamayo y Tamayo (1998) El Trabajo de Investigacin.

http://www.monografias.com/trabajos106/confiabilidad-y-validez/confiabilidad-y-

validez.shtml#ixzz4jpFkfJZm

S-ar putea să vă placă și