Sunteți pe pagina 1din 14

~~

NORMAS TECNICAS

PARA LOS TESTS PSICOLOGICOS y SUS MANUALES.


Traduccin

y EDUCACIONALES

cometarios:

F.

Murat.

1970

Int/-odu(,,~(,,~i

bn

la

teo/-la

t(,,~nica

de

los

tests.

UNC.

(mimeog.)

Sintesis

yadpatacin:

o.

Oonolo.1991

en el uso de estas normas. Las normas tienen que se~ir para mejorar el grado de entrenamiento porfesionalde lds que usan los tests. Lo~; test tienen que cumplir necesariamente con todas .las normas, en algun grado (un test puede apaiecer como confiable pero tenerdeficiencias en cuanto a sil validez --tener muy en cuenta esta observacion en casos de test de rendimiento educacional--. Por si solas no son garantia de que el test sera usado en forma satisfactoria. LAS NORMAS de la informaciOn. A.l Toda la informacion que necesita el usuario debe estar expresada en el MANUAL, para que el test sea utilizado en for-ma operatlva. Si no se puede cumpl i. r expl ici taamente con alguna de ellas se debe dejar expresa constancia de las circunstancias y cual es procedimiento para suplirlas. En el mismo sentido, el material que se utilice para promocionar un test debera ser correcto y exhaustivo. A. 2 El test y sus mar)uales deben ser revisados a int-er-va.los regulares (15 aos, se sugiere). Cambios en la sit-uacion general o en aspect-os particulares modi.fican -las relaciones con los resultados de los t-est. (modificacion de progrmas, bibliografia...). En estas revisiones se sugiere incorporar resultado de investigaciones propias 0 de otros, estn a favor o no de lo predi.cado en el test . A. 2.3 Si se prepara lJ na forma abreviada de u n test , es necesario obtener y publicar nuevos datos que fundamenten esta ver-sion. (recordar que es importante mencionar el error st-andar de la nueva medida, definido como la raiz cuadrada de la diferencia ente la unidad y el coeficiente de correlacion o de confiabilidad). Tambin es importante reunir datos adicionales sobre la interpr-etabilidad de los resu-ltados obtenidos. A. Difusion INTERPRETACION Si bien no se puede esperarque el test acerca de todas las posibles interpretaciones que hcer-se. debe preparar quienes lo utilicen. 8.1 Test. mamual. prolocolo y demas material ayudar al usuario a hacer uso correcto del test. favorecer las ;nt.ArnrAta~; nn!=\c:-.::.~Art-::.rl::."" B.

Limitaciones

alerte pueden
deben ya

1.

Los nombres precisos, no interpretaciones

o titulos de crear falsas errneas.

los test deben expectativas,

ser claros e inducir

y a

En este sentido los instrumentos que se uticen para conocer intereses o rasgos de personalidad, deberan denominarse (.~uestiona.ios" in\l'enta.ios" listas de cont.ol mas que tests . Cuando para la ilustrar las interpretaciones se utilicen estudios de casos, es conveniente presentar situaciones relativmente complejas, en donde la interpretacin sea relativa~ente .ambigua o dificultosa. Si se presupone errores sistematicos en la puntuacin de un test (esto es, errores que alteran constantemente la medicin, ya sea en forma positiva o negativa) debe dejarse aclarada la direccin y magnitud pr~bable del error. Especificamente tambin se deben," aclarar relaciones que comunmente se hacen cuando no estan categoricamente habilitadas (inteligencia y rendimie,Qto escolar). 8.2 El manual debe decir e$>ecificamente cuales es o son los objetivos del test. (Ampl.iar con el corcepto de validez. Aqui el trmino criterio se u'tiliza para designar la variable o conducta que se desea predecir. Si el. test se distribuy~ con fines de investigacin debe dejarse expresamente asentado, el uso operativo es de otra magnitud y compromete a otro tipo de responsabilidad profesional. profesionales 8.3 El manual del estan habilitados test debe decir claramente para hacer uso del test a pensar que el inicial si pueda test estar que en se a

que instancias. Por- esa r-azn tampoco debe interpreta solo, aunque un

inducir punteo

cargo del mismo interesado. Las instrucciones deben ser precisas y acordes a los distintos tipos de interpretaciores e infererlcias que puedan hacer.se del test . Tambin debe especificar-se el tipo de bibliografia que es necesario consultar para mejorar las inferencias e in ter.pr-etaciones .Del. mismo modo las relaciones entre variables tienen que hacese de modo preciso. 8.4 Erl el caso de utilizar el trmino signiFi(.~ati\l'o debe aclararse el alcance que tiene. corriente o estadistico, y en el segundo caso, la pt-ueba u ti 1 izada, su sertsibi 1 idad y su potencia de significacin. Cuando se especif ique la r-elacin entre test y ct-i terio se debe dejar aclarado si la interpretacin puede aplicarse aun indj.viduo en particular o al promedio del grupo. Tambin deben quedar registradas sobre que puntuaciones se pueden hacer inter-pretaciones (puntajes par-ciales, subtests. totales. etc.) C. VALIDEZ .Nos indica el lograr ciertos objetivos. coeficientes de validez, ol.Jeden oerseQuirse en la

grado en que un test Se pueden establecer dentro de los fines aplicacin de un test:

es capaz de tres tipos de posibles que 1. se propone

.3

determinar c6mo se comporta un individuo en la actualidad frente a un conjunto o universo de situaciones de las cuales el test pretende ser un resumen o una muestra de sus aspectos esenciales; 2. el usuario del test o bien puede pronosticar el comportamiehto futuro de los individuos o bien estimar el comportamiento actual en alguna otra ,variable de inters par-ticular, distinta de la que mide el test en forma directa; 3. el usuario de un test puede desear inferir el grado con que un individuo posee algun rasgo hipottico o un cierto atributo, L~onL-:eptuall1lente definido del cual se presupone que el test es un indicador operacional. La aplicaci6n <jel test en este ultimo caso puede aportar datos para -aprender O saber algo del sujeto en examen, -estudiar el test, estudiar teor-ia la relaci6n con otros test, -desarrollar una nueva

psicol6gica . Los distintos tipos de te~t se pueden usar con una finalidad particular, aunque a vec~s hay sobreposiciones en la clase de test y en los prop6sitos para los que son usados. Para juzgar la L.ltilidad c;ie un test para un lJSO determinado es necesario reuniritlformaci6n adecuada para cada uno de los tipos de validez que desee probarse. Los tres tipos principales de fines que son posibles en la aplicaci6n de todo test se denominan: ' \-'all'dez pOIel c~ontenl'do" , \-'alldez t-elaL-:ionada a L.ln ct-i tel-io" ' \-'alidez t-elati \-'a a una noL-:ion de o a un conL~epto. La validez por el contenido se demuestra comprobando que proporcibn del contenido o del test es urja muestr-a representativa del tipo de situaciones, o de l.a discipl.ina o mater"ia de enseanza, con respecto a .las cuales se pr-etende hacer alguna inferencia a partir de los r'esultados de dicho test. Es de capital importancia en l.as puebas de rendimiento o capacitaci6n. El manual debera contar con suficiente material. para fundar la tesis de que representa aquel. SUplJesto universo de tareas, condiciones o procesos que pr-etende repr"esentar. Se entiende que son contenidos en este caso, contenidos curriculares, aptitudes, actitudes, habil.idades, destrezas, conocimientos, etc. En este caso se prueba el grado de especificidad o adecuacin de una cierta defir1ici6n de aquella finalidad. Este pr-oceso es en gran medida similar ala valoraci6n subjetiva del mismo criterio. La validez con respecto aun criterio dado, se comprueba comparando las puntuaciones de un test con una o mas var-iables exter-iores, a las que se considera un medida directa de la caracteristica o del comportamiento examinado. Esta comparaci6n puede tomar l.a forma de tabla de pt-onosti(..-:os o pt-e\-'isiones o I1IJS L~OmUnl1lente de Llna (..~L;I-t-elaL~ion que t-elaL~lOna .las puntuaL~iones en los tests L~on aq(.Jellas 117ediL~iones los los sido ef'eL~tua(.ias en el (..~t-i tet~io. Segun sea el comportamiento que se desea pr-edecirdatos acerca del criterio se recopilan paralelamente a del test o en un periodo posterior, segun si el test ha recomendado como instrumento predictor del criterio o Lietet-minada

un medio de llegar a una estimaci6n o valot-aci6n actual de los sujetos en el criterio considerado. La validaz conceptual se valora determinado el grado en que cierto concepto explicativo o ciertas estructuras conceptuales dan cuenta del rendimiento o del comportamiento registrado er el test. Para examinarla se requieren dos enfoques: lbgico yemplrico. Basicamente se somete a prueba la teoria psico16gica subyacente al test. Este proceso implica tres fases: a) a par-tir de esta teoria, cuales son las hip6tesis que pueden formularse acerca de la conducta de las personas que en el test registr-an puntajes altos o bajos; b) reuni6n de los datos para sometera prueba la hip6tesis que dedujo de aquella teoria, y c) a la luz de los resultados obtenidos formular las conclusiones acerca de la pertinencia o no de lo adecuado de la teor-ia para explicar los datos reunidos. Si se fracasa sera necesjrio, revisar la teoria, o el test o ambos, reformularlos o bien desecharlos. Un procedimiento sencillo 'para investigar qu mide un tes t es relacionarlo con otros test hom610gos, otr-o es hacerlo en forma experimental para' ver como actua el sujeto en determinadas condiciones controladas. La validez conceptual se estudia por lo general cuando se desea aumentarla comprensin de los atributos psicolgicos medidos por el test. Las relaciones entre test y cri terio no me.joran la comprensi6n de ese fen6meno . Los tres aspectos de la validez de un test son ffil..ltual11ente independiente solo desde el punto de vista terico. Raramente uno solo de estos tres aspectos es el que importa a una situaci6n particular. Las tres nociones acerca de la, validez se aplican a cualquier clase de test, pero lo que determina que tipo de evidencia se requiere acerca de la val idez de un test, depen,,1e mas del uno que se le quiet-a daque de su natu-aleza. C.l El manual del test debera consignar cual es la validez del test con respecto a cada una de las inferencias para las cuales ha sido reconocido. En cada caso se hara expresa menci6n acerca del tipo de validez que se esta justificando, evitando expresiones anodinas. Si algunos de esos aspectos no has sido aun investigados, se debe dejar expresa constancia. Se debe dejar constancia de las imterpr-etaciones que estan habilitadas a partir de items, de puntuaciones pat~ciales, difer-encias entre puntuaciones, i nterpretacin de perfiles, indicando las pruebas que justifiquen tales af i t-maciones . C_2 Las correlaciones item-test no deben tomarse como prueba de val idez relativa a un criterio, ni como indice de discriminaci6n de un i tem , ni como coef icier1te de correlaci6n de los ) items; solo es una medida de coherencia interna. Esa relac :i6n esta habilitada para los estudios de v~';rl~7 ~onceotual-

bien como del estado

,.

VALIDEZ POR EL CONTENIDO .C"3 El manual debe indicar claramente cual es el conjunto representado po~ el test y en que medida el mismo es una muestra representativa de aquel. Si se utilizan jueces para determinar esta pertinencia, se debe indicar la formaci6n personal de los mismos. Cuando se trate de tests escolares se debe indicar el sistema de clasificaci6n que se utiliz6 para seleccionar los items. En las pruebas de rendimiento, cuando se emplea una tabla de doble entrada para distribuir los items, es aconsejable incluirla en el manual. Siempre es necesario destinguir entre los resultados 16gicos de los empiricos en que se fundan las conclusiones. La validez por el contenido se prueba demostrando que el test es una muestra r~resentativo de un ~rea determinada. En las pr-uebas escolares es necesar-io mencionar la fecha en que fue confeccionada y en relaci6n a qu programa de estudio (contenidos y b~bliografia). RELATIVA A UN CRITERIO DADO. C.4 Todas las mediciones que se efectuan sobre el criterio, tendran que ser descriptas completa y cuidadosamente. Se dejara constancia del valor efectivo del criterio. Mediciones simultaneas en el test y erl el criterio o diferidas en el tiempo. Tambin el valor de los baremos, tables de pronstico y previsin local. El manual de un test debe informar acerca de su validez para cada uno de los criterios para los que se recomienda su empleo. En caso de no haberse sometido a control experimental debe dejar expresa constancia. En cada caso se dejara sentado los coeficientes de cor-relacin yel numero de casos que se utiliz en su calculo; indicando la forrna de inter-pretarla en cada caso especifico. Es j,mportante consignar el tiempo que transcurre ente la aplicacin del test y la recoleccin de los datos correspondientes al criterio, indicando en cada caso el per-iodo en que se extendi la recoleccin. Si la prediccin es de largo alcance pero solamente se mencionan las compar-aciones efectuadas entr-e cri ter-ios simul taneos y el test, en el manual debera dejarse constancia de que la val idez en tales predicciones es i n(.iete,-mi nada. Las puntuaciones erl la varible criterio deben ser tomadas en forma independiente de las puntuaciones en el test, indicandose en el manual las precauciones que se tomaron para evitar" la (..~ontaI11ina(..~i6n de los valores obtenidos en el criterio, o bien llamando la atencin acerca de la posibilidad de que se haya producido contaminacin. En caso de que el criterio sea una medida d.l"-e(..~ta o subjet.l""'a en el manual se debera informaracerca de si los que efectuaron las ~preciaciones tuvieron informacin previa de los datos en el test, advirtindose que esta circunstancia puede haber influido aumentando el coeficiente de validez. VALIDEZ

Cuando el criterio est definido por categorias de variable es conveniente explicitar dichas categorias y formas en que los sujetos fueron incluidos en ellas. En muchos casos es ms util los datos obtenidos en la validacin de pruebas en muestras locales que las ya publicadas. En este caso el manual debe alertar sobre esta conveniencia y dar los elementos necesarios para que se proceda en ese sentido. Tngase presente que las car-acteristicas que definen un criterio difieren de localidad a localidad o de una institucin a otra por lo que el clculo de la validez con los datos publicados deja de tenetutilidad. una las PARA LA VALIDEZ RELATIVA A UN CRITERIO DADO. C.5 La muestra que se emplea en un estudio sobre la y las condiciones en ~os que se efectuan la va idez de los test tiene que ser coherente con las ap icaci6n trucciones que se han dado en el 'manual. La descripci6n de la muestra debe ser pormenorizada para que el usuario pueda decidir si es pertinente en el caso de que quiera utilizar el test. El dilema entre publicar datos demasiado detallados que reduc:e la utilidad del test o tan gener-ales que no pueda saberse con seguridad a que se esta refiriendo, fue solucionado por un editor al publicar los datos mas importantes y sealando en donde encotrar en detalle el resto de ellos. Las estadisticas basicas que deben aparecer en los manuales son las medidas de tendencia central y de dispersiOn. Si la distribuciOn frecuencial es marcadamente diversa a la utilizada en la validaciOn es necesario proceder a la revalidaciOn. (Tener en cuenta los efectos de truncamiento en la selecciOn de los sujetos, sobre todo en los estudios de prediocion de rendimiento escolar). En sintesis, la descripciOn de la muestra debera incluir todos los aspectos importantes de aquellas variables que se saben relacionadas con el atributo estudiado, indicando tambin todo factor" selectivo que 'haya determinado la composiciOn de la muestra. Si la validaciOn se realizO con la acumulaciOn de datos sin un plan determinado y con informes dados voluntariamente debe destacarselo en el manual. Tngase presente que esta for"ma de proceder afecta el tipo de validez ya que es imposible atribuirlo a una muestra sistemAtic o aleator"ia de la poblaciOn . La detet-mi naci6n debera del coef iciente de val. idez determinarse 1 que ~ con sujetos de la misma edad y formaci6r cuales se aconseja el uso del test. aquellos par -a los (Tomar en cuenta l ~ observaci6n para test de orientaci6n voc ciona] 'n\ J~I nt~rios de intereses. etc).
MUF

STRA

Cuando el criterio est definido por categorias de variable es conveniente explicitar dichas categorias y formas en que los sujetos fueron incluidos en ellas. En muchos casos es ms util los datos obtenidos en la validaci6n de pruebas en muestras locales que las ya publicadas. En este caso el manual debe alertar sobre esta conveniencia y (::lar los elementos necesar-ios para que se proceda en ese sentido. Tngase presente que las caracteristicas que definen un criterio difieren de localidad localidad o de una instituci6n a otra por lo que el clculo a J la validez con los datos plJblicados deja de tener de utj Llidad. una las MUESTRA PARA LA \vALIDEZ RELATIVA A UN CRITERIO DADO. C.5 La muestra que se emprea en un estudio sobre la validez y las condiciones en tos que se efectan la aplicaci6n de los test tiene que. ser coherente con las instrucciones que se han dado en elc..1,/nanual. La descripci6n de la muestra debe ser pormenorizada f>ara que el usuario pueda decidir si es pertinente en el caso de que quiera utilizarel test. El dilema entre publicar datos demasiado detallados que reduce la utilidad del test o tan generales que no pueda saber'se con seguridad i;a que se esta r'efiriendo, fue solucionado potIJn editor al publicar los datos mas importantes y sealando er donde encotrar en detalle el resto de ellos. --l-as estadisticas b~sicas que deben aparecer en los manuales son las medidas de tendencia central y de dispersin. Si la distribucin frecuencial es marcadamente diversa a la utilizada en la validacin es necesario proceder a la revalidacin. (Tener en cuenta los efectos de truncamiento er\ la seleccin de los sujetos, sobre todo en los estudios de predicci6n de rendimiento escolar). En sintesis, la descripci6n de la muestra deber~ incluir todos los aspectos importantes de aquellas variables que se saben relacionadas con el atributo estudiado, indicando tambin todo factor selectivo que haya determinado la composici6n de la muestra. Si la validaci6n se realiz6 con la acumulaci6n de datos sir) un plan deter-minado y con informes dados voluntariamente debe destac~rselo en el manual. Tngase presente que esta forma de proceder afecta el tipo de validez ya que es imposible atribuirlo a una mlJestra sistemAtic o aleatoria de la poblaci6n. La determinaci6n del coeficiente de validez deber-~ determinarse cor\ sujetos de la misma edad y formaci6n que aquellos para los cuales se aconseja el uso del test. (Tomar en cuenta la observaci6n para test de orientaci6n vocacional, i nvAntar-ios de inter-eses .etc) -

Se prefiere que se utilicen los conciernen a una persona. conocidos para la determinacin procedimientos es tadisticos caso contrario debe explioitarse del coeficiente d e validez. el procedimiento ,y la bibliografia en que se funda. para que formadas pueda valorar la tcr)ica personas medianal1 lente adecuadamente. La informacin a incluir sobre la validez relativa a un criterio es por lo menos la siguiente: a. uno o mAs coeficientes de correlacin de tipo familiar; b. descripcin con que el test discrimina entre los distintos grupos de la variable criter-io; o. tablas de pronsticos y predicciones; y d. diagramas que ilustren las relaciones entre el test y el criterio. Si el test ha sido propuesto para efectuar diagnstico diferencial de los pacientes debe incluir las pruebas de su capacidad para ubi~r a los pacientes en los distintos grupos diagn6sticos, mA~ bien que solamente su capacidad para separarlos ca,~os diagnosticados como anormales, indicAndose la propoilci6n de errror en las cl.~sificaciones, las que deberian ser comparadas con .las tasas bas.lcas es decir con la propor'oi6n de clasificaciones correctas que es posible realizar a par-tirdel mer-o conocimiento del tamao en el test. C.6.3 Cuando se sabe que una informaci6n acerca de los sujetos en examen, distinta de las puntuaciones propias del test, posee un notable grado de validez predictiva con respecto al criterio, y cuando la misma esta al alcance de qu ien usa el test, el manual tendr-A que consignarla val idez de la misma, conjurltamente con el coeficiente de correlaci6n multiple que se obtiene al combinar esta infor-maci6n con aquella que proporciona el test. Los coeficientes de validez deben ratificarse odicamente, publicAndose los resultados. Este periodo no peri los 15 o 20 aos debe ! exceder
VALIDEZ CONCEPTUAL

C.7

Si

el

autor

poropone

que

el

test

sea

ir\terpretado

como

una

medidad

de

una

variable

teoricamente

concebida.

el

prop6sito

deberA

ser

claramente

expr-esado;

diferenciandolo

expresamente

de

otras

interpretaciones

que

tambin

puedan

hacerse

sobr'e

la

base

de

otras

teorias.

El

manual

deberA

indicar

en

que

medida

las

j,nterpretaciones

han

sido

ratificadas

comprobadas

experimentalmente

Si

un

test

es

aplicado

con

tiempo

ilimitado ias.
r

el no debe con de
.-~,

manual

del

test

debe

indicat-

estas

circunstanc

considerarse

esta

medida

como

especificamente

elacionada , efectos "nrrA' C::II --~_. ~r-,i

la

rapidez.

Se

dejarA

tambin

constancia

de

los

la nr'\

con rapidez

otr-as

sobre

var"

las :>les

puntuaciones .

del

test

de

ial

CONFIAE

r)rp

isiOr

ILIDAD a confiabilidad (consistencia

de un estabilidad)

test de

se las

refiere medidas

a que

la s@

En correlaciones reflejan la

puntuaciones, de tr-aba.jo Del . anal isis preceden te se despr-ende que los distir\tos mtodos de calcular los coeficientes de confiabilidad tienen distintas fuentes o causas de error, que afectan los resultados. En los basados en dos o mas aplicaciones se cuenta la historia, la variacion en el sujeto, la distinta administracion,.. .Para los basados en una sola aplicacion, pasan por alto esas dificultades, al no "",", <=:-irl~r;;r como errores sus efectos sobre las puntaciones.

(o

Por esa raz6n, coef'iciente de (..:onfiabilidad es tan solo una denominaci6n general que se refieren a varios tipos de evidencias o pruebas, cada una de las cuales posee un significado diverso. Por SUS consecuencias e interpretabilidad el mtodo que se utilice par-a derivar el coeficiente de confiabilidad debe ser descripto con claridad en manual. En general el trmino confiabilidad se refiere a diversos tipos de evidencias que describen la consistencia que se debe esperar entre observaciones similares. Cada tipo de evidencia toma en cuenta solo algunas clases de inconsistencias o errores, y desconoce otros posibles. En general puede entenderse que la operacj,6n de medir puede ser vista como una :~rie de muestr-as a saber : muestra del momento o tiempo en ~e se aplica, muestra del entrevistador, muestra de it'ems, del aparato, del observador. ..operaciones de muestreo que tienen que ver en el momento de obtener una puntuac~n registrada en el test. Para el usuario del test es muy importante saber en que medida influyen los factores sealados (u otros) en la determinaci6n del puntaje y cuales serian las consecuencias de modificar alguna de las condiciones sealadas. Hay varios factores que afectan la consistencia y concomitantemente est~n aumentando la inconsistencia en .las puntuaciones obtenibles a partir de la aplicaci6n de un test: a. variaciones en las respuestas dadas por el sujeto, b. variaciones en el contenido del test o en las situaci6n de aplicaci6n, o. variaci6n en la administr-aci6n, d. variaci6n en el proceso 0.1 de observaci6n. el

GENERALES En el manual deben constarlas puntuaciones de confiabilidad el test para que el usuario pueda decidir si son suficientes para su aplicaci6n. En caso de no figurar debe dejarse sentada esa cir'cunstancia. (test-retest; pares impares; formas alternativ.as o paralelas; intercorrelaciones de las partes; an~lisis interno de datos obtenidos en una sola aplicaci6n). Tambin deben mencionarse las fuentes de inconsistencia de los items. En las pruebas de rerldimiento acadmico (escolar) colectivo las fuen'tes pr-incipales de error que hay que valorar son por lo general las siguientes: a. la inconsistencia debida a la heterogeneidad de la muestra del contenido de la prueba; b. en la aplicaci6n del tes't; o. de las respuestas en el tiempo, inestabilidad. La evaluaci6n debe ser planeada para permitir la valoraci6n de estos tres factores. 0.1.3 Las normas de confiabilidad deber~n aplicarse a toda puntuaci6n total, puntuaciones parciales o combinaci6n de puntuaciones, dej~ndose expresa constancia del mtodo mpleado sujetos utiliz~ndose para su c~lculo. O. 2 Tambin debe empleada para siempre que de,jarse constancia de la mues tra el c~lculo de confiabilidad, sea posible sujetos que estn de en tipos de

PRINCIPIOS

cicuns-tancias similares a aquellos a los que va a aplicase el test para toma decisiones. La estimaci6n de la confiabilidad de los test de endimiento e inteligencia debea ser estimada sepaadamente a par.ti de los distintos cursos que componen el sistema educativo, mencionandose media y desviaci6n estanda junto con los coeficientes de confiabilidad. La muestra de sujetos debe se descipta, mencionando cualquie aspecto que pueda indica selecci6n previa, corigiendo de ser posible los efectos por truncamiento. Se deben mencionar tambin los coeficientes de confiabilidad diferencial porsexo, o por oategoria. si corresponde etc... D.2.4 Cuando se incluya sr el manual el analisis de confiabilidad de un test de int~ligencia o de endimiento escola. que se dise6 para obtener una difeer1ciaci6n util dento del unico gado escolar. 'pste analisis tenda que fundamentarse en el estudio de las'/espuestas de dichos nios de aquel grado en particular y no" en las respuestas de una mu~sta de nios de grados divesos y con una capacidad mas heterognea. En el manual debera mencionarse si el error en la medida varia en los distintos niveles de puntuaci6n. La confiabilidad es una cuesti6n necesaia pero no suficiente de la validez; es importante la r'elaci6n pero en un sentido negativo, por cuanto un test no confiable no puede ser valido. Sin embargo, un test confiable ro es de pO si valido. puesto que su validez depende de la utilidad que se le quiet-a dar a los resultados. En sintesis es la base para la deter-minaci6n de cualquier ooefienciente de validez pero de nir19ur1 modo puede eemplazar esas estimaciones .
COMPARABI IDAD DE

AS

\jORMA

D .4 Si, se publican dos formas de un test entendiendo que ambas pueden usarse con los mismos sujetos tendr~ que consignarse la media y la varianza de ambas y la corr-elaci6n entre ellas. Si no se lo hace deber~ ponerse en aviso de esta situaci6n y sobre los riesgos que significa aceptar que las dos formas dan resultados comparables. Deber~n presentarse tambin la dificultad de los items y los indices de discriminaciOn. Toda vez que sea posible es conveniente presentarun an~lisis comparativo entre las dos formas para demostrar el grado de similaridad, en especial si son pr-uebas de rendimiento y se desea una validez por el contenido, pr'esentando una tabla resumen o diagrama. Esa tabla debe incluir la distt-iblJci6n de frecuencias de las estadisticas referidas a los items, la tabulaci6n de las frecuencias por categoria o por el contenido de la materia o de los objetivos conductuales o ~ducacionles a los que apunta el test. Las dos formas tendrian que representar dos distintas muestras de un mismo conjunto de items de cada categoria considerada.

.,~

Una similaridad artificialmente alta entre dos formas podria obtenerse apareando los items de cada una de las dos formas, sin embargo eso puede no ser deseable hacerlo puesto que asi se disminuirian los verdaderos err-ores de medidas asociadas con el Illuest-eo del (..")ontenido que se quiere repr-esentar en el test y ademas, puesto que en este caso la correlacin inter-item resultaria en una estimacin alta pero espurea de la confiabilidad. Toda vez que se establesca la comparabilidad entre dos formas de un test es necesario dejar sentado en tiempo transcurrido entr-e una toma y la siguiente . Para demostrar la comparabilidad a lo largo del r.ecorrido de las puntuaciones se qebera presentar una tabla que muestree cuales son las punt~aciones originales en las dos formas que ocupan las mismas \posiciones centiles en la poblacin. D.5 Si un test sugiere q~e una puntuacin es una medida de un rasgo homogneo y ~neralizado, debe aportar pruebas de la coherencia y consistencia interna del test. La consistencia interna es importante sobre todo si el test es una muestra extraida de un universo relativamente homogneo. Sin embargo, las medidas. de consistencia interna no deberan reemplazar a otr-as. Cuando se disponga de for-mas al ternativas habra que consignar los indices de confiabilidad entre forma y forma, pero sin que ellos excluyan los coeficientes fundados en un analisis interno. D.5.1 Las estimaciones de consistencia interna tendr~ que determinarse por los mtodos de particin por mitades o los que se conocen como mtodos de Kuder-Richarson, si pueden ser aplicados correctamente a los datos en estudio. Otras tcnicas m~s novedosas deben ser claramerlte explicadas. D.5.2 Toda vez que se publiquen coefiencientes de confiablidad fundados en el an~lisis interno, debera dejar-se sentado que la velocidad jlJega un papel irrelevarte sobre las puntuaciones. Si se asurne que la velocidad es impor-tante , aumenta el coeficiente en forma indeterminad. por ello si no se tienen formas alternativas debera calcular-se a par-tir de los puntajes obtenidos en dos horas de exarr.en, aplicado ste con tiempo limite. D.5.3 Cuando un test consta de partes o secciones deber~ dejarse constancia de las correlaciones entre ellas, conjuntamente con las medias y las desviaciones est~ndar mas importantes. Si se indica la correlacin entre un sub-testy el. total, debera dejarse aclarado que una parte de esta correlacin es ar'tificial. D .5. 4 Si varias preguntas de una pl-ueba estan empiricamente relacionadas. de manera tal. que la respuesta en una determina la r-espuesta con respecto a otra, ese grupo de preguntas debe ser considerada como un solo item. cada vez ~ue se consignen datos que surgen de la aplicacin de mtodos de analisis de la varianza o de particin en mitades. D.5.5 Si un test puede dividirse en conjunto de items de distinto contenido. el an~lisis interno podra efectuarse por mtodos diseados especiaJ.mente, como la

f6t-mula de Jacobson y Ferguson para batel-j'a, en donde los distintos considerados como un sub test.

le .l

(..~on.f"iabilil.ial.1 tipos de

de items

una son

COMPARACION A TRAYES DEL TIEMPO D .6 El manual del test debe i ndicaren qu medida las puntuaciones del test son estables; esto es, en qu medida las puntuacions tienden a ser constantes cuando el test es repetido luego que haya transcurrido un cierto tiempo. Tiene que figurar tambin efecto que toda variacin puede tener en la utilidad del test. El tiempo entre las tomas puede var-iar conforme a naturaleza del test ya las inter-pretaciones que a partir de l puedan hacerse . En nuestras ciencias las variaciones son frecuent.es , grandes y se dan en corto tiempo, -1,,0 que de por si afectan el procedimiento de medicin; de cu~~quier modo toda medicin tiene que tener algOn grado de estabilidad para que tenga valor, si bien deben refle,jar las",modificaciones propias de los sujetos y del atributo que mide'j'). D.6.1 La determinaci6n de la estabilidad por toma subesivas tentra que surgir por la aplicacin de formas paralelas (alternativas) para minimizar los efectos del recuerdo y del aprendizaje de respuestas especificas. Este requisito es particular-mente importante si el tiempo transcurrido entre las tomas no es muy amplio, para asegurar el olvido de las respuestas dadas en la primer-a toma del D.6.2 Ademas de los coeficientes de cor"r-elacion debe figurar en e1. manual los valores promedios y desviacion estandar de cada toma, en la estimacion de la estabilidad de los puntajes en el tiempo. D.6.3 Si los datos en el test son asentados en el legajo personal de sujeto; el manual debe dejar establecido el tiempo en que ese puntaje puede ser utilizado para tomar decisiones con respecto al sujeto, debindose informar acerca de los cambios en la medias y en las desviaciones estandar que se producen en el test en tomas sucesivas despus de uno, dos aos. Tamin el manual debe dejar las experiencias mas relevantes del muestra en las distintas aplicaciones o tres sentado cuales grupo que sirvio del test. fueron como test.

E.

ADMINISTRACION Y SCORING E .1 Las instr"ucciones para la aplicaci6n del test tentr.3n que ser presentadas en el manual con suficiente claridad, subrayando la necesidad de que el usuar-io respete las mismas condiciones en que el test fue preparado. Para ello las instrucciones deber-.3n ser- completas y claras, par-a que las personas que se someten al test entiendan que es lo que el autor del test pide de ellos, esto es principalmente CLJ 5e considera re5Puesta en cada si tuaci6rl.

cor\ respecto respuestas ampliar testista elaborar

instrucciones para el examinado deben ser claras a los aspectos criticos como, adivinaci6n de las correctas, timpo, uso de la hoja de respuesta. Tambin debe informarse acerca de la posibilidad de o reformular las consigna dadas, indicandose si el esta en libertad de utilizar su mejor juicio para una consigna y dar ejemplos aclaratorios

Las

complementarios. E.2 Los mtodos de correcci6n y puntuaci6n del test deben ser presentados con maximo detalle y claridad para evitaro disminuir cualquier equivocaci6n en la puntuaci6n de los test, debe incluir tambin las formas de control y verificaci6n por si las puntuaciones tienen algLIn error de c6mputo o transcripci6n como calculo reiterado de las puntuaciones correspondietes en ,una hoja de respuesta, corregir separadamente las respuestas correctas y las incor-rectas, o el empleo de corrector-es independientes, y el control repetido de los totales gen~rales. Si la valoraci6n del ;i test incluye elementos sujetivos el manual debe llamar la atenci6n acerca del acuerdo entre las distintas valor-aciones y las formas de controlarlas, para evitar errores importantes en la medici6n. Las bases para ~l entrenamiento de cor-r.ector-es debe ser preserltada con suf iciente claridad y detalle, pal-a que se logr-e el mismo gr.ado de acuer-do que los cor-r'ector-es que se utilizaron para efectuar el estudio inicial. E.2.3 Si el test ha sido proyectado para que el examinado pueda utilizar mas de una forma para registrar sus r-espuestas, se debe dejar constancia de la intercambiabilidad de los resultados obtenidos a travs de los mismos. E.2.5 El manual tendra que recomendar el empleo de f6rmulas para corregir el azar o el efecto de respuestas adivinadas. Cuando el manual indica que hay que usarla f6rmual para la (,.~ol-'-e(,.~(,.~i6n por las respuestas adi\.-'inadas sera pr-eciso adver.tir al examinado que, en caso de dudas elija la respuesta mas verosimil y pase por alto solamente aquellos ltems en que no conocen el absoluto la respuesta corr-ecta.

F.

ESCALAS y NORMAS O BAREMOS F.l Las escalas para interpretar las puntuaciones tendran que ser descriptas cuidadosamente de manera de que se aumente la pr-obabilidad de una interpretaci6n y correcci6n correctas. Si bien no se desalienta la utilizaci6n de escalas especiales cuando asi lo exijan las circunstancias, ni que se investigue en este sentido. se sugiere que se empleen las puntuaciones estandar o z, con preferencia a otr.os tipos de puntuaciones derivadas. En los casos mas generales se sugiere qlJe para pu ntuaciones estandar de dos ci f r-as se u ti 1 ice una media de 50 puntos y una desviaci6n de 10; para las de unas cifr-a, una media de 5 y una desviaci6n de 2. .Si se proveen normas relativas a gr.ados de ~0::~("\l;:r;'.;:~;("\ndeben orooonerse tablas separadas par-a cada

S-ar putea să vă placă și