Sunteți pe pagina 1din 325

Pablo Cazau

Estadstica y metodologa de la investigacin



Presentacin
Captulo 1: Introduccin a la estadstica
Captulo 2: Estadstica descriptiva
Captulo 3: Probabilidad y curva normal
Captulo 4: Correlacin y regresin
Captulo 5: Estadstica inferencial
Captulo 6: Investigacin e investigacin cientfica
Captulo 7: Tipos de investigacin cientfica
Captulo 8: Causalidad y experimento
Captulo 9: Las etapas de la investigacin tpica
Captulo 10: Problema, bibliografa, teora y objetivos
Captulo 11: Hiptesis y variables
Captulo 12: Tcnicas de muestreo e instrumentos de medicin
Captulo 13: El diseo de investigacin
Captulo 14: El procesamiento de los datos
Captulo 15: Redaccin y publicacin de los resultados
Captulo 16: Investigaciones especiales
Referencias bibliogrficas de estadstica
Otras fuentes consultadas para estadstica
Referencias bibliogrficas de metodologa
Anexos de estadstica
Anexos de metodologa

LA FORMA DE CITAR LA PRESENTE BIBLIOGRAFA ES LA SIGUIENTE:
Cazau Pablo (2011), Estadstica y metodologa de la investigacin. Buenos Aires: Biblioteca
Redpsicologa.

Buenos Aires, Junio 2012. Ms informes: pcazau@gmail.com

INDICE GENERAL

Presentacin

PARTE I: ESTADSTICA

CAPTULO 1: INTRODUCCIN A LA ESTADSTICA

1. DEFINICIN Y UTILIDAD DE LA ESTADSTICA
2. CLASIFICACIONES DE LA ESTADSTICA
3. POBLACIN Y MUESTRA
4. ESTRUCTURA DEL DATO
5. LA MEDICIN

CAPTULO 2: ESTADSTICA DESCRIPTIVA

1. GENERALIDADES
2. ORDENAMIENTO Y AGRUPACIN DE LOS DATOS: MATRICES Y TABLAS
3. VISUALIZACIN DE LOS DATOS: GRFICOS
4. SNTESIS DE LOS DATOS: MEDIDAS ESTADSTICAS DE POSICIN
5. SNTESIS DE LOS DATOS: MEDIDAS ESTADSTICAS DE DISPERSIN
6. SNTESIS DE LOS DATOS: ASIMETRA Y CURTOSIS
NOTAS

CAPTULO 3: PROBABILIDAD Y CURVA NORMAL

1. EL CONCEPTO DE PROBABILIDAD
2. ANLISIS COMBINATORIO
3. DEFINICIN Y CARACTERSTICAS DE LA CURVA NORMAL
4. PUNTAJES BRUTOS Y PUNTAJES ESTANDARIZADOS
5. APLICACIONES DE LA CURVA NORMAL
NOTAS

CAPTULO 4: CORRELACIN Y REGRESIN

1. INTRODUCCIN
2. EL ANLISIS DE CORRELACIN
3. CLCULO GRFICO DE LA CORRELACIN
4. CLCULO ANALTICO DE LA CORRELACIN
5. UN EJEMPLO: CONSTRUCCIN Y VALIDACIN DE TESTS
6. EL ANLISIS DE REGRESIN
7. CLCULO ANALTICO DE LA REGRESIN
8. CLCULO GRFICO DE LA CORRELACIN
NOTAS

CAPTULO 5: ESTADSTICA INFERENCIAL

1. INTRODUCCIN
2. ESTIMACIN DE PARMETROS
3. PRUEBA DE HIPTESIS
4. EJEMPLOS DE PRUEBAS DE HIPTESIS
5. EL CONCEPTO DE SIGNIFICACIN ESTADSTICA
NOTAS

PARTE II: METODOLOGA DE LA INVESTIGACIN

CAPTULO 6: INVESTIGACIN E INVESTIGACIN CIENTFICA

1. QU ES INVESTIGACIN
2. TIPOS DE INVESTIGACIN
3. LA INVESTIGACIN CIENTFICA
4. EL MTODO EN LA INVESTIGACIN CIENTFICA
5. EL ENCUADRE EN LA INVESTIGACIN CIENTFICA
6. LA FORMACIN DEL INVESTIGADOR CIENTFICO

CAPTULO 7: TIPOS DE INVESTIGACIN CIENTFICA

1. INVESTIGACIN PURA, APLICADA Y PROFESIONAL
Bases cientficas de la investigacin
Investigacin y tica
Interrelaciones entre los tres tipos de investigacin
Los tres tipos de investigacin y los contextos de la ciencia
2. INVESTIGACIN EXPLORATORIA, DESCRIPTIVA, CORRELACIONAL Y EXPLICATIVA
Investigacin exploratoria
Investigacin descriptiva
Investigacin correlacional
Investigacin explicativa
Otras consideraciones
Un anlisis crtico de la propuesta tipolgica
Algunos ejemplos de investigaciones descriptivas y explicativas
3. INVESTIGACIN TERICA Y EMPRICA
4. INVESTIGACIN CUALITATIVA Y CUANTITATIVA
5. INVESTIGACIONES PRIMARIA Y BIBLIOGRFICA
6. CONCLUSIONES

CAPTULO 8: CAUSALIDAD Y EXPERIMENTO

1. CAUSA Y CAUSALIDAD
Unicausalidad y policausalidad
Hacia una definicin de causa
Requisitos de causalidad
2. EL EXPERIMENTO
Definicin
Medicin de la variable dependiente
Manipulacin de la variable independiente
Grupo experimental y grupo de control
Experimento y no experimento
Limitaciones del experimento
Experimento y diseo experimental
Validez interna y validez externa del experimento
Las variables extraas
Control de las variables extraas
Pruebas de confirmacin y pruebas de refutacin
Experimentos bivariados y multivariados
Un inventario de relaciones entre variables
3. LOS CNONES DE STUART MILL
Una presentacin de los mtodos de Mill
Crticas y comentarios a los mtodos de Mill
Antecedentes histricos
Los mtodos de Mill y los mtodos experimentales actuales

CAPTULO 9: LAS ETAPAS DE LA INVESTIGACIN TPICA

CAPTULO 10: PROBLEMA, BIBLIOGRAFA, TEORA Y OBJETIVOS

1. PLANTEO DEL PROBLEMA
2. REVISIN BIBLIOGRFICA
3. PLANTEO DEL MARCO TERICO
4. PLANTEO DE OBJETIVOS

CAPTULO 11: HIPTESIS Y VARIABLES

1. HIPTESIS
Definicin
Clasificacin de las hiptesis
Componentes de la hiptesis: los conceptos
2. VARIABLES
Definicin
Relacin entre variables y unidades de anlisis
La definicin conceptual de las variables
Clasificacin de las variables
Categorizacin de las variables
La definicin operacional de las variables u operacionalizacin
Relaciones entre la categorizacin y la operacionalizacin

CAPTULO 12: TCNICAS DE MUESTREO E INSTRUMENTOS DE MEDICIN

1. DEFINICIN DE LA POBLACIN
2. SELECCIN DE LA TCNICA DE MUESTREO
3. SELECCIN DEL INSTRUMENTO DE MEDICIN

CAPTULO 13: EL DISEO DE INVESTIGACIN

1. VERSIN CAMPBELL Y STANLEY
Diseos preexperimentales
Diseos experimentales propiamente dichos
Diseos cuasiexperimentales
2. VERSIN LEN Y MONTERO
Diseos de investigacin con encuestas
Diseos experimentales con grupos
Diseos de N = 1 (diseos de sujeto nico)
Diseos cuasi experimentales
3. VERSIN ARNAU GRAS
Diseos experimentales
Diseos experimentales simples
Diseos experimentales factoriales
Diseos experimentales de bloques homogneos
Diseos intrasujeto (o de medidas repetidas)
Diseos experimentales no estadsticos
Diseos preexperimentales
Diseos cuasiexperimentales
4. VERSIN SELLTIZ ET AL
5. OTRAS VERSIONES
Versin Kohan
Versin Hernndez Sampieri et al
Versin Lores Arnaiz
Versin Greenwood
Versin ONeil
6. CONCLUSIONES

CAPTULO 14: EL PROCESAMIENTO DE LOS DATOS

1. RECOLECCIN DE LOS DATOS
La observacin
La entrevista
El cuestionario
El test
2. ORGANIZACIN DE LOS DATOS
Pasos de la organizacin de los datos
El anlisis factorial
3. ANLISIS DE LOS DATOS
El anlisis de la varianza
4. INTERPRETACIN DE LOS DATOS

CAPTULO 15: REDACCIN Y PUBLICACIN DE LOS RESULTADOS

1. REDACCIN DE LOS RESULTADOS
La forma del texto
El contenido del texto
La bibliografa
La conexin entre una cita bibliogrfica y una referencia bibliogrfica
Algunos errores posibles
Precauciones
2. PUBLICACIN DE LOS RESULTADOS
3. COMO HACER UNA MONOGRAFA

CAPTULO 16: INVESTIGACIONES ESPECIALES

1. INVESTIGACIN MDICA
2. INVESTIGACIN GRAFOLGICA
La cientificidad de la grafologa
La investigacin en grafologa
Grafologa y psicologa
Conclusiones

REFERENCIAS BIBLIOGRFICAS DE ESTADSTICA

OTRAS FUENTES CONSULTADAS PARA ESTADSTICA

REFERENCIAS BIBLIOGRFICAS DE METODOLOGA

ANEXOS DE ESTADSTICA

ANEXO 1: NOMENCLATURA UTILIZADA EN ESTA GUA
ANEXO 2: TABLA DE REAS BAJO LA CURVA NORMAL ESTANDARIZADA
Tabla 1 reas desde z hacia la izquierda
Tabla 2 reas desde z = 0 hacia la izquierda o hacia la derecha
ANEXO 3: TABLA DE LA DISTRIBUCIN t

ANEXOS DE METODOLOGA

ANEXO 1. PREGUNTAS MULTIPLE CHOICE
ANEXO 2. EJERCITACIONES VARIAS
ANEXO 3. EJERCITACIN CON INVESTIGACIONES
ANEXO 4. NORMAS DE PUBLICACIN DE LA APA Y COMPARACIN CON LAS NORMAS DE VANCOUVER
ANEXO 5. NORMAS PARA HACER REFERENCIA A DOCUMENTOS CIENTFICOS DE INTERNET EN EL ESTILO
WEAPAS (LAND, 1998)
ANEXO 6. GUA PARA MONOGRAFAS.
PRESENTACIN

El presente texto abarca dos grandes partes: estadstica y metodologa de la investigacin.
El material de estadstica fue pensado como un manual de consulta para alumnos de diversas carreras
universitarias de grado y posgrado que cursan asignaturas donde se ensea la estadstica como
herramienta de la metodologa de la investigacin cientfica. Se brinda aqu un panorama general e
introductorio de los principales temas de una disciplina que opera en dos grandes etapas: la estadstica
descriptiva y la estadstica inferencial. Tambin se desarrollan los conceptos de probabilidad y curva
normal, bsicos para la comprensin de la estadstica inferencial, y los conceptos de correlacin y
regresin vinculados, respectivamente, con las etapas descriptiva e inferencial.
El material de metodologa de la investigacin, fruto de varios aos de enseanza universitaria en los
niveles de grado y posgrado, intenta explicar cmo procede el cientfico cuando investiga la realidad en
el mbito de las ciencias sociales.
Esencialmente, la investigacin tiene dos etapas: proponer una hiptesis como respuesta a un
problema, y luego probarla. Para la primera puede necesitarse intuicin y creatividad, y el cientfico no
est tan sujeto a normas como en la segunda etapa, en la cual se requiere un mtodo provisto de reglas
especficas que cuidarn que la hiptesis planteada quede efectivamente confirmada (o refutada).
El presente texto trata acerca de los pasos concretos que habitualmente da el cientfico cuando realiza
una investigacin tpica en ciencias sociales, que se presentan en forma panormica en uno de los
captulos, el 9.
La primera edicin de este libro (Noviembre 1991) form parte de la bibliografa obligatoria de la ctedra
de Investigacin Psicopedaggica II (Carrera de Psicopedagoga. Buenos Aires, Universidad de Belgrano.
Profesora titular: Lic. Liliana Hernndez).
La segunda edicin (Julio 2002) form parte de la bibliografa obligatoria de las ctedras de Metodologa
de la Investigacin (Carrera de Trabajo Social. Buenos Aires, Universidad del Museo Social Argentino.
Profesora titular: Lic. Norma Ramljak de Bratti), y Metodologa de la Investigacin I, II y III (Carrera de
Especialista en Ortodoncia. Buenos Aires, Fundacin Favaloro y Asociacin Argentina de Odontodologa.
Profesor titular: Lic. Pablo Cazau). Tambin sirvi de base para el desarrollo de investigaciones en la
Asociacin Panamericana de Grafologa.

Pablo Cazau. Buenos Aires, Junio 2012.
PARTE I: ESTADSTICA

CAPTULO 1: INTRODUCCIN A LA ESTADSTICA

1. DEFINICIN Y UTILIDAD DE LA ESTADSTICA

La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran
cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos.
Por ejemplo, la estadstica interviene cuando se quiere conocer el estado sanitario de un pas, a travs de
ciertos parmetros como la tasa de morbilidad o mortalidad de la poblacin. En este caso la estadstica
describe la muestra en trminos de datos organizados y resumidos, y luego infiere conclusiones respecto
de la poblacin. Por ejemplo, aplicada a la investigacin cientfica, hace inferencias cuando emplea
medios matemticos para establecer si una hiptesis debe o no ser rechazada.

A veces la estadstica ha sido cuestionada por mentir distorsionando los datos de la realidad, pero ello no la hace
menos cientfica: en todo caso se trata de un uso tendencioso de la estadstica para lograr algn fin. Una errnea
lectura de la informacin estadstica puede dar lugar a algunas de las siguientes conclusiones un tanto risueas:
a) La tasa de natalidad es el doble que la tasa de mortalidad; por lo tanto, una de cada dos personas es inmortal.
b) El no tener hijos es hereditario; si tus padres no tuvieron ninguno, lo ms probable es que t tampoco los
tengas. c) En Nueva York un hombre es atropellado cada diez minutos. El pobre tiene que estar hecho polvo. d)
La probabilidad de tener un accidente de trfico aumenta con el tiempo que pasas en la calle. Por tanto, cuanto
mas rpido circules, menor es la probabilidad de que tengas un accidente. e) El 33 % de los accidentes mortales
involucran a alguien que ha bebido. Por tanto, el 67 % restante ha sido causado por alguien que no haba bebido.
A la vista de esto y de lo anterior, esta claro que la forma mas segura de conducir es ir borracho y a gran
velocidad.

La estadstica puede aplicarse a cualquier mbito de la realidad, y por ello es utilizada en fsica, qumica,
biologa, medicina, astronoma, psicologa, sociologa, lingstica, demografa, etc.
Cuando en cualquiera de estas disciplinas se trata de establecer si una hiptesis debe o no ser rechazada,
no siempre es indispensable la estadstica inferencial.
Por ejemplo, si sobre 60 veces que se mira un dado, sale un dos 10 veces, no se requiere la estadstica
para rechazar la hiptesis el dado est cargado. Si sale un dos en 58 ocasiones sobre 60, tampoco se
necesita la estadstica para aceptar la hiptesis el dado est cargado.
Pero, qu ocurre si el nmero dos sale 20, 25 o 30 veces? En estos casos de duda, la estadstica
interviene para determinar hasta qu cantidad de veces se considerar rechazada la hiptesis (o bien
desde qu cantidad de veces se la considerar aceptada). En otras palabras, la estadstica interviene
cuando debe determinarse si los datos obtenidos son debidos al azar o son el resultado de un dado
cargado.
Otro ejemplo. Si una persona adivina el color (rojo o negro) de las cartas en un 50% de los casos, se
puede rechazar la hiptesis la persona es adivina. Si, en cambio, acierta en el 99% de los casos el color
de las cartas, se puede aceptar la mencionada hiptesis. Los casos de duda corresponden a porcentajes
de acierto intermedios, como el 60%, el 70%, etc., en cuyos casos debe intervenir la estadstica para
despejarlos.
La importancia de la estadstica en la investigacin cientfica radica en que la gran mayora de las
investigaciones son casos de duda.

2. CLASIFICACIONES DE LA ESTADSTICA

Existen varias formas de clasificar los estudios estadsticos.
1) Segn la etapa.- Hay una estadstica descriptiva y una estadstica inferencial. La primera etapa se
ocupa de describir la muestra, y la segunda etapa infiere conclusiones a partir de los datos que describen
la muestra (por ejemplo, conclusiones con respecto a la poblacin).
Tanto la estadstica descriptiva como la estadstica inferencial se ocupan de obtener datos nuevos. La
diferencia radica en que la estadstica descriptiva procede a resumir y organizar esos datos para facilitar
su anlisis e interpretacin, y la estadstica inferencial procede a formular estimaciones y probar hiptesis
acerca de la poblacin a partir de esos datos resumidos y obtenidos de la muestra. Puesto que estas
ltimas operaciones llevarn siempre a conclusiones que tienen algn grado de probabilidad, la teora de
la probabilidad constituye una de sus herramientas principales. Tngase presente que en s misma la
teora de la probabilidad no forma parte de la estadstica porque es otra rama diferente de la matemtica,
pero es utilizada por la estadstica como instrumento para lograr sus propios objetivos.
La estadstica descriptiva tambin incluye explcita o implcitamente- consideraciones probabilsticas,
aunque no resultan ser tan importantes como en la estadstica inferencial. Por ejemplo, la eleccin de un
determinado estadstico para caracterizar una muestra (modo, mediana o media aritmtica) se funda
sobre ciertas consideraciones implcitas acerca de cul de ellos tiene ms probabilidades de representar
significativamente el conjunto de los datos que se intenta resumir.
Tanto la estadstica descriptiva como la inferencial implican, entonces, el anlisis de datos. Si se realiza
un anlisis con el fin de describir o caracterizar los datos que han sido reunidos, entonces estamos en el
rea de la estadstica descriptiva Por otro lado, la estadstica inferencial no se refiere a la simple
descripcin de los datos obtenidos, sino que abarca las tcnicas que nos permiten utilizar los datos
muestrales para inferir u obtener conclusiones sobre las poblaciones de las cuales fueron extrados dichos
datos (Pagano, 1998:19).
La estadstica inferencial se ocupa de problemas como los siguientes: 1) Relacin entre muestra y
poblacin: estimar parmetros poblacionales a partir de estadsticos muestrales, determinar la
probabilidad que una muestra pertenezca a una poblacin, o examinar de si hay diferencia significativa
entre muestra y poblacin. 2) Relacin entre dos muestras: determinar si hay diferencias significativas
entre dos muestras de una poblacin, o determinar si la diferencia entre dos muestras significa que las
poblaciones muestreadas son ellas mismas realmente diferentes.
Kohan, por su parte, sintetiza as su visin de las diferencias entre ambos tipos de estadstica: Si
estudiamos una caracterstica de un grupo, sea en una poblacin o en una muestra, por ejemplo talla,
peso, edad, cociente intelectual, ingreso mensual, etc., y lo describimos sin sacar de ello conclusiones
estamos en la etapa de la estadstica descriptiva. Si estudiamos en una muestra una caracterstica
cualquiera e inferimos, a partir de los resultados obtenidos en la muestra, conclusiones sobre la poblacin
correspondiente, estamos haciendo estadstica inductiva o inferencial, y como estas inferencias no
pueden ser exactamente ciertas, aplicamos el lenguaje probabilstico para sacar las conclusiones
(Kohan, 1994:25). Kohan emplea la palabra inductiva porque las inferencias realizadas en este tipo de
estadstica son razonamientos inductivos, modernamente definidos como razonamientos cuya conclusin
es slo probable.
En suma: la estadstica descriptiva debe preocuparse de si la muestra est o no bien descripta a partir
de los datos de los individuos, mientras que la estadstica inductiva se preocupar de establecer la
representatividad de la muestra respecto de la poblacin. Ms generalmente, la primera es
eminentemente descriptiva y no ampla mayormente nuestro conocimiento: mas bien lo resume
mediante las medidas estadsticas. En cambio la segunda s ampla nuestro conocimiento pues lo
extiende (con cierto margen de error) a toda la poblacin, y de all su carcter predictivo.
2) Segn la cantidad de variables estudiadas.- Desde este punto de vista hay una estadstica univariada
(estudia una sola variable, como por ejemplo la inteligencia), una estadstica bivariada (estudia la
relacin entre dos variables, como por ejemplo inteligencia y alimentacin), y una estadstica
multivariada (estudia tres o ms variables, como por ejemplo como estn relacionados el sexo, la edad y
la alimentacin con la inteligencia).
El siguiente esquema ilustra la relacin entre dos clasificaciones de la estadstica: descriptiva / inferencial
y univariada / bivariada.



La estadstica descriptiva se ocupa de muestras, y la estadstica inferencial infiere caractersticas de la
poblacin a partir de muestras.
A su vez, ambas etapas de la estadstica pueden estudiar una variable por vez o la relacin entre dos o
ms variables. Por ejemplo, a) en el caso de la estadstica univariada, el clculo de medidas de posicin y
dispersin en una muestra corresponde a la estadstica descriptiva, mientras que la prueba de la media
corresponde a la estadstica inferencial; b) en el caso de la estadstica bivariada, el anlisis de correlacin
de variables en una muestra corresponde estrictamente hablando a la estadstica descriptiva, mientras
POBLACION

MUESTRA

Parmetros

x
1
x
2

x
n


Estadsticos

x
1

y
1


x

y

x

y

Una variable

Dos (o ms) variables

que el anlisis de regresin o las pruebas de hiptesis para coeficientes de correlacin (Kohan N,
1994:234) corresponden a la estadstica inferencial.
3) Segn el tiempo considerado.- Si se considera a la estadstica descriptiva, se distingue la estadstica
esttica o estructural, que describe la poblacin en un momento dado (por ejemplo la tasa de
nacimientos en determinado censo), y la estadstica dinmica o evolutiva, que describe como va
cambiando la poblacin en el tiempo (por ejemplo el aumento anual en la tasa de nacimientos).
La estadstica descriptiva dinmica o evolutiva estudia las llamadas series temporales o cronolgicas. Se
trata de series determinadas por dos variables, una de las cuales es el tiempo generalmente medido en
aos. La serie se ordena de acuerdo a la variable tiempo (X) y, en funcin de su variacin, variar la otra
variable, que puede ser por ejemplo cantidad de habitantes o temperaturas mximas (Y).
De acuerdo a como vara la variable Y, las series cronolgicas pueden ser crecientes (cuando Y va
aumentando a lo largo del tiempo), decrecientes (cuando Y va disminuyendo a lo largo del tiempo),
alternadas (cuando Y aumenta y disminuye cclicamente), y estacionarias (cuando los valores de Y
difieren poco respecto de un valor medio).
Las series temporales no sirven solamente para describir la evolucin de Y en el tiempo, sino tambin
para hacer predicciones, aunque estas generalmente se hacen a corto plazo porque son muchos los
factores que pueden incidir en la evolucin de Y, tornndose entonces incierta la prediccin.
Existen diversos procedimientos para describir o predecir en las series temporales: el mtodo grfico, el
mtodo de los dos promedios, el mtodo de las medias mviles y el mtodo de los cuadrados mnimos.
Los diferentes valores que adquiere Y a lo largo del tiempo pueden descomponerse en partes, llamadas
componentes de la serie, y que bsicamente son cuatro: tres componentes sistemticos y una
componente aleatoria. Los componentes sistemticos estn sujetos a leyes precisas y son la Tendencia
(describe como evoluciona Y a corto y largo plazo), el componente Estacional (describe modificaciones
repetitivas observables en la evolucin de Y en periodos definidos dentro de un periodo mayor), y el
componente Cclico (describe variaciones mayores en la evolucin de Y en lapsos repetitivos no definidos
dentro de uno mayor). La diferencia entre Estaconal y Cclico reside especialmente en el tiempo
considerado: menor para lo Estacional (por ejemplo cada ao hay variaciones estacionales), y mayor
para lo Cclico (por ejemplo cada diez aos hay periodos de prosperidad o depresin econmica). La
componente aleatoria describe la evolucin de Y en tanto depende del azar, y es por tanto impredecible.

3. POBLACIN Y MUESTRA

Puesto que la estadstica se ocupa de una gran cantidad de datos, debe primeramente definir de cules
datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio estadstico se
llama poblacin.
No debe confundirse la poblacin en sentido demogrfico y la poblacin en sentido estadstico.
La poblacin en sentido demogrfico es un conjunto de individuos (todos los habitantes de un pas, todas
las ratas de una ciudad), mientras que una poblacin en sentido estadstico es un conjunto de datos
referidos a determinada caracterstica o atributo de los individuos (las edades de todos los individuos de
un pas, el color de todas las ratas de una ciudad).
Incluso una poblacin en sentido estadstico no tiene porqu referirse a muchos individuos. Una poblacin
estadstica puede ser tambin el conjunto de calificaciones obtenidas por un individuo a lo largo de sus
estudios universitarios.
La poblacin o universo, definible como el conjunto de todas las unidades de anlisis, puede ser finita o
infinita, segn tenga o no un nmero determinado de individuos: se puede considerar infinito al
conjunto de todos los individuos posibles segn su combinacin gentica. La poblacin tambin puede
ser real o potencial: una poblacin real es el conjunto de todos los argentinos mayores de 18 aos y
menores de 20, y poblacin potencial es por ejemplo el conjunto de todas las personas que podran
utilizar el servicio de psicopatologa de un hospital.

En el siguiente esquema pueden apreciarse algunas formas de considerar los datos individuales, segn
que correspondan a muchas personas o a una sola, y tambin segn que hayan sido recolectados en un
instante de tiempo determinado, o bien a lo largo del tiempo.

De muchos individuos De un solo individuo
En un instante de tiempo Notas de todos los alumnos en el
primer parcial de tal mes y tal ao.
Notas de un solo alumno en el
primer parcial de las materias que
cursa en ese momento.
A lo largo del tiempo Notas de todos los alumnos durante
los 6 aos de carrera.
Notas de un alumno a lo largo de
los 6 aos de carrera.

Los datos de la totalidad de una poblacin pueden obtenerse a travs de un censo. Sin embargo, en la
mayora de los casos no es posible hacerlo por razones de esfuerzo, tiempo y dinero, razn por la cual se
extrae, de la poblacin, una muestra, mediante un procedimiento llamado muestreo. Se llama muestra
a un subconjunto de la poblacin, que puede o no ser representativa de la misma, y que puede estar
formada por uno o muchos individuos.
Por ejemplo, si la poblacin es el conjunto de todas las edades de los estudiantes de la provincia de
Buenos Aires, una muestra podra ser el conjunto de edades de 2000 estudiantes de la provincia de
Buenos Aires tomados al azar.
Obviamente, hay que asegurarse de que la muestra sea representativa de la poblacin: si se quiere
tomar una muestra de los habitantes de una ciudad y slo se seleccionan veinte enfermos mentales de
un hospicio, esta muestra no representar adecuadamente a la poblacin. En cambio si se selecciona la
misma cantidad de sujetos tomando uno de cada 100 de la gua telefnica aqu ya se puede empezar a
pensar ms en la posibilidad de cierta representatividad, pues estn tomados ms al azar.
An as no hay un azar total, pues en la gua no figuran por ejemplo individuos de clase baja (no tienen
telfono); y si se elige por una lista de empadronamiento para votar, all no figurarn los extranjeros
residentes. Un procedimiento bastante aleatorio, en cambio, consiste en elegir un individuo por cada
manzana.
El tamao elegido para la muestra es tambin importante, y variar de acuerdo a cada investigacin
pudiendo ser el 5%, el 20%, etc., de la poblacin total. Suele ser difcil elegir el tamao justo, ya que
no se puede pecar por defecto (un solo individuo no representa a una ciudad, an tomndolo al azar) o
por exceso (una muestra que sea el 80% de la poblacin es altamente confiable pero no econmica, ya
que con menos esfuerzo y dinero puede obtenerse una muestra considerablemente ms pequea sin
que vare en forma significativa su grado de representatividad).

Para saber cuando el tamao de una muestra es aceptable, debe considerarse, adems de la varianza
poblacional (heterogeneidad de la poblacin), otros dos factores que son el nivel de confianza y el mximo
error permitido en las estimaciones (tambin llamado error muestral).
En principio, cuanto ms homognea es la poblacin, menor ser el tamao requerido de la muestra.
Para determinar el tamao de la muestra, deber primero determinarse un nivel de confianza y un mximo
error permitido (valores que determinar el investigador). Una vez conocidos estos valores, se puede
determinar el tamao de la muestra por varios caminos. Por ejemplo (Kohan, 1994:181) (Rubio y otro,
1997:290):
a) Utilizar la frmula de N (tamao de la muestra), donde el numerador es el producto entre el cuadrado del
nivel de confianza y la varianza poblacional, y el denominador el cuadrado del error permitido. Esta frmula es
aplicable slo en poblaciones infinitas (ms de 100.000 elementos), y cuando el procedimiento de muestreo fue
aleatorio simple. Tambin hay frmulas especiales para poblaciones finitas, donde se introduce un factor de
correccin con una especificacin del tamao de la poblacin.
b) Si no se quiere utilizar una frmula, puede recurrirse a tablas especiales ya preparadas para estos
menesteres, como por ejemplo las tablas de Tagliacarne. Para consultarlas, es preciso conocer antes qu nivel
de confianza y qu error muestral ser considerado.

Los muestreos se dividen clsicamente en probabilsticos y no probabilsticos. Lo esencial del muestreo
probabilstico es que cada individuo de la poblacin total tiene la misma o aproximadamente la misma
probabilidad de estar includo en la muestra. Si se toma una muestra de los habitantes de Londres
considerando uno de cada 100 de un listado alfabtico, la probabilidad que tiene de haber sido
seleccionado el seor Smith es la misma que tiene el seor Brown o cualquier otro (en este caso, la
probabilidad del uno por ciento).
Hay varias tcnicas para realizar muestreos probabilsticos, y todas se basan en la seleccin de
individuos al azar ya que es ste quien presuntamente garantiza la equiprobabilidad. El muestreo puede
ser: a) simple: partiendo de toda la poblacin se toman individuos al azar segn diversos
procedimientos; b) estratificado: previamente se seleccionan en la poblacin estratos (por ejemplo
clases sociales: alta, media y baja), y dentro de cada estrato se toman individuos al azar segn el
muestreo simple; c) por reas o conglomerados: se delimitan previamente reas geogrficas
(provincias, ciudades) y dentro de cada una de ellas se toman individuos al azar segn el muestreo
simple o estratificado.
En el muestreo no probabilstico los individuos de la poblacin no tienen todos la misma probabilidad de
aparecer en la muestra, ya que aqu no se hace una estricta seleccin al azar sino que se toman casos
tpicos (que se suponen representativos de la media poblacional) o casos en forma accidental (los que
tenemos ms a mano), etc.
Una vez obtenida la muestra (preferiblemente mediante muestreo probabilstico), se procede a
describirla, para lo cual se usan ciertas medidas especiales diferentes a las medidas que usamos para
medir individuos. Si se quiere describir sujetos individuales se usa una medida individual: Juancito tiene
cociente intelectual 110, o Pedrito tiene poco inters en poltica, etc. Pero, si se quiere describir una
muestra se usar lo que se llama una medida estadstica. Por ejemplo, tal muestra se compone de
sujetos cuyo promedio de cocientes intelectuales es 120, o tal otra muestra tiene un 70% de sujetos
con poco inters en poltica, etc. Como se ve, estas medidas estadsticas son verdaderas sntesis o
resmenes de muchas medidas individuales, y un ejemplo tpico es la media aritmtica, o sea, un
simple promedio.

4. ESTRUCTURA DEL DATO

Los datos son la materia prima con que trabaja la estadstica, del mismo modo que la madera es la
materia prima con que trabaja el carpintero. As como este procesa o transforma la madera para obtener
un producto til, as tambin el estadstico procesa o transforma los datos para obtener informacin til.
Tanto los datos como la madera no se inventan: se extraen de la realidad; en todo caso el secreto est
en recoger la madera o los datos ms adecuados a los objetivos del trabajo a realizar. El dato es siempre
el resultado de un proceso de medicin.
De una manera general, puede definirse tcnicamente dato como una categora asignada a una variable
de una unidad de anlisis. Por ejemplo, Luis tiene 1.70 metros de estatura es un dato, donde Luis es
la unidad de anlisis, estatura es la variable, y 1.70 metros es la categora asignada.
Como puede apreciarse, todo dato tienen al menos tres componentes: una unidad de anlisis, una
variable y una categora.

La unidad de anlisis es el elemento del cual se predica una propiedad y caracterstica. Puede ser una
persona, una familia, un animal, una sustancia qumica, o un objeto como una dentadura o una mesa.
Por ejemplo: a) las personas son unidades de anlisis si consideramos su edad, su sexo, su inteligencia,
su salario o la cantidad de sillas que posee, como variables; b) las sillas son unidades de anlisis si
consideramos su precio, su color o su estado como variables; c) los colores son unidades de anlisis si
consideramos su tono o su longitud de onda como variables.
La variable es la caracterstica, propiedad o atributo que se predica de la unidad de anlisis. Por ejemplo
puede ser la edad para una persona, el grado de cohesin para una familia, el nivel de aprendizaje
alcanzado para un animal, el peso especfico para una sustancia qumica, el nivel de salud para una
dentadura, y el tamao para una mesa.
Pueden entonces tambin definirse poblacin estadstica (o simplemente poblacin) como el conjunto de
datos acerca de unidades de anlisis (individuos, objetos) en relacin a una misma caracterstica,
propiedad o atributo (variable).
Sobre una misma poblacin demogrfica pueden definirse varias poblaciones de datos, una para cada
variable. Por ejemplo, en el conjunto de habitantes de un pas (poblacin demogrfica), puede definirse
una poblacin referida a la variable edad (el conjunto de edades de los habitantes), a la variable
ocupacin (el conjunto de ocupaciones de los habitantes), a la variable sexo (el conjunto de condiciones
de sexo de los habitantes).
La categora es cada una de las posibles variaciones de una variable. Categoras de la variable sexo son
masculino y femenino, de la variable ocupacin pueden ser arquitecto, mdico, etc., y de la variable edad
pueden ser 10 aos, 11 aos, etc. Cuando la variable se mide cuantitativamente, es decir cuando se
expresa numricamente, a la categora suele llamrsela valor. En estos casos, el dato incluye tambin
una unidad de medida, como por ejemplo aos, cantidad de hijos, grados de temperatura, cantidad de
piezas dentarias, centmetros, etc. El valor es, entonces, cada una de las posibles variaciones de una
variable cuantitativa.

Datos individuales y datos estadsticos.- Un dato individual es un dato de un solo individuo, mientras
que un dato estadstico es un dato de una muestra o de una poblacin en su conjunto. Por ejemplo, la
edad de Juan es un dato individual, mientras que el promedio de edades de una muestra o poblacin de
personas es un dato estadstico. Desde ya, puede ocurrir que ambos no coincidan: la edad de Juan puede
ser 37 aos, y el promedio de edades de la muestra donde est includo Juan es 23 aos. Por esta razn
un dato estadstico nada dice respecto de los individuos, porque solamente describe la muestra o
poblacin.
Los datos estadsticos que describen una muestra suelen llamarse estadsticos (por ejemplo, el
promedio de ingresos mensuales de las personas de una muestra), mientras que los datos estadsticos
descriptores de una poblacin suelen llamarse parmetros (por ejemplo, el promedio de ingresos
mensuales de las personas de una poblacin) (Kohan N, 1994:143).

5. LA MEDICIN

Los datos se obtienen a travs un proceso llamado medicin. Desde este punto de vista, puede definirse
medicin como el proceso por el cual asignamos una categora (o un valor) a una variable, para
determinada unidad de anlisis y para un determinado lugar y tiempo. Ejemplo: cuando decimos que
Martn es varn, estamos haciendo una medicin, porque estamos asignando una categora (varn) a una
variable (sexo) para una unidad de anlisis (Martn), y aqu y ahora. Como puede verse, la medicin va
ms all del clsico empleo de la regla y el nmero.

A veces se ha definido medir como comparar, lo cual puede referirse a diversos tipos de comparacin: 1)
comparar una cantidad con otra tomada como unidad Sentido clsico de comparacin); 2) comparar dos
categoras de una misma variable en el mismo sujeto y distinto tiempo; 3) comparar dos categoras de una misma
variable en distintos sujetos al mismo tiempo; y 4) categoras de variables distintas (debe usarse puntaje
estandarizado), en el mismo sujeto o en sujetos distintos.

Las mediciones individuales recaen sobre sujetos, mientras que las mediciones estadsticas recaen sobre
muestras o poblaciones. As por ejemplo decimos que medimos una muestra A cuando le asignamos la
media aritmtica 120 respecto de la variable inteligencia. Obviamente, las medidas estadsticas se
derivan de las individuales pues no se puede obtener un promedio si desconocemos los valores
individuales de los sujetos de la muestra.
Para llevar a cabo una medicin, necesitamos obligatoriamente tres cosas: a) un instrumento de
medicin, b) un sistema de medicin (o escala), ya que hay diferentes grados de precisin en la
medicin, y c) un procedimiento para hacer la medicin. Nos ocuparemos brevemente de los dos
primeros.

Instrumentos de medicin.- Un instrumento de medida es un artificio usado para medir. Una balanza es
un instrumento para medir peso, un test mide personalidad, inteligencia, aptitud vocacional, etc., un
cuestionario mide conocimientos, etc., pero sea cual fuere el instrumento utilizado, para que sea eficaz
debe reunir dos requisitos: confiabilidad y validez.
Si la misma balanza hoy me informa que peso 70 kg, maana 80 kg y pasado 63 kg, es un instrumento
poco confiable. Un test puede tambin ser poco confiable si, respecto del mismo sujeto, arroja
resultados dispares en diferentes momentos de administracin. Confiabilidad significa, entonces,
estabilidad o constancia de los resultados.

Esta constancia no es nunca perfecta. El hecho de que puedan existir ligeras variaciones debidas al azar no
compromete la confiabilidad del instrumento de medida, siempre que esas variaciones sean poco significativas.
Tambin debemos tener en cuenta los cambios propios del sujeto cuya propiedad medimos. Si el sujeto aumenta
de peso o mejora su rendimiento intelectual por un efecto madurativo habr una variabilidad en los resultados, lo
cual no implica necesariamente que el instrumento no sea confiable. En la confiabilidad, como aqu la
entendemos, la constancia o la variabilidad en los resultados depende de la labilidad del instrumento mismo, no
del sujeto. Por ejemplo si el instrumento tiene una consigna de aplicacin ambigua, podr ser aplicado de manera
distinta antes y despus, y los resultados podrn ser diferentes.

Un test o cualquier otro instrumento puede ser confiable pero no vlido: es vlido cuando mide lo que
efectivamente pretende medir, lo cual puede parecer una perogrullada pero que no es tal si nos damos
cuenta de los casos de instrumentos que queran medir una propiedad y medan otra. Si con un
determinado test pretendemos medir memoria pero slo medimos ansiedad, no es vlido. La validez de
un test puede establecerse prospectivamente: nos percatamos que un test de aptitud para la ingeniera
es vlido cuando, andando el tiempo, constatamos que quienes obtuvieron altos puntajes hoy son
buenos ingenieros, y quienes sacaron bajos puntajes no lo son.

Para determinar la confiabilidad de una prueba, hay muchos procedimientos, siendo uno de ellos el Coeficiente
Alfa de Cronbach.
a) Cmo se determina la confiabilidad de un test utilizando la escala alfa de Crombach? Para aplicar el
coeficiente alfa de Cronbach se requieren conocimientos y experiencia en estadstica. No obstante, con un
conocimiento mnimo bsico y algo de audacia se puede calcular la fiabilidad de un test mediante el Cronbach
utilizando software de estadstica como por ejemplo el SPSS (preferiblemente la versin 4), uno de los ms
conocidos y utilizados para estas cuestiones. La informacin que debe ingresarse es por lo menos cuantos tems
tiene el test y las respuestas obtenidas de una muestra de sujetos.
Si no se dispone del software y se cuenta con cierto conocimiento estadstico, la frmula para calcular el alfa de
Cronbach tiene como numerador el nmero de tems de la escala, y como denominador, el producto de dicho
nmero menos 1, multiplicado por el cociente entre la sumatoria de varianzas de los tems y la varianza de toda
la escala.
Si se est usando un test ya estandarizado, no hay necesidad de calcular su Coeficiente Cronbach, pues se
supone que dicho test es lo suficientemente vlido y confiable. An as, los creadores de la prueba suelen dar
informacin sobre estas propiedades, incluyendo un coeficiente Cronbach o algn otro que tambin mida
fiabilidad (como el clsico coeficiente Kappa, que mide la equivalencia o concordancia entre observadores, o el
coeficiente r de correlacin de Pearson de la prueba de test-retest, que mide la estabilidad de las respuestas.
El Cronbach, por su parte, mide la confiabilidad a partir de la consistencia interna de los tems, entendiendo por
tal el grado en que los tems de una escala se correlacionan entre s). En estos casos, en el informe de
investigacin debe indicarse el coeficiente Cronbach asignado al test utilizado.
En cambio, si se ha creado un test o cuestionario ad hoc, ser conveniente determinar su fiabilidad mediante el
Cronbach para que los lectores sepan cun confiable o fiable es el test que se est usando. Este coeficiente
Cronbach se utilizar, sin embargo, cuando la prueba tenga muchos tems, ya que lo que evala es la
confiabilidad a partir de la consistencia interna de los mismos. Si no es as, un tcnico estadstico podr
recomendar qu otra prueba de fiabilidad utilizar.
b) Qu indica un ndice de confiabilidad de 0.9 utilizando dicha escala? Cronbach desarroll su coeficiente en la
dcada del 50 dentro del contexto de investigaciones educativas. En principio, un Cronbach de 0.90 es bastante
alto, con lo cual la confiabilidad de test est prcticamente asegurada y puede ser utilizado sin problemas, ya
que est indicando una consistencia interna satisfactoria. En general, se admite que por encima de 0.80, la
prueba es confiable. El alfa de Cronbach vara entre 0 y 1 (0 es ausencia total de consistencia, y 1 es
consistencia perfecta). El valor 0.90 es satisfactorio si, como dijimos antes, el test tiene muchos tems. Si el test
llegara a tener pocos tems, se pueden aceptar valores alfa de Cronbach de 0.60 y 0.50 (como sostienen
Carmines y Zeller 1979; Pedhazur y Schmelkin 1991).
Finalmente, digamos que puede ocurrir que un test tenga varios alfa de Cronbach distintos. Por lo regular esto
significa que el test est midiendo una variable compleja, multidimensional, y entonces se ha obtenido un alfa
para cada dimensin. No obstante, an en estos casos puede obtenerse un alfa nico para toda la variable.

Puntuacin, validez y confiabilidad en los tests psicomtricos.- La eficacia de cualquier instrumento de
medicin, como por ejemplo una balanza o un test, depender de su grado de validez y confiabilidad (o
fiabilidad, o consistencia). Cuanto ms vlido y confiable sea el instrumento, mejor medir la variable.
Por ello, quienes construyen el instrumento de medicin deben determinar o calcular su grado de validez
y confiabilidad.
En lo que sigue se describen los conceptos de validez y confiabilidad aplicados a ciertos instrumentos de
medicin especiales, llamados habitualmente tests psicomtricos, es decir, pruebas que permiten medir
variables psicolgicas en funcin de algn tipo de puntaje numrico. Por lo tanto, antes explicaremos
sucintamente la puntuacin, es decir, la asignacin de puntajes a los resultados de los tests.
1) Puntajes brutos y derivados.- Los nmeros que se asignan a las respuestas de un test se llaman
puntajes brutos o directos. Tales puntajes no permiten comparar al sujeto con la poblacin o el grupo
normativo representado en un baremo (por ejemplo con los dems sujetos de su misma edad o pas), y
por ello se requiere transformar los puntajes brutos en puntajes derivados o transformados. Estos ya
pueden interpretarse estadsticamente, o sea, permiten comparar al sujeto con los dems de la
poblacin, ya que el baremo expresa estadsticamente el desempeo de la poblacin en dicho test.
Ejemplos de puntajes transformados son los puntajes estandarizados, que toman como unidad
desviaciones estndar o fracciones de la misma. Algunos ejemplos son el puntaje z (que puede valer
entre -3 y +3), el puntaje CI (coeficiente intelectual), la edad mental, el eneatipo (que puede valer entre
1 y 9) y el decatipo (entre 1 y 10).
Existen tambin los puntajes llamados percentiles (que pueden valer entre 1 y 100, y donde cada valor
se llama centil o percentil). Por ejemplo si un sujeto obtuvo un percentil 30, ello significa que supera al
30% de la poblacin y el superado por el 70%. Los puntajes derivados pueden transformarse unos en
otros. Por ejemplo, un puntaje percentil puede transformarse en uno z o viceversa.
2) Validez.- Un instrumento de medicin es vlido si realmente mide aquello que pretende medir. Si un
test pretende medir inteligencia pero mide simplemente memoria, no es vlido. En casos de variables
simples como el peso no hay mayores problemas para establecer su validez: una balanza mide el peso,
pero cuando se trata de variables psicolgicas la cuestin de la validez no es tan sencilla.
Estadsticamente, la validez suele definrsela como la proporcin de la varianza relevante para los fines
del test, o sea, la proporcin de las pruebas del test atribuibles a la variable que pretende medir. Ello
significa que la validez es una cuestin de grado: un test ser ms vlido, entre otras cosas, si tiene ms
cantidad de pruebas, tems o subtests que realmente expresan la variable a medir. Tngase presente que
la validez no es un atributo del test en s mismo sino que las inferencias que se hagan a partir de l.
La validez no es algo fijo e invariable para todos los tests, sino que depender tambin de lo que el
entrevistador quiera medir. Para determinar la validez de un test deben considerarse diferentes aspectos,
que algunas veces fueron denominados tipos de validez, lo cuales se influencian recprocamente
formando un todo articulado.
Pueden mencionarse los siguientes tipos o categoras de validez:
a) Validez de contenido.- Un test es vlido si el conjunto de sus tems son una muestra representativa de
la variable que pretende medir. Esto es esencial cuando deben hacerse generalizaciones a partir de los
resultados del test. Se utiliza especialmente en los tests de rendimiento como por ejemplo un test de
vocabulario: un conjunto de expertos seleccionar algunas palabras para incluir en el test de manera tal
que representen adecuadamente la totalidad del vocabulario, las cuales pueden elegirse al azar (si se
seleccionan slo palabras muy fciles, el test disminuye su validez).
Un tipo especial de validez de contenido es la validez aparente o de facie: un test tiene validez aparente
cuando produce en el sujeto que hace el test la impresin que mide realmente la variable que se quiere
medir. Si esto no ocurre no estarn motivados para responder los tems (por ejemplo porque los juzgan
dem asiado inapropiados para su edad o instruccin).
b) Validez de constructo.- Es especialmente importante cuando se miden variables complejas definidas
desde alguna teora en particular. No es lo mismo un test que mida inteligencia segn Weschler que
inteligencia segn Piaget: cada uno de ellos da definiciones o constructos diferentes. Un test entonces
tendr menor validez si no estn representados en l los diversos aspectos del constructo o variable que
propone la teora, o bien si la teora de la cual se parte es errnea. Algunos autores actuales consideran
que la validez de constructo es la nica admisible.
Para estimar la validez de constructo se pueden utilizar mtodos intraprueba, que ofrecen una llamada
validez factorial (por ejemplo examinando el grado de correlacin entre los tems del test, o pidiendo a
los sujetos que razonen en voz alta sus respuestas), mtodos de manipulacin experimental (modificar
los valores de la variable a medir y viendo qu efectos producen sobre la puntuacin del test), y otros
mtodos, como por ejemplo la determinacin de la validez convergente y la validez discriminante.
Hay validez convergente cuando las mediciones del mismo rasgo realizadas con distintos mtodos tienen
alta correlacin, lo cual aumenta la probabilidad de la existencia real del rasgo.
Hay validez discriminante cuando las mediciones de distintos rasgos con un mismo mtodo tienen una
baja correlacin en comparacin con la que muestran las medidas del mismo rasgo con diferentes
mtodos, lo que indica que los rasgos son independientes entre s, e independientes al sistema de
medicin utilizado.
c) Validez predictiva.- Es el grado en que un test puede predecir el rendimiento o el comportamiento
futuro del sujeto. Por ejemplo, en seleccin de personal un test de liderazgo es vlido si, una vez que el
postulante entr y obtuvo alto puntaje, a lo largo del tiempo demuestra que efectivamente es un buen
lder. Se llama tambin validez de pronstico, y se puede estimar a partir de un coeficiente de validez,
que correlaciona el puntaje del test con la produccin posterior. Esta produccin anterior es llamada por
algunos autores criterio o sea cualquier produccin en la vida real, no en un test. Es importante definir
la forma en que ser medido ese criterio o comportamiento ulterior: algn psiclogo puede medir el
liderazgo en trminos de influencia real del lder sobre los dems, y otro en trminos de si es o no elegido
en su trabajo para un puesto de liderazgo.
Una variante de la validez predictiva es la validez retrospectiva, donde el test mide algn
comportamiento o criterio del pasado del sujeto que por alguna razn no es accesible al conocimiento.
d) Validez concurrente.- Un test tiene validez concurrente cuando se da una correlacin alta entre los
puntajes del mismo y otro test que mide lo mismo y que ya fue validado previamente. Por ejemplo el
Test A de inteligencia es vlido concurrentemente si las puntuaciones de los sujetos sin similares a las
puntuaciones de otro Test B de inteligencia ya validado.
3) Confiabilidad.- Un test es confiable cuando al ser administrado al mismo sujeto en diferentes
momentos, da aproximadamente los mismos puntajes. Si el test se administra en distintos momentos
puede ocurrir que varen las condiciones de cada uno, que pueden atribuirse a que el examinador no
aplic siempre la misma consigna (usualmente explicitada en el manual del test) y/o a que el examinado
est atravesando distintas experiencias (un da est ms relajado y atento, otro ms angustiado, un mes
madur o aprendi ms que el anterior, un da hay ms luz o ms humedad ambiental y otro menos,
etc.).
Incluso aunque siempre se aplique la misma consigna y el examinado est aproximadamente en las
mismas condiciones, los distintos puntajes tienen pequeas variaciones atribuibles al azar.
La confiabilidad de un test es un indicador de la estabilidad del mismo, de su consistencia y del grado de
precisin con que mide la variable. Para medir este grado de confiabilidad hay varios procedimientos,
como por ejemplo la prueba test-retest (tomar dos o ms veces el mismo test y examinar el grado en
que se correlacionan los puntajes: el coeficiente de correlacin ser el coeficiente de confiabilidad); la
prueba paralela (tomar al mismo sujeto dos tests distintos que midan lo mismo y examinar el grado de
correlacin entre ambos puntajes, lo que da un coeficiente de confiabilidad llamado coeficiente de
equivalencia); la prueba de las dos mitades (se comparan los puntajes obtenidos en dos mitades del test
y se examina su grado de correlacin, lo cual indica la consistencia interna del test y su confiabilidad). En
esta ltima prueba ambas mitades deben ser equivalentes (por ejemplo tomar en una los tems pares y
en otra los impares, pues a veces los tests presentan los tems en un orden de complejidad creciente).
Hay otros mtodos para determinar la consistencia interna de los tests como el coeficiente de Cronbach,
Kuder-Richardson, y el coeficiente Beta, til para determinar la confiabilidad de una batera de tests
(conjunto de tests), que ofrece una medida de la consistencia interna de los puntajes de cada uno.
A la obtencin de estos diferentes tipos de coeficientes de confiabilidad debe tambin agregarse una
estimacin del error estndar de medida (que se obtiene mediante una frmula), que permite estimar
dentro de qu intervalo de puntajes posibles estar el verdadero puntaje. Recordemos que administrar
varias veces un mismo test arroja puntajes diferentes debido al azar, es decir, a errores aleatorios o no
sistemticos.
Mientras en la confiabilidad influyen los errores aleatorios, en la validez influyen los errores constantes o
sistemticos, pues si un test mide otra variable a la que se pretende medir, arrojar siempre
aproximadamente un mismo error.

Escalas de medicin.- Se pueden hacer mediciones con mayor o menor grado de precisin. Cuanto ms
precisa sea la medicin, ms informacin nos suministra sobre la variable y, por tanto, sobre la unidad de
anlisis. No es lo mismo decir que una persona es alta, a decir que mide 1,83 metros.

Los niveles de medicin se definen a partir de escalas de medicin. Desde el punto de vista de la teora de la
medicin, una escala es una lnea que representa el campo de variabilidad de una variable. Por ejemplo: la lnea
indicadora de kilos en una balanza, la lnea indicadora de kilmetros en un mapa, la lnea indicadora de grados
en un termmetro, etc.
Los elementos constitutivos de una escala son: a) una longitud, generalmente expresada en centmetros. Por
ejemplo, un termmetro de uso clnico puede tener 10 centmetros entre el valor mximo y el valor mnimo de
temperatura; b) Un valor mnimo y un valor mximo de la variable, llamados cota inicial y cota final. Por
ejemplo: 0 grados y 45 grados centgrados; c) Valores intermedios entre la cota inicial y la final. Por ejemplo:
5-10-15-20-25-30-35-40 grados centgrados; d) Una determinada correspondencia entre la variable a
representar (por ejemplo temperatura) y la variable longitud. Por ejemplo: un centmetro representa una
variacin de 5 grados centgrados. Se llama mdulo de la escala al cociente entre la longitud de la escala
(numerador) y la resta entre la cota final y la cota inicial (denominador).
Existen escalas uniformes, donde el valor representado es siempre proporcional al valor en longitud elegido
para representarlo, y escalas funcionales, donde el valor representado nunca lo es, como sucede en las escalas
logartmicas (en este ltimo caso, por ejemplo, 0 cm corresponde a x=10, 4 cm corresponde a x=100, y no a
x=40, etc.).

Habida cuenta de que hay maneras ms precisas y menos precisas de medir variables, Stevens
estableci en 1948 cuatro niveles de medicin en orden de precisin creciente: nominal, ordinal, de
intervalos iguales y de cocientes o razones. Posteriormente, Coombs agreg otros niveles intermedios: la
escala parcialmente ordenada y la escala mtrica ordenada.
En cada uno de los cuatro niveles de medicin, la obtencin del dato o resultado de la medicin ser
diferente:

Ejemplos de datos en diferentes niveles de medicin

Nivel de
medicin
Nivel nominal Nivel ordinal Nivel cuantitativo
discreto
Nivel cuantitativo
continuo
DATO Martn es
electricista
Elena termin la
secundaria
Juan tiene 32
dientes
Mara tiene 70
pulsaciones por
minuto
Unidad de
anlisis
Martn Elena Juan Mara
Variable Oficio Nivel de
instruccin
Cantidad de piezas
dentarias
Frecuencia cardaca
Categora o
valor
Electricista Secundaria
completa
32 70
Unidad de
medida
------------- ------------ Diente Pulsaciones por
minuto

En el nivel nominal, medir significa simplemente asignar un atributo a una unidad de anlisis (Martn es
electricista).
En el nivel ordinal, medir significa asignar un atributo a una unidad de anlisis cuyas categoras pueden
ser ordenadas en una serie creciente o decreciente (la categora secundaria completa puede ordenarse
en una serie, pues est entre secundaria incompleta y universitaria incompleta).
En el nivel cuantitativo, medir significa adems asignar un atributo a una unidad de anlisis de modo tal
que la categora asignada permita saber cunto mayor o menor es respecto de otra categora, es decir,
especifica la distancia o intervalo entre categoras (por ejemplo, la categora 70 es el doble de la
categora 35).
Las variables medibles en el nivel cuantitativo pueden ser discretas o continuas. Una variable discreta es
aquella en la cual, dados dos valores consecutivos, no puede adoptar ningn valor intermedio (por
ejemplo entre 32 y 33 dientes, no puede hablarse de 32.5 dientes). En cambio, una variable es continua
cuando, dados dos valores consecutivos, la variable puede adoptar muchos valores intermedios (por
ejemplo entre 1 y 2 metros, puede haber muchas longitudes posibles).
Algunas veces una misma variable puede ser considerada como discreta o continua. Por ejemplo, la
variable peso es discreta si solamente interesan los pesos sin valores intermedios (50 kg, 51 kg, etc.),
mientras que ser continua si interesan tambin los valores intermedios (50,3 kg, 50,35 kg, 50,357 kg,
etc.). Obviamente, al considerar una variable como continua se obtendr mayor precisin, es decir,
mayor informacin.

La precisin es una cualidad importante de la medicin. Se pueden hacer mediciones ms precisas y menos
precisas, o tan precisas como lo permita el instrumento de medicin. El primer nivel de medicin es el menos
preciso, y el ltimo el ms preciso. Por ejemplo, una mujer puede estar interesada en medir el amor de su
pareja, para lo cual podr interrogarla solicitndole diferentes grados de precisin: me quers? (nivel nominal),
me quers ms que a la otra? (nivel ordinal), Cunto me quers, del 1 al 10? (nivel cuantitativo).
De la misma manera, diferentes grados de precisin para la variable temperatura pueden ser: A es un objeto
caliente (nivel nominal), A es ms caliente que B (nivel ordinal), A tiene 25 grados Celsius (nivel cuantitativo). Los
ejemplos del amor y de la temperatura ilustran tambin el hecho de que una variable puede en principio medirse
en cualquiera de los niveles de medicin.

Los niveles de medicin pueden tambin ser clasificados de acuerdo a un criterio diferente, que afecta
especficamente a los dos ltimos. As, los niveles de medicin pueden ser clasificados (Stevens) como
nominal, ordinal, de intervalos iguales y de cocientes o razones.
Estos cuatro niveles son cada vez ms precisos y exactos, con lo cual aumenta la informacin que
recibimos al hacer la medicin. Somos ms precisos y decimos ms si afirmamos que Juan tiene 52
aos (escalas cuantitativas) que si decimos solamente que es adulto (escalas cualitativas). De idntica
forma, la medicin es ms precisa si decimos que un objeto cae a 9,8 m/sg2 (escala de cocientes o
razones), que si solamente decimos que ese objeto cae ms velozmente que otro (escala ordinal).

Cierto da un emperador, que deba invadir una fortaleza, reunin a cuatro de sus espas para que ingresaran en
ella y obtuviesen informacin. Luego de varios das se presentan los cuatro espas con sus respectivos informes.
El espa nmero 1 informa que adentro de la fortaleza hay un jefe. El espa nmero 2 informa que adentro de la
fortaleza hay un jefe que es ms alto que el hijo. El espa nmero 3 informa que adentro de la fortaleza hay un
jefe que es dos veces ms alto que el hijo. El espa nmero 4 informa que adentro de la fortaleza hay un jefe que
mide 1,90 metros. Los cuatro espas utilizaron respectivamente los cuatro niveles de medicin: el primero
inform realmente muy poco, en comparacin con el ltimo, que proporcion la informacin ms precisa.
De idntica manera, no es lo mismo decir que es de noche, es una hora avanzada de la noche y son las once
de la noche, siendo sta ltima informacin ms precisa que la primera.

Esta precisin creciente es debida a que las propiedades de cada nivel son acumulativas: el nivel 4 tiene
las caractersticas de los tres anteriores, ms alguna nueva. El nivel 3 tiene las caractersticas de los dos
anteriores, ms otras nuevas que harn que ese nivel sea ms exacto y por tanto, ms informativo
acerca de la propiedad o variable a medir.
En un sentido genrico, una escala es el conjunto de categoras (o valores) de una variable, conjunto
que, como qued dicho, debe ser exhaustivo y mutuamente excluyente. Estas categoras o valores
podemos representarlas grficamente mediante los puntos de una lnea recta para una mejor
visualizacin. Ejemplos:

FIGURA 1




Una escala nominal es simplemente un conjunto de dos o ms categoras de una variable, sin que
interese el orden o la jerarqua entre ellas. La escala nominal de la variable religin son sus distintas
categoras: judo, catlico, etc. El requisito fundamental que deben reunir es que sean distintas entre si
de manera que no puede haber dos categoras con el mismo nombre, ni dos categoras que se
superpongan (como cristianos y catlicos). Obviamente, adems las categoras deben ser
homogneas: todas deben referirse a religiones y no a partidos polticos, oficios o lugares de
nacimiento.

Una escala nominal para la variable profesin puede representarse de cualquiera de las siguientes
maneras, entre otras:

FIGURA 2



Este ejemplo muestra que en una escala nominal no interesa ni el orden en que colocamos las
categoras, ni la distancia que hay entre ellas. Si la variable hubiese sido prestigio de una profesin
aqu s hubiera importado el orden, pues hay profesiones ms prestigiosas y menos prestigiosas.
Tampoco la escala nominal informa sobre las distancias entre las categoras: subjetivamente podemos
pensar que la distancia entre un mdico y un dentista no es la misma que hay entre un ingeniero y un
arquitecto, pero esta informacin no nos es suministrada por la escala nominal.
Otro ejemplo de variable medible nominalmente es la numeracin del 1 al 11 de los jugadores de un
equipo de ftbol. Aqu, puesto que las categoras son numricas podramos pensar que estamos ante
Mdico Dentista Psiclog
o
Veterin Ingenier
o
Arquitecto
Dentista Veterin Psiclog
o
Mdico Arquitecto Ingenier
o
-2 -1 0 +1 +2 +3
Escala
nominal
Escala
ordinal
Escala de
intervalos
Escala de
cocientes
Ejemplo:
religin
Ejemplo:
dureza
Ejemplo:
temperatura
Ejemplo:
altura
Jud
o
Catl Bud
i
Prot Otr
o
Diam Hierr
o
Cuer Cart
n
Papel
0 m 1 m 2 m 3 m
una variable cuantitativa y por tanto medible en los niveles 3 o 4, pero si pensamos as estaremos
equivocados. Aqu los nmeros no funcionan como tales en el sentido que no podemos manipularlos
aritmticamente sumndolos, restndolos, etc., sino slo como simples etiquetas: el 1 representa
simplemente la palabra arquero, el 10 delantero, etc. Nadie afirmara que el jugador con el nmero
6 es dos veces ms capaz que el jugador nmero 3. Los nmeros empiezan a funcionar como
indicadores de cantidad recin en las escalas cuantitativas.
En la escala ordinal, adems de la homogeneidad y la diferenciabilidad entre categoras, importa el
orden en que ellas se disponen. Las variables dureza de los materiales y prestigio de una profesin
son ordinales, pues los materiales pueden ordenarse segn su dureza y las profesiones de acuerdo a su
prestigio. Una escala ordinal para la variable prestigio ocupacional puede graficarse de cualquiera de
las siguientes formas, entre otras:

FIGURA 3



Esto nos muestra que sea cual fuere la forma de representacin, siempre ha de respetarse el orden.
Este tipo de escalas tiene una ventaja sobre las nominales, pero tambin tiene una limitacin: la escala
ordinal me informa si un individuo tiene mayor o menor prestigio ocupacional que otro, pero no me dice
cunto en forma objetiva. Esto ltimo es importante porque subjetivamente uno podra pensar que
un ejecutivo tiene tres veces ms prestigio que un zapatero, pero este criterio no sera compartido por
otras personas, y una escala ha de ser la misma para todos. Otros ejemplos de variables medibles
ordinalmente son el grado de mrito, el grado militar y la gradacin de tonos de colores.
Segn la escala nominal, decimos que hemos hecho una medicin simplemente cuando afirmamos que
Fulano es mdico, y segn la escala ordinal cuando afirmamos que Fulano tiene una ocupacin ms
prestigiosa que Zutano, aunque no sepamos cunto ms prestigiosa es. Mientras una escala nominal
permite hacer identificaciones, o poner nombres (de all la expresin nominal), la escala ordinal
permite hacer comparaciones cualitativas.
Las comparaciones cuantitativas, o sea la medicin numrica, se hace posible recin con las escalas
cuantitativas. Si examinamos las escalas cualitativas (nominales y ordinales) veremos que los intervalos
o distancias entre las categoras (o sea las distancias entre los puntos de la recta) son irregulares y no
responden a ningn criterio objetivo, aunque s a muchos subjetivos. En la figura 3 vemos que
zapatero puede estar ms cerca de basurero segn algunos, o ms cerca de ejecutivo segn otros.
La escala ordinal permite comparar profesiones en cuanto a prestigio, pero no permite comparar
distancias entre profesiones, o sea no es posible saber cunto mayor es la distancia de basurero a
zapatero respecto de la distancia entre zapatero y ejecutivo.
En este sentido, las escalas cuantitativas son an ms informativas. A los requisitos de homogeneidad,
diferenciabilidad y orden se agrega uno nuevo: los intervalos deben ser regulares, y ms
especficamente iguales. Las siguientes tres escalas representan todas ellas intervalos iguales, o sea que
los intervalos o distancias entre los puntos estn determinados segn un cierto criterio matemtico:

FIGURA 4



1 2 3 4 5 6 7 8 9
10
1 2 3 4 5
1 2 4 8 16
Basurer
o
Zapatero Ejecutiv
o
Basurer
o
Zapatero Ejecutiv
o
En la primera vemos que los intervalos son iguales, pues la distancia que hay de 1 a 2 es igual a la
distancia que hay entre 2 y 3, etc., todo lo cual, dicho matemticamente, equivale a afirmar que 1-2 =
2-3, etc. Por la misma razn en la segunda escala las distancias tambin son iguales aunque hayamos
tomado intervalos mayores. En la tercera ya parecera que los intervalos no son iguales pues van
aumentando cada vez ms hacia la derecha, pero si consideramos que se trata de una escala
logartmica (y no lineal como las dos anteriores), veremos que tambin sus intervalos son iguales segn
la siguiente serie de igualdades, donde en vez de restar, dividimos:

1 2 4 8
------ = ------ = ------ = ------ = etc
2 4 8 16

Esta misma serie, expresada logartmicamente, es log1-log2 = log2-log3, etc., o sea que en vez de
restar nmeros como en la escala lineal restamos logaritmos, pero igualmente sigue cumplindose la
condicin de igualdad de intervalos.
Toda escala que tenga intervalos iguales se llama escala mtrica, y a este nivel ya s tiene sentido
definir medicin ms familiarmente como la operacin por la cual comparamos una cierta cantidad con
otra tomada como nidad. Por ejemplo, decimos que hemos medido el peso de Fulano cuando hemos
dicho que pesa 60 kg, o sea, su peso entra 60 veces en la unidad de medida de 1 kg.
Estas escalas mtricas, tpicas de los niveles cuantitativos de medicin, siguen conservando las
caractersticas de diferenciabilidad (o identidad), y orden de la escala ordinal, pero se agregan otras
nuevas: no slo me dice que los pesos 35 kg y 70 kg son distintos (identidad), y no slo me dice que 70
es un peso mayor que 35 (orden), sino que adems me agrega nueva informacin al decirme: (a) que
70 kg es cuantitativamente tan distinto de 35 kg como 35 kg lo es de 0 kg; y (b) que 70 kg es dos
veces ms pesado que 35 kg, o sea, me informa acerca de cunto ms pesado es un objeto que otro.
Las escalas de intervalos iguales slo nos pueden dar la informacin (a), mientras que la escala de
cocientes o razones, adems, nos suministra la informacin (b), con lo cual esta ltima resulta ser ms
precisa o con mayor contenido informativo.
Establezcamos ms en detalle las diferencias entre ambas escalas cuantitativas, para lo cual
comenzaremos por distinguir las escalas absolutas y las relativas. Supongamos que tomamos cinco
objetos cualesquiera y medimos sus alturas, graficando del siguiente modo sus valores respectivos:

FIGURA 5



Es indudable que estas alturas son reales: el objeto A mide efectivamente dos metros, el objeto B tres
metros, etc. A estas escalas cuyos nmeros representan realmente el atributo fsico las llamamos
absolutas y en ellas, obviamente, la cifra 0 corresponder a la ausencia de altura. Pero supongamos
ahora que queremos considerar la altura A, que es dos metros, como altura 0 en forma arbitraria. La
escala anterior y la nueva quedarn entonces correlacionadas del siguiente modo:

FIGURA 6



En esta nueva escala el objeto B no tiene realmente un metro de altura: slo nos dice que B es un
metro ms alto que A, es decir marca su ubicacin respecto de otro objeto. De la misma forma esta
escala no dice que A no tenga altura, sino que arbitrariamente le hemos asignado el valor 0 para que
sirva de punto de referencia de los dems valores: es una escala relativa o arbitraria. Obviamente, si
disponemos de una escala relativa y conocemos adems la altura absoluta de uno cualquiera de los
2m 3m 4m 5m 6m
A B C D E
Escala absoluta
Escala relativa
0m 1m 2m 3m 4m
1m 2m 3m 4m 5m
A B C D E
objetos, podremos calcular la altura absoluta de los dems (tambin necesitamos una regla de
transformacin, pero de esto no nos ocuparemos).
Tambin podramos haber asignado el valor cero no a 2 sino a la media aritmtica, que en nuestro
ejemplo coincide con 4 metros. La nueva escala relativa quedara entonces representada del siguiente
modo:

FIGURA 7



Estrictamente hablando no tiene sentido decir que algo mide menos 2 metros (-2), pues no hay
alturas negativas, pero no obstante esa cifra aparecida en la nueva escala nos est diciendo algo: que el
objeto A es tan alto con respecto al objeto B como ste con respecto al C, que es la media, y el signo
negativo nos indica solamente que la altura de A est por debajo de la media aritmtica. Del mismo
modo la altura cero no significa aqu ausencia de altura, error que cometi aquel tipo que, cuando le
dijeron que haca cero grado de temperatura exclam alborozado: No hace ni fro ni calor!. Galeno
haba sugerido como punto cero de temperatura un calor neutro que no era ni fro ni calor, pero
Galeno estaba en realidad proponiendo una simple convencin. Vemos as que la escala de temperatura
es un tpico ejemplo de escala relativa (con un cero arbitrario).
En las escalas de intervalos iguales tenemos escalas relativas (o sea con un cero arbitrario) y en las
escalas de cocientes o razones tenemos escalas absolutas (con un cero absoluto o real). El cero
arbitrario no corresponde con la ausencia de la magnitud (cero grado no significa ausencia de
temperatura), pero el cero absoluto es real (cero metros significa ausencia de altura). Ntese que lo que
interesa es la ausencia de la variable, no del individuo. Tanto cero metros como cero cantidad de hijos
significa ausencia de altura y ausencia de hijos, y no interesa que el primer valor corresponda a un
individuo inexistente y el segundo a una pareja que s podra existir.
Las escalas de cocientes o razones son muy difciles de encontrar en psicologa y en general en las
ciencias sociales: en estas disciplinas se manejan variables que, como motivacin, inteligencia o
aprendizaje, son muy difciles (o carecera de sentido) identificar su ausencia real, o sea asignarles un
cero absoluto, y en general sus valores se consiguen establecer por comparacin con otros valores.
Efectivamente, existen ciertas variables a las cuales no puede asignrsele un cero real, por cuanto no se
considera que esa variable pueda estar ausente en la realidad. Tal es el caso de la ansiedad o la
inteligencia: nadie, por menos ansioso o por menos inteligente que sea, puede tener ansiedad o
inteligencia nulas.

Pero, ms exactamente, porqu las variables psicolgicas suelen medirse con escalas relativas y las variables
fsicas con escalas absolutas? O, si se prefiere, qu nos obliga a medir ciertas variables mediante escalas
relativas, cuando en rigor sera preferible usar escalas absolutas por ser ms precisas y exactas?
Esta interesante cuestin tiene su complejidad, no obstante lo cual orientaremos una respuesta en algn sentido
que pueda interesarnos como investigadores en ciencias sociales. Para ello comparemos un fsico que debe medir
la altura de 10.000 objetos, y un psiclogo que debe medir la inteligencia de 10.000 sujetos de la misma edad.
Una vez que hicieron sus respectivas mediciones, cada uno obtiene un promedio: el promedio de alturas es 1,53
metros, y el promedio de inteligencias es 100.
Acto seguido, si ahora el psiclogo encuentra una persona y, tras medir su inteligencia encuentra que tiene un
valor 60, con justa razn puede decir que tiene una inteligencia inferior a lo normal; pero si el fsico encuentra un
objeto que mide apenas 0,42 metros no tendr sentido que diga que su altura es inferior a lo normal o que se
trata de un objeto retrasado en cuanto a altura. No es este el tipo de comparacin que le interesa hacer al
fsico, pero s al psiclogo. Este ltimo desea saber si una persona est por encima o por debajo de la media de
su edad. Las escalas relativas como la inteligencia toman como punto de referencia no un cero absoluto sino un
promedio estadstico al cual puede asignrsele tanto el valor 0 como el valor 100 o cualquier otro, y entonces
estas escalas relativas son especialmente aptas para comparar la situacin de un individuo respecto de otros y
ver as si tiene ms o si tiene menos inteligencia que el resto. Ms an: si quien mide altura no es un fsico sino
un mdico o un psiclogo (por tanto ya estamos midiendo personas, no objetos), empiezan a cobrar sentido las
expresiones altura normal o altura anormal, por la misma razn que tiene sentido hablar de inteligencia
normal o inteligencia anormal.
Quienes construyeron los tests de inteligencia no empezaron eligiendo a un individuo con inteligencia nula (o
sea, un cero absoluto) y a partir de all luego los dems valores (10, 20, 30, etc.). Ellos comenzaron eligiendo
una gran cantidad de individuos y luego obtuvieron un promedio (supuestamente el promedio de toda la
poblacin humana, si acaso la muestra fuese representativa). A dicho promedio le adscribieron
convencionalmente el valor 100 y as, si algn nuevo sujeto llegara a obtener cero segn esta nueva escala, no
2m 3m 4m 5m 6m
A B C D E
Escala absoluta
Escala relativa
-2m -1m 0m 1m
2m
significar que no tiene inteligencia (cero absoluto), sino slo que su capacidad intelectual est muy por debajo
de la media poblacional (cero relativo).
Hasta aqu puede quedar justificado el uso de escalas relativas en ciencias sociales, pero, entonces, porqu
ciertas magnitudes fsicas como la temperatura se miden habitualmente en escalas relativas y no absolutas, que
ya dijimos seran preferibles? En el caso especial de la temperatura podemos invocar razones histricas y
prcticas. Tomemos con la mano un objeto cualquiera: inferimos que tiene una cierta temperatura a juzgar por la
sensacin trmica que nos produce. Supongamos ahora que el cuerpo que sostenemos se empieza a enfriar.
Llegar un momento en que el fro es tan intenso que nuestros dedos se congelan y dejan de funcionar nuestros
termorreceptores, o sea, no experimentamos ya ninguna sensacin y quedamos anestesiados. Significa esto que
el cuerpo no puede seguir enfrindose? No. Puede seguir hacindolo aunque ya no podamos darnos cuenta por el
tacto, y entonces, para averiguarlo, decidimos tomar otro punto de referencia, como por ejemplo su dureza.
Podemos as saber si se sigue o no enfriando examinando si su dureza aumenta o no, pero aqu tambin la
dureza puede tener un lmite, y el hecho de que el cuerpo haya alcanzado una dureza mxima y no pueda
endurecerse ms, ello no significa necesariamente que no pueda seguir enfrindose. De hecho, podemos seguir
eligiendo ms criterios hasta el infinito, pero la termodinmica ha venido a resolver este problema tomando como
punto de referencia no la sensacin trmica ni la dureza del cuerpo, sino el movimiento de sus molculas. Y as,
cuando las molculas cesan todo movimiento el cuerpo ya no podr seguir enfrindose alcanzando entonces lo
que se llama su temperatura absoluta, designada convencionalmente como el cero grado en la escala Kelvin,
creada a tal efecto. Esta escala es absoluta porque el cero grado corresponde realmente a la ausencia de
temperatura. Podra argumentarse que esto no es as que cero grado est indicando un fro intenssimo en lugar
de ausencia de temperatura pero no debemos olvidar que la termodinmica, al crear esta escala, equipar
temperatura a movimiento molecular y no a sensacin trmica y entonces el cero grado, al indicar ausencia de
movimiento molecular, indica tambin ausencia de temperatura. Si nuestros termorreceptores pudiesen
hipotticamente percibir la sensacin trmica a cero grado Kelvin sin quedar arruinados, seguramente
retiraramos violentamente la mano y nadie podra convencernos de que all no hay temperatura, pero esto es
porque estamos habituados a equiparar temperatura con sensacin trmica y no con movimiento molecular. Por
lo dems, se supone que el cero absoluto es inalcanzable tanto tcnicamente como en teora, porque si cesara el
movimiento molecular la materia dejara de existir.
La idea de equiparar temperatura con movimiento molecular deriva de la teora cintica del calor del siglo pasado,
y sostiene que el movimiento genera calor. Entonces, si las molculas comienzan a moverse cada vez ms
rpidamente, el cuerpo empezar a aumentar su temperatura. Obviamente que esto no es ms que una teora: el
da de maana puede aparecer otra que tome como referencia de temperatura no el movimiento sino otro
parmetro hoy desconocido, con lo cual se construir una nueva escala con el cero ms alejado y donde el cuerpo
podr seguir enfrindose an cuando haya cesado todo movimiento molecular. Esto prueba que, en el fondo, el
cero absoluto es paradjicamente relativo, pues todo depender de qu significado le demos a temperatura: si
sensacin trmica, dureza, movimiento molecular o un parmetro an no descubierto.
Histricamente, la primera escala de temperatura que se cre no fue la escala Kelvin, ya que no exista la idea de
vincular la temperatura con el movimiento molecular y construir, sobre esa base, una escala. Pero los fsicos
necesitaban contar igualmente con alguna que pudiese medir esta magnitud, y fue as que se crearon varias,
como la escala centgrada (Celsius), la escala Farenheit y la escala Reamur. La escala Celsius le adjudic un poco
arbitrariamente el cero al punto de congelamiento del agua y el 100 a su punto de ebullicin (todo a presin
atmosfrica normal), dividindose luego en 100 partes iguales la escala entre uno y otro valor. Presumiblemente
la practicidad de esta escala radica en el hecho de que la mayora de los objetos que manipulamos o los
ambientes donde habitamos estn entre 0 y 100 grados Celsius, utilizndose la escala Kelvin slo para objetos
muy fros. Haciendo las transformaciones necesarias (0 grado Kelvin corresponden a -273 grados Celsius)
podramos usar tambin la escala Kelvin pero no lo hacemos, entre otras razones, por una cuestin psicolgica o
de acostumbramiento a las mismas cifras de siempre. En otros casos el desacostumbramiento puede ser menos
difcil, y es cuando no hay que habituarse a nuevas cifras sino simplemente a nuevas denominaciones. Tal es el
caso del pasaje de los milibares a los hectopascales (escala de presin atmosfrica): aqu no se cambi de escala
sino de nombre, ya que, por ejemplo, 1008 hectopascales siguen siendo 1008 milibares.

Adems del hecho de que una tiene un cero arbitrario y la otra un cero absoluto, hay otra diferencia
entre las escalas relativas y absolutas, y que de alguna forma ya empezamos a adelantar.
En las escalas de intervalos iguales, que son relativas, no se puede decir que un sujeto con CI 160
tenga el doble de inteligencia que otro de 80, del mismo modo que dos grados no es el doble de
temperatura que un grado en la escala Celsius. A lo sumo podemos llegar a decir que la diferencia de
inteligencia que hay entre 120 y 140 es la misma que hay entre 100 y 120. En las escalas de cocientes,
que son absolutas, podemos obtener en cambio ambos tipos de informacin como ocurre con las escalas
de peso, sonido, longitud o densidad. Adems de la inteligencia, otras escalas de intervalos iguales son
la energa y las fechas del calendario: del 2 al 4 de junio hay el mismo intervalo temporal que hay entre
4 y 6 de junio, pero carecer de sentido decir que el 4 de junio es el doble del 2 de junio.
Observemos la figura 6. En la escala absoluta s tiene sentido decir que 6 metros (altura del objeto E) es
el doble de 3 metros (la altura de B). O sea, se cumple la igualdad E = 2.B. Si intentamos trasladar esto
mismo a la escala relativa esta igualdad no se cumple, pues 4 no es el doble de 1. Para que la expresin
E = 2.B valga en la escala relativa debemos sumarle el nmero 2, que es la distancia que hay entre el
cero arbitrario y el absoluto (ya que aqu la escala relativa aparece corrida dos lugares). La nueva
frmula para esta escala ser E = 2.B + 2, y entonces s se cumple que 4 = 2.1 + 2. Todo esto es
bastante terico, porque slo lo podemos hacer si conocemos el corrimiento de la escala relativa
respecto de la absoluta, o sea, si conocemos la distancia del cero arbitrario al cero absoluto, cosa que
no siempre podemos hacerlo ni tampoco necesitarlo. Desde este punto de vista, la escala absoluta pasa
a ser un caso especial de la escala relativa donde la distancia entre los ceros arbitrario y absoluto es
nula.
Esta clasificacin en cuatro niveles ya es clsica y corresponde a Stevens, pero no han faltado otras
variantes entre las que podemos mencionar la de Coombs, quien agrega dos niveles ms:
a) Entre la nominal y la ordinal incluye la escala parcialmente ordenada (figura 8). Se trata en ltima
instancia de una variante de la escala ordinal donde en algunas categoras, como B y C, no se conoce la
relacin de mayor o menor que tienen entre s: A es mayor que B o que C, y por otro lado B o C son
mayores que D, pero se desconoce si B es mayor, menor o igual a C.

FIGURA 8



b) Entre la ordinal y la de intervalos iguales, Coombs agrega la escala mtrica ordenada, una variante
de la escala de intervalos iguales donde en vez de ser estos iguales son distintos pero estn ordenados
creciente o decrecientemente. A diferencia de la escala meramente ordinal, aqu no slo se ordenan las
categoras, sino tambin los intervalos de acuerdo a su tamao. Evidentemente informa ms que la
simple escala ordinal pero menos que la de intervalos iguales propiamente dicha, pues no aclara cunto
mayor es un intervalo que otro.

Siempre estamos haciendo mediciones. Por ejemplo, cuando decimos que tal o cual individuo es catlico
(medicin nominal), o que tal sujeto tiene ms mrito que otro (medicin ordinal), o cuando decimos
que tal otro sujeto tiene 30 aos (medicin intervalar). Pero la importancia de la medicin no reside
simplemente en el hecho de que siempre estamos haciendo mediciones, sino en que el acto de medir
nos permite conocer cmo varan los fenmenos de la realidad tanto en cantidad como en calidad, lo
cual a su vez es muy importante porque es gracias a que existen unas variaciones que dependen
causalmente de otras, que podemos organizar nuestro conocimiento del mundo.

CAPTULO 2: ESTADSTICA DESCRIPTIVA

1. GENERALIDADES

El propsito fundamental de la estadstica descriptiva es resumir y organizar una gran cantidad de
datos referentes a una muestra (lo ms habitual) o a una poblacin. Se supone que los datos resumidos
y organizados permiten describir adecuadamente la muestra o la poblacin a los efectos de conocerla y,
eventualmente, utilizarlos en la estadstica inferencial para obtener conclusiones a partir de ellos.
Para resumir y organizar los datos se utilizan diferentes procedimientos, llamados tcnicas
descriptivas: la matriz de datos permite ordenarlos, las tablas de frecuencias (o tablas de distribucin
de frecuencias) permiten agruparlos, los grficos permiten visualizarlos, y las medidas estadsticas y las
medidas de asimetra y curtosis permiten resumirlos reducindolos a un solo dato.

Secuencia para organizar y resumir datos individuales

A medida que se van utilizando estos procedimientos, los datos van quedando cada vez ms resumidos y
organizados. El empleo de dichos procedimientos propios de la estadstica descriptiva sigue un orden
determinado, como puede apreciarse en el siguiente esquema:

A > B > C > D > E Escala ordinal
Escala parcialmente ordenada
B
A > > D > E
C


Como puede verse:
a) Los datos quedan recolectados mediante entrevistas, cuestionarios, tests, etc.
b) Los datos quedan ordenados mediante una matriz de datos (lo cual permite resumir la informacin en
unas pocas pginas).
c) Los datos quedan agrupados mediante tablas de frecuencias (lo cual permite resumir la informacin en
una sola pgina).
d) Los datos quedan visualizados mediante grficos.
e) Los datos quedan sintetizados mediante las medidas estadsticas y otras (lo cual permite resumir la
informacin en uno o dos renglones).
Puede entonces decirse que, mediante una matriz de datos, una tabla de frecuencias (1), un grfico o
con medidas estadsticas, etc., la muestra o la poblacin (conjuntos de datos) puede quedar
adecuadamente descrita.
Estas sucesivas abstracciones estadsticas implican: a) la reduccin del espacio fsico donde queda
guardada la nueva informacin, y b) la desaparicin de considerable informacin irrelevante.
Debe distinguirse el fin o propsito perseguido (por ejemplo ordenar los datos), del medio utilizado para
ello, que e la tcnica descriptiva (por ejemplo, la matriz de datos).

2. ORDENAMIENTO Y AGRUPACIN DE LOS DATOS: MATRICES Y TABLAS

Una vez que los datos han sido recolectados, se procede a continuacin a ordenarlos en una matriz de
datos y luego a agruparlos en una tabla de frecuencias.
La forma de ordenarlos y agruparlos depender del tipo de variable considerada. Por ejemplo, si son
datos relativos a variables cualitativas (niveles de medicin nominal y ordinal), no podremos utilizar
tablas de frecuencias por intervalos. El siguiente cuadro indica de qu manera se pueden ordenar y
agrupar los datos segn cada nivel de medicin de la variable:

Ejemplos de organizacin de los datos segn el nivel de medicin

Datos ordenados Datos agrupados por frecuencia Datos agrupados por
intervalos
Nivel nominal
(Ejemplo:
variable
religin)
Matriz de datos
Sujeto x (religin)
Juan Catlica
Pedro Catlica
Mara Juda
Antonio Protestante
Luis Protestante
Jos Protestante
Tabla de frecuencias
x (religin) f
Catlica 2
Juda 1
Protestante 3
n = 6

f = frecuencia
n = tamao de la muestra


DATOS RECOLECTADOS
(entrevistas, cuestionarios, tests, etc.)
DATOS ORDENADOS
(matriz de datos)
DATOS AGRUPADOS POR
FRECUENCIA
(tabla de frecuencias)
DATOS AGRUPADOS POR
INTERVALOS
(tabla de frecuencias por intervalos)
DATOS VISUALIZADOS
(grficos)
DATOS SINTETIZADOS
(medidas estadsticas y medidas de asimetra y curtosis)
Nivel ordinal
(Ejemplo:
variable clase
social)
Matriz de datos
Sujeto x (clase
social)
Juan Alta
Pedro Media
Mara Media
Antonio Media
Luis Baja
Jos Baja
Tabla de frecuencias
x (clase social) f
Alta 1
Media 3
Baja 2
n = 6

f = frecuencia
n = tamao de la muestra

Nivel
cuantitativo
(Ejemplo:
variable edad)
Matriz de datos
Sujeto x (edad)
Juan 15
Pedro 15
Mara 15
Antonio 16
Luis 16
Jos 16
Ana 16
Gabriela 16
Susana 17
Martn 17
Sergio 17
Pablo 17
Daniel 17
Graciela 17
Daniela 17
Beatriz 17
Oscar 18
Felipe 18
Alberto 18
Mnica 19
Marta 19
Mariana 20
Tabla de frecuencias
x (edad) f
15 3
16 5
17 8
18 3
19 2
20 1
n = 22

f = frecuencia
n = tamao de la muestra
Tabla de frecuencias por
intervalos
x (edad) f
15-16 8
17-18 11
19-20 3
n = 22

f = frecuencia
n = tamao de la muestra

Una vez confeccionada la matriz de datos, se procede luego a resumir an ms esta informacin
mediante una tabla de frecuencias o, si cabe, en una tabla de frecuencias por intervalos. Una tabla de
este ltimo tipo se justifica cuando la tabla de frecuencias original es demasiado grande y por tanto de
difcil manejo para procesar la informacin. Sea de la forma que fuere, los datos ordenados segn sus
frecuencias suelen denominarse distribucin de frecuencias (13).

Las tablas de frecuencias contienen tres elementos importantes: las frecuencias, el tamao de la muestra
y los intervalos (en este ltimo caso slo para variables cuantitativas).

a) Frecuencia.- La frecuencia (f) se define como la cantidad de datos iguales o que se repiten. Por
ejemplo: la frecuencia 2 indica que el dato catlico se repite dos veces, la frecuencia 3 que el dato
clase media se repite tres veces, y la frecuencia 8 que el dato 17 aos se repite ocho veces.
A veces resulta necesario expresar las frecuencias de otra manera, como puede apreciarse en la siguiente
tabla ilustrativa:

Tipos de frecuencias que pueden indicarse en una tabla de frecuencias

x (edad) f f% F F% fr F
r

15 3 15% 3 15% 0.15 0.15
16 7 35% 10 50% 0.35 0.50
17 8 40% 18 90% 0.40 0.90
18 2 10% 20 100% 0.10 1
n = 20 n = 100% ------ ------ n = 1 ------

Frecuencia absoluta (f).- Es la cantidad de datos que se repiten. Por ejemplo, la frecuencia 3 indica que
hay tres personas de 15 aos. La suma de todas las frecuencias absolutas equivale al tamao de la
muestra.
Frecuencia porcentual (f%).- Es el porcentaje de datos que se repiten. Por ejemplo, la frecuencia
porcentual 15% indica que el 15% de la muestra tiene la edad de 15 aos. La suma de todas las
frecuencias porcentuales es 100%.
Frecuencia acumulada (F).- Es el resultado de haber sumado las frecuencias anteriores. Por ejemplo, la
frecuencia acumulada 10 resulta de sumar 7+3, e indica la cantidad de veces que se repiten las edades
16 y 15. La ltima de todas las frecuencias acumuladas, que en el ejemplo es 20, debe coincidir con el
tamao de la muestra.
Frecuencia acumulada porcentual (F%).- Es el porcentaje de las frecuencias acumuladas.
Frecuencia relativa (f
r
).- A veces tambin llamada proporcin, es el cociente entre la frecuencia de un
dato x y la frecuencia total o tamao de la muestra. En la prctica, el tamao de la muestra se considera
como 1, a diferencia del tamao de la muestra en la frecuencia porcentual, que se considera 100%.
Frecuencia relativa acumulada (F
r
).- Es el resultado de haber sumado las frecuencias relativas
anteriores. Por ejemplo: la frecuencia relativa 0.90 indica que en 0.90 casos sobre 1 las edades estn
comprendidas entre 15 y 17 aos.
Frecuencias parciales y frecuencia total.- Tanto las frecuencias absolutas como las porcentuales o las
relativas pueden ser frecuencias parciales o una frecuencia total, siendo sta ltima la suma de todas
frecuencias parciales.
Las frecuencias porcentuales y las frecuencias relativas comparan la frecuencia parcial con la frecuencia
total, y sirven para establecer comparaciones entre muestras distintas. Por ejemplo, si en una muestra
de 1000 hombres, solo votaron 200, y en una muestra de 600 mujeres solo votaron 200 mujeres, en
trminos de frecuencias absolutas existe la misma cantidad de votantes masculinos y femeninos, es decir
200, pero en proporcin, las mujeres votaron ms (la tercera parte del total) que los hombres (la quinta
parte del total). Esta informacin se obtiene al convertir las frecuencias absolutas en frecuencias
porcentuales o en frecuencias relativas (o proporciones).

2) Tamao de la muestra.- Otro concepto importante es el tamao de la muestra (n), que designa la
cantidad total de datos. Obviamente, la suma de todas las frecuencias f debe dar como resultado el
tamao n de la muestra, por lo que el tamao de la muestra coincide con la frecuencia total.

3) Intervalos.- Un intervalo, tambin llamado intervalo de clase, es cada uno de los grupos de valores
ubicados en una fila en una tabla de frecuencias. Por ejemplo el intervalo 15-16 significa que en esa fila
se estn considerando las edades de 15 a 16 aos. La frecuencia correspondiente a un intervalo es igual
a la suma de frecuencias de los valores en l includos (2). Los intervalos presentan algunas
caractersticas, que son las siguientes:
Tamao del intervalo (a).- Tambin llamado amplitud o anchura del intervalo, es la cantidad de valores
de la variable que se consideran conjuntamente en ese intervalo. Por ejemplo, el intervalo 15-16 aos
tiene una amplitud de 2, puesto que se consideran dos valores: 15 y 16. En otro ejemplo, el intervalo 20-
25 aos tiene una amplitud de 6, puesto que se consideran seis valores.
En general, puede calcularse el tamao de un intervalo restando el lmite superior y el inferior y sumando
al resultado el nmero 1. Por ejemplo, 25 menos 20 da 5, y sumndole 1 da 6.
Los ejemplos indicados corresponden a variables discretas, lo que significa que no podrn encontrarse
valores intermedios entre dos intervalos. Por ejemplo, entre los intervalos 15-16 y 17-18 no se
encontrarn valores intermedios entre 16 y 17 aos.
Tngase presente que: a) preferiblemente los intervalos deben tener un tamao constante, de manera tal
que no se pueden considerar como intervalos 15-16 y 17-20, porque tienen diferentes tamaos; y b) los
intervalos han de ser mutuamente excluyentes, de manera tal que cuando se trata de variables discretas,
no pueden definirse los intervalos 15-16 y 16-17, porque el valor 16 aos est en ambos intervalos y no
se podr saber con seguridad en qu intervalo ubicar dicho valor.
El problema se puede presentar con las variables continuas, donde, por definicin, podra aparecer algn
valor intermedio entre dos intervalos. Por ejemplo, si se considera la variable continua ingresos
mensuales y se consideran en ella los intervalos 1000-2000 dlares y 3000-4000 dlares, puede ocurrir
que un dato obtenido de la realidad sea 2500 dlares, con lo cual no podr ser registrado en ningn
intervalo. En tal caso se deberan reorganizar los intervalos como 1000-2999 dlares y 3000-4999
dlares, con lo cual el problema estara resuelto.
Desde ya, puede ocurrir que aparezca un ingreso mensual de 2999,50 dlares, en cuyo caso en principio
deberan reorganizarse nuevamente los intervalos como 1000-2999,50 dlares y 2999,51-4999 dlares.
La forma de reorganizar los intervalos depender entonces del grado de precisin que pretenda el
investigador o del grado de precisin del instrumento de medicin disponible.
Lmites del intervalo.- Todo intervalo debe quedar definido por dos lmites: un lmite inferior y un lmite
superior. Estos lmites, a su vez, pueden ser aparentes o reales (Pagano, 1998:38-39). Considrese el
siguiente ejemplo:

Lmites aparentes Lmites reales
95-99 94.5-99.5
90-94 89.5-94.5
85-89 84.5-89.5
80-84 79.5-84.5
75-79 74.5-79.5

Si la variable considerada es discreta, carecer de sentido la distincin entre lmites reales o aparentes.
Si se conviene que los valores que la variable puede adoptar son nmeros enteros, se considerarn
solamente los intervalos 95-99, 90-94, etc. Estos intervalos son en rigor reales, porque expresan los
valores reales que puedan haber, que no son fraccionarios.
Slo en el caso de las variables continuas adquiere sentido la distincin entre lmites reales y aparentes.
Si la variable es continua, deberan tenerse en cuenta los lmites reales. Por ejemplo, si un valor resulta
ser 94.52, entonces ser ubicado en el intervalo 94.5-99.5. Sin embargo, an en estos casos, lo usual es
omitir los lmites reales y presentar slo los lmites aparentes (Pagano, 1998:39). En todo caso, los
lmites reales se utilizan a veces cuando se intenta transformar la tabla de frecuencias por intervalos en
un grfico.
En principio, en ningn caso deber haber una superposicin de valores, como en el caso de los
intervalos 20-21 y 21-22, donde el valor 21 est includo en ambos intervalos, violndose as la regla de
la mutua exclusin. Si acaso se presentara esta situacin, o bien podr ser adjudicada a un error del
autor de la tabla, o bien deber traducrsela como 20-20.99 y 21-22.99.
Punto medio del intervalo (x
m
).- Es el valor que resulta de la semisuma de los lmites superior e inferior,
es decir, el punto medio del intervalo se calcula sumando ambos lmites y dividiendo el resultado por dos.
Por ejemplo, el punto medio del intervalo 15-20 es 17.5. El punto medio del intervalo sirve para calcular
la media aritmtica.
Intervalos abiertos y cerrados.- Idealmente, todos los intervalos deberan ser cerrados, es decir, deberan
estar especificados un lmite superior y uno inferior de manera definida. Sin embargo, en algunos casos
se establecen tambin intervalos abiertos, donde uno de los lmites queda sin definir. En el siguiente
ejemplo, 18 o menos y 29 o ms son intervalos abiertos. Obviamente, en este tipo de distribucin los
intervalos dejan de ser de tamao constante.

Intervalos
18 o menos
19-23
24-28
29 o ms

Cantidad de intervalos.- La cantidad de intervalos es inversamente proporcional al tamao de los
mismos: cuanto menor tamao tienen los intervalos, ms numerosos sern.
El solo hecho de emplear intervalos supone una cierta prdida de la informacin. Por ejemplo, si se
considera el intervalo 15-18 aos, quedar sin saber cuntas personas de 16 aos hay. Para reducir esta
incertidumbre, podra establecerse un intervalo menor (15-16 aos), pero con ello habr aumentado la
cantidad de intervalos hasta un punto donde la informacin se procesar de manera ms difcil.
Consiguientemente, al agrupar los datos hay que resolver el dilema entre perder informacin y presentar
los datos de manera sencilla (Pagano R, 1998:37) (Botella, 1993:54), es decir, encontrar el justo
equilibrio entre el tamao de los intervalos y su cantidad.
En la prctica, por lo general (Pagano, 1998:37) se consideran de 10 a 20 intervalos, ya que la
experiencia indica que esa cantidad de intervalos funciona bien con la mayor parte de las distribuciones
de datos (3).

Se pueden sintetizar algunas reglas importantes para la construccin de intervalos de la siguiente
manera:
a) Los intervalos deben ser mutuamente excluyentes.
b) Cada intervalo debe incluir el mismo nmero de valores (constancia de tamao).
c) La cantidad de intervalos debe ser exhaustiva (todos los valores deben poder ser includos en algn
intervalo).
d) El intervalo superior debe incluir el mayor valor observado (Botella, 1993:54).
e) El intervalo inferior debe incluir al menor valor observado (Botella, 1993:54).
f) En variables continuas, es aconsejable expresar los lmites aparentes de los intervalos, que los lmites
reales.

3. VISUALIZACIN DE LOS DATOS: GRFICOS

Una vez que los datos han sido organizados en tablas de frecuencias, es posible seguir avanzando
organizndolos, desde all, de otras maneras diferentes y con distintos propsitos. Una de estas maneras
es la utilizacin de representaciones grficas, algunas de las cuales son aptas para representar variables
cualitativas (niveles nominal y ordinal) y otras para variables cuantitativas. Al tratarse de esquemas
visuales, los grficos permiten apreciar de un golpe de vista la informacin obtenida.

Diagrama de tallo y hojas

Esta tcnica de visualizacin de datos es aqu mencionada en primer lugar porque puede ser considerada
un procedimiento intermedio entre la tabla de frecuencias y el grfico. Fue creada por Tukey en 1977
(citado por Botella, 1993:59) y presenta, entre otras, las siguientes ventajas: a) permite conocer cada
puntuacin individual (a diferencia de la tabla de frecuencias por intervalos, donde desaparecen en ellos);
y b) puede ser considerada un grfico si hacemos girar 90 el listado de puntuaciones o datos.

A continuacin se describe la forma de construir un diagrama de tallo y hojas, tomando como ejemplo la
siguiente distribucin de datos ordenados:

32-33-37-42-46-49-51-54-55-57-58-61-63-63-65-68-71-72-73-73-73-75-77-77-78-83-85-85-91-93

Tallo Hojas Procedimiento para realizar el diagrama de tallo y hojas

a) Se construye una tabla como la de la izquierda con dos columnas: tallos y
hojas.
b) Se identifican cules son los valores extremos: 32 y 93.
c) Se consideran los primeros dgitos de cada valor: 3 y 9.
d) En la columna tallos se colocan los nmeros desde el 3 hasta el 9.
e) En la columna hojas se colocan los segundos dgitos de cada valor que
empiece con 3, con 4, con 5, etc.
3 237
4 269
5 14578
6 13358
7 123335778
8 355
9 13

Girando la tabla obtenida 90 hacia la izquierda, se obtendr algo similar a un grfico de barras, que
muestra por ejemplo que la mayor concentracin de valores es la que comienza con 7.

Una utilidad adicional del diagrama de tallo y hojas es que permite comparar visualmente dos variables,
es decir, dos conjuntos de datos en los anlisis de correlacin, como puede apreciarse en el siguiente
ejemplo:

Hojas (Grupo control) Tallo Hojas (Grupo experimental)
87655 1 9
44322110 2 124
876655 3 5667788899
111000 4 00023344
5 555

Visualmente es posible darse una idea de los resultados del experimento: los datos del grupo
experimental tienden a concentrarse en los valores altos, y los del grupo de control en los valores bajos.

Pictograma

Es una representacin grfica en la cual se utilizan dibujos. Por ejemplo, en el siguiente pictograma cada
cara puede representar 100 personas:



Sector circular

Representacin grfica de forma circular donde cada porcin de la torta representa una frecuencia. Para
confeccionarlo se parte de una tabla de frecuencias donde estn especificadas las frecuencias en grados
(f), las cuales se calculan mediante una sencilla regla de tres simple a partir de las frecuencias absolutas
(f).
Por ejemplo, si 825 es a 360, entonces 310 es igual a 360 x 310 dividido por 825, lo cual da un
resultado de 135. Por lo tanto, para representar la frecuencia 310 deber trazarse un ngulo de 135.
Estos valores pueden verse en el ejemplo siguiente, donde se han representado dos sectores circulares
distintos, uno para varones y otro para mujeres:
Varones
Mujeres
100 personas

x
(patologa)
Sexo Total f
(varones)
f
(mujeres) Varones Mujeres
Angina 310 287 597 135 113
Bronquitis 297 429 726 130 169
Sarampin 123 120 243 54 47
Otras 95 80 175 41 31
Total 825 916 1691 360 360



Para realizar estos sectores se traza un ngulo de por ejemplo 130 y dentro de coloca la palabra
bronquitis, y as sucesivamente.
El crculo para mujeres es algo mayor que el crculo para hombres, porque en la muestra hay ms
mujeres que hombres. Para lograr estos tamaos debe calcularse el radio. Por ejemplo, si se ha elegido
un radio masculino de 4 cm, el radio femenino puede calcularse mediante la frmula siguiente:
El radio femenino es igual al radio masculino multiplicado por la raz cuadrada del n femenino, resultado
que se dividir por la raz cuadrada del n masculino, donde n = tamao de la muestra de cada sexo. Si el
radio masculino es 4 cm, con esta frmula se obtendr un radio femenino de 4,22 cm.

Diagrama de barras

Representacin grfica donde cada barra representa una frecuencia parcial. En el eje de las ordenadas se
indican las frecuencias absolutas, y en el eje de absisas se representan los valores de la variable x. De
esta manera, las barras ms altas tienen mayor frecuencia.
Existen diferentes tipos de diagramas de barras, de los cuales se ilustran tres: las barras simples, las
barras superpuestas y las barras adyacentes. Los dos ltimos tipos dan informacin sobre dos variables
al mismo tiempo, que son sexo y estado civil en los ejemplos que siguen:

Varones
Mujeres
Bronquitis
Angina
Saram
pin
Otras
Bronquitis
Angina
Saram
pin
Otras


Las barras tambin pueden disponerse horizontalmente.
Mediante el diagrama de barras pueden representarse variables cualitativas y cuantitativas discretas.

Histograma de Pearson

Utilizado para representar variables cuantitativas continuas agrupadas en intervalos, este grfico se
compone de barras adyacentes cuya altura es proporcional a las respectivas frecuencias parciales. En el
ejemplo siguiente, se presenta la tabla de frecuencias por intervalos y su histograma correspondiente:

x (longitud) f
1-1.99 3
2-2.99 5
3-3.99 2
Total 10


f

25

20

15

10

5

Barras simples
f

25

20

15

10

5

Solteros Casados Separados
x
Barras superpuestas
f

25

20

15

10

5

Solteros Casados Separados x
Barras adyacentes
Solteros Casados Separados x
Adolescentes
Adultos


Como pude apreciarse, en las absisas se indican los lmites inferiores de los intervalos.
Cuando los intervalos no son iguales, en lugar de indicar las frecuencias absolutas pueden indicarse las
alturas (h). Esta ltima se obtiene dividiendo la frecuencia parcial por el tamao del intervalo
correspondiente.

Polgono de frecuencias

Es un grfico de lneas rectas que unen puntos, siendo cada punto la interseccin del punto medio del
intervalo (indicado en las absisas) y la frecuencia correspondiente. Tomando el ejemplo anterior, el
polgono de frecuencias sera el siguiente:



Un polgono de frecuencias puede obtenerse tambin a partir del histograma correspondiente. Para ello
basta con indicar los puntos medios de cada lnea horizontal superior de cada barra del histograma, y
luego unirlos con lneas rectas.
Otra alternativa para este tipo de diagrama es el polgono de frecuencias acumuladas, donde se indican
las frecuencias acumuladas en lugar de las frecuencias habituales.

Ojiva de Galton

Grfico en el cual se consignan en las ordenadas las frecuencias acumuladas y en las absisas los lmites
superiores de cada intervalo (aunque tambin pueden indicarse los puntos medios de cada intervalo). Por
ejemplo:

x (longitud) f F
1-1.99 3 3
2-2.99 5 8
3-3.99 2 10
Total 10

f

5

4

3

2

1

1.5 2.5 3.5 punto medio (xm)
f

5

4

3

2

1

1 2 3 4
x


La ojiva de Galton tambin puede representar frecuencias acumuladas decrecientes.

4. SNTESIS DE LOS DATOS: MEDIDAS ESTADSTICAS DE POSICIN

Los datos individuales pueden ser sintetizados mediante medidas de posicin, medidas de dispersin
(ambas se llaman medidas estadsticas), medidas de asimetra y medidas de curtosis. En este tem se
describen las medidas de posicin.

Definicin

Las medidas de posicin pueden ser definidas de diversas formas (4). En esta nota proponemos la
siguiente definicin: Las medidas de posicin son datos estadsticos que intentan representar un conjunto
de datos individuales respecto de una variable.
Esta definicin se refiere a tres cuestiones:

1) Son medidas estadsticas, es decir, no son medidas individuales. Una medida de posicin representa a
todo un conjunto de datos, y no son los datos individuales. Por ejemplo, un promedio de edades
representa a todas las edades del grupo, y no es la edad individual de uno de sus miembros, aunque
pueda coincidir numricamente con ella. As, si el promedio de edades es 20 aos y una de las personas
del grupo tiene 20 aos, el primer dato es una medida estadstica y el segundo una medida individual.
En otros trminos, las medidas estadsticas no describen individuos, sino poblaciones o muestras. Por
ejemplo, no tiene sentido explicar que una persona es anciana porque vive en una poblacin cuyo
promedio de edad es 70 aos.
2) Son medidas representativas, es decir, intentan representar y sintetizar a todas las medidas
individuales. El conjunto de todas las medidas individuales puede recibir diversos nombres, tales como
muestra y poblacin, con lo cual tiene sentido afirmar proposiciones tales como una medida de posicin
representa una muestra o una poblacin.
Por ejemplo, es posible representar las notas obtenidas por un grupo de alumnos de diversas maneras:
a) El promedio de las notas es de 7.35 puntos (en este caso usamos una medida de posicin llamada
media aritmtica).
b) La mitad de los alumnos ha obtenido una nota superior a 6,5 puntos (en este caso utilizamos otra
medida de posicin llamada mediana).
c) La nota que ms se ha repetido fue 7 puntos (en este caso usamos la medida de posicin llamada
modo).
La pregunta acerca de cul de las tres medidas de posicin representa mejor al conjunto de datos
individuales es el problema de la representatividad de la medida de posicin, y la estadstica suministra,
F

10

9

8

7

6

5

4

3

2

1
1.99 2.99 3.99 lm superior (Ls)
como se ver, diversos criterios para evaluar la mejor forma de representar un cierto nmero de datos
individuales.
3) Son medidas que miden una variable, es decir, algn atributo o propiedad de los objetos. En el
ejemplo anterior la variable medida es el rendimiento acadmico, pero tambin pueden obtenerse
medidas de posicin representativas de un conjunto de edades, de profesiones, de clases sociales, de
puntuaciones de un test, de cantidad de dientes, etc.
De otra manera: no tiene sentido decir que una medida de posicin represente un conjunto de personas,
pero s tiene sentido decir que representan las edades de un conjunto de personas.

Caractersticas de las principales medidas de posicin

Las medidas de posicin pueden ser de tendencia central y de tendencia no central. Las primeras se
refieren a los valores de la variable que suelen estar en el centro de la distribucin (Kohan, 1994:69).
Por ejemplo: la media aritmtica, la mediana y el modo son las ms conocidas, pero tambin est la
media aritmtica ponderada (til cuando hay valores que se repiten y que requieren atencin diferencial),
la media geomtrica (Kohan, 1994:71-72), la media armnica, la media antiarmnica, la media
cuadrtica, la media cbica, etc.
Las medidas de posicin no centrales son los cuartiles, deciles y percentiles (Kohan, 1994:79), que
reciben genricamente el nombre de cuantiles o fractiles (5). Los cuantiles se clasifican entonces en
cuartiles, quintiles, deciles y percentiles, segn que dividan la serie ordenada de valores en cuatro, cinco,
diez o cien partes iguales.
De acuerdo a Botella (1993:99), las medidas de posicin no centrales son datos o valores que ocupan
una posicin especial en la serie de datos. Cuando una medida de posicin es un dato que ocupa un lugar
central, la llamamos medida de tendencia central.

En el siguiente cuadro se especifican las definiciones y caractersticas principales de las medidas de
posicin.

Medida Definicin Caractersticas
MODO Es el dato o
valor que ms
se repite, o
sea, el de
mayor
frecuencia.
Resulta til si hay muchos datos repetidos (altas frecuencias).
Puede calcularse cuando hay valores muy extremos.
El modo muestral no es un estimador suficiente del modo poblacional
porque no incluye todos los datos.
En distribuciones multimodales es posible que la muestra no sea
homognea, y que est constituda por varios estratos.
Es posible convertir una distribucin multimodal en una modal
reorganizando los intervalos.
Si una distribucin no tiene modo, podra obtenerse reorganizando los
datos en intervalos.
MEDIANA Es el dato o
valor que
divide por la
mitad la serie
de datos
ordenados
creciente o
decrecienteme
nte, es decir,
es el valor
central de la
serie.
Es la medida ms til en escalas ordinales siempre que los valores
centrales sean iguales.
No est influenciada por los valores extremos (por ello por ejemplo
puede aplicarse desconociendo estos o sea cuando hay lmites
superiores o inferiores abiertos).
Puede usarse cuando hay intervalos abiertos, siempre que el orden de
la mediana no se corresponda con ellos.
Es til cuando unos pocos datos difieren mucho del resto.
No es til si hay muchos datos repetidos (altas frecuencias).
La mediana muestral no es un estimador suficiente de la mediana
poblacional porque no incluye todos los datos.
Es til es distribuciones muy asimtricas (extremos no compensados).
La mediana coincide con el Q2 (cuartil 2), el D5 (decil 5) y el P50
(percentil 50) (8).
MEDIA
ARITMTICA
Es el promedio
aritmtico de
todos los
datos o
valores.
Est influenciada por los valores extremos (por ejemplo, no puede
utilizarse cuando hay valores extremos desconocidos o intervalos
abiertos, salvo que estos puedan cerrarse).
No conviene cuando los valores extremos son muy altos o muy bajos.
Es til en distribuciones simtricas (con extremos compensados).
No puede usarse en escalas nominales ni ordinales.
Es siempre superior a la media geomtrica y a la media armnica.
La media muestral es un estimador suficiente de la media poblacional
porque incluye todos los datos.
No necesariamente coincide con alguno de los valores.
La media aritmtica tiene varios otras propiedades (7).
CUANTIL Es el dato o
valor que
Es til cuando hay gran cantidad de valores.
Puede tambin utilizarse como medida de dispersin.
divide la serie
ordenada de
datos en
partes iguales.
Suelen utilizarse los cuartiles, los deciles y los percentiles.
-Cuartiles Valores que
dividen la
serie en
cuatro partes
iguales.
Tres cuartiles dividen la serie en cuatro partes iguales.
-Deciles Valores que
dividen la
serie en diez
partes iguales.
Nueve deciles dividen la serie en diez partes iguales.

-Percentiles Valores que
dividen la
serie en cien
partes iguales.
Noventa y nueve percentiles dividen la serie en cien partes iguales.
Tambin se llaman centiles.


Relacin entre modo, mediana y media aritmtica.- a) La experiencia indica que la relacin entre estas
tres medidas es:
Modo = (3 . Mediana) (2 . Media aritmtica). Esta relacin es conocida como la frmula de Pearson. b)
Cuanto ms simtrica es una distribucin (por ejemplo en una curva normal), ms tienden a coincidir los
valores de las tres medidas.

Media armnica y media geomtrica.- Otras medidas de posicin asociadas a la media aritmtica son la
media armnica y la media geomtrica.
La media armnica es una medida de posicin que suele utilizarse cuando se comparan cantidades
constantes de una variable con cantidades variables de otra. Se emplea por ejemplo en fsica o en
msica.
La media armnica se utiliza en problemas tales como el siguiente: Cul es la velocidad promedio de un
mvil que recorre una trayectoria sobre un cuadrado de 200 km de lado? Las cantidades variables son las
velocidades diferentes en cada lado del cuadrado, mientras que la cantidad constante es 200 km. Para
calcularla, se utiliza una frmula donde el numerador es la cantidad de lados (en este caso cuatro), y el
denominador es la suma de las inversas de las diferentes velocidades (por ejemplo 1/200 kmh, ms
1/150 kmh, etc.).
La media geomtrica es una medida de posicin utilizada en variables tales como tasas de crecimiento,
tasas de mortalidad, tasas de inters o cualquier otra expresada en porcentajes. La media geomtrica no
est tan influenciada por los valores extremos como en la media aritmtica
La media geomtrica se utiliza en problemas tales como el siguiente: En un banco se colocan 100$ al
10% en el primer mes, al 6% en el segundo mes, al 4% en el tercer mes y al 8% en el cuarto mes. Cul
es la tasa de inters promedio obtenida?
Para calcular la media geomtrica, es decir, la tasa de inters promedio, se utiliza la frmula
correspondiente. En este caso se multiplican los valores $110, $106, $104 y $108, que expresan el
capital no acumulado ms el inters de cada mes, y el resultado se lo eleva a la raz cuarta (porque son
cuatro los meses). El resultado es $106.9 que, restado a $100, da $6.9. Esto significa que la tasa de
inters promedio es del 6.9%.

Clculo analtico de las medidas de posicin: frmulas

Para calcular una determinada medida de posicin puede haber diversas frmulas. La eleccin de la
frmula adecuada depender de la forma en que estn organizados los datos individuales.
En principio, los datos pueden estar organizados de cuatro maneras:
1) Datos desordenados. Por ejemplo, las edades de un grupo de cuatro personas son 17, 29, 17 y 14.
Cuando se recolecta informacin, generalmente se obtienen datos desordenados, frente a lo cual
convendr ordenarlos.
2) Datos ordenados. Por ejemplo, las edades del mismo grupo de personas son 14, 17, 17 y 29, si hemos
decidido ordenarlas en forma creciente, aunque tambin podemos ordenarlas decrecientemente.
3) Datos agrupados por frecuencia. Por ejemplo, hay dos edades de 17 aos, una edad de 14 aos y una
edad de 29 aos. O, lo que es lo mismo, la frecuencia de la edad 17 es 2, y la frecuencia de las restantes
edades es 1.
4) Datos agrupados por intervalos. Por ejemplo, hay 3 edades comprendidas en el intervalo 14-17 aos,
y una edad comprendida en el intervalo 18-29 aos.
La estadstica va agrupando los datos siguiendo el orden anterior. Cuanto ms avance en este proceso,
ms habr logrado sintetizar y organizar los datos individuales.
En el siguiente cuadro se sintetizan las diversas reglas o frmulas para calcular las medidas de posicin,
segn como estn organizados los datos individuales y segn los niveles de medicin que admiten.
Ntese que en algunos casos no es posible especificar ninguna frmula, y entonces el clculo se har
siguiendo la regla indicada para los mismos. Por ejemplo: para calcular el modo de un conjunto de datos
ordenados, debe buscarse el dato o valor que ms se repite (6).

Clculo de medidas de posicin segn los niveles de medicin que admiten y segn la forma de organizacin de los datos individuales.
Preparado por: Pablo Cazau

Medida de
posicin
Nivel de
medicin
Datos ordenados Datos agrupados por frecuencia Datos agrupados por intervalos
Modo Nominal Valor que ms se repite Valor con la mayor frecuencia
------------
Ordinal Valor que ms se repite Valor con la mayor frecuencia
------------
Cuantitativo Valor que ms se repite Valor con la mayor frecuencia
f - f
ant

Mo = L
i
+ ---------------------- . a
(f - f
ant
) + (f- f
pos
)
Mediana Ordinal Valor central de la serie
ordenada de valores
Valor que corresponde a la frecuencia acumulada n/2
------------
Cuantitativo Valor central de la serie
ordenada de valores
Valor que corresponde a la frecuencia acumulada n/2
n/2 - F
ant

Mn = L
i
+ ---------------------- . a
f
Media
aritmtica
Cuantitativo
E x
X = -----
n
E (x.f)
X = ---------
n
E (x
m
.f)
X = ---------
n
Cuartil Cuantitativo Valores que dividen la serie
en cuatro partes iguales.
Por tanto, hay 3 cuartiles: Q1,
Q2 y Q3
Valor que corresponde a la frecuencia acumulada t.n/4, expresin
llamada cuartil de orden o Q
0
(1)
Donde t puede valer 1, 2 o 3.
Por tanto, hay 3 cuartiles: Q1, Q2 y Q3
t.n/4 - F
ant

Q
t
= L
i
+ ---------------- . a
f
Decil Cuantitativo Valores que dividen la serie
en diez partes iguales.
Por tanto, hay 9 deciles:
desde el D1 hasta el D9
Valor que corresponde a la frecuencia acumulada t.n/10, expresin
llamada decil de orden o D
0
(1)
Donde t puede valer entre 1 y 9.
Por tanto, hay 9 deciles: desde el D1 hasta el D9
t.n/10 - F
ant

D
t
= L
i
+ ---------------- . a
f
Percentil Cuantitativo Valores que dividen la serie
en cien parte iguales.
Por tanto, hay 99 percentiles:
desde el P1 hasta el P99
Valor que corresponde a la frecuencia acumulada t.n/100, expresin
llamada percentil de orden o P
0
(1)
Donde t puede valer entre 1 y 99.
Por tanto, hay 99 percentiles: desde el P1 hasta el P99
t.n/100 - F
ant

P
t
= L
i
+ ---------------- . a
f

(1) Si no puede identificarse unvocamente una frecuencia acumulada, y por tanto un valor determinado de x, puede ser calculada por interpolacin. En realidad, los cuantiles se
utilizan preferentemente cuando los datos estn agrupados por intervalos.

A continuacin, se suministran ejemplos de cmo calcular cada medida de posicin teniendo en cuenta
las reglas y frmulas del esquema anterior.

a) Clculo del modo para datos ordenados (niveles nominal, ordinal y cuantitativo)

Nivel nominal: perro, perro, gato, gato, gato, gato (por tanto, el modo es gato)
Nivel ordinal: grande, grande, mediano, mediano, mediano, chico, chico, chico, chico (por tanto, el
modo es chico)
Nivel cuantitativo: 6, 6, 7, 7, 7, 7, 8, 9, 10, 10, 11 (por tanto, el modo es 7)

b) Clculo del modo para datos agrupados en frecuencia (niveles nominal, ordinal y
cuantitativo)

Nivel nominal Nivel ordinal Nivel cuantitativo
x (religin) f
Catlicos 56
Protestantes 78
Judos 45
Budistas 24
Otros 31
x (dureza) f
Muy duro 18
Duro 8
Intermedio 13
Blando 16
Muy blando 7
x (edad) f
30 aos 6
31 aos 14
32 aos 19
33 aos 24
34 aos 15
El modo es Protestantes El modo es Muy duro El modo es 33 aos

Como puede verse, el modo es el valor de la variable x que est ms repetido.

c) Clculo del modo para datos agrupados por intervalos (nivel cuantitativo)

x (cantidad piezas dentarias) f
10-18 6
19-27 8
28-36 24
37-45 2
n=40

Una vez confeccionada la tabla de frecuencias por intervalos, se procede en dos pasos:

a) Se identifica cul es el intervalo de mayor frecuencia. En este caso, es 28-36.
b) Se aplica la frmula correspondiente:

f - f
ant

Mo = L
i
+ ---------------------- . a
(f - f
ant
) + (f- f
pos
)

24 - 8
Mo = 28 + ---------------------- . 8 = 31.37 piezas dentarias
(24 - 8) + (24 - 2)

d) Clculo de la mediana para datos ordenados (niveles ordinal y cuantitativo)

Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o
ascendente. Si el conjunto de datos contiene un nmero impar de elementos, el central es la mediana. Si
hay un nmero par, la mediana es el promedio de los dos datos centrales.

Ejemplos para el nivel ordinal:

Nmero impar de datos: alto, alto, alto, alto, medio, medio, medio, medio, medio, medio, bajo (por
tanto, la mediana es = medio).
Nmero par de datos: En el nivel ordinal no puede calcularse un promedio si los dos valores centrales son
distintos. Si los dos valores centrales son iguales, ese es el valor de la mediana.

Ejemplos para el nivel cuantitativo:

Nmero impar de datos: 13, 13, 13, 14, 14, 17, 18, 19, 19 (por tanto, la mediana es 14)
Nmero par de datos: 11, 11, 12, 13, 14, 15, 16, 18, 18, 18 (por tanto, la mediana es el promedio entre
14 y 15, o sea 14.5).


Pgina 35 de 325
35
e) Clculo de la mediana para datos agrupados por frecuencia (niveles ordinal y cuantitativo)

x (das) f F
1 7 7
2 9 16
3 14 30
4 10 40
5 2 42
n = 42

La variable es aqu cantidad de das de posoperatorio.
El procedimiento es el siguiente:
a) Se calcula la mediana de orden:

Mn
0
= n/2 = 42/2 = 21

b) Se identifica cul es el valor de x que corresponde a la frecuencia acumulada que contiene el valor 21:

Dicha frecuencia acumulada es 30, y, por lo tanto Mn = 3 das

f) Clculo de la mediana para datos agrupados por intervalos (nivel cuantitativo)

x f F
0-3 8 8
3-6 10 18
6-9 11 29
9-12 12 41
12-15 9 50
15-18 7 57
18-21 6 63
21-24 5 68
n = 68

Ntese que para calcular la mediana se precisa informacin sobre frecuencias acumuladas, razn por la
cual se ha agregado la columna respectiva.
Se procede en dos pasos:
a) Se identifica cul es el intervalo que debe ser considerado, para lo cual se calcula la mediana de
orden:

Mn
0
= n/2 = 68/2 = 34
Tomando en cuenta las frecuencias acumuladas, el valor 34 entra en la frecuencia acumulada 41, y, por
lo tanto, el intervalo a considerar ser 9-12.
b) Se aplica la frmula de mediana:

n/2 - F
ant

Mn = L
i
+ ---------------------- . a
f

34 - 29
Mn = 9 + ---------------------- . 3 = 10.25
12

Tngase presente que si la variable fuera discreta y medible slo en nmeros enteros, sera Mn = 10.
Si la variable fuese cantidad de materias aprobadas, el alumno con 10 materias aprobadas est en el
lugar central de la serie, es decir, habra un 50% de compaeros con menos materias aprobadas y un
50% con ms materias aprobadas.

g) Clculo de la media aritmtica para datos ordenados (nivel cuantitativo)

Dados los siguientes dados ordenados: 2-2-3-4-4-4-5-5-6-7-8-10
Se puede calcular la media aritmtica aplicando la frmula:

E x
X = -----
n

Pgina 36 de 325
36

2+2+3+4+4+4+5+5+6+7+8+10 60
X = ---------------------------------------- = --------- = 5
12 12


h) Clculo de la media aritmtica para datos agrupados por frecuencia (nivel cuantitativo)

x (edad) f f . x
18 3 54
19 1 19
20 2 40
23 4 42
25 2 50
26 2 52
28 2 56
n = 16 363

Ntese que para el clculo de la media aritmtica se ha agregado una columna con los productos de x . f.
Se aplica la frmula de media aritmtica:

E (x.f) 54+19+40+42+50+52+56 363
X = --------- = ----------------------------------- = -------- = 22.68 aos = 23 aos.
n 16 16


i) Clculo de la media aritmtica para datos agrupados por intervalos (nivel cuantitativo)

x f x
m
x
m
.f
0-3 8 1.5 12
3-6 10 4.5 45
6-9 11 7.5 82.5
9-12 12 10.5 126
12-15 9 13.5 121.5
15-18 7 16.5 115.5
18-21 6 19.5 117.6
21-24 5 22.5 112.5
n = 68 732.5

Ntese que para el clculo de la media aritmtica se ha agregado una columna con los puntos medios de
los intervalos y otra con los productos de las frecuencias por los puntos medios.
Se aplica la frmula de media aritmtica:

E (x
m
.f) 732.5
X = ------------- = ---------- = 10.77
n 68

El mtodo corto y el mtodo clave son dos mtodos alternativos para calcular la media aritmtica, siendo
el ltimo slo aplicable cuando el tamao de los intervalos es constante.
De acuerdo al mtodo corto, la media aritmtica se calcula sumando al punto medio del intervalo de
mayor frecuencia, el cociente entre la sumatoria de los productos entre cada frecuencia y la diferencia
entre el punto medio de cada intervalo menos el punto medio del intervalo de mayor frecuencia, y la
sumatoria de frecuencias (n).
De acuerdo al mtodo clave, la media aritmtica se calcula sumando al punto medio del intervalo de
mayor frecuencia, el producto entre el tamao del intervalo y un cociente, donde el numerador es la
sumatoria de los productos entre las frecuencias y el llamado intervalo unitario (que resulta de dividir la
diferencia entre cada punto medio y el punto medio del intervalo de mayor frecuencia, por el tamao del
intervalo), y donde el denominador es la sumatoria de frecuencias (n).

j) Clculo del cuantil para datos ordenados (nivel cuantitativo)

1-1-1-1-1-2-2-2-3-3-3-3-4-5-6-6-6-6-7-7-8-8-9


Pgina 37 de 325
37
Si en la serie anterior resaltamos los tres valores que la dividen en cuatro partes iguales, esos valores
sern los cuartiles Q
1
, Q
2
y Q
3
:

1-1-1-1-1-2-2-2-3-3-3-3-4-5-6-6-6-6-7-7-8-8-9

Q
1
= 2
Q
2
= 3
Q
3
= 6

Sin embargo, es ms prctico agrupar los datos por frecuencias o por intervalos, a los efectos del clculo
de los cuantiles (cuartiles, deciles o percentiles).

k) Clculo del cuantil para datos agrupados por frecuencia (nivel cuantitativo)

x (edad) f F
18 3 3
19 1 4
20 2 6
23 4 10
25 2 12
26 2 14
28 2 16
n = 16

Se pueden calcular, por ejemplo, Q
1
, Q
2
y Q
3
.

El primer paso consiste en averiguar los respectivos cuartiles de orden.

Para Q
1
es Q
0
= t.n/4 = 1.16/4 = 4
Para Q
2
es Q
0
= t.n/4 = 2.16/4 = 8
Para Q
3
es Q
0
= t.n/4 = 3.16/4 = 12

El segundo y ltimo paso consiste en identificar el valor de x correspondiente al cuartil de orden
respectivo.

Q
1
= 4
Q
2
= Est entre 20 y 23
Q
3
= 25

l) Clculo del cuantil para datos agrupados por intervalos (nivel cuantitativo)

x (puntaje) f F
0-10 1 1
10-20 3 4
20-30 5 9
30-40 6 15
40-50 10 25
50-60 12 37
60-70 13 50
70-80 9 59
80-90 4 63
90-100 3 66
n = 66

Se pueden calcular, por ejemplo, Q
3
, D
7
y P
45
.

El primer paso consiste en averiguar los cuantiles de orden:

Para Q
3
es Q
0
= t.n/4 = 3.66/4 = 49.5
Para D
7
es D
0
= t.n/10 = 7.66/10 = 46.2
Para P
45
es P
0
= t.n/100 = 45.66/100 = 29,7

El segundo paso consiste en identificar el intervalo que corresponde al cuantil de orden en la columna de
frecuencias acumuladas:

El valor 49.5 corresponde al intervalo 60-70

Pgina 38 de 325
38
El valor 46.2 corresponde al intervalo 60-70
El valor 29.7 corresponde al intervalo 50-60

El tercer y ltimo paso consiste en aplicar la frmula basndose en la informacin del intervalo
identificado. Si la frmula pide el dato de la frecuencia acumulada anterior y esta no existe, se coloca 0
(cero).
En el ejemplo del clculo del D7, se aplica la siguiente frmula:

t.n/10 - F
ant

D
t
= L
i
+ ------------------- . a
f

46.2 - 37
D
7
= 60 + ---------------- . 11 = 67.78
13


Clculo visual de las medidas de posicin: grficos

Es posible utilizar un procedimiento grfico para calcular ciertas medidas de posicin, tales como el modo
y la mediana. Por ejemplo, el modo se puede calcular a partir de un histograma. La mediana tambin
puede calcularse con un histograma, aunque lo ms habitual es hacerlo mediante una ojiva.

a) Clculo del modo mediante un histograma

Una vez construido el histograma a partir de una tabla de datos agrupados por intervalos:
1) Se considera el rectngulo de mayor frecuencia (mayor altura).
2) Dentro del mismo se trazan dos rectas como est indicado en el grfico siguiente.
3) Por la interseccin de ambas rectas se traza una recta perpendicular al eje de absisas.
4) El punto del eje de las absisas por donde pasa la recta perpendicular corresponde al modo (en el
ejemplo, el modo es 4.80).



b) Clculo de la mediana mediante una ojiva

En este caso pueden utilizarse dos procedimientos:
1) Una vez trazada la ojiva, a) se ubica en el eje de las ordenadas a la mediana de orden (Mn
0
); b) por
la mediana se orden se traza una recta paralela al eje x hasta que intersecte la ojiva; c) por este punto
de interseccin se traza una recta paralela al eje y hasta que intersecte el eje x. En este punto estar
ubicada la mediana.
2) Se trazan en el mismo eje de coordenadas las ojivas creciente y decreciente de la misma distribucin
de datos. Luego, a) se traza una recta paralela al eje y que pase por la interseccin de ambas ojivas y
por algn punto del eje x; b) el punto del eje x por donde pasa dicha recta corresponde a la mediana.

Criterios de eleccin de medidas de posicin

1) La eleccin de una medida de posicin debe tener en cuenta el nivel de medicin de la variable que se
mide:
f

5

4

3

2

1

1 4 7 10
x

Pgina 39 de 325
39

Nivel nominal Nivel ordinal Nivel cuantitativo
Modo SI SI SI
Mediana NO SI. Siempre y cuando los dos
valores centrales con n = par
sean iguales. En caso
contrario usar el Modo.
SI
Media
aritmtica
NO NO SI Cuando no haya valores extremos
alejados ni valores extremos abiertos. En
caso contrario, usar el Modo o la Mediana
(*).
Cuantiles NO NO SI

(*) Hay al menos tres situaciones donde se preferir la mediana a la media (Botella, 1993:115): a) cuando la variable
es ordinal, b) cuando haya valores extremos que distorsionen la interpretacin de la media, y c) cuando haya
intervalos abiertos, como en el caso de variables como ingresos mensuales.

2) La eleccin de una medida de posicin debe tener en cuenta la forma en que estn organizados los
datos. Por ejemplo: en ocasiones, el azar hace que un solo elemento no representativo se repita lo
suficiente para ser el valor ms frecuente del conjunto de datos. Es por esta razn que rara vez
utilizamos el modo de un conjunto de datos no agrupados como medida de tendencia central. Por esta
razn, debemos calcular el modo en datos agrupados en una distribucin de frecuencias (Levin y Rubin,
1996).

3) La eleccin de una medida de posicin de una muestra debe tener en cuenta el grado de fidelidad con
que representa a la medida de posicin poblacional.
Botella (1993:114) afirma, en este sentido, que si no hay ningn argumento en contra, siempre se
preferir la media, no slo porque permite la utilizacin de otras medidas estadsticas (por ejemplo el
desvo estndar), sino porque es ms representativa de la media poblacional que el modo o la mediana
con respecto al modo o la mediana poblacional.

5. SNTESIS DE LOS DATOS: MEDIDAS ESTADSTICAS DE DISPERSIN

Definicin

Las medidas de dispersin, llamadas tambin medidas de variabilidad o de variacin, son datos
estadsticos que informan acerca del grado de dispersin o variabilidad de los datos individuales de una
muestra o una poblacin, respecto de una variable. En otras palabras, indican el grado de homogeneidad
o de heterogeneidad del conjunto de los datos. Por ejemplo, indican cun alejados o cun cercanos se
encuentran los datos de algn valor central como la media aritmtica: una muestra cuyos datos son 3-4-
5 es menos dispersa que una muestra cuyos datos son 1-4-7.

Algunos autores (Botella, 1993:325) han relacionado la dispersin de los datos -para los niveles de
medicin nominal y ordinal- con los conceptos de entropa y de incertidumbre e incluso han propuesto
a la primera como una medida que permite cuantificar la dispersin: a mayor dispersin de los datos, hay
mayor entropa y mayor incertidumbre.
Por ejemplo, las siguientes dos muestras tienen cada una 40 sujetos que han elegido determinados
colores para representar la idea de paz:

Blanco Verde Amarillo Celeste Rosa
Muestra A: 28 3 3 3 3
Muestra B: 8 8 8 8 8

Si habra que adivinar qu color eligi determinado sujeto de la muestra A, cabra proponer el color
blanco porque fue el ms elegido. En cambio, la incertidumbre aumenta si habra que elegir lo mismo en
la muestra B. En esta muestra hay ms entropa, es decir, ms desorden, mientras que en la muestra A
los datos estn ms ordenados alrededor de un valor muy repetido, como el blanco.
La muestra B es ms dispersa, es decir, ms heterognea, mientras que la muestra A es menos dispersa,
es decir, ms homognea. La homogeneidad no debe relacionarse con la repeticin de frecuencias (3-3-
3-3) sino con la repeticin de valores iguales o muy cercanos entre s (28 sujetos eligieron blanco).

Una medida de posicin no alcanza para describir adecuadamente una muestra. Se obtiene una
informacin ms precisa y completa de ella cuando adems se utiliza una medida de dispersin.
Por ejemplo, la muestra 1 de datos 3-4-5 y la muestra 2 de datos 1-4-7 tienen la misma medida de
posicin: la media aritmtica en ambos casos es 4. Sin embargo, se trata evidentemente de dos
muestras diferentes, por cuanto la segunda es ms dispersa que la primera, es decir, sus datos estn
ms alejados de la media aritmtica.

Pgina 40 de 325
40
En la primera muestra el promedio de las desviaciones respecto de la media es 1 (de 3 a 4 hay 1, y de 5
a 4 hay 1), mientras que el promedio de las desviaciones en la segunda muestra es 3 (de 1 a 4 hay 3, y
de 7 a 4 hay 3). Por lo tanto, ambas muestras pueden representarse de la siguiente manera:

Muestra 1: 4 + 1 (se lee 4 ms/menos 1)
Muestra 2: 4 + 3 (se lee 4 ms/menos 3).

Las medidas de dispersin tienen una importancia adicional porque (Levin y Rubin: 1996): a)
Proporcionan informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central.
Si los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los
datos. b) A veces resulta indispensable conocer la dispersin de una muestra porque muestras
demasiado dispersas pueden no ser tiles para poder sacar conclusiones tiles sobre la muestra. Levin y
Rubin indican que, ya que existen problemas caractersticos para datos ampliamente dispersos,
debemos ser capaces de distinguir los que presentan esa dispersin antes de abordar esos problemas.

Caractersticas de las principales medidas de dispersin

En general, las medidas de dispersin ms utilizadas sirven para la medicin de variables en el nivel
cuantitativo. Seguidamente se examinarn las siguientes medidas de dispersin: rango, desviacin
media, varianza, desvo estndar, desvo intercuartlico y coeficiente de variacin.

En el siguiente cuadro se especifican las definiciones y caractersticas principales de las medidas de
dispersin.

Medida Definicin Caractersticas
RANGO Es la diferencia
entre los valores
mximo y mnimo
de la variable.
De uso limitado, no es una buena medida de dispersin.
Es muy sensible a los valores extremos e insensible a los valores
intermedios.
Est muy vinculada al tamao de la muestra: es probable que la muestra
de mayor tamao presente mayor rango aunque las poblaciones de
referencia tengan igual dispersin (Botella, 1993).
Se llama tambin amplitud.
DESVIACION
MEDIA
Es el promedio de
las desviaciones de
todos los valores
respecto de la
media aritmtica.
Considera desviaciones absolutas, es decir, no las considera con valores
negativos (de otro modo, el promedio de las desviaciones, por un teorema
de la media aritmtica, dara cero). Esto representa una dificultad de
clculo, por lo que se utiliza la varianza.
VARIANZA Es el promedio de
los cuadrados de
las desviaciones
con respecto a la
media aritmtica.
Es un valor esencialmente no negativo (10).
Matemticamente es buena medida de dispersin, pero da valores muy
altos, por lo cual en estadstica descriptiva se utiliza el desvo estndar
(9).
Se apoya en una propiedad de la media aritmtica segn la cual la suma
de los cuadrados de las desviaciones respecto a la media es un valor
mnimo.
La varianza permite comparar la dispersin de dos o ms muestras si sus
medias aritmticas son similares (Botella, 1993).
Si se suma una constante a un conjunto de valores, la varianza no se
modifica (Botella, 1993).
Si se multiplica por una constante a un conjunto de valores, la varianza de
los nuevos valores el igual al producto de la varianza de las originales por
el cuadrado de la constante (Botella, 1993).
DESVIO
ESTNDAR
Es la raz cuadrada
de la varianza (11)
Es un valor esencialmente no negativo (10).
Es la medida de dispersin ms utilizada.
Se la emplea conjuntamente con la media aritmtica como medida de
posicin.
La raz cuadrada permite compensar el cuadrado de la varianza.
Si se suma una constante a un conjunto de valores, el desvo estndar no
se modifica (Botella, 1993).
Si se multiplica por una constante a un conjunto de valores, el desvo
estndar de los nuevos valores el igual al producto del desvo estndar de
las originales por el cuadrado de la constante (Botella, 1993).
Se llama tambin desviacin tpica, o tambin desviacin estndar
(Pagano, 1998:71).
DESVIO
INTER
CUARTILICO
Es la diferencia
entre el Q
3
y el Q
1
.
Expresa el rango del 50% central de la serie de valores.
Se llama tambin amplitud intercuartil.

Pgina 41 de 325
41
COEFICIENTE
DE
VARIACION
Es el cociente entre
el desvo estndar y
la media aritmtica.
Permite comparar la dispersin de dos o ms muestras con diferentes
medias aritmticas: a mayor coeficiente de variacin, mayor dispersin.
No se expresa en unidades como la variable en estudio (por ejemplo, para
edad, no se expresa en aos).
Puede considerarse como un ndice de la representatividad de la media
aritmtica: cuanto mayor es el coeficiente de variacin, menos
representativa es la media (Botella, 1993).

Clculo analtico de las medidas de dispersin: frmulas

En este tem se indican las frmulas para calcular medidas de dispersin, y se suministran ejemplos de
cada caso.

Clculo de las medidas de dispersin segn la forma de organizacin de los datos individuales
Preparado por: Pablo Cazau

Medida de
dispersin
Datos ordenados Datos agrupados por frecuencia Datos agrupados por intervalos
Rango
R = x
may
- x
men
R = x
may
- x
men

No
Desviacin
media
E | x X |
D
m
= ---------------
n
E | x X | . f
D
m
= ------------------
n
E | x
m
X | . f
D
m
= --------------------
N
Desvo
estndar
E ( x X )
2

S = ----------------
n
El segundo miembro es a
la raz cuadrada
E ( x X )
2
. f
S = -------------------
n
El segundo miembro es a la raz
cuadrada
E ( x
m
X )
2
. f
S = ----------------------
n
El segundo miembro es a la raz cuadrada
Varianza Es el cuadrado del
desvo estndar (S
2
)
Es el cuadrado del desvo estndar
(S
2
)
Es el cuadrado del desvo estndar
(S
2
)
Desvo
intercuartlico
D
Q
= Q
3
Q
1
D
Q
= Q
3
Q
1
D
Q
= Q
3
Q
1

Coeficiente
de variacin
S
CV = -----
X
S
CV = -----
X
S
CV = -----
X

Cuando hay que calcular varianza o desvo estndar poblacionales, se utiliza n en el denominador, pero
cuando se calculan las correspondientes medidas muestrales (o cuando la muestra es muy pequea), se
utilizar n1 (12).

a) Clculo del rango para datos ordenados y para datos agrupados por frecuencia

Se puede aplicar a estas muestras la frmula del Rango R = x
may
- x
men


Muestra 1: 80, 100, 100, 110, 120. Aqu el rango R es = 120 80 = 40.
Muestra 2: 30, 50, 70, 120, 180. Aqu el rango R es = 180 30 = 150

Como se ve, la muestra 2 es ms dispersa porque tiene mayor rango.

No se puede calcular el rango para datos agrupados por intervalos porque se desconocen cules son los
valores mximo y mnimo.

b) Clculo de la desviacin media para datos ordenados

La serie ordenada de datos puede ser la siguiente: 2, 3, 5, 6, 7, 9, 10
Como primer paso se calcula la media aritmtica:

2+3+5+6+7+9+10
X = --------------------------- = 6
7

Como segundo y ltimo paso, se calcula la desviacin media:

E | x X | |2-6| + |3-6| + |5-6| + |6-6| + |7-6| + |9-6| + |10-6|
Dm = --------------- = --------------------------------------------------------------------- = 2.29
N 7

Pgina 42 de 325
42

c) Clculo de la desviacin media para datos agrupados por frecuencia

A la siguiente tabla de frecuencias (f) deber agregarse una columna (f.x) para calcular la media
aritmtica, y luego otras dos columnas (x-X) y (| x-X | . f) para calcular la desviacin media:

x f f . x | x - X | | x - X | . f
70 45 3150 35 1575
80 63 5040 25 1575
90 78 7020 15 1170
100 106 10600 5 530
110 118 12980 5 590
120 92 11040 15 1380
130 75 9750 25 1875
140 23 3220 35 115
n = 600 62800 160 8810

Primero se calcula la media aritmtica:

E (x.f) 62800
X = --------- = ------------ = 104.66 = 105
n 600

Finalmente se calcula la desviacin media:

E | x X | . f 8810
Dm = ------------------ = ------------ = 14.68
n 600

d) Clculo de la desviacin media para datos agrupados por intervalos

Se procede de la misma manera que en el caso anterior, con la diferencia que en lugar de considerar los
valores x, se consideran los puntos medios de los intervalos (x
m
).

e) Clculo del desvo estndar para datos ordenados

Para la serie de valores 5, 6, 10, su media aritmtica es 7. Una vez conocido este valor, puede obtenerse
el desvo estndar de la siguiente forma:

E ( x X )
2
(5-7)
2
+ (6-7)
2
+ (10-7)
2

S = \ ------------------- = \ ------------------------------------ = \ 4.66 = 2.2
n 3

f) Clculo del desvo estndar para datos agrupados por frecuencia

x (edad) f f . x x X ( x X )
2
( x X )
2
. f
18 3 54 -5 25 75
19 1 19 -4 16 16
20 2 40 -3 9 18
23 4 42 0 0 0
25 2 50 +2 4 8
26 2 52 +3 9 18
28 2 56 +5 25 50
n = 16 363 185

Primero se calcula la media aritmtica, que arroja un valor de X = 23.
Finalmente, se aplica la frmula de desvo estndar:

E ( x X )
2
. f 185
S = \ ---------------------- = \ ------------ = \ 11.56 = 3.2
n 16

Puede tambin utilizarse una frmula ms sencilla a los efectos del clculo (Bancroft, 1960:80):

E x
2
.f
S = ----------- - (X)
2


Pgina 43 de 325
43
n

Donde el primer trmino del segundo miembro es a la raz cuadrada.

g) Clculo del desvo estndar para datos agrupados por intervalos

Se procede del mismo modo que en el caso anterior, con la diferencia que se calcula el punto medio x
m
de los intervalos en lugar del valor x.

h) Clculo de la varianza

El procedimiento es el mismo que en el caso del desvo estndar. Slo debe tenerse presente que la
varianza es el cuadrado del desvo estndar.

i) Clculo del desvo intercuartlico

Dada la siguiente serie, obtener el desvo intercuartlico:

x f
0-20 2
20-40 4
40-60 5
60-80 8
80-100 1
n = 20

Primero se calculan los Q
3
y Q
1
aplicando la frmula explicada en medidas de posicin.
Finalmente, se aplica la frmula del desvo intercuartlico:

D
Q
= Q
3
Q
1
= 70 35 = 35

Una variante es el empleo del desvo semi-intercuartlico, es decir, el desvo intercuartlico dividido dos.
Se trata de una medida de dispersin propuesta por Galton en 1889, y que resulta recomendable cuando
hay algn valor extremo que pudiera distorsionar la representatividad de la media aritmtica (Botella,
1993).

j) Clculo del coeficiente de variacin

Si una muestra tiene una media aritmtica 111 y el desvo estndar 18, entonces su coeficiente de
variacin es:

S 111
CV = ----- = ---------- = 0.16
X 18

Cuanto mayor es el CV, mayor es la dispersin.
Tambin puede calcularse un coeficiente de variacin porcentual, multiplicando CV por 100. En el
ejemplo:

CV% = 0.16 . 100 = 16%.

Clculo visual de las medidas de dispersin: grficos

Botella (1993:143) menciona dos procedimientos para expresar grficamente medidas de dispersin: el
diagrama de caja y bigotes (Tukey, 1977) y el diagrama de bigotes verticales.

Diagrama de caja y bigotes


Pgina 44 de 325
44


Puede apreciarse a simple vista que la distribucin de valores B es ms dispersa que A no slo porque la
diferencia entre los valores mximo y mnimo (rango) es mayor, sino tambin porque lo es la diferencia
entre los cuartiles primero y tercero.

Diagrama de bigotes verticales



El grfico representa las medias aritmticas de nivel de ansiedad de diversos cursos de alumnos. En cada
media aritmtica se han trazado bigotes verticales que representan los respectivos desvos estndar.
Puede entonces apreciarse, por ejemplo, que a medida que aumenta la media aritmtica, tiende tambin
a aumentar el desvo estndar.

6. SNTESIS DE LOS DATOS: ASIMETRA Y CURTOSIS

Un conjunto de datos o distribucin de datos queda exhaustivamente descrito cuando pueden
especificarse una medida de posicin, una medida de dispersin, un ndice de asimetra y un ndice de
curtosis. Las medidas de asimetra y curtosis se refieren a la forma de la distribucin y, aunque no son
tan importantes como las medidas de posicin y dispersin y son muy poco utilizadas, aportan tambin
informacin sobre la distribucin de los valores de una muestra o poblacin.

Asimetra

La asimetra hace referencia al grado en que los datos se reparten equilibradamente por encima y por
debajo de la tendencia central (Botella, 1993:169). Por ejemplo, en la siguiente tabla se puede apreciar
que en el curso A muchos alumnos obtuvieron buenas notas, en el curso C muchos alumnos obtuvieron
bajas notas, y en el curso B estn equilibrados.

x (nota) f (curso A) f (curso B) f (curso C)
10 5 2 1
9 10 5 2
8 15 8 3
7 22 10 6
Nivel de
ansiedad
4 5 6 7 8
Curso
75 80 85 90 95 100 105 110 115 120 125 130
A
B
Xmn Xmx
Xmx Xmn
Q1 Q3
Q1 Q3

Pgina 45 de 325
45
6 16 15 8
5 12 20 12
4 8 15 16
3 6 10 22
2 3 8 15
1 2 5 10
0 1 2 5
n = 100 n = 100 n = 100

Representando las tres distribuciones de datos con curvas en un grfico con las frecuencias en las
ordenadas y los valores de x en las absisas, se obtiene lo siguiente:



Han sido propuestos diversos ndices de asimetra para cuantificar el grado de asimetra de una
distribucin de datos. De entre ellos pueden citarse los siguientes (Botella, 1993:170):

Indice de
asimetra media-
modo

Indice de asimetra
media-mediana
(Kohan, 1994:93)
Indice de asimetra
de Pearson
Indice de asimetra
intercuartlico
Es la distancia entre
la media y el modo,
medido en desvos
estndar:
X - Mo
As = -------------
S
Es la distancia entre la
media y la mediana
multiplicada por tres,
medida en desvos
estndar:
X - Mn
As= -------------
S
Es el promedio de los
valores z elevados al
cubo (donde z es el
cociente entre la
diferencia entre x y la
media aritmtica, y el
desvo estndar).
Es el cociente entre la
diferencia Q
3
-Q
2
y Q
2
-Q
1
,
y la diferencia Q
3
-Q
1


Los tres ndices se interpretan de manera similar: si resultan ser nmeros negativos, la curva ser
asimtrica hacia la derecha, y si dan resultados positivos, la curva ser asimtrica a la izquierda. El
resultado 0 (cero) indicar asimetra nula (simetra perfecta).
Existen otros muchos tipos de curvas: parablicas, hiperblicas, bimodales, etc., pero una forma usual es
la curva simtrica, llamada tambin curva normal o campana de Gauss.

Curtosis

La curtosis hace referencia a la forma de la curva de la distribucin de datos en tanto muy aguda (mayor
apuntamiento o mayor curtosis: leptocrtica) o muy aplanada (menor apuntamiento o menor curtosis:
platicrtica).

Curso A Curso C Curso B
Media Modo Modo Media Media
Modo
Asimetra
negativa
(curva hacia
la derecha)
Asimetra
cero
Asimetra
positiva
(curva hacia
la izquierda)

Pgina 46 de 325
46


Del mismo modo que sucede con la asimetra, tambin se han propuesto diversos ndices de curtosis. Si
el ndice es positivo, su apuntamiento es mayor que el de una distribucin normal y la curva ser
leptocrtica, y si es negativo, su apuntamiento es menor y la curva ser platicrtica (Botella, 1993).

NOTAS

(1) Segn Botella (1993:49) la distribucin de frecuencias es un instrumento diseado para cumplir tres funciones:
a) proporcionar una reorganizacin y ordenacin racional de los datos recogidos; b) ofrecer la informacin necesaria
para hacer representaciones grficas; y c) facilitar los clculos necesarios para obtener los estadsticos muestrales.
(2) Cuando se confecciona una tabla de frecuencias por intervalos con la intencin de elaborar grficos o medidas
estadsticas a partir de ella, deben asumirse ciertos supuestos que implican un margen de error, pero que son
imprescindibles. Estos supuestos, llamados supuestos de concentracin intraintervalo, son dos. a) El supuesto de
concentracin en el punto medio del intervalo, segn el cual todos los valores de la variable son el mismo, a saber, el
punto medio del intervalo. b) El supuesto de distribucin homognea, segn el cual los valores incluidos en un
intervalo se reparten con absoluta uniformidad en su interior. Es decir, que si en un intervalo hay cinco observaciones
[valores observados en la variable] aceptaremos que sus valores son los que tendramos si partiramos al intervalo en
cinco subintervalos de igual amplitud y asignramos a cada individuo el punto medio de un subintervalo (Botella,
1993:56).
(3) Hay quienes recurren a la frmula de Sturges para calcular la cantidad de intervalos que resulta deseable tomar en
funcin del tamao de la muestra. Esta frmula es: Nmero de intervalos = 1 + (log n / log 2), donde n designa el
tamao de la muestra. Por ejemplo, aplicando la frmula para n = 40, la cantidad deseable de intervalos es 6.3, con lo
cual podrn elegirse entre 6 o 7 intervalos. Una vez determinada la cantidad de intervalos, slo resta dividir el tamao
de la muestra por 6 o 7, de lo que resultar el tamao de cada intervalo.
(4) Por ejemplo, las medidas de posicin son aquellas que caracterizan la posicin de un grupo respecto de una
variable (Kohan, 1994:69). Otras definiciones se refieren a la utilidad de estas medidas, y entonces por ejemplo se
definen como ndices diseados especialmente para revelar la situacin de una puntuacin con respecto a un grupo,
utilizando a ste como marco de referencia (Botella, 1993:83).
(5) Estrictamente hablando, ciertos cuantiles como el cuartil 2, el decil 5 y el percentil 50 resultan ser medidas de
tendencia central, ya que coinciden con la mediana.
(6) Estrictamente, dato y valor no son sinnimos, aunque aqu se emplearn indistintamente ambas expresiones. El
valor es uno de los componentes del dato: los otros dos son la unidad de anlisis y la variable.
(7) Botella (1993:105-111) describe seis propiedades de la media aritmtica: 1) La suma de las diferencias de n
puntuaciones de la media aritmtica, o puntuaciones diferenciales, es igual a cero. 2) La suma de los cuadrados de las
desviaciones de unas puntuaciones con respecto a su media es menor que con respecto a cualquier otro valor. 3) Si
sumamos una constante a un conjunto de puntuaciones, la media aritmtica quedar aumentada en esa misma
constante. 4) Si multiplicamos una constante a un conjunto de puntuaciones, la media aritmtica quedar multiplicada
por esa misma constante. 5) La media total de un grupo de puntuaciones, cuando se conocen los tamaos y medias de
varios subgrupos hechos a partir del grupo total, mutuamente exclusivos y exhaustivos, puede obtenerse ponderando
las medias parciales a partir de los tamaos de los subgrupos en que han sido calculadas. 6) Una variable definida
como la combinacin lineal de otras variables tiene como media la misma combinacin lineal de las medias de las
variables intervinientes en su definicin.
(8) Equivalencias entre cuantiles (Botella, 1993:89):

Cuartiles Deciles Percentiles
D1 P10
D2 P20
Q1 P25
D3 P30
D4 P40
Q2 D5 P50
D6 P60
D7 P70
Leptocrtica Platicrtica Mesocrtica

Pgina 47 de 325
47
Q3 P75
D8 P80
D9 P90

(9) Para la varianza, las unidades son el cuadrado de las unidades de los datos. Estas unidades no son intuitivamente
claras o fciles de interpretar. Por esta razn, tenemos que hacer un cambio significativo en la varianza para calcular
una medida til de la desviacin, que sea menos confusa. Esta medida se conoce como la desviacin estndar, y es la
raz cuadrada de la varianza. La desviacin estndar, entonces, est en las mismas unidades que los datos originales
(Levin y Rubin, 1996). La varianza como tal se utiliza ms frecuentemente en estadstica inferencial (Pagano,
1998:77).
(10) La raz cuadrada de un nmero positivo puede ser tanto positiva como negativa. Cuando tomamos la raz
cuadrada de la varianza para calcular la desviacin estndar, los estadsticos solamente consideran la raz cuadrada
positiva (Levin y Rubin, 1996).
(11) La desviacin estndar nos permite determinar, con un buen grado de precisin, dnde estn localizados los
valores de una distribucin de frecuencias con relacin a la media. El teorema de Chebyshev dice que no importa qu
forma tenga la distribucin, al menos 75% de los valores caen dentro de + 2 desviaciones estndar a partir de la
media de la distribucin, y al menos 89% de los valores caen dentro de + 3 desviaciones estndar a partir de la
media.
Con ms precisin:
Aproximadamente 68% de los valores de la poblacin cae dentro de + 1 desviacin estndar a partir de la media.
Aproximadamente 95% de los valores estar dentro de + 2 desviaciones estndar a partir de la media.
Aproximadamente 99% de los valores estar en el intervalo que va desde tres desviaciones estndar por debajo de la
media hasta tres desviaciones estndar por arriba de la media (Levin y Rubin, 1996).
(12) Esto se debe a que los especialistas en estadstica pueden demostrar que si tomamos muchas muestras de una
poblacin dada, si encontramos la varianza de la muestra para cada muestra y promediamos los resultados, entonces
este promedio no tiende a tomar el valor de la varianza de la poblacin, a menos que tomemos n1 como
denominador de los clculos (Levin y Rubin, 1996).
(13) El concepto de distribucin de frecuencias es uno de los ms bsicos de la estadstica descriptiva, y hace
referencia a un conjunto de valores de una variable ordenados de acuerdo con sus frecuencias. Las distribuciones de
frecuencias pueden expresarse en forma de tablas, grficos, medidas de posicin, medidas de dispersin, de asimetra
y de curtosis. Estas ltimas cuatro medidas pueden considerarse propiedades o caractersticas bsicas de una
distribucin frecuencial.


CAPTULO 3: PROBABILIDAD Y CURVA NORMAL

La curva normal es uno de los temas fundamentales de la estadstica que utiliza la informacin provista
por la estadstica descriptiva y permite el paso a la estadstica inferencial en el sentido de proveer una
herramienta para obtener conclusiones respecto de la poblacin. La comprensin de este tema exige un
conocimiento mnimo de la teora de la probabilidad.

1. EL CONCEPTO DE PROBABILIDAD

Se entiende por probabilidad el grado de posibilidad de ocurrencia de un determinado acontecimiento.
Dicha probabilidad puede calcularse en forma terica o emprica, a partir de las llamadas probabilidad
clsica y frecuencial, respectivamente. El concepto de probabilidad ha demostrado ser de importante
utilidad en ciertos enfoques sistmicos, especialmente en los mbitos de la termodinmica y la teora de
la informacin.

1. Concepto de probabilidad.- Entendida como medida de la posibilidad de la ocurrencia de un
determinado acontecimiento, la probabilidad abarca un espectro que se extiende desde la certeza (el
acontecimiento ocurrir con total seguridad), hasta la imposibilidad (es imposible que el acontecimiento
ocurra), pasando por todos los grados intermedios (es muy probable que ocurra, es medianamente
probable, es poco probable, etc.).
Por ejemplo, el suceso 'obtener un nmero entre 1 y 6 tirando un dado' equivale a la certeza; el suceso
'obtener un 7 arrojando un dado' equivale a la imposibilidad; y el suceso 'obtener un 2 arrojando un
dado' equivale a uno de los grados intermedios de probabilidad.
Es habitual representar el grado de probabilidad mediante un nmero que puede variar entre 1 (certeza)
y 0 (imposibilidad). La probabilidad puede entonces valer 1, 0, 0.50, 0.80, etc. Por ejemplo, una
probabilidad de 0.1 es muy baja, y una probabilidad de 0.98 muy alta. Una probabilidad intermedia es
0.50 o tambin, si la expresamos en trminos de porcentajes corriendo la coma dos lugares hacia la
derecha, obtenemos una probabilidad del 50 por ciento. Tal el caso de obtener una cara arrojando una
moneda.
Los aspectos ms importantes del concepto de probabilidad han sido sintetizados en los llamados
axiomas de probabilidad:
Axioma 1: Evento seguro.- La probabilidad del conjunto universal o espacio muestral es igual a 1. Por
ejemplo, el espacio muestral para un dado es 1, 2, 3, 4, 5, 6.
Axioma 2: Evento imposible.- La probabilidad del conjunto vaco es igual a 0. Por ejemplo, que salga un 7
tirando un dado.

Pgina 48 de 325
48
Axioma 3: Evento aleatorio.- La probabilidad de un evento es un nmero real mayor o igual que 0 y
menor o igual que 1.
Axioma 4: Eventos aleatorios compuestos excluyentes.- La probabilidad de un evento ms la probabilidad
del evento contrario es igual a 1. Por ejemplo, la probabilidad que un dado salga 1 o 2 ms la
probabilidad que un dado salga 3, 4, 5 o 6 es igual a 1. En smbolos: p + q = 1.

2. Probabilidad clsica y probabilidad frecuencial.- Si bien existen diferentes teoras y enfoques acerca de
la probabilidad, explicaremos a continuacin los dos planteos ms habituales, siguiendo un ordenamiento
histrico e incluso sistemtico: el clsico y el frecuencial. En ltima instancia, se trata de dos modos
diferentes de calcular la probabilidad de la ocurrencia de un fenmeno.
a) Probabilidad clsica (Laplace).- Suele tambin denominarse probabilidad terica o a priori, y se define
como el cociente entre el nmero de casos favorables y el nmero de casos equiprobables posibles.
Aclaremos esta aparentemente engorrosa definicin.
Sabemos que un dado tiene seis caras, numeradas del uno al seis. La probabilidad de obtener la cara
tres, por ejemplo, es de un sexto, es decir de un caso favorable (porque hay una sola cara con el tres)
sobre seis casos equiprobables y posibles (caras 1-2-3-4-5-6). Aplicando la definicin de probabilidad, es:

Casos favorables 1
p= ----------------------------------------------------- = 0.1666
Casos equiprobables posibles 6

Para poder calcular esta probabilidad necesitamos, obviamente, conocer todos los casos posibles
(requisito de exhaustividad), pero adems debemos saber que todos esos casos posibles tienen la misma
probabilidad de salir (requisito de equiprobabilidad), vale decir, debemos tener la suficiente seguridad de
que ninguna cara tendr mayor o menor probabilidad de salir que otra cara cualquiera, como puede
ocurrir, por ejemplo, con los dados 'cargados'.
Una aclaracin respecto de la expresin 'casos favorables'. Debemos evitar aqu la connotacin subjetiva
del trmino. Un caso favorable es simplemente un caso del cual queremos conocer la probabilidad de su
ocurrencia. Puede incluso tratarse de un terremoto o una enfermedad, aunque estos eventos no sean
'favorables' desde otro punto de vista ms subjetivo.
Respecto de la expresin 'casos equiprobables posibles', esta alude al hecho antes indicado de que para
calcular una probabilidad en sentido clsico, deben cumplirse los dos requisitos de exhaustividad y
equiprobabilidad.
Puede suceder, en efecto, que alguno de estos requisitos no se cumpla. 1) Exhaustividad: Este requisito
puede no cumplirse en dos casos. Primero, puede ocurrir que al arrojar un dado, este quede parado en
equilibrio sobre alguno de sus vrtices o aristas. Como posibilidad existe, pero es remotsima. Debido a
que esta posibilidad es muy baja, a los efectos prcticos la consideramos nula y seguimos aplicando la
definicin clsica de probabilidad, como si todos los casos posibles fueran, como en el caso del dado,
solamente seis. Segundo, puede ocurrir que no sepamos cuntas caras tiene el dado (en la situacin
anterior s sabamos esta cantidad, descartando las alternativas remotas), an cuando sepamos que
todas tienen la misma probabilidad de salir. En este caso, al desconocer el nmero de casos posibles, la
definicin clsica de probabilidad resulta inaplicable, quedndonos la opcin de aplicar la probabilidad
frecuencial. 2) Equiprobabilidad: Este requisito puede no cumplirse cuando el dado est 'cargado' lo que
hace que, por ejemplo, el tres tenga mayores probabilidades de salir que el cuatro. En este caso,
podemos calcular la probabilidad mediante la probabilidad frecuencial.
En sntesis hasta aqu: cuando ninguno de estos requisitos, o ambos, no pueden cumplirse, nos queda
an la opcin de calcular la probabilidad en forma emprica, lo que nos lleva al tema de la llamada
probabilidad frecuencial.
b) Probabilidad frecuencial.- Suele tambin denominarse probabilidad emprica o a posteriori, y es
definible como el cociente entre el nmeros de casos favorables y el nmero de casos observados. En un
ejemplo, supongamos que no conocemos cuntas caras tiene un dado (es decir desconocemos la
cantidad de casos posibles), y queremos averiguar qu probabilidad tiene de salir el uno. Obviamente no
podemos decir 'un sexto' o 'uno sobre seis' porque no sabemos cuntas caras tiene el dado. Para hacer
este clculo decidimos hacer un experimento, y arrojamos un dado comn de seis caras (aunque
nosotros ignoramos este detalle) por ejemplo diez veces, constatando que el uno sali cinco veces, cosa
perfectamente posible. Conclumos entonces que la probabilidad de obtener un uno es de cinco sobre
diez, es decir, de 0.5. Si tomamos al pie de la letra este valor, podramos concluir que el dado tiene... 2
caras!, cada una con la misma probabilidad de 0.5. Aplicando la definicin de probabilidad frecuencial,
resulta:

Casos favorables 5
p= -------------------------------- = 0.5
Casos observados 10

Otro ejemplo: supongamos que conocemos perfectamente que el dado tiene seis caras, pero no sabemos
si las probabilidades de salir son iguales o no para todas ellas, ya que sospechamos que el dado puede

Pgina 49 de 325
49
estar 'cargado'. Para determinar la probabilidad de salir del nmero uno hacemos el mismo experimento,
dndonos un valor de 0.7. Este valor, si lo tomamos al pie de la letra, nos hara pensar que el dado est
preparado para que tenga tendencia a salir el nmero uno, ya que su probabilidad de ocurrencia es
bastante alta.
La probabilidad frecuencial se llama tambin 'a posteriori' debido a que 'slo despus' de hacer nuestra
observacin o nuestro experimento podemos saber el valor de la probabilidad, y no 'antes', como en el
caso de la probabilidad clsica, donde 'antes' de arrojar el dado ya sabemos que la probabilidad de cada
cara es de 0.1666.
La denominacin 'frecuencial' alude al hecho de el clculo de probabilidades se realiza en base a la
frecuencia con que sale una determinada cara o posibilidad, frecuencia que es relativa porque la
comparamos con la cantidad de casos observados. Por ejemplo, en nuestro ltimo ejemplo la frecuencia
absoluta es 7, porque de 10 veces que arrojamos el dado, 7 veces sali el nmero deseado. En cambio la
frecuencia relativa es 0.7, y resulta de dividir la frecuencia absoluta por el nmero de casos observados.

Las probabilidades clsica y frecuencial se llaman tambin probabilidades lgica e inductiva, respectivamente. a)
Probabilidad lgica: si yo tengo un dado perfectamente balanceado (o sea que las seis caras tienen la misma
probabilidad de salir), no necesitar arrojarlo para saber qu probabilidad tiene de salir el nmero 3. Como ya s
que tiene seis caras equiprobables, su probabilidad ser de uno sobre seis (p=1/6). b) Probabilidad inductiva:
puede ocurrir, sin embargo, que el dado no est balanceado, o que yo no sepa si el nmero 3 figura en dos
caras y el 5 en ninguna, etc., y slo s que tiene 6 caras. A priori, o sea antes de arrojar los dados, en estos
casos no puedo saber qu probabilidad tiene el 3 de salir, debido a mi desconocimiento del dado. No obstante
tengo un medio de saberlo: arrojo el dado una gran cantidad de veces (cuantas ms veces mejor) y voy
anotando los nmeros que aparecieron. Si constato que el 3 sali en un 50% de los casos, entonces puedo
concluir que la probabilidad ser de tres sobre seis (p=3/6=1/2). Este dato no me aclara definitivamente si el
dado estaba desbalanceado o si en realidad en tres de sus caras estaba el nmero 3; slo me sugiere la
probabilidad de aparicin del nmero en cuestin.
En suma: en la probabilidad lgica y debido a que conozco el dado, puedo calcular qu probabilidad tiene de salir
determinado nmero sin necesidad de hacer ninguna prueba. Es una probabilidad deductiva, puesto que deduzco
de los datos conocidos la probabilidad de cada alternativa. En cambio en la probabilidad inductiva no conozco la
naturaleza del dado, y entonces slo puedo concluir la probabilidad de aparicin de un cierto nmero siguiendo
un razonamiento inductivo, vale decir, a partir de los casos observados que fui anotando.
Las mismas consideraciones que hicimos con las caras de un dado tambin podemos hacerlas con los naipes de
un mazo y con los individuos de una poblacin. En estadstica, puesto que generalmente desconocemos la
naturaleza de la poblacin, el tipo de probabilidad empleado es el inductivo.

c) La ley de los grandes nmeros.- Tambin llamada principio de la estabilidad de la frecuencia relativa,
nos permite unificar conceptualmente los dos tipos de probabilidad recin examinados, y puede
expresarse de la siguiente manera: a medida que aumenta la cantidad de ensayos, el valor de la
probabilidad emprica obtenido se va aproximando cada vez ms al valor de la probabilidad terica.

Ley de los Grandes Nmeros

Cantidad de ensayos arrojando
una moneda
Probabilidad terica de salir
cara
Probabilidad emprica obtenida
para cara
una vez 0.5 0
2 veces 0.5 0.5
3 veces 0.5 0.3333
4 veces 0.5 0.25
10 veces 0.5 0.3
100 veces 0.5 0.4
1000 veces 0.5 0.45
1000000 veces 0.5 0.4999999999999

Siguiendo el esquema adjunto, si arrojamos una moneda por primera vez (primer ensayo), la
probabilidad terica de salir cara es de 0.5, cosa que sabemos ms all de hacer o no esa experiencia.
Sin embargo, puede ocurrir que salga ceca, y entonces conclumos que la probabilidad emprica es 0,
pues no sali ninguna cara.
Al arrojar la moneda por segunda vez, la probabilidad terica sigue siendo 0.5, ya que el dado no tiene
'memoria': por ms que haya salido cien veces cara, la 101 vez sigue teniendo la misma probabilidad de
salir cara. La probabilidad emprica, en cambio, nos da por ejemplo tambin 0.5, porque la primera vez
no sali cara pero la segunda s, con lo cual habr salido cara la mitad de las veces, o sea hay una
probabilidad de 0.5. Al tercer tiro vuelve a aparecer ceca, con lo cual sobre tres tiros habr salido slo
una cara (la segunda vez), y entonces la probabilidad emprica es de un tercio (0.333).
Lo que dice la ley de los grandes nmeros es que, si seguimos aumentando la cantidad de tiros, el valor
de la probabilidad emprica se ir aproximando cada vez ms a la probabilidad terica de 0.5, es decir, se
verifica una tendencia de la frecuencia relativa a estabilizarse en dicho resultado, y por ello esta ley se
llama tambin principio de la estabilidad de la frecuencia relativa.


Pgina 50 de 325
50
La probabilidad (p) vara entre 0 y 1

Imposible Grados intermedios de probabilidad Seguro
0 0.25 0.50 0.75 1
0 1/4 1/2 3/4 1
Probabilidad de
extraer un as de
espadas de un
mazo de cartas
francesas
Probabilidad de
extraer un naipe
de copas de un
mazo de cartas
espaolas
Probabilidad de
obtener cara
arrojando una
moneda
Probabilidad de
extraer una bolilla
roja de una caja
donde hay 3 rojas
y una blanca
Probabilidad de
extraer una bolilla
roja de un bolillero
de bolillas rojas

d) Probabilidad y variable aleatoria.- Las variables aleatorias son variables donde cada uno de sus valores
puede asumir un valor de probabilidad entre 0 y 1. Las variables aleatorias pueden ser discretas o
continuas. La variable nmero del dado es discreta, y por ejemplo su valor 2 asume un valor de
probabilidad de 1/6.
Las distribuciones de probabilidad son modelos donde se emplean variables aleatorias. Por ejemplo la
distribucin normal (para probabilidad continua), la distribucin binomial y la distribucin de Poisson
(para probabilidad constante), y la distribucin hipergeomtrica (para probabilidad variable).

3. Algunas aplicaciones del concepto de probabilidad.- La teora de las probabilidades, importante rama
de la matemtica, ha permitido encarar la investigacin de sistemas, tanto cerrados como abiertos, bajo
este relativamente nuevo enfoque. Ejemplos particularmente representativos aparecen en la
termodinmica y en la teora de la informacin.
a) Probabilidad en termodinmica.- La evolucin de los sistemas cerrados o abiertos puede medirse
segn varios parmetros, como por ejemplo el grado de entropa o desorden, pero tambin segn el
grado de probabilidad que pueden alcanzar cuando evolucionan hacia estados de equilibrio (como en el
sistema cerrado) o hacia estados uniformes (como en el sistema abierto). As, se dice que la tendencia
general de los procesos fsicos entendidos como sistemas cerrados apunta a la entropa creciente o
estados de creciente probabilidad, mientras que los sistemas abiertos, como por ejemplo los sistemas
vivos, consiguen mantenerse en un estado de mnima entropa, es decir, en un estado de alta
improbabilidad estadstica.
b) Probabilidad en Teora de la Informacin.- En la Teora de la Informacin se emplea tanto la
probabilidad clsica como la probabilidad frecuencial. Es posible ilustrar esta cuestin con el siguiente
ejemplo (Lichtenthal, 1970): Un forastero llega a un pueblo y pregunta: "Llover esta tarde?", a lo cual
un vecino contesta "s". Esta respuesta provee mucha informacin o poca informacin? Todo depende de
quien la reciba.
a) Si la respuesta la recibe el mismo forastero, el "S" implica bastante informacin, porque desconoce el
clima del pueblo. El "S" encierra para l tanta informacin como el "No", porque, al no conocer el clima
habitual de la zona, para l ambas respuestas son igualmente probables (equiprobabilidad), y por
consiguiente evala la probabilidad de que llueva o no en base a una probabilidad terica o a priori.
b) Si la respuesta la escucha otro vecino, el "S" tiene un valor informativo prcticamente nulo porque
todos en el pueblo saben que casi siempre llueve por las tardes. No es ninguna novedad el "S", es decir
encierra poqusima informacin. En cambio si nuestro vecino hubiese escuchado "No" se sorprendera
mucho, y la cantidad de informacin es mucha. El "S" y el "No" no son igualmente probables, cosa que el
vecino descubri por experiencia, por haber vivido un tiempo en el pueblo (la probabilidad es, en este
caso, frecuencial, y las posibles alternativas no son equiprobables).
Los ejemplos vienen a destacar una idea muy importante que vincula informacin con probabilidad, y que
es la siguiente: el contenido informativo de un mensaje est ntimamente ligado a su improbabilidad o
'valor sorpresa'. Por ejemplo, cuando ms nos 'sorprende' la respuesta, o cuando ms 'improbable' o
'inesperada' la juzgamos, ms informacin encierra. De aqu una importante definicin de informacin,
como aquello que hace disminuir la incertidumbre del receptor. Si al vecino le dicen que "s llover en
este pueblo esta tarde" esto no es sorpresa para l, no reduce su incertidumbre y, por consiguiente,
apenas si contiene informacin.

4. Vocabulario.- La teora de la probabilidad utiliza cierta terminologa tcnica. Algunos de los principales
trminos son los siguientes:
Espacio muestral: es el conjunto S de todos los resultados posibles de un experimento dado. Por
ejemplo, los resultados posibles del experimento de arrojar un dado son 1, 2, 3, 4, 5 y 6.
Muestra: es un resultado particular, o sea, un elemento de S. Por ejemplo, arrojar un dado y obtener 4.
Espacio finito de probabilidad: se obtiene al asignar a cada muestra de un espacio muestral finito una
determinada probabilidad de ocurrencia en forma de nmero real. La probabilidad de un evento es igual a
la suma de las probabilidades de sus muestras. Si en un espacio finito de probabilidad cada muestra tiene
la misma probabilidad de ocurrir, se llamar espacio equiprobable o uniforme. Existen tambin espacios
muestrales infinitos.

Pgina 51 de 325
51
Evento: Un evento A es un conjunto de resultados, o sea, un subconjunto de S. Por ejemplo, un evento
puede ser arrojar dos veces un dado obtenindose por ejemplo un 4 y un 3. Si el evento tiene una sola
muestra, se llama evento elemental.
El conjunto S o espacio muestral es de por s un evento (en este caso se lo llama cierto o seguro, pues es
seguro que arrojando un dado se obtendr 1, 2, 3, 4, 5 o 6), mientras que tambin se considera evento
al conjunto vaco (se lo llama imposible: no es posible que no salga ningn nmero).
Se pueden combinar eventos entre s para formar nuevos eventos, por ejemplo:
A unin B es el evento que sucede si y slo si A o B o ambos suceden.
A interseccin B es el evento que sucede si y slo si A y B suceden simultneamente.
A complemento de A es el evento que sucede si y slo si A no sucede. Dos eventos son mutuamente
excluyentes cuando no pueden suceder simultneamente.
De una manera ms sencilla pueden identificarse los siguientes tipos de eventos:

Eventos Frmulas (a) Ejemplo
Simple o
elemental
De un mazo de cartas sacar un 3. p (A) =
casos favorables / casos
posibles
4/52 = 0.077
Compuestos Excluyentes
o
alternativos
Contrarios: sacar una carta que sea
un 3 o no sea un 3.
p (A o A) =
p (A) + p (-A)
4/52 + 48/52 = 1
No contrarios: sacar una carta que sea
un 3 o un as.
p (A o B) =
p (A) + p (B)
4/52 + 4/52 =
2/13
No
excluyentes
o conjuntos
Sacando una sola carta: sacar una
carta que sea un 3 y que sea de
corazn (c).
p (A y B) =
p (A) . p (B)
4/52 . 13/52 =
1/52
Sacando
dos o
ms
cartas
Eventos independientes
(con reposicin): de un
mazo sacar dos
corazones reponiendo la
primera (b).
p (A y B) =
p (A) . p (B)
13/52 . 13/52 =
1/16
Eventos dependientes
(sin reposicin): de un
mazo sacar 2 corazones
sin reponer (a).
p (A y BsiA) =
p (A) . p (BsiA)
13/52 . 12/51 =
0.059
(a) Las frmulas para eventos excluyentes son el teorema de las probabilidades totales. La frmula p (A y B) = p (A) .
p (B) es el teorema de las probabilidades compuestas para eventos independientes. La frmula p (A y BsiA) = p (A) . p
(BsiA) es el teorema de las probabilidades compuestas para eventos dependientes (probabilidad condicional).
(b) Eventos independientes: Se dice que un evento B es independiente de un evento A si la probabilidad de que B
suceda no est influenciada porque A haya o no sucedido.
(c) Combinando los teoremas de las probabilidades totales de las probabilidades compuestas para eventos
independientes, se pueden hacer otros clculos, como por ejemplo calcular la probabilidad de sacar un 3 o un corazn,
pero no ambos (o sea, no un 3 de corazn), mediante la frmula p (A o B no ambos) = p (A) + p (B) p (A y B) =
4/52 + 13/52 (4/52 . 13/52) = 4/13.

2. ANLISIS COMBINATORIO

Una de las aplicaciones de la teora de la probabilidad es el anlisis combinatorio, que estudia cuntos
grupos distintos de elementos se pueden formar con un nmero finito de elementos. Por ejemplo: a)
cuantos nmeros de tres cifras (grupos) se pueden formar con los elementos 6, 7, 8 y 9 (un ejemplo de
nmero podra ser 768).
Por convencin, se designa con la letra m al nmero total de elementos (en el ejemplo son 4), y se
designa con la letra n la cantidad de elementos por grupo (en el ejemplo son 3).
Los tipos de grupos ms importantes que se consideran en el anlisis combinatorio son las variaciones
(V), las permutaciones (P) y las combinaciones (C), y en ningn caso se considera que los elementos se
repiten dentro del grupo (como por ejemplo en 667, donde se repite el 6).
En el siguiente cuadro se presentan las definiciones de las variaciones, las permutaciones y las
combinaciones, y las respectivas frmulas para calcular la cantidad de variaciones, permutaciones y
combinaciones. Para comprender las mismas, tngase presente el sencillo concepto de factorial. El
nmero factorial de x es aquel que resulta de multiplicar x por cada uno de sus decrecientes hasta llegar
al 1. Por ejemplo, el factorial de 4 (que se simboliza 4!) es igual a 24, porque 4! = 4.3.2.1.

Variaciones Permutaciones Combinaciones
Definicin: Para que los grupos sean
variaciones deben diferir en al menos
un elemento (por ejemplo 678-679)
o en su orden de sucesin (por
ejemplo 678-786).
Definicin:Para que los grupos sean
permutaciones deben diferir slo en
su orden de sucesin (por ejemplo
678-786).
Definicin:Para que los grupos sean
combinaciones deben diferir slo en
por lo menos un elemento (por
ejemplo 678-679).
Frmula:
Vm,n = m! / (m-n)!


Frmula:
Pm = m!


Frmula:
Cm,n = Vm,n / Pn
Cm,n = m! / n! (m-n)!


Pgina 52 de 325
52
La expresin Vm,n se lee cantidad
de variaciones de m elementos, de n
elementos cada variacin.
La expresin Pm se lee cantidad de
permutaciones de m elementos de m
elementos cada permutacin.
La permutacin es el nico caso
donde se considera m = n, pues la
permutacin es un caso especial de
variacin.
La expresin Cm,n se llama nmero
combinatorio y se lee cantidad de
combinaciones de m elementos, de n
elementos cada combinacin.
El nmero combinatorio es igual a 1
en dos casos: cuando m = n y
cuando n = 0.
Ejemplo:
Cuntos grupos de 3 personas se
pueden formar con 5 candidatos?
m = 3
n = 5
V5,3 = 60 grupos o variaciones.
Ejemplo:
Cuntos nmeros de 3 cifras
pueden formarse con los dgitos 4, 5
y 6, sin repetir ninguno de ellos?
m = n = 3
P3 = 6 nmeros o permutaciones.
Ejemplo:
Cuntos grupos distintos pueden
formarse con los colores A, V y R
tomndolos de a dos?
m = 3
n = 2
C3,2 = 3 grupos o combinaciones.

La relacin entre la teora de la probabilidad y el anlisis combinatorio reside en que, tomando como
punto de partida las frmulas de la cantidad de variaciones, permutaciones o combinaciones, se puede
luego calcular la probabilidad de ocurrencia de uno de los grupos de elementos. Las frmulas de
variaciones, permutaciones o combinaciones indican el nmero de casos posibles.

Experimento binomial.- El nmero combinatorio puede ser utilizado en los llamados experimentos
binomiales, es decir, en experimentos donde se cumplen las siguientes condiciones:

Condiciones Ejemplo
Es una secuencia de repeticiones del mismo
ensayo o experimento.
Sacar 3 bolillas de una urna.
Cada ensayo tiene solamente dos resultados
posibles (xito-fracaso).
La bolilla solamente puede salir blanca o negra.
Los ensayos son independientes es decir, no se
influyen entre s.
Antes de sacar la siguiente bolilla se introduce la
anterior en la urna (con reposicin).
La probabilidad de un resultado (por ejemplo
xito) es igual para todos los ensayos
(equiprobabilidad).
Todas las bolillas tienen la misma probabilidad de
salir blancas (por ejemplo si se considera blanca
como xito).
La variable es discreta. No hay grados intermedios entre blanco y negro.

La frmula para calcular la probabilidad de obtener n xitos con m ensayos es la siguiente:

pn = Cm,n . p
n
. (1 p)
m-n


donde:
m = nmero de ensayos (o n, segn otra nomenclatura).
n = nmero de xitos (o k, segn otra nomenclatura).
Cm,n = nmero combinatorio.
p
n
= probabilidad de xitos.

Ejemplo: cul es la probabilidad de obtener 6 caras al arrojar
una moneda 10 veces?
Como m = 10 y n = 6, resulta pn = 0,2050.

En lugar de realizar los clculos utilizando la frmula anterior, se puede utilizar una llamada tabla de
probabilidades binomiales.

Los experimentos binomiales y la curva normal, que se estudia en el punto siguiente, son dos tipos
frecuentes de distribucin de probabilidades.

Algunos tipos de distribuciones de probabilidad son los siguientes:
1) Distribucin normal (para probabilidad continua).- Se representa mediante la curva de Gauss o curva normal,
conforma de campana. Es una funcin unimodal, continua, donde la probabilidad es un rea que se acumula de
izquierda a derecha, siendo la total igual a 1. La curva es simtrica. Hay tres tipos de distribucin normal: no
estandarizada, estndar con z y estndar con t. a) Distribucin normal no estandarizada.- Sus parmetros son
la media aritmtica y el desvo estndar. La media aritmtica, la mediana y el modo coinciden en el punto
central. La variable x puede tomar cualquier valor, positivo o negativo. b) Distribucin normal estndar con z.-
Caso particular donde la media aritmtica asume el valor 0 (cero) y el desvo estndar el valor 1 (uno). c)
Distribucin normal estndar con t.- La curva es ms chata que en el caso anterior, lo que indica mayor
dispersin ya que aqu se desconoce el desvo poblacional: al tener menos informacin, se supone que los
valores se distribuyen con mayor dispersin. El aplanamiento de la curva depende del tamao de la muestra
(grados de libertad): cuando ste aumenta, la curva va aproximndose a la forma menos achatada o aplanada
de la distribucin z.
2) Distribucin asimtrica de Chi-cuadrado o x
2
.- Curva asimtrica a la derecha, unimodal, donde x
2
asume slo
valores positivos. A medida que aumentan los grados de libertad, la curva se hace cada vez ms simtrica. Los
grados de libertad dependen de la cantidad de grupos e tratamiento (o sea de las diferentes categoras de la

Pgina 53 de 325
53
variable: los grados de libertad se expresan como k 1, donde k = nmero de categoras de la variable). Chi-
cuadrado se usa cuando hay variables nominales.
3) Distribucin asimtrica de Snedecor o F.- Curva asimtrica a la derecha, unimodal, donde F asume slo
valores positivos. A medida que aumentan los grados de libertad, la curva se hace cada vez ms simtrica. F es
el cociente entre variancias: F = variancia 1 / variancia 2, y se calcula en base al nivel alfa de significacin, los
grados de libertad del numerador y los grados de libertad del denominador.
4) Distribucin binomial (para probabilidad constante).- Considera un esquema de pruebas repetidas con
probabilidad constante, donde se realizan experimentos en los cuales se busca obtener x xitos y n-x fracasos.
5) Distribucin de Poisson (para probabilidad constante).- Descubierta por Poisson en el siglo 19, considera un
esquema de pruebas repetidas con probabilidad constante. Es el caso lmite de la probabilidad binomial, donde
la probabilidad es constante y los sucesos son independientes. Es totalmente compatible con la distribucin
binomial, pero solo viene tabulada para nmeros grandes (n = 20 o ms) y para probabilidades muy pequeas
(inferiores al 5%), razn por la cual se la llama tambin distribucin de los sucesos raros.
La funcin de probabilidad P(x) de la distribucin de Poisson se calcula en base a una tabla especial o bien en
base al siguiente cociente:
Numerador: producto del nmero e elevado a la menos Lambda, por Lambda elevado a la x. Lambda es el
coeficiente de Poisson una constante igual a n.p. La variable discreta es x, y el nmero e es igual a 2,71828.
Denominador: Factorial de x.
Si Lambda es un valor muy pequeo, la curva es marcadamente asimtrica y decreciente. Al crecer Lambda, va
tomando forma de campana, o sea se asemeja cada vez ms a la distribucin normal.
6) Distribucin hipergeomtrica (para probabilidad variable).- Como la distribucin binomial, es un esquema de
pruebas repetidas, con la diferencia que es con probabilidad variables pues es sin reposicin y los sucesos son
dependientes. La dispersin es menor que en la distribucin binomial, por lo que se la considera una
distribucin ms precisa.

3. DEFINICIN Y CARACTERSTICAS DE LA CURVA NORMAL

Si se tomaran nueve personas al azar para medir la variable frecuencia cardaca, podran obtenerse, por
ejemplo, los siguientes resultados: tres personas con 62, cinco personas con 70 y una persona con 84
pulsaciones por minuto. Representando visualmente esta situacin mediante un polgono de frecuencias,
se obtiene el grfico 1.
Si se registrara la frecuencia cardaca de 80 personas ms, probablemente se obtendra resultados
similares al polgono de frecuencias del grfico 2. Finalmente, si se consideraran infinito nmero de
personas, la representacin visual se asemejara al grfico 3, denominado curva normal, curva de Gauss
o campana de Gauss (por su forma acampanada).
Como puede apreciarse, ciertas variables continuas como la frecuencia cardaca, la glucemia, la estatura,
el peso, la agudeza visual, el cociente intelectual, y otras, tiende a adoptar la forma de una curva normal
a medida que aumenta la cantidad de casos observados (3). Aunque esta curva es una idealizacin,
porque no pueden medirse infinitos casos, tiene, como se ver, su utilidad, an cuando las variables que
se estudian desde este modelo no siguen estrictamente la distribucin de la curva normal. Pruebas como
por ejemplo el chi cuadrado permiten determinar si una distribucin es lo suficientemente parecida a una
distribucin normal como para poder aceptar el modelo de la curva normal para estudiarla. De hecho,
muchas variables tienen distribuciones lo suficientemente similares a una distribucin normal como para
tratarlas como tales sin cometer grandes errores.
En relacin con estas cuestiones, conviene recordar aqu el teorema del lmite central, que dice que
cualquiera sea la poblacin de donde se tome una muestra, la distribucin de los valores de la muestra se
aproximan o asemejan cada vez ms a una distribucin normal a medida que el tamao n de la muestra
aumenta. En la prctica se consideran normales a las muestras cuyo tamao es igual o superior a 30.



La curva normal tiene entonces algunas caractersticas que son las siguientes:
f
x 70
5

3

1
62 70 84
Grfico 1 Grfico 2 Grfico 3

Pgina 54 de 325
54
a) Es la idealizacin de un polgono de frecuencias con tendencia central para una gran cantidad de
casos. Por esta razn tiene la apariencia de una curva y no de una lnea quebrada, ya que el polgono de
frecuencias tiene infinito nmero de lados.
b) Tiene forma de campana: no tiene otras formas similares como puede ser la forma de herradura o la
forma de una campana invertida.
c) Es simtrica respecto de un eje vertical, lo que las diferencia de otras curvas como por ejemplo la
hiprbole equiltera. La simetra de la curva normal implica que la media aritmtica, la mediana y el
modo coinciden en el punto central. Consecuentemente, la curva normal es unimodal (en cambio, una
campana invertida podra ser bimodal). Tambin implica que la distancia del cuartil 1 al cuartil 2 es igual
a la distancia entre el cuartil 2 y el cuartil 3.
d) Es asinttica respecto del eje x. Esto significa que la curva y el eje de las absisas se cortan en el
infinito, lo cual implica que cualquier valor de x tiene potencialmente alguna frecuencia, y ninguna
frecuencia igual a 0.
e) La curva normal puede adoptar diferentes formas: mesocrtica, platicrtica o leptocrtica.
f) Los puntos de inflexin (donde la curva cambia de cncava a convexa y viceversa) se encuentran en
los puntos correspondientes a la media aritmtica ms/menos un desvo estndar.
g) Hay muchas posibilidades de curvas normales, dependiendo de cules sean los valores de las medias
aritmticas y los desvos estndar. La ms importante es aquella que tiene como media aritmtica 0
(cero) y como desvo estndar 1 (la unidad). En este caso, la curva normal se designa como distribucin
o curva normal estndar o estandarizada.
h) Est comprobado que en una curva normal, y siempre idealmente, alrededor de un 68% de los casos
posibles estn comprendidos entre menos un desvo estndar y ms un desvo estndar ( 1o), alrededor
de un 95% estn comprendidos entre menos 2 y ms dos desvos estndar ( 2o), y alrededor de un
99% estn comprendidos entre menos tres y ms tres desvos estndar ( 3o), segn lo ilustra el
siguiente esquema:



Esto significa por ejemplo que una persona tiene una probabilidad del 68% de tener una frecuencia
cardaca comprendida entre menos un desvo estndar y ms un desvo estndar. Si la media aritmtica
de esta distribucin fuera 80 pulsaciones por minuto y el desvo estndar fuera de 10 pulsaciones por
minuto, entonces la frecuencia cardaca de una persona cualquiera tendra un 68% de probabilidades de
valer entre 70 y 90 pulsaciones por minuto.
Siguiendo el mismo criterio, tambin puede calcularse la probabilidad de aparicin de un valor
comprendido entre menos tres desvos estndar y la media aritmtica (99% dividido 2), la probabilidad
de aparicin de un valor comprendido entre menos dos desvos estndar y la media aritmtica (95%
dividido 2), la probabilidad de aparicin de un valor comprendido entre menos un desvo estndar y ms
dos desvos estndar (68% dividido 2, ms 95% dividido 2), y la probabilidad de obtener cualquier otro

Pgina 55 de 325
55
valor intermedio (como el comprendido entre -1.27 desvos y +2.56 desvos), para lo cual se habr de
consultar una tabla especialmente confeccionada para tal efecto.

4. PUNTAJES BRUTOS Y PUNTAJES ESTANDARIZADOS

Antes de hacer referencia a las utilidades prcticas de la curva normal, convendr aclarar algunos
conceptos tales como los de puntaje bruto y puntaje estandarizado.

Para designar los diferentes valores que asume una variable para una determinada unidad de anlisis, en
estadstica descriptiva suele emplearse la expresin dato. Por ejemplo, un dato puede ser Juan mide
1.70 metros. Muchos datos, sin embargo, se distribuyen de acuerdo a una curva normal, y esta clase de
datos suelen ser tpicamente puntuaciones o puntajes de tests o pruebas de evaluacin. Por ejemplo,
Juan obtuvo 90 puntos en el test de inteligencia de Weschler, o Pedro obtuvo 7 puntos en el examen
de geografa. Esta es la razn por la cual, en lo que sigue se utilizar la expresin puntaje en lugar de
dato, pero debe tenerse presente que todo puntaje es, siempre, un dato.

Se llama puntaje bruto, directo u original al puntaje obtenido por un sujeto en una prueba. Por ejemplo,
podra resultar de la suma de respuestas correctas, valiendo cada una de ellas un punto (Kohan,
1994:138).
Los puntajes brutos presentan sin embargo algunos inconvenientes. Por ejemplo: a) Si una persona
obtuvo 4 puntos en una prueba acadmica, podemos suponer que obtuvo un bajo puntaje porque lo
comparamos con el puntaje mximo, que es 10. Sin embargo, no nos sirve para comparar a esa persona
con el resto de la poblacin, ya que si los dems alumnos obtuvieron en promedio 2 puntos, la
calificacin 4 ser, entonces, alta. b) Si una persona obtuvo 8 puntos en geografa y 5 puntos en
matemticas, podemos suponer que obtuvo ms puntaje en geografa. Sin embargo, esta suposicin es
errnea si resulta ser que el puntaje mximo en geografa es 20 y el puntaje mximo en matemticas es
6, en cuyo caso habr obtenido mayor puntaje en matemticas.
Estas y otras dificultades pueden resolverse transformando los puntajes brutos en otros llamados
puntajes estandarizados (o tambin puntajes transformados, porque resultan de haber transformado
los puntajes brutos). Estos puntajes estandarizados permitirn, por ejemplo, comparar el puntaje de un
sujeto con toda la poblacin, o bien comparar dos puntajes de pruebas con diferentes sistemas de
evaluacin (1).
Los puntajes estandarizados pueden ser lineales o no lineales, segn que resulten de transformaciones
lineales o no lineales (Kohan, 1994:138). En el primer caso existe una proporcionalidad entre los
puntajes brutos y sus correspondientes puntajes estandarizados, ya que la transformacin opera segn
una ecuacin lineal o ecuacin de primer grado y, por tanto, no deforma la distribucin de los puntajes
brutos.
En lo que sigue se describen sucintamente tres ejemplos de puntajes estandarizados de uso frecuente:
los puntajes estandarizados z (puntaje reducido), Z (puntaje derivado) y P (puntaje percentil).
El puntaje reducido z es un dato transformado que designa a cuntas unidades de desvos estndar
por arriba o por debajo de la media se encuentra un dato en bruto (Pagano, 1998:84). Para transformar
un dato en bruto x en un puntaje z se utiliza la frmula: z = (x - X) / s.
Pueden destacarse tres caractersticas de los puntajes z (Pagano, 1998:86-87): a) tienen la misma forma
que el conjunto de datos en bruto; b) la media de los puntajes z es siempre igual a cero; y c) el desvo
estndar de los puntajes z es siempre igual a 1.
El puntaje derivado Z (tambin llamado a veces puntaje derivado T) tiene la ventaja sobre el puntaje
reducido z que no tiene valores negativos y que pueden despreciarse los decimales por ser una cantidad
pequea (Kohan, 1994:141). Para transformar un puntaje reducido z en un puntaje derivado Z se utiliza
la frmula: Z = (z.10) + 50, ya que este puntaje derivado considera la media aritmtica como 50 y el
desvo estndar como 10.
Existen otras modalidades de puntajes derivados (Botella: 1993:161). Uno muy conocido en psicologa es
el llamado cociente intelectual o CI, que considera como media aritmtica a 100 y como desvo estndar
a 15.
El puntaje percentil P es un puntaje no lineal y es tambin de uso frecuente por su facilidad de
comprensin, aunque tenga el inconveniente de que su distribucin toma una forma que no responde a la
realidad de las funciones psicolgicas. Para transformar un puntaje z en un puntaje percentil hay que
recurrir a una tabla especial, que se describe ms adelante.
Como se puede apreciar en el esquema siguiente, el puntaje percentil P no es proporcional al resto de los
puntajes, pero si lo es respecto de las reas cubiertas bajo la curva normal, reas que a su vez indican la
probabilidad de ocurrencia de un puntaje cualquiera. En efecto, puede verse que los puntajes percentiles
P estn concentrados en aquellos lugares donde el rea bajo la curva es mayor y, adems, cuanto mayor
es esta rea mayor ser el percentil correspondiente.

Las correspondencias entre los diferentes puntajes pueden visualizarse mediante el siguiente esquema
(2):


Pgina 56 de 325
56
Equivalencias de puntajes brutos y estandarizados



As por ejemplo, puede apreciarse que un puntaje bruto correspondiente a ms un desvo estndar
corresponde a un puntaje reducido z de +1, a un puntaje derivado Z de 60, y a un percentil de 84.
Especialmente cuando se trata de averiguar valores intermedios (por ejemplo el puntaje bruto
correspondiente a ms 1.62 desvos estndar) debe recurrirse al empleo de frmulas y tablas. El
siguiente esquema indica la forma de hacerlo:

Reglas de transformacin de puntajes (de utilidad para resolver aplicaciones prcticas de la curva
normal)

50% del rea
probabilidad = 0.5
P0 P2 P16 P50 P84 P98 P100
0 10 20 30 40 50 60 70 80 90 100
-3s -2s -1s X +1s +2s +3s
-5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5
f (frecuencia) X = media aritmtica
s = desvo estndar
x = puntaje bruto
z = puntaje reducido
Z = puntaje derivado
P = percentil
x
z
Z
P
50% del rea
probabilidad = 0.5

Pgina 57 de 325
57


En este esquema, las flechas ms gruesas indican los procedimientos habituales en las aplicaciones
prcticas de la curva normal, mientras que aquellas y las flechas ms finas indican mas bien los
procedimientos que se piden en ejercitaciones en cursos de estadstica.

5. APLICACIONES DE LA CURVA NORMAL

El modelo matemtico de la curva normal tiene varias aplicaciones prcticas, como por ejemplo en
psicologa y ciencias de la educacin. Pagano (1998:81) invoca tres razones principales que explican su
importancia en estas disciplinas: 1) Muchas variables psicolgicas tienen distribuciones muy semejantes a
la curva normal, tales como altura, peso e inteligencia. 2) Muchas pruebas de inferencia empleadas para
analizar experimentos tienen distribuciones muestrales que poseen una distribucin muestral al aumentar
el tamao de la muestra. 3) Muchas pruebas de inferencia requieren distribuciones muestrales que se
asemejen a la curva normal, como la prueba z, la prueba t de Student o la prueba F.
Consiguientemente, gran parte de la importancia de la curva normal aparece conjuntamente con la
estadstica inferencial.

En lo que sigue se suministran algunos ejemplos de aplicaciones prcticas de la curva normal con
puntajes estandarizados. En primer lugar se expone un problema tpico y la forma de resolverlo teniendo
en cuenta las reglas de transformacin de puntajes (ver esquema anterior). En segundo lugar, se
presentan algunas variantes posibles dentro del problema tpico u otros.

Problema tpico.- La variable peso en una poblacin de mujeres adultas tiene una distribucin
aproximadamente normal, con una media aritmtica (X) de 60 kg y un desvo estndar (s) de 6 kg.
Calcular la probabilidad de que una mujer adulta de esa poblacin tomada al azar tenga un peso mayor a
68 kg.

Resolucin del problema tpico.- Cuando el enunciado del problema afirma que la variable tiene una
distribucin aproximadamente normal, ello significa que puede ser resuelto recurriendo al modelo de la
curva normal. A partir de aqu, los pasos para resolverlo son los siguientes:

a) Lo primero que debe especificarse son los datos y las incgnitas. Los datos son tres: la media
aritmtica (60 kg), el desvo estndar (6 kg), y finalmente un valor de la variable a partir del cual debe
estimarse su probabilidad (68 kg). En smbolos:
X = 60 kg s = 6 kg x = 68 kg
PUNTAJE
BRUTO (x)
PUNTAJE
REDUCIDO (z)
AREA EXPRESADA
COMO PROBABILIDAD
(p)
AREA EXPRESADA
COMO PORCENTAJE (%)
PUNTAJE
DERIVADO
(Z)
PERCENTIL (P) m = un nmero cualquiera entre 0 y 100
z = (x - X) / s
Z = (z.10) + 50
Tabla: entrar
por z
Tabla: entrar
por p
Multiplicar
por 100
Dividir
por 100
z = (Z-50) / 10
x = (z.s) + X
m% P
m
P
m
m%

Pgina 58 de 325
58
En este caso el problema solicita resolver una sola incgnita: la probabilidad de que una persona tomada
al azar tenga ms de 68 kg (tambin podra haber solicitado averiguar la probabilidad de que tenga
menos de 50 kg, o la probabilidad de que tenga entre 40 y 60 kg). En smbolos:
p 68 kg > x

b) Antes de seguir adelante, siempre convendr trazar la curva normal y especificar la informacin
revelante para resolver el problema. En este caso es:



Segn el esquema de reglas de transformacin de puntajes, si a partir de un valor dado de x (68 kg) se
quiere calcular su probabilidad p, antes deber transformarse el valor x a un puntaje reducido z, el cual
constituye una incgnita (?) que deber resolverse.
Asimismo se raya el rea bajo la curva que se extiende desde 68 hacia la derecha, porque es esa
probabilidad (proporcional al rea rayada) la que debe averiguarse (es decir, 68 o ms).

c) Se aplica la frmula de transformacin del puntaje x en puntaje z:

z = (x - X) / s
z = (68 60) / 6 = 1.33

d) Se recurre a la Tabla de reas bajo la curva normal estandarizada para hallar la probabilidad p a partir
de z = 1.33. Para ello, puede utilizarse indistintamente la Tabla 1 o la Tabla 2 (ver Anexo).
Se utilizar la Tabla 1, donde puede verse que a un valor z = 1.33 corresponde una probabilidad p =
0.9082.

e) Sin embargo, esta tabla indica la probabilidad de z o menos, es decir, la zona rayada hacia la izquierda
de z.
Por lo tanto, como lo que interesa es la probabilidad de un valor de z o mayor, se restar al valor p = 1
(el total del rea bajo la curva) el valor p = 0.9082. En smbolos:
Area total 1.0000
Menos rea hacia la izquierda 0.9082
Area hacia la derecha 0.0918
Por lo tanto, la probabilidad de que una mujer adulta pese ms de 68 kg es de p = 0.0918. Traduciendo
la probabilidad a porcentajes, puede decirse que existe un 9.18% de probabilidades de que la mujer pese
68 kg o ms. De idntica manera, puede decirse que el percentil P que ocupa una mujer adulta de 68 kg
es, siguiendo las pautas del esquema de reglas de transformacin de puntajes: P
91
(calculado y
redondeado a partir de p = 0.9082), lo cual significa que una mujer que pese 68 kg tiene por debajo
aproximadamente un 91% de personas que pesan menos que ella.

Algunas variantes posibles.- Los siguientes ocho casos ilustran algunos ejemplos de problemas que
pueden resolverse mediante la curva normal y los puntajes estandarizados. El problema tpico examinado
precedentemente encuadra en el caso 4.
En todos estos casos se trata de calcular la probabilidad de ocurrencia de un valor comprendido bajo el
rea rayada de la curva ya que la probabilidad de ocurrencia del valor es proporcional al rea respectiva.
Como se ver, en algunos casos conviene ms utilizar la Tabla 1 y en otros las Tabla 2 (ver Anexo).


Pgina 59 de 325
59

CASO 1

CASO 2

CASO 3

CASO 4

CASO 5

CASO 6

CASO 7

CASO 8

Caso 1.- Aqu se trata de averiguar la probabilidad p de que un valor cualquiera de la poblacin
corresponda a z = +1.5. Para este caso convendr utilizar la tabla 1, donde primero se busca el valor
+1.5 en la primera columna, y luego se busca su valor de probabilidad, que es p = 0.9332. Nota: si el
valor de z hubiese sido +1.56, se busca primero z = 1.5 y luego se busca, en la primera hilera, el valor
0.06 (ya que 1.5 + 0.06 = 1.56). En el entrecruzamiento de 1.5 y 0.06 encontraremos, finalmente, el
valor de la probabilidad p = 0.9406.

Caso 2.- En este caso se procede de manera similar que en el caso anterior.

Caso 3.- Aqu se trata de averiguar la probabilidad de que un valor z valga -2 o ms. Esta situacin exige
dos pasos. El primer paso es idntico al caso 1. Sin embargo, este primer paso calcula la probabilidad de
z hacia la izquierda, y lo que se necesita saber es la probabilidad de z hacia la derecha (zona rayada).
Como se sabe que la totalidad del rea bajo la curva vale 1, para averiguar la zona hacia la derecha
bastar con restar 1 de la probabilidad de la zona hacia la izquierda. En esto consiste el segundo y ltimo
paso.

Caso 4.- Aqu debe averiguarse la probabilidad de que un valor z valga 1.5 o ms. La opcin ms sencilla
es aqu emplear la Tabla1, con la cual se calcula la probabilidad correspondiente a z = +1.5, que es p =
0.9332. Esta probabilidad corresponde a la zona rayada desde z hacia la izquierda, pero como debe
averiguarse la probabilidad de z hacia la derecha, deber restarse 1 menos 0.9332.

Pgina 60 de 325
60

Caso 5.- Aqu debe averiguarse la probabilidad de que un valor z est comprendido entre -2.5 y +1.5.
Una forma sencilla de resolver este problema es dividiendo el rea rayada en dos: una desde la mitad
hacia la izquierda (0 a -2.5) y otra desde la mitad hacia la derecha (0 a +1.5). Se calcula luego la
probabilidad de cada rea recurriendo a la Tabla 2, y finalmente se suman ambas probabilidades. Nota:
para el clculo de la zona rayada de la mitad hacia la izquierda se buscar en la Tabla 2 el valor z =
+2.5, porque es igual al valor z = -2.5 (por ser la curva normal simtrica).

Caso 6.- Este caso es tan sencillo que no requiere el uso de tablas. La probabilidad de la zona rayada es
p = 0.5 porque corresponde exactamente a la mitad de toda el rea bajo la curva, cuya p es igual a 1 (p
= 1 equivale a la certeza).

Caso 7.- Aqu debe calcularse la probabilidad de que un valor z est comprendido entre -2 y -1. En este
caso, en lugar de sumar reas como en el caso 5, debern restarse reas. Recurriendo a la Tabla 1, se
calcula primero la probabilidad correspondiente a z = -1 (que es p = 0.1587) y luego la probabilidad de z
= -2 (que es p = 0.0228). La probabilidad resultante ser p = 0.1587 0.0228 = 0.1359.

Caso 8.- Aqu debe calcularse la probabilidad de que un valor z est comprendido entre +1 y +2. Se
puede proceder de la misma forma que en el caso 7, es decir, restando las probabilidades
correspondientes a z = +2 y z = +1.

NOTAS

(1) Botella (1993:153) refiere que los puntajes estandarizados son tiles en los siguientes casos: a) al hacer
comparaciones entre unidades de distintos grupos: se pueden comparar, mediante puntuaciones estandarizadas,
distintas observaciones de un mismo sujeto o de sujetos diferentes; b) al hacer comparaciones entre variables
medidas de distinta forma, debido a que los puntajes estandarizados son adimensionales. Por ejemplo, comparar una
altura expresada en centmetros con otra expresada en metros; y c) al comparar observaciones de distintas variables:
por ejemplo, comparar la altura y el peso de un sujeto.
(2) En el esquema puede apreciarse que z contempla valores que se extienden a -5 o +5.desvos estndar. En la
prctica, sin embargo, se consideran solamente valores entre -3 y +3 por razones prcticas. En efecto, los valores
superiores a +3 o menores a -3 cubren reas muy pequeas bajo la curva, es decir, la probabilidad de ocurrencia de
puntajes mayores que +3 o menores que -3 son muy improbables, estando muy alejados de la media aritmtica.
(3) Hay muchas formas en que los datos pueden distribuirse, y en todos esos casos existe cierta regularidad en los
mismos. Por ejemplo, hay una tendencia a que la mitad de las veces salga cara arrojando una moneda, y tambin hay
una tendencia a que la mitad de las veces se opte por un producto A y no uno B (suponiendo que lo hay ninguna razn
para elegir uno u otro). Estos hechos sugieren que los datos de una manera regular, y los estadsticos propusieron
diversos modelos de distribucin, uno para cada forma regular de distribucin de datos, como por ejemplo el modelo
Bernouilli o el modelo binomial.
La nocin de permanencia estadstica (Vessereau A, 1962:15) hace referencia a ciertas uniformidades en los datos de
la realidad. Por ejemplo: a) la cantidad de varones y la de mujeres tiende a ser aproximadamente igual; b) el tamao
de las galletitas que fabrica una mquina tiende a ser aproximadamente igual; c) la proporcin entre granos esfricos
de arvejas y granos arrugados de arvejas tiende a ser del 75% y del 25% aproximadamente, o sea, siempre tiende a
encontrarse aproximadamente 75 granos esfricos cada 100, y 25 granos arrugados cada 100; d) la estatura de las
personas tienden siempre a estar alrededor de un valor medio, siendo frecuente encontrar estaturas de 1.70 metros
pero raro encontrar estaturas de 2 metros.
Estas uniformidades sugieren la presencia de leyes que rigen la forma en que se distribuyen los datos. Como hay
muchas formas en que los datos pueden distribuirse, tambin habr muchas leyes que describen dichas distribuciones.
Entre las ms conocidas (Vessereau A, 1962:16-24) se cuentan la ley binomial, la ley de Laplace-Gauss y la ley de
Poisson. Por ejemplo, la ley de Laplace-Gauss describe las distribuciones que siguen una curva normal: cuando una
magnitud recibe la influencia de una gran cantidad de causas de variacin, y estas son todas muy pequeas e
independientes unas de otras, se demuestra que los valores individuales de las mediciones se distribuyen
respondiendo a la ley de Laplace-Gauss (Vessereau A, 1962:20).
Otros autores consideran fundamentales a las distribuciones normal, binomial y de Student, y hacen referencia a
otras, como la distribucin chi cuadrado (x
2
) que, a diferencia de la primeras, no es paramtrica, es decir, no requiere
supuestos tan rigurosos acerca de la poblacin, como por ejemplo de que esta se distribuya normalmente (Kohan N,
1994:191).
Hay otras leyes que tienen alcance ms general, como por ejemplo la ley de distribucin de las medias (Vessereau A,
1962:24) que establece que, cualquiera que sea la distribucin (binomial, gaussiana, etc.), el desvo estndar de las
medias aritmticas de todas las muestras posibles de n elementos disminuye inversamente a la raz cuadrada de n.
Esto significa que cuanto ms grandes sean las muestras, menos desviacin o dispersin habr entre sus medias
aritmticas.

Teorema de Chebicheff.- Esta desigualdad se aplica a cualquier tipo de distribucin (normal o no),
hiptesis, ley, etc., y por ello puede actuar como prueba de consistencia. Se emplea cuando no se sabe
qu tipo de distribucin tiene la muestra o poblacin.
Esta desigualdad brinda el lmite inferior (probabilidad mnima) de los casos ms probables segn
cualquier ley, teora, etc. Ms concretamente, sirve para determinar la probabilidad mnima de un
intervalo centrado en la media, y que abarca tantas dispersiones en menos y tantas en ms.
Generalmente se toman +2 y -2.
La frmula es:

Pgina 61 de 325
61
P (m t . o x m + t . o) 1 (1/t
2
)
donde:
P = Probabilidad mnima.
m = Media aritmtica.
o = Desvo estndar.
t = Cantidad de desvos estndar (en general se toman 2).
m t . o = Lmite inferior.
m + t . o = Lmite superior.
x = Valor que est entre ambos lmites.
m t . o x m + t . o = Intervalo
Como se considera generalmente t = 2, resulta ser:
P (m 2. o x m + 2 . o) 0.75
Ejemplo de problema.- En una muestra, la media aritmtica es 60 y el desvo estndar es 20. Determinar
el intervalo de x que abarque por lo menos el 75% de los casos ms probables.
P (m 2. o x m + 2 . o) 0.75
P (60 2. 20 x 60 + 2 . 20) 0.75
P (20 x 100) 0.75
El intervalo obtenido nos asegura que por lo menos (probabilidad mnima) el 75% de los casos ms
probables estn entre 20 y 100.

CAPTULO 4: CORRELACIN Y REGRESIN

1. INTRODUCCIN

El anlisis de correlacin permite averiguar el tipo y el grado de asociacin estadstica entre dos o ms
variables, mientras que el anlisis de regresin permite hacer predicciones sobre la base de la correlacin
detectada.
Ms concretamente, una vez realizado el anlisis de correlacin, pueden obtenerse dos resultados: que
haya correlacin o que no la haya. Si hay correlacin, entonces se emprende un anlisis de regresin,
consistente en predecir cmo seguirn variando esas variables segn nuevos valores.
Por ejemplo, si sobre la base de haber examinado a 40 alumnos se concluye una alta correlacin en sus
notas en ambos parciales, conociendo la nota del primer parcial de un alumno nmero 41, podremos
predecir con algn margen de seguridad cunto se sacar este alumno en el segundo parcial.
En general el anlisis de correlacin se realiza conjuntamente con el anlisis de regresin. Mientras el
anlisis de correlacin busca asociaciones, el anlisis de regresin busca predicciones, es decir, predecir
el comportamiento de una variable a partir del comportamiento de la otra.
As, la correlacin y la regresin estn ntimamente ligadas. En el nivel ms sencillo, ambas implican la
relacin entre dos variables y utilizan el mismo conjunto de datos bsicos, pero mientras la correlacin
tiene que ver con la magnitud y la direccin de la relacin, la regresin se centra en el uso de la relacin
para hacer una prediccin. Esta ltima es sencilla cuando la relacin es perfecta, pero la situacin es ms
compleja si la relacin es imperfecta (Pagano, 127).
La correlacin es til porque permite hacer predicciones, porque permite establecer correlaciones (paso
previo para la determinacin de una conexin causal), y para realizar pruebas de confiabilidad de
instrumentos de medicin como los tests (prueba test-retest) (Pagano, 99).
Por ltimo, vale la pena aclarar que en el contexto de un estudio cientfico, no basta con determinar el
grado de correlacin entre dos variables en una muestra. Es necesario adems establecer, mediante una
prueba de significacin (por ejemplo la prueba t), si la correlacin establecida en la muestra puede
extenderse a toda la poblacin con un determinado nivel de confianza. Esta tarea corresponder a la
estadstica inferencial.

Correlacin lineal.- Las relaciones entre variables pueden ser de muchos tipos. a) Hay relaciones
deterministas que responden a modelos matemticos tericos, como por ejemplo la relacin entre la
intensidad de una corriente y la resistencia del conductor, o bien, la relacin entre la factura de consumo
de agua y el nmero de metros cbicos consumidos. Estas relaciones son habituales en ciencias exactas.
b) Otras relaciones no son tan deterministas, pero pueden eventualmente parecerse slo parecerse- a
algn modelo matemtico terico determinista, en cuyo caso se concluye que ese modelo explica bien la
relacin, aunque no lo haga perfectamente. Estas relaciones son habituales en las ciencias sociales
(Botella, 1993:181).
Dentro de los muchos modelos tericos a los cuales podra ajustarse una relacin no determinista se
cuentan los modelos lineales, los modelos cuadrticos, los modelos cbicos, etc. El primero se representa
mediante una recta, y los restantes mediante diversos tipos de curva como parbolas e hiprbolas. El
presente artculo har referencia, por razones de simplicidad, a las relaciones lineales y, por tanto, a la
correlacin lineal.

Correlacin y causalidad.- El hecho de que dos variables estn correlacionadas, no significa
necesariamente que una sea la causa y la otra el efecto: la correlacin no siempre significa causalidad.

Pgina 62 de 325
62
Entre otras cosas, una alta correlacin puede deberse a que ambas variables X e Y dependen cada una
independientemente de otra variable Z, y entonces, al variar Z hace variar conjuntamente a X e Y,
produciendo un efecto de alta correlacin que puede dar la apariencia de causalidad. Por dar un ejemplo:
entre memoria visual (X) y memoria auditiva (Y) puede haber una alta correlacin, pero ello no significa
que la memoria visual sea la causa de la memoria auditiva, ya que ambas pueden estar dependiendo de
otro factor Z ms general, llmese "memoria", o "cantidad de ARN".
Si realizar el anlisis de correlacin es algo relativamente fcil (se trata de recoger datos y aplicar una
frmula), determinar el vnculo causal suele implicar un procedimiento ms laborioso, como por ejemplo
la ejecucin de un diseo experimental que implique la comparacin de dos grupos sometidos a
condiciones diferentes y donde haya un control sobre la influencia de variables extraas.

El siguiente esquema permite visualizar algunos pasos posibles para llevar a cabo un anlisis de
correlacin seguido de un anlisis de regresin. El esquema sintetiza, al mismo tiempo, los temas a tratar
en el presente artculo.



2. EL ANLISIS DE CORRELACIN

Juan se sac una buena nota en el primer parcial, y por lo tanto es bastante probable que tambin
saque buena nota en el segundo parcial. Esta persona tiene ms edad y por lo tanto es ms probable
que le falte alguna pieza dentaria. Abundan esta clase de razonamientos en la vida cotidiana, que suelen
aceptarse sin demasiada crtica.
Sin embargo, en un estudio cientfico es habitual que estas hiptesis deban ser comprobadas ms all de
las certidumbres subjetivas. Para constatar si hay realmente asociacin entre dos o ms variables
cualesquiera, se emplea una herramienta denominada anlisis de correlacin, que tambin evala el
grado o intensidad en que dichas variables estn asociadas. Se examina aqu el caso ms sencillo (dos
variables), que se estudia dentro de la estadstica bivariada.
En el siguiente ejemplo se exponen tres posibles distribuciones de frecuencias bivariadas (1) referidas a
las primeras y segundas notas de exmenes parciales.

Alumno Tabla 1 Tabla 2 Tabla 3
X Y X Y X Y
A
B
C
D
E
F
G
3
4
6
6
8
9
10
2
5
5
6
6
9
9
3
4
6
6
8
9
10
3
4
6
6
8
9
10
3
4
6
6
8
9
10
2
3
5
5
7
8
9
X = Nota del primer parcial
Y = Nota del segundo parcial
Si las variables son
CUANTITATIVAS
Se calcula la correlacin con
CUALITATIVAS ORDINALES
Se calcula la correlacin con
METODO ANALITICO
Coeficiente de correlacin por
rangos de Spearman
METODO ANALITICO
Coeficiente de
correlacin de Pearson
METODO GRAFICO
Diagrama de
dispersin
Se calcula la
regresin
(prediccin) con
Para interpretar mejor este
coeficiente, se calcula el
coeficiente de determinacin
METODO ANALITICO
Mtodo de los cuadrados
mnimos
METODO GRAFICO
Recta de regresin

Pgina 63 de 325
63

En la Tabla 1 se han consignado las notas de los parciales de un grupo de 7 alumnos ordenadas en forma
creciente.
Un somero examen visual de la tabla revela que hay bastante asociacin entre las variables X e Y:
quienes sacaron buena nota en el primer parcial tienden a sacar buena nota en el segundo, y lo mismo
para quienes sacaron bajas notas, con lo cual ambas variables tienden a variar concomitantemente o
conjuntamente.
Sin embargo, debe tenerse presente que la asociacin o correlacin entre ambas variables no depende de
la similitud entre X y Y, sino de la similitud de sus modos de variacin. As, en la Tabla 2 las notas de los
primeros y segundos parciales de cada alumno son iguales, y en la Tabla 3 la nota del segundo parcial es
diferente, pero siempre menor en un punto. Sin embargo, en ambas tablas la correlacin es la misma.

El anlisis de correlacin busca establecer esencialmente tres cosas:
1) Presencia o ausencia de correlacin.- Dadas dos o ms variables, si existe o no correlacin entre ellas.
2) Tipo de correlacin.- En caso de existir correlacin, si esta correlacin es directa o inversa. En la
correlacin directa, ambas variables aumentan (o disminuyen) concomitantemente, y en la correlacin
inversa ambas variables varan inversamente, o tambin puede decirse "en relacin inversamente
proporcional", lo que significa que cuando una aumenta la otra disminuye, o viceversa (2). En el siguiente
esquema se muestran algunos ejemplos de correlacin directa e inversa.

Tipos de correlacin

Tipo Definicin Ejemplos en psicologa
Correlacin
directa o
positiva
Ambas variables
aumentan (o
disminuyen) en forma
concomitante.
Cociente intelectual/calificacin: A mayor CI, mayor calificacin
obtenida en el examen.
Tiempo/retencin: A mayor tiempo para memorizar, mayor
cantidad de palabras retenidas.
Test laboral/rendimiento futuro: A mayor puntaje en un test de
aptitud tcnica, mayor rendimiento en dicha rea dentro de x
aos (esto es tambin un modo de estimar la validez predictiva
de un test).
Correlacin
inversa o
negativa
Una variable aumenta
y la otra disminuye (o
viceversa) en forma
concomitante.
Edad/memoria: Al aumentar la edad, disminuye la memoria.
Numero de ensayos/cantidad de errores: Al aumentar el nmero
de ensayos, disminuye la cantidad de errores.
Cansancio/atencin: Al aumentar el cansancio disminuye la
atencin.

3) Grado de correlacin.- El grado o intensidad de la correlacin, es decir, cunta correlacin tienen en
trminos numricos.

Para hacer todas estas averiguaciones, se puede recurrir a tres procedimientos.
a) El mtodo tabular.- Una correlacin podra constatarse con la simple visualizacin de tablas de
correlacin como las indicadas anteriormente, pero habitualmente las cosas no son tan fciles, sobre todo
porque hay bastante mayor cantidad de datos, y porque estos casi nunca registran los mismos
incrementos para ambas variables. Por lo tanto, debe abandonarse la simple visualizacin de las tablas y
utilizar procedimientos ms confiables, como los grficos (diagramas de dispersin o dispersiogramas) y
los analticos (por ejemplo el coeficiente de Pearson).
b) El mtodo grfico.- Consiste en trazar un diagrama de dispersin.
c) El mtodo analtico.- Consiste en aplicar una frmula que permita conocer no slo el tipo de
correlacin (directa o inversa) sino tambin una medida cuantitativa precisa del grado de correlacin. La
frmula del coeficiente de Pearson es un ejemplo tpico para medir correlacin entre variables
cuantitativas.

3. CLCULO GRFICO DE LA CORRELACIN

Un grfico es mucho mejor que una tabla para apreciar rpidamente si hay o no correlacin entre
variables. Existen varias maneras de graficar la correlacin (3), pero aqu se describir el procedimiento
clsico: el diagrama de dispersin. El diagrama de dispersin es bsicamente una nube de puntos,
donde cada punto corresponde al entrecruzamiento de cada par de valores de X e Y. Este diagrama
puede realizarse independientemente del clculo analtico de la correlacin.
Por ejemplo, el diagrama de dispersin correspondiente a la Tabla 1 se asemeja al diagrama A del
esquema de diagramas de dispersin.
A este diagrama se ha agregado a ojo una lnea imaginaria, que viene a representar ms o menos el
ordenamiento lineal de los puntos (que van desde abajo a la izquierda hacia arriba a la derecha). El
diagrama se llama 'de dispersin' porque muestra cun dispersos (prximos o alejados) estn los puntos
alrededor de dicha recta. Fcil es advertir que cuanto ms alineados estn, ms correlacin habr. En el

Pgina 64 de 325
64
ejemplo A del esquema sobre diferentes diagramas de dispersin, los puntos tienden a ubicarse en las
proximidades de la recta imaginaria, lo que indica que estn poco dispersos. Si los puntos figurasen ms
alejados habra ms dispersin, y por lo tanto menor correlacin entre X e Y.
El caso B muestra correlacin inversa, pues el ordenamiento de los puntos indican que, a medida que
aumenta X, va disminuyendo Y. As entonces, cuando la lnea imaginaria va de abajo a la izquierda hacia
arriba a la derecha, hay correlacin directa, y cuando va desde arriba a la izquierda hacia abajo a la
derecha hay correlacin inversa. Dicho ms tcnicamente, en el primer caso la recta tiene una inclinacin
o pendiente positiva, y en segundo su pendiente es negativa.
El caso C revela, por su parte, que a medida que aumenta Y, los valores de X ni aumentan ni disminuyen,
permaneciendo fijos en el valor 5. Por lo tanto no hay correlacin. En general no la hay cuando una de las
variables no vara (en este caso X permanece constante en el valor 5).
El caso D es similar al anterior: all los valores de Y permanecen constantes en el nmero 4, mientras va
variando X. Tampoco hay correlacin.
El caso E muestra un ejemplo donde varan ambas variables, pero sin embargo no hay correlacin. En
esa nube es imposible trazar una lnea imaginaria representativa de la orientacin de los puntos,
simplemente porque no hay tal orientacin lineal. Los valores que van asumiendo las variables son en
principio aleatorios (varan al azar). Tampoco hay correlacin.
El caso F nos muestra un caso de correlacin perfecta o mxima (en este caso directa), pues no hay
dispersin de puntos alrededor de la lnea imaginaria: todos estn sobre ella. Estas regularidades
perfectas no suelen encontrarse fcilmente, ni menos an en ciencias sociales, porque los fenmenos
obedecen siempre a muchas causas que estarn actuando para romper la armona natural entre X e Y.
Tambin hay casos de correlacin no lineal, donde en lugar de una recta imaginaria se traza una curva.
En este artculo se presentan solamente los casos ms sencillos, es decir, los casos de correlacin lineal,
representables mediante rectas.

Diferentes diagramas de dispersin



Y

10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 X
A) Correlacin directa
Y

10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 X
B) Correlacin
inversa
Y

10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 X
C) Sin correlacin
Y

10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 X
D) Sin correlacin
Y

10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 X
E) Sin correlacin
Y

10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 X
F) Correlacin directa
perfecta

Pgina 65 de 325
65
Si bien una nube de puntos puede dar una idea de si hay o no correlacin, o de si es directa o inversa,
todava no proporciona informacin sobre cuanta correlacin hay. Esta informacin se obtiene mediante
un clculo analtico.

4. CLCULO ANALTICO DE LA CORRELACIN

La correlacin se calcula analticamente mediante ciertos coeficientes, que sern distintos segn se trate
de correlacionar variables nominales, ordinales o cuantitativas, y segn se trate de otras consideraciones
varias.
Si bien existen muchos coeficientes de correlacin (4), en lo que sigue se explicarn algunos de los ms
utilizados: el coeficiente de correlacin lineal de Pearson (para variables cuantitativas), y el coeficiente de
correlacin por rangos de Spearman (para variables cualitativas ordinales).

a) Coeficiente de correlacin lineal de Pearson

Este coeficiente (que se designa con r), fue creado por Karl Pearson (1857-1936) para relacionar
variables cuantitativas (es decir, variables que, como nota de examen, se miden mediante nmeros).
El coeficiente de Pearson es un nmero comprendido entre -1 y +1, y que posee un determinado signo
(positivo o negativo). El valor numrico indica cuanta correlacin hay, mientras que el signo indica qu
tipo de correlacin es (directa si el signo es positivo, inversa si es negativo). En el siguiente esquema se
muestran algunos posibles valores de r.

Algunos valores del coeficiente de Pearson



Cuanto ms cerca de cero est el coeficiente de correlacin obtenido, tanto menor correlacin habr.
Cabra preguntarse: hasta qu valor se considera que hay correlacin? desde qu valor no la hay? Esto
es una cuestin que depende de varias cosas, y hace a la cuestin de la relatividad del coeficiente de
Pearson.
En efecto, su interpretacin depende de varios factores, como por ejemplo: a) la naturaleza de las
variables que se correlacionan; b) la significacin del coeficiente; c) la variabilidad del grupo; d) los
coeficientes de confiabilidad de los tests; e) el propsito para el cual se calcula r.
El valor r = 0,70 puede indicar alta correlacin para cierto par de variables, pero baja correlacin para
otras variables distintas. Otro ejemplo: un r de 0,30 entre estatura e inteligencia o entre tamao craneal
y habilidad mecnica indicara una correlacin mas bien alta, puesto que las correlaciones entre variables
fsicas y mentales suelen ser mucho ms bajas, a menudo iguales a cero. Otro ejemplo: un r de 0,30
entre inteligencia y nota de examen, o entre puntaje en ingls y puntaje en historia es considerada
bajsima, ya que los r en estos campos suelen extenderse entre 0,40 y 0,60. Otro ejemplo: semejanzas
entre padres e hijos, en cuanto a rasgos fsicos y mentales, se expresan por valores entre 0,35 y 0,55, y
por lo tanto un r de 0,60 sera alto.
Respecto de la frmula para calcular el coeficiente de correlacin de Pearson ("r"), no hay una nica
manera de presentarla, y la eleccin de una u otra depender de la forma de presentacin de los datos.
Por ejemplo, si los datos estn agrupados en una tabla de frecuencias, se utiliza cierta frmula (Bancroft,
1960:190), mientras que si los datos no estn agrupados en frecuencias, podrn utilizarse cualquiera de
las frmulas indicadas en el siguiente esquema (5):

Frmula 1 Frmula 2

E { ( x X) (y Y) }

E { ( x X) (y Y) }
Correlacin inversa mxima (-1)



Baja correlacin inversa (-0.15)

Correlacin nula (0)



Alta correlacin directa (+0.70)

Correlacin directa mxima (+1)

Pgina 66 de 325
66
r = -------------------------------
n ox . oy

Se usa esta frmula cuando dan como datos
las medias de X e Y y sus respectivos
desvos estndar.
r = -------------------------------
E ( x X)
2
. E (y Y)
2


(El denominador debe elevarse a la raz cuadrada).
Se usa esta frmula cuando dan como datos las medias aritmticas
de X e Y.
Frmula 3 Frmula 4

E (Z x . Zy)
r = ---------------------
n

Se usa esta frmula cuando dan como datos
los puntajes estandarizados Z.

n E (x.y) Ex . Ey
r = ------------------------------------------------
n Ex
2
(Ex)
2
. n Ey
2
(Ey)
2


(Ambos factores del denominador se elevan a la raz cuadrada)
Se utiliza esta frmula (llamada frmula del producto momento)
cuando no se conocen ni medias aritmticas ni desvos estndar.

A continuacin se suministra un ejemplo de cmo calcular el coeficiente "r" utilizando la frmula 2. Se
trata de determinar el coeficiente de Pearson para dos variables X e Y (que podran ser por ejemplo las
notas del primero y segundo parcial). Tambin se pide interpretar el resultado.
La tabla 1 son los datos dados, mientras que la tabla 2 es una ampliacin que debe hacerse para poder
obtener ms informacin y poder as aplicar la frmula:

Tabla 1

Alumno X Y
A
B
C
D
E
4
5
7
9
10
6
7
8
9
10
N=5 alumnos 35 40

Tabla 2

x X y Y ( x X) (y Y) ( x X)
2
(y Y)
2

-3
-2
0
2
3
-2
-1
0
1
2
6
2
0
2
6
9
4
0
4
9
1
1
0
1
1
0 0 16 26 10

X = 7
Y = 8

Con los datos obtenidos se aplica ahora la frmula 2:

E { ( x X) (y Y) } 16
r = ---------------------------------------- = ----------------------- = +0.99
raz de E ( x X)
2
. E (y Y)
2
raz de 26,10

Interpretando el resultado, se puede decir que la correlacin obtenida es directa o positiva y es adems,
muy alta.

Coeficientes derivados.- A partir del coeficiente "r" de Pearson (en cualquiera de sus formas) se pueden
derivar otros, segn la informacin que se quiera obtener:
1) Coeficiente de determinacin (r
2
): es el coeficiente "r" elevado al cuadrado. El coeficiente de
determinacin indica qu porcentaje de la variacin de Y est determinada por las variaciones de X. Por
ejemplo, para un "r" de 0,70, hay un coeficiente de determinacin de 0,49, lo que significa que el 49% de
la variacin de Y est determinada por la variacin de X.
2) Coeficiente de alienacin (k): llamado tambin de no correlacin, no indica la correlacin sino la falta
de correlacin entre dos variables (o grado de independencia). Para calcularlo se aplica la frmula
siguiente:
r
2
+ k
2
= 1 [1]

Pgina 67 de 325
67
Por ejemplo, si sabemos que "r" es de 0,50, aplicando la frmula indicada tenemos que "k" vale 0,86, con
lo cual el grado en que falta la correlacin resulta ser mayor que el grado en que s hay correlacin.
Idnticamente, si "r" vale 1 entonces "k" vale 0, y viceversa. Cuanto mayor es el coeficiente de alienacin
tanto menor es la correlacin, y por tanto menos confiables sern las predicciones que -anlisis de
regresin mediante- se hagan sobre esa base.
3) Coeficiente de indeterminacin (k
2
): es el coeficiente "k" pero elevado al cuadrado. Mide el grado en
que la variacin de Y no est determinada por la variacin de X. La frmula del coeficiente de
indeterminacin es deducible de la anterior [1].
4) Coeficiente de eficiencia predictiva (E): suele utilizarse para, sabiendo "r", estimar rpidamente el
poder predictivo de la correlacin "r". Su frmula es:
E = 100 . (1 - 1-r2) donde 1-r2 debe elevarse a la raz cuadrada.
Por ejemplo si la correlacin "r" es de 0,50, la eficiencia predictiva ser del 13%. Pero cuando "r" sube a
0,98, la eficiencia predictiva ser del 80%. La correlacin debe ser entonces de 0.87 o ms para que la
eficiencia predictiva sea mayor al 50%.

Matriz de correlaciones.- En muchas investigaciones se estudian muchas variables, y se intenta
cuantificar mediante el coeficiente r sus relaciones dos a dos, es decir, las relaciones de cada variable
con cada una de las dems (Botella, 1993:202). A los efectos de comparar estos diferentes valores de r
se traza una matriz de correlacin, que puede tener la siguiente forma:

Variable X Variable Y Variable W Variable Z
Variable X r = -0.17 r = -0.11 r = -0.30
Variable Y r = +0.46 r = +0.17
Variable W r = +0.10
Variable Z

La matriz permite visualizar inmediatamente, entre otras cosas, cules son los coeficientes de correlacin
ms altos (en este caso, entre Y y W).
Ntese que no han sido llenados los casilleros donde se cruzan las mismas variables (por ejemplo X con
X), porque carece de sentido hacerlo y su correlacin es siempre perfecta y positiva (r = +1).

b) Coeficiente de correlacin por rangos de Spearman

Se trata de un coeficiente de correlacin utilizado para estudiar la asociacin entre dos variables
ordinales. Se representa con la letra griega rho, y sus frmulas son las siguientes:

Frmula 1 Frmula 2

6 E d
2

= 1 - ---------------------------
n (n + 1) (n 1)


E x
2
+ E y
2
+ E d
2

= --------------------------------
2 . \ E x
2
. E y
2


La frmula para obtener E x
2
o E y
2
es la misma en ambos casos,
y es E x
2
= E y
2
= (n
3
n) / 12
En el denominador, la raz cuadrada afecta a E x
2
. E y
2


En ciertos casos conviene utilizar la primera frmula, y en otros casos la segunda. Por ejemplo (Kohan,
1994:256), si no hay empates en los rangos o son muy pocos, se utilizar la frmula 1, y si hay empates
en los rangos, se utilizar la frmula 2. Para comprender esto, se suministran a continuacin dos
ejemplos diferentes: uno sin empates y otro con empates.

Ejemplo 1.- En este ejemplo (tomado de Kohan, 1994:256) se utiliza el coeficiente de Spearman para
evaluar el grado de asociacin entre dos variables ordinales: X (autoritarismo) e Y (bsqueda de status).
Por ejemplo, permitir averiguar si a medida que aumenta el autoritarismo en las personas tiende
tambin a aumentar la bsqueda de status social.
Para ello se toma una muestra de 12 sujetos, y se obtienen los siguientes resultados:

Sujeto x (rango por autoritarismo) y (rango por bsqueda de status) d d
2

A 2 3 -1 1
B 6 4 2 4
C 5 2 3 9
D 1 1 0 0
E 10 8 2 4
F 9 11 -2 4
G 8 10 -2 4

Pgina 68 de 325
68
H 3 6 -3 9
I 4 7 -3 9
J 12 12 0 0
K 7 5 2 4
L 11 9 2 4
n = 12 E d
2
= 52

Esta tabla indica, por ejemplo, que el sujeto A se situ en un segundo lugar en autoritarismo y en un
tercer lugar en bsqueda de estatus.
Aplicando la frmula 1, se obtiene un coeficiente de Spearman de 0.82, lo cual sugiere una alta
correlacin entre autoritarismo y bsqueda de status.

Ejemplo 2.- Aqu se trata de obtener el coeficiente de Spearman cuando hay empates en los rangos. Los
empates ocurren cuando dos o ms sujetos tienen el mismo rango en la misma variable. Por ejemplo
(ver tabla siguiente), los sujetos A y B obtuvieron el mismo puntaje en la variable X (o sea, obtuvieron
ambos cero). Otro tanto ocurri con los sujetos C y D y con los sujetos J y K, siempre en relacin a la
misma variable X. En el caso de la variable Y todos los puntajes fueron diferentes, y por lo tanto no hubo
empates.
Cuanto mayor es la cantidad de empates, ms conveniente resultar utilizar la frmula 2.

Sujeto x (rango por autoritarismo) y (rango por bsqueda de
status)
d d
2

Puntaje Rango Puntaje Rango
A 0 (1) 1.5 42 3 -1.5 2.25
B 0 (2) 1.5 46 4 -2.5 6.25
C 1 (3) 3.5 39 2 1.5 2.25
D 1 (4) 3.5 37 1 2.5 6.25
E 3 (5) 5 65 8 -3.5 9
F 4 (6) 6 88 11 -5 25
G 5 (7) 7 86 10 -3 9
H 6 (8) 8 56 6 2 4
I 7 (9) 9 62 7 2 4
J 8 (10) 10.5 92 12 -1.5 2.25
K 8 (11) 10.5 54 5 -5.5 30.25
L 12 (12) 12 81 9 3.5 9
n = 12 E d
2
= 109.5

Para hallar el coeficiente de Spearman en estos casos, puede procederse se acuerdo a tres pasos:

a) Reasignacin de rangos.- En la columna de Puntaje de la variable X se ha agregado entre parntesis el
rango u orden que ocupara el sujeto. Este agregado sirve al nico efecto de determinar el rango
definitivo que se le asignar, y que aparece en la columna Rango, de la misma variable.
La forma de calcular este rango definitivo es simple. Por ejemplo, si se consideran los sujetos A y B, se
suman los rangos 1 y 2, con lo cual se obtiene el valor 3. Este valor se divide por la cantidad de
empates, que en este caso es 2, y se obtiene el valor 1.5, que ser el rango definitivo de ambos sujetos.

b) Correccin de la suma de los cuadrados.- Para poder aplicar la frmula 2, y puesto que hay empates,
deben modificarse los valores de E x
2
y de E y
2
es decir, las sumatorias de los cuadrados de los valores de
cada variable.
Para modificar dichos valores deben restarse a ellos E E, cuyo valor se entiende a partir de la siguiente
frmula donde dicho factor se ha restado:

n
3
n 12
3
12 2
3
2 2
3
2 2
3
- 2
E x
2
= --------- - E E = ------------ - ( --------- + --------- + --------- ) = 143 1.5 = 141.5
12 12 12 12 12

El valor 2 significa que hay sido dos los valores empatados. En este caso, los empates se han dado en
tres oportunidades (sujetos A-B, C-D y J-K), y por ello se suman los tres cocientes.
Como en la variable Y no se han verificado empates, el clculo no incluir el factor de correccin:

n
3
n 12
3
12
E y
2
= --------- = ------------ = 143
12 12

c) Aplicacin de la frmula 2.- Se aplica la frmula con los valores corregidos del siguiente modo:

Pgina 69 de 325
69

E x
2
+ E y
2
+ E d
2
141.5 + 143 109.5
= -------------------------------- = ------------------------------ = 0.616
2 . \ E x
2
. E y
2
2 \ 141.5 . 143

Si no se hubieran introducido las correcciones indicadas, el valor del coeficiente de Spearman hubiera
sido ms elevado, aunque en este caso la diferencia es poco importante y slo conviene corregir cuando
hay gran cantidad de empates (Kohan, 1994:258).

5. UN EJEMPLO: CONSTRUCCIN Y VALIDACIN DE TESTS

El anlisis de correlacin se aplica en muchos mbitos de la psicologa, como por ejemplo en la teora
factorialista de la inteligencia, en el anlisis de actitudes en psicologa social, y tambin en la
construccin de pruebas psicodiagnsticas (6).
Como ejemplo, a continuacin se inventar un test, no slo para ver como se realiza esta tarea, sino
tambin para ver el modo en que interviene en este proceso el anlisis de correlacin.
La idea de construir un supuesto Test de personalidad de Prez pudo haber comenzado al leer los
diversos trastornos de personalidad del DSM-IV. Uno de ellos es el trastorno narcisista, otro el trastorno
esquizoide, y as sucesivamente. El DSM-IV propone diversos criterios para identificarlos, pero aqu se ha
elegido otro camino: tomar un test creado ad hoc.
Pensando en la cuestin, cabe imaginarse que un individuo narcisista podra muy bien estar cmodo con
un dibujo como el esquema 6, donde aparece un gran punto rodeado de otros ms pequeos que lo
admiran, mientras que un esquizoide preferira el esquema 7, representativo de un patrn de
distanciamiento de las relaciones sociales.




Acto seguido, se eligen mil sujetos con diagnsticos diversos de personalidad y se les pregunta qu
dibujo les gusta ms. Aqu es donde interviene el anlisis de correlacin, que permitir ver el grado de
asociacin entre el diagnstico y el dibujo elegido. Una muy alta correlacin aparecera, por ejemplo, si
gran cantidad de sujetos con trastorno narcisista eligen el esquema 6, con lo cual, en lo sucesivo se
podr tomar este test sin necesidad de explorar sus conductas y ver si cumplen los criterios del DSM-IV,
un trmite que suele ser arduo.
Desde ya, construir un test exige una gran cantidad de controles y precauciones que no vienen al caso
exponer aqu. Por ejemplo, debe determinarse su validez y su confiabilidad. El anlisis de correlacin
permite, precisamente, determinar por ejemplo un tipo especial de validez: la validez predictiva, que
pueden verse claramente en las pruebas de orientacin vocacional.
As, por ejemplo, una forma de establecer si un test de este tipo evala la vocacin de un sujeto, es
esperar varios aos y ver si ese sujeto tuvo xito en la profesin sugerida por el test. Como puede
apreciarse, aqu se recurre nuevamente al anlisis de correlacin, al compararse la profesin
diagnosticada con la profesin elegida exitosamente. Una alta correlacin entre ambas variables es
indicador de la validez predictiva del test en cuestin.
El anlisis de correlacin permite tambin determinar otros tipos de validez como la validez inter-test,
que compara los resultados de un test vocacional con otro test vocacional. Si ambos arrojan
aproximadamente los mismos resultados en un conjunto de sujetos, entonces tienen validez inter-test,
comparacin que fue posible por un anlisis de correlacin.
Esquema 6 Esquema 7

Pgina 70 de 325
70

6. EL ANLISIS DE REGRESIN

El objetivo del anlisis de regresin es establecer una prediccin acerca del comportamiento de una
variable Y conociendo el correspondiente valor de X (o viceversa) y el grado de correlacin existente
entre ambas variables.
Para ello es preciso conocer la llamada recta de regresin (7), que es la recta imaginaria que mejor
representa el conjunto de pares de valores de las variables X e Y. En el siguiente eje de coordenadas,
estn representados por ejemplo cinco de esos pares de valores, mediante cinco puntos. La recta de
regresin dibujada sera la que mejor representa esos puntos, por cuanto la distancia de los puntos a la
recta (representada con una lnea punteada) es la mnima. Esta distancia recibe el nombre de regresin,
de manera tal que cuanto menor es la regresin de los puntos, mayor ser la correlacin entre ellos.



La recta de regresin es, de muchas rectas posibles, la que mejor representa la correlacin o, ms
tcnicamente, es la nica que hace mnima la suma de los cuadrados de las desviaciones o distancias de
cada punto a la recta. Es, adems, la mejor manera de poder hacer predicciones.
Las desviaciones de los puntos respecto de la recta se adjudican a factores no controlados (que suelen
ser particularmente importantes en las ciencias sociales), y se parte del supuesto de que si no hubiera
factores extraos que afecten la relacin entre X e Y, entonces no habra desviaciones y la correlacin
sera perfecta.
La recta de regresin puede trazarse a ojo, pero este procedimiento no tiene precisin. El anlisis de
regresin propone un mtodo mucho ms preciso, consistente en hallar la recta de regresin por una va
analtica.
Este clculo de la recta de regresin consiste en hallar la ecuacin de la recta de regresin, y
eventualmente luego dibujndola en un diagrama de coordenadas cartesianas. Una vez en posesin de
esta ecuacin, podrn hacerse predicciones a partir de la ecuacin misma o bien a partir de la recta
trazada en el diagrama de coordenadas.
Ambos procedimientos sern examinados a continuacin con los nombres de clculo analtico de la
regresin y clculo grfico de la regresin, respectivamente.

7. CLCULO ANALTICO DE LA REGRESIN

El clculo analtico de la regresin consiste en averiguar la ecuacin de la recta de regresin. Ello
permitir realizar predicciones en base a dicha ecuacin.
Una vez que se cuenta con un determinado conjunto de pares de valores obtenidos de la realidad, puede
determinarse la ecuacin de la recta que los representan por dos mtodos: el mtodo de los cuadrados
mnimos, y el mtodo de las desviaciones.
Antes de examinarlos, debe tenerse presente que la forma general de una ecuacin de una recta es y =
a + b.x (8). Determinar la ecuacin de la recta significa asignarle un valor al parmetro a y otro valor al
parmetro b. Los mtodos indicados tienen como fin determinar el valor de ambos parmetros.

a) Mtodo de los cuadrados mnimos.-

La ecuacin de la recta que tiene la forma y
1
= a + b . x
1
se obtiene averiguando los valores a y b. Una
vez obtenidos ambos valores, puede realizarse una prediccin cualquiera: a partir de x
1
como el valor
conocido, se puede predecir el valor de y
1
.
Las frmulas para el clculo de a y b son las siguientes:

x
y
Recta de regresin

Pgina 71 de 325
71
n E (x.y) E x . E y
b = ------------------------------
n E x
2
- (E x)
2


a = Y - b . X (donde Y y X son las respectivas medias aritmticas)

Como puede apreciarse, primero debe calcularse b, ya que para calcular a se requiere conocer b.

b) Mtodo de las desviaciones.-

La ecuacin de la recta se obtiene a partir de la siguiente expresin:

y = r . (S
y
/ S
x
) . (x - X) + Y

En esta ecuacin de la recta, la expresin r . (S
y
/ S
x
) se llama coeficiente de regresin.
Como puede apreciarse, la aplicacin del mtodo de las desviaciones requiere conocer las medias
aritmticas y los desvos estndar de X e Y. Tambin requiere conocer el coeficiente de correlacin r, para
lo cual resulta aqu recomendable utilizar la frmula nmero 1.

Ejemplo de prediccin en base a la ecuacin de la recta.- Si se dispone ya de una ecuacin de la recta,
ser muy sencillo hacer una prediccin del valor de y en funcin del valor de x.
En cambio, si debe hacerse esa prediccin a partir de una simple lista de pares de valores
correlacionados, primero deber obtenerse la ecuacin de la recta, para lo cual, a su vez si la idea es
aplicar el mtodo de las desviaciones- deben conocerse las medias aritmticas de x e y, los desvos
estndar de x e y, y la correlacin r entre x e y.
Considrese la siguiente lista de pares de valores ordenados:

Sujeto X (edad) Y (puntaje test)
A 2 55
B 3 60
C 5 65
D 6 80
E 6 85
F 8 75

A los efectos de poder obtener informacin sobre las medias aritmticas, los desvos estndar y el
coeficiente de correlacin (necesarios para calcular la ecuacin de la recta), se ampla la tabla anterior de
la siguiente manera:

Sujeto X (edad) Y (puntaje test) (X-X) (Y-Y) (X-X) (Y-Y)
A 2 55 -3 -15 45
B 3 60 -2 -10 20
C 5 65 0 -5 0
D 6 80 1 10 10
E 6 85 1 15 15
F 8 75 3 5 15
Total 30 420 --- --- 105

Aplicando la frmula correspondiente, se obtienen las medias aritmticas de X e Y (que son 5 y 70).
Aplicando la frmula correspondiente, se obtienen los desvos estndar de X e Y (que son 2 y 10.8).
Aplicando la frmula 1, se obtiene el coeficiente de correlacin (que es r = +0.81).
Finalmente, se obtiene la ecuacin de la recta utilizando el mtodo de loas desviaciones:

y = r . (S
y
/ S
x
) . (x - X) + Y
y = 0.81 (10.8 / 2) . (x 5) + 70

Esta expresin se transforma de manera tal que adopte la forma tpica de la ecuacin de la recta, con lo
cual se obtiene:

y = 47.85 4.43 . x

Una vez que se cuenta con la ecuacin de la recta, ahora s pueden hacerse predicciones. Por ejemplo, si
a un nio que 10 aos se le toma el test, cul ser el puntaje ms probable que obtendr?

y = 47.85 4.43 . x

Pgina 72 de 325
72
y = 47.85 4.43 . 10 = 92.15
y = 92.15

8. CLCULO GRFICO DE LA REGRESIN

El clculo grfico de la regresin consiste en trazar la recta de regresin en base a la ecuacin de la recta
obtenida en el clculo analtico. Ello permitir realizar predicciones en base a dicha recta trazada en el
diagrama de coordenadas cartesianas.
La recta de regresin, como toda recta, puede determinarse por dos puntos. Un punto es la ordenada al
origen, y el otro punto es la interseccin de las medias aritmticas de x e y. Este ltimo punto se llama
baricentro.
Tomando el ejemplo anterior, la ordenada al origen es 47.85, mientras que el baricentro queda
determinado por las medias aritmticas 5 y 70, con lo cual la recta de regresin ser la siguiente:



Ejemplo de prediccin en base a la recta del diagrama cartesiano.- Considerando solamente la recta
dibujada, puede hacerse una prediccin (mtodo grfico). Por ejemplo, si se sabe que x = 7, puede
predecirse que el valor de y ser 82 de la siguiente manera:


Error estndar de la prediccin.- En el ejemplo anterior la prediccin realizada es slo probable, lo que
significa que se est cometiendo algn error en la estimacin del valor y. Ello es as porque se ha
calculado el coeficiente de correlacin r y la ecuacin de la recta de regresin en base a una muestra (en
este caso de apenas seis sujetos) y con esta informacin se est intentando predecir un valor nuevo que
no est en la muestra, es decir, que pertenece a la poblacin. Adems, se est suponiendo (Kohan N,
1994:228) que la muestra ha sido tomada al azar, y que ambas variables se distribuyen normalmente.
Es posible estimar el error estndar cometido en base a la siguiente expresin:

o
est

y
= o
y
. \ 1 r
2


Esto es, el error estndar es igual al desvo estndar poblacional multiplicado por la raz cuadrada de la
diferencia entre 1 y el cuadrado del coeficiente de correlacin.
En el ejemplo anterior, el desvo estndar vala 10.8 y el coeficiente de correlacin vala 0.82.
Reemplazando, se obtiene:

o
est

y
= 10.8 . \ 1 0.82
2
= 6.2
Y

90
80
70
60
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8 9 10 X
Y

90
80
70
60
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8 9 10 X

Pgina 73 de 325
73

Esto significa que el valor de y predicho y = 82, estar en un 68% de los casos entre 82 6.2, es decir
entre 88.2 y 75.8. O si se quiere, hay un 68% de probabilidades que el valor de y se encuentre entre
88.2 y 75.8. Desde ya, tambin puede calcularse este intervalo de confianza en base a un 95% o un 99%
de probabilidades, en cuyo caso el intervalo de confianza deber ser mayor.

NOTAS

(1) Una distribucin de frecuencias bivariada es un conjunto de pares de valores, correspondientes a dos variables
observadas conjuntamente, con sus respectivas frecuencias. Cuando la distribucin se registra en una tabla de doble
entrada se obtiene una tabla de contingencia. En cada celda de esta tabla se indica la frecuencia con que se observ
cada par de valores.
(2) Algunos autores (por ejemplo Botella, 1993:183), clasifican en tres los casos posibles de relacin lineal entre
variables. a) Relacin lineal directa: se dice que dos variables X e Y mantienen una relacin lineal directa cuando los
valores altos en Y tienden a emparejarse con valores altos en X, los valores intermedios en Y tienden a emparejarse
con valores intermedios en X, y los valores bajos en Y tienden a emparejarse con valores bajos en X. Por ejemplo: la
relacin entre inteligencia y rendimiento. b) Relacin lineal inversa: se dice que dos variables X e Y mantienen una
relacin lineal inversa cuando los valores altos en Y tienden a emparejarse con valores bajos en X, los valores
intermedios en Y tienden a emparejarse con valores intermedios en X, y los valores bajos en Y tienden a emparejarse
con valores altos en X. Por ejemplo: la relacin entre tiempo y errores. c) Relacin lineal nula: se dice que hay relacin
lineal nula entre dos variables cuando no hay un emparejamiento sistemtico entre ellas en funcin de sus valores. Por
ejemplo: la relacin entre estatura e inteligencia.
(3) Otra forma de apreciar grficamente la correlacin es mediante el ngulo de correlacin: dadas las dos rectas y1
= a + b . x1 y x1 = a + b . y1 , el punto donde se intersectan se llama centroide. El ngulo entre ambas rectas se
llama ngulo de correlacin. Cuanto menor es este ngulo, ms correlacin hay (Kohan, 1994:224).
(4) Adems del clsico coeficiente "r" de Pearson, existen otros tambin destinados a medir el grado de asociacin
entre variables. En el esquema siguiente se resumen algunos ejemplos. No deben confundirse los coeficientes
derivados del coeficiente de Pearson, con estos otros coeficientes de correlacin, que en general fueron diseados de
manera diferente o para otros propsitos.

Nombre Condiciones de aplicacin
Coeficiente de Pearson Se aplica sobre variables cuantitativas (de intervalos iguales o de cocientes). Adems, las
variables deben estar distribuidas normalmente, o al menos tratarse de distribuciones
bastante simtricas respecto de la media.
Se llama tambin coeficiente de correlacin producto-momento de Pearson.
Coeficiente Q de Yule De fcil clculo e interpretacin como el anterior, pero su uso se limita a dos variables
nominales, con dos categoras cada una.
Coeficiente de
asociacin (gamma) de
Goodmann y Kruskal
Se utiliza sobre todo cuando son muchas observaciones y muy pocos valores ordinales
alcanzados por ellas. Se busca computando las concordancias e inversiones en las
ordenaciones que representan las dos variables y se aplica la frmula.
Coeficiente (Rho) de
Spearman
No es ms que el coeficiente de Pearson aplicado a variables ordinales.
Coeficiente Etha Utilizado para variables cuantitativas (de intervalos iguales o de cocientes), debe reunir dos
requisitos: que la curva de distribuciones sea bastante simtrica y unimodal, y que la
asociacin de variacin sea al menos aproximadamente rectilnea.
Coeficiente de
correlacin mltiple
Para correlacionar simultneamente ms de dos variables.
Coeficiente Phi Para variables nominales.

Otros coeficientes son: el Coeficiente (Tau) de Kendall (Kohan, 1994:260), el Coeficiente de Wilcoxon, el Coeficiente
de Flanagan, el Coeficiente de correlacin multiserial de Jaspe, el Coeficiente T de Tschuprow, el Coeficiente de
correlacin tetracrica (Kohan, 1994:281), etc.
Un ejemplo de aplicacin del Coeficiente Q de Yule (poco usado hoy en da) es el clculo de la correlacin entre dos
variables nominales con dos categoras cada una: por un lado sexo (masculino-femenino) y por el otro nivel de
ingresos (alto-bajo). Primero, se construye una tabla de doble entrada que organice la informacin obtenida en la
muestra. Por ejemplo:

Alto Bajo
Masculino A B
Femenino C D

Segundo, aplicar la frmula de Q:

A.D B.C
Q = ----------------
A.D + B.C

Los valores de Q varan entre -1 y +1 y se interpretan igual que el clsico coeficiente r de Pearson.
Eventualmente, tambin podr establecerse la significacin del coeficiente de correlacin obtenido recurriendo a la
prueba de t Student. La frmula de t que puede utilizarse lleva como numerador el producto de r por la raz
cuadrada de N-2 (N es el tamao de la muestra), y el denominador es la raz cuadrada de 1-r
2
.

Pgina 74 de 325
74
Todos los coeficientes de correlacin pueden aplicarse en psicologa, por ejemplo, en experimentos sobre el
aprendizaje, en la teora factorialista de Spearman, y en psicometra cuando por ejemplo debemos establecer el grado
de correlacin entre dos tests, o el grado de correlacin de un mismo test tomado en dos momentos diferentes.
(5) En algunos textos de estadstica se describen frmulas abreviadas para facilitar los clculos cuando se dispone de
un nmero grande de pares de valores. La disponibilidad actual de calculadoras de mesa y ordenadores personales
hacen innecesarias estas frmulas (Botella, 1993:193).
(6) La construccin de tests puede llevarse a cabo para realizar una investigacin ad hoc para la cual no hay
instrumentos de medicin conocidos, o bien para crear una prueba que pueda ser utilizada por otros en diferentes
circunstancias, aunque esto ltimo es ms raro en un mercado sobresaturado de pruebas psicomtricas y proyectivas
donde es realmente muy difcil posicionar un test que pueda representar una mejora respecto de los anteriores.
(7) Tambin puede ser una curva, pero en este artculo se describe solamente la regresin lineal, que se representa
mediante una recta.
(8) El valor a es la ordenada al origen, y el valor b es el coeficiente angular o pendiente de la recta, que equivale a
la tangente del ngulo alfa (formado por la recta y otra recta paralela a la absisa). La ecuacin de la recta tambin
puede representarse como x = a + b.y, en cuyo caso el parmetro a significar la absisa al origen. En este artculo no
se considerar esta segunda expresin por razones de simplicidad, y por cuanto la idea es poder predecir un valor y en
funcin de un valor x, y no un valor x en funcin de un valor y. As, la ecuacin y = a + b.x permite predecir cunto
valdr y en funcin de x, mientras que la ecuacin x = a + b.y permite predecir cunto valdr x en funcin de y.
Ambas rectas de regresin se cortan en un punto llamado centroide, y la correlacin entre las dos variables est dada
por el ngulo entre las dos rectas: si este ngulo vale 0, la correlacin es 1 (Kohan N, 1994:224).


CAPTULO 5: ESTADSTICA INFERENCIAL

1. INTRODUCCIN

A diferencia de la estadstica descriptiva, la estadstica inferencial va ms all de la mera descripcin de
la muestra por cuanto se propone, a partir del examen de sta ltima, inferir una conclusin acerca de la
poblacin, con un cierto nivel de confianza (o, complementariamente, con un cierto nivel de error).
Las muestras de las cuales se ocupa la estadstica inferencial son muestras probabilsticas, es decir,
aquellas en las cuales es posible calcular el error cometido al estimar una caracterstica poblacional
(Kohan N, 1994:144) (1).
Clsicamente, la estadstica inferencial se ocupa de dos cuestiones: la estimacin de parmetros y la
prueba de hiptesis, aunque por lo general, la mayora de las aplicaciones de la estadstica inferencial
pertenecen al rea de la prueba de hiptesis (Pagano, 1998:209).
De acuerdo al mismo autor (1998:155), en la estimacin de parmetros el investigador busca determinar
una caracterstica de la poblacin a partir de los datos de la muestra. Por ejemplo, tomando la variable
edad, podra concluir que la probabilidad de que el intervalo 4050 contenga la media de la poblacin es
de 0.95.
En cambio en la prueba de hiptesis, el investigador rene datos en una muestra para validar cierta
hiptesis relativa a una poblacin. Ejemplos: a) para validar la hiptesis de que la media poblacional no
tiene una diferencia significativa con la media muestral, toma ambas medias y las compara
estadsticamente mediante la prueba de la media; b) para validar la hiptesis de que en la poblacin el
mtodo de enseanza A es mejor que el B, el investigador toma dos muestras de alumnos y a cada uno
le aplica un mtodo de enseanza diferente. El tipo de conclusin que se busca aqu podra ser que las
mayores calificaciones en un grupo que en otro se deben al mtodo de enseanza aplicado y no al azar,
y, adems, que dicha conclusin no se aplica slo a la muestra sino a toda la poblacin.
En la estadstica inferencial se pueden hacer inferencias espaciales e inferencias temporales. Una
inferencia espacial implica suponer, a partir de la muestra, cmo es la poblacin total. Una inferencia
temporal es un caso especial donde, a partir de ciertos datos actuales podemos inferir o suponer ciertos
otros datos que podamos obtener en el futuro, vale decir una poblacin potencial.

2. ESTIMACIN DE PARMETROS

Esta tarea consiste en, partiendo de ciertos valores de la muestra llamados estadsticos o estadgrafos
(por ejemplo la media aritmtica muestral), inferir ciertos otros valores de la poblacin llamados
parmetros (por ejemplo la media aritmtica poblacional o esperanza).
Ello es as porque en general lo que interesa es la poblacin, no la muestra. Cuando un investigador
observa que en una muestra el 80% de las personas lee el diario, le interesar averiguar a partir de all
qu porcentaje o proporcin de la poblacin lee el diario, ya que por ejemplo su inters es editar un
nuevo peridico. De la misma forma, cuando un investigador observa que la media aritmtica muestral
de la frecuencia cardaca es 80 pulsaciones por minuto, le interesar averiguar si ello se cumple tambin
en la poblacin, ya que por ejemplo su inters puede ser comparar la frecuencia cardaca de sus
pacientes con toda la poblacin para decidir sobre su salud en base a un criterio estadstico.
Como puede verse, lo ms habitual es inferir medias aritmticas (promedios) y proporciones
(porcentajes). As, a partir de la media aritmtica muestral se infiere la media aritmtica poblacional, y a
partir de la proporcin observada en la muestra se infiere la proporcin en la poblacin.

Pgina 75 de 325
75
Existen dos tipos de estimacin de parmetros: la estimacin puntual y la estimacin intercalar (Pagano
R, 1998:304).
La estimacin puntual consiste en inferir un determinado valor para el parmetro. Por ejemplo, inferir
que la poblacin debe tener puntualmente una media aritmtica de 80.
La estimacin intervalar consiste en inferir dentro de qu intervalo de valores estar el parmetro con un
determinado nivel de confianza. Por ejemplo, inferir que la poblacin debe tener una media aritmtica
entre 75 y 83, con un nivel de confianza de 0.95 (esto es, hay un 95% de probabilidades de que el
parmetro poblacional se encuentre entre 75 y 93) o, si se quiere, con un nivel de riesgo (4) de 0.05
(esto es, hay un 5% de probabilidades de que el parmetro no se encuentre entre esos valores).
En general, resulta mucho ms riesgoso afirmar que el parmetro vale 80 que afirmar que vale entre 75
y 83. Por esta razn, se prefiere bajar este riesgo y establecer un intervalo de confianza, que podr ser
de 0.90, 0.95, 0.99, etc., segn elija el investigador.
Hay diferentes procedimientos de estimacin de parmetros, segn se trate de estimar medias o
proporciones, o segn se trate de estimar parmetros de variables cualitativas (con dos categoras o con
ms de dos categoras) o cuantitativas. En lo que sigue se dan algunos ejemplos combinados.

Estimacin de la media poblacional para variables cuantitativas.- Conociendo la media muestral, es
posible averiguar con un cierto nivel de confianza (por ejemplo 0.95), entre qu valores de la variable
estar la media poblacional. Estos valores se llaman lmite superior del intervalo (Ls) y lmite inferior del
intervalo (Li).
Para obtener ambos valores se utilizan las siguientes frmulas:

Ls = X + z . (S / \ n)

Li = X - z . (S/ \ n)
Donde:

Ls = Lmite superior del intervalo de confianza.
Li = Lmite inferior del intervalo de confianza.
X = Media aritmtica muestral.
S = Desvo estndar muestral.
n = Tamao de la muestra. Si se trata de una muestra chica (menor a 30) se
considera n-1.
(S / \ n) = Desvo estndar poblacional. Cuando no tenemos el desvo estndar
de la poblacin (hecho muy frecuente) se utiliza el desvo muestral (Rodrguez
Feijo N, 2003).
z . (S/ \ n) = Error muestral o estndar (error que puede cometerse al inferir la
media poblacional) (3).
z = Puntaje estandarizado que define el nivel de confianza. Si se desea un nivel
de confianza de 0.90, debe consignarse z = 1.64. Si se desea un nivel de
confianza de 0.95, debe consignarse z = 1.96. Si se desea un nivel de confianza
de 0.99, debe consignarse z = 2.58. Para valores intermedios de nivel de
confianza, pueden consultarse las tablas de reas de z (ver captulo sobre
probabilidad y curva normal).

Ejemplo (Rodrguez Feijo N, 2003).- En una muestra probabilstica de 600 nios de 10 aos de Capital
Federal el cociente intelectual promedio obtenido fue de 105 con una desviacin estndar de 16. Con un
intervalo de confianza del 95%, entre qu lmites oscilar el CI promedio de los nios de 10 aos de
Capital Federal?
Ls = X + z . (S / \ n) = 105 + 1.96 (16 / \ 600) = 106.27
Li = X - z . (S/ \ n) = 105 - 1.96 (16 / \ 600) = 103.73
Respuesta: con un riesgo de 5% de equivocarse en la estimacin, el CI promedio de los nios de 10 aos
de Capital Federal oscila entre 103.73 y 106.27 puntos.

Estimacin de proporciones para variables cualitativas de dos categoras (Kohan N, 1994:166).-
Conociendo la proporcin muestral, es posible averiguar con cierto nivel de confianza (por ejemplo 0.99)
entre qu proporciones estar la proporcin poblacional. Tngase presente que una variable con dos
categoras es una variable que tiene solamente dos posibilidades de variacin (por ejemplo: el sexo).
Para obtener los lmites superior e inferior del intervalo de confianza, se utilizan las siguientes frmulas:

Ls = p + z . (\ p . q /
n)

Li = p - z . (\ p . q / n)

Nota: La raz cuadrada
afecta a p, q y n.
Donde:

Ls = Lmite superior del intervalo de confianza.
Li = Lmite inferior del intervalo de confianza.
p = Proporcin muestral
z = Puntaje estandarizado que define el nivel de confianza. Si se desea un
nivel de confianza de 0.90, debe consignarse z = 1.64. Si se desea un nivel de
confianza de 0.95, debe consignarse z = 1.96. Si se desea un nivel de
confianza de 0.99, debe consignarse z = 2.58. Para valores intermedios de

Pgina 76 de 325
76
nivel de confianza, pueden consultarse las tablas de reas de z (ver captulo
sobre probabilidad y curva normal).
q = Proporcin que falta para llegar al 100%. Por ejemplo: si p es 65%,
entonces q = 35%).
n = Tamao de la muestra. Si se trata de una muestra chica (menor a 30) se
considera n-1.

Ejemplo.- En una muestra probabilstica de 100 personas, el 20% son masculinos. Con un intervalo de
confianza del 99%, entre qu proporciones oscilar el porcentaje de masculinos en la poblacin?
Ls = 20% + 2.58 . (\ 20 . 80 / 100) = 30.3%
Li = 20% 2.58 . (\ 20 . 80 / 100) = 9.7%
Respuesta: con un riesgo de 1% de equivocarse en la estimacin, la proporcin de masculinos en la
poblacin oscila entre el 9.7% y el 30.3%.

3. PRUEBA DE HIPTESIS

Las pruebas de hiptesis se utilizan para probar alguna hiptesis en investigacin cientfica (10). Cuando
el investigador propone una hiptesis, su deseo ser poder confirmarla (porque l mismo la propuso o
porque cree intuitivamente en ella). Si decide hacer una prueba estadstica para salir de dudas, entonces
realizar una prueba de hiptesis y establecer dos hiptesis estadsticas: su propia hiptesis, a la que
convertir en hiptesis alternativa, y la opuesta, que llamar hiptesis nula, y la tarea consistir en
intentar probar esta ltima. Si la rechaza, aceptar la alternativa, y si la acepta, rechazar la alternativa
(7).
Existe una gran variedad de pruebas de hiptesis, pero todas ellas tienen en comn una determinada
secuencia de operaciones, que son las siguientes:

1) Formulacin de la hiptesis de investigacin y obtencin de los datos.- El investigador comienza
formulando la hiptesis que pretende probar. Por ejemplo, que una determinada droga cura una
enfermedad. Luego, disea un experimento y lo ejecuta para obtener datos que permitan aceptar o no la
hiptesis. Por ejemplo, administra la droga a un grupo y al otro no, para comparar los resultados.
Estrictamente, este primer paso no forma parte de la prueba estadstica de la hiptesis pero es una
condicin necesaria para realizarla, y ello por tres motivos: a) si no hay datos empricos, no puede
realizarse ningn estudio estadstico, del mismo modo que si no hay combustible, el motor no funcionar;
b) si los datos obtenidos en el experimento o en la observacin son lo suficientemente convincentes como
para aceptar o rechazar la hiptesis de investigacin, no ser necesario emplear una prueba estadstica
de hiptesis, con lo cual, este primer paso permite decidir si cabe o no aplicarla, an cuando se sepa que
en la inmensa mayora de los casos s cabe hacerlo. Por ejemplo, si el 100% de los pacientes tratados
con una droga se cura, mientras que el 100% de los pacientes no tratados sigue enfermo, es posible
concluir, sin la ayuda de la estadstica, que cabe aceptar la hiptesis de investigacin segn la cual la
droga cura. Sin embargo, en la realidad no suelen obtenerse datos tan auspiciosos, por lo que se requiere
una prueba estadstica; y c) para obtener datos se utiliza un determinado diseo de investigacin, y la
eleccin de la prueba estadstica de hiptesis ms adecuada depender del tipo de diseo de
investigacin utilizado.
En suma, es importante saber qu diseo est usando el investigador, cules son las variables que puede
controlar y en funcin de esto buscar la prueba estadstica adecuada (Kohan, 1994:357).

2) Formulacin de la hiptesis alternativa y la hiptesis nula.- Si la prueba estadstica resulta necesaria,
la hiptesis de investigacin es reformulada en trminos estadsticos, obtenindose la hiptesis
alternativa (Ha). A continuacin, se formula, en los mismos trminos, la hiptesis nula (Ho), que es la
opuesta de la alternativa. Ambas reformulaciones incluyen consideraciones del tipo hay o no hay una
diferencia significativa entre.
Por ejemplo, si la hiptesis de investigacin sostiene que la droga cura, la hiptesis alternativa dir que
hay una diferencia significativa entre los resultados del grupo de pacientes tratado y el grupo de
pacientes no tratado. Por lo tanto, la hiptesis nula sostendr que no hay una diferencia significativa
entre ambos grupos. En este caso, adems, la Ha plantea un cambio (la droga cura), mientras que la Ho
plantea la permanencia de un estado (la droga no cura).

Lo que siempre se intentar probar es la hiptesis nula para un determinado nivel de significacin o de
riesgo. Si rechazamos la hiptesis nula aceptamos la alternativa, y si no rechazamos la hiptesis nula,
rechazamos la alternativa, ya que ambas son mutuamente contradictorias (8).
Al estimar parmetros o probar hiptesis pueden cometerse errores. Suelen describirse dos tipos de
errores (Kohan N, 1994:178):
El error Tipo I consiste en rechazar la hiptesis nula cuando en realidad es verdadera. O sea, creer que la
muestra NO es representativa de la poblacin, cuando s lo es. Es el error del desconfiado.
El error Tipo II consiste en aceptar la hiptesis nula cuando en realidad es falsa. O sea, creer que la
muestra SI es representativa de la poblacin, cuando no lo es. Es el error del ingenuo.

Pgina 77 de 325
77
La probabilidad de cometer el error I se simboliza con la letra griega alfa (o), y la probabilidad de
cometer el error II se simboliza con la letra griega beta (|) (Kohan N, 1994:185).
Estos errores no son errores que cometan inadvertidamente los investigadores. Como la hiptesis nula se
rechaza o se acepta en base a determinado nivel de significacin o de riesgo de equivocarse, siempre
habr algn riesgo de error, que podr ser mayor o menor segn el nivel de riesgo elegido, pero que no
obliga necesariamente a invalidar los resultados. Debe tenerse presente que siempre que se concluya
algo sobre la poblacin a partir de la muestra, el procedimiento estar teido de algn grado de
incertidumbre, es decir, siempre habr algn grado de probabilidad de cometer alguno de los dos tipos de
errores.

3) Seleccin de la prueba de hiptesis ms adecuada.- Qued dicho que hay una gran cantidad de
pruebas de hiptesis y su eleccin depende de la hiptesis alternativa que se formule, del nmero de
casos examinados, del nivel de medicin utilizado, etc (Kohan N, 1994:176). Por ejemplo, a) si la
hiptesis es direccional (es decir, especifica una relacin de mayor que o bien una relacin de menor
que), se utilizar una prueba de hiptesis de una cola, mientras que si la hiptesis es no direccional
(indica una relacin de diferente a), se utilizar una prueba de hiptesis de dos colas (11); b) si se
conoce el desvo estndar poblacional, puede aplicarse la prueba z, mientras que si solamente se conoce
el desvo estndar muestral, se aplicar la prueba t de Student; c) si se opera con variables medidas en
un nivel nominal, puede utilizarse la prueba de chi cuadrado; si se trabaja con muestras muy pequeas
(por ejemplo de 5 a 10 datos), la prueba t de Student es til. Seala Vessereau que se trata de un aporte
importante por cuanto durante mucho tiempo se ha credo que era imposible sacar buen partido de las
muestras muy pequeas (Vessereau A, 1962:33); d) La prueba ANOVA (anlisis de varianza): as como
se pueden comparar las medias de dos muestras, existen pruebas que permiten confrontar su
variabilidad (varianza o desviacin tpica). Estas pruebas sirven, entre otras, para resolver los problemas
siguientes: 1) Reconocer si un grupo de muestras es homogneo; y 2) determinar, en la variabilidad de
una poblacin de medidas, la parte que corresponde al azar y la que debe atribuirse a causas de
variacin sistemticas, llamadas causas controladas o asignadas (Vessereau A, 1962:38).

4) Determinacin del nivel de significacin.- El nivel de significacin o es la probabilidad de rechazar Ho
siendo esta verdadera (error tipo I). Cada investigador elige su nivel de significacin, es decir, su
probabilidad de equivocarse en el sentido indicado. Por ejemplo, puede elegirse un 5% o un 1% de
probabilidad de error (o, lo que es lo mismo, un 95% o un 99% de probabilidad de no equivocarse).
Seala Kohan (1994:177) que el nivel de significacin elegido depender de la importancia prctica de la
investigacin. Por ejemplo, para un estudio sobre los efectos de una droga en el sistema nervioso se
usar un nivel de significacin muy bajo, como por ejemplo un 0.01%, lo que minimiza al extremo su
probabilidad de producir intoxicacin.
Lo usual es especificar un nivel de significacin o (probabilidad de cometer el error tipo I) y no el nivel de
significacin | (probabilidad de cometer el error tipo II).
Una aclaracin ms detallada del concepto de significacin estadstica puede consultarse ms adelante en
este mismo captulo.

5) Determinacin del tamao de la muestra.- En principio, el tamao de la muestra n ya fue determinado
en el momento de elegir y ejecutar el diseo de investigacin: cuanto mayor haya sido el tamao de la
muestra elegido, menor ser el error de o (Kohan, 1994:178). Sin embargo, tambin puede procederse
al revs: si se elige un determinar nivel o, puede determinarse por medios matemticos el tamao de la
muestra n adecuado a ese nivel (Kohan N, 1994:181-185). As, por ejemplo, en general si el investigador
desea un menor margen de error, deber aumentar el tamao de la muestra.
Adems del tamao de la muestra, debern tambin determinarse la curva operativa caracterstica
(Kohan N, 1994:180) y el poder de eficiencia de la prueba (o tambin potencia), definido este ltimo
como la probabilidad de rechazar la hiptesis nula cuando es realmente falsa. Por consiguiente, el poder
de eficiencia se define como 1 - |, es decir, 1 menos la probabilidad del error II (no rechazar la hiptesis
nula cuando es realmente falsa) (Kohan N, 1994:185). Tngase presente:

o Nivel de error tipo I Es la probabilidad de cometer el error tipo I.
Probabilidad de rechazar la Ho cuando es verdadera.
1 - o Nivel de confianza Es la probabilidad de NO cometer el error tipo I.
Probabilidad de NO rechazar (aceptar) la Ho cuando es verdadera.
| Nivel de error tipo II Es la probabilidad de cometer el error tipo II.
Probabilidad de NO rechazar (aceptar) la Ho cuando es falsa.
1 - | Nivel de confianza Es la probabilidad de NO cometer el error tipo II.
Probabilidad de rechazar la Ho cuando es falsa. Se llama poder de
eficiencia o potencia de la prueba.

6) Determinacin de la distribucin muestral de la prueba estadstica para Ho.- Seala Kohan (1994:186-
187) que cuando un investigador eligi una prueba estadstica, necesita saber cul es su distribucin
muestral, que es una distribucin terica que se obtendra si se sacaran al azar todas las muestras

Pgina 78 de 325
78
posibles del mismo tamao de una poblacin (12). El conocimiento de esta distribucin muestral permite
estimar la probabilidad de la ocurrencia de ciertos valores.

7) Definicin de la zona de rechazo.- Sobre la base de los puntos 3, 4, 5 y 6 deber ahora establecerse la
zona de rechazo de la Ho. Para una mejor comprensin de este concepto, se puede trazar una lnea
horizontal sobre la cual se podrn definir las zonas de rechazo y de no rechazo de la Ho. En esa lnea
horizontal se indicarn valores que van desde -3 hasta +3, pasando por el 0 (cero). Estos valores
corresponden a puntajes estandarizados, como por ejemplo z, si la prueba estadstica elegida es la
prueba z, o t, si la prueba elegida es la prueba t de Student:



Las zonas de rechazo se definirn segn se trate de pruebas de hiptesis de una cola (hiptesis
direccionales) o de dos colas (hiptesis no direccionales), segn el siguiente esquema:



Para determinar una zona de rechazo (o tambin zona crtica) es preciso indicar un determinado valor de
z (o de t) que sirva para delimitar la zona de rechazo (o) de la zona de aceptacin (1 - o). Ese valor
recibe el nombre de z terico, z crtico o punto crtico, que se calcula en base a una tabla de z (o de t)
y en base al nivel de significacin elegido.
Existe una relacin bsica entre o, | y el tamao de muestra n. Puesto que o es la probabilidad de que la
estadstica de prueba (por ejemplo el z emprico) caiga en la regin de rechazo, un incremento en el
tamao de esta regin aumenta o, y simultneamente disminuye |, para un tamao de muestra fijo. El
reducir el tamao de la regin de rechazo disminuye o y aumenta |. Si se aumenta el tamao de muestra
entonces, se tiene ms informacin en la cual basar la decisin y ambas o y | decrecern.

8) Decisin final (6).- Si el dato emprico (llamado z emprico) obtenido cae dentro de la zona de
rechazo, se rechaza la Ho y por tanto se acepta la Ha. En cambio, si el dato cae fuera de esta zona de
rechazo, no se rechaza (se acepta) la Ho, siempre para un nivel de significacin elegido (Kohan N,
1994:189). Por ejemplo:

z
z
Prueba de una cola a
la izquierda
z
Prueba de una cola a
la derecha
Prueba de dos colas
Zona de rechazo Zona de aceptacin
Zona de rechazo Zona de aceptacin
Zona de rechazo Zona de rechazo Z de aceptacin
-3 -2 -1 0 +1 +2 +3
z
-3 -2 -1 0 +1 +2 +3
t

Pgina 79 de 325
79


En este ejemplo, se puede apreciar que el z terico delimita las zonas de rechazo y aceptacin de la Ho.
Como de los datos del experimento result un z emprico ubicado dentro de la zona de rechazo, se decide
rechazar la Ho y, por lo tanto, se acepta la Ha.

Sintticamente, el procedimiento bsico general para realizar las pruebas de hiptesis con z o t es el
siguiente:
1) Se hace un listado con los datos disponibles: tamao de la muestra, media muestral, desvo
poblacional (o desvo muestral si no est el desvo poblacional: en el primer caso se aplica z, y en el
segundo t), el nivel de significacin alfa, y el nmero de colas (una cola a la izquierda o a la derecha en
hiptesis direccionales del tipo menor que o mayor que; dos colas en hiptesis no direccionales).
2) Se dibuja la curva normal y se marca el valor o los valores de z crtico (o t crtico), rayando la parte
correspondiente.
3) Se calcula el z o t emprico (por frmula).
4) Se calcula el z o t crtico (por tabla).
5) Se indica en el dibujo el z o y emprico. Si cae dentro de la zona rayada o crtica, se rechaza la
hiptesis nula, y si cae fuera de la zona rayada o crtica, no se rechaza la hiptesis nula.

4. EJEMPLOS DE PRUEBAS DE HIPTESIS

Existe una enorme cantidad de tipos de pruebas de hiptesis, adaptables a diversas necesidades y
objetivos. En lo que sigue se suministran ejemplos de algunas de las pruebas ms frecuentes.

1) Prueba de la media.- Aqu no hay que estimar un intervalo para la media poblacional (como en la
estimacin de parmetros), sino probar la hiptesis segn la cual no hay diferencia estadsticamente
significativa entre la media poblacional y la muestral. Esta prueba, llamada tambin prueba de la media,
se entiende cabalmente a partir de un conocimiento mnimo sobre distribucin muestral y teorema
central del lmite (12).
Existe una gran diversidad de pruebas de la media, segn que se conozca o no se conozca el desvo
estndar poblacional (en cuyo caso se utiliza una prueba z o una prueba t, respectivamente), segn que
la hiptesis sea direccional (prueba de una cola) o no direccional (prueba de dos colas), y segn se
aplique a una sola muestra (Pagano R, 1998:293) o a dos muestras (Pagano R, 1998:317).

Ejemplo.- Se supone que la estatura media de la poblacin de alumnos de una universidad es menor que
1.68 m, y su desvo estndar poblacional es de 0.10 m. Se cuenta con una muestra de 36 alumnos, con
una media muestral de 1.65 m. Probar la hiptesis con un nivel de significacin o riesgo del 5%.

Resolucin.- a) En primer lugar convendr ordenar los datos que suministra el problema:

Tamao de la muestra (n) = 36. Media aritmtica de la poblacin () = 1.68 m.
Media aritmtica de la muestra (X) = 1.65 m. Desvo estndar de la poblacin (o) = 0.10 m.
Nivel de significacin (o) = 5% = 0.05.

b) En segundo lugar, se establecen la hiptesis alternativa y la hiptesis nula.
La hiptesis alternativa (Ha) sostiene que la media poblacional es menor que 1.68 m, o sea < 1.68 m.
Ntese que, primero, la Ha siempre se refiere a la poblacin, no a la muestra; segundo, es la hiptesis
deseable por el investigador y por tanto la que se quiere probar; tercero, en este caso particular la
hiptesis se refiere a una permanencia, no a un cambio, ya que sostiene que la estatura media
poblacional sigue siendo menor que 1.68 m. a pesar de la muestra, que parece sugerir lo contrario; de
esto ltimo se desprende, en cuarto lugar, que la muestra no sera representativa de la poblacin, es
decir, la diferencia entre muestra y poblacin sera significativa y en este caso debida al azar.
La hiptesis nula (Ho) sostiene que la media poblacional es igual a 1.68 m, o sea = 1.68 m.
Estrictamente hablando la Ho, por ser la opuesta a la Ha, debera proponer > 1.68 m, pero en la
prctica se utiliza la igualdad.
z
Zona de
rechazo de la
Ho
Zona de aceptacin de la Ho
z terico = -
1.65
z emprico = -
1.80

-1.65 -1.80

Pgina 80 de 325
80
La hiptesis nula (Ho) sostiene que la diferencia entre la media muestral y la media poblacional no es
estadsticamente significativa para el nivel de significacin del 5%, o sea, la muestra es representativa de
la poblacin.

2) Se calcula el z emprico mediante la siguiente frmula:

X - 1.65 1.68
ze = -------------- = ------------------ = - 1.8
o / \ n 0.10 / \ 36

3) Se calcula el z terico mediante la tabla de z para un nivel de significacin del 5%. Como se trata de
una hiptesis alternativa direccional que especifica una direccin de menor que, se emplea la tabla de
reas de z hacia la izquierda (ver apndice).
Puesto que se pide un nivel de significacin del 5%, traduciendo este valor a probabilidades obtenemos
0.05. A continuacin, se busca el valor de z que corresponde aproximadamente a esa probabilidad. Hay
dos valores que se aproximan idnticamente: 0.0505 y 0.0495. Eligiendo arbitrariamente el primero, se
obtiene:

zt = -1.64

4) Se define la zona de rechazo mediante zt y se indica el valor de ze:


5) Como ze cae dentro de la regin de rechazo o regin crtica, entonces se rechaza la Ho, y por lo tanto,
se acepta la Ha segn la cual la estatura media poblacional es menor que 1.68 m. En este caso se puede
estar cometiendo un error tipo I, es decir, rechazar la Ho cuando es verdadera, con una probabilidad de o
= 0.05 (o si se quiere, existe una probabilidad del 5% de estar rechazando la Ho cuando es verdadera).

2) Prueba de hiptesis de correlacin (13).- La prueba de hiptesis que permite estudiar la significacin
de una correlacin entre dos variables intenta probar la hiptesis nula que sostiene que la correlacin
entre las dos variables ser cero en la poblacin origen. Las hiptesis estadsticas de esta prueba son:
Ho) = 0
Ha) = 0
La significacin del coeficiente de correlacin se estudia por medio de la distribucin t de Student. Para
ello se obtiene el valor de:

que se sita bajo la distribucin t (n-2,o).

Ejemplo.- Sean, a efectos didcticos, las siguientes seis observaciones obtenidas en dos variables X e Y:

X Y
10
10
12
12
14
16
13
16
12
17
15
15

Resolucin.- Aplicando la expresin del coeficiente de correlacin lineal de Pearson, se obtiene r =
0.1225.
Si se quiere contrastar la hiptesis nula Ho) = 0, se deber estudiar la significacin del valor r obtenido.
Para estudiar su significacin se debe transformar, en primer lugar, el valor de la correlacin en un valor
t (t emprico) y, en segundo lugar, comparar dicho valor con el valor de las tablas de la t de Student (t
terico) con n-2 grados de libertad (ver Tabla t en Anexo).

z
Zona de
rechazo de la
Ho
Zona de aceptacin de la Ho
z terico = -
1.64
z emprico = -
1.8

-1.64 -1.8

Pgina 81 de 325
81


El valor proporcionado por las tablas es t (4, 0.05)= 2.776.
As, puesto que el valor obtenido es inferior al de las tablas se concluye que los datos no aportan
informacin para rechazar la hiptesis nula Ho en funcin de la cual las dos variables no estn
correlacionadas en la poblacin origen de la muestra.

Panorama final.- El siguiente cuadro describe algunas de las principales pruebas de hiptesis:

Prueba H (0) H (A) Zona de
rechazo
Valor emprico
(se calcula por
frmula)
Valor crtico
(se calcula
por tabla)
z
Puntaje reducido.
Se utiliza cuando se
conoce el desvo
poblacional.
= x < x A la izquierda
del punto
crtico (una
cola a la
izquierda)
z =
Numerador:
media muestral
menos media
poblacional.
Denominador:
desvo
poblacional
dividido por la
raz cuadrada de
n.
Calcular por
tabla en base
a o
= x > x A la derecha
del punto
crtico (una
cola a la
derecha)
1 = 2 1 2 Dos colas
t (n-1)
t de Student con n-1
grados de libertad.
Se utiliza cuando se
desconoce el desvo
poblacional pero s el
desvo muestral (s).
= x < x A la izquierda
del punto
crtico (una
cola a la
izquierda)
t =
Numerador:
media muestral
menos media
poblacional.
Denominador:
desvo muestral
s dividido por la
raz cuadrada de
n.
Calcular por
tabla en base
a o y a n-1
= x > x A la derecha
del punto
crtico (una
cola a la
derecha)
1 = 2 1 2 Dos colas
X
2

Chi cuadrado.
Busca si hay diferencia
significativa entre
muestra y poblacin.
Slo para variables
cualitativas.
f (0) = f (e) f (0) f (e) A la derecha
del punto
crtico (una
cola a la
derecha)
X
2
= Sumatoria
de
Numerador:
cuadrado de la
diferencia entre
f (0) y F (e)
Denominador: F
(e)

Calcular por
tabla en base
a o y a k-1
F
F de Snedecor o
ANOVA.
Busca si hay
diferencias
significativas entre
medias de muestras o
poblaciones.
Busca decidir si la
variacin entre
tratamientos prevalece
sobre la variacin
aleatoria.
1 = 2 =
3
1 2 3

(o al menos
dos
distintas)
A la derecha
del punto
crtico (una
cola a la
derecha)
F =
Numerador:
variancia entre
grupos.
Denominador:
variancia en
cada grupo.
(F se calcula por
computadora).
Calcular por
tabla en base
a o, a k-1 y a
n-k

z y t corresponden a distribuciones normales.
X
2
y F corresponden a distribuciones asimtricas a la izquierda.

Smbolos:
x = Valor de la media poblacional.
= Media poblacional o esperanza.
n = Tamao de la muestra.
o = Nivel de significacin.

Pgina 82 de 325
82
n-1 = Grados de libertad.
F (0) = Frecuencia observada.
F (e) = Frecuencia esperada.
k-1 = Grados de libertad (N de categoras menos uno).
n k = Grados de libertad.
ANOVA = Anlisis de la variancia. La variancia entre grupos consiste en las distintas respuestas de la VD ante la
aplicacin de los distintos niveles de la VI. La variancia en cada grupo consiste en las generadas por las diferencias
individuales y otras eventualidades del experimento. Por ejemplo, esta prueba permite indagar si el aerobismo o la
caminata mejoran el funcionamiento cardiovascular. La hiptesis nula considera aqu que no hay diferencias en cuanto
a funcionamiento cardiovascular entre el grupo aerbico, el grupo caminante y el grupo control (1 = 2 = 3).

5. EL CONCEPTO DE SIGNIFICACIN ESTADSTICA

En este tem se ofrecen mayores detalles este importante concepto de la estadstica inferencial, con un
tercer ejemplo de prueba de hiptesis.
Uno de los fines de la estadstica inferencial consiste en determinar si la diferencia entre dos conjuntos de
datos es o no significativa. En el contexto de la investigacin cientfica, ambos conjuntos de datos pueden
consistir en dos muestras (por ejemplo entre el grupo experimental y el grupo de control), o bien entre
una muestra y una poblacin de la que fue extrada.

1) Diferencia entre muestras.- Cuando la investigacin incluye un diseo experimental, es sabido que las
muestras (entonces designadas como grupo experimental y grupo de control), en general exigen un
tratamiento estadstico antes y despus de la manipulacin, es decir, antes y despus de su exposicin a
la influencia de la variable experimental x.

a) Antes de aplicar x lo que se exige es que no haya diferencias significativas entre los grupos
experimental y de control, tanto en lo referente a x como en las variables de control (es decir a las
variables extraas relevantes que requieren ser controladas).
b) Despus de aplicar x, lo que se espera como deseable (para aceptar la hiptesis de investigacin)
es que haya diferencias significativas en cuanto a x entre ambos grupos. La teora de las muestras
(2) es til para poder determinar si las diferencias observadas entre dos muestras son realmente
debidas al azar o si son significativas, lo que puede llevar a un proceso de toma de decisiones gracias
a las pruebas de hiptesis y de significacin que se pueden hacer (Kohan N, 1994:144).

2) Diferencia entre muestra y poblacin.- Queda, no obstante, otra tarea adicional para la estadstica
inferencial: establecer si las conclusiones obtenidas para la muestra experimental, luego de la exposicin a
x, pueden extenderse lcitamente a toda la poblacin, habida cuenta de que la ciencia busca un
conocimiento vlido y universal. Esta tarea es lo que Kohan describe como probar hiptesis vlidas para la
poblacin correspondiente, conociendo la informacin de las muestras (Kohan N, 1994:144). La misma
autora indica que para que las conclusiones que se obtienen a partir de las muestras sean vlidas, stas
deben ser representativas de la poblacin.

El objetivo de este tem es explicar con un ejemplo de qu manera se puede alcanzar el objetivo 1b, es
decir, como se puede probar si hay o no diferencias significativas entre un grupo experimental y un grupo
de control.
Los resultados de un experimento requieren un tratamiento estadstico que permita orientar al
investigador acerca de si la hiptesis de investigacin debe ser rechazada o no rechazada, para lo cual
deber establecer convencionalmente un determinado nivel de significacin que permita diferenciar
resultados estadsticamente significativos de resultados estadsticamente no significativos. Seguidamente
se explica en detalle esta aseveracin.

En los informes de investigacin suelen aparecer expresiones del tipo "los resultados del experimento son
estadsticamente significativos". Seguidamente se aclarar en forma intuitiva qu quiere decir esto,
siguiendo los lineamientos didcticos de Len y Montero (1995:105-130).
Supngase un sencillo experimento, donde se trata de probar si un choque emocional altera o no el
recuerdo de los sucesos inmediatamente anteriores al mismo.
Para ello, se tomaron dos grupos de estudiantes: el grupo experimental presenci una pelcula donde
haba una escena violenta, y el grupo de control presenci la misma pelcula pero sin la escena violenta.
Los resultados fueron los siguientes: el grupo sometido al choque emocional lograba luego recordar un
promedio de 10, mientras que el grupo sin choque emocional lograba recordar ms sobre las escenas del
film: por ejemplo, un promedio de 15. Esquemticamente:

Grupo Choque
emocional
Recuerdo
Grupo I (vieron escena violenta) SI 10
Grupo II (no vieron escena violenta) NO 15


Pgina 83 de 325
83
Lo que debe ahora establecerse es si esta diferencia en los recuerdos entre 10 y 15 es o no significativa,
es decir, si va o no ms all del simple azar. Si se concluye que NO es significativa, entonces las
diferencias entre 10 y 15 se deben al azar, pero si se concluye que SI es una diferencia significativa,
entonces no debe descartarse la influencia del choque emocional sobre la memoria. La expresin
'significativa' quiere decir una diferencia lo suficientemente grande como para pensar que el choque
emocional influye sobre los recuerdos.
En principio, para averiguar si la diferencia es o no significativa, puede apelarse a dos procedimientos,
que podran llamarse el procedimiento intuitivo y el procedimiento estadstico.
a) El procedimiento intuitivo es muy simple: se advierte que la diferencia entre ambos grupos es 15-
10=5, y entonces se piensa: "evidentemente, hay una diferencia significativa". Si ambos grupos hubiesen
obtenido 15, se pensara que no habra diferencia significativa y entonces se concluira que el choque
emocional no influye sobre el recuerdo.
Como puede notarse, este procedimiento intuitivo tiene el problema de la subjetividad en la estimacin
de los resultados. Tal vez para otro investigador no hubiese sido significativa la diferencia de 5 sino una
diferencia mayor, como por ejemplo 8. Ambos investigadores polemizaran fundamentando sus
argumentaciones sobre la base de simples impresiones o creencias, es decir, jams llegaran a un
acuerdo, y, en el mejor de los casos, acordaran buscar un procedimiento ms objetivo. En este caso
contrataran a un tcnico en estadstica para que hiciera una estimacin como la que ahora se pasa a
explicar.
b) El procedimiento estadstico es ms complejo que el anterior: en lugar de intentar averiguar si la
diferencia entre las promedios 15 y 10 es "intuitivamente significativa", lo que intentar probar es si la
diferencia es "estadsticamente significativa".
Cabe aqu anticipar algo que sealan Len y Montero: "Encontrar una diferencia de valores que no es
estadsticamente significativa equivale a decir que esa diferencia la hemos encontrado por casualidad. O
lo que es lo mismo, si repitiramos el proceso, el promedio de diferencias encontradas sera cero".
Qu significa esta ltima expresin? Significa que si se hicieran otros experimentos con otros grupos,
puesto que las diferencias que se obtienen obedecen a la casualidad, una vez se podra encontrar una
diferencia de 5, otra vez una diferencia de 3, otra vez una diferencia de -4, etc., es decir, saldran
nmeros al azar cuyo promedio tendera a cero, puesto que si dicho promedio tendiese a 5, entonces los
resultados ya podran ser pensados como significativos.

A partir del ejemplo, se puede ahora examinar el concepto de significacin estadstica, central dentro de
la teora de las muestras (5).
Len y Montero proponen imaginar por un momento una variante del experimento anterior, donde
ninguno de los dos grupos fue expuesto al choque emocional, es decir, ambos grupos vieron la misma
pelcula sin la escena violenta.
Desde ya, este experimento carece de sentido, porque lo que interesa es ver si hay o no diferencias entre
dos grupos en lo concerniente a capacidad de recordar, sometidos cada uno a 'diferentes' condiciones
experimentales (uno vio la escena violenta y el otro no). Sin embargo, analizar lo que sucedera en este
experimento imaginario resultar til para entender la idea de significacin estadstica, como enseguida
se ver.
En este experimento imaginario, puesto que ambos grupos no recibieron el estmulo violento, es
esperable que los rendimientos mnmicos sean iguales, o por lo menos aproximadamente iguales, porque
siempre cabe la posibilidad de la intervencin de pequeas variables no controladas.
Repitiendo varias veces el experimento, una vez podramos obtener una diferencia de 0, otra vez una
diferencia de 0.5, otra vez una diferencia de -1, etc. Si el experimento se repitiese diez mil veces, es
razonable pensar que habra muy pocos casos donde la diferencia fuese muy extrema (por ejemplo 7 o -
7), y muchos casos prximos a una diferencia de 0. Las diferencias obtenidas en los diez mil
experimentos podran resumirse, segn este criterio, en la tabla 1.

Tabla 1

Diferencias entre los 2
grupos
Cantidad de experimentos
(frecuencias)
7 5
6 25
5 90
4 280
3 680
2 1200
1 1690
0 2000
-1 1700
-2 1190
-3 720

Pgina 84 de 325
84
-4 290
-5 100
-6 26
-7 4
Total 10.000

Los resultados de la tabla 1 permiten ver, en efecto, que hay muy pocos experimentos donde la
diferencia entre grupos es muy grande (en apenas 5 experimentos la diferencia fue 7), mientras que hay
muchos experimentos donde la diferencia entre grupos es nula (hay 2000 experimentos donde la
diferencia fue 0).
La tabla tambin informa sobre lo siguiente:
a) La cantidad de casos que obtuvieron como diferencia entre +1 y -1 fue de 5.390 casos (que resulta de
sumar 1690 + 2000 + 1700). Ello representa el 53,9% ms prximo a cero del total de casos.
b) La cantidad de casos que obtuvieron como diferencia entre +3 y -3 fue de 9180 casos. Esto representa
el 91,8% ms prximo a cero del total de casos, y se puede graficar mediante una curva normal tal como
aparece en el grfico 1. En este grfico se puede visualizar fcilmente que el 91,8% de los experimentos
obtuvo una diferencia de -3 hasta +3.

Grfico 1



Una vez hechos estos clculos, ahora cabe hacerse una pregunta fundamental: dentro de qu intervalo
de diferencias cabra admitir que las diferencias responden al simple azar? Dentro del intervalo -1 y +1?
Dentro del intervalos -3 y +3? Por las dudas, se considerar convencionalmente este ltimo intervalo.
Esto quiere decir, por ejemplo, que si en un experimento se obtuvo una diferencia de 2, entonces se
considerar que dicha diferencia se debe al azar (pues 2 est entre -3 y +3), mientras que si en otro
experimento se obtuvo una diferencia de 6, entonces se considerar que dicha diferencia no se debe al
azar (pues 6 est fuera del intervalo entre -3 y +3), es decir, se considerar que la diferencia es
'estadsticamente significativa'.
Supngase ahora el experimento original, donde un grupo era sometido al estmulo violento y el otro no,
es decir, donde los grupos son sometidos a diferentes condiciones experimentales.
En uno de dichos experimentos se ha obtenido, por ejemplo, una diferencia de 2.5; por lo tanto, deber
concluirse que esta diferencia no es 'estadsticamente significativa' porque est comprendida dentro del
91,8% de los casos ms prximos a cero (o sea, entre -3 y +3), segn la convencin propuesta.
En cambio, si la diferencia encontrada en otro experimento de este tipo hubiese sido de 5, este valor cae
fuera del intervalo entre -3 y +3, y por lo tanto es 'estadsticamente significativo' (ver grfico 2). Desde
ya, para decidir esto se ha considerado que el porcentaje que permite discriminar lo que es significativo
de lo que no lo es era 91,8%. Si se hubiese elegido el 99%, una diferencia de 5 como resultado hubiese
resultado estadsticamente no significativa.
Sealan Len y Montero: "el investigador [es quien] determina el porcentaje que sirve para discriminar la
significacin de la no significacin. Este tanto por ciento se denomina 'nivel de confianza', y tiene sus
z

-7 -6 -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 +6
+7

Diferencias

2000
Frecuencias

91,8%


Pgina 85 de 325
85
valores ms frecuentes entre 95% y 99%". Cuanto mayor es el porcentaje elegido, ms exigente deber
ser en cuanto a la tipificacin de un resultado como estadsticamente significativo.
En los informes de investigacin, en vez de citarse el nivel de confianza, se suele citar su
complementario, que es el 'nivel de significacin' o 'nivel de riesgo'. En el caso del ejemplo, si el nivel de
confianza era del 91,8%, el nivel de significacin o de riesgo ser lo que falta para completar 100%, es
decir, el 8,2% (ver grfico 2). Ms an, inclusive, es frecuente expresar este nivel de significacin no en
trminos de porcentajes sino en trminos de probabilidad, con lo cual, en vez de afirmarse 8,2%, se
afirmar 0.082.

Grfico 2



Las expresiones 'confianza' y 'riesgo' resultan esclarecedoras para entender estos conceptos: si un
experimento cae dentro del nivel de confianza se puede decir con tranquilidad, con 'confianza', que los
resultados no son estadsticamente significativos, pero si cae dentro del nivel de riesgo, el investigador se
estara 'arriesgando' a sostener que los resultados son estadsticamente significativos, es decir, a aceptar
la hiptesis segn la cual un choque emocional efectivamente influye sobre los recuerdos.
Len y Montero indican que encontrar diferencias estadsticamente significativas no es el propsito final
del investigador, ni lo ms importante. Lo que el investigador persigue es en realidad determinar la
significacin terica, ms que la significacin estadstica que le sirve como medio, es decir, si resulta o no
relevante para alguna finalidad. As por ejemplo, si se ha constatado que un tratamiento para adelgazar
produce una prdida de 2 Kg, esto puede ser estadsticamente significativo, pero mientras que para un
investigador nutricionista ser adems tambin importante desde el punto de vista terico, para un
vendedor de esa dieta no, porque 2 Kg. no le proporciona un buen argumento de venta.
Una ltima acotacin. Podra ocurrir que algunos investigadores que hicieran el experimento del choque
emocional hubiesen obtenido diferencias extremas, como por ejemplo -7 o +7, mientras que otros
hubiesen obtenido diferencias ms prximas a cero, con lo cual los primeros hubiesen aceptado la
hiptesis del choque emocional, mientras que los segundos la hubiesen rechazado. Este desacuerdo entre
investigaciones puede ocurrir, con lo cual deber emprenderse lo que se llama un 'meta-anlisis', es
decir, un procedimiento que permita integrar los resultados acumulados de una serie de investigaciones.

NOTAS

(1) Las muestras no probabilsticas solo suelen usarse como primera aproximacin en trabajos piloto, pero no puede
saberse cun confiables son sus resultados (Kohan N, 1994:146).
(2) Toda teora de las muestras es una estadstica inferencial, pues se infieren a partir de los valores estadsticos
hallados en las muestras los valores paramtricos ms probables para las poblaciones de las cuales hemos extrado las
muestras (Kohan N, 1994:145).
(3) Cuanto mayor es el error estndar, mayor es el intervalo de confianza. El error estndar es mayor cuando z es
mayor, o sea, cuanto menor es el riesgo que se quiere correr; cuando n es menor (si se quiere ms precisin se
necesitar una muestra ms grande), y cuando S es mayor. En sntesis: cuanto menor es el riesgo que se quiere
correr, cuanto menor es el tamao de la muestra y cuanto mayor es el S (desvo estndar muestral), mayor ser el
intervalo de confianza.
z

-7 -6 -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 +6
+7

Resultados estadsticamente
significativos

Nivel de
significacin
(o de riesgo)
4,1%

Nivel de
confianza
91,8%

Nivel de
significacin
(o de riesgo)
4,1%

Resultados estadsticamente
NO significativos

Resultados estadsticamente
significativos


Pgina 86 de 325
86
(4) Este nivel de riesgo es tambin llamado nivel de significacin (Rodrguez Feijo N, 2003).
(5) "La teora sobre las muestras... es til [entre otras cosas] para poder determinar si las diferencias observadas
entre dos muestras son realmente debidas al azar o si son significativas, lo que puede llevar a un proceso de toma de
decisiones gracias a las pruebas de hiptesis y de significacin que se pueden hacer" (Kohan N, 1994:144).
(6) La prueba de hiptesis tiende a ser denominada en la actualidad teora de la decisin (Kohan N, 1994:173). Con
ello se quiere significar que la prueba de hiptesis se lleva a cabo sobre la base de una teora llamada teora de la
decisin.
(7) Un experimento clsico para probar la hiptesis del investigador es comparar dos muestras: el grupo experimental
y el grupo de control. Si hay diferencia significativa entre la muestra experimental y la muestra de control, entonces
NO hay diferencia significativa entre la muestra experimental y la poblacin.
(8) Puede llamar la atencin que el investigador no pruebe directamente su hiptesis alternativa sino que lo haga
indirectamente, probando la hiptesis nula. Por qu proceder para apoyar una teora mostrando que hay poca
evidencia para apoyar la teora contraria? Por qu no apoyar directamente la hiptesis alternativa o de investigacin?
La respuesta est en los problemas para evaluar las posibilidades de decisiones incorrectas.
El argumento que en general puede encontrarse en los textos de estadstica es el siguiente: Si la hiptesis de
investigacin es verdadera (por ejemplo una vacuna cura el resfriado), la prueba de la hiptesis nula (la contraria a la
hiptesis de investigacin) deber conducir a su rechazo. En este caso, la probabilidad de tomar una decisin
incorrecta corresponde a o cuyo valor fue especificado al determinar la regin de rechazo. Por lo tanto, si se rechaza la
hiptesis nula (que es lo deseable) se conoce inmediatamente la probabilidad de tomar una decisin incorrecta. Esto
proporciona una medida de confianza de la conclusin.
Supngase que se utiliza el razonamiento opuesto, probando la hiptesis alternativa (de investigacin) de que la
vacuna es efectiva. Si la hiptesis de investigacin es verdadera, la estadstica de prueba probablemente caer en la
regin de aceptacin (en lugar de la de rechazo). Ahora, para encontrar la probabilidad de una decisin incorrecta de
debe evaluar |, la probabilidad de aceptar la hiptesis nula cuando esta es falsa. A pesar de que esto no representa un
gran esfuerzo para el problema de la vacuna contra el resfriado, es un trabajo adicional que se debe hacer y en
algunos casos es muy difcil calcular |.
As que, para resumir, es mucho ms fcil seguir el camino de la prueba por contradiccin. Por lo tanto, el estadstico
elegir la hiptesis contraria a la de la investigacin como hiptesis nula y su deseo es que la prueba conduzca a su
rechazo. Si es as, el estadstico conoce el valor de o y tiene una medida inmediata de la confianza que se puede
depositar en esta conclusin.
(9) Autores como Hernndez Sampieri et al (1996:91) nos ofrecen una interesante tipologa de hiptesis nulas que
contemplan varias posibilidades. Concretamente, hacen referencia a: 1) hiptesis nulas descriptivas de una variable
que se va a observar en un contexto (por ejemplo la expectativa de ingreso mensual de los trabajadores de la
corporacin T no oscila entre 50.000 y 60.000 pesos colombianos); 2) hiptesis que niegan o contradicen la
correlacin entre dos o ms variables (por ejemplo no hay relacin entre la autoestima y el temor de logro); 3)
hiptesis que niegan que haya diferencia entre grupos (por ejemplo no existen diferencias en el contenido de sexo en
las telenovelas S, L y M); y 4) hiptesis que niegan la relacin de causalidad entre dos o ms variables (por ejemplo
la percepcin de la similitud en religin, valores y creencias no provoca mayor atraccin fsica).
A nuestro entender, una visin ms completa de las hiptesis nulas debera considerar al menos cuatro sentidos, que
podemos designar respectivamente en trminos de hiptesis nula de estimacin, hiptesis nula de correlacin, de
causalidad y de validez externa:
a) La hiptesis nula de estimacin vendra a afirmar que los estadsticos muestrales no son representativos de los
parmetros poblacionales.
b) La hiptesis nula de correlacin vendra a afirmar que no existe una correlacin significativa entre dos o ms
variables. El nivel de significacin es en estos casos el que establece a priori el investigador cuando califica ciertos
intervalos del coeficiente de correlacin como alto, medio, bajo, etc.
c) La hiptesis nula de causalidad vendra a afirmar que los cambios en la variable dependiente Y no son adjudicables
a los cambios de la variable independiente X. Pagano, por ejemplo, refiere que la hiptesis nula indica que la variable
independiente no influye sobre la variable dependiente (Pagano, 1998:212). Este segundo sentido de hiptesis nula es
el ms frecuentemente mencionado en los tratados sobre el tema.
d) La hiptesis nula de validez externa vendra a indicar que las conclusiones obtenidas en la muestra no son
extensibles -con el nivel confianza requerido- a toda la poblacin. Este tipo de hiptesis vendra entonces a negar la
validez externa de un experimento, entendiendo aqu validez externa como requisitos de los diseos experimentales
tal como por aparecen en gran parte de la bibliografa sobre el tema (por ejemplo Campbell D y Stanley J, 1995:16).
Autores como Tamayo pareceran considerar este sentido de hiptesis nula cuando la incluyen dentro de las hiptesis
estadsticas, definiendo stas ltimas como suposiciones sobre una poblacin que se realizan a partir de los datos
observados, es decir, de una muestra (Tamayo M, 1999:120).
La hiptesis nula de estimacin corresponde a la primera tarea de la estadstica inferencial: la estimacin de
parmetros. Las hiptesis nulas de correlacin y de causalidad corresponderan a la prueba de hiptesis donde se
busca establecer si y se debe a x y no al azar, y la hiptesis nula de validez externa corresponderan a la prueba de
hiptesis donde se busca generalizar los resultados a toda la poblacin.
(10) Debe diferenciarse la hiptesis de investigacin (H), la hiptesis alternativa (Ha) y la hiptesis nula (Ho). La
hiptesis de investigacin resulta, segn Vessereau (1962:28), de consideraciones tericas o bien est sugerida por
los datos mismos. A los efectos de probar la hiptesis de investigacin, deber drsele una forma estadstica, con lo
cual se convierte en la hiptesis alternativa (esta forma estadstica significa que incluye por ejemplo alguna
afirmacin acerca de si hay o no diferencias significativas). A su vez para probar esta hiptesis alternativa deber
probarse la hiptesis nula, que no es otra cosa que la negacin de la hiptesis alternativa.
Ms concretamente, por lo general, la hiptesis de investigacin predice una relacin entre dos o ms variables (por
ejemplo, que los nios que tienen mayor dominio del ojo izquierdo obtendrn puntajes de rendimiento en lectura
bastante inferiores a los de los otros alumnos). Para probar esta hiptesis de manera estadstica, el investigador debe
transformarla en hiptesis alternativa y luego negarla mediante la hiptesis nula. La hiptesis nula no siempre refleja las
expectativas del investigador en relacin con el resultado del experimento. Por lo general, se opone a la hiptesis de
investigacin, pero se la utiliza porque resulta ms apropiada para la aplicacin de los procedimientos estadsticos. La
hiptesis nula determina que no existe relacin entre las variables consideradas (por ejemplo, en lo que respecta al

Pgina 87 de 325
87
rendimiento en la lectura, no hay ninguna diferencia entre los nios que poseen mayor dominio del ojo izquierdo y los
dems). Por lo general, cuando se formula una hiptesis nula, se espera que sea rechazada. Si esto ltimo ocurre, se
acepta la hiptesis de investigacin (Van Dalen: 189-190).
(11) Las pruebas de una cola y dos colas tambin se llaman pruebas de un extremo y dos extremos, o tambin
unilaterales y bilaterales, o tambin one tailed test o two tailed test.
(12) Dada una poblacin de la cual se conoce su media aritmtica, por ejemplo 70, su varianza, y su tamao N, por
ejemplo 4, puede llevarse a cabo el siguiente procedimiento: a) primero se sacan todas las muestras posibles del
mismo tamao. La cantidad de muestras posibles se puede calcular mediante un nmero combinatorio, y as, por
ejemplo, de una poblacin de N = 4, se pueden obtener un total de 6 muestras de n = 2. b) A continuacin se calculan
las medias aritmticas de cada una de las muestras posibles, con lo cual se obtiene una distribucin muestral de
medias aritmticas. Por ejemplo, las medias aritmticas de las 6 muestras pueden ser: 50, 60, 70, 80 y 90. c)
Seguidamente se calcula la media aritmtica de todas estas medias aritmticas, y se obtiene un valor de 70. Como
puede apreciarse, esta media de todas la medias muestrales coincide con la media poblacional.
La estadstica ha demostrado que esta distribucin de medias de todas las medias muestrales sigue el modelo de la
curva normal, y se ha establecido as el teorema central de lmite, que dice que si se sacan repetidamente muestras de
tamao n de una poblacin normal de cierta media y cierta varianza, la distribucin de las medias muestrales ser
normal con una media igual a la media poblacional y con una varianza igual a la varianza poblacional dividido n. Desde
ya, la precisin de la aproximacin mejora al aumentar n.
De todo ello se desprende que si se selecciona una muestra cualquiera y sta tiene una determinada varianza (o sea,
un determinado desvo estndar respecto de la media de las medias), se habr cometido un determinado error,
llamado en este caso error estndar, por haber trabajado con una muestra en lugar de haberlo hecho con la poblacin.
La frmula del error estndar no es otra cosa que el desvo estndar de la muestra en cuestin, lo que es igual al
desvo estndar poblacional dividido por la raz cuadrada del tamao n de la muestra (Rodrguez Feijo, 2003) (Kohan
N, 1994:150-153).
(13) Extrado de http://www.bibliopsiquis.com/psicologiacom/vol5num1/2815/. Otro ejemplo de prueba de hiptesis
de correlacin puede encontrarse en Kohan (1994:234).


Pgina 88 de 325
88
PARTE II: METODOLOGA DE LA INVESTIGACIN

CAPTULO 6: INVESTIGACIN E INVESTIGACIN CIENTFICA

La investigacin -ms all de si es cientfica o no lo es- es un proceso por el cual se enfrentan y se
resuelven problemas en forma planificada, y con una determinada finalidad. Una forma de clasificar los
diferentes tipos de investigacin en general es a partir de su propsito o finalidad: fines distintos
corresponden a diferentes tipos de investigacin.
Toda investigacin, y en particular la investigacin cientfica, tiene un determinado mtodo y un
determinado encuadre, que sern descritos en este captulo donde adems se sugiere, finalmente, un
proyecto para la formacin de investigadores cientficos.

1. QU ES INVESTIGACIN

Partiendo de una definicin simple, pero no menos correcta, puede decirse que la investigacin es un
proceso por el cual se enfrentan y se resuelven problemas en forma planificada, y con una determinada
finalidad. En esta definicin deben destacarse cuatro ideas importantes: "proceso", "problema",
"planificada" y "finalidad".

1) Proceso.- Como muchas palabras que terminan en cin, investigacin puede designar dos cosas: la
accin de investigar, o bien el efecto, resultado o producto de esa accin. En nuestra definicin
adoptamos el primer sentido, es decir, un sentido ms dinmico y menos esttico: la investigacin es
algo que hace la gente, acciones que requieren tiempo.
Que la investigacin sea un proceso significa que no es algo que ocurra instantneamente, sino que se da
a lo largo de un tiempo, es decir que tiene una secuencia cronolgica. Hay algunas investigaciones que
duran unos pocos minutos, como investigar quien me escondi los zapatos, unas pocas horas o das,
como podra ser investigar cmo ocurri un accidente callejero, mientras que otras llevan varios aos,
como la investigacin de la eficacia de una cierta droga para curar cierta enfermedad.

2) Problema.- En nuestra definicin hablamos deliberadamente de 'problema', y no empleamos palabras
como misterio o enigma, por cuanto ellas tienden a sugerir cuestiones que aceptamos como insolubles,
como cuando se dice el misterio de la Santsima Trinidad, o el misterio de Mara, una mujer que, siendo
virgen, pari un hijo. Por tanto, el problema que genera la investigacin debe ser, por lo menos en
principio, solucionable -sea en el grado que sea-, si no, no hay investigacin posible. La investigacin
implica no slo enfrentar un problema sino tambin resolverlo, pues de otra forma la investigacin no se
completa como proceso: un investigador es un buscador de soluciones o si se quiere, un disolvedor de
misterios.
Si solamente nos ocupramos de enfrentar problemas sin resolverlos, haramos como Fabio Zerpa con el
asunto de los platos voladores y como Charles Berlitz con el Tringulo de las Bermudas, para quienes
cuantos ms misterios sin resolver haya, tanto mejor: es lo que podemos llamar una anti-investigacin,
porque el fin no es solucionar misterios sino multiplicarlos. De alguna forma ellos saben de la fascinacin
que ejercen los misterios sobre las personas, y de esa manera pueden vender muchos libros: Bunge
llamaba a estos personajes "traficantes de misterios". Desde ya, estos traficantes de misterios ofrecen
soluciones, como por ejemplo cuando dicen que las pirmides fueron construidas por extraterrestres,
pero la solucin vuelve a encerrar un misterio an mayor, como por ejemplo de dnde vinieron o quienes
eran aquellos presuntos extraterrestres. Estos traficantes seducen con lo misterioso, insisten en el
enigma, no en la solucin. La investigacin cientfica procura resolver problemas, aunque detrs de ellos
encuentra problemas ms grandes. Sin embargo, no insisten en el enigma sino en la solucin.
Etimolgicamente, 'investigar' significa buscar, indagar. En ingls, investigacin se dice 'research', y
precisamente 'search' significa buscar. Desde ya se trata, como hemos indicado, de una bsqueda de
soluciones.
En nuestra definicin habamos dicho que la investigacin implica enfrentar y resolver problemas. Ya
hemos aclarado que 'resolver' problemas significa encontrarles soluciones. Aclaremos ahora un poco ms
que significa 'enfrentar' problemas.
Tanto en la vida cotidiana como en la investigacin cientfica enfrentamos problemas, pero mientras en la
primera los problemas se presentan muy a pesar nuestro, en la ciencia los buscamos y los formulamos
deliberadamente. El cientfico, a diferencia del hombre comn, es un problematizador por excelencia, es
alguien que est 'mentalizado' para detectarlos. Mario Bunge deca que una de las tareas del investigador
es tomar conocimiento de problemas que otros pueden haber pasado por alto. Por ejemplo, en la vida
cotidiana nadie se plantea el problema de por qu se cae una manzana cuando la soltamos, salvo que sea
Newton y se haya sentado debajo del manzano: "el trabajo cientfico consiste, fundamentalmente, en
formular problemas y tratar de resolverlos" (Ander-Egg E, 1987:139).
Ahora bien, sea que los problemas se busquen deliberadamente (como en la ciencia) o se encuentren
inopinadamente (como en la vida cotidiana), el denominador comn es le hecho de que el problema debe
ser enfrentado. La distincin entre buscar y encontrar puede tener una importancia psicolgica, pero es

Pgina 89 de 325
89
secundaria a los efectos de lo que aqu queremos ver, es decir, lo que es comn a cualquier
investigacin. Lo importante ser para nosotros que en la investigacin se 'enfrentan' problemas, sea que
estn buscados deliberadamente, sea que hayan sido encontrados 'sin querer'.
En general, en los manuales de metodologa de la investigacin suele insistirse en el papel protagnico
del problema en la investigacin, tal como podemos encontrarlo por ejemplo en Selltiz. El mismo Bunge
tambin insiste en ello, dndonos una versin de investigacin con reminiscencias darwinianas, cuando la
define como un proceso que "consiste en hallar, formular problemas y luchar contra ellos" (Bunge M,
1970:185). En sntesis, si tuvisemos que condensar en una frmula muy simplificada qu es la
investigacin, podramos decir: "investigacin = problema + resolucin".
Como podemos advertir, no puede haber investigacin sin un problema, pero, puede haber un problema
sin investigacin? Respuesta: puede haberlo, como por ejemplo en los casos de resolucin de problemas
en forma automtica, ya que la investigacin implica una forma planificada de resolucin, como
enseguida veremos. Otro ejemplo puede ser agrandar el problema (la anti-investigacin de Fabio Zerpa),
y otro ejemplo es cuando hay un problema pero no hay una inquietud por resolverlo. Yo tuve una novia
que deca: "si un problema no tiene solucin, para qu hacerse problema?, y si tiene solucin, para qu
hacerse problema?" Nunca supe si el problema que la desvelaba era yo, entre otras cosas porque no me
dio tiempo: salimos solamente tres das.

3) Planificacin.- El tercer concepto includo en nuestra definicin de investigacin es el de planificacin:
concretamente, cuando decimos que la investigacin implica resolver un problema en forma planificada.
Para Bunge, el trmino 'problema' designa "una dificultad que no puede resolverse automticamente,
sino que requiere una investigacin, conceptual o emprica" (Bunge M, 1970:195). Esto nos suscita la
idea de que hay por lo menos dos formas de resolver problemas: automtica y planificada.
a) Resolucin automtica.- Un problema puede ser resuelto automticamente, lo que significa que no
exige mayormente esfuerzo intelectual, ingenio, creatividad o planificacin. Podemos mencionar tres
modalidades de resolucin automtica de problemas: inmediata, rutinaria y aleatoria.
En la resolucin inmediata, apenas aparece el problema aparece la solucin. Si tengo necesidad de una
birome, la tomo del bolsillo y se acab el problema, es decir, no necesito hacer una 'investigacin' para
buscar la birome (la investigacin, como veremos, supone una resolucin planificada). Si mi problema es
conocer el origen del universo, puedo tener una solucin inmediata que me es provista por mi
cosmovisin: lo cre Dios y punto. El dogma religioso suele prohibir la investigacin: las verdades estn
dadas, no hay que buscarlas en ningn lado.
La resolucin rutinaria implica llevar a cabo una serie de actividades en forma ordenada, mecnica o
predeterminada. Muchas actividades cotidianas son rutinarias: si tengo que preparar la comida de todos
los das, si tengo que entrar al auto, arrancarlo y andar, o si debo tomar el colectivo todos los das para ir
a trabajar, ejecuto una serie de pasos ordenados, incluso sin pensarlos demasiado, en forma automtica.
Nadie dira que preparar la comida de todos los das es 'hacer una investigacin': resolver un problema
cotidiano no implica necesariamente investigar. Otro ejemplo: un cirujano que realiza su operacin
nmero mil de vescula ya la hace casi con los ojos cerrados, en forma automtica y rutinaria, y por ende
no investig nada.
La diferencia que puede haber entre la resolucin rutinaria y la inmediata es tal vez solamente que la
primera requiere cierto tiempo y, es, por lo tanto, un proceso.
Finalmente, la resolucin aleatoria consiste en encontrar una solucin de manera fortuita, incluso sin
haberla buscado. Podemos por ejemplo tener problemas de dinero, y encontramos en la calle cien pesos.
Aqu nadie dira que hemos realizado una investigacin para resolver nuestro problema econmico.
b) Resolucin planificada.- Como podemos imaginarnos, una resolucin planificada no es una resolucin
automtica: exige cierto esfuerzo, exige cierta dosis de creatividad, exige trazarnos estrategias y
tcticas. Como su nombre lo indica, exige trazarnos un 'plan' para resolver el problema, precisamente
porque no podemos resolverlo automticamente.
Cuando pierdo el botn de la camisa o los documentos y no puedo resolver el problema de manera
automtica, inicio una 'investigacin', pero previamente hago una planificacin, por muy inconciente o
rudimentaria que pueda ser, es decir, me organizo, me trazo un plan: primero busco en el piso, despus
en la casa, despus en los lugares donde estuve, para lo cual a su vez pudo llamar por telfono a esos
lugares o ir personalmente, etc.
La investigacin supone una planificacin, pero la planificacin sola no es investigacin, porque requiere
tambin la ejecucin del plan. Planificar sin ejecutar es como hacer el plano de una casa sin construirla.
La planificacin, a su vez, supone una organizacin y un mtodo, pero no toda organizacin metdica de
actividades supone planificacin: la resolucin rutinaria de problemas implica una organizacin de las
conductas y un mtodo, pero su mismo carcter rutinario hace innecesaria una planificacin previa.
Debemos entonces preguntarnos cmo debe ser esta organizacin metdica para que podamos hablar
propiamente de una necesidad de planificacin, esto es, para que podamos hablar propiamente de
investigacin.
Ciertos autores (Matus C, 1985) distinguen entre planificacin normativa y planificacin estratgica, y
aclaramos ante todo que lo que aqu estamos llamando planificacin corresponde con ste ltimo sentido.
Una 'planificacin' normativa implica disear un plan en forma inflexible y rgida, sin tener en cuenta las
posibles variaciones y sorpresas que la realidad pueda presentarnos. No admite ni prev cambios sobre la

Pgina 90 de 325
90
marcha. Se trata de una planificacin que pretende actuar sobre la realidad como Procusto, quien en
lugar de construir un lecho acorde con las dimensiones del hombre, cortaba a ste para ajustarlo al
lecho.
Una planificacin estratgica, al revs, considera los imprevistos e instrumenta los modos de adaptarse a
ellos introduciendo cambios en el plan original. Un fsico norteamericano, Robert Oppenheimer, deca que
investigar significa pagar la entrada por adelantado y entrar sin saber lo que se va a ver. Como el lector
habr advertido, una planificacin normativa no es en realidad tal, y est ms bien relacionada con la
forma rutinaria de resolver problemas. La investigacin, en suma, implica una planificacin,
sobreentendindose que se trata de una planificacin estratgica y no normativa.
La planificacin implica trazar un plan constitudo por pasos sucesivos para resolver el problema. A
grandes rasgos, estos pasos deben incluir la formulacin adecuada del problema (para tener claro qu es
lo que requiere una solucin), la especificacin de los medios para recolectar, seleccionar, comparar e
interpretar la informacin -necesaria para resolver el problema-, de la forma ms sencilla, breve y
econmica posible. Deca Pedro Lan Entralgo: "el buen investigador ha de tener a la vez ideas nuevas,
buena informacin y buena tcnica de trabajo. A los malos investigadores les falta siempre uno por lo
menos de esos tres requisitos". El autor pensaba en la investigacin cientfica, pero sus requisitos son
igualmente aplicables a cualquier otro tipo de investigacin, por ms cotidiana e intrascendente que
pueda ser.
Como dijimos, la investigacin implica entre otras cosas saber seleccionar la informacin pertinente, y
buscarla en la forma ms sencilla posible.
As, seleccionamos aquella informacin que juzgamos atingente o pertinente al problema. Si mi problema
es encontrar el botn que perd, informacin no pertinente ser por ejemplo la cantidad de satlites de
Jpiter, e informacin pertinente ser qu clase de objetos hay detrs del silln.
La investigacin debe tambin buscar la sencillez (y hasta la elegancia), cuestin importante porque
muchas veces se piensa que una investigacin es algo complicado: indudablemente muchas
investigaciones son complicadas, pero ello no se debe a que el investigador se proponga deliberadamente
sembrar dificultades. Por ejemplo, en una investigacin a veces debemos tomar una muestra que ya es
representativa con 100 personas. Si tomamos 200 personas estamos complicando innecesariamente la
investigacin, ya que se nos hace ms lenta y ms costosa.
c) Una relacin entre resolucin automtica y resolucin planificada.- Cualquier tipo de investigacin, sea
del hombre comn en su vida o el cientfico en su laboratorio, implica siempre, como hemos visto, una
forma planificada de resolver el problema que la gener. Sin embargo, en el curso de la misma suelen
aparecer secundariamente formas automticas de resolucin de problemas. Las investigaciones reales
incluyen formas planificadas y formas automticas de resolucin, pero con la importante aclaracin que la
intencin principal de la investigacin es la planificacin, no la resolucin automtica.
Por ejemplo, la resolucin aleatoria puede darse en el curso de una resolucin planificada: Pasteur
encontr la manera de 'pasteurizar' la leche por azar. Un da sin querer se le cay el preparado con
bacterias patgenas y luego comprob que haban muerto todas por el brusco cambio de temperatura,
consecuencia de esta cada. Esto del azar es un poco relativo, porque, como deca Claude Bernard, el
eminente investigador del siglo XIX: quien no sabe lo que busca, no comprender lo que encuentra. Esto
es importante porque si alguna vez encaramos una investigacin, no es raro que resolvamos el problema
central o algn problema secundario en forma aleatoria, pero sabremos interpretarlos porque tenemos en
mente una investigacin planificada en la cual sabemos lo que buscamos.
En otro ejemplo menos cientfico, puede ocurrir que mientras investigamos dnde perdimos los
documentos, nos sentamos a pensar y advertimos que lo hemos hecho encima de ellos: intentamos una
resolucin planificada, pero desembocamos -por azar- en una resolucin aleatoria.
Del mismo modo, la investigacin incluye modos inmediatos y modos rutinarios de resolucin de
problemas. Mientras un cientfico investiga, resuelve en forma inmediata el problema de ponerse los
anteojos, y resuelve en forma rutinaria muchas de sus actividades, como por ejemplo resolver mediante
un algoritmo matemtico el nivel de significacin estadstico para los resultados de un experimento, tanto
que incluso deja que se encargue de la tarea una computadora.

4) Finalidad.- La definicin, por ltimo, hace alusin a una finalidad. Toda investigacin es una actividad
humana intencional, y persigue siempre un propsito especfico, ms all del fin genrico que es resolver
un problema. La diversidad de finalidades es lo que nos dar la diversidad de investigaciones, es decir,
los diferentes tipos de investigacin. Veamos algunos ejemplos.

2. TIPOS DE INVESTIGACIN

La cantidad de tipos de investigacin que se pueden hacer es prcticamente infinita. Vamos a recorrer
solamente algunos ejemplos representativos.

1) La investigacin cotidiana.- La investigacin es un proceso que se infiltra e muchas de nuestras
actividades diarias: investigamos cuando estudiamos, cuando jugamos, cuando aprendemos algo, cuando
vamos a un boliche bailable a 'investigar', cuando 'investigamos' al vecino, etc. La investigacin es una

Pgina 91 de 325
91
actividad que suele infiltrarse dentro de otras actividades. Por lo tanto, no se necesita ser un cientfico
para ser un investigador.
Las investigaciones cotidianas son aquellas que realizamos todos los das, y en este sentido amplio, todos
somos investigadores. Si yo llego a mi casa y me encuentro con que perd los documentos, voy a iniciar
una investigacin para encontrarlos. Estn aqu todos los elementos de una investigacin: hay un
problema (perd los documentos), hay una finalidad (quiero encontrarlos) y hay un intento por solucionar
el problema en forma planificada: empiezo a averiguar en todos los lugares donde estuve, pregunto por
telfono, dejo dicho que si los encuentran me avisen, etc., etc.

2) La investigacin infantil.- No se trata de la investigacin que podemos hacer nosotros como psiclogos
'sobre' el nio, sino de las investigaciones hechas 'por' el nio cuando indaga la realidad para satisfacer
su natural curiosidad o para adaptarse mejor a ella. El nio es, no cabe duda, un investigador nato, y
esto ya lo destacaron pensadores como Piaget y Freud.
Para Piaget el nio es un verdadero investigador de la realidad: ya desde muy pequeo debe enfrentar
problemas, los intenta resolver y lo hace en forma planificada con un fin: la adaptacin. No es la
planificacin de un adulto, pero es tambin planificacin porque el nio, a su manera y en su nivel,
tambin se organiza y al mismo tiempo gracias a ello tambin va organizando su actividad del mundo y
su conocimiento de ste.
Freud tambin habla de los nios investigadores al hablar de la 'investigacin sexual infantil', es decir,
cuando indagan su sexualidad elaborando y poniendo a prueba sus teoras sexuales infantiles. Freud no
dice 'creencias infantiles' sino 'teoras infantiles'. Si el nio tuviese simplemente creencias, creera
dogmticamente en ellas y por tanto ni se preocupara por iniciar una investigacin. Lo que el nio arma
son teoras, es decir, hiptesis, suposiciones y, como tales, se preocupar por ponerlas a prueba. Por
ejemplo, no acepta sin ms la teora de la castracin: necesita verificarla, por ejemplo, espiando a la
hermanita a ver si es cierto que a las mujeres le cortaron el pito o no. Esto implica hacer una
investigacin. Desde ya, un nio de cinco aos no necesita dominar el pensamiento hipottico-deductivo
del que habla Piaget para hacer investigaciones: ni sus hiptesis ni sus procedimientos para verificarla
estn tan formalizados como en el adolescente, pero esto no le impide investigar y considerar a sus ideas
como entidades que han de ser comprobadas en la realidad.

3) Otros tipos de investigacin.- Encontramos tambin investigaciones periodsticas (donde el problema
puede residir en averiguar qu individuos se dedican a la corrupcin en el gobierno), investigaciones
administrativas (donde el problema puede residir en averiguar qu funcionario fue el responsable de tal o
cual acto administrativo), investigaciones criminales (como averiguar quin es el asesino),
investigaciones judiciales (como resolver la imputabilidad o no de un acusado en el fuero penal, o la
magnitud de la pena, etc.), investigaciones de mercado (el llamado 'marketing', para detectar perfiles de
clientes potenciales), investigaciones literarias, filosficas, cientficas, etc.

Desde ya, el hecho de llamar 'investigaciones' a tanta diversidad de actividades humanas obedece a que
tienen ciertos caracteres en comn, caracteres que hemos resumido en nuestra definicin general. Por
algo Irving Copi (1974:493) traza una interesante analoga entre la investigacin cientfica y la
investigacin policial que llev a cabo Sherlock Holmes en uno de los cuentos de Conan Doyle. Y por algo
Sigmund Freud traza tambin un paralelismo entre la investigacin analtica y la investigacin judicial
(Freud S, 1906).

3. LA INVESTIGACIN CIENTFICA

Este tipo de investigacin debe definrsela por su finalidad y por su mtodo al mismo tiempo: la
investigacin cientfica se caracteriza por buscar un conocimiento cada vez ms general, amplio y
profundo de la realidad aplicando el llamado mtodo cientfico. Este ltimo se caracteriza porque es
fctico, trasciende los hechos, se atiene a reglas, utiliza la verificacin emprica, es autocorrectivo y
progresivo, presenta formulaciones generales, y es objetivo (Ander-Egg E, 1987:43). El producto final de
la aplicacin del mtodo cientfico es la ciencia, definida como un conjunto de conocimientos racionales,
ciertos o probables, que obtenidos de manera metdica y verificados en su contrastacin con la realidad
se sistematizan orgnicamente haciendo referencia a objetos de una misma naturaleza, cuyos contenidos
son susceptibles de ser transmitidos (Ander-Egg E, 1987:33).
En suma, la investigacin cientfica es un procedimiento reflexivo, sistemtico, controlado y crtico que
tiene por finalidad descubrir o interpretar los hechos y los fenmenos, relaciones y leyes de un
determinado mbito de la realidad (Ander-Egg E, 1987:57).

Es habitual definir la investigacin cientfica como el motor de la ciencia, el seudpodo que extiende el
conocimiento hacia regiones desconocidas, o, menos metafricamente, que es el procedimiento por el cual
planteamos y verificamos hiptesis y teoras para que luego, los profesionales puedan aplicarlas exitosamente con
una finalidad prctica, y los docentes difundirla a las nuevas generaciones. Sin embargo, las cosas no son tan
ideales. Preferimos decir que el conocimiento cientfico no es de ninguna manera el mejor conocimiento, ni an
tampoco el que ha tenido mayores xitos en cuanto a resultados prcticos se refiere. Por ejemplo: a) muchos
procedimientos teraputicos no mejoraron y an empeoraron a los pacientes; b) muchos procedimientos no

Pgina 92 de 325
92
cientficos practicados por curanderos han demostrado ser ms eficaces. Como dice Feyerabend, "actualmente la
ciencia no es superior a otras ideologas gracias a sus mritos, sino porque el show est montado a su favor".
Muchas publicaciones cientficas forman parte de ese show, en la medida en que tienden a hipervalorar los
procedimientos de investigacin cientfica de la psicologa, rescatando en ellos su ajuste a los canones de
cientificidad consensualmente reconocidos. Sin embargo, procuramos tambin no mostrar el mtodo cientfico ni
como infalible ni como el nico posible, como as tampoco afirmamos sin ms, en el otro extremo, que la ciencia
es deleznable. En lugar de ello, intentamos describir y comprender la principal herramienta del investigador,
llamada 'mtodo cientfico', hurgando al mismo tiempo en sus limitaciones y en sus posibilidades.

Etapas.- No siempre los tratadistas del mtodo cientfico siguen el mismo orden en sus etapas, por lo
cual hay diversidad de esquemas. Casi la totalidad estn de acuerdo en tres pasos fundamentales: tema,
problema, metodologa (Kerlinger, Ander Egg, Vandalen y Meyer, Morales, Arias G. Mc Guigan, Castro,
Ackoff, Garza, Pozas, Brons, Galtung, Tamayo y Tamayo, Asti, Vera, Parinas, entre otros). Entre los ms
conocidos tenemos (Tamayo, 1999:170):

Esquema Ackoff a) Planteamiento del problema.
b) Marco terico.
c) Hiptesis.
d) Diseo.
e) Procedimiento de muestreo.
f) Tcnica y obtencin de datos.
g) Gua de trabajo.
h) Anlisis de los resultados.
i) Interpretacin de los resultados.
j) Publicacin de los resultados.
Esquema Pozas a) Planteamiento de la investigacin.
b) Recoleccin de datos.
c) Elaboracin de los datos.
d) Anlisis.
Esquema
Vzquez-Rivas
a) Planteamiento.
b) Levantamiento de datos.
c) Elaboracin.
d) Anlisis.
Esquema
Pardinas
a) Teora.
b) Observacin.
c) Problema.
d) Hiptesis.
e) Diseo de prueba.
f) Realizacin del diseo de prueba.
g) Conclusiones.
h) Bibliografa.
i) Notas.
j) Cuadros y tablas.
Esquema Brons a) Especificacin, delimitacin y definicin del problema.
b) Formulacin de la hiptesis.
c) Toma, organizacin, tratamiento y anlisis de los datos.
d) Conclusiones.
e) Confirmacin o rechazo de los hijos.
f) Presentacin del informe.
Esquema Tamayo a) Eleccin del tema (planteamiento inicial).
b) Formulacin de objetivos (generales, especficos)
c) Delimitacin del tema (alcances y lmites, recursos).
d) Planteamiento del problema (descripcin, elementos, formulacin).
e) Marco terico (antecedentes, definicin de trminos bsicos, formulacin de hiptesis,
operacionalizacin de variables).
f) Metodologa (poblacin y muestra, recoleccin de datos, procesamiento de datos, codificacin
y tabulacin).
g) Anlisis de la informacin y conclusiones.
h) Presentacin del informe de investigacin.

Sea cual fuere la secuencia de pasos del mtodo cientfico, el xito de cualquier empresa cientfica
depende de tres elementos: una clara identificacin de los objetos a investigar, una teora imaginativa
que explique cmo se relacionan, y una idea precisa de los problemas concretos vinculados con la
evidencia y las pruebas ms adecuadas al tema de estudio (Lazarsfeld, 1984:11).

4. EL MTODO EN LA INVESTIGACIN CIENTFICA

En ciertas ocasiones y en el contexto de la actividad cientfica en sentido amplio (investigacin, ejercicio
profesional, etc.) resulta importante distinguir mtodos de tcnicas en trminos de la siguiente
convencin: mtodos son procedimientos generales y tcnicas son procedimientos especficos aplicados
en el marco de un mtodo.
Pocas palabras se utilizan de una forma tan diversa y generalizada como 'mtodo' y 'tcnica'.
Generalizada porque se emplean en todas las artes y todas las ciencias, y diversa porque suelen
adjudicrseles significados diferentes. Suelen ser adems vocablos que se utilizan sin ser definidos
explcitamente, de la misma manera que no nos sentimos obligados a definir la palabra 'ventilador'
cuando hablamos de los ventiladores.
Hemos de reconocer que muchas veces no es necesario definir los trminos 'mtodo' y 'tcnica' cuando
los empleamos en la vida cotidiana, en las artes o en la ciencia, pero puede resultar importante
especificar sus respectivos significados en aquellas ocasiones en las cuales: a) se utilicen ambos trminos
para describir procedimientos en el contexto de la actividad cientfica; b) se utilicen ambos trminos con
sentidos diferentes; y c) cuando sea necesario diferenciarlos si con ello se clarifican aquellos
procedimientos.

Pgina 93 de 325
93
Por empezar, convengamos en que tanto el mtodo como la tcnica se refieren a procedimientos para
hacer o lograr algo, es decir, son medios orientados hacia un fin. Tal es el sentido que recogen las
definiciones lexicogrficas a partir de los usos ms habituales: "tcnica es un conjunto de procedimientos
de un arte o ciencia"; "mtodo es el orden que se sigue en las ciencias para investigar y ensear la
verdad" (Diccionario Aristos, 1968).
Vamos ahora a la diferencia bsica entre mtodo y tcnica: un mtodo es un procedimiento general
orientado hacia un fin, mientras que las tcnicas son diferentes maneras de aplicar el mtodo y, por lo
tanto, es un procedimiento ms especfico que un mtodo. Por ejemplo: hay un mtodo general para asar
la carne, aunque pueden usarse diferentes tcnicas: a la parrilla, al horno, a la cacerola, con un horno de
microondas, etc.
Esta distincin entre mtodo y tcnica como procedimiento general y especfico respectivamente, es la
ms aceptada y reconocida dentro de la comunidad cientfica. Greenwood seala, por ejemplo, al hablar
de mtodos y tcnicas de investigacin, que "un mtodo puede definirse como un arreglo ordenado, un
plan general, una manera de emprender sistemticamente el estudio de los fenmenos de una cierta
disciplina. Una tcnica, por el contrario, es la aplicacin especfica del mtodo y la forma especfica en
que tal mtodo se ejecuta" (Greenwood, 1973:106). Greenwood hace una analoga diciendo que el
mtodo es a la tcnica como la estrategia a la tctica, es decir, la tcnica est subordinada al mtodo: es
un auxiliar de ste.
Bunge sigue la misma orientacin para distinguir mtodo de tcnica, cuando seala por ejemplo que "la
ciencia es metodolgicamente una a pesar de la pluralidad de sus objetos y de las tcnicas
correspondientes" (Bunge, 1969:36), o que "la diversidad de las ciencias est de manifiesto en cuanto
atendemos a sus objetos y sus tcnicas; y se disipa en cuanto se llega al mtodo general que subyace a
aquellas tcnicas" (Bunge, 1969:38).
El mismo autor (1969:24) distingue mtodos generales y mtodos especiales, y tiende a reservar el
nombre de tcnicas en relacin con estos ltimos destacando, de esta forma, el carcter de especificidad
de la tcnica en relacin al mtodo.
En suma, para Bunge: "el mtodo cientfico es la estrategia de la investigacin cientfica: afecta a todo el
ciclo completo de investigacin y es independiente del tema en estudio. Pero, por otro lado, la ejecucin
concreta de cada una de esas operaciones estratgicas depender del tema en estudio y del estado de
nuestro conocimiento respecto a dicho tema. As, por ejemplo, la determinacin de la solubilidad de una
sustancia dada en el agua exige una tcnica esencialmente diversa de la que se necesita para descubrir
el grado de afinidad entre dos especies biolgicas" (Bunge, 1969:31).
Por tanto, si hemos de respetar la convencin precedente, resultar correcto decir "utilic esta tcnica
para aplicar este mtodo", y resultar incorrecto decir "utilic este mtodo para aplicar esta tcnica" (an
cuando en esta ltima expresin se entienda mtodo como un conjunto de pasos para aplicar la tcnica).
Veamos algunos ejemplos donde cabe hacer distinciones entre mtodo y tcnica:
Ejemplo 1: psicoterapia.- Hay un mtodo general para curar a un paciente: escuchar su problema,
intervenir teraputicamente, verificar la cura, etc. A partir de este procedimiento genrico, cada
terapeuta instrumentar diferentes tcnicas (las que dependeran del marco terico que utilice, de sus
preferencias personales, de su adecuacin al paciente y al problema, etc.). Por ejemplo la tcnica de la
prescripcin del sntoma, la tcnica de la asociacin libre, la tcnica de la desensibilizacin sistemtica, la
tcnica Phillips 66 para terapia grupal, la tcnica de la interpretacin onrica, la hipnosis, etc.
Ejemplo 2: matemticas.- Hay un mtodo general para realizar una operacin de suma, que bsicamente
consiste en relacionar dos o ms elementos llamados sumandos y generar un tercero llamado resultado.
Para ello pueden utilizarse diferentes procedimientos llamados tcnicas: sumar mentalmente, sumar con
una calculadora, sumar con los dedos, sumar con un baco, etc., y hasta pedirle a otra persona que haga
la suma por uno. Suelen denominarse algoritmos a cada una de estas formas diferentes de realizar un
clculo.
Ejemplo 3: metodologa de la investigacin.- Dentro del mtodo general de recoleccin de datos, se
pueden utilizar diferentes tcnicas: la entrevista, el cuestionario, el test, la observacin, etc. Tambin,
dentro del mtodo de muestreo hay diferentes tcnicas: el muestro estratificado, el muestreo por
conglomerados, etc.
Ejemplo 4: ciencias naturales.- En astronoma, dentro del mtodo general de observacin de los astros,
se pueden implementar diferentes tcnicas: utilizar un telescopio reflector, un radiotelescopio, etc. En
biologa, dentro del mtodo general de observacin microscpica, puede usarse la tcnica del microscopio
ptico, la del microscopio electrnico, etc.
As como dentro de un mismo mtodo se pueden usar tcnicas diferentes, tambin dentro de diferentes
mtodos se pueden usar las mismas tcnicas. Por ejemplo, la tcnica de los tests se puede usar dentro
de un mtodo para diagnosticar (en la clnica) o en el contexto de un mtodo para verificar una hiptesis
(en la investigacin). De la misma manera, la tcnica del horno de microondas puede ser utilizada dentro
del mtodo general para asar carne, o tambin dentro del mtodo general para llevarle la contra a mi
suegra (por cuanto a ella no le gusta que la comida se haga en esa clase de artefactos).
Una tcnica inadecuada puede arruinar un buen mtodo, y, alternativamente, un mal mtodo puede
echar a perder una buena tcnica. Por ejemplo, la observacin participante es una buena tcnica, pero si
con ella se procurar verificar experimentalmente una hiptesis, se arruina el mtodo experimental y se

Pgina 94 de 325
94
desaprovecha la tcnica El fin de la tcnica debe ser congruente con el fin del mtodo dentro del cual se
utiliza.
Esta ltima cuestin tiene relacin con la eficiencia y la eficacia de la tcnica. Decimos que alguien es
eficiente cuando hace bien las cosas, y que es eficaz cuando consigue lo que se propone, es decir, la
eficiencia tiene que ver con los medios, y la eficacia con los fines. Considerando estas diferencias,
podemos decir que tanto los mtodos como las tcnicas pueden ser eficientes y eficaces: eficientes si
estn bien aplicados, y eficaces si alcanzan el fin que se propusieron. Como hemos dicho antes, una
tcnica puede ser eficiente pero no eficaz, es decir, puede estar bien usada pero ser irrelevante respecto
del fin general del mtodo donde est inscripta.
Por ltimo, resulta importante destacar que si el mtodo alude a un procedimiento general y la tcnica a
uno especfico, forzosamente habrn de ser trminos relativos. Por ejemplo, un mismo procedimiento
podr ser considerado general en relacin a otro ms especfico, o viceversa. As, la hipnosis es una
tcnica si lo inscribimos dentro del mtodo teraputico, pero ser un mtodo si intentamos discriminar
diferentes formas de hipnotizar (con la mano, con un objeto pendular, con un casete subliminal, etc.) las
que, entonces, habremos de considerar tcnicas.
De la misma forma, la tcnica del microscopio ptico es tal en relacin al mtodo general de observacin
de clulas, pero es un mtodo en relacin con las diferentes maneras de implementarlo: la tcnica de la
hematoxilina-eosina, etc.

5. EL ENCUADRE EN LA INVESTIGACIN CIENTFICA

Entre otras funciones, el encuadre es un sistema de reglas que nos suministra, tanto en la clnica como
en la investigacin, un teln de fondo fijo o constante que nos permite detectar con facilidad las posibles
variaciones en aquellos aspectos de la situacin que pueden interesarnos.

Una mosca viajera.- Dnde podemos detectar mejor una mosca caminando? Cundo camina sobre una
pantalla donde estn proyectando una pelcula, o cuando camina sobre un cuadro colgado de la pared?
Evidentemente podremos ver con mayor facilidad el desplazamiento de la mosca sobre un cuadro porque
ste, al ser esttico, permite visualizar ms fcilmente cualquier cosa que se mueva. En una pantalla, en
cambio, el movimiento de las imgenes nos dificulta ver el movimiento de la mosca, porque... todo se
est moviendo.
Hasta aqu, podemos ir sacando la siguiente conclusin: si yo quiero detectar variaciones (como el
desplazamiento de una mosca), tengo que contar con un fondo fijo y constante (como por ejemplo un
cuadro), es decir, tengo que hacer un 'encuadre' (poner en un cuadro).
En las situaciones clnicas e investigativas trabajamos con variables, es decir, con atributos del sujeto que
se supone que variarn. Y para detectar esas variaciones de las variables deber armar un fondo de
constancia y fijeza, llamado encuadre. Se trata de una de las funciones del encuadre, y para
comprenderla mejor veamos algunos ejemplos.

Encuadre psicoteraputico.- Imaginemos que con nuestro paciente no establecemos ningn encuadre
definido: quedamos en que l puede venir cuando se le antoja, a la hora que quiera, nosotros podemos o
no atenderlo ese da segn nuestras ganas, pudindolo hacer en la cocina o en el garaje. Y encima de
todo, nuestro paciente puede pagarnos lo que l quiera y cuando quiera. Tampoco establecemos las
reglas de juego dentro de la sesin: si quiere asociar libremente que lo haga, y si no, no. Por nuestra
parte, mientras tanto tenemos derecho a hacernos una siesta o mirar el programa de Tinelli por la
televisin.
En este contexto no podemos evaluar, por ejemplo, variables importantes como son las resistencias o las
transferencias del paciente. No podremos saber si lleg tarde porque no hay encuadre o porque tiene
resistencias, como as tambin ser difcil saber si nuestra paciente se quita la blusa en nuestra cocina
por una falta de encuadre o por una intensificacin de la transferencia positiva, otra variable
indispensable en el tratamiento analtico.
En cambio, procedamos ahora a establecer un encuadre: fijamos reglas como horarios definidos,
comportamientos en la sesin, honorarios, etc. Cuando todo esto se mantiene constante o fijo, cualquier
variacin en la resistencia o en la transferencia ser inmediatamente detectada. Por ejemplo, si tras
haber fijado un encuadre determinado, la paciente se quita la blusa, es decir, no respeta cierta regla del
encuadre, entonces no habremos de pensar que falta un encuadre, sino que la transferencia positiva se
ha manifestado. En cuanto a las resistencias, una medida de esta puede darla la magnitud de las
violaciones al encuadre: y si no hay encuadre, resultar ms difcil evaluar la resistencia. O para decirlo
en otras palabras: si no creamos como fondo un marco de conductas esperables, nos resultar ms difcil
identificar conductas inesperadas o llamativas, y es as que un psictico puede pasar mucho ms
desapercibido en una murga que en un grupo de estudio, donde el encuadre es menos flexible o
permisivo.

El encuadre en psicoanlisis.- Seala Freud en la Conferencia 28, que la cura analtica impone al mdico y
enfermo un difcil trabajo que es preciso realizar para cancelar unas resistencias internas. Pero este trabajo al
que Freud se refiere, para ser fructfero, debe realizarse bajo determinados condiciones, que implican

Pgina 95 de 325
95
obligaciones que debe cumplir el analista (abstinencia, etc.), el paciente (asociar libremente, etc.) y ambos en
un contrato que establece tiempo, honorarios, cantidad de sesiones, y que contribuyen a garantizar que dicho
trabajo se realizar sin mayores obstculos.
Un ejemplo de situacin que puede amenazar este encuadre pactado entre paciente y analista es la intromisin
de la familia del primero. Freud, en la Conferencia 28 ms adelante, ofrece un ejemplo de una mujer a quien
tuvo ocasin de tratar, pero el encuadre fue afectado por la intromisin de su madre, y el tratamiento no pudo
proseguir: la madre tom rpidamente su decisin: puso fin al daino tratamiento. Esto viola el encuadre
porque la paciente ya no est en condiciones de pactar libremente con el analista un conjunto de obligaciones
que son las que permitirn el anlisis.
Otros ejemplos los suministra Freud en sus artculos sobre la transferencia, donde la paciente se enamora del
analista y, lejos de interpretarse esta situacin como transferencial, analista y paciente se convierten en
amantes violando el primero la regla de la abstinencia, una de las reglas del encuadre.
Dentro del encuadre est contemplado por ejemplo el tiempo y el dinero. Indica Freud que debe darse al
paciente una hora determinada, que le pertenece por completo, y paga por ella aunque no la use. De otro modo
puede empezar a aprovechar para faltar, lo cual pone de manifiesto la importancia del encuadre para el
tratamiento. Slo en casos extremos, como alguna enfermedad orgnica, podemos suspender
momentneamente esta regla.
En casos leves pueden bastar tres horas semanales: si son ms espaciadas cuesta ms seguir la vida actual del
paciente, con riesgo para la cura, lo cual destaca nuevamente la importancia del encuadre para el tratamiento.
El encuadre tambin debe incluir honorarios. Freud reconoce haber hecho tratamientos gratuitos con el fin de
eliminar toda fuente de resistencia, pero tal actitud no fue beneficiosa, pues la gratuidad intensifica mucho
algunas resistencias del neurtico: en las mujeres, por ejemplo la tentacin implicada en la transferencia, y en
hombres jvenes, la rebelda contra el deber de gratitud, vinculada al complejo del padre. La ausencia de
honorarios hace perder la relacin entre mdico y paciente todo carcter oral, quedando ste privado de un
motivo principal para la cura.
El tratamiento analtico moviliza la energa preparada para la transferencia para luchar contra las resistencias, y
muestra al paciente los caminos para canalizarla. Un encuadre adecuado permite cumplir con estas tareas.

En el caso de investigaciones que indagan la eficacia de tratamientos, est descontada entonces la
importancia de fijar un mismo encuadre en todos los casos, para que influyan lo menos posibles las
variables extraas ajenas al tratamiento.

Encuadre experimental.- El experimento es un procedimiento incluido en las investigaciones cientficas
tpicas. Aunque no es tan habitual denominarlo encuadre, tambin en una situacin experimental existe
la necesidad de crear un teln de fondo constante para poder identificar, por contraste, la variacin de las
variables.
O'neil ha definido un experimento como un modelo particular de variacin y constancia con lo cual quera
decir que un experimento consiste en hacer variar una variable para ver como vara otra, pero
manteniendo todos los dems factores constantes.
Si quiero saber si influye o no la msica funcional sobre el rendimiento de los empleados, har variar la
variable msica funcional y ver si hay una variacin concomitante en los rendimientos, pero para ello
tuve que mantener constantes otras variables que podran tambin haber influido en el rendimiento,
como el salario. Si en el medio del experimento aumento todos los sueldos, no podr saber si la variacin
en los rendimientos obedece al salario o al cambio en la msica funcional.

Encuadre psicodiagnstico.- Otro ejemplo de encuadre en el contexto de la metodologa de la
investigacin es el referido al empleo de los instrumentos de medicin. La toma de un test puede
realizarse con fines clnicos, laborales, forenses, etc., pero tambin con fines de investigacin del test
mismo, como por ejemplo cuando la prueba en cuestin est recin inventada y atraviesa an un periodo
de prueba donde constataremos su validez y su confiabilidad. Puede tambin servir a fines puramente
estadsticos, como cuando queremos determinar la media de cociente intelectual de una poblacin dada,
o a fines de investigacin pura, como cuando queremos verificar la hiptesis segn la cual los tiempos de
reaccin a una consigna son directamente proporcionales a la ansiedad, con el fin de obtener una ley
general del funcionamiento psquico.
En cualquiera de los casos indicados es preciso tambin un encuadre. Por ejemplo, forma parte del
encuadre la manera de administrar la consigna, que debe ser siempre la misma. No es lo mismo decir
"dibuje SU familia" a decir "dibuje UNA familia", o a decir "Dibuje su familia haciendo algo". Si a todas las
personas a quienes le tomo el mismo test le administro consignas diferentes, no podr contar con un
mismo patrn para comparar sus respectivas respuestas. Una misma consigna para todos permite, en
efecto, asegurarnos de que las variaciones en las respuestas respondern a variaciones individuales de
los sujetos, y no a variaciones en las consignas. Porqu? Porque lo que nos interesa es precisamente la
variabilidad individual, es decir, aquello que es propio de cada persona.
Tambin forma parte del encuadre del proceso psicodiagnstico el comportamiento del psiclogo durante
la toma. Si en el medio de una administracin yo empiezo a comportarme en forma rgida y autoritaria o
de manera excesivamente permisiva y familiar, no sabr si las nuevas respuestas del sujeto derivan de
su peculiar funcionamiento psquico frente a las consignas de los tests, o de mis nuevos
comportamientos.

Pgina 96 de 325
96
Desde ya, yo puedo inventar un nuevo encuadre donde en el medio de la toma cambio ex profeso mi
comportamiento, pero en este caso deber aplicar el mismo encuadre en todas las tomas y recin
entonces podr comparar, sobre este fondo constante, la variabilidad inter- individual.

Otras funciones del encuadre.- Siempre nos manejamos con encuadres, an en la vida cotidiana: este
encuadre son las reglas de convivencia. Es esperable que cuando llamamos por telfono a alguien nos
diga "Hola", y es esperable que cuando dos personas se presentan se extiendan la mano. En este marco
de conductas predecibles, cualquier anomala, cualquier variacin ser inmediatamente detectada, cosa
que no sucede cuando no hay reglas y cualquier cosa puede esperarse de cualquiera en cualquier
momento.
En estos casos, las funciones del encuadre social son variadas: puede servir para regular y tornar
predecible el comportamiento ajeno ("no tengo que temer al otro si me acerco a saludarlo, pues estoy
casi seguro que responder mi saludo amistosamente"), para identificarse con un grupo de pertenencia
("Yo te saludo dndote la mano porque somos de la misma cultura"), etc., etc.
Pero fuera de estos encuadres socialmente instituidos, hemos mencionado otros encuadres ad hoc (o sea,
construidos especialmente para ciertas situaciones especiales), como el teraputico y el psicodiagnstico.
Tales encuadres suelen tener adems otras funciones, entre las cuales podemos citar dos como ejemplo.
Una primera funcin del encuadre es la de proveer un marco disciplinario que otorgue seriedad y obligue
a un compromiso con la tarea. Si decimos a un paciente que venga cuando quiera, la tarea teraputica
puede perder importancia a su consideracin, es decir, puede pensar que la cura es una joda. Otras
veces un encuadre, y sobre todo si es menos flexible, servir como metamensaje para aquellos pacientes
que no les gusta someterse a ninguna disciplina y que necesitan alguien que les ponga lmites, o para
aquellos otros que consideran que pueden controlar el tratamiento introduciendo las variaciones que se
les antoje en las reglas del encuadre.
Una segunda funcin es el hecho de que un encuadre contribuye a que tanto paciente como terapeuta
puedan organizarse la vida racionalmente. En general, todas nuestras actividades cotidianas estn
regladas en cuanto a horarios, das, etc. an las que pueden parecer ms espontneas como la
planificacin del tiempo libre. Si no establecemos ningn encuadre en un tratamiento y nuestro paciente
puede venir cuando se le antoja, deberemos estar todo el da esperando al paciente por las dudas que se
le ocurra aparecer, y mientras tanto nosotros no podremos hacer ninguna otra actividad. O bien si la
hacemos, el paciente nunca estar seguro de encontrarnos cuando venga a visitarnos.

6. LA FORMACIN DEL INVESTIGADOR CIENTFICO

La actividad cientfica es una empresa que tiene tres protagonistas principales: el investigador, el docente
y el profesional. Mientras el primero desarrolla hiptesis, las pone a prueba y construye teoras, el
docente transmite este conocimiento a los futuros profesionales, quienes lo aplicarn con un fin prctico.
Existen carreras para ser profesional (todas las carreras de grado como Medicina, Psicologa, Ingeniera,
Derecho, Agronoma, etc.). Existen tambin carreras para ser Profesor (los Profesorados), pero no han
sido desarrolladas con la misma atencin y dedicacin las carreras para ser Investigador.
Conviene hacer una diferencia entre una carrera, o una maestra de Investigador Cientfico y un
Doctorado, tal como estos ltimos se implementan en las Universidades, habida cuenta que en estos
ltimos existen asignaturas vinculadas con la Metodologa de la Investigacin, y hay adems que
presentar un trabajo de investigacin como tesis.
1) Un Doctorado incluye asignaturas propias de la carrera de origen, y por lo tanto todos los alumnos
estn graduados en la misma disciplina. En cambio, en una maestra de Investigador Cientfico todas las
asignaturas estn relacionadas con la investigacin, sea cual fuere esta, y por lo tanto ser posible
encontrar entre sus alumnos una diversidad de profesiones distintas o diferentes intereses disciplinares.
2) En un Doctorado suele no privilegiarse la enseanza prctica de la investigacin. Para hacer la tesis,
los alumnos deben recurrir o bien a terceros, o bien a un padrino de tesis que tenga la buena voluntad de
asistirlo. En cambio, en una carrera de investigador cientfico el objetivo fundamental es formar
investigadores, sea cual fuese la disciplina que dominen, y, en ltima instancia, profesionalizar esta
actividad. Los docentes comparten as ms la responsabilidad de la formacin de sus alumnos, los futuros
investigadores.
La Maestra de Investigacin Cientfica que proponemos puede cumplirse en dos aos, con un ttulo
intermedio de Auxiliar en Investigacin Cientfico al ao, y de Investigador Cientfico al finalizar los
estudios.
Como requisitos de ingreso, puede considerarse la posibilidad de tomar dos exmenes, donde se
evaluarn:
a) Conocimientos de computacin (Entorno Windows, Aplicaciones Word, Access y Excel o equivalentes, y
bsqueda bibliogrfica va Internet). Quienes no dominen estos temas, pueden cursar una asignatura de
Informtica antes del comienzo del ao lectivo de la carrera o al menos durante el primer ao de la
misma.
b) Formacin intelectual: no son pruebas psicomtricas en el sentido tradicional, donde se evale el
cociente intelectual, ni tampoco un examen de conocimientos generales, sino pruebas de manejo de
situaciones e ideas. Generalmente, quienes ms posibilidades tienen de pasar esta prueba son aquellos

Pgina 97 de 325
97
que tienen un ttulo de grado, es decir, una formacin cientfica previa. No se trata, entonces, de un
examen para el cual haya que 'prepararse' en base a un programa, ya que lo que evala es la educacin
del pensamiento gestada a lo largo de los aos, incluso desde la infancia y la adolescencia. El principal
objetivo de esta evaluacin es averiguar si la persona tiene dotes naturales mnimas para la
investigacin: curiosidad, espritu crtico, disciplina intelectual, creatividad, disposicin para incorporar
nuevas maneras de pensar, etc.

Exponemos seguidamente los lineamientos generales de un proyecto de Plan de Estudios para una
Maestra de Investigador Cientfico, que contempla una duracin de dos aos y la posibilidad de obtener
un ttulo intermedio de Auxiliar. La inquietud apunta a la posibilidad de profesionalizar una actividad que,
hoy por hoy, suele ejercerse a fuerza de experiencia, intuicin y autoaprendizaje.
En el siguiente recuadro se indica un sistema tentativo de materias, distribuidas en cuatro cuatrimestres.
A continuacin, damos algunas especificaciones sobre sus contenidos.

MAESTRIA EN INVESTIGACION CIENTIFICA: ASIGNATURAS

PRIMER CUATRIMESTRE
Introduccin a la Investigacin Cientfica
Investigacin Bibliogrfica
Estadstica Descriptiva
SEGUNDO CUATRIMESTRE
Investigacin Emprica I (Campo)
Estadstica Inferencial
Teora de la Medicin
TERCER CUATRIMESTRE
Investigacin Emprica II (Experimental)
Investigacin Terica
Modelos Elucidatorios y Heursticos
CUARTO CUATRIMESTRE
Modelos Formales
Corrientes Epistemolgicas
Historia de la Investigacin cientfica

a) Introduccin a la Investigacin Cientfica: Asignatura que presenta e introduce en el plan de estudios
de la maestra, explicando los lineamientos generales de la investigacin. La materia intentara resumir
todo lo que se ver en los dos aos, para que el alumno pueda tener una visin global de los temas que
ir viendo despus.
b) Investigacin Bibliogrfica: Habitualmente, toda investigacin comienza con una bsqueda
bibliogrfica de informacin sobre el tema que se quiere investigar ('review'), lo que incluye no solamente
buscar y seleccionar ideas de otros pensadores, sino tambin las propias. A partir de esta investigacin
bibliogrfica, la indagacin podr continuar con una investigacin terica, con una investigacin emprica
de campo o con una investigacin emprica experimental, tres posibilidades contempladas en asignaturas
subsiguientes.
c) Investigacin Emprica I (Campo): Paralelamente a la explicacin de conceptos tericos (problema,
hiptesis, ley, teora) y de conceptos bsicos sobre investigacin de campo, los alumnos llevarn a cabo
bajo supervisin docente un trabajo de investigacin de campo.
d) Investigacin Emprica II (Experimental): Junto al desarrollo de conceptos tericos (explicacin,
prediccin, accin tecnolgica, observacin, teora del diseo experimental, inferencia cientfica), los
alumnos realizarn una investigacin experimental bajo supervisin docente. Los conceptos tericos
indicados para esta asignatura y para la anterior no necesariamente tienen relacin con las
investigaciones experimentales o de campo, respectivamente. Mas bien los hemos distribuido en ambas
materias porque todos ellos no pueden ser vistos en una sola. Los conceptos seleccionados siguieron el
plan del texto de M. Bunge, "La investigacin cientfica: su estrategia y su filosofa" (Barcelona, Ariel,
1971). Esta obra est diseada para cursos, e incluye un panorama muy completo de la investigacin
cientfica, por lo que puede servir como bibliografa de referencia bsica a lo largo de toda la carrera.
Incluye tambin ms de 500 problemas para resolver como prctica.
e) Investigacin terica: Mientras la investigacin emprica confronta ideas con la realidad, la
investigacin terica confronta ideas entre s en un nivel de abstraccin mayor. En esta asignatura puede
tambin incluirse la cuestin acerca de cmo organizar y redactar un informe o un artculo cientfico
(temtica que tambin se aplica en relacin con las investigaciones bibliogrficas y empricas).
f) Corrientes Epistemolgicas: Abarca la historia de la epistemologa desde los Segundos Analticos del
Organon aristotlico, hasta un anlisis detallado de las corrientes contemporneas: Husserl, Bachelard,
Piaget, Hempel, Carnap, Reichenbach, Popper, Feyerabend, Lakatos, Kuhn, etc. Como bibliografa de
referencia puede utilizarse: Losee J., "Introduccin histrica a la filosofa de la ciencia", Madrid, Alianza,
1972, as como textos clsicos: los "Segundos Analticos" del "Organon" de Aristteles, Kuhn T., "La
estructura de las revoluciones cientficas", Feyerabend P., "Tratado contra el mtodo", Bachelard G., "La
formacin del espritu cientfico", "Popper K., "La lgica de la investigacin cientfica" y "El desarrollo del
conocimiento cientfico", etc.
g) Teora de la medicin: Tomando como referencia los niveles de medicin de Stevens (1948), esta
asignatura explica qu significa medir, qu es un instrumento de medicin y cules son sus diferencias y
semejanzas con un instrumento de observacin; los requisitos de tales instrumentos, tales como la
validez y la confiabilidad; y una explicacin detallada de las propiedades matemticas de cada nivel de
medicin. Asimismo, se podrn examinar los problemas particulares de medicin que presenta cada tipo
de ciencia.

Pgina 98 de 325
98
h) Modelos Elucidatorios y Heursticos: Los modelos elucidatorios proveen un marco para aprender a
definir. Ellos son, por ejemplo, el fenomenolgico, basado en la epistemologa husserliana, y el emprico,
basado en la epistemologa neopositivista. Los modelos heursticos proveen marcos de referencia para el
desarrollo de la creatividad, como por ejemplo los modelos estructural, dialctico, hermenutico, y los
modelos visuales analgicos (simulacin computarizada, etc.). Los modelos elucidatorios detienen el
pensamiento fijndolo en definiciones, mientras que los modelos heursticos estimulan el movimiento de
las ideas, son ms dinmicos. Los primeros aslan ideas, los segundos las relacionan.
i) Modelos Formales: Provee marcos de referencia para la construccin de modelos, teoras y esquemas
de planificacin en investigacin cientfica. Teora de Conjuntos, Teora de la Probabilidad, Teora de los
Juegos, Teora de la Informacin, Ciberntica, Lgica formal, Teora General de los Sistemas, Modelos
Inferenciales en la Ciencia, Camino Crtico, Modelos Estocsticos, Modelos Aleatorios, etc.
j) Historia de la Investigacin cientfica: Aborda un enfoque particular dentro de la historia de la ciencia, a
saber, detenindose en la descripcin y anlisis de las investigaciones ms sobresalientes de la historia
del conocimiento: Galileo, Harvey, Mendel, Maxwell, Freud, etc.
Segn la teora del aprendizaje social de Bandura, es posible aprender a investigar observando cmo los
dems lo hicieron, y no leyendo un artculo que resume los resultados de una investigacin, ya que en
ste ltimo no suelen figurar las marchas, contramarchas, obstculos y vacilaciones que inevitablemente
estn siempre presentes en cualquier emprendimiento cientfico. Se procura que el alumno se lleve una
imagen real, y no ideal, de la investigacin.
k) Estadstica descriptiva e Inferencial: Incluye los contenidos tpicos de la asignatura homnima de
carreras universitarias como Psicologa, Sociologa, Economa, etc., slo que vistos desde el punto de
vista que puede interesar al investigador, es decir, principalmente como herramienta para establecer el
grado de confianza de las conclusiones obtenidas en experimentos. Se puede hacer hincapi en el estudio
de variables temporales y aleatorias, as como en el anlisis de correlacin y regresin y en las pruebas
de significacin, herramientas de uso frecuente en las investigaciones.

Pgina 99 de 325
99
CAPTULO 7: TIPOS DE INVESTIGACIN CIENTFICA

Diversas clasificaciones se han propuesto para construir o contribuir a una taxonoma de la investigacin
cientfica. En el presente captulo se pasa revista a algunas de ellas, de amplia difusin, que han utilizado
diversos criterios tales como el objetivo o propsito de la investigacin: a) investigaciones pura, aplicada,
profesional; b) investigaciones exploratoria, descriptiva, correlacional y explicativa; c) investigaciones
terica y emprica; d) investigaciones cualitativa y cuantitativa; y e) investigaciones primaria y
bibliogrfica.

1. INVESTIGACIN PURA, APLICADA Y PROFESIONAL

La investigacin cientfica pura tiene como finalidad ampliar y profundizar el conocimiento de la realidad;
la investigacin cientfica aplicada se propone transformar ese conocimiento 'puro' en conocimiento
utilizable; la investigacin profesional suele emplear ambos tipos de conocimiento para intervenir en la
realidad y resolver un problema puntual.
Lo que habitualmente se llama investigacin cientfica engloba solamente las dos primeras, en la medida
en que ellas buscan obtener un conocimiento general, y no meramente casustico, ya que la investigacin
pura (o bsica) busca ampliar y profundizar el conocimiento de la realidad.

Ejemplo 1) En psicologa, la investigacin pura investiga el mecanismo de la proyeccin. La investigacin
aplicada busca, utilizando como marco terico el conocimiento puro, un saber general que pueda
utilizarse prcticamente. Por ejemplo, investigar alguna tcnica de diagnstico sobre la base del concepto
freudiano de proyeccin, como podra ser un test proyectivo. Finalmente, la investigacin profesional
consiste en intervenir en la realidad. Por ejemplo, diagnosticar una situacin usando la tcnica proyectiva
descubierta y validada en la investigacin aplicada.
Ejemplo 2) Un bioqumico estudia en su laboratorio la estructura molecular de ciertas sustancias
(investigacin pura); luego, otro investigador utiliza este conocimiento para probar la eficacia de ciertas
sustancias como medicamentos (investigacin aplicada); finalmente, el profesional har un estudio para
determinar si a su paciente puede o no administrarle el medicamento descubierto (investigacin
profesional).
Ejemplo 3) Los matemticos desarrollan una teora de la probabilidad y el azar (investigacin pura);
luego, sobre esta base, los especialistas en diseo experimental y en estadstica investigan diversos tipos
de diseos experimentales y pruebas estadsticas (investigacin aplicada); finalmente, un investigador
indagar la forma de utilizar o adaptar estos diseos y pruebas a la investigacin concreta que en ese
momento est realizando (investigacin profesional).
Ejemplo 4) Los antroplogos estudian el problema de la transculturacin y su influencia en el aprendizaje
escolar de nios que llegan a una nueva cultura (tales problemas suelen provenir, por ejemplo, cuando
un maestro argentino ensea a un nio que viene de una cultura diferente, donde no coincide la lgica de
la enseanza con la lgica de apropiacin del conocimiento idiosincrsica del nio, o sea, no coinciden la
forma de ensear con la de aprender). Un investigador aplicado disea tcnicas especiales para ensear
a estos nios facilitndoles el aprendizaje, y un profesional investiga la forma de aplicarlas a ese caso
particular.

Investigacin pura Investigacin aplicada Investigacin profesional
Qu busca Busca el conocimiento por
el conocimiento mismo.
Busca recursos de aplicacin del
conocimiento obtenido en la
investigacin pura.
Busca intervenir en la realidad
utilizando los resultados de los
otros dos tipos de
investigacin.
Qu hace Generaliza. Generaliza. Singulariza.

Diferencias ms
especficas
"Se realiza con el propsito
de acrecentar los
conocimientos tericos
para el progreso de una
determinada ciencia, sin
interesarse
directamente en sus
posibles aplicaciones o
consecuencias prcticas;
es ms formal y persigue
propsito tericos en el
sentido de aumentar
el acervo de conocimientos
de una determinada teora"
(Ander-Egg, 1987:68).

Guarda ntima relacin con la
investigacin pura o bsica, pues
depende de sus descubrimientos
y avances y se enriquece con
ellos.
"Se trata de investigaciones que
se caracterizan por su inters en
la
aplicacin, utilizacin y
consecuencias prcticas de los
conocimientos"
(Ander-Egg, 1987:68).

Utiliza las ideas elaboradas en
la investigacin aplicada con el
fin de resolver un problema
singular y concreto.

Ejemplo en
psicologa
Elaborar una teora de la
personalidad.
Construir un test en base a una
teora de la personalidad.
Investigar un paciente usando
un test de personalidad.

Pgina 100 de 325
100

Ejemplo en
fsica
Elaborar una teora de la
superconductividad.
Ensayar materiales
superconductivos.
Resolver un problema de
instalacin elctrica usando
superconductores.

1. Investigacin pura o bsica.- La investigacin pura busca el conocimiento por el conocimiento mismo,
ms all de sus posibles aplicaciones prcticas. Su objetivo consiste en ampliar y profundizar cada vez
nuestro saber de la realidad y, en tanto este saber que se pretende construir es un saber cientfico, su
propsito ser el de obtener generalizaciones cada vez mayores (hiptesis, leyes, teoras).
Algunos autores ofrecen su propia definicin de investigacin pura.
Para Ander-Egg (1987:68), es la que se realiza con el propsito de acrecentar los conocimientos tericos
para el progreso de una determinada ciencia, sin interesarse en sus posibles aplicaciones o consecuencias
prcticas; es ms formal y persigue propsitos tericos en el sentido de aumentar el acervo de
conocimientos de una teora.
Para Rubio y Varas, tiene como finalidad primordial avanzar en el conocimiento de los fenmenos
sociales y elaborar, desarrollar o ratificar teoras explicativas, dejando en un segundo plano la aplicacin
concreta de sus hallazgos. Se llama bsica porque sirve de fundamento para cualquier otro tipo de
investigacin (Rubio y Varas, 1997:120).
Segn Tamayo, recibe tambin el nombre de pura y fundamental. Tiene como fin la bsqueda del
progreso cientfico, mediante el acrecentamiento de los conocimientos tericos, sin interesarse
directamente en sus posibles aplicaciones o consecuencias prcticas; es de orden formal y busca las
generalizaciones con vista al desarrollo de una teora basada en principios y leyes (Tamayo, 1999:129).
Afirmar que la simple curiosidad o el placer por conocer cuestiones que suelen carecer de utilidad prctica
inmediata, es una motivacin frecuente para la investigacin pura puede sugerir que se trata de
investigaciones intiles. Luego de haber presenciado como Faraday expona los resultados de una
investigacin pura, una seora le pregunt para qu servan todas esas cosas, a lo cual el fsico ingls le
respondi: Seora, para qu sirve un nio recin nacido?.
Hacen investigacin pura, por ejemplo, un astrofsico que indaga el origen del universo, un psiclogo
social que estudia el problema de la discriminacin, un psiclogo que estudia el aprendizaje para
establecer las leyes que lo rigen, un fsico que explora la estructura subatmica de la materia o las
vinculaciones de esta con la energa, un bilogo que intenta desentraar los orgenes de la vida, un
gelogo que investiga la estructura interna de la tierra, etc.

2. Investigacin aplicada.- La investigacin aplicada busca o perfecciona recursos de aplicacin del
conocimiento ya obtenido mediante la investigacin pura, y, por tanto, no busca la verdad, como la
investigacin pura, sino la utilidad. En otras palabras, se trata aqu de investigar las maneras en que el
saber cientfico producido por la investigacin pura puede implementarse o aplicarse en la realidad para
obtener un resultado prctico. "En las ciencias aplicadas -nos dice M. Bunge- las teoras son la base de
sistemas de reglas que prescriben el curso de la accin prctica ptima" (Bunge, 1969:683).
La investigacin aplicada guarda ntima relacin con la investigacin bsica pues depende de los
descubrimientos y avances de ella y se enriquece con ellos. Se trata de investigaciones que se
caracterizan por su inters en la aplicacin, utilizacin y consecuencias prcticas de los conocimientos
(Ander-Egg, 1987:68).

A modo de ejemplo, pueden mencionarse cuatro maneras distintas cmo la investigacin aplicada puede
obtener resultados prcticos: materiales, artefactos, tcnicas y campos.

a) Materiales.- Utilizando como marco terico los resultados de la investigacin bsica, se pueden crear o
perfeccionar nuevos materiales o sustancias que tengan alguna utilidad. Por ejemplo un nuevo
medicamento, un novedoso material superconductivo que permita conducir la electricidad con el mnimo
posible de disipacin de calor (lo que redunda en el fin utilitario de ahorrar energa), un novedoso
material lo suficientemente inocuo o maleable que como para que pueda reemplazar a la plastilina con
que los chicos juegan, etc.

b) Artefactos.- La investigacin aplicada busca tambin inventar o perfeccionar mquinas, un motor de
automvil que gaste menos, nuevas mquinas-herramientas, el detector de mentiras, etc. La rueda fue el
resultado de una de las primeras investigaciones aplicadas que realiz el hombre, an cuando no tuviera
bases cientficas explcitas en la investigacin pura (que en aquella poca, por lo dems, no exista).

c) Tcnicas.- La investigacin aplicada se propone tambin descubrir nuevas tcnicas, o perfeccionar las
ya existentes para mejorar su efectividad o adaptarlas a nuevos propsitos. Todas tienen sus alcances y
sus limitaciones, y en todos los casos, debemos investigar su validez y su confiabilidad.
Las tcnicas, que se definen lexicogrficamente como conjuntos de procedimientos de un arte o ciencia,
pueden clasificarse con arreglo a varios criterios. Por ejemplo encontramos tcnicas puramente verbales
(vgr. el test desiderativo), y tcnicas que emplean materiales (vgr. el test de Rorschach, que utiliza

Pgina 101 de 325
101
lminas), la tcnica de la hora de juego diagnstica que emplea juguetes, o, fuera de la psicologa, la
tcnica de la hematoxilina (para visualizar estructuras microscpicas, donde se utiliza dicha sustancia).
Propondremos aqu, sin embargo, otro criterio especialmente importante. De acuerdo a su finalidad,
podemos agruparlas en tcnicas de in-put y tcnicas de out-put. En efecto, el valor instrumental de una
tcnica reside en su capacidad para obtener datos de la realidad (in put), o bien en su capacidad para
operar sobre ella (out put).
Tcnicas de in put son, por ejemplo, las tcnicas de recoleccin de datos (entrevistas, cuestionarios,
asociacin libre, etc.) que son -strictu sensu- tambin tcnicas de medicin. Todas estas tcnicas sirven
para ingresar informacin acerca de la realidad, y por ello tambin podremos incluir la tcnica del
detector de mentiras, del detector de radiactividad, del detector de metales, el empleo del termmetro o
el barmetro, la tcnica del carbono-14 para averiguar la antigedad de los fsiles, etc. En psicologa, las
tcnicas de in put son, en general, las llamadas tcnicas diagnsticas, como un test, mientras que en
didctica podemos mencionar las tcnicas de evaluacin del aprendizaje o la enseanza.
Las tcnicas de out put tienen como prototipo en psicologa las tcnicas teraputicas, porque con ellas
pretendemos operar, es decir, producir algn efecto en la realidad, sea para modificarla o mantenerla sin
cambios. En didctica, una tcnica audiovisual, por ejemplo, busca producir un cambio en los alumnos,
ayudndolos a construir sus objetos de conocimiento, y lo mismo es aplicable a cualquier tcnica que
sirva para ensear mejor. En oratoria, las tcnicas de persuasin son tcnicas de out put, mientras que
en ingeniera encontramos por ejemplo las tcnicas metalrgicas y siderrgicas, que buscan producir un
cambio, una transformacin en los metales para adaptarlos a usos especficos. En astronoma es difcil
encontrar tcnicas de out put, puesto que el astrnomo no puede producir cambios en el universo, alterar
la rbita de un planeta y hacer estallar un meteorito que se acerca peligrosamente a la tierra. Las
tcnicas astronmicas son -por ahora- fundamentalmente de in put, es decir, tcnicas para ingresar
informacin, para saber ms, acerca de los astros.
Un ejemplo histrico de investigacin de tcnicas de out put, y ms concretamente de tcnicas
teraputicas lo tenemos en Sigmund Freud, cuando sucesivamente fue probando y descartando diversas
tcnicas, pasando por la hipnosis, por la tcnica del apremio hasta llegar, finalmente, a la interpretacin.
Este ltimo ejemplo viene a mostrarnos que ciertas tcnicas pueden funcionar con tcnicas de in put y/o
como tcnicas de out put al mismo tiempo Para Freud, la interpretacin era una tcnica que le serva
tanto para hacer investigacin, es decir para incorporar informacin sobre el funcionamiento del
psiquismo (in put), como tambin para producir un efecto teraputico en el paciente (out put).
Otro ejemplo de tcnica mixta es la evaluacin mediante un examen final. A primera vista, parecera que
tomar examen es una tcnica de in put, en cuanto el docente busca ingresar informacin acerca del
desempeo del alumno. Sin embargo, un examen tiene tambin las caractersticas de una tcnica de out
put, ms all de la intencin del docente, por cuanto incide en el aprendizaje: el alumno suele tener, en
los exmenes, no slo la oportunidad de averiguar lo que no sabe, sino tambin eventualmente la de
aprenderlo. Lo mismo sucede con los llamados exmenes a 'libro abierto', que son, en realidad,
exmenes a 'cerebro abierto'. Y en particular, cuando se trata del ltimo examen de la carrera, se
acenta an ms su carcter de tcnica de out put, en la medida que parece ejercer un efecto
constituyente sobre el alumno al convertirlo, en virtud de un mero acto administrativo, nada menos que
en un profesional.
El hecho de que ciertas tcnicas funcionen inevitablemente -y a veces tambin inadvertidamente- como
tcnicas de in put y de out put al mismo tiempo, puede originar ciertas dificultades metodolgicas. En
este sentido, cabe mencionar la influencia de la pre-medida en los diseos experimentales y, ms
clsicamente, la dificultad metodolgica advertida por Heisenberg en su principio de incertidumbre. En su
interpretacin subjetivista, este principio establece que en toda medicin fsica influye inevitablemente
sobre lo observado el observador, lo que significa que, al pretender aplicar una tcnica de medicin (in
put) estamos al mismo tiempo ejerciendo una influencia sobre el fenmeno observado (out put).
La importancia de la creacin y la revisin de tcnicas dentro de la investigacin aplicada reside al menos
en dos cuestiones: a) Las tcnicas de recoleccin de datos debieran ser hoy ms importantes que nunca,
ya que estamos en la era de la globalizacin y la informtica, donde la cantidad de informacin que
recibimos es monstruosa. Entre otros, Alvin Toffler advirti acerca de los peligros que entraa esta
situacin para el psiquismo; b) muchas de las tcnicas de recoleccin de informacin que usamos
venimos usndolas y arrastrndolas como un mal hbito desde la primaria en nuestra profesin actual.
Por ejemplo, el psiclogo que siempre vino usando una tcnica obsesiva donde no descuida ningn
detalle, seguir con la tcnica obsesiva cuando deba realizar una entrevista. Se hace entonces emprender
una investigacin aplicada para revisar estas tcnicas, cuestionarlas, criticarlas, mejorarlas, examinar sus
alcances y sus limitaciones.
Inclusive, tambin pueden inventarse nuevas tcnicas que antes jams haban usado y ponerlas a
prueba, como un nuevo test o una nueva tcnica de entrevista.
Por ltimo, digamos que una manera de examinar crticamente las tcnicas consiste en investigar su
adecuacin con respecto:
1) a su finalidad: una tcnica que detecta especialmente actos fallidos no sirve cuando la finalidad es
tomar apuntes en una clase, pero s cuando estamos en una entrevista o en una sesin usando un marco
terico psicoanaltico. En otro ejemplo, un test, por ejemplo, es ms adecuado a la finalidad diagnstica,

Pgina 102 de 325
102
pronstica o de evaluacin de un tratamiento que a la finalidad del tratamiento en s, porque suponemos
que un test no cura pero s puede diagnosticar, pronosticar o evaluar progresos en un tratamiento;
2) al sujeto sobre el que se aplica la tcnica: para anotar lo que dice un profesor que habla muy rpido,
tal vez lo mejor sea una tcnica de grabacin, y para un profesor aburrido, la tcnica onrica. Y en el
mbito del ejercicio profesional, no podemos administrar el CAT a un adulto porque es un test hecho para
nios;
3) al sujeto que aplica la tcnica: uno va eligiendo o adaptando una tcnica tambin de acuerdo a su
idiosincrasia, personalidad o estilo de conducta. No se puede forzar a usar una tcnica obsesiva a un
histrico. No estamos hablando aqu de patologas, sino de formas de ser, pues todos nosotros somos
algo histricos, algo fbicos o algo obsesivos, y la cuestin est en poder aprovechar productivamente
estas tendencias empleando en la profesin la tcnica ms til;
4) al marco terico desde donde estn operando: la tcnica tiene tambin que ser compatible con la
teora que hemos adoptado. Ciertas tcnicas psicomtricas se adaptan a un marco terico piagetiano, las
tcnicas proyectivas son ms apropiadas para un marco psicoanaltico, etc. No se trata simplemente de
usar la tcnica que prescribe la teora, sino tambin se puede usar tcnicas de otra teora: lo importante
es que no haya incompatibilidad. Por ejemplo, en principio no podramos usar la tcnica conductista de la
desensibilizacin sistemtica si estamos en un marco psicoanaltico, porque mientras esa tcnica busca
eliminar el sntoma, la teora, al revs, busca mantenerlo para poder analizarlo.

d) Campos.- De lo que aqu se trata es de pensar y ensayar nuevos campos de aplicabilidad del saber
puro. Por ejemplo, los principios de la fsica pueden aplicarse a la aeronutica, a la construccin de
barcos, de ferrocarriles, a la tecnologa mdica, etc. Si tomamos como ejemplo las disciplinas de la salud,
como la psicologa, los campos pueden clasificarse por lo menos segn tres criterios:
a) El campo de la prevencin primaria, de la prevencin secundaria y el de la terciaria. Un psicopedagogo
no tiene por qu estar constreido al campo de la prevencin secundaria, cuando tambin puede
intervenir a nivel de prevencin primaria, por ejemplo, detectando precozmente dificultades de
aprendizaje.
b) El campo institucional, el campo grupal, el campo de lo individual. Aqu se trata de investigar si la
psicopedagoga -por caso- es aplicable o no a situaciones donde quien tiene problemas de aprendizaje ya
no es un individuo, sino un grupo o an una institucin. En el campo institucional puede investigarse por
qu una institucin no aprende, o bien en qu medida un problema institucional puede generar
problemas individuales o grupales de aprendizaje, en las personas o en los grupos que la integran.
c) El campo clnico, el campo judicial y el campo laboral son tambin posibilidades de investigacin
aplicada, ya que cada uno plantea problemas y procedimientos diferentes.
d) Otros campos son la infancia, la adultez y la senectud. Por ejemplo, el psicopedagogo no tiene por qu
atender solamente nios en edad escolar, pues tambin pueden tener problemas de aprendizaje los
adultos (por ejemplo para aprender su trabajo).
En fin, hay muchos otros campos para explorar, y muchos de ellos pueden encontrarse en las llamadas
"incumbencias" profesionales, que aparecen por ejemplo en los planes de estudio de las carreras, y dicen
para qu est habilitado un profesional, qu cosa puede hacer y qu cosas no. Tambin aparece en las
leyes: para las incumbencias del psiclogo est por ejemplo la Ley de Ejercicio Profesional de la
Psicologa, donde habla de campos de aplicacin en el rea docente, educacional, forense, laboral, etc.

3. Investigacin profesional.- La clasificacin clsica divide la investigacin en pura y aplicada, pero en
este tem se incluye tambin la investigacin profesional, que debe ser diferenciada de la investigacin
aplicada. De hecho, algunos autores parecen incluir dentro de la investigacin aplicada algunas
caractersticas de la investigacin profesional. Por ejemplo, en el caso de las ciencias sociales, Ander-Egg
(1987) describe la investigacin aplicada diciendo que busca "el conocer para hacer, para actuar
(modificar, mantener, reformar o cambiar radicalmente algn aspecto de la realidad social). Le preocupa
la aplicacin inmediata sobre una realidad circunstancial antes que el desarrollo de teoras. Es el tipo de
investigacin que realiza de ordinario el trabajador o promotor social; en general, comprende todo lo
concerniente al mbito de las tecnologas sociales que tienen como finalidad producir cambios inducidos
y/o planificados con el objeto de resolver problemas o de actuar sobre algn aspecto de la realidad
social" (Ander-Egg, 1987:68).

La investigacin profesional se propone intervenir en la realidad utilizando los resultados de la
investigacin pura y aplicada. Como esta tarea la realiza alguien a quien habitualmente llamamos
'profesional' (un mdico, un abogado, un ingeniero, un psiclogo clnico, etc.), hemos denominado con el
mismo trmino a este tipo de investigacin.
La investigacin profesional es as inherente a una profesin, a una prctica profesional. Un mdico, un
psicopedagogo, un abogado debe investigar el caso que le presentan. En cambio, la investigacin
cientfica no necesariamente est ligada a la prctica de una profesin: un profesional puede o no
dedicarse, adems, a investigar en el sentido cientfico. De hecho, hay investigadores cientficos
dedicados exclusivamente a esta actividad, y nunca ejercieron la profesin. La investigacin profesional
se pone en marcha cuando un profesional es convocado para resolver un problema concreto sin intentar

Pgina 103 de 325
103
generalizaciones, y por lo cual cobrar honorarios. En cambio, el investigador puro o el aplicado, busca
generalizar y su retribucin no se suele consignar como honorarios sino como sueldo.
La investigacin profesional se propone obtener algn resultado (un diagnstico, una curacin, resolver
un problema de aprendizaje, construir un edificio, etc.) en relacin con un caso nico y determinado: no
busca generalizar, aunque para ello pueda utilizar los saberes generales obtenidos en la investigacin
pura y la aplicada: en el curso de los dos ltimos siglos la enorme mayora de las innovaciones tcnicas
han sido precedidas por investigaciones aplicadas, las que a su vez lo han sido por resultados bsicos.
La investigacin profesional es, entonces, singular, en el sentido de que su finalidad no es obtener un
conocimiento general, sino un conocimiento aplicable a un solo caso, a saber, aquel que se debe resolver
en ese momento: planificar una clase, en el caso del docente, averiguar el origen de un problema de
aprendizaje en el caso del psicopedagogo, construir un puente en el caso de un ingeniero, resolver un
pleito en el caso de un abogado.
En oposicin a la investigacin profesional, la investigacin pura no necesariamente est urgida por
resolver un situacin prctica. En este nivel, un cientfico puede iniciar una investigacin motivado
solamente por su curiosidad, lo que no quiere decir que en ciertos casos, como en algunas
investigaciones aplicadas, haya de por medio un propsito prctico para el cual el investigador haya sido
convocado por alguna institucin. En este sentido, la investigacin aplicada est a mitad camino entre la
investigacin pura y la profesional, ya que en la investigacin aplicada no siempre hay tanta urgencia por
resolver inmediatamente un problema: las tcnicas pueden investigarse y proponerse hoy, pero empezar
a usarse ms tarde, cuando los profesionales adquieren informacin sobre ellas.
Hay una relacin importante entre la investigacin profesional y la cientfica propiamente dicha (que
incluye la pura y la aplicada): los resultados de la investigacin casustica del profesional, cuando no son
archivados y olvidados, pueden servir como elemento de juicio para llegar a generalizaciones ms vastas
mediante inducciones galileanas (a partir de un solo caso) o baconianas (a partir de varios). Freud, por
caso, investig los casos de Dora y de Schreber con el fin de ampliar y profundizar su teora de los
sueos y su teora de la psicosis, respectivamente.
En oposicin a la investigacin profesional, la investigacin cientfica (pura, aplicada) busca siempre
generalizar, e incluso para ello hasta puede partir de los datos de un caso singular abordado por un
profesional, pero en este punto no estar haciendo una investigacin profesional, sino una investigacin
cientfica. "Las prcticas profesionales no estn sometidas al doble imperativo de la universalizacin y la
validacin de sus conclusiones cognoscitivas: les basta con alcanzar una adecuada 'eficacia local,
particular', lograda en los marcos del problema prctico que intentan resolver..." (Samaja J, 1995:32).
Tomemos el caso de la percepcin. Al investigador cientfico le interesa estudiar los fenmenos
perceptivos con el fin de llegar a una comprensin general de la percepcin, incluso a formular hiptesis
o teoras sobre la misma, como hicieron por ejemplo teoras como la Gestalt o el New Look. En cambio, al
investigador profesional le interesa solamente la percepcin de su paciente: si est alterada o no, si tiene
alteraciones cualitativas o cuantitativas, etc., y todo ello no para extraer conclusiones sobre la percepcin
en general, sino como parte de un diagnstico de la situacin del paciente, lo que a su vez le servir para
planificar un tratamiento.
Otro ejemplo de investigacin profesional es la investigacin docente, cuando por ejemplo debe planificar
una clase o un curso: debe hacer investigaciones bibliogrficas, investigacin sobre tcnicas didcticas,
buscar el mejor ejemplo para una idea, etc., todo ello con vista a resolver esa clase o ese curso en
particular.
Las investigaciones clnicas que hace un psicopedagogo son tambin ejemplos de investigacin
profesional. Por ejemplo, en un problema de aprendizaje, se trata de un problema de transculturacin?
O tal vez se trata de un problema institucional, en cuyo caso la escuela misma anda mal, y esto se
refleja en el aprendizaje de los alumnos? O tal vez el problema tiene su origen en una cuestin familiar,
o en una simple cuestin de retraso madurativo, o en una cuestin orgnica que requiere la atencin de
un neurlogo? Tal vez el problema est en una maestra que utiliza el 'horscopo piagetiano' (una mala
interpretacin de la teora piagetiana) y que exige demasiado a un nio que teniendo 8 aos no sabe an
clasificar o seriar? Todos estos interrogantes, entre otros, son los que pondrn en marcha la investigacin
profesional.

La investigacin profesional se corresponde aproximadamente con lo que otros autores llaman investigacin-
accin participativa, en el contexto de investigaciones en ciencias sociales.
La Investigacin-Accin Participativa puede considerarse como un proceso que lleva a cabo una determinada
comunidad para llegar a un conocimiento ms profundo de sus problemas y tratar de solucionarlos, intentando
implicar a todos sus miembros en el proceso (Prez Serrano, 1990:134).
La finalidad de la Investigacin-Accin Participativa es de inters para la poblacin, no slo para una institucin
determinada: conocer para actuar, sensibilizar e implicar a la poblacin, transformar la propia realidad. Quienes
investigan? Los investigadores, tcnicos y la poblacin (destinataria de la accin). Cmo se disea y ejecuta? Los
grupos de trabajo disean y realizan todas las fases del anlisis de la realidad. Cul es su mbito? Son mbitos
locales como barrios, zonas rurales, grupos, etc (Rubio y Varas, 1997:123).

Independientemente de las investigaciones profesionales que realiza, el profesional puede tambin tener
la intencin de llevar a cabo o participar en investigaciones puras o aplicadas, motivado por el placer o la

Pgina 104 de 325
104
curiosidad, o tal vez por una finalidad ms prosaica relacionada con abultar el currculum o aumentar sus
ingresos.
Cevallos Garca y otros (2004) llevaron a cabo un estudio para conocer la actividad investigadora de un
grupo de mdicos, sus actitudes hacia la investigacin y las dificultades que haban encontrado para
investigar. Respondieron el cuestionario 174 mdicos de ambos sexos con una edad promedio de 43
aos, habindose obtenido los siguientes resultados: a) en los ltimos 5 aos, casi la mitad de los
profesionales haba publicado un trabajo cientfico y el 38% haba presentado comunicaciones a
congresos; b) la actitud hacia la investigacin revel que era apenas aceptable; y c) las dificultades
encontradas para investigar fueron, desde las ms importantes a las menos importantes: la presin
asistencial, la escasez de tiempo, las deficiencias estructurales, la ausencia de lneas de investigacin
multicntricas, la falta de incentivacin y preparacin, y la ausencia de motivacin.

Bases cientficas de la investigacin

Si bien estamos presuponiendo que estos tres tipos de investigacin tienen todas una base cientfica,
existieron o existen situaciones en la cuales ello no se cumple, o no se cumple totalmente.
Por ejemplo, un gur pudo haber inventado o perfeccionado una tcnica de curacin basndose en la
intuicin: hizo investigacin aplicada pero sin base cientfica.
Tambin pueden encararse investigaciones profesionales sin una base cientfica. En nuestro pas, para
rehabilitar a los alcohlicos la institucin Alcohlicos Annimos no admite mdicos, ni psiclogos ni
ningn otro profesional, sino solamente a ex-alcohlicos. Yendo un poco ms lejos en el tiempo, los
pueblos primitivos construan puentes sin tener conocimientos tericos de esttica (una rama de la fsica
que estudia los cuerpos en reposo), utilizando para ello la intuicin, y una experiencia de fracasos
acumulada a lo largo del tiempo.
Inclusive ms: un profesional puede tener una buena base de conocimiento cientfico porque se recibi
en la universidad pero, con el tiempo, poco a poco puede ir utilizando cada vez ms su saber cotidiano y
menos el cientfico, en parte porque no se actualiza y, por tanto, puede seguir utilizando teoras que en el
nterin ya fueron refutadas.
Un ejemplo de investigacin psicopedaggica no cientfica es la que realiza la madre cuando trata de
averiguar por qu su hijo tiene problemas de aprendizaje, y cuando formula hiptesis al respecto. A su
manera ella tambin est haciendo una investigacin psicopedaggica, pero no podemos decir que sea
cientfica.
Todas estas investigaciones pueden tener indudable xito, desde ya, pero no discutiremos aqu este
importante problema de status del saber cientfico en relacin con otros saberes, un tema del que, entre
otros, se ocup Paul Feyerabend.
Y una ltima observacin. Si bien la investigacin aplicada o la profesional pueden no estar basadas en
las teoras cientficas producto de la investigacin pura, ellas mismas podran ser consideradas en s
mismas cientficas por utilizar un 'mtodo' cientfico (Bunge, 1969:685). Bunge distingue, por caso,
teoras cientficas, teoras tecnolgicas sustantivas y teoras tecnolgicas operativas. Podramos relacionar
estos tres tipos de teoras con los tres tipos de investigacin que hemos descrito, en los siguientes
trminos. Las teoras cientficas son elaboradas por la investigacin pura, y orientan o pueden orientar los
otros dos tipos de investigacin, las cuales estn guiadas, adems, por teoras propias: la teora
tecnolgica sustantiva orientara la investigacin aplicada, y la teora tecnolgica operativa la
investigacin profesional.

Investigacin y tica

Cierta imagen clsica del cientfico que indaga a nivel de investigacin pura o bsica es aquella que lo
pinta encerrado en una torre de cristal, y que est ms all del bien o del mal, por cuanto sus fines son
desinteresados: le interesa conocer para satisfacer su curiosidad, independientemente de si su obra se
utilizar para el bien o el mal. Desde este punto de vista, la investigacin aplicada est ms
comprometida ticamente, por cuanto aqu ya no se produce simplemente conocimiento sino tcnicas o
artefactos para operar sobre la realidad: una cosa es inventar un misil, y otra un marcapasos. Sin
embargo, todava existe a este nivel un cierto grado de independencia, desde que se pueden inventar
tcnicas o artefactos que, como el rayo lser, puede servir para el bien o para el mal.
En la investigacin profesional, en cambio, el compromiso tico es insoslayable, porque a este nivel ya no
se inventan tcnicas o artefactos, sino que directamente se las utiliza.
Lo dicho no nos debe hacer pensar, sin embargo, que el investigador puro no tiene un compromiso tico
con la sociedad, en la medida en que debe poder prever o imaginar el uso que podr drsele al
conocimiento que produce. Einstein, por caso, parece no haber previsto el uso que se le dio en Hiroshima
y Nagasaki a su conocida frmula de interconvertibilidad de la masa y la energa. De hecho, cuando se
enter del desastre producido por la bomba atmica, se arrepinti pblicamente.
En suma: en cualquiera de los tres tipos de investigacin existe una responsabilidad en lo que se produce
como saber, en lo que se disea o en lo que se hace, con lo cual, la actividad de investigar tiene siempre
implicancias ticas.

Pgina 105 de 325
105
Un ejemplo bastante extendido es aquel donde se realiza 'mal' una investigacin en forma deliberada con
el fin de obtener algn resultado ventajoso en algn sentido (una 'mala' investigacin es aquella que no
est de acuerdo con los patrones de procedimiento vigentes en cada poca. Por ejemplo, una
investigacin que presenta como definitivos resultados que son provisorios, o como verdaderos
resultados que son equivocados). Tomemos dos casos reales:
a) Muchas investigaciones incompletas o insuficientes sobre nuevos medicamentos son presentadas por
algunos laboratorios como investigaciones concluidas, y por una razn comercial lanzan prematuramente
al mercado remedios an no suficientemente probados en seres humanos. En estos casos, a veces se
utilizan como conejillos de Indias a la gente de los pases sub-desarrollados para probar la eficacia de
medicamentos por los que luego pagarn fortunas en los pases desarrollados.
b) Ciertas investigaciones de sondeos de opinin suelen ser tendenciosas, siendo contratadas
especialmente por partidos polticos que compran encuestas 'arregladas' para su propio beneficio. Este
procedimiento es una forma ticamente cuestionable de aplicar una hiptesis verificada por la Escuela del
New Look, segn la cual tendemos a opinar como lo hace la mayora y, por lo tanto, 'si segn tal
encuesta de opinin tanta gente vota a Fulano ser por algo, entonces yo tambin lo votar'.
Otro caso similar est representado por aquella investigacin tendenciosa que intentaba persuadir a los
ricos a estudiar en universidades privadas, en vez de en las pblicas, mostrando que quienes ms poder
adquisitivo tenan, eran los que precisamente estudiaban en universidades privadas. Para ello, tomaron
como indicadores de nivel de vida cosas como la casa donde viva, si tena o no electrodomsticos caros,
el barrio de residencia, etc., con lo cual entraban en esta categora una gran cantidad de gente (lase:
hijos de gente pudiente) que por s mismos no tenan en realidad ningn patrimonio personal. Esta
investigacin tenda a contrarrestar la tendencia a estudiar en universidades pblicas, famosas por su
prestigio y nivel acadmico.
Con el mismo criterio utilizado por los promotores de la educacin privada, tambin podramos
promocionar la educacin pblica bajo el lema: "Estudia en la UBA: millones de alumnos no se pueden
equivocar", por parafrasear al humorista ingls Benny Hill, cuando dijo: "Coma en el restaurant de Harry:
millones de moscas no se pueden equivocar".

Interrelaciones entre los tres tipos de investigacin

La investigacin profesional puede estar orientada o guiada por un marco terico producido por la
investigacin pura y la investigacin aplicada (flechas 4 y 5). A partir de las hiptesis generadas en ellas,
la investigacin profesional generar sus propias hiptesis, que convendr denominar 'hiptesis
casusticas' por cuanto, a diferencia de las hiptesis propiamente dichas, no es general y est destinada a
explicar solamente un caso en especial. As, no es lo mismo explicar el proceso de la percepcin en
general, que explicar por qu un determinado paciente percibe como lo hace, explicacin que es
inaplicable a otro paciente.
La investigacin pura puede alimentarse de los datos producidos durante una investigacin profesional
(flecha 6). La obra de Freud nos ofrece abundantes ejemplos: l construy una teora acerca del
funcionamiento psquico en general, sobre la base de los datos que fue recolectando en su prctica
profesional.
La investigacin pura est tambin influenciada por los resultados de la investigacin aplicada (flecha 1).
Por ejemplo, la tcnica del carbono-14 para estimar la antigedad de los fsiles, un producto de la
investigacin aplicada, contribuy a modificar las teoras sobre el origen de la vida, a propsito del
reciente descubrimiento, en la Antrtida, de los restos de un meteorito proveniente del planeta Marte. En
otro ejemplo, la tcnica de la interpretacin contribuy a impulsar la investigacin pura en psicoanlisis,
del mismo modo que la tcnica del taquitoscopio permiti verificar ciertas hiptesis de la teora del New
Look.
La investigacin aplicada suele utilizar los resultados de la investigacin pura (flecha 2), como cuando se
disea un nuevo motor sobre la base de los principios de la termodinmica, o cuando se prueban nuevos
medicamentos sobre la base de ciertas propiedades qumicas de algunas sustancias, descubiertas en el
curso de la investigacin pura.
Finalmente, la investigacin aplicada recibe el aporte de la investigacin profesional (flecha 3) en la
medida en que, por ejemplo, esta ltima aporta elementos de juicio para evaluar la validez o la
confiabilidad de tcnicas diagnsticas o teraputicas.

Interrelaciones entre investigacin pura, aplicada y profesional


Pgina 106 de 325
106


Los tres tipos de investigacin y los contextos de la ciencia

En otra oportunidad (Cazau, 1996:20) nos hemos referido a los contextos de la ciencia como etapas o
vicisitudes que atraviesa el conocimiento cientfico. En este devenir, intervienen los tres tipos de
investigacin descriptos, del modo en que se indica en el siguiente esquema. Analicemos en l columna
por columna.

Contextos Roles Tipos de investigacin Tipos de ciencia
Descubrimiento y
justificacin
Investigador cientfico Investigacin Pura o Aplicada Ciencia Pura o Aplicada
Difusin Transmisor/Receptor Investigacin didctica Saber Transpuesto
Aplicacin Profesional Investigacin Profesional Ciencia Aplicada

Columna 1: Los cuatro contextos de la ciencia (descubrimiento, justificacin, difusin y aplicacin) se
cumplen tanto en la actividad cientfica como en la vida cotidiana. Demos un ejemplo simple en este
ltimo caso. Una madre se encuentra con un problema: su hijo no aprende. A partir de aqu ella intentar
responder a este problema formulando una hiptesis, como por ejemplo que su hijo no aprende porque
no lo castigan (contexto de descubrimiento). Hace la prueba, es decir le prohbe las vacaciones o las
golosinas si no estudia bien, y la cosa funciona (contexto de justificacin). Comunica esto a sus amigas
(contexto de difusin), quienes luego utilizan esta informacin con sus propios hijos (aplicacin).
Estas cuatro etapas se cumplen tambin en la vida cientfica. Hay, sin embargo, por lo menos tres
diferencias entre la actividad cotidiana y la actividad cientfica. a) El proceder cientfico es ms riguroso
con la prueba de la hiptesis: el cientfico es una especie de neurtico obsesivo que hace sus
verificaciones con el mximo rigor, cosa que no sucede en la vida cotidiana, donde incluso hasta
aceptamos nuestras hiptesis como verdades absolutas. Por ejemplo, la teora de la madre del ejemplo
es un equivalente de la teora del refuerzo negativo de un Skinner, cuyas pruebas estn llenas de
controles experimentales. El resultado es que la hiptesis de Skinner est mucho mejor probada que la
de la vida cotidiana. b) En la actividad cientfica, el conocimiento obtenido es includo en el marco de una
teora ms amplia que permite sistematizar el saber, por ejemplo, dentro de una teora del aprendizaje.
En la vida cotidiana, el conocimiento por ejemplo que a los chicos que andan mal hay que castigarlos no
es includo explcitamente dentro de una teora, de un sistema hipottico-deductivo sino que se mantiene
aislado, escindido del resto del saber. c) En tercer lugar, doa Rosa formula y pone a prueba sus
hiptesis con un fin exclusivamente utilitario (que su hijo estudie bien), y no lo hace por una cuestin de
simple curiosidad intelectual. En la actividad cientfica hay siempre una inquietud por conocer, adems de
una intencin utilitaria.
Columna 2: La investigacin pura se ocupa bsicamente de descubrir hechos, problemas o hiptesis, y de
justificar (poner a prueba) estas ltimas. La investigacin aplicada procede de igual manera pero con
tcnicas, materiales, etc., correspondiendo en estos casos hablar mas bien de invencin que de
descubrimiento. Los resultados de estos dos tipos de investigacin son utilizados en la investigacin
profesional, cuyos resultados a su vez pueden servir de fuente de datos para la investigacin pura y
aplicada (doble flecha).
Columna 3: Los investigadores cientficos -puros o aplicados- producen conocimiento, los profesores lo
transmiten, los alumnos los reciben y los profesionales los aplican. Los alumnos tienen varias
posibilidades: no solamente pueden convertirse en profesionales, que es lo que ocurre en la mayora de
los casos, sino que tambin podrn convertirse en profesores, en investigadores puros y en
investigadores aplicados.
Estos diferentes roles pueden aclararse ms mediante la metfora del 'edificio de la ciencia'. Hay
rascacielos como la fsica, pero hay tambin ranchitos como la parapsicologa, una ciencia que est en
Investigacin
pura

Investigacin
aplicada

Investigacin
profesional

4 5
6
1
2
3

Pgina 107 de 325
107
paales (o una protociencia como dira M. Bunge), donde hay muchos hechos constatados pero pocas
teoras. La psicologa vendra a ser un edificio estndar pero de varios pisos. No es un rancho, pero
tampoco un rascacielos.
Si la ciencia fuera un edificio, el profesional es el que vive en los departamentos, el investigador puro es
el constructor del edificio, y est en los stanos vigilando que el edificio no se caiga; mientras tanto, el
investigador aplicado refacciona o ampla el departamento para hacerlo ms habitable, y el docente
vendra a ser el que los muestra a los futuros adquirentes (alumnos) para vendrselos, y por ello la
docencia es una profesin que exige, como la del vendedor, capacidad persuasiva. Tambin podramos
ubicar a los usurpadores de viviendas, es decir, quienes, por ejemplo como los manosantas y astrlogos,
se hacen pasar como psiclogos pero que no lo son porque no estn habilitados por el Estado, es decir,
no han comprado su vivienda 'por derecha'. Adviertan entonces la diferencia entre el investigador, que
construye ciencia, y el profesional, que la usa. Finalmente, los clientes de los profesionales seran las
visitas que estos reciben en sus departamentos.
Finalmente, hemos includo una categora especial de investigacin, la investigacin didctica, que indaga
las maneras en que se transmiten los conocimientos desde el contexto de descubrimiento y justificacin
hacia el contexto de aplicacin, y viceversa.
Columna 4: Las ciencias puras son aquellas donde se realizan investigaciones puras, y las ciencias
aplicadas, son aquellas donde se investigan nuevas herramientas para optimizar la aplicacin del
conocimiento o extenderlo a otros campos. Algunos ejemplos pueden verse en el siguiente esquema.

Puras Aplicadas
Matemticas Estadstica
Fsica Ingeniera
Qumica Farmacia
Biologa Medicina, Veterinaria, Agronoma, etc.
Psicologa Psicopedagoga, etc.
Derecho Abogaca

Piaget trabaj por ejemplo en el campo de la investigacin pura: l estudi la inteligencia y no
encontramos en l un estudio sistemtico de sus implicancias pedaggicas o educativas, lo cual hubiera
sido investigacin aplicada. Freud en cambio, trabaj en los dos campos: en la investigacin pura estudi
los procesos inconcientes, las pulsiones, los afectos, y en la investigacin aplicada pens y ensay nuevas
tcnicas teraputicas, como el apremio o la interpretacin.
Si por ciencia aplicada entendemos tambin la aplicacin del conocimiento, deberemos incluir en ella a la
investigacin profesional: si bien esta ltima es casustica (no busca un saber general, como la ciencia
propiamente dicha), es 'ciencia' en tanto utiliza un procedimiento cientfico para validar sus hiptesis
casusticas, y es 'aplicada' en tanto usa como marco terico el saber de la ciencia pura. Finalmente, en el
contexto de difusin no encontramos un saber puro sino una transposicin de ese saber en un saber
enseable y enseado (Chevallard, 1997).

2. INVESTIGACIN EXPLORATORIA, DESCRIPTIVA, CORRELACIONAL Y EXPLICATIVA

Segn su alcance, las investigaciones pueden ser exploratorias, descriptivas, correlacionales o
explicativas. Estos tipos de investigacin suelen ser las etapas cronolgicas de todo estudio cientfico, y
cada una tiene una finalidad diferente: primero se 'explora' un tema para conocerlo mejor, luego se
'describen' las variables involucradas, despus se 'correlacionan' las variables entre s para obtener
predicciones rudimentarias, y finalmente se intenta 'explicar' la influencia de unas variables sobre otras
en trminos de causalidad.
Hyman clasifica las encuestas en tres grandes tipos (Hyman, 1955:100-101): descriptivas, explicativas y
predictivas, aunque se ocupar en detalle solamente de las dos primeras.

Autores como Hyman (1955) se limitan a clasificar las investigaciones como descriptivas y explicativas,
denominndolas metonmicamente como encuestas descriptivas y explicativas por cuanto la herramienta principal
de recoleccin de datos es la encuesta. Este autor establecer una diferencia entre las encuestas descriptivas y las
explicativas, aunque seala que tal distincin, si bien real, no es siempre factible, pues "muchas encuestas renen
caractersticas combinadas de descripcin y explicacin" (Hyman, 1955:24). Su intencin, al explicar
separadamente los principios de cada una, ha sido mas bien didctica.

Ms concretamente: dentro de las diferentes formas de clasificar los tipos de investigacin en ciencias
sociales, una tipologa posible las clasifica, segn el alcance de la investigacin, en investigaciones
exploratorias, descriptivas, correlacionales y explicativas. La clasificacin pertenece a Gordon Dankhe
(1986) y aqu la explicitaremos basndonos en una sntesis realizada por Hernndez Sampieri y otros
(1991).
En la prctica, cualquier estudio puede incluir aspectos de ms de una de estas cuatro clases de
investigacin, pero los estudios exploratorios ordinariamente anteceden a los otros porque sirven para
empezar a conocer el tema. A partir de all se inicia una investigacin descriptiva, que por lo general

Pgina 108 de 325
108
fundamentar las investigaciones correlacionales, las que a su vez proporcionan informacin para llevar a
cabo una investigacin explicativa. Una investigacin puede entonces comenzar siendo exploratoria,
despus ser descriptiva y correlacional, y terminar como explicativa.
No se puede hacer un estudio explicativo si antes, uno mismo u otro investigador no realiz antes un
estudio descriptivo, como tampoco podemos iniciar este ltimo sin que alguien antes haya hecho una
investigacin exploratoria. La historia de la ciencia nos muestra, primero, que una de estas etapas
puede durar aos y puede haber quedado "olvidada" hasta que alguien retoma la siguiente etapa; y
segundo, que los lmites entre una y otra etapa no son temporalmente exactos, pudiendo a veces
superponerse.
Las tres etapas persiguen propsitos diferentes: la investigacin exploratoria identifica posibles
variables, la investigacin descriptiva constata correlaciones entre variables, y la investigacin
explicativa intenta probar vnculos causales entre variables.

Ms concretamente: en la investigacin exploratoria buscamos informacin sobre algn tema o problema por
resultarnos relativamente desconocido, como por ejemplo la cuestin de los prejuicios raciales. Este estudio
culmina cuando hemos obtenido el conocimiento suficiente como para hacer un listado de los diferentes factores
que suponemos vinculados con el prejuicio racial, como por ejemplo educacin recibida, religin, zona de
residencia, edad, sexo, filiacin poltica, etc. En la investigacin descriptiva buscaremos correlacionar
estadsticamente cada uno de esos factores con el factor prejuicio racial, y termina cuando hemos constatado
ciertas correlaciones lo suficientemente significativas como para sospechar la existencia de un vnculo causal. Por
ltimo, en la investigacin explicativa intentaremos probar nuestra sospecha anterior, por ejemplo realizando un
experimento que me permita concluir si el o los factores considerados son o no causa de la actitud prejuiciosa
hacia personas de otras razas.

Seala Hyman que "los hallazgos de las encuestas descriptivas constituyen una gua para teorizar en las
explicativas; la capacidad de conceptualizar un fenmeno, que es de enorme importancia en las
encuestas descriptivas, resulta fundamental en las encuestas explicativas, ya que el mismo poder de
conceptualizacin debe extenderse al problema de las variables independientes" (Hyman, 1955:116-
117). Por lo comn, a la encuesta descriptiva se la relega a un segundo plano, otorgndosele un valor
puramente emprico y de aplicacin. En contraste, a las encuestas explicativas se les otorga gran valor,
dada la gran aceptacin de su papel en las ciencias sociales (Hyman, 1955:102).

Investigacin exploratoria

El objetivo de una investigacin exploratoria es, como su nombre lo indica, examinar o explorar un tema
o problema de investigacin poco estudiado o que no ha sido abordado nunca antes. Por lo tanto, sirve
para familiarizarse con fenmenos relativamente desconocidos, poco estudiados o novedosos,
permitiendo identificar conceptos o variables promisorias, e incluso identificar relaciones potenciales
entre ellas.
La investigacin exploratoria, tambin llamada formulativa (Selltiz), permite conocer y ampliar el
conocimiento sobre un fenmeno para precisar mejor el problema a investigar. Puede o no partir de
hiptesis previas, pero al cientfico aqu le exigimos flexibilidad, es decir, no ser tendencioso en la
seleccin de la informacin. En la investigacin exploratoria se estudian qu variables o factores podran
estar relacionados con el fenmeno en cuestin, y termina cuando uno ya tiene una idea de las variables
que juzga relevantes, es decir, cuando ya conoce bien el tema. Por ejemplo, cuando apareci por primera
vez el Sida hubo que hacer una investigacin exploratoria, porque haba un desconocimiento de este
tema. Otros ejemplos son investigar el tema drogadiccin para quien no lo conoce, o el tema salud
mental en relacin con el entorno social. La investigacin exploratoria tiene otros objetivos secundarios,
que pueden ser familiarizarse con un tema, aclarar conceptos, o establecer preferencias para posteriores
investigaciones. La informacin se busca leyendo bibliografa, hablando con quienes estn ya metidos en
el tema, y estudiando casos individuales con un mtodo clnico. Blalock destaca la tcnica de la
observacin participante como medio para recolectar informacin. Es importante que la investigacin
exploratoria est bien hecha, porque si no puede echarse a perder la subsiguiente investigacin
descriptiva y la explicativa.
Hernndez Sampieri y otros (1996:71) indican que los estudios exploratorios tienen por objeto esencial
familiarizarnos con un tpico desconocido o poco estudiado o novedoso. Esta clase de investigaciones
sirven para desarrollar mtodos a utilizar en estudios ms profundos. De hecho, una misma investigacin
puede abarcar fines exploratorios, en su inicio, y terminar siendo descriptiva, correlacional y hasta
explicativa: todo segn los objetivos del investigador.
En su momento, fueron investigaciones exploratorias las primeras investigaciones sobre el Sida, sobre las
vinculaciones potenciales entre histeria y sexualidad (Sigmund Freud), sobre el rendimiento de los
obreros en las fbricas (Elton Mayo), etc. En su momento, cuando nada se saba sobre estas cuestiones,
se emprendieron investigaciones para 'explorar' dichos temas y problemas.
En un estudio exploratorio se puede partir de una hiptesis previa, o sea, podemos tener alguna idea
previa sobre qu factores estn vinculados con la drogadiccin. Pero esta idea vaga es una gua muy
general y slo nos sirve para descartar la influencia de factores tales como si hay o no atmsfera en
Jpiter, por dar un ejemplo; no nos debe servir para descartar otros posibles factores relevantes (o que

Pgina 109 de 325
109
podran serlo), tales como la inestabilidad poltica, social o econmica de los pases donde aparece la
drogadiccin.

Investigacin descriptiva

En un estudio descriptivo se seleccionan una serie de cuestiones, conceptos o variables y se mide cada
una de ellas independientemente de las otras, con el fin, precisamente, de describirlas. Estos estudios
buscan especificar las propiedades importantes de personas, grupos, comunidades o cualquier otro
fenmeno.
Las investigaciones descriptivas constituyen una "mera descripcin de algunos fenmenos" (Hyman,
1955:100), como por ejemplo describir la conducta sexual del hombre norteamericano, describir los
sentimientos del pblico hacia los programas radiales, o describir la opinin norteamericana sobre la
bomba atmica. Su objetivo central es "esencialmente la medicin precisa de una o ms variables
dependientes, en alguna poblacin definida o en una muestra de dicha poblacin" (Hyman, 1955:102).
"La conceptualizacin eficaz del fenmeno a estudiar constituye el problema terico fundamental que se
plantea al analista de una encuesta descriptiva" (Hyman, 1955:129).
Los estudios descriptivos (Hernndez Sampieri y otros, 1996:71) sirven para analizar como es y se
manifiesta un fenmeno y sus componentes (ejemplo, el nivel de aprovechamiento de un grupo, cuntas
personas ven un programa televisivo y porqu lo ven o no, etc.).
Un ejemplo tpico de estudio descriptivo es un censo nacional, porque en l se intenta describir varios
aspectos en forma independiente: cantidad de habitantes, tipo de vivienda, nivel de ingresos, etc., sin
pretender averiguar si hay o no alguna correlacin, por ejemplo, entre nivel de ingresos y tipo de
vivienda.
Otro ejemplo de investigacin descriptiva puede ser aquella que intenta averiguar qu partido poltico
tiene ms seguidores, o qu imagen posee cada partido poltico en la poblacin, o cuntas personas
hacen psicoterapia en una determinada ciudad, o el ndice de productividad de una fbrica, o la cantidad
de varones y mujeres que miran televisin, etc. Medir los diferentes aspectos de la personalidad de un
sujeto (hipocondra, depresin, sociabilidad, etc.) es tambin un estudio descriptivo.
Mientras los estudios exploratorios buscan descubrir variables, los descriptivos buscan describirlas
midindolas, y, por tanto, requieren mayor conocimiento del tema para saber qu variables describir y
cmo hacerlo.
Los estudios descriptivos pueden ofrecer tambin la posibilidad de hacer predicciones incipientes, aunque
sean rudimentarias. Por ejemplo, si sabemos el promedio de horas que miran TV los nios de la ciudad X,
podemos predecir con cierta probabilidad el tiempo que mirar TV un nio determinado de dicha ciudad.
Otro ejemplo: si sabemos, en base a una muestra, cunta gente votar a tal partido, podemos predecir
con cierto margen de probabilidad o error, si triunfar en las elecciones.
Segn Hyman, el objetivo fundamental de las encuestas de prediccin no es describir ni explicar una
situacin 'actual', sino hacer una estimacin de algn estado de cosas 'futuro' (Hyman, 1955:101). El
mismo autor proporciona un ejemplo de investigacin predictiva, que tuvo lugar en EEUU cuando el
gobierno patrocin una encuesta que sirviese para orientar la poltica del control de la inflacin. Se
buscaba informacin que permitiese pronosticar el curso de los rescates de bonos de guerra durante el
prximo ao. La idea era recabar informacin directamente de las personas, porque hasta entonces los
datos surgan de ndices globales, como la renta nacional, etc., que no arrojaban luz sobre el efecto
diferencial que ciertos factores ejercen sobre los distintos sectores de la poblacin, ni indicaban las
distintas motivaciones que los impulsaban. La informacin necesaria para formular el pronstico deba
obtenerse analizando: a) datos econmicos sobre la tenencia de bonos y datos inferidos sobre la
vulnerabilidad econmica de la familias, y b) datos psicolgicos sobre factores cognitivos o
motivacionales en que se fundaba la compra y conservacin o rescate de bonos, en relacin con los
diversos procesos econmicos previstos en el pas. Entre otras cosas, se pudo pronosticar por ejemplo
que la reaparicin de bienes de consumo no sera muy significativa, ya que los tenedores de bonos
queran conservarlos hasta su amortizacin.

Investigacin correlacional

Tiene como finalidad medir el grado de relacin que eventualmente pueda existir entre dos o ms
conceptos o variables, en los mismos sujetos. Ms concretamente, buscan establecer si hay o no una
correlacin, de qu tipo es y cul es su grado o intensidad (cun correlacionadas estn).
En otros trminos, los estudios correlacionales pretenden ver cmo se relacionan o vinculan diversos
fenmenos entre s (o si no se relacionan) (Hernndez Sampieri y otros, 1996:71).
Por ejemplo, un estudio correlacional tratar de averiguar si hay alguna relacin entre motivacin y
productividad laboral para los mismos sujetos (obreros de una fbrica), o si hay o no alguna relacin
entre el sexo del cnyuge alcohlico y el nmero de divorcios o abandonos generados por el alcoholismo,
o si hay alguna relacin entre el tiempo que se dedica al estudio y las calificaciones obtenidas.
Consiguientemente, el propsito principal de la investigacin correlacional es averiguar cmo se puede
comportar un concepto o variable conociendo el comportamiento de otra u otras variables relacionadas,
es decir, el propsito es predictivo. Por ejemplo, si yo se que la ocupacin y la preferencia de voto estn

Pgina 110 de 325
110
correlacionadas, puedo predecir que los obreros tendern a votar a determinado partido poltico ms que
a otro. No se trata de una prediccin incipiente como en la investigacin descriptiva, porque en los
estudios correlacionales la prediccin est apoyada en evidencias ms firmes, a saber, en la constatacin
estadstica de un vnculo de correlacin.
Sealan Hernndez Sampieri et al (1991) que la investigacin correlacional tiene un cierto valor
explicativo, que es parcial. Decir que los estudiantes obtuvieron mejores calificaciones 'porque'
estudiaron ms tiempo es una explicacin, pero parcial, porque hay muchos otros factores que pudieron
hacer incidido en sus buenas calificaciones.
Los mismos autores advierten sobre la posibilidad de encontrar lo que ellos llaman "correlaciones
espurias", es decir, correlaciones existentes entre variables pero que en realidad no expresan causalidad.
Por ejemplo, hay una alta correlacin entre estatura e inteligencia, pero ello no nos autoriza a sostener
que la estatura es la 'causa' de la inteligencia, o a decir que una persona es inteligente debido a su
altura.

Investigacin explicativa

Las investigaciones descriptivas y correlacionales constituyen una mera descripcin de algunos
fenmenos, para lo que se centran en la medicin de una o ms variables dependientes en alguna
poblacin o muestra. La investigacin explicativa, en cambio, va ms all tratando de encontrar una
explicacin del fenmeno en cuestin, para lo cual busca establecer, de manera confiable, la naturaleza
de la relacin entre uno o ms efectos o variables dependientes y una o ms causas o variables
independientes.
As entonces, este tipo de investigacin va ms all de la simple descripcin de la relacin entre
conceptos, estando dirigido a indagar las causas de los fenmenos, es decir, intentan explicar por qu
ocurren, o, si se quiere, por qu dos o ms variables estn relacionadas. No es lo mismo decir que
ocupacin y preferencia poltica estn relacionadas, a explicar por qu lo estn en trminos de un vnculo
causa-efecto.
Las investigaciones explicativas son ms estructuradas que las anteriores, y proporcionan adems un
'sentido de entendimiento' del fenmeno en estudio, es decir, procuran entenderlo a partir de sus causas
y no a partir de una mera correlacin estadstica verificada con otras variables.
Algunos llaman 'experimental' a la investigacin explicativa. Hernndez Sampieri et al (1991) sostienen
que si bien la mayora de las investigaciones explicativas son experimentales, ciertos estudios no
experimentales pueden aportar evidencia para explicar por qu ocurre un fenmeno, proporcionando as
"un cierto sentido de causalidad".

Hyman, en su anlisis de las investigaciones explicativas, sostiene que lejos de intentar la mera
descripcin de un fenmeno como en las encuestas descriptivas, las encuestas explicativas tratan de
encontrar una explicacin' del mismo (Hyman, 1955:100). En las encuestas explicativas, "se establece de
manera confiable la naturaleza de la relacin entre uno o ms fenmenos (variables dependientes) y una
o ms causas (variables independientes)" (Hyman, 1955:100).
Los procedimientos para analizar encuestas explicativas "deben proporcionar pruebas confiables de la
relacin entre el fenmeno y una o ms causas o variables independientes y, por tanto, solucionar el
problema general del analista: hallar una explicacin" (Hyman, 1955:229). La encuesta explicativa "sigue
el modelo de los experimentos de laboratorio, con la diferencia fundamental de que procura representar
este diseo en un medio natural. En vez de crear y manejar las variables independientes cuyo efecto hay
que descubrir, el analista de encuestas debe encontrar en el medio natural casos en que se den dichos
factores. Mediante la medicin de su presencia y magnitud, es posible establecer, en el curso del anlisis,
su relacin con el fenmeno. La restriccin del universo abarcado y el diseo de la muestra proporcionan
la tcnica bsica mediante la que se excluyen otras fuentes de variacin del fenmeno en la encuestas
explicativa" (Hyman, 1955:117).
Clasificacin de las investigaciones explicativas.- Hyman clasifica las encuestas explicativas en tres
grandes grupos, que son los siguientes:
a) Encuestas tericas o experimentales.- Aqu, "la tarea adopta fundamentalmente la forma de
verificacin de una 'hiptesis especfica' derivada de alguna teora ms amplia, en tanto determinante
especial del fenmeno" (Hyman, 1955:100).
b) Encuestas de evaluacin o programticas.- Son aquellas donde "los factores que 'han sido o pueden
ser manejados por un organismo de accin social' se estudian desde el punto de vista de la ayuda que
brindan para determinar el fenmeno. Aqu el objetivo inmediato es la aplicacin, modificacin o cambio
de algn estado de cosas o fenmeno, tomando como base el conocimiento probado de los factores en
juego. Tal fue el caso de la investigacin sobre el ausentismo: auspiciada por el gobierno, los hallazgos
deban facilitar recomendaciones acerca de las medidas correctivas a adoptar en los talleres o en un
ambiente ms amplio, mediante su manipulacin. Esto no significa que el planeamiento bsico de esas
investigaciones no involucre consideraciones tericas [como en las encuestas tericas o experimentales],
sino simplemente que los determinantes especficos que en ltima instancia constituyen el foco del
anlisis son entidades manipulables" (Hyman, 1955:100).

Pgina 111 de 325
111
c) Encuestas de diagnstico.- "Implica una bsqueda de causas posibles en un mbito relativamente
desconocido" (Hyman, 1955:100).
Algunas diferencias entre los tres subtipos de investigaciones explicativas.- 1) A diferencia de las
encuestas tericas o experimentales, donde se busca verificar una hiptesis especfica sobre los
'determinantes especiales' del fenmeno, a las encuestas de evaluacin y de diagnstico incumbe
"verificar la 'contribucin de una serie de factores' a la causalidad de un fenmeno" (Hyman, 1955:100).
2) La encuesta programtica o de evaluacin "hace hincapi en los modos de anlisis denominados
'especificacin' y 'explicacin' (...). Adems, la encuesta terica pone el nfasis en el modo de anlisis
llamado 'interpretacin'" (Hyman, 1955:101). La especificacin, la explicacin y la interpretacin son tres
modos de anlisis que Hyman desarrolla ms adelante, en el captulo 7 titulado "La introduccin de
variables adicionales y la elaboracin del anlisis". Estos tres modos de anlisis reciben en Hyman el
nombre genrico de 'elaboracin', y consisten bsicamente en introducir variables adicionales para
explorar con mayor detalle la original relacin X-Y. No se desarrolla aqu este punto, pero para que el
lector pueda tener una idea aproximada del tema, hemos diseado el esquema, que intenta resumir las
ideas de Hyman al respecto.



En la explicacin, el factor de prueba es una variable antecedente, en la interpretacin es una variable
interviniente. En la especificacin se indica bajo qu circunstancias (variables contextuales) la relacin
original X-Y es menos o ms pronunciada (Hyman, 1955:352). Se volver sobre este tema cuando se
examinen ms adelante algunos ejemplos de relaciones entre variables.
3) Las encuestas programticas y tericas acentan la importancia de que la 'confiabilidad de las
conclusiones est rigurosamente garantizada', en tanto que la encuesta de diagnstico puede reservar
menos recursos a esas garantas y tratar de alcanzar, en un amplio mbito, comprensin o 'evidencia
sugestiva'" (Hyman, 1955:101).
4) "La estructura conceptual de la encuesta terica ser ms 'abstracta', mientras que la encuesta
programtica o de evaluacin utilizar variables ms 'concretas', y la de diagnstico participar de ambos
niveles de conceptualizacin" (Hyman, 1955:101).

Otras consideraciones

1. Una investigacin, puede incluir elementos de los diferentes tipos de estudio indicados?
Muchas veces cuando se dice que un estudio es descriptivo, o correlacional, etc., esto no significa
necesariamente que no incluya elementos o caractersticas de otros tipos de investigacin. Adems, una
investigacin puede comenzar siendo descriptiva y terminar siendo luego correlacional.
Inclusive ms: un estudio puede comenzar siendo explicativo porque procura averiguar la causa de la
evasin de impuestos, pero luego, al revisarse la literatura. se comprueba que no hay nada investigado
sobre el tema, con lo cual debe continuar investigando de manera exploratoria, pues se trata de indagar
en un tema relativamente desconocido.
2. De qu depende que una investigacin comience como exploratoria, descriptiva, correlacional o
explicativa? Que una investigacin comience como exploratoria, descriptiva, correlacional o explicativa
depender del estado de conocimiento sobre el tema a investigar (lo que podemos saber a partir de la
revisin de la literatura), y del enfoque que el investigador pretenda darle a su estudio.
La revisin de la literatura sobre el tema puede revelarnos, en primer lugar, que no hay antecedentes
sobre el tema, o que ellos son inaplicables a lo que queremos estudiar, en cuyo caso iniciaremos una
investigacin exploratoria.
En segundo lugar, puede revelarnos que ciertos estudios descriptivos han detectado y definido ciertas
variables, en cuyo caso podremos iniciar un estudio descriptivo. En tercer lugar la revisin de la literatura
X

Y

t

t: Variable antecedente
(t ocurre antes que x)

t: Variable interviniente
(t ocurre despus que x)

t: Variable contextual
(t ocurre al mismo tiempo que x)

t

Y

X

X

Y

t

INTERPRETACIN

EXPLICACIN

ESPECIFICACIN


Pgina 112 de 325
112
puede revelarnos la existencia de una o varias relaciones entre conceptos o variables, en cuyo caso
podremos emprender una investigacin correlacional. En cuarto y ltimo lugar, la literatura puede
revelarnos que hay una o varias teoras aplicables a nuestro problema, con lo cual podremos comenzar
un estudio explicativo.
El enfoque que el investigador busque darle a su estudio tambin determinar el tipo de investigacin
que elegir: a veces el propsito es simplemente describir, otras veces correlacionar, otras veces buscar
causas, etc.
3. Cul es de los cuatro tipos de investigacin es mejor? Las cuatro son igualmente vlidas e
importantes, por cuanto todas han contribuido al avance de la ciencia, porque han aumentado y
profundizado el conocimiento del fenmeno en estudio.

Un anlisis crtico de la propuesta tipolgica

La tipologa de Dankhe representa un importante avance conceptual al discriminar las investigaciones
descriptivas como diferentes de las correlacionales. De hecho, hay innumerables ejemplos de
investigaciones descriptivas que no llegan a ser correlacionales, entre otras cosas porque no est como
objetivo de la investigacin establecer relaciones entre variables. Por ejemplo, los censos describen el
estado de variables demogrficas como sexo, edad, ocupacin, salario, nmero de hijos o vivienda, sin
intentar relacionarlas entre s. En otro ejemplo, una empresa encuestadora es contratada por algn
medio de comunicacin para que investigue el estado de la variable preferencia poltica de la poblacin:
en estos casos su nico objetivo es describir la variable en cuestin, sin intentar establecer qu tipo de
relacin puede tener con edad, sexo, etc. A lo sumo, podr cruzar la variable preferencia poltica con
ellas, pero sin intentar un clculo de su grado de correlacin mediante coeficientes especiales como
pueden ser el coeficiente Pearson, el coeficiente Spearman, tarea que ya caer dentro de los objetivos de
una investigacin correlacional, que es en este caso poder hacer predicciones confiables. Por otro lado,
nos permitiremos discrepar con los autores en algunas cuestiones relacionadas con los objetivos de una
investigacin explicativa que, a nuestro entender, son presentados como demasiado laxos.

Esquema 6 - Tipologia de Dankhe (1986)

Tipo de
investigacin
Esquema Propsitos
Exploratoria X Y
X ------ Y
- Identifican variables promisorias
- Sugieren relaciones potenciales entre variables
Descriptiva X Y
X ------ Y
- Describen -miden- las variables identificadas
- Pueden sugerir relaciones potenciales entre variables
(predicciones rudimentarias)
Correlacional X ------ Y - Determinan correlacin entre variables(predicciones ms firmes)
Explicativa X -----> Y - Sugieren vnculos causas entre las variables. O sea, buscan
explicar por qu estn correlacionadas (explican una variable a
partir de otra/s)

Una investigacin explicativa no se limita a sugerir vnculos causales entre variables sino que,
fundamentalmente, se propone probarlos, para lo cual debe constatar que se cumplen los tres requisitos
bsicos que definen un vnculo de ese tipo: primero, que haya correlacin significativa (lo que ya fue
probado en la investigacin correlacional), segundo, que la supuesta causa ocurra antes que el efecto, y
tercero, que haya suficientes motivos para descartar la influencia de otros posibles factores causales,
adems del que se estudia. La investigacin explicativa se centra particularmente en esta ltima
cuestin, y el recurso casi obligado para ello es el experimento.
Segn algunos autores, la investigacin correlacional tendra un cierto valor explicativo porque
proporciona 'explicaciones parciales', entendiendo por tales las que informan acerca de un nico factor, y
no de todos los factores que inciden en un fenmeno. A nuestro entender, un anlisis de correlacin no
intenta probar un vnculo causal, sino constatar estadsticamente un nivel de asociacin entre variables.
Por lo tanto, si algn sentido tiene la expresin 'explicacin parcial' aplicada al anlisis de correlacin,
ste slo puede consistir en que la presencia de correlacin es slo uno de los tres requisitos del vnculo
causal antes indicados.
Debido a que un anlisis de correlacin, por ltimo, no intenta probar conexiones causales, no resulta
feliz la expresin 'correlacin espuria', utilizada por algunos autores. Segn estos, entre dos variables
pueden existir 'correlaciones espurias', lo que ocurre cuando, a pesar de existir entre ambas existe una
alta correlacin, no estn vinculadas causalmente, como el caso de la estatura y la inteligencia. A nuestro
entender, lo correcto sera decir 'causalidad espuria' porque en el caso indicado no hay duda de que hay
correlacin y, en todo caso, lo que se pone en tela de juicio es la presencia o no de un vnculo de
causalidad.

Algunos ejemplos de investigaciones descriptivas y explicativas


Pgina 113 de 325
113
Hyman suministra algunos ejemplos de investigaciones descriptivas y explicativas realizadas entre 1938
y 1946 en los EEUU. El lector podr apreciar en estos ejemplos algunas de sus caractersticas generales:
a) Tamao grande: se estudia un gran nmero de casos, del orden de los miles (Hyman, 1955:45).
b) Tarea colectiva: Salvo una excepcin, la investigacin no fue llevada a cabo por un estudioso, sino por
una organizacin compuesta por muchas personas (Hyman, 1955:58).
c) Patrocinio y subvencin: A veces, el problema en estudio no es el resultado de la eleccin individual de
un investigador, sino que surge de las necesidades de la otra parte interesada, que patrocina y respalda
la investigacin (Hyman, 1955:71).
d) Temas controvertibles: por lo comn las encuestas giran alrededor de temas controvertibles, y el
marco social donde se emprenden y cualquier solucin propuesta estn generalmente cargado de
conflictos (Hyman, 1955:90).

Esquema 7- Ejemplos de Hyman (1955) de investigaciones descriptivas y explicativas

Encuesta Sub-tipo Ejemplos
Descriptiva Encuesta N 2: La opinin pblica y la bomba atmica
Encuesta N 3: Opinin norteamericana sobre la radio
comercial
Encuesta N 5: Conducta sexual de los
norteamericanos
Explicativa Terica o experimental Encuesta N 4: Prejuicio y personalidad
Encuesta N 6: Conciencia de clase
De evaluacin o programtica Encuesta N 1: Ausentismo industrial
De diagnstico No hay ejemplos

Encuesta nmero 1: Ausentismo industrial.- Cierto organismo estatal de EEUU se propuso investigar
ciertos hechos relacionados con la naturaleza y alcance del ausentismo en la industria blica, as como
tambin determinar algunos de los factores que incidan en l. Se vio que a menudo se identificaba el
ausentismo con mala voluntad por trabajar, y se lo consideraba un mal nacional que amenazaba el
podero blico nacional. Los analistas encontraron que casi nunca se distingua ausencia voluntaria de
involuntaria, y que el tema se trataba en voz baja.
Se entrevistaron 1800 individuos (100 de 18 fbricas diferentes), y se computaron los ndices de
ausentismo por fbrica y por individuo. Las variaciones en estos ndices se relacionaron con las
caractersticas de los obreros, con sus condiciones de trabajo y con el grado de satisfaccin que sentan
respecto de la planta y de la comunidad, todos factores determinados en las entrevistas. Otros factores
se determinaron mediante observacin, como las condiciones objetivas internas de la planta y la
comunidad.
Encuesta nmero 2: La opinin pblica y la bomba atmica.- Una institucin plane sondear la opinin de
los norteamericanos respecto de la bomba atmica y las cuestiones internacionales, con el fin de
incorporar ms elementos de juicio para disear una poltica nacional al respecto. Una institucin sonde
la opinin de una muestra de 3000 personas, y otra una de 600 personas.
Se busc indagar qu conocimiento tenan sobre la bomba atmica, su existencia, su modo de
fabricacin, los responsables de la misma, los pases que la posean, su grado de preocupacin y sus
actitudes frente al control internacional de dicha arma. Tambin se indag opinin sobre relaciones
internacionales, como la relacin del pas con la ONU, con Rusia y con otros pases.
Encuesta nmero 3: Opinin norteamericana sobre la radio comercial.- La Asociacin de Radiodifusoras
se propuso hacer una encuesta para determinar los puntos fuertes y dbiles de la radio y averiguar qu
lugar ocupaba estas en las preferencias del pblico, con el fin de elaborar un plan de radiodifusin.
Se constat que ciertos individuos y grupos criticaban el carcter comercial de la radio y el descuido de
su responsabilidad pblica al no elevar el nivel cultural de sus programas.
Se hicieron entrevistas personales a 2500 personas, buscndose indagar si ciertos programas y
publicidades resultaban satisfactorios a la gente, y se investigaron actitudes frente al control de la radio
por parte del estado. Se indag tambin la actitud de la gente frente a otros medios no radiales. Las
opiniones se relacionaron con las caractersticas personales de los entrevistados, como la frecuencia con
que escuchaban radio, el nivel de instruccin, sexo, edad, zona de residencia, etc.
Encuesta nmero 4: Prejuicio y personalidad.- Una institucin decidi investigar el problema del prejuicio,
lo que inclua un estudio tendiente a demostrar que ciertos factores de la personalidad del hombre
moderno lo predisponen a exhibir hostilidad hacia grupos raciales y religiosos. El propsito primario no
fue utilizar los resultados para hacer un programa contra el antisemitismo, sino contribuir al conocimiento
de las fuentes del antisemitismo, intentando probar empricamente varias hiptesis acerca de lo
correlatos del fenmeno del prejuicio.
La orientacin terica de los investigadores los llev a concluir que el antisemitismo formaba parte de
una pauta ms generalizada de sentimientos prejuiciosos, que integraba a su vez una pauta amplia y
coherente de convicciones polticas y sociales. Se consider que los sentimientos autoritarios eran
consecuencia de un sndrome ms bsico de personalidad, derivado a su vez de experiencias infantiles.
Mediante cuestionarios, se indagaron a 2000 personas sobre antisemitismo, etnocentrismo, ideologa

Pgina 114 de 325
114
poltico econmica y ciertos rasgos ms bsicos de personalidad. Luego, se entrevist una muestra
menor de personas que exhiban tipos particulares de actitudes que surgan de los cuestionarios, para
determinar en detalle sus rasgos de personalidad y su historia y verificar las hiptesis principales.
Encuesta nmero 5: Conducta sexual de los norteamericanos.- Kinsey y colaboradores realizaron
entrevistas para informarse sobre el comportamiento sexual del norteamericano y establecer cules son
los factores que explicaban las diferencias individuales y grupales en cuanto a conducta sexual. Se
confeccion el Informe Kinsey en base a 5.300 entrevistas a varones blancos. Se procur que en los
investigadores no influyeran prejuicios sobre lo que era sano o enfermo en la eleccin de historias o
seleccin de tems. Fue una investigacin que encontr resistencias y crticas en la sociedad, dado lo
controvertido del tema. Se obtuvo informacin sobre la historia de las conductas sexuales de cada
interrogado, y sobre sus caractersticas personales. Se describi la conducta sobre todo en funcin del
orgasmo, determinando su intensidad y frecuencia por distintas vas (masturbacin, emisin nocturna,
desahogo homosexual, relaciones premaritales, extramaritales o maritales, etc.). Se relacion el
desahogo total, la suma de las conductas sexuales y los modos especficos de desahogo con factores
como la edad, la educacin, la religin, el lugar de residencia y otros.
Encuesta nmero 6: Conciencia de clase.- R. Centers proyect una encuesta buscando probar una teora
segn la cual el status y el rol de una persona respecto de los procesos econmicos le imponen ciertas
actitudes, valores e intereses vinculados con su rol y status en la esfera poltica y econmica. Adems, el
status y el rol del individuo, en relacin con lo econmico, despiertan en l la conciencia de pertenencia a
una clase social que comparte esas actitudes, valores e intereses.
La finalidad de esta investigacin era terica, consistiendo en proporcionar una prueba objetiva de las
hiptesis especficas deducidas de esta teora general del grupo de inters en la clases sociales. Centers
se interesaba tanto por el conflicto de clases, como por la contribucin que podan aportar los cientficos
sociales para comprender mejor las crisis, trastornos y cambios sociales.
Se entrevistaron 1.200 individuos adultos, blancos y de sexo masculino, y, a fin de verificar la teora, se
confeccion un cuestionario que abarc tres reas: la orientacin bsica en materia poltico econmica de
los encuestados, la identificacin subjetiva del interrogado con una clase social, y la posicin objetiva de
cada persona segn su nivel de vida, ocupacin y grado de poder o control ejercido sobre otros. La
verificacin de la teora entra correlacionar los distintos ndices de estratificacin con las medidas de
conciencia de clase y de ideologa poltico econmica.

3. INVESTIGACIN TERICA Y EMPRICA

Es posible distinguir dos actividades diferentes y complementarias en el mbito de la investigacin
cientfica: la investigacin terica, que compara ideas entre s, y la investigacin emprica, que compara
las ideas con la realidad.
El escenario clsico de la investigacin terica es la biblioteca, y el de la investigacin emprica el
laboratorio. En rigor, la gran mayora de los investigadores desarrollan al mismo tiempo una actividad
terica y emprica, y la diferencia est mas bien en el nfasis en que ponen en cada una de ellas: hay
investigadores mas bien orientados hacia la teora, y otros hacia la experiencia en la realidad.
En una aproximacin grosera, podemos decir que la investigacin terica es una actividad por la cual
relacionamos ideas entre s, mientras que la investigacin emprica se centra en confrontar las ideas con
la realidad. Y as, cuando el investigador toma contacto con una idea -sea porque se le ocurri a l o
porque la ley en algn lado-, tiene a partir de all dos opciones: relacionar esa nueva idea con otras que
ya conoce (investigacin terica), o intentar examinarla o probarla a la luz de los hechos (investigacin
emprica).

Dentro de la investigacin emprica suele distinguirse la investigacin de laboratorio y la investigacin de campo,
segn el lugar donde los sujetos son investigados. En la investigacin de campo se estudia a los individuos en
los mismos lugares donde viven, trabajan o se divierten, o sea, en su hbitat natural. Si se quiere saber cmo
influye la televisin en la educacin infantil se utilizarn datos sobre nios que ven (o no) televisin en sus
hogares. A nadie se le ocurrira encerrar durante meses o aos a varios nios en un laboratorio mirando
televisin, para ver como evoluciona su educacin. Del mismo modo, tampoco se podra provocar un terremoto
en una habitacin para ver cmo reacciona la gente all ubicada (salvo que se invente un sofisticado sistema de
simulacin de sismos, pero esto ya sera costoso): slo se puede encarar este estudio a travs de una
investigacin de campo, o sea en el lugar natural donde estos fenmenos ocurren. Tcnicas tpicas de
recoleccin de datos en las investigaciones de campo son las encuestas o la observacin participante.
La investigacin de laboratorio, en cambio, 'saca' a los sujetos de sus lugares naturales, los 'asla' de su entorno
llevndolos a un lugar especial, el laboratorio, y que no necesariamente debe tener azulejos o probetas. Un
ejemplo de laboratorio en psicologa es la cmara Gesell, o habitacin donde por ejemplo se deja jugar
libremente a los nios mientras estudiamos sus reacciones a travs de un vidrio que permite verlos, y sin que
ellos puedan advertir la mirada del investigador. Las investigaciones de laboratorio encuentran su justificacin en
que permiten aislar el fenmeno de influencias extraas, de manera tal que, aplicado el estmulo, cualquier
cambio en las respuestas ha de deberse con mucha mayor probabilidad a dicho estmulo y no a otras variables
extraas. En la investigacin de campo los fenmenos en estudio estn ms expuestos a estas influencias
externas, mientras que en las investigaciones de laboratorio puede aislrselos ms de ellas.
Tngase presente que tambin puede introducirse un estmulo en una investigacin de campo, es decir, lo que se
llama experimento puede realizarse tambin en este contexto. Refiere Vander Zanden (1986:619) que el

Pgina 115 de 325
115
experimento puede ser de laboratorio o de campo. En el primer caso se efecta en un recinto especial para
controlar las condiciones con ms cuidado. En el segundo se realiza el experimento en el mundo real,
introduciendo en la vida cotidiana de las personas la variable independiente.
Cierto tipo de investigaciones se prestan para planificarse indistintamente como de laboratorio o de campo. As,
si se quiere saber cmo influyen los ruidos sobre el estrs, hay dos alternativas: a) llevar dos grupos de
personas a un lugar especial aislado, donde se los somete a uno a ruidos fuertes y al otro a ruidos dbiles,
midiendo luego en ambos el estrs resultante (investigacin de laboratorio); b) medir directamente el estrs en
personas que viven en lugares de mucho ruido y en lugares de poco ruido, para evaluar la diferencia
(investigacin de campo).

Tomando como ejemplo al creador del psicoanlisis, podemos decir que hay un Freud terico y un Freud
emprico. El primero es el que compara ideas de diversas teoras, o ideas dentro del mismo psicoanlisis.
En otras palabras, es un Freud ms centrado en examinar relaciones entre ideas, conceptos, hiptesis,
teoras, y de aqu que gran parte de la investigacin terica sea investigacin bibliogrfica (la otra parte
no implica contacto con libros, ya que se refiere a la comparacin entre ideas nunca publicadas, fruto de
la imaginacin del cientfico).
El Freud emprico, en cambio, es que est en contacto directo con pacientes en la clnica a los efectos de
poder descubrir o probar sus hiptesis, es decir, est ms directamente centrado en buscar inspiracin en
los hechos para construir una teora o en la confrontacin de la teora con la realidad.
Por ejemplo, el Freud terico (Freud S, 1916) establece una comparacin entre los sueos, actos fallidos
o actos sintomticos, con los sntomas neurticos: al comparar ideas entre s est haciendo investigacin
terica. En cambio el Freud emprico (Freud S, 1909) es el que toma contacto con los pacientes
intentando verificar sus hiptesis sobre el sntoma, sobre los sueos o sobre los actos fallidos.
En ltima instancia, la existencia de ambos modos de investigar se justifica a partir de la necesidad de
satisfacer dos exigencias igualmente importantes en el conocimiento cientfico: la coherencia lgica de las
ideas (investigacin terica), y la adecuacin de las mismas con la realidad (investigacin emprica).
Centrarse exclusivamente en probar las hiptesis mediante los hechos implica el riesgo de descuidar la
conexin lgica entre las mismas hiptesis, con lo cual no puede organizarse el conocimiento en teoras,
es decir, en sistemas hipottico-deductivos donde unas ideas estn conectadas con otras por deduccin.
Y al revs, concentrarse exclusivamente en armar una teora lgicamente coherente mediante la
comparacin de ideas, implica el riesgo de construir un sistema especulativo que no tiene nada que ver
con la realidad, es decir, de armar una teora perfectamente lgica pero tambin perfectamente falsa.
La relacin entre investigacin emprica e investigacin terica puede comprenderse mejor a partir de la
siguiente secuencia natural del proceso general de la investigacin: a partir del examen de los hechos,
los cientficos emprenden una investigacin emprica (tpicamente exploratoria) que desembocar en la
elaboracin de una hiptesis o teora. Esta a su vez requiere ser verificada, para lo cual se vuelve a
realizar una investigacin emprica con ese propsito (tpicamente explicativa).
En este esquema, las investigaciones tericas aparecen cuando a) un cientfico se propone comparar
hiptesis o teoras entre s en trminos de nivel de verificacin, simplicidad, coherencia lgica y otros
parmetros, o b) cuando un cientfico se propone comparar investigaciones empricas entre s en
trminos de capacidad predictiva, nivel de verificacin, calidad metodolgica y otos parmetros (actividad
habitualmente llamada metaanlisis). Para cualquiera de estas actividades, al investigador le basta con la
consulta de libros y revistas especializadas, de all que su tarea sea eminentemente una investigacin
bibliogrfica.
La importancia del segundo tipo de estudio terico, es decir, la investigacin sobre investigaciones es
que pone al descubierto sus fortalezas y debilidades. Por ejemplo (Annimo, 2005), una revisin de los
estudios ms importantes publicados entre 1990 y 2003 en revistas cientficas influyentes revelaron que
casi un tercio de los mismos mostraron resultados contradictorios o dbiles. En dicha revisin se indic
que los hallazgos contradictorios y potencialmente exagerados son muy comunes en la investigacin
clnica, por lo que tanto mdicos como pacientes no deben poner tantas esperanzas en un solo estudio
porque los tratamientos suelen volverse obsoletos. Por ejemplo, un estudio contradictorio hall que el
xido ntrico no aumentaba la sobreviva de pacientes respiratorios, a pesar de las confirmaciones previas,
y que las terapias hormonales de reemplazo para mujeres menopusicas demostraron tener un efecto
adverso como protectores de enfermedades cardiovasculares, cuando antes se haba concluido lo
contrario. Tampoco la vitamina E logr prevenir los infartos.

4. INVESTIGACIN CUALITATIVA Y CUANTITATIVA

Cook y Reichardt hacen referencia a dos mtodos de investigacin: los cualitativos y los cuantitativos.
Los autores sostienen al respecto dos cuestiones:

a) El que un investigador utilice uno u otro mtodo no depende del paradigma que sostenga. De hecho,
se han utilizado mtodos cualitativos dentro de paradigmas cuantitativos, y viceversa. Los autores
suministran ejemplos de ello en relacin con los diversos tems que los diferencian (tems que se indican
en el esquema 8).
- Del paradigma cualitativo se dice que postula una concepcin global fenomenolgica, inductiva,
estructuralista, subjetiva, orientada al proceso y propia de la antropologa social.

Pgina 116 de 325
116
- Del paradigma cuantitativo, en cambio, se dice que posee una concepcin global positivista,
hipottico-deductiva, particularista, objetiva, orientada a los resultados y propia de las ciencias
naturales.

De acuerdo con algunos autores (Rubio J y Varas J, 1997:237), el mtodo cualitativo opera en dos
momentos: 1) en un primer momento el investigador intenta (mediante grupos de discusin, entrevistas
abiertas, historias de vida, etc.) reproducir los discursos de determinado grupo social, comunidad o
colectivo. O en su caso, produce o recopila documentos (relatos histricos, biogrficos, tradiciones orales,
etc.) referidos al mbito o poblacin en la que se centra la investigacin. 2) Posteriormente, se analiza e
interpreta la informacin recogida.

Esquema 8 Paradigmas de la investigacion cualitativa y cuantitativa (Cook y Reichardt).

Paradigma cualitativo Paradigma cuantitativo
Aboga por mtodos cualitativos. Aboga por mtodos cuantitativos.
Fenomenalismo y Verstehen (comprensin):
interesado en comprender la conducta humana
desde el propio marco de referencia de quien
acta.
Positivismo lgico: busca los hechos o causas de
los fenmenos sociales, prestando escasa atencin
a los estados subjetivos de los individuos.
Observacin naturalista y sin control. Medicin penetrante y controlada.
Subjetivo. Objetivo.
Prximo a los datos; perspectiva 'desde dentro'. Al margen de los datos; perspectiva 'desde fuera'.
Fundamentado en la realidad, orientado a los
descubrimientos, exploratorio, expansionista,
descriptivo e inductivo.
No fundamentado en la realidad. orientado a la
comprobacin, confirmatorio, reduccionista,
inferencial e hipottico deductivo.
Orientado al proceso Orientado al resultado.
Vlido: datos 'reales', 'ricos' y 'profundos'. Fiable: datos 'slidos' y repetibles.
No generalizable: estudios de casos aislados. Generalizable: estudios de casos mltiples.
Holista. Particularista.
Asume una realidad dinmica. Asume una realidad estable.

b) La oposicin radical entre ambos tipos de mtodo no tiene sentido, y resaltan los beneficios
potenciales del empleo conjunto de ambos mtodos. Se mencionan tres razones por las cuales pueden
emplearse conjuntamente ambos mtodos:
- Objetivos mltiples, que obligan a usar diferentes mtodos.
- Los dos mtodos pueden vigorizarse mutuamente, brindando cada uno lo que el otro no puede dar.
- Como ambos mtodos tienen prejuicios, slo cabe llegar a la verdad usando tcnicas diferentes con
las que se harn triangulaciones.
Usar ambos mtodos tiene tambin sus desventajas: a) puede ser caro, b) puede suponer demasiado
tiempo, y c) se puede carecer de adiestramiento en ambos mtodos.

5. INVESTIGACIONES PRIMARIA Y BIBLIOGRFICA

Un ltimo criterio para clasificar las investigaciones guarda relacin con la fuente de los datos
consultados. En este sentido, los datos pueden ser clasificados como primarios o secundarios. Los datos
primarios son aquellos obtenidos directamente de la realidad por mismo investigador mediante la simple
observacin o a travs de cuestionarios, entrevistas, tests u otro medio. Los datos secundarios son los
datos obtenidos de otras personas o instituciones (censos, estudios empricos de otros investigadores,
metaanlisis, etc.). A veces el inters de un investigador recae sobre este segundo tipo de fuentes, y ello
por motivos muy diversos: a) no requieren tanto costo y esfuerzo como la obtencin de los datos
primarios, b) no hay datos primarios disponibles, o c) necesidad de relacionar, sintetizar o integrar
diversas investigaciones basadas en datos primarios, tal como ocurre por ejemplo en los llamados
metaanlisis. En cualquier caso, el investigador habr de asegurarse que no hay razones para desconfiar
de la verosimilitud de los datos secundarios.
Por ejemplo, si un investigador hace un seguimiento de un grupo de pacientes para verificar si un
tratamiento farmacolgico da resultados, est utilizando datos primarios. En cambio, si un investigador
hace una recopilacin, una sntesis o una valoracin de diversas investigaciones sobre ese tratamiento
farmacolgico, estar utilizando datos secundarios.
En funcin de lo anterior, es posible entonces clasificar las investigaciones en primarias, si utilizan
principalmente datos primarios, y en bibliogrficas, si utilizan principalmente datos secundarios, por
cuanto la fuente de los datos secundarios se halla en material publicado (libros, revistas, etc.). En la
prctica, si bien muchas investigaciones se centran en los datos primarios, pueden tambin utilizar datos
secundarios. Es el caso del mdico que adems de obtener datos a partir de sntomas y signos (datos
primarios), los obtiene a partir de informes de laboratorio clnicos o de comunicaciones de familiares
(datos secundarios).

Pgina 117 de 325
117

6. CONCLUSIONES

El propsito principal de de la exposicin de diversas clasificaciones de las investigaciones es el de
proveer un marco de referencia para tipificar una investigacin en particular, sea que ya est realizada,
sea que deba an realizarse. As, por ejemplo, una determinada investigacin puede ser tipificada como
pura, explicativa terica y primaria, si lo que busca es: a) realizar un estudio sobre conocimiento bsico,
b) suministrar pruebas de vnculos causales, c) elaborar una teora sobre el tema elegido y d) basarse
principalmente en datos obtenidos directamente de la realidad en vez de consultar informacin
secundaria.

Pura Exploratoria Emprica Primaria
Bibliogrfica
1
2
Terica Primaria
Bibliogrfica
3
4
Descriptiva Emprica Primaria
Bibliogrfica
5
6
Terica Primaria
Bibliogrfica
7
8
Correlacional Emprica Primaria
Bibliogrfica
9
10
Terica Primaria
Bibliogrfica
11
12
Explicativa Emprica Primaria
Bibliogrfica
13
14
Terica Primaria
Bibliogrfica
15
16
Aplicada Exploratoria Emprica Primaria
Bibliogrfica
17
18
Terica Primaria
Bibliogrfica
19
20
Descriptiva Emprica Primaria
Bibliogrfica
21
22
Terica Primaria
Bibliogrfica
23
24
Correlacional Emprica Primaria
Bibliogrfica
25
26
Terica Primaria
Bibliogrfica
27
28
Explicativa Emprica Primaria
Bibliogrfica
29
30
Terica Primaria
Bibliogrfica
31
32

El esquema intenta ordenar 32 tipos de investigacin combinando algunos de los criterios de clasificacin
propuestos. En el mismo no se ha considerado el criterio que las clasifica como cualitativas y
cuantitativas, principalmente porque en rigor toda investigacin tiene en mayor o menor medida algo de
ambos aspectos. Por ejemplo, en las investigaciones exploratorias tiende a predominar el aspecto
cualitativo, y en las investigaciones correlacionales o explicativas el aspecto cuantitativo.
Debe tenerse presente, por ltimo, que estos tipos de investigacin no suelen encontrarse en la prctica
en estado puro: una investigacin tpica no suele solamente primaria y emprica sino tambin
bibliogrfica y terica, por cuanto es habitual que est precedida por una revisin de la literatura y pueda
incluir alguna consideracin acerca de la teora de base. Si fue clasificada como primaria y emprica es al
solo efecto de destacar que tales fueron sus propsitos principales.

Pgina 118 de 325
118
CAPTULO 8: CAUSALIDAD Y EXPERIMENTO

Antes de comenzar a describir las etapas de la investigacin tpica que constituyen la esencia de la
metodologa de la investigacin, ser conveniente incursionar brevemente en los conceptos de causalidad
y experimento para comprender mejor el resto del libro.
Tpicamente el experimento es el dispositivo creado por el investigador para probar una relacin causal y
cabe enmarcarlo, en ese sentido, dentro de una investigacin explicativa. En el presente captulo se
enfocar la causalidad desde un punto de vista ms metodolgico que epistemolgico, es decir,
atendiendo a las maniobras que realiza el investigador para probar la causalidad y no al concepto de
causalidad en s tal como es utilizado en tanto referente terico de la actividad cientfica. Se har tambin
una breve resea histrica de los mtodos de Stuart Mill, importante antecedente de las actuales
concepciones de causalidad y experimento.

1. CAUSA Y CAUSALIDAD

Unicausalidad y policausalidad

Respecto de la causalidad se pueden sustentar tres posiciones distintas: a) todo fenmeno tiene una
sola causa (principio de unicausalidad); b) algunos fenmenos se deben a una sola causa, pero otros a
varias; y c) todo fenmeno obedece a muchas causas (principio de policausalidad).
El sentido comn sostiene habitualmente la primera postura. En la vida cotidiana las personas suelen
basarse en este supuesto cuando afirman o creen en enunciados tales como "coma manzanas y
adelgazar", o "si estoy enojado se debe simplemente a que usted me hizo enojar", etc., o bien "no
aprob el examen porque el profesor se ensa conmigo". Si las personas se mantienen en esta ilusin
de la nica causa se debe probablemente a que, entre otras razones, en la fantasa podrn controlar la
ocurrencia o la no ocurrencia de los acontecimientos dominando un solo factor, o sea de la forma ms
sencilla. Si alguien piensa que se resfri simplemente porque se desabrig, podr supuestamente
controlar el resfro abrigndose bien.
La psicologa conoce bien esta tendencia. De Vega refiere que el hombre de la calle utiliza un principio
de parsimonia intuitivo cuando busca explicaciones causales a los fenmenos. Tendemos a
sobreestimar el valor de las atribuciones unicausales, a conformarnos con una sola causa plausible,
minimizando otras causas concurrentes (De Vega, 1984).

El principio de unicausalidad es utilizado tambin tendenciosamente para manipular la opinin pblica y
difundir informacin falsa. Cierto ministerio argentino sugiere la idea que diversas afecciones tumorales y
cardacas estn causadas por el cigarrillo. Hace ya mucho tiempo que la ciencia abandon la idea de la causa
nica. Ningn fenmeno, por ms sencillo que sea, tiene una sola causa. En las afecciones indicadas
intervienen gran cantidad de factores que, cuando se dan juntos, producen la enfermedad. Por lo tanto, esta
ocurre cuando la persona fuma, tiene una cierta disposicin gentica a contraer cncer, cuando tiene altos
niveles de colesterol, sobrepeso o estrs, entre otros. Esto explica porqu personas que no son fumadores
activos ni pasivos tienen cncer, y personas que fumaron siempre no contraen cncer.
Es probable que la no referencia al estrs, al smog ni al sobrepeso se deba a que el mismo Estado es en parte
responsable del estrs de los ciudadanos y del smog circulante, y a que algunos funcionarios encargados de
planificar estrategias preventivas padecen ellos mismos de sobrepeso. En suma: el cigarrillo parece cargar con
toda la culpa de cnceres e infartos quedando en la penumbra los dems factores indicados, con lo cual queda
desvirtuada la realidad de las cosas.

Sin embargo, cuando se empieza a advertir que las cosas no son tan sencillas se comienza a sostener
insensiblemente la segunda postura, pero la tercera posicin ya es sustentada por la actitud cientfica.
Aos de investigaciones ensean que la realidad es bastante ms compleja de lo que se supone y que
cualquier fenmeno, por simple y anodino que parezca, obedece a muchas causas que actan
conjuntamente para producirlo. Se podra pensar que la rotura de un vidrio tiene una sola causa: la
piedra arrojada contra l. Este acontecimiento obedece sin embargo a muchas razones que intervienen
simultneamente: el arrojar la piedra, su dureza, su trayectoria, su velocidad, la fragilidad del vidrio, el
propio instinto de agresin, etc. etc. Conoc un nio que habiendo roto una ventana, se justific diciendo
"qu culpa tengo yo si el vidrio es frgil". Podra tambin haber dicho, apelando a otra posible causa,
"qu culpa tengo yo si el vidrio se interpuso en la trayectoria de la piedra".
En suma: si se pretende ser un poco objetivo, debe admitirse que la realidad es compleja y aceptar que
un fenmeno responde a una multiplicidad de causas que, actuando conjuntamente, producirn el
fenmeno en cuestin. Pero, debido a que tampoco conocemos todas las causas que lo producen, slo
podremos decir que la intervencin de las causas conocidas simplemente aumenta mucho la
probabilidad de que el fenmeno ocurra.
Cabe, por ltimo, una pregunta: si los cientficos aceptan el principio de policausalidad, porqu muchas
investigaciones cientficas consideran slo una causa? Es posible citar dos razones importantes: a) es
imposible poner a prueba simultneamente todas las causas posibles (entre otras cosas porque se
desconocen), por lo que el cientfico decide probar uno por uno cada factor causal en investigaciones
separadas e independientes; b) al cientfico suelen interesarle, por razones prcticas, slo ciertos factores

Pgina 119 de 325
119
causales y en ocasiones uno solo. Sostena Freud (1915) que en la causacin de la neurosis intervienen
varias causas, como los factores constitucionales heredados y los conflictos sexuales infantiles. Freud, sin
embargo, se centr en este ltimo factor, porque ese era su inters, aunque, por lo dems, poco poda
estudiarse sobre el factor constitucional en aquel entonces.

Si bien los cientficos suponen el principio de causalidad mltiple, intimamente anhelan a buscar una
nica causa y, en el caso de los fsicos, una nica frmula que permita explicar el todo. Newton unific la
mecnica terrestre con la mecnica celeste creando su mecnica clsica. Maxwell unific la electricidad y
el magnetismo en su teora del electromagnetismo, aunque no pudo resumirlo en una sola frmula sino
en cuatro. Einstein unific la teora de la gravedad de Newton y su propia teora sobre la velocidad de la
luz en su teora general de la relatividad o teora del espacio-tiempo, y hasta el final de sus das intent
unirla a su vez con el electrognetismo con la esperanza que lograr la frmula que lo explicase todo, pero
no lo logr.
De todas maneras tampoco lo iba a explicar todo porque an quedaba por incluir esa realidad subatmica
infinitamente pequea de la que daba cuenta la teora cuntica, que siempre Einstein ignor
olmpicamente porque no tena nada que ver con su visin determinista del universo.
El estudio de las realidades infinitamente pequeas como las fuerzas nucleares fuertes y dbiles mostr
que la gravedad misma no era una fuerza tan intensa: si un objeto cae desde un dcimo piso no sigue
cayendo hasta el centro de la tierra porque lo detendr un pavimento, compuesto por tomos unidos por
fuerzas nucleares fuertes y dbiles, que, entonces, son capaces de detener la fuerza gravitacional.
Hoy en da los fsicos buscan todava una teora que lo unifique todo: la relatividad general y la mecnica
cuntica o, si se quiere, una frmula que sintetice las cuatro fuerzas fundamentales de la naturaleza: la
fuerza nuclear fuerte, la fuerza nuclear dbil, el electromagnetismo y la gravedad, y parece que un
candidato potable es la teora de las cuerdas, supuestamente elaborada por fsicos igualmente cuerdos.
Segn esta teora toda la realidad, desde las mnimas partculas terrestres hasta las estrellas ms
lejanas, estn compuestas del mismo material: cuerdas increblemente pequeas que vibran de
diferentes maneras, diferencias que dan lugar a los distintos tipos de partculas hasta ahora descubiertas
por los fsicos.

Hacia una definicin de causa

Dentro de este principio de policausalidad es posible ahora intentar una definicin de causa en los
siguientes trminos.
Segn el supuesto de la policausalidad, un efecto es producido por varias causas. Las causas que
determinan aprobar un examen son varias: haber estudiado, no estar nervioso, un profesor tolerante,
etc. Esquemticamente, X representan las causas, e Y el efecto:



Indudablemente que estudiar es una condicin necesaria, pero an no es suficiente para aprobar, pues
puede ocurrir que los nervios nos traicionen o el profesor sea muy exigente. Otro tanto podemos decir
de los otros factores: tener un profesor tolerante es condicin necesaria pero no suficiente, pues
adems debemos haber estudiado y no estar nerviosos. Del mismo modo, la sola intervencin del factor
tranquilidad, si bien necesario, no alcanza a ser suficiente por los mismos motivos anteriores. Nuestra
primera conclusin es entonces esta: cada uno de los factores causales, considerados en forma
independiente, son una condicin necesaria pero no suficiente.
Sin embargo, si ahora en vez de considerarlos independientemente los consideramos conjuntamente,
las cosas cambian, porque si todos esos factores se dan juntos entonces aprobamos el examen. Todos
ellos juntos son entonces una condicin suficiente, lo que nos lleva a nuestra segunda conclusin: si
consideramos a los factores causales conjuntamente, funcionan como condicin suficiente. De todo lo
dicho se desprende que una condicin suficiente es el conjunto de todas las condiciones necesarias.
En general, por causa entenderemos toda condicin necesaria y suficiente para que ocurra un
fenmeno. Condicin necesaria es aquella que si no est, el efecto no se produce. Estudiar es condicin
necesaria porque si no estudiamos, no aprobamos. Del mismo modo cierta capacidad mental es
condicin necesaria para el aprendizaje (una piedra no puede aprender), y tambin es condicin
necesaria para ser drogadicto haber tenido alguna experiencia con drogas.
En cambio una condicin suficiente es aquella que si est, el fenmeno se produce. Condicin suficiente
es la suma de estudiar, estar tranquilo y tener un profesor tolerante, pues si se dan estos tres factores
Tranquilidad (X) Aprobar (Y)
Haber estudiado (X)
Profesor tolerante (X)

Pgina 120 de 325
120
aprobamos. Podemos decir tambin que una condicin suficiente para la ceguera es la destruccin del
nervio ptico, o que un conflicto grupal es condicin suficiente para su bajo rendimiento.
En la investigacin cientfica, las condiciones necesarias son importantes porque permiten excluir
factores irrelevantes, y las condiciones suficientes porque permiten incluirlos.
Selltiz, Wrightsman, Deutsch, y Cook (1980) dicen que en la prctica es, sin embargo, muy difcil
encontrar condiciones necesarias y suficientes: la destruccin del nervio ptico no es la nica condicin
necesaria y suficiente para la ceguera, pues sta puede existir an cuando no se haya destruido dicho
nervio, o sea, puede haber otras condiciones distintas que produzcan este efecto. Por ello el cientfico
debe buscar una constelacin de otras posibles causas (adems de la necesaria y suficiente), y que
suelen clasificarse como condiciones contribuyentes, contingentes y alternativas. Veamos un ejemplo,
tomado de los autores mencionados
Es condicin necesaria y suficiente de la drogadiccin el hecho de no poder el sujeto suspender
voluntariamente el consumo de drogas: si no puede suspender este consumo el sujeto es drogadicto,
pero nadie que investigue sobre las causas de la drogadiccin se puede conformar con esta nica
explicacin. Buscar entonces causas contribuyentes (ausencia de padre), contingentes (el habitual
consumo de drogas en el barrio), y alternativas (presencia de un padre hostil).
Condicin contribuyente es aquella que aumenta las probabilidades de ocurrencia del fenmeno, pero no
lo hace seguro. La ausencia de padre aumenta las probabilidades que el adolescente sea drogadicto.
Sin embargo, esta condicin contribuyente podr funcionar efectivamente como causa siempre y cuando
en el barrio el consumo de droga sea habitual (condicin contingente). Y as, una condicin contingente
es una situacin especial en la cual la condicin contribuyente puede realmente actuar como causa. En
suma: en las vecindades donde el uso de drogas est generalizado (condicin contingente), la ausencia
del padre del adolescente (condicin contribuyente), contribuye o ayuda a aumentar las probabilidades
de que el muchacho sea drogadicto. Decimos que aumenta su probabilidad pero no lo hace 100%
seguro, porque adems el sujeto debe no poder desprenderse voluntariamente de su hbito (condicin
suficiente).
La condicin contribuyente (ausencia del padre) tiene una condicin alternativa (presencia de un padre
que trata en forma hostil o indiferente al sujeto). En rigor esta ltima es tambin una condicin
contribuyente en tanto tambin aumenta la probabilidad que el hijo sea drogadicto. Lo que interesa
entonces destacar ac, segn nuestro parecer, es que si una condicin contribuyente tiene alguna
condicin alternativa que es tambin capaz de producir el fenmeno, entonces aumentan an ms las
probabilidades de que este ocurra pues ambas condiciones cubrieron todo o casi todo el espectro de
posibilidades de la situacin del padre.

Requisitos de causalidad

En toda investigacin explicativa lo que se hace es una prueba de causalidad, y para poder probar que
realmente la relacin X-Y es causal deben cumplirse obligatoriamente tres requisitos:
1) Variacin concomitante (correlacin).- X (causa) e Y (efecto) deben variar conjunta o
concomitantemente. Sin embargo, hay muchas situaciones donde dos variables aparecen
estadsticamente correlacionadas, pero que sin embargo, carecen de todo vnculo causal. Por ejemplo,
pues puede ocurrir que X e Y varen en el mismo sentido slo porque son ambas efectos de una causa
desconocida Z.
Evidentemente puede haber una alta correlacin entre el hecho de que un profesor comience una clase
a las 20 horas y otro, en la misma aula, lo haga a las 22 horas, pero ello no significa que la primera
situacin sea la causa de la otra. En estos casos, ambas variables dependen de una tercera, que es la
organizacin horaria de la universidad.
De la misma manera, hay una alta correlacin entre los hechos amanece en Buenos Aires y amanece
en Chile, ya que cada vez que amanece en Buenos Aires, poco despus tambin amanece en Chile. Sin
embargo, nadie se animara a decir que lo primero es la causa de lo segundo. La tercera variable de la
cual dependen ambas es, en este caso, la rotacin de la tierra.
Existe cierta tendencia muy humana a considerar que las simples correlaciones estadsticas indican una
relacin causal. Antiguamente, se pensaba que cuando ocurran ciertos fenmenos como un viento que
soplaba del este, el resultado era que a los nueve meses se produca el nacimiento de un hijo, ya que se
haba atendido a la correlacin viento-nacimiento. Obviamente se trata este de un caso de correlacin
sin causalidad, ya que el viento, si bien poda estar asociado por un nacimiento, nadie hoy en da dira
que el viento es la causa del mismo. Y es que a nadie se le haba ocurrido por entonces relacionar el
coito con el nacimiento: hoy sabemos que la relacin coito-nacimiento no slo es una correlacin sino
que adems tambin es un vnculo causal.

Alternativamente, puede ocurrir que X e Y no aparezcan en un primer momento correlacionadas, pero ello no
significa que no estn conectadas causalmente, ya que otras variables que no podemos controlar en ese
momento pueden estar distorsionando la correlacin subyacente (como por ejemplo errores de medicin). Estas
situaciones especiales no deben hacernos pensar que puede haber causalidad sin correlacin: all donde hay
causalidad siempre ha de haber correlacin, aunque sta pueda aparecer encubierta.


Pgina 121 de 325
121
La existencia de una correlacin (encubierta o no) es condicin necesaria para que hay un vnculo
causal, pero an no suficiente, porque adems deben cumplirse los restantes dos requisitos.
2) Ordenamiento temporal.- Para que X sea causa de Y es preciso que la causa X ocurra
cronolgicamente antes que el efecto Y, o por lo menos simultneamente con l. No se rompe primero
el vidrio y despus tiramos la piedra. Robert Koch, bacterilogo alemn, bromeaba con que haba un
solo caso donde la causa sigue al efecto, y es cuando el mdico va detrs del fretro de su paciente.
3) Eliminacin de otros posibles factores causales.- Para que X sea causa de Y es preciso haber
constatado que no hay otras causas ejerciendo influencia sobre el efecto Y. Si la tarea de establecer la
correlacin era propia de una investigacin descriptiva, el trabajo de eliminar la influencia de otros
posibles factores causales es ya lo ms caracterstico de una investigacin explicativa. En este contexto,
los experimentos son los dispositivos ms aptos para ejercer un control sobre las variables extraas.

2. EL EXPERIMENTO

Definicin

En un sentido amplio, es toda modificacin introducida deliberadamente en la realidad con el fin de
examinar sus efectos o consecuencias. Ejemplo: cuando un nio intenta averiguar si su llanto atrae a su
mam, est realizando un experimento. Un tipo especial de experimento es el experimento cientfico,
donde se manipula una variable con el fin de examinar sus efectos en otra variable
Clsicamente, un experimento es un dispositivo para probar un vnculo causal, para lo cual: a) el
investigador hace intervenir deliberadamente la posible causa (variable independiente) para ver si
influye sobre el efecto (variable dependiente), y b) al mismo tiempo controla la incidencia de otras
posibles causas (variables extraas). Si estas otras causas no influyen o estn controladas, entonces
aumenta la presuncin de que lo que hizo variar el efecto fue la nica causa que se hizo intervenir
deliberadamente. En suma: un experimento es una situacin provocada y controlada.
Oneil (1968) da una excelente definicin de experimento cuando dice que es un modelo particular de
variacin y constancia, es decir, en todo experimento se hace variar X para ver cmo vara Y, mientras
se mantienen constantes todos los otros posibles factores extraos.

La investigacin explicativa puede denominarse, segn Hyman, terica o experimental. Este autor parece
considerar como sinnimos ambos trminos, pero a nuestro criterio cabe hacer una diferencia: en la investigacin
experimental buscamos confrontar una hiptesis con la realidad, mientras que en la investigacin terica
buscamos confrontar hiptesis entre s.
Segn el mismo autor (1984:100), adems del propsito terico o experimental, una investigacin explicativa
puede apuntar a objetivos ms prcticos, de aqu que tambin existan, de acuerdo a denominaciones de Hyman,
estudios explicativos de diagnstico, de prediccin, y de evaluacin o programticos. En este texto centraremos
nuestra atencin en la tarea principal: la prueba de la hiptesis causal.
En otro orden de cosas, si bien lo que caracteriza la investigacin cientfica es la identificacin de las causas de
los fenmenos, en nuestras investigaciones cotidianas no cientficas- muchas veces no nos tomamos esta
molestia. De hecho, podemos resolver muchos problemas sin conocer las causas que los ocasionan, como por
ejemplo: a) Golpeamos duramente el telfono y anda!!!; b) Reemplazamos un electrodomstico que no anda
por otro que s funciona; c) Si la PC anda mal muchos tcnicos ni se preocupan por averiguar la causa:
directamente formatean el disco rgido y reinstalan todos los programas. Estas actitudes son tambin observables
en los mbitos que suponemos cientficos: la esquizofrenia o la epilepsia puede curarse con un electroshock, lo
que no presenta gran diferencia con arreglar un telfono golpendolo.

Campbell y Stanley (1995:9) definen un experimento como aquella "parte de la investigacin en la cual
se manipulan ciertas variables [llamadas variables experimentales] y se observan sus efectos sobre otras
[llamadas variables dependientes]". En todo experimento se debe tomar la precaucin de que sobre la
variable dependiente no influya ningn otro factor (que los autores llaman variable externa), para poder
estar razonablemente seguros que el efecto producido se debe a la variable experimental. Finalmente, se
tomarn ciertos otros recaudos que aseguren que los resultados del experimento podrn generalizarse a
toda la poblacin.
Consiguientemente, los tres tipos de variables involucradas en un experimento son:
a) Variable experimental: Variable que se manipula para conocer cuales son sus efectos sobre otra.
Campbell y Stanley tambin suelen referirse a ella con el nombre de estmulo experimental, y se la
designa con la letra X.
b) Variable dependiente: Variable sobre la cual supuestamente influye la variable experimental, y suele
designrsela con la letra Y. Campbell y Stanley no utilizan estas denominaciones, y suelen referirse a las
variables dependientes como los 'efectos' que se observan o miden (por ello las designan con la letra O,
que indica un proceso particular de observacin o medicin).
Por ejemplo, cuando los autores mencionados esquematizan un diseo en la forma O1--X--O2, estn
queriendo decir que primero se observa o mide la variable dependiente (O1), luego se aplica el estmulo
experimental (X), y finalmente se observa o mide si hubo o no algn cambio en la variable dependiente
(O2).
c) Variable externa: Variable que, de no ser controlada en el experimento, podra generar efectos que se
confundiran con el del estmulo experimental (Campbell y Stanley, 1995:17). Campbell y Stanley suelen

Pgina 122 de 325
122
tambin referirse a ellas con el nombre de hiptesis rivales (Campbell y Stanley, 1995:20), mientras que
otros autores como Selltiz y otros (1965) las llaman hiptesis alternativas. Algunos autores (Arnau Gras
J, 1980) llaman a las variables externas, variables 'extraas', que es la denominacin que se utilizar
preferentemente en este libro.
Mediante un breve ejemplo se puede ilustrar el papel de las variables experimentales, dependientes y
extraas. Si quisiramos hacer un experimento para probar cierto mtodo educacional correctivo,
podramos aplicarlo a un grupo de alumnos durante un tiempo, y luego observar y medir la mejora
producida. Sin embargo, puede ocurrir que la mejora no obedezca al mtodo correctivo empleado, sino
a un factor de maduracin que hizo que durante el tiempo que dur la experiencia los alumnos hicieron
una remisin espontnea de sus dificultades escolares. La hiptesis que sostiene que la mejora obedece
a una remisin espontnea se convierte as en una hiptesis rival que compite con la hiptesis de
investigacin (que dice que la mejora es debida al mtodo correctivo).
En este ejemplo, la variable experimental es el mtodo correctivo, la variable dependiente es la mejora
de los alumnos, y la variable externa es la maduracin. Se hace preciso controlar la influencia de esta
ltima variable, porque de otro modo no podramos saber si la mejora obedeci a ella o al mtodo
correctivo.
Tngase presente entonces, que la variable independiente (VI) se manipula, la variable dependiente
(VD) se mide, y la variable extraa o externa (VE) se controla. Son tres operaciones diferentes: cuando
se manipula la VI se ha hace variar a voluntad del investigador, y para ver si produce algn efecto sobre
la VD, esta deber ser medida. Al mismo tiempo, se procurar anular la influencia de las VE, es decir, se
las controlar.

Medicin de la variable dependiente

En algunos experimentos la variable dependiente se mide antes y despus de la aplicacin de la variable
independiente, para constatar si hubo alguna variacin en ella. En otros, se mide solamente despus. En
un sentido muy amplio, las variables independientes tambin se miden, entendiendo medicin como
asignacin de una categora. Precisamente cada categora de la variable independiente suele
denominrsela tratamiento experimental.

Manipulacin de la variable independiente

Hay dos formas de manipular la variable independiente: cuando el investigador provoca la variacin de la
variable est haciendo una manipulacin de facto, mientras que cuando selecciona variaciones ya
producidas naturalmente est haciendo una manipulacin ex post facto, expresin latina que significa
"despus de ocurrido el hecho". Esta terminologa se propone en este libro. Muchas veces la VI se
manipula ex post facto por existir cuestiones prcticas o ticas que impiden la manipulacin de facto.
Tambin depende del tipo de investigacin experimental emprendido: en las investigaciones de
laboratorio se realizan manipulaciones de facto, mientras que en las investigaciones de campo pueden
realizarse ambos tipos de manipulacin.
Ejemplo 1) Para estudiar la incidencia del estado civil de los padres en la condicin de drogadiccin filial,
se seleccionan de la poblacin dos grupos: uno de padres casados y otro de padres divorciados. Se trata
de una manipulacin ex post facto, porque los padres ya estaban casados o divorciados antes del estudio.
Si hipotticamente se hubiera realizado una manipulacin de facto, el investigador habra pedido a ciertos
padres que se divorciaran para ver la incidencia de este estado civil en la drogadiccin de los hijos.
Ntese la diferencia: en el segundo caso se ha "provocado" deliberadamente el divorcio, mientras que en
el primero se han "seleccionado" casos de divorcio ya ocurridos naturalmente.
Ejemplo 2) La indagacin de la relacin ruido-hipoacusia puede llevarse a cabo como investigacin de
campo o como investigacin de laboratorio. En este ltimo caso se lleva a los sujetos a un lugar especial
-el laboratorio- y un grupo es expuesto a los ruidos y el otro no (manipulacin de facto). En la
investigacin de campo, en cambio, los ruidos o los no-ruidos ya estn en los lugares naturales donde la
gente vive (manipulacin ex post facto), con lo cual bastar con seleccionar el grupo experimental en la
poblacin con ambiente ruidoso, y el grupo de control en la poblacin de entorno ms silencioso.
Ejemplo 3) Como tercer ejemplo se pueden mencionar investigaciones que indagan la influencia del
mtodo de aprendizaje de lectoescritura (variable independiente) sobre el rendimiento del alumno en
lectoescritura (variable dependiente). Concretamente, se trata de averiguar si es ms eficaz el mtodo
silbico o el mtodo global, eficacia medible a partir de los respectivos rendimientos de los alumnos.
Una investigacin como la descrita puede realizarse, de dos maneras: a) Manipulacin ex post facto: se
seleccionan alumnos o ex-alumnos de escuelas donde ya se hayan implementado los mtodo silbico y
global, y se procede a comparar los respectivos rendimientos. b) Manipulacin de facto: se seleccionan
dos escuelas y se les propone aplicar, desde el comienzo del ciclo lectivo, una el mtodo silbico y otra el
mtodo global, y despus de uno o dos aos se analizan los rendimientos de los alumnos en cada una de
esas instituciones educativas.
A este ltimo tipo de manipulacin pueden oponrsele objeciones de tipo tico, porque se est
exponiendo a la poblacin de una de las escuelas a un mtodo que considerado ineficaz y por ende
perjudicial para los propsitos educativos.

Pgina 123 de 325
123
Ejemplo 4) Un ejemplo de manipulacin de facto en una investigacin de campo ocurri durante el
"experimento" llevado a cabo por Orson Welles (aunque su intencin no haya sido hacer una
investigacin sino lograr un efecto espectacular), cuando un buen da se le ocurri transmitir por la radio
una falsa noticia: estaban descendiendo platillos voladores en las afueras de la ciudad, y los
extraterrestres se acercaban amenazantes para invadir el planeta. Durante mucho tiempo se coment el
descomunal efecto que produjo en la gente, que huy despavorida y hubo incluso algunos suicidios. Se
trata de un ejemplo donde la manipulacin de la variable independiente (invasin extraterrestre) fue
ejercida de facto, es decir, se provoc su presencia deliberadamente, y termin ejerciendo su influencia
sobre la variable dependiente (conducta de la poblacin) en la forma indicada.

Grupo experimental y grupo de control

Muchos experimentos comparan dos grupos. Una vez extrada una muestra de una poblacin, dentro de
la misma se seleccionan al azar dos grupos: el grupo experimental y el grupo de control. Se llama grupo
experimental al que se somete a la influencia del posible factor causal que interesa (X), o sea a la
influencia de la variable independiente o experimental, y se llama grupo de control a cualquier otro grupo
usado como referencia para hacer comparaciones. Habitualmente los grupos de control son aquellos a los
que no se somete a la influencia del posible factor causal. Ejemplo: a los efectos de investigar el estrs,
el grupo experimental es el sometido a distintas intensidades de ruidos, y el grupo de control no. Otra
posibilidad sera que a los diferentes grupos se los sometiera a diferentes intensidades de sonidos, en
cuyo caso todos seran experimentales porque recibiran la influencia de X, pero al mismo tiempo seran
grupos de control porque permitiran establecer comparaciones.
Por ltimo, hay investigaciones donde se utiliza un solo grupo. En estos casos, este grupo funcionar
como grupo experimental cuando recibe la influencia de X, y en otro instante de tiempo funcionar como
grupo de control cuando no recibe esa influencia.

Experimento y no experimento

Un experimento implica siempre en mayor o menor medida crear una situacin controlada, donde
mantenemos constantes ciertos factores y hacemos variar otros. Pero a veces, para probar una
hiptesis, no podemos recrear una tal situacin, y debemos esperar a que ocurra espontneamente.
Esto se aplicara por ejemplo en el caso de querer verificar la hiptesis de la periodicidad de las
manchas solares o de los eclipses, en cuyo caso no tenemos otro remedio que esperar una determinada
fecha para ver si se producen o no, y para colmo tampoco se pueden mantener constantes todos los
otros posibles factores extraos.
En cambio si lo que se quiere es verificar la temperatura de ebullicin del agua, aqu s se puede crear
una situacin donde se pone a hervir agua y se comprueba con un termmetro a qu temperatura se
transformar el vapor, manteniendo al mismo tiempo constantes otros factores como presin
atmosfrica, cantidad de solutos disueltos, etc. Esta ltima es, entonces, una investigacin claramente
experimental, mientras que el caso anterior del eclipse corresponde a una investigacin no
experimental.

Limitaciones del experimento

En las investigaciones no experimentales debe esperarse a que ocurra el fenmeno para luego
estudiarlo, y por ello se las llama tambin investigaciones ex-post-facto (despus de ocurrido el hecho).
No es costumbre provocar la drogadiccin para estudiar luego sus consecuencias, as como tampoco se
suele provocar un plenilunio (luna llena) para ver cmo influye sobre el comportamiento criminal de las
personas, con lo cual en estos dos ltimos casos no puede emplearse un experimento.
Realizar experimentos en ciencias sociales presenta algunas dificultades especiales: a) experimentar con
seres humanos suele tener una limitacin tica. La alternativa podra ser encarnizarse con animales no
humanos, pero aqu surge otra dificultad: puede desconocerse hasta qu punto las conclusiones
obtenidas sobre animales son extensibles a los seres humanos. De hecho este problema se presenta
an en ciencias biolgicas, cuando se investigan nuevas drogas para curar enfermedades; b) el ser
humano es particularmente complejo, y por lo tanto puede resultar problemtico que un experimento
pueda controlar una mayor cantidad de variables extraas.

Experimento y diseo experimental

El diseo experimental es un plan general para hacer un experimento, de la misma manera que el plano
de una casa es un plan para construirla. Oneil (1968) define experimento como un modelo particular de
variacin y constancia, definicin aplicable tambin al diseo experimental. Es particular porque se
aplica a una muestra concreta, no a toda la poblacin, con lo cual luego deber resolverse si las
conclusiones obtenidas para la muestra son igualmente aplicables a toda la poblacin, tarea que
competer a la estadstica inferencial.

Pgina 124 de 325
124
Tambin es un modelo de variacin, porque el experimento consiste en hacer variar la variable
independiente X para ver si tambin vara la variable dependiente Y. Es tambin un modelo de
constancia porque al mismo tiempo que se hace variar las variables principales se deben controlar la
influencia de las variables extraas, lo que puede hacerse mantenindolas en valores constantes.

Validez interna y validez externa del experimento

Es posible probar dentro de los estrechos lmites del laboratorio que el ruido produce estrs (validez
interna), pero, la conclusin es aplicable a todas las otras personas que no participaron del
experimento (validez externa)?
Siguiendo cierta nomenclatura clsica, se dice que un experimento tiene "validez interna" cuando puede
probar, con cierto margen de confiabilidad, que X es la causa de Y, y que el efecto Y no obedece a otros
factores tales como el azar o la influencia de variables extraas. Asimismo, se dice que un experimento
tiene "validez externa" cuando sus resultados pueden, tambin con cierto margen de confiabilidad,
generalizarse a toda la poblacin, es decir, cuando hay una cierta seguridad que durante el experimento
no estn ejerciendo influencia ciertos factores que, se supone, tampoco actan en la poblacin. Validez
externa es, entonces, sinnimo de representatividad de la muestra experimental, y su importancia reside
en que la representatividad permite la generalizacin y sta, a su vez, aumenta la capacidad predictiva
de la hiptesis.

En los trminos de Campbell y Stanley, la validez interna es la "mnima imprescindible, sin la cual es imposible
interpretar el modelo: introducan, en realidad, una diferencia los tratamientos empricos en este caso
experimental concreto?. [Por su parte], la validez externa "plantea el interrogante de la posibilidad de
generalizacin: a qu poblaciones, situaciones, variables de tratamiento y variables de medicin puede
generalizarse este efecto?" (Campbell y Stanley, 1995:16). Por consiguiente, de acuerdo a Campbell y Stanley las
variables 'externas' conciernen a la validez 'interna', aclaracin que hacemos para evitar que el lector se confunda
al respecto (razn por la cual se prefiere en este libro la denominacin variable extraa).

Arnau Gras indica que "el problema surge cuando se produce una incompatibilidad entre ambos tipos de
validez. En efecto, los controles que se utilizan para asegurar la validez interna tienden a comprometer
la validez externa, es decir, a medida que se aumentan las restricciones sobre la situacin experimental,
desfiguramos totalmente el contexto y limitamos automticamente la representatividad de la misma.
Esto llevar, sin duda, a preguntarse, en el caso que se hallen comprometidos los dos tipos de validez,
cul de los dos deber prevalecer. Segn Campbell (1957), la respuesta es clara: deber darse prioridad
a la validez interna. Siempre ser mejor para la ciencia conseguir probar hiptesis que sacrificarlas en
aras de generalizaciones vagas o imprecisas" (Arnau Gras J, 1980:350-352).
No obstante, debe tenerse presente que Campbell y Stanley siguen considerando como objetivos dignos
de alcanzar a los diseos ricos en una y otra validez. "As ocurre, particularmente, respecto de la
investigacin sobre mtodos de enseanza, donde el desidertum ser la generalizacin a situaciones
prcticas de carcter conocido" (Campbell y Stanley, 1995:17).
Finalmente, hasta qu punto pueden resolverse los problemas de la validez interna y la validez externa
en un diseo experimental? Al respecto, Campbell y Stanley sealan que mientras "los problemas de
validez interna son susceptibles de solucin dentro de los lmites de la lgica de la estadstica
probabilstica, los de validez externa no pueden resolverse en estricto rigor lgico en una forma ntida y
concluyente" (Campbell y Stanley, 1995:39), habida cuenta de que, como dijo Hume, 'la induccin o
generalizacin nunca tiene una plena justificacin lgica', es decir, los resultados del experimento no
pueden generalizarse concluyentemente a toda la poblacin.
Campbell y Stanley sugieren una solucin a este problema de validez externa, que consiste en procurar
la mxima similitud entre experimentos y condiciones de aplicacin (que sea compatible con la validez
interna), por cuanto la generalizacin resulta ms 'vlida' cuanto ms se asemeje la situacin
experimental y la situacin con respecto a la cual se desea generalizar. El fundamento de este
procedimiento se encuentra en la hiptesis de Mill acerca de la legalidad de la naturaleza, y que
Campbell y Stanley describen como el supuesto del 'aglutinamiento': "cuanto ms cercanos se hallan dos
acontecimientos en tiempo, espacio y valor..., ms tienden a ajustarse a las mismas leyes" (Campbell y
Stanley, 1995:40).

Las variables extraas

Cuando se intenta averiguar si X es la causa de Y casi siempre existe la sospecha de que hay otras
variables ajenas al experimento en s que pueden estar ejerciendo tambin influencia sobre Y, y
entonces podr ocurrir que Y vara por influencia de esas otras variables ajenas y no por X. Por lo tanto,
deben anularse al mximo estas influencias extraas para saber si realmente la variacin de Y se debe
o no a X. Si por caso el inters est en averiguar la influencia causal de la educacin (X) sobre la
inteligencia (Y), se procurar anular la influencia de variables extraas como por ejemplo la
alimentacin, pues cabe la sospecha que la inteligencia tambin depende de ella. Ntese que se trata de
una simple anulacin metodolgica pues no se est anulando la condicin causal de la alimentacin
como tal, sino slo su influencia (de hecho, los nios del experimento continan alimentndose).

Pgina 125 de 325
125
Las variables extraas tambin han sido denominadas variables de control, factores de prueba, etc. y ha
sido representada con diversos smbolos: con la letra t (Hyman, 1984:346), con la letra "z" (Blalock
(1982:26), etc., adaptndolas a contextos particulares.
Las variables extraas han sido clasificadas de diversas maneras, de las cuales se explicarn dos: a) las
variables pueden ser organsmicas y situacionales, segn dependan de los individuos o de la situacin, y
b) las variables extraas (Campbell y Stanley, 1995) pueden ser fuentes de invalidacin interna o
fuentes de invalidacin externa, segn estn afectando, respectivamente, la validez interna o la validez
externa.

a) Variables extraas organsmicas y situacionales.- Las variables organsmicas son factores que
dependen del sujeto mismo, tales como sus experiencias pasadas y los cambios debidos a la
maduracin o al desarrollo. Si se quiere indagar la influencia de los premios o castigos (X) sobre el
aprendizaje (Y), puede ocurrir que el sujeto aprenda mejor debido a sus cambios madurativos (variable
extraa) y no a los refuerzos, sobre todo si el experimento implica un seguimiento de nios muy
pequeos a lo largo de varios meses. Del mismo modo, si se quiere conocer la influencia del ruido (X)
sobre el estrs (Y), puede ocurrir que ciertos sujetos sean hipersensibles a los ruidos por alguna
experiencia traumtica o simplemente por factores constitucionales, y entonces revelen mayor nivel de
estrs debido a su hipersensibilidad (variable extraa).
Las variables situacionales son factores que dependen del ambiente. Al investigar cmo influye el ruido
sobre el estrs, puede ocurrir que los sujetos elegidos para el experimento habiten en un pas
econmicamente inestable, con lo cual el estrs se ver influenciado tambin por esta condicin
(variable extraa), con lo que se corre el riesgo de no saber si el estrs se debe al ruido o a la
inestabilidad econmica.
Un caso muy especial de variable situacional son las variables derivadas del experimento, ya que
muchas veces ocurre que es el mismo experimento quien influye sobre Y. Al investigar el vnculo ruido-
estrs puede ocurrir que el sujeto, al sentirse como una especie de conejillo de Indias, por ese solo
hecho aumente su nivel de estrs. Quizs estamos usando una amenazadora mquina para medir su
estrs y el individuo se estresa con slo mirarla, con lo cual no se podr saber si tal estrs se debe al
experimento mismo o a los ruidos. Esta influencia que puede ejercer la misma situacin experimental es
llamada accin retroactiva por Oneil, influencia de la pre-medida por Selltiz, efectos de las
mediciones previas segn Blalock, etc., pero todas esas denominaciones apuntan a la misma idea.

Un conocido ejemplo de influencia del experimento y que preocup durante mucho tiempo a los mdicos fue la
llamada hipertensin del guardapolvo blanco. Cuando el mdico intentaba tomarle la presin a una persona, la
sola presencia del galeno munido de un tensimetro bastaba para que la presin subiera espontneamente, con
lo cual el mdico nunca poda saber si la hipertensin era un signo patolgico o simplemente un momentneo
aumento de la presin ante la visin del guardapolvo blanco y el instrumento de medicin.
Otro ejemplo aparece en Blalock (1982). Un grupo de obreras aument su rendimiento laboral pero no debido a
que haba mayor iluminacin y horarios de descanso, como se pensaba, pues cuando estos factores se
suprimieron, el rendimiento no decay. Este se deba en realidad a que fueron separadas y aisladas para realizar
el experimento: esto las halag pues crean estar siendo objeto de un trato preferencial, y entonces aumentaron
su rendimiento.
Los factores debidos al experimento mismo no se ven slo en el mbito de las ciencias sociales: pueden
detectarse tambin en experimentos de microfsica cuando se trata de averiguar la causa de ciertas
caractersticas de las partculas subatmicas. Una de las interpretaciones del principio de incertidumbre de
Heisenberg dice que, cuando el fsico quiere observar la trayectoria de una partcula subatmica, su sola
presencia material hace que esa trayectoria se modifique, con lo cual nunca puede saber hasta qu punto
depende de su presencia fsica o de otro factor que en ese momento resulte importante investigar.

b) Factores de invalidacin interna y externa como variables extraas.- La validez interna queda
comprometida cuando en el experimento estn ejerciendo influencia ciertos factores llamados 'variables
extraas', adems de X. Por ello, estas variables extraas son denominadas 'fuentes de invalidacin
interna'. Se trata de factores que por s solos pueden "producir cambios susceptibles de confundirse con
los resultados de X" (Campbell y Stanley, 1995:38).
Del mismo modo, la validez externa queda comprometida cuando en el experimento estn ejerciendo
influencia ciertos otros factores, que, por ello, son denominados 'fuentes de invalidacin externa'. Estas
amenazas a la validez externa "pueden considerarse efectos de interaccin entre X y alguna otra
variable" (Campbell y Stanley, 1995:38) relacionada con la situacin experimental, con lo cual la
influencia que ejercen valen slo para el experimento, no para toda la poblacin.
El experimento ideal sera aquel que puede controlar la influencia de la totalidad de las fuentes de
invalidacin interna y externa. En la prctica, sin embargo, los diseos experimentales pueden controlar
slo algunas fuentes de invalidacin, y otras no. El esquema 2 muestra precisamente qu fuentes de
invalidacin interna y externa pueden ser controladas por cada diseo experimental (en este caso
aparece el signo ms +), y qu fuentes no pueden controlar (en este caso aparece el signo menos -).
Como puede observarse en el esquema, los diseos experimentales propiamente dichos son, en general,
los que mejor controlan las fuentes de invalidacin interna, porque han sido pensados precisamente para
ello. De hecho, son los diseos que ms recomiendan los autores del esquema (Campbell y Stanley,
1995:31).

Pgina 126 de 325
126
A continuacin se explicarn algunas de las ms corrientes fuentes o factores de invalidacin
mencionados por Campbell y Stanley. Los autores describen un total de 12 fuentes: las primeras 8 son
fuentes de invalidacin interna, y las ltimas 4 son fuentes de invalidacin externa (esquema 2).

1) Historia.- Acontecimientos especficos ocurridos entre la primera y la segunda medicin, adems de la
incidencia de la variable experimental (Campbell y Stanley, 1995:17). "Como es obvio, estas variables
suelen manifestarse con mayor frecuencia en experimentos a largo plazo" (Arnau Gras J, 1980:350-
352). La variable historia es la contrapartida de lo que en el laboratorio fsico y biolgico ha sido
denominado "aislamiento experimental" (Campbell y Stanley, 1995:79).

Un ejemplo de intervencin de la variable extraa historia puede ser el siguiente. Supngase que se quiere
saber si determinada droga produce o no una disminucin de un tumor. Supngase tambin que, en lugar de
elegir animales, para ello, se elige un grupo de personas y, antes de comenzar el experimento, se les mide el
tamao del tumor (esto es lo que Campbell y Stanley llamaran primera medicin). A continuacin se manipula
la variable independiente droga administrndoles a estas personas determinado medicamento. Luego de un
tiempo de dos meses, se pide a los sujetos que vuelvan al hospital para medirles nuevamente el tamao del
tumor (segunda medicin) para ver si aument, si disminuy o si sigue igual.
Supngase que los tumores hayan disminuido significativamente de tamao. En este punto, un investigador un
poco apresurado concluira que su droga surti efecto, pero, si fuese ms cuidadoso, considerara la posibilidad
de la intervencin de la variable extraa historia. En efecto, tal vez la disminucin del tumor no obedeci a la
droga (o solamente a ella), sino al hecho de que durante esos dos meses los pacientes iniciaron por propia
voluntad una dieta estricta, y que fue esta variable extraa la que en realidad produjo el efecto deseado.

2) Maduracin.- Procesos internos de los participantes, que operan como resultado del mero paso del
tiempo, y que incluyen el aumento de edad, el hambre, el cansancio y similares (Campbell y Stanley,
1995:17). El trmino abarca, entonces, "todos aquellos procesos biolgicos o psicolgicos que varan de
manera sistemtica con el correr del tiempo e independientemente de determinados acontecimientos
externos" (Campbell y Stanley, 1995:21).
3) Administracin de tests.- Influencia que ejerce la administracin de un test sobre los resultados de
otro posterior (Campbell y Stanley, 1995:17). "Las medidas tomadas de los sujetos o los tests
previamente suministrados, a fin de obtener datos para la posible formacin de grupos, pueden influir en
los resultados finales, independientemente de la accin del tratamiento" (Arnau Gras J, 1980:350-352).
4) Instrumentacin.- Cambios en los instrumentos de medicin o en los observadores o calificadores
participantes que pueden producir variaciones en las mediciones que se obtengan (Campbell y Stanley,
1995:17). La expresin se refiere entonces a "las variaciones autnomas en el instrumento de medicin
que podran ser la causa de una diferencia O1-O2" (Campbell y Stanley, 1995:24).
En un sentido muy amplio podran incluirse aqu los prejuicios de los mismos investigadores. Rollo May
(1990:25) describe un experimento realizado por Robert Rosenthal, de la Universidad de Harvard,
destinado a comprobar cmo influyen los prejuicios del investigador en los resultados de su experimento.
Para ello, seleccion tres grupos de estudiantes avanzados de la carrera de psicologa, informndoles que
habran de participar en un experimento con ratas que deban recorrer un laberinto.
Al primer grupo de estudiantes les inform que las ratas con las que trabajaran eran muy inteligentes, al
segundo grupo no les dijo nada sobre la inteligencia de las ratas, y al tercer grupo les advirti que sus
ratas eran especialmente tontas.
En realidad, todas las ratas eran aproximadamente iguales en cuanto a su capacidad, y a pesar de ello
los resultados del experimento fueron sorprendentes. Las ratas del primer grupo se desempearon en el
laberinto significativamente mejor que las dems, mientras que las del tercer grupo (supuestamente
tontas) fueron las de peor rendimiento, incluso con un mal desempeo realmente llamativo.
Rosenthal y sus colegas han repetido este experimento con muchas variantes, incluyendo pruebas donde
en vez de ratas se trabajaba con seres humanos. La conclusin fue entonces la siguiente: no hay duda
que el 'prejuicio', o la expectativa del experimentador influye en el rendimiento de los sujetos de prueba,
a pesar de haberse adoptado todos los recaudos necesarios para que los distintos experimentadores
dieran exactamente las mismas instrucciones a sus sujetos.
La pregunta que faltaba responder era: pero entonces, cmo se comunica la expectativa del
experimentador a las ratas u otros sujetos? Al parecer, concluye el equipo de Rosenthal, lo ms probable
es que sea mediante movimientos corporales. Rosenthal est ahora tratando de determinar qu
movimientos son esos y qu y cmo se comunica informacin a travs de los mismos. Para otros
pensadores, adems de los movimientos corporales influira tambin el tono y la inflexin de la voz, y el
lenguaje subliminal infinitamente matizado con el cual nos comunicamos sin saber que suele ser
significativo.
5) Regresin estadstica.- Opera all donde se han seleccionado los grupos sobre la base de sus puntajes
extremos (Campbell y Stanley, 1995:17). Estos puntajes extremos (sean muy altos o muy bajos) hacen
surgir una diferencia entre el pretest y el postest ms all de los efectos de la variable experimental,
diferencia adjudicable al fenmeno de la regresin estadstica.
El concepto de regresin fue planteado por Francis Galton (1822-1911) cuando observ que los hijos de
padres altos tienden a ser menos altos, y los hijos de padres bajos tienden a ser menos bajos que sus
progenitores. Es decir, la talla de los descendientes tiende hacia la estatura media de la poblacin,

Pgina 127 de 325
127
movimiento regresivo que Galton expres en su principio de regresin. Este autor atribuy el fenmeno
como una previsin de la naturaleza destinada a proteger la raza contra los extremos. Posteriormente,
Karl Pearson retom estas investigaciones ideando la ecuacin de regresin, que permite hacer
predicciones o estimaciones de una variable sobre la otra.
Arnau Gras explica esta fuente de invalidacin en los siguientes trminos (1980:350-352): supongamos
que se aplic un test de rendimiento, y se han seleccionado los sujetos con puntajes ms altos (por
ejemplo, superiores al centil 85). Si a estos sujetos, luego de la aplicacin de X, se les toma un segundo
test, la puntuacin media que obtendrn tender a desplazarse hacia la media de la poblacin original, o
sea, tendern a bajar.
Lo mismo hubiese sucedido si se elegan los puntajes ms bajos: en el segundo testo la media del grupo,
baja en el primer test, se desplazara hacia la media real de la poblacin, o sea, sera mayor en este
segundo test. Los efectos de regresin estadstica tienen como causas principales el azar, o bien, las
propias deficiencias de los instrumentos de medicin.
La regresin estadstica es una fuente de invalidacin, entonces, porque es una causa de la diferencia de
puntajes entre un primer test y un segundo test, cuando en realidad la causa que nos interesa realmente
comprobar es la de X: al haber regresin estadstica, los resultados quedan distorsionados por este
factor. El esquema 1 nos ilustra ms claramente el fenmeno de la regresin estadstica.

Esquema 1 El fenmeno de la regresin estadstica en los diseos experimentales

A 100 90 80 70 60 50 40 30 20 10 0 La media aritmtica de una poblacin tiene un valor 50.
B 100 90 80 70 De esa poblacin se extrae un grupo con puntajes altos, donde la
media aritmtica es 85.
C 95 85 75 65 Ms tarde, se vuelve a medir a ste ltimo grupo, obtenindose una
media aritmtica menor (82,5), ms aproximada a la media
poblacional 50.
La diferencia de puntajes entre B y C se debe al fenmeno de la
regresin estadstica y, de haberse aplicado X entre el pretest B y el
postest C, la regresin puede confundirse con los efectos de X.

6) Seleccin: sesgos resultantes en una seleccin diferencial de participantes para los grupos de
comparacin (Campbell y Stanley, 1995:17). Dice Arnau Gras: "la seleccin diferencial de los sujetos
determina en muchos casos que los resultados acusen ms bien las diferencias existentes entre los
grupos, que la accin del tratamiento experimental. Si se quiere probar, por ejemplo, la eficacia de un
nuevo mtodo para el aprendizaje de lectura y se eligen para ello dos clases de alumnos de primer
curso, puede ocurrir, independientemente del mtodo, que el grupo experimental tenga ms habilidad
para la lectura que el grupo control" (Arnau Gras J, 1980:350-352).
7) Mortalidad experimental.- O diferencia en la prdida de participantes de los grupos de comparacin
(Campbell y Stanley, 1995:17), lo que implica por ejemplo casos perdidos, y casos para los cuales slo
se dispone de datos parciales (Campbell y Stanley, 1995:36). Esta fuente de invalidacin es ms
importante si se produce en sujetos ubicados en los extremos de la distribucin (Arnau Gras J,
1980:350-352).
Seala Arnau Gras que "esta posibilidad es muy alta en aquellos experimentos que se programan para
periodos prolongados. Los sujetos pueden enfermar o cansarse, y no acudir cuando se aplican los
tratamientos" (Arnau Gras J, 1980:350-352). Aclaramos que mortalidad experimental significa,
entonces, que los sujetos han 'muerto' a los efectos del experimento, y no necesariamente que hayan
fallecido.
8) Interaccin de seleccin y maduracin, etc.- En algunos de los diseos cuasiexperimentales de grupo
mltiple, como el diseo 10, se confunde con el efecto de la variable experimental (Campbell y Stanley,
1995:17). Arnau Gras seala al respecto que "la interaccin entre seleccin y maduracin, entre
seleccin e historia y otras condiciones puede comprometer seriamente la validez de los resultados
experimentales. Puede ocurrir, por ejemplo, que si bien tanto el grupo experimental como el de control
han presentado puntuaciones similares en el pretest, dado que el grupo experimental se halla ms
motivado, o muestre ms rapidez en captar las explicaciones, obtiene un rendimiento superior en el
retest que el grupo control, independientemente del tratamiento" (Arnau Gras J, 1980:350-352).

Esquema 2 Fuentes de invalidacin para diseos experimentales segn Campbell-Stanley (Preparado
por Pablo Cazau)

Fuentes de invalidacin para diseos
experimentales segn Campbell y
Stanley (preparado por Pablo Cazau)

Estos cuadros se presentan con renuencia, pues
pueden resultar demasiado tiles si se llega a
confiar en ellos y no en el texto del libro.
Ningn indicador de + o debe respetarse, a
Fuentes de
invalidacin interna
(1) Historia
(2) Maduracin
(3) Tests
(4) Instrumentacin
(5) Regresin
(6) Seleccin
(7) Mortalidad
Fuentes de invalidacin
externa
(9) Interaccin de tests y X
(10) Interaccin de seleccin y X
(11) Dispositivos reactivos
(12) Interferencia de X mltiples

Pgina 128 de 325
128
menos que el lector comprenda por qu se lo
ha colocado (Nota de Campbell y Stanley).

Signo negativo: imperfeccin definida
Signo positivo: factor controlado
Signo interrogacin: posible causa de
preocupacin
Espacio en blanco: factor no pertinente
(8) Interaccin

1

2

3

4

5

6

7

8

9

10

11

12
Diseos
pre
experimentales
1. Estudio de casos con
una sola medicin
- - -
2. Diseo pretest-postest
de un solo grupo
- - - - ? + + - - - ?
3. Comparacin con un
grupo esttico
+ ? + + + - - - -
Diseos
experimentales
propiamente
dichos
4. Diseo de grupo de
control pretest-postest
+ + + + + + + + - ? ?
5. Diseo de 4 grupos de
Solomon
+ + + + + + + + + ? ?
6. Diseo de grupo de
control con postest
nicamente
+ + + + + + + + + ? ?
Diseos
cuasi
experimentales
7. Experimento de series
cronolgicas
- + + ? + + + + - ? ?
8. Diseo de muestras
cronolgicas equivalentes
+ + + + + + + + - ? - -
9. Diseo de materiales
equivalentes
+ + + + + + + + - ? ? -
10. Diseo de grupo de
control no equivalente
+ + + + ? + + - - ? ?
11. Diseos compensados + + + + + + + ? ? ? ? -
12. Diseo de muestra
separada pretest-postest
- - + ? + + - - + + +
12a. Variante a del diseo
12
+ - + ? + + - + + + +
12b. Variante b del diseo
12
- + + ? + + - ? + + +
12c. Variante c del diseo
12
- - + ? + + + - + + +
13. Diseo de muestra
separada prestest-postest
con grupo de control
+ + + + + + + - + + +
13a. Variante a del diseo
13
+ + + + + + + + + + +
14. Diseo de series
cronolgicas mltiples
+ + + + + + + + - - ?
15. Diseo de ciclo
institucional recurrente
(diseo de retazos)
02 < 01 y 05 < 04
02 < 03
02 < 04
06 = 07 y 02y = 02o



+
-
-



-
-
-
+



+
-
+



+
?
?



?
?
?




-
+
+



?
+
?








-



+
-
+



?
?
?




+
+
?


16. Anlisis de
discontinuidad en la
regresin
+ + + ? + + ? + + - + +

9) Interaccin de tests y X.- Cuando un pretest podra aumentar o disminuir la sensibilidad o la calidad
de la reaccin del participante a la variable experimental, haciendo que los resultados obtenidos para
una poblacin con pretest no fueran representativos de los efectos de la variable experimental para el
conjunto sin pretest del cual se seleccionaron los participantes experimentales (Campbell y Stanley,
1995:18).
En otras palabras, "el efecto reactivo o interactivo del pretest puede restringir la posibilidad de
generalizacin de los resultados experimentales. La previa aplicacin de un test puede incrementar o
disminuir la sensibilidad de un grupo de sujetos en relacin con la variable independiente. De ah que los
resultados obtenidos de un experimento en el que los sujetos han sido sometidos a una previa prueba,
no podrn ser representativos del efecto de la variable experimental para una poblacin que no ha sido
sometida a dicha prueba" (Arnau Gras J, 1980:350-352).
10) Interaccin de seleccin y X.- Este factor hace referencia a los efectos de interaccin de los sesgos
de seleccin y la variable experimental (Campbell y Stanley, 1995:18). Se trata, en rigor, de un

Pgina 129 de 325
129
problema en el muestreo, es decir, en la seleccin de las muestras para el experimento. Dice Arnau
Gras:"Si los grupos experimental y de control no han sido seleccionados al azar de la poblacin de donde
proceden, los resultados difcilmente podrn extenderse a toda la poblacin. Sobre todo si se parte de
grupos naturales o muestras no representativas es posible que determinado tratamiento interacte con
el grupo experimental debido a sus caractersticas particulares" (Arnau Gras J, 1980:350-352).
11) Dispositivos reactivos.- O efectos reactivos de los dispositivos experimentales, que impediran hacer
extensivo el efecto de la variable experimental a las personas expuestas a ella en una situacin no
experimental (Campbell y Stanley, 1995:18).
El efecto interactivo "suele ocurrir en aquellos experimentos en los que por parte de los sujetos se da
una predisposicin a participar de ellos. Ejemplo tpico de este efecto lo encontramos en aquellos
experimentos que se realizan con estudiantes de primer ao de especialidad, o bien, con sujetos
voluntarios. Los sujetos voluntarios difieren considerablemente de los sujetos no voluntarios y,
consecuentemente, no constituyen una muestra representativa. Este extremo atenta contra el principio
del muestreo probabilstico. De ah que los resultados obtenidos de las situaciones en que los sujetos o
bien estn predispuestos, o bien, tienen cierta familiaridad con las tcnicas experimentales, no pueden
ser considerados como representativos" (Arnau Gras J, 1980:350-352). El factor reactividad se refiere
tambin a que, por ejemplo, el mismo hecho de hacer una medicin previa, ya es un estmulo para el
cambio. Por ejemplo, en un experimento sobre terapia para el control del peso, el pesaje inicial puede
funcionar por s mismo como estmulo para adelgazar, aun sin tratamiento curativo alguno (Campbell y
Stanley, 1995:24).
12) Interferencia de X mltiples.- Pueden producirse cuando se apliquen tratamientos mltiples a los
mismos participantes, pues suelen persistir los efectos de tratamientos anteriores. Este es un problema
particular de los diseos de un solo grupo de tipo 8 o 9 (Campbell y Stanley, 1995:18).
Para Arnau Gras, este factor viene a ser una ampliacin de lo afirmado en el anterior. "As, en aquellos
casos en que el experimento exige una exposicin repetitiva a dos o ms tratamientos, es posible que la
accin de los tratamientos anteriores interacte con los tratamientos posteriores, a no ser que su accin
quede eliminada con el tiempo. Siempre que precisamente no interese conocer el efecto de esta
exposicin sucesiva, como ocurre en los experimentos sobre el aprendizaje y la transferencia" (Arnau
Gras J, 1980:350-352).
La seleccin de las tcnicas de control de las variables extraas es sumamente importante al disear un
experimento, razn por la cual se desarrollar a continuacin ms en detalle esta cuestin.

Control de las variables extraas

Una de los propsitos principales de un experimento clsico es el control de las variables extraas de
manera tal que no ejerzan influencia sobre la variable dependiente, o al menos que se conozca su grado
de influencia sobre ella para luego descontarlo.
Mtodos para controlar variables extraas son los siguientes:
a) Eliminacin.- Cuando se sabe que existe una variable extraa que puede alterar los resultados de la
investigacin, se puede simplemente eliminarla (Pick y Lpez, 1998). Sin embargo, este procedimiento es
muy difcil de aplicar porque las variables, en tanto atributos de los fenmenos, no pueden eliminarse sin
ms. En un ejemplo, nadie puede eliminar los vientos porque ellos podran influir sobre el estado de
nimo de las personas (variable dependiente) adems del estado civil (variable independiente).
b) Evitacin.- Aunque una variable no pueda eliminarse, puede realizarse el experimento en aquellas
situaciones donde la variable extraa no acta. Siguiendo con el ejemplo, sera estudiar el vnculo entre
estado civil y estado de nimo en lugares donde no sopla viento.
c) Constancia.- Si la variable extraa no puede eliminarse ni evitarse, puede implementarse una situacin
donde se mantenga en valores constantes. Siguiendo con el ejemplo, en un lugar donde sopla el mismo
viento en forma permanente, cualquier variacin en el estado de nimo de las personas podr ser
entonces atribuida a las diferencias en el estado civil.
En otro ejemplo (ONeil, 1968), al estudiarse la incidencia del nivel escolar en la amplitud del vocabulario,
puede seleccionarse una muestra con alumnos de la misma escuela, con aproximadamente el mismo
coeficiente intelectual, y con padres con similar amplitud de vocabulario, etc., todas variables extraas
que tambin pueden influir sobre la amplitud de vocabulario de los nios.
Esta tcnica de control se emplea tambin en fsica, cuando por ejemplo se desea estudiar la relacin
entre volumen y temperatura de un gas, manteniendo la presin constante.
En los casos de experimentos con un grupo experimental y otro de control, se pueden mantener
constantes los valores de las variables extraas en ambos grupos mediante la tcnica del apareamiento
(o control por apareo de pares, o equiparacin por igualacin) (Campbell y Stanley, 1995:17)
(Greenwood, 1973:109) (McCall, 1923) (Fisher, 1925), mediante la cual se forman grupos equivalentes,
asignando al azar a cada grupo pares de sujetos con caractersticas psicolgicas iguales (Tamayo,
1999:54). De esta forma la nica diferencia entre ambos grupos ser que uno recibe la influencia de la
variable independiente y el otro no, pudindose as llegar a una conclusin ms segura respecto de su
influencia sobre la variable dependiente.
La tcnica del apareamiento, ms concretamente, consiste en: primero, elegir dos sujetos que sean lo
ms iguales posibles en cuanto a las variables consideradas relevantes; segundo, empezar a formar con

Pgina 130 de 325
130
uno de ellos el grupo experimental y con el otro el grupo de control; tercero, hacer lo mismo con nuevos
pares de sujetos, hasta formar los dos grupos. Este procedimiento asegura, obviamente, la igualdad de
ambos grupos, con lo cual se habr podido controlar la influencia de las variables extraas.
Un ejemplo muy simple: si se quiere probar la eficacia de un determinado mtodo de enseanza, se
eligen dos grupos de alumnos, pero, antes de utilizar con uno de ellos el mtodo en cuestin, se igualan
por emparejamiento o apareamiento: se toman dos sujetos que tengan la misma inteligencia o la misma
motivacin (variables relevantes extraas que tambin pueden influir sobre el rendimiento escolar) y se
envan uno a cada grupo. Se hace lo mismo con otra pareja de sujetos, y as sucesivamente. Con ello,
ambos grupos habrn quedado igualados, en el sentido de que tendrn ms o menos la misma
inteligencia, la misma motivacin, etc., con lo cual, luego del experimento, cualquier variacin entre los
dos grupos, en cuanto a rendimiento escolar, podr ser adjudicada al mtodo de enseanza y no a otras
variables extraas como las indicadas.
d) Balanceo.- Cuando las variables extraas no pueden mantenerse constantes se prepara un dispositivo
de balanceo y de contrabalanceo donde de alguna manera los efectos de una variable extraa se
compensen con los efectos de otra, con lo cual ambas se anulan en el conjunto. Un ejemplo de
contrabalanceo (Pick y Lpez, 1998), aparece en ciertas investigaciones donde se pide a los sujetos que
respondan varias veces a un mismo estmulo o a varios estmulos diferentes. Esta serie de respuestas
puede provocar en los mismos dos reacciones: por un lado, fatiga, porque los sujetos se cansan de estar
respondiendo; por otro lado, aprendizaje, ya que despus de presentar dos o tres veces el mismo
estmulo el sujeto ya sabe cmo responder. Para evitar estos problemas, los grupos se pueden subdividir
en subgrupos para que los efectos de la fatiga y/o aprendizaje queden anulados.
El balanceo de las variables extraas se lleva a cabo mediante un procedimiento similar al diseo
experimental del cuadrado latino (vase ms adelante en este libro) con la salvedad que en este se
balancea variables independientes, no extraas.
e) Aleatorizacin.- Consiste en seleccionar a los sujetos al azar (Campbell y Stanley, 1995:17)
(Greenwood, 1973:109) (McCall, 1923) (Fisher, 1925). Propuesto por Fisher pero anticipado por McCall
en la dcada del '20, se trata de un procedimiento que "sirve para lograr, dentro de lmites estadsticos
conocidos, la igualdad de los grupos antes del tratamiento" (Campbell y Stanley, 1995:18). Esta tcnica
de control es una de los ms sencillas y ms utilizadas en ciencias sociales, sobre todo cuando se llevan
a cabo estudios experimentales. Se parte del postulado de que si la seleccin y distribucin de sujetos en
grupos de control fue hecha al azar, podemos inferir que las variables extraas, desconocidas por el
investigador, se habrn repartido tambin al azar en ambos grupos, y as quedarn igualadas (Pick y
Lpez, 1998).
Por ejemplo, si se quiere estudiar la influencia del ruido sobre el estrs, los sujetos elegidos no podrn
ser todos ellos veteranos de guerra o bien todos ejecutivos, porque entonces las variables extraas
experiencias traumticas y tipo de ocupacin estarn tambin influyendo sobre los niveles de estrs.
En cambio si se toman los sujetos al azar (donde entrarn verosmilmente veteranos y no veteranos,
ejecutivos y no ejecutivos), esto se supone que garantizar la heterogeneidad del grupo en cuanto a
experiencias traumticas y ocupaciones, con lo que la influencia de stas se reducir considerablemente
hasta un nivel aceptable donde su intervencin no resulta significativa, ya que ambos grupos
(experimental y de control) tendrn aproximadamente la misma proporcin de veteranos
La ventaja de la aleatorizacin no reside en su sencillez sino tambin en que permite controlar al mismo
tiempo gran cantidad de variables extraas, incluso aquellas que son desconocidas para el investigador.
Como no se pueden mantener constantes tantas variables extraas al mismo tiempo, se puede lograr el
mismo control mediante la aleatorizacin, situacin en la cual si bien no se mantienen constantes sus
valores, sus fluctuaciones quedan razonablemente neutralizadas.
Cabra preguntarse: para qu recurrir a la aleatorizacin, si se puede controlar las variables extraas
mantenindolas constantes? Sera como decir que al estudiar el vnculo ruido-estrs se seleccionan
solamente a veteranos de guerra (es decir se mantiene constante la variable extraa experiencias
traumticas pasadas) y entonces, cualquier variacin en el grado de estrs entre los que recibieron
ruidos y los que no, se deber solamente al factor ruido ya que ambos grupos, al ser todos veteranos de
guerra, estn en igualdad de condiciones.
Esta solucin sera viable si fuese solamente una la variable extraa que hay que controlar, pero
habitualmente son muchas y realmente resulta muy difcil, cuando no imposible, mantenerlas constantes
a todas, o sea, reunir un grupo homogneo respecto de todas las variables extraas. De hecho, ya poder
seleccionar un grupo donde todos sean veteranos de guerra y al mismo tiempo todos ejecutivos es
bastante engorroso. Se elige entonces el procedimiento de la aleatorizacin: el azar, como la muerte, es
el gran nivelador, y por s solo es capaz de colocar en igualdad de condiciones a todos los sujetos de un
experimento.
La aleatorizacin presenta la ventaja de su fcil implementacin, pero tambin que permite igualar los
grupos con respecto a muchas variables extraas, incluso aquellas que son desconocidas por el
investigador. Se ha adjudicado el mrito de haber introducido esta tcnica de control a Fisher, pero
McCall es en rigor el precursor, cuando dijo un par de aos antes que "as como se puede lograr la
representatividad por el mtodo aleatorio [...] tambin se puede conseguir la equivalencia por el mismo
medio, siempre que el nmero de sujetos sea lo suficientemente grande" (McCall, 1923).

Pgina 131 de 325
131
La aleatorizacin es una tcnica que Campbell y Stanley prefieren al clsico mtodo de la igualacin por
equiparacin (Campbell y Stanley, 1995:18). Es posible tambin una combinacin de equiparacin y
aleatorizacin para obtener mayor precisin estadstica, como en el caso de la tcnica del 'bloqueo'
(Campbell y Stanley, 1995:10; 35/36).
f) Distribucin de frecuencias.- La tcnica de la distribucin de frecuencias (Greenwood, 1973) intenta
igualar los grupos a partir de armar dos que tengan aproximadamente las mismas medidas estadsticas,
como por ejemplo, que ambos tengan la misma media aritmtica y el mismo desvo estndar respecto de
las variables consideradas relevantes.

Pruebas de confirmacin y pruebas de refutacin

Dos tipos de sospechas pueden poner en marcha una investigacin explicativa, y, en particular, un
experimento: primero, se puede sospechar que cierto o ciertos factores S son la causa de un
fenmeno; segundo, que cierto factor NO es la causa de un fenmeno dado a pesar de las apariencias
(por ejemplo, a pesar de la alta correlacin). En el primer caso se emprende una prueba de
confirmacin, y en el segundo caso, una prueba de refutacin.
a) Si el investigador piensa que uno o varios factores son causa de cierto efecto, est haciendo una
prueba de confirmacin. Una prueba de confirmacin no es una prueba donde se confirma una hiptesis,
ya que el resultado puede confirmar o refutar la hiptesis (aceptacin o rechazo), sino una prueba
diseada con la intencin de confirmar la sospecha de causalidad. Si una prueba de confirmacin fuese
una prueba donde se confirma una hiptesis, para qu realizarla si ya se conoce el resultado?
b) Si el investigador piensa, en cambio, que un cierto factor no es la causa de un fenmeno a pesar de
la alta correlacin constatada entre ambas, entonces estar emprendiendo una prueba de refutacin,
como por ejemplo la llamada prueba de espureidad (o prueba de falsedad, pues se busca probar que a
pesar de parecer verdadera, la causa no lo es). La prueba de espureidad tiene la estructura de un
experimento crucial, donde se busca decidir entre dos hiptesis alternativas y donde una de ellas debe
quedar refutada.
Una prueba de refutacin no es, entonces, una prueba donde se refuta una hiptesis sino slo donde se
intenta refutarla, pudindose o no tener xito en dicho intento. La sospecha que pone en marcha este
tipo de investigacin puede surgir antes, durante o despus de una prueba de confirmacin. A veces en
el curso de la investigacin y antes de poder confirmar o rechazar la hiptesis, puede surgir una fuerte
sospecha de que X no es la causa de Y sino Z, o sea, otra variable. En este punto se podrn abandonar
los intentos originales por confirmar y emprender una prueba de refutacin, consistente en tratar de
demostrar que X no es la causa sino Z.
Si bien una investigacin puede estar orientada hacia la modalidad confirmatoria o hacia la modalidad
refutatoria, cuando luego deben aplicarse pruebas estadsticas que apoyen las conclusiones se sigue
clsicamente el esquema de la refutacin plantendose la denominada hiptesis nula.

Experimentos bivariados y multivariados

El experimento clsico es bivariado, es decir, procura probar la conexin entre una variable
independiente (causa X) y una variable dependiente (efecto Y). Tal es el caso del abordaje de hiptesis
como "la memoria depende de la edad", "ambientes con msica aumentan el rendimiento laboral", etc.,
o de aquellas otras que la divulgacin cientfica suele expresar ms literariamente como "el mal humor
es una hormona" y "la tristeza atrae a los virus".
Ejemplos de relaciones bivariadas son las siguientes:

X = Edad Y = Memoria X = Incentivo Y = Rendimiento
X = Nivel econmico Y = Hbitos alimenticios X = Nivel
socioeconmico
Y = Inteligencia
X = Area geogrfica Y = Drogadiccin X = Cantidad de ensayos Y = Nmero de errores
X = Mtodo de
enseanza
Y = Rapidez del
aprendizaje
X = Desercin escolar Y = Drogadiccin
X = Proximidad
elecciones
Y = Voto decidido X = Frustracin Y = Agresin
X = Padres separados Y = Desercin escolar X = Drogadiccin Y = Soledad

Sin embargo, segn las necesidades y posibilidades de la investigacin, tambin puede contemplar el
estudio de ms de una variable independiente o ms de una dependiente, en cuyo caso se habla de
experimentos multivariados, mltiples o factoriales. Tanto los experimentos bivariados como los
multivariados requieren el control de las variables extraas.

Como indican Campbell y Stanley (1995:14), los diseos que estudian una sola variable por vez resultan demasiado
lentos para la investigacin de ciertos temas como al aprendizaje. Desde la dcada del 50 en adelante tiende a
enfatizarse la importancia de considerar diseos multivariados, sea que consistan en estudiar varias variables
independientes a la vez, sea que consistan en estudiar varias variables dependientes, sea que consistan en ambas

Pgina 132 de 325
132
cosas simultneamente. Uno de los pioneros de estos enfoques fue Fisher, cuyos procedimientos eran multivariados
en el primer sentido y bivariados en el segundo.

Por lo general, en los experimentos multivariados la variable dependiente (Y) sigue siendo una sola, y lo
nico que aumenta es el nmero de variables independientes o experimentales (X1, X2, X3, etc.), pues
lo que se busca investigar son varios posibles factores causales al mismo tiempo, con el objeto de
probar cul o cules de ellos influyen como causa y en qu medida lo hacen. Ejemplos de
investigaciones multivariadas son la indagacin simultnea de la edad, el sexo y la situacin familiar
como posibles causas de la drogadiccin. O la msica, el color de las paredes y la temperatura ambiente
como posibles factores que influyen sobre el rendimiento laboral.
Tales diseos multivariados se justifican por ejemplo cuando: a) no se puede aislar y controlar en la
realidad las distintas variables independientes, con lo que no queda otro remedio que considerarlas
conjuntamente mediante un diseo mltiple; b) cuando resulta menos costoso en tiempo y dinero tratar
conjuntamente todas las variables en lugar de hacer varios diseos bivariados separados (como X1-Y,
X2-Y, etc.). Ejemplos de relaciones multivariadas son las siguientes:

Ejemplo 1 Ejemplo 2 Ejemplo 3
Variables
independientes o
experimentales
X1 = Nmero de palabras a
recordar
X2 = Nivel de ansiedad
X1 = Variedad vegetal
X2 = Tipo de suelo
X3 = Clima
X1 = Mtodo de enseanza
X2 = Personalidad profesor
X3 = Proximidad exmenes
Variable
dependiente
Y = Memoria Y = Velocidad de
crecimiento
Y = Rendimiento escolar

En sntesis:



Un inventario de relaciones entre variables

Dentro del esquema de un experimento bivariado y, con mayor razn, dentro de uno multivariado,
existen muchas posibilidades de combinacin entre variables. Sin pretender ser exhaustivos, los
siguientes son algunos ejemplos de ellas:

X Y X2 Y
X1
Xn
Experimento
bivariado
Experimento
multivariado

Pgina 133 de 325
133




Se han clasificado estos diferentes esquemas en lineales y cibernticos. Estos ltimos estudian
especficamente procesos de feedback o retroalimentacin: no es lo mismo estudiar como influye la
alimentacin en la inteligencia (esquema lineal X Y), que estudiar como ambas variables se influyen
mutuamente (X Y).
Ntese que en ninguno de los esquemas se utiliza la letra Y, que representa la variable dependiente o
efecto. En realidad en cualquiera de estos esquemas se puede sustituir alguna X por Y, siempre y
cuando a la Y llegue una flecha y al mismo tiempo no salga ninguna flecha de ella. Estas
sustituciones, sin embargo, careceran de sentido en los esquemas cibernticos, donde todas las
variables son al mismo tiempo independientes y dependientes, pues todas ellas influyen y son influidas.

Esquemas cibernticos
X 10 X
X
11
X
X 12 X X
X X
Xn significa una X o ms
X 1 X
Esquemas lineales
X 2 Xn X
3 X
Xn
X
4 X
Xn
X X
5
X
Xn
X 6
X
Xn
X
X
Xn
7
X
Xn
X X 8
X
Xn
X X
9
X Y
z

Pgina 134 de 325
134
Ejemplo 1) Este es el esquema clsico ms simple, donde se procura investigar la influencia que ejerce
la variable independiente X sobre la variable dependiente Y. Por ejemplo, la influencia de las fases
lunares sobre el comportamiento agresivo.
Mediante este esquema puede llevarse a cabo, por ejemplo, una investigacin para averiguar si el sexo
influye en la forma de percibir los mensajes publicitarios.
Se pueden tomar dos grupos de personas: uno de hombres y otro de mujeres, preferiblemente elegidos
al azar, y pedirles que opinen sobre un mismo mensaje publicitario que se le entrega recortado de un
diario o revista. Como tems para este instrumento de medida (en este caso un cuestionario), se le
pueden preguntar qu fue lo que ms le llam la atencin del aviso (imagen, texto, colores, etc.), si lo
consideran interesante (mucho, poco, nada), qu cree que intenta decir el mensaje (vender, sugerir,
seducir, ensear, etc.), y cualquier otro tem que tambin evale especficamente la forma de percibir.
Una vez contestados todos los cuestionarios, se comparan las respuestas masculinas y femeninas
intentando averiguar si las diferencias son significativas (no debidas al azar, por ejemplo). Finalmente,
convendr que el mensaje publicitario elegido sea neutro respecto del sexo, o sea, que publicite un
producto o servicio tanto para hombres como para mujeres (una aspirina, un viaje al Caribe, etc.), para
que luego las diferencias en las respuestas no sean adjudicadas a la ndole del mensaje sino a las
caractersticas personales de los sujetos.

Ejemplo 2) En este esquema se introduce una variable interviniente, as llamada porque interviene
entre otras dos de manera tal que es efecto de la primera pero a la vez causa de la segunda.
Por ejemplo, es lugar comn considerar que el fro es la causa de la gripe. Sin embargo, esta relacin
no es tan directa: en rigor, podra pensarse que el fro hace que las personas busquen los lugares
cerrados (variable interviniente), lo cual a su vez aumentara la probabilidad de contagio gripal.
Hyman (1984:353-356) propone un ejemplo de variable interviniente. Originalmente, los datos de una
investigacin descriptiva pueden hacer sospechar que el nivel de educacin de las personas (X) es lo
que determina sus intenciones de voto (Y) o sea, sus intenciones por participar activamente del sistema
democrtico, sea porque la educacin ensea la importancia del voto, sea porque simplemente se
advirti una alta correlacin entre ambos factores (personas poco instruidas tienden a no votar,
personas instruidas tienden a querer votar). Esta sospecha surge del siguiente cuadro:

Cuadro I Intencin de voto
Secundario 92%
Primario 82%

Puede sin embargo suponerse que en realidad entre X e Y se interpone una variable interviniente: el
inters en poltica (z), de forma tal que el nivel de educacin determina el inters en poltica y recin
ste es la causa directa de la intencin de votar:



Para examinar entonces esta nueva relacin entre inters en poltica e intencin de voto se recolect la
siguiente informacin, que revela la existencia de un factor causal ms directo (el inters en poltica):

Cuadro II Intencin de voto
Secundario Primario
Mucho inters 99% 98%
Moderado inters 93% 90%
Poco inters 56% 59%

Se podra aqu argumentar que en rigor el nivel educativo es tambin causa, aunque indirecta, de la
intencin de votar. Esto es admisible, pero tambin es cierto que lo que al cientfico le interesa a veces
es una causa ms directa para poder controlar mejor la aparicin o la no aparicin de Y. Es ms difcil
controlar la intencin de votar a partir del nivel educativo pues puede ocurrir que cierto tipo de
educacin no despierta inters en poltica. En cambio el inters poltico es ms seguro para controlar la
intencin de voto. Esta es slo una razn prctica para elegir causas directas, pero hay tambin una
razn terica: no aumenta en mucho el conocimiento de un fenmeno sus causas remotas.
Efectivamente, cuanto ms indirecta o remota sea la causa menor inters tendr para el cientfico: una
Nivel de educacin Inters en poltica Intencin de voto
z Y X

Pgina 135 de 325
135
causa remota de la drogadiccin es por ejemplo la existencia del sol, ya que si no hay sol no hay
fotosntesis, y por lo tanto no hay plantas, y por lo tanto no habr ni cocana ni marihuana, con lo cual
no habr drogadiccin. La explicacin de la adiccin a las drogas por el sol resulta ser inatingente.

Ejemplo 3) Una investigacin que siga este esquema podra consistir en averiguar cmo influyen sobre
el rendimiento escolar el mtodo de enseanza, la personalidad del profesor y la proximidad de los
exmenes. Para examinar todas estas variables a la vez hay varias tcnicas, de las cuales puede citarse
a modo de ejemplo la tcnica del cuadrado latino.
Antes de ser utilizado en la investigacin experimental, el cuadrado latino era un simple entretenimiento
que en la poca medieval reemplazaba a la televisin, slo que haca pensar. Consista en disponer en
una tabla cuadrada letras de tal forma que ninguna de ellas poda repetirse en ninguna columna
vertical- ni hilera horizontal-. Por ejemplo, si las letras eran A, B y C, el cuadrado latino se solucionaba
del siguiente modo:

A B C
C A B
B C A

Aqu la letra A aparece slo una vez en cualquier columna o hilera, y lo mismo sucede con las letras B y
C. Una vez resuelto, se intentaran luego pruebas ms difciles utilizando por ejemplo cuatro columnas,
cuatro hileras y cuatro letras, y as sucesivamente.
Con el cuadrado latino, en el ejemplo indicado, se investigan cuatro variables (tres independientes y
una dependiente), y el nmero de columnas o hileras guarda relacin no con el nmero de variables
sino con el nmero de categoras de las mismas. Si se quiere estudiar la influencia de tres variables
independientes (mtodo de enseanza, personalidad del profesor y proximidad de los exmenes) sobre
la variable dependiente (rendimiento escolar), y tomar tres categoras para cada una de esas variables,
puede organizarse el experimento sobre la base del siguiente cuadrado:

Examen lejano Examen intermedio Examen prximo
Profesor A M1 M2 M3
Profesor B M2 M3 M1
Profesor C M3 M1 M2

En este cuadrado quedaron formados nueve casilleros. En la prctica, esto significa que se han tomado
nueve grupos de alumnos, y as por ejemplo el primer grupo est formado por alumnos que tienen el
profesor A, cuyos exmenes estn lejanos, y con los cuales se utiliz el mtodo de enseanza M1, y as
sucesivamente con los dems grupos. Obsrvese que los nmeros 1, 2 y 3, las tres categoras de la
variable mtodo de enseanza, han sido dispuestas de acuerdo al criterio del cuadrado latino: no se
repite ninguna cifra ni por hilera ni por columna. Esto resulta muy importante porque mezcla todas las
variables y categoras lo suficiente como para que no haya predominio de ninguna en especial en el
conjunto de los nueve grupos. As por ejemplo, si en lugar de haber puesto en la primera hilera
horizontal M1, M2 y M3 se hubiese puesto M1, M1 y M1, en esa hilera habra un neto predominio del
mtodo de enseanza 1 y del profesor A. En cambio, con la disposicin del cuadrado latino se procura
que no aparezcan estos predominios.
Obviamente el cuadrado no contempla todas las posibilidades de combinacin, pues faltan por ejemplo
los grupos con profesor A, cercana de exmenes y mtodo de enseanza 1. Esta y otras posibilidades
fueron anuladas para evitar el predominio anteriormente citado, y los nueve grupos seleccionados
bastan para poder emprender la investigacin con ellos sin considerar los 27 posibles, con el
consiguiente ahorro de esfuerzo, tiempo y dinero.
El hecho de que no aparezcan los predominios indicados tiene un motivo fundamental. Siguiendo con el
ejemplo anterior, si en la primera hilera aparecen predominando el profesor A y el mtodo de
enseanza 1, un muy alto rendimiento escolar en esos tres grupos no se sabra si atribuirlo al profesor o
al mtodo de enseanza, con lo cual habrase desvirtuado el propsito del experimento, a saber,
conocer el grado de influencia causal de cada uno de los factores considerados.
Una vez que se ha seguido durante meses la evolucin de los nueve grupos formados, hipotticamente
pueden haberse obtenido los siguientes valores de rendimiento escolar:

Examen lejano Examen intermedio Examen prximo
Profesor A 9 5 2
Profesor B 6 1 8
Profesor C 3 8 4

Estos valores no son frecuencias sino ndices de rendimiento escolar, que pueden resultar por ejemplo
del promedio de calificaciones de los alumnos de cada grupo. Por ejemplo, 9 fue el promedio de
calificaciones obtenido por el grupo con profesor A, examen lejano y mtodo de enseanza 1.

Pgina 136 de 325
136
Cmo se analiza esta informacin? El primer lugar se puede comenzar observando dnde estn las
calificaciones ms altas (8-8-9), y se ve que coinciden justamente con los grupos donde se aplic el
mtodo de enseanza 1. En segundo lugar se puede observar dnde estn las calificaciones ms bajas
(1-2-3), que aparecen en los grupos donde se us el mtodo de enseanza 3. Ambas observaciones
sugieren que el factor mtodo de enseanza es muy importante para el rendimiento escolar, y adems
que las otras dos variables tienen escasa influencia, ya que por ejemplo tanto en los grupos con bajas
calificaciones como en los de altas calificaciones, existieron diversos profesores y diversos grados de
proximidad temporal al examen. Adems, por ejemplo, cada profesor tuvo alumnos con rendimientos
muy dismiles en sus respectivos tres grupos.
Los resultados de la investigacin tambin podran haber sido estos otros:

5 4 1 6 5 6
4 5 1 7 6 5
9 4 2 5 6 6
Caso A Caso B

En el caso A pueden sacarse dos conclusiones importantes: primero, que el rendimiento escolar
aumenta notablemente con la feliz combinacin del profesor C que imparte el mtodo de enseanza 3
lejos de los exmenes (promedio de calificaciones 9), con lo cual pueden organizarse las clases en un
colegio con estos criterios; y segundo, que la proximidad de los exmenes disminuye notablemente el
rendimiento escolar, pues all las calificaciones fueron bajas (1-1-2) en comparacin con las
calificaciones de los otros grupos.
En el caso B el anlisis de los datos revela que ninguno de los tres factores es ms importante que el
otro, ejerciendo todos ellos una influencia ms o menos igual, que hasta incluso podra ser nula. En el
anlisis de los datos es tan importante darse cuenta qu dicen como qu no dicen, y as, el caso B no
informa acerca del porqu de las calificaciones regulares (5-6-7), lo cual puede atribuirse a alguna
variable contextual como por ejemplo la edad de los alumnos: en la adolescencia, se piensa en cualquier
cosa menos en estudiar.

Ejemplo 4) Este esquema resulta ser una combinacin de los esquemas 1 y 3.

Ejemplo 5) Tericamente cabe la posibilidad de investigar simultneamente dos variables dependientes
(dos efectos) de una nica causa. Tal es el caso del enunciado "el ruido produce estrs y tambin
hipoacusia", pero en estas situaciones lo habitual es desglosar el enunciado en dos hiptesis diferentes
("el ruido produce estrs" y "el ruido produce hipoacusia") y emprender dos investigaciones diferentes y
bivariadas, con lo que se vuelve al primer esquema simple (ejemplo 1). Y si bien es posible tambin
desglosar una investigacin bivariada en varias bivariadas, si se prefiere la primera es porque ahorra
tiempo y esfuerzo o porque no es posible separar en la realidad la influencia de las otras posibles
causas.
El esquema del ejemplo 5 sirve tambin para probar relaciones espreas. Blalock (1982:78) cita un
ejemplo donde se constat una alta correlacin entre la religin y la preferencia poltica, lo que llev a
pensar que era la religin no que determinaba a sta ltima. No obstante, se sospech que en realidad
la influencia provena del tipo de ocupacin, o sea de si las personas eran empleados u obreros. El
esquema correspondiente es:



Los datos que llevaron a la suposicin de un vnculo causal entre X e Y haban surgido del cuadro
siguiente, donde figuran por igual obreros y empleados sin discriminar, ya que an no se sospechaba la
influencia del tipo de ocupacin:

Protestantes Catlicos
Republicanos 62% 38%
Demcratas 38% 62%

Religin
Tipo de ocupacin
Preferencia poltica
z
Y X

Pgina 137 de 325
137
Cuando se empez a pensar en la espureidad de este vnculo entre religin y preferencia poltica se
construyeron dos nuevos cuadros con la misma muestra de sujetos que haba servido para el primero:
uno con empleados solamente y otro con slo obreros, siendo los resultados los siguientes.

Empleados Protestantes Catlicos
Republicanos 56% 24%
Demcratas 14% 6%

Obreros Protestantes Catlicos
Republicanos 6% 14%
Demcratas 24% 56%

Estos datos muestran que efectivamente el vnculo X-Y es espreo, y adems agrega elementos de
juicio favorables a la hiptesis del tipo de ocupacin como factor causal. Este segundo ejemplo nos
muestra adems que el cuadro trivariado del primer ejemplo puede ser desglosado en dos cuadros
bivariados, uno para cada categora de la variable adicional.
Las pruebas de espureidad pueden establecer inequvocamente que la relacin X-Y no es causal, pero
algunas veces no alcanzan para probar simultneamente que Z sea la causa real de Y, con lo cual el
investigador se ve obligado a recurrir a algn tipo de diseo experimental bivariado para llevar a cabo
esta ltima prueba de confirmacin, o bien a realizar una nueva prueba de espureidad si se sospecha de
una nueva variable adicional Z, como factor causal real.
Otro ejemplo donde puede probarse una relacin esprea es el siguiente: una investigacin descriptiva
revel que exista una alta correlacin entre el estrs y el tiempo en que las personas estaban fuera del
hogar. En un primer momento se sospech que el estrs se deba a esas prolongadas ausencias, pero
por uno u otro motivo fue creciendo en el investigador la sospecha de que el tiempo de alejamiento
(variable independiente) no era la causa del estrs (variable dependiente) sino el tipo de ocupacin de
la persona (variable adicional), y que si las dos primeras estaban altamente correlacionadas era porque
sobre ellas actuaba independiente y simultneamente el tipo de ocupacin (o sea, el tipo de ocupacin
influye tanto sobre el estrs como sobre el tiempo de alejamiento del hogar). Esquemticamente:



En este esquema las dos flechas llenas indican que efectivamente Z es causa de X y de Y, y la flecha
punteada indica que la relacin X-Y es esprea, es decir, aparenta ser un vnculo causal pero no lo es.
Pero, cmo se ha procedido para llegar a esas conclusiones?
La alta correlacin existente entre X e Y, que haba hecho suponer al investigador que exista un vnculo
causal, surgi originalmente a partir de la lectura del cuadro siguiente:

% de estresados
Ms tiempo fuera del hogar 80%
Menos tiempo fuera del hogar 60%

Una vez que se afianz la creencia de que este vnculo slo tiene apariencia de causal pero en realidad
no lo es (relacin esprea), y de que la causa pareca ser en realidad el tipo de ocupacin, el
investigador procedi a recoger los datos en un segundo cuadro pero, esta vez, incluyendo la variable
adicional Z para ver si se produca algn cambio:

% de estresados
Ms tiempo fuera del hogar Menos tiempo fuera del hogar
Ejecutivos 81% 78%
No ejecutivos 62% 61%

Este nuevo cuadro trivariado- confirma la espureidad del vnculo original X-Y. En efecto, aqu se
aprecia que la diferencia en el porcentaje de estresados entre los que estn ms tiempo y menos
tiempo fuera del hogar (81% y 78%, o bien 62% y 61%), no es significativa si la comparamos con la
Tiempo de ausencia
Tipo de ocupacin
Estrs
z
Y X

Pgina 138 de 325
138
diferencia en el porcentaje de estresados entre los ejecutivos y los no ejecutivos (81% y 62%, o bien
78% y 61%), todo lo cual indica que el estrs no es debido al mayor o menor tiempo fuera del hogar
sino al tipo de ocupacin.
Ms concretamente, vemos que la diferencia en cuanto a porcentaje de estresados entre ejecutivos y no
ejecutivos es del 19% (que resulta de restar 81% y 62%), diferencia que es grande en comparacin con
la diferencia en el porcentaje de estresados entre los que estn ms tiempo y menos tiempo alejados
del hogar, que es apenas del 3% (resultado de restar 81% y 78%).
Hyman la denomina variable antecedente (z) porque ocurre antes que X e Y.
Otro ejemplo de variable antecedente son los factores genticos. El hecho de que se haya encontrado
una alta correlacin entre la raza (X) y ciertos tipos de cncer (Y) no prueba necesariamente que la raza
sea la causa de esas patologas: raza y cncer dependen de factores genticos (Z), por ejemplo: si se
piensa que entre X e Y hay una relacin causal es porque se constat alta correlacin, pero sta puede
deberse simplemente a que raza y cncer estn determinados por el mismo cromosoma, portador al
mismo tiempo del gen del color de piel (raza) y del gen que predispone al cncer.
Otro investigador podr sospechar otra cosa: que el cncer se debe a la raza y que los factores
genticos no influyen, si por ejemplo piensa que el color de piel hace que los rayos ultravioletas solares
penetren ms profundamente en los tejidos y tengan ms probabilidades de producirles lesiones
malignas. En estos casos la investigacin estar encaminada a probar que X es causa de Y, en lugar de
intentar probar que no lo es por existir otro sospechoso ms convincente (z).

Ejemplos 6 y 7) Estos esquemas resultan ser combinaciones de otros esquemas.

Ejemplo 8) Este caso es citado por caso por Blalock (1982:82) como ejemplo de complicacin de
fuentes de espureidad: el vnculo entre religin (X superior) y preferencia poltica (Xn) puede obedecer
a dos causas comunes (X izquierda y X derecha): la religin y la regin del pas.

Ejemplo 9) Este esquema ilustra lo que Hyman llama variable contextual. Una investigacin descriptiva
realizada en cierto pas (variable contextual) ha revelado que hay una alta correlacin entre el sexo de
los estudiantes y la carrera que estos eligen, ya que por ejemplo los hombres se orientan sobre todo
hacia la ingeniera y las mujeres hacia la psicologa:



Suponiendo que la investigacin haya sido hecha a escala internacional, puede llegarse a advertir que la
relacin sexo-carrera sufre variaciones segn el pas considerado. Podrase quizs constatar que en los
pases socialistas aumenta la proporcin de mujeres que estudian ingeniera, etc. Sobre la original
relacin X-Y est entonces actuando una variable contextual (pas), la que obviamente no se tendr en
cuenta si la investigacin es slo a nivel nacional, en cuyo caso deja de ser variable adicional y pasa a
ser una constante.
Por lo general las variables contextuales son espacio-temporales. La relacin sexo-carrera no slo puede
depender de la regin o pas, sino tambin de la poca considerada: hace 60 o 70 aos la proporcin de
mujeres que estudiaban medicina era considerablemente menor.

Ejemplo 10) Algunas relaciones causales pueden darse en cualquiera de ambos sentidos: si bien es
cierto que el incentivo aumenta el rendimiento, un mejor rendimiento puede a su vez funcionar como
incentivo. O tambin la droga hace que un adolescente falte al colegio, y a su vez la ausencia del
colegio hace que vaya a otros lugares donde puede adquirir el hbito. En ltima instancia cul de los
dos factores ser considerado causa depende de la decisin del investigador, lo que viene a mostrar que
fuera de todo contexto no se puede saber si una variable dada es independiente o dependiente, y slo
se sabr viendo cmo est relacionada con otra variable: si como causa o como efecto. El solo hecho de
pensar que la variable conducta en psicologa es dependiente (bajo el supuesto que la psicologa
estudia las causas de la conducta), no debe excluir la posibilidad de que, en este mismo mbito, pueda
ser considerada a veces como independiente, en la medida que se pretenda investigar cmo influye, por
caso, el comportamiento sobre la autoestima.
Sexo Carrera
Pas
X Y
z

Pgina 139 de 325
139
En algunos de sus escritos Freud consider al sntoma en su doble aspecto de causa y efecto. Lo
entendi como efecto cuando sugiri que un sentimiento de culpa o una intensa fijacin anal (causa)
puede hacer que el paciente sea un manitico de la limpieza (sntoma-efecto); y lo entendi como
causa, cuando agreg que su mana por la limpieza (sntoma-causa) puede tornarse tan insoportable
para el mismo sujeto que se defienda de ella con una extrema suciedad (efecto, o sntoma secundario).

Ejemplos 11 y 12) Estos esquemas resultan ser complejizaciones del esquema 10. Estas variantes
admiten an esquemas ms complejos donde intervienen 5, 10 o 30 variables al mismo tiempo con
realimentaciones positivas y negativas. Por ejemplo: en una ciudad cuando aumenta el nmero de
habitantes aumenta la cantidad de basura; cuando sta aumenta se incrementa la cantidad de
bacterias, y esto a su vez provoca un aumento en las enfermedades infecciosas. Este incremento de
enfermedades a su vez hace descender el nmero de habitantes, lo que a su vez har descender la
cantidad de basura, y as sucesivamente.

Finalmente, puede consignarse que:
a) Los ejemplos 2 y 5 son algunas de las formas en que puede presentarse una prueba de espureidad
b) Los ejemplos 5, 2 y 9 respectivamente, indican segn Hyman (1984:351) tres maneras en que las
variables extraas, que l llama aqu variables adicionales (z), pueden estar ejerciendo su influencia:



Los esquemas nos muestran que z acta como variable antecedente cuando ocurre cronolgicamente
antes de X; que acta como variable interviniente cuando ocurre despus de X; y que acta como
variable contextual cuando ocurre al mismo tiempo (simultneamente) que X.

3. LOS CNONES DE STUART MILL

En el siglo pasado, John Stuart Mill present una serie de procedimientos destinados a descubrir y a
probar conexiones causales, basndose en las ideas de Francis Bacon y algunos autores medievales. En
el presente tem se explican estos mtodos con ejemplos, se exponen comentarios sobre ellos, algunas
de las crticas que han recibido, y se resean brevemente sus antecedentes histricos con el fin de
completar la informacin sobre los conceptos de causalidad y experimento desde un punto de vista
histrico.
John Stuart Mill (1806-1873), filsofo, psiclogo y metodlogo de la ciencia britnico, tuvo que esperar
ms de veinte aos en poder casarse con su novia Harriet Taylor, durante los cuales debi sufrir los
prejuicios victorianos de la poca. Fue, tal vez por eso, un ardiente defensor de los derechos de las
mujeres a decidir por s mismas y no por las presiones sociales (entre otras cosas defendi el sufragio
femenino), y fue tambin tal vez por ello que, decidido a indagar las causas de tal demora, plante sus
famosos cnones para descubrir y probar vnculos causales.

Una presentacin de los mtodos de Mill

Comenzaremos dando una explicacin sencilla de cada uno de los mtodos de Stuart Mill, para lo cual
nos guiaremos siguiendo el esquema 1. Asimismo, utilizaremos un mismo ejemplo hipottico para todos
los mtodos, para simplificar la explicacin.
El ejemplo en cuestin es el siguiente: se trata de utilizar los mtodos de Mill para descubrir y probar las
causas de los problemas de aprendizaje en los nios (fenmeno). Entre las causas posibles estn A (mala
alimentacin), B (el colegio), C (el maestro), y D (los vnculos familiares). Antes de ver cmo se aplican a
este problema los mtodos de S. Mill, hagamos una breve aclaracin sobre la expresin "circunstancias
antecedentes" que aparece en el esquema 1.
X Y
z
Variable antecedente Variable interviniente Variable contextual
z Y X
X Y
z
EJEMPLO 5 EJEMPLO 2 EJEMPLO 9

Pgina 140 de 325
140
En principio, la expresin 'antecedentes' puede tener dos sentidos distintos, que podemos designar como
ontolgico y metodolgico: 1) en un sentido ontolgico, circunstancias antecedentes son circunstancias
que ocurren temporalmente 'antes' que el fenmeno (Copi, 1974:431). Por ejemplo, el ruido se produce
antes que la reaccin de estrs; y 2) en un sentido metodolgico, circunstancias antecedentes puede
aludir a que son circunstancias que deben formularse 'antes' de la aplicacin del mtodo (por ejemplo,
esta interpretacin es mencionada por Losee como una condicin de aplicabilidad del mtodo de la
diferencia en Losee, 1979:158). Por ejemplo, antes de investigar sobre el estrs, debemos especificar al
ruido como un factor con l relacionado.
Mill considera el primer sentido pues 'causa' es, para l, el antecedente necesario e invariable de un
fenmeno (Fatone, 1969:167). El hecho de que, como veremos, Mill defina sus mtodos en trminos de
"la circunstancia es la causa (o el efecto) de...", alude simplemente a que sus mtodos sirven tanto para
buscar la causa de un efecto, como para buscar el efecto de una causa, es decir, ms genricamente,
para estudiar en qu concuerdan o en qu difieren casos diferentes (Fatone, 1969:167).
El segundo sentido es igualmente compatible con la posicin de Mill, porque no contradice su pretensin
de que los mtodos permiten 'descubrir' causas, lo cual puede hacerse perfectamente antes de la fase
probatoria, o fase de aplicacin propiamente dicha del mtodo. Finalmente, diferenciemos circunstancia
antecedente de circunstancia comn y circunstancia relevante. Circunstancias comunes son aquellas
circunstancias antecedentes que aparecen cuando tambin aparece el fenmeno. Por su parte, las
circunstancias antecedentes elegidas se supone que son circunstancias relevantes a los efectos de la
explicacin del fenmeno.

Esquema 1: Los mtodos de Stuart Mill

Mtodo Casos Circunstancias
Antecedentes
Fenmeno Conclusin
Concordancia N1
N2
N3
A B C
B C
C
X
X
X
C es causa (o efecto)
probable de X
Diferencia N1
N2
A B
B
X
no-X
A es causa (o efecto)
probable de X
Conjunto de
concordancia y
diferencia
N1
N2
0N3
A B C
B C
C
X
X
no-X
B es causa (o efecto)
probable de X
Residuos N1 A B C
Se sabe que A
Se sabe que B
X Y Z
X
Y
C es causa (o efecto)
probable de Z
Variacin
concomitante
N1
N2
A B
2A B
X
2X
A es causa (o efecto)
probable de X

A: Mala alimentacin X: Problema de aprendizaje
B: Colegio Y: Problema de conducta en la escuela
C: Maestro Z: Problema de conducta en la casa

1. Mtodo de la concordancia (o del acuerdo).- "Si dos o ms casos del fenmeno que se investiga tiene
slo una circunstancia en comn, esa circunstancia es la causa (o el efecto) del fenmeno en cuestin".
Las definiciones de los mtodos son prcticamente textuales de Stuart Mill (1843).

Siguiendo el esquema adjunto, vemos que en el primer caso se trata de un nio con problemas de
aprendizaje (X). Este fenmeno se presenta con ciertas circunstancias en comn: este nio tiene mala
alimentacin (A), va a un determinado colegio (B) y tiene determinado maestro (C).
Pero hemos avanzado poco: cualquiera de esos tres factores puede o no estar relacionado con el
problema de aprendizaje. Para empezar a sacar algunas conclusiones, entonces, debemos seguir
examinando otros casos.
En el segundo caso, tenemos otro nio con el mismo problema de aprendizaje, slo que el factor A no
est presente, pues est bien alimentado, pero sin embargo los otros dos s, pues concurre al mismo
colegio y tiene el mismo maestro que el nio del primer caso. Hasta aqu, en principio se pueden concluir
dos cosas: a) que el factor A no es la causa del problema de aprendizaje, pues ste se produce estando o
no estando presente dicho factor; y b) que la causa del problema de aprendizaje queda circunscripto a
los factores B y C, o a alguno de ellos.
Sin embargo, la conclusin que nos debe interesar hasta ahora, de acuerdo al espritu de los mtodos de
Mill, es la segunda: se trata de procedimientos que no intentar probar que un factor NO es causa de otro,
sino que probar que un factor SI lo es. A diferencia del enfoque popperiano, aqu el propsito de la
investigacin no es refutar sino probar factores, an cuando un resultado de esta prueba pueda
desembocar secundariamente en una refutacin.
Retomando: como todava nuestra conclusin no es satisfactoria (no sabemos si el factor causal es B o
C), pasamos a examinar un tercer caso, donde est presente como circunstancia solamente C, y vemos

Pgina 141 de 325
141
que el efecto 'problema de aprendizaje' sigue producindose. Ahora s podemos concluir que C tiene
importancia causal respecto de X, porque hay una 'concordancia': cada vez que aparece C aparece X,
cuando todos los dems factores varan.
Veamos este otro ejemplo: "Es interesante sealar que uno de los sntomas frecuentes de los casos de
extrema angustia ante el combate es una inhibicin del lenguaje, que puede ir desde la mudez completa
hasta la vacilacin y el tartamudeo. Anlogamente, el que sufre de pnico escnico agudo es incapaz de
hablar. Muchos animales tienden a dejar de emitir sonidos cuando estn atemorizados, y es obvio que
esta tendencia tiene un valor adaptativo, al impedirles atraer la atencin de sus enemigos. A la luz de
estos elementos de juicio, cabra sospechar que el estmulo del temor tiene una tendencia innata a
provocar la respuesta de una suspensin de la conducta vocal" (John Dollard J y Millar N, "Personalidad y
psicoterapia", citado por Copi, 1974:428). El esquema sera el siguiente:

Caso Circunstancia Antecedente Fenmeno
Caso 1 A B Mudez
Caso 2 A C Mudez
Caso 3 A D Mudez

A: temor, angustia, pnico.
B: estar en combate.
C: estar en un escenario.
D: un animal en su hbitat.

Los factores variables, es decir, las circunstancias que no estn siempre presentes cada vez que se
produce mudez son los lugares: una batalla, un escenario, una selva, pero el factor comn es siempre el
temor, de lo cual se concluye la relacin causal entre el temor y la mudez: en todos los casos, ambos
factores 'concuerdan'.
Otro ejemplo: "Se observ que los habitantes de varias ciudades presentaban una proporcin mucho
menor de caries dentales que el trmino medio de toda nacin y se dedic cierta atencin a tratar de
descubrir la causa de este fenmeno. Se hall que las circunstancias propias de estas ciudades diferan
en muchos aspectos: en latitud y longitud, en elevacin, en tipos de economa, etc. Pero haba una
circunstancia que era comn a todas ellas: la presencia de un porcentaje raramente elevado de flor en
sus aguas, lo que significaba que la dieta de los habitantes de esas ciudades inclua una cantidad
excepcionalmente grande de flor. Se infiri de ello que el uso de flor puede causar una disminucin en
la formacin de caries dentales y la aceptacin de esta conclusin condujo a adoptar tratamientos a base
de flor, para este propsito, en muchas localidades (Copi, 1974:427).

2. Mtodo de la diferencia.- "Si un caso en el cual el fenmeno que se investiga se presenta y un caso en
el cual no se presenta tienen todas tienen todas las circunstancias comunes excepto una, presentndose
sta solamente en el primer caso, la circunstancia nica en la cual difieren los dos casos es el efecto, o la
causa, o una parte indispensable de la causa de dicho fenmeno".

En el primer caso, hay un nio con problemas de aprendizaje (X) que tiene mala alimentacin (A) y que
va a un determinado colegio (B).
En cambio, en un segundo caso est la situacin de un nio sin problemas de aprendizaje (no-X), con
buena alimentacin pero que va al mismo colegio.
Del anlisis de ambos casos se puede concluir que A es la causa del problema, porque cuando aparece A
el fenmeno se produce y cuando no aparece A el fenmeno no se produce (o si se quiere, porque la
'diferencia' entre la produccin y la no produccin del fenmeno radica en A).
Ejemplo: "En 1861, Pasteur finalmente aport una prueba general contra la generacin espontnea. Hizo
hervir un caldo de carne en un frasco con un cuello delgado muy largo hasta que no qued ninguna
bacteria. Esto se probaba por el hecho de que poda mantener el caldo en el frasco durante un periodo
indefinido sin que se produjeran cambios, pues el estrecho cuello no permita que nada penetrara en l.
Luego rompi el cuello y en pocas horas aparecieron microorganismos en el lquido, y la carne estaba en
plena descomposicin. Prob que el aire transportaba tales organismos filtrndolo dos veces con filtros
estriles y mostrando que poda provocar la putrefaccin con el primer filtro, pero no con el segundo (H
Pledge, "La ciencia desde 1500". Citado por Copi, 1974:433).

3. Mtodo conjunto de la concordancia y la diferencia.- "Si dos o ms casos en los cuales aparece el
fenmeno tienen solamente una circunstancia en comn, mientras que dos o ms casos en los cuales no
aparece no tienen nada en comn excepto la ausencia de esta circunstancia, la circunstancia nica en la
cual difieren los dos grupos de ejemplos es el efecto, o la causa, o parte indispensable de la causa del
fenmeno".

Este mtodo resulta de aplicar la concordancia y la diferencia en una misma investigacin. Por ejemplo:
a) Aplicando el mtodo de la concordancia a los casos 1 y 2, se concluye provisoriamente que la causa
del problema de aprendizaje puede ser B o C. b) Para decidir cul de estos dos factores es la causa,

Pgina 142 de 325
142
aplicamos ahora el mtodo de la diferencia a los casos 2 y 3, donde podemos concluir que la causa del
problema es B.
El mtodo de la diferencia y el mtodo conjunto de la concordancia y la diferencia son los dos nicos
procedimientos donde contamos con fenmenos o efectos que NO se han producido (no-X).
Ejemplo: "Eijkman aliment a un grupo de pollos exclusivamente con arroz blanco. Todos ellos
desarrollaron una polineuritis y murieron. Aliment a otro grupo de aves con arroz sin refinar. Ni uno solo
de ellos contrajo la enfermedad. Luego reuni los residuos del refinamiento del arroz y aliment con ellos
a otros pollos polineurticos, que al poco tiempo se restablecieron. Haba logrado asignar con exactitud la
causa de la polineuritis a una dieta defectuosa. Por primera vez en la historia, haba conseguido producir
experimentalmente una enfermedad debida a deficiencias de alimentacin y haba podido curarla. Fue un
trabajo notable, que dio como resultado medidas teraputicas inmediatas (Jaffe B, "Avanzadas de la
ciencia". Citado por Copi, 1974:436).

4. Mtodo de los residuos.- "Restad de un fenmeno la parte de la cual se sabe, por inducciones
anteriores, que es el efecto de ciertos antecedentes, y entonces el residuo del fenmeno es el efecto de
los antecedentes restantes".

El primer caso corresponde a un nio con mala alimentacin (A), que va a un determinado colegio (B) y
que tiene determinado maestro (C). Este nio presenta problemas de aprendizaje (X), problemas de
conducta en la escuela (Y) y problemas de conducta en el hogar, es decir, se trata de una configuracin
de tres fenmenos discriminables y relacionados entre s.
Por los resultados de investigaciones anteriores, sabemos que A es la causa de X, y que B es la causa de
Y. Por lo tanto, C ser la causa de Z, por ser el factor 'residual' de un fenmeno tambin 'residual'.
Como puede apreciarse, este mtodo slo puede aplicarse cuando se aplic alguno de los otros mtodos
de Mill, gracias a los cuales se haba podido concluir que A es causa de X y que B es causa de Y.
Un ejemplo muy citado de este mtodo es el descubrimiento del planeta Neptuno por Adams y Le Verrier.
Se haba estudiado el movimiento del planeta Urano con ayuda de las teoras de Newton, y se bosquej
su rbita en la suposicin de que el Sol y los planetas interiores a ella eran los nicos cuerpos que
influan sobre ella. Pero las posiciones de Urano obtenidas por clculo no coincidan con las observadas.
Suponiendo que estas diferencias podran explicarse por la accin gravitacional de un planeta exterior a
la rbita de Urano, se calcul la posicin de tal planeta hipottico (cuya conducta se ajustara a los
principios comunes de la mecnica celeste), tomando como base para el clculo las perturbaciones en el
movimiento de Urano. En las cercanas del lugar calculado fue descubierto, en efecto, el planeta Neptuno.
Dicho descubrimiento se acredita por ese motivo al mtodo de los residuos (Cohen y Nagel, 1979:87-88).
El mtodo de los residuos resulta particularmente til en aquellos casos donde no podemos encontrar un
caso donde falte alguna posible causa, o donde las posibles causas no pueden ser eliminadas por
experimentacin. En el ejemplo del problema de aprendizaje, cuando no es posible encontrar ni producir
ningn caso en el cual falte A, B o C.
Fatone da otro ejemplo: "el pndulo puede ser sustrado a la influencia de una montaa, pero no a la
influencia de la tierra, para ver si seguir oscilando en caso de que la accin de la tierra fuera suprimida"
(Fatone, 1969:168).

5. Mtodo de la variacin concomitante.- "Un fenmeno que vara de cualquier manera, siempre que otro
fenmeno vara de la misma manera es, o una causa, o un efecto de este fenmeno, o est conectado
con l por algn hecho de causalidad".

En los dos casos aqu considerados, el problema de aprendizaje (X) del nio tiene como circunstancias
comunes tanto la mala alimentacin (A) como el colegio donde concurre (B).
As las cosas no podemos concluir nada, salvo que podamos constatar que cuando aumenta la
alimentacn deficitaria, tambin se agrava correlativamente el problema de aprendizaje.
Esquemticamente: si la mala alimentacin aumenta al doble (2A) y correlativamente el problema de
aprendizaje se agrava tambin al doble (2X), entonces podemos concluir que A es la causa de X, porque
se ha producido una 'variacin concomitante' entre A y X: a medida que se incrementa un factor, se
incrementa el efecto.
Como podemos apreciar, este es el nico mtodo de los cinco que introduce un anlisis cuantitativo del
problema: los cuatro mtodos anteriores implicaban una consideracin cualitativa, es decir, de 'presencia'
o 'ausencia' de factores, y no de cambios cuantitativos en los mismos.
Ejemplo: El fenmeno de las mareas puede podra producirse por la atraccin gravitacional de la luna o
por la presencia de estrellas fijas. Sin embargo, cuando se produce un cambio en la atraccin
gravitacional lunar, tambin se produce una alteracin en el nivel del mar. De esta manera, se puede
concluir que las mareas estn producidas por la atraccin gravitacional lunar.

Crticas y comentarios a los mtodos de Mill


Pgina 143 de 325
143
Los cnones de Mill estaban destinados a averiguar las relaciones de causalidad, esto es, los
"antecedentes invariables e incondicionales" de todos los fenmenos (Ferrater Mora, 1979:2228). La
expresin 'averiguar' alude aqu tanto a descubrir relaciones causales, como a probarlas.
En efecto, Stuart Mill haba propuesto sus mtodos como instrumentos de 'descubrimiento' de conexiones
causales, y como procedimientos de 'prueba' de las mismas. Una buena parte de las crticas apuntan
precisamente a estas dos pretensiones, que examinaremos por separado. Un examen ms completo de
estas crticas pueden encontrarse en (Copi, 1974:451-459) y en (Cohen y Nagel, 1979:72-90).

1. Los mtodos de Mill como instrumentos para descubrir conexiones causales.- Imaginemos que,
aplicando el mtodo de la concordancia para averiguar las causas del problema de aprendizaje,
consideramos un cuarto caso donde incluimos una nueva circunstancia antecedente D (por ejemplo, ser
drogadicto), y que haba estado presente tambin en los tres casos anteriores. En esta nueva situacin,
el esquema sera el siguiente:

Caso 1 ABCD X
Caso 2 BCD X
Caso 3 CD X
Caso 4 D X

Si constatamos que el problema de aprendizaje (X) se produce tambin en presencia del factor D,
concluiremos entonces que D es la causa de X.
Por lo tanto, cuando habamos aplicado el mtodo de la concordancia considerando solamente los tres
primeros casos, habamos concluido errneamente que la causa era C, debido a que no habamos
considerado 'todos' los factores atinentes o relevantes a la cuestin. El mtodo no nos ayuda entonces a
'descubrir' nuevos posibles factores atinentes, entre los cuales podra estar la 'verdadera' causa.
Esta crtica es extensible a los dems mtodos. Como indica Copi, "los mtodos no pueden usarse a
menos que se tengan en cuenta todas las circunstancias atinentes al fenmeno. Pero las circunstancias
no llevan rtulos que digan 'atinente' o 'no atinente'. Los problemas de atinencia son problemas relativos
a la 'conexin causal', algunos de los cuales, al menos, deben hallarse resueltos 'antes' de que sea
posible aplicar los mtodos de Mill. Por consiguiente, los mtodos de Mill no son 'los' mtodos para
descubrir conexiones causales, pues algunas de estas conexiones deben ser conocidas previamente a
toda aplicacin de esos mtodos" (Copi, 1974:456).
Crticas similares formulan Cohen y Nagel (1979:89), cuando sostienen que para que los mtodos de Mill
sirvan para descubrir causas, deben incluir entre las circunstancias antecedentes la causa verdadera: "si
no hemos tenido la fortuna de incluirla, eliminaremos todas las alternativas sin descubrir la causa de X".
El problema no pasa solamente por no haber seleccionado todos los factores atinentes, sino que tambin
puede pasar por haberlos seleccionado mal. Un ejemplo particularmente risueo nos lo suministra Copi
(1974:453): tomo whisky con soda y me emborracho, tomo vino con soda y me emborracho, tomo ron
con soda y me emborracho, y tomo gin con soda y tambin me emborracho. Por lo tanto, lo que me
emborracha es la soda, porque concuerda siempre la soda con la borrachera.
Esta mala seleccin de los factores relevantes me impide descubrir la verdadera causa de la borrachera,
lo que ilustra otro aspecto del problema de los mtodos de Mill para descubrir conexiones causales. En
realidad, el factor concordante que habra que haber seleccionado es el componente de alcohol presente
en todas las bebidas consideradas.

2. Los mtodos de Mill como reglas para probar conexiones causales.- Copi (1974:457-459) sostiene dos
razones para negarles valor demostrativo a los cnones de Mill.
a) Puesto que los mtodos, como hemos visto en el pargrafo anterior, no pueden ayudarnos a
seleccionar todos los factores atinentes, la afirmacin de que uno de los factores considerados es la causa
del fenmeno no tiene valor de prueba. El experimento de la soda que emborracha no logr probar la
causa de la borrachera.
b) Las correlaciones entre factores y fenmenos no siempre son prueba de un vnculo causal, y los
mtodos de Mill, especialmente el de las variaciones concomitantes, concluyen un vnculo causal all
donde hay una simple correlacin. Por ejemplo (Copi, 1974:458), el hecho de que la velocidad diaria del
viento en Chicago vare proporcionalmente durante un ao o ms con la tasa de nacimientos en la India,
no indica que un factor sea la causa del otro.
Desde ya, cuanto mayor sea el nmero de casos donde hay correlacin, tanto mayor ser la probabilidad
que dicha relacin sea causal, pero, como no se pueden examinar todos los casos posibles, las
conclusiones nunca sern seguras. Tal el tipo de cuestionamiento que hace Copi a los mtodos de Mill
como instancias de prueba de conexiones causales: los mtodos de Mill son inductivos, no deductivos, y
por tanto nunca podrn conferir necesariedad a un vnculo causal.
Este tipo de crtica podemos incluso encontrarla varios siglos antes, cuando Nicols de Autrecourt (siglo
XIV) cuestiona el mtodo de la concordancia propuesto por entonces diciendo que no puede establecerse
que una correlacin cuya vigencia se ha observado deba continuar mantenindose en el futuro, con lo
cual no se puede conseguir conocimiento necesario de las relaciones causales (Losee, 1979:52). En la

Pgina 144 de 325
144
misma lnea de pensamiento se inscribe la conocida posicin escptica de Hume (1711-1776) al respecto
(Losee, 1979:110).
Tengamos presente, por ltimo, que la presencia de correlacin no asegura que haya un vnculo causal,
por cuanto la correlacin entre los fenmenos estudiados podra muy bien deberse a que son efectos de
una misma causa. Stuart Mill haba llegado a advertir esto cuando consider los fenmenos altamente
correlacionados del da y de la noche (Losee, 1979:164): en realidad, dicha correlacin obedece a que
ambos fenmenos dependen de ciertas condiciones, como por ejemplo la rotacin diurna de la tierra, lo
que viene a mostrarnos que Mill tuvo conciencia de las limitaciones de sus mtodos. Examinmoslas
brevemente.

3. La autocrtica de Stuart Mill.- Los diversos cuestionamientos que hemos detallado apuntan, en general,
al mal uso de los mtodos ms que al pensamiento original de Stuart Mill, por cuanto ste ya se haba
percatado acerca de los alcances y las limitaciones de ellos.
Mill haba propuesto sus mtodos como reglas para probar conexiones causales, pero "en sus momentos
ms prudentes, sin embargo, restringi la prueba de la conexin causal a aquellos argumentos que
satisfacan el mtodo de la diferencia" (Losee, 1979:165). Adems, Mill sostuvo que el mtodo de la
diferencia era el ms importante en cuanto a su potencial para descubrir causas, y que, en este sentido,
contrastaba con el mtodo de la concordancia, que tena dos importantes limitaciones (Losee, 1979:158-
159). El primer lugar, el mtodo de la concordancia slo sirve cuando se hizo un inventario exacto de las
circunstancias relevantes, con lo cual su xito depende de las hiptesis previas sobre las circunstancias
relevantes. En nuestro ejemplo del problema de aprendizaje, ya hemos dicho que si no inclumos el factor
drogadiccin como causa y ste factor es efectivamente causal, las conclusiones seguirn un camino
equivocado.
En segundo y ltimo lugar, el mtodo de la concordancia no sirve si est funcionando una pluralidad de
causas. "Mill reconoci que un tipo determinado de fenmenos puede ser el efecto de diferentes
circunstancias en diferentes ocasiones" (Losee, 1979:158-159). Por ejemplo, en la siguiente situacin:

Caso Circunstancias antecedentes Fenmenos
1 ABEF abe
2 ACD acd
3 ABCE afg

es posible que B causara 'a' en los casos 1 y 3, y que D causara 'a' en el caso 2. Debido a que esta
posibilidad existe, slo se puede concluir que es probable que A sea la causa de 'a'.
En general, Stuart Mill estableci la limitacin de sus mtodos en su carcter inductivo. En efecto, Para
l, "la lgica debe estudiar principalmente la teora de la induccin como el nico mtodo adecuado para
las ciencias. Los conocimientos cientficos son producto de la induccin, pues las mismas generalidades
ideales que se suponen adquiridas 'a priori' son el resultado de generalizaciones inductivas. La previsin
de los fenmenos tiene, por tanto, un carcter probable [que] no es nunca seguridad definitiva" (Ferrater
Mora, 1979:2227-2228).

4. Reivindicacin de los mtodos de Mill.- Copi los cuestiona los mtodos de Mill como instancias de
descubrimiento y de prueba, pero los reivindica diciendo que, si se agrega una hiptesis adicional que
postule un universo finito de causas, pueden obtenerse conclusiones seguras o necesarias, es decir,
fundadas en la deduccin, y no en la induccin (los mtodos de Mill son esencialmente inductivos). En el
ejemplo del problema de aprendizaje, si agregamos como premisa adicional que las 'nicas' causas
posibles del problema de aprendizaje X son A, B y C, entonces la conclusin de que C es la causa efectiva
es necesaria.
As presentados, los mtodos de Mill "aparecen como instrumentos para someter a ensayo la hiptesis.
Sus enunciados describen el mtodo del 'experimento controlado', que constituye un arma indispensable
de la ciencia moderna" (Copi, 1974:461). Copi redondea su reivindicacin, sealando que si bien las
leyes causales nunca pueden ser descubiertas con los mtodos de Mill, ni pueden estos establecer
'demostrativamente' [deductivamente] su verdad, estos mtodos "constituyen los modelos bsicos a los
cuales debe adecuarse todo intento por confirmar o refutar, mediante la observacin o el experimento,
una hiptesis que confirme una conexin causal" (Copi, 1974:464).
Cohen y Nagel tambin cuestionan los mtodos como procedimientos de descubrimiento y de prueba,
pero los reivindican indicando que, aunque no pueden servir para probar causas, sirven para eliminar
otras. Copi dice: "los mtodos de Mill son esencialmente eliminatorios". En el ejemplo del problema de
aprendizaje, aunque mtodos como el de la concordancia no prueban con certeza que C es la causa de X,
s prueban con certeza que A y B no lo son.
Cohen y Nagel sealan, as, que los mtodos de Mill "son de indudable valor en el proceso de llegar a la
verdad, pues al eliminar las hiptesis falsas, restringen el campo dentro del cual podemos encontrar las
verdaderas. Y an cuando no logren eliminar todas las circunstancias irrelevantes, nos permiten
establecer (con cierta aproximacin) de modo tal las condiciones para la produccin de un fenmeno que
podamos distinguir aquella hiptesis que, desde el punto de vista lgico, es preferible a sus rivales"
(Cohen y Nagel, 1979:90).

Pgina 145 de 325
145

Antecedentes histricos

Stuart Mill no es del todo original al plantear sus mtodos. Su mrito reside en haber revisado,
sistematizado y propagandizado las ideas al respecto de Francis Bacon quien, a su vez, tampoco fue el
primero en formular los mtodos inductivos, ya que encontramos importantes antecedentes en algunos
pensadores medievales, como por ejemplo en Robert Grosseteste, Juan Duns Escoto o Guillermo de
Occam.
Consiguientemente, podemos trazar dos etapas histricas hasta desembocar en los mtodos de Mill del
siglo XIX: los medievales y Francis Bacon (despus de Bacon y antes de Stuart Mill, el ingls David Hume
haba escrito ocho reglas "para juzgar sobre causas y efectos", entre las cuales estaban los mtodos de la
concordancia, de la diferencia y de las variaciones concomitantes. Ver Losee, 1979:115). Para todo ello,
nos guiaremos por el esquema 2.

Esquema 2: Algunos antecedentes histricos de los mtodos de Mill

Grosseteste
(1168-1253)
Duns Escoto
(1265-1308)
G. de Occam
(1280-1349)
Galileo
(1564-1642)
F. Bacon
(1561-1626)
Concordancia B F
Diferencia C G
Conjunto A D
V.Concomitante E H

(Para las letras maysculas, remitirse al texto).

1. Los medievales.- A) Grosseteste contribuy a desarrollar nuevas tcnicas inductivas para descubrir
principios explicativos. Sugiri por ejemplo un procedimiento para saber si una hierba tena efecto
purgante: deban examinarse numerosos casos donde se administrase la hierba en condiciones donde no
hubiera otros agentes purgantes. Se trata (Losee, 1979:42) de un procedimiento inductivo que luego
describira Stuart Mill como el mtodo conjunto de la concordancia y la diferencia.
B) Duns Escoto propuso el mtodo de la concordancia, pero le asign mritos muy modestos: sostena
que, si cada vez que se daba la circunstancia A se produca el efecto X, varindose todas las otras
circunstancias, el cientfico estaba autorizado a afirmar que A 'puede' ser la causa de X, pero no a que
necesariamente A 'debe' ser su causa (Losee, 1979:43). Escoto habl de 'uniones disposicionales' entre
un efecto y su circunstancia antecedente, es decir, de uniones constatadas en la experiencia y que, como
tales, no podan ser consideradas uniones necesarias.
C) Nos cuenta Losee: "Occam formul un procedimiento para extraer conclusiones acerca de las uniones
disposicionales siguiendo un Mtodo de la Diferencia. El mtodo de Occam consiste en comparar dos
casos: un caso en que el efecto est presente, y un segundo caso en que el efecto no est presente. Si se
puede mostrar que existe una circunstancia que est presente cuando el efecto est presente, y ausente
cuando est ausente [...], entonces el investigador est autorizado a concluir que la circunstancia 'puede
ser' la causa del efecto".
"Occam mantena que, en el caso ideal, el conocimiento de una unin disposicional poda establecerse
sobre la base de solamente una asociacin observada. Sealaba, sin embargo, que en un caso as se
debe estar seguro de que todas las dems causas posibles del efecto en cuestin no estn presentes.
Observ que, en la prctica, es difcil determinar si dos conjuntos de circunstancias difieren slo en un
aspecto. Por esta razn, instaba a investigar muchos casos, con el fin de minimizar la posibilidad de que
un factor no localizado sea el responsable de la aparicin del efecto" (Losee, 1979:43).
D) Crombie (1979:36) indica que Occam tambin propuso un mtodo similar al luego conocido como
mtodo de la concordancia y la diferencia. Mediante dicho procedimiento, Occam pens que, ya que el
mismo efecto poda tener diferentes causas, era preciso eliminar las hiptesis rivales.
E) En su "Dilogo sobre los dos sistemas principales del mundo" (1632), Galileo hace discutir a Salviati
(que representa el pensamiento de Galileo) y a Simplicio (que representa a los aristotlicos). Refiere
Crombie (1979:126-127) que en este texto Galileo habla de un procedimiento igual al mtodo de las
variaciones concomitantes de Stuart Mill (o al mtodo de los grados de comparacin de Bacon), cuando
dice: "As digo que si es verdad que un efecto puede tener solamente una causa, y si entre la causa y el
efecto hay una conexin precisa y constante, entonces cuando quiera que se observe una variacin
precisa y constante en el efecto, debe haber una variacin precisa y constante en la causa". Para
ejemplificar el procedimiento, Galileo nos suministra el ejemplo de las mareas, que hemos explicado
brevemente ms arriba.
Sin embargo (Losee, 1979:65), Galileo no aval los otros mtodos de Bacon: las hiptesis sobre
idealizaciones no pueden obtenerse de la induccin por enumeracin simple ni por los mtodos de la
concordancia y la diferencia, siendo preciso que el cientfico intuya qu propiedades de los fenmenos son
la base adecuada para la idealizacin, y qu propiedades pueden ignorarse.


Pgina 146 de 325
146
2. Francis Bacon.- Bacon propondr sus 'tablas' como un nuevo procedimiento inductivo que reemplazara
al hasta entonces conocido mtodo de la induccin por simple enumeracin, tambin llamado induccin
incompleta. En su "Novum Organum", nos cuenta que "esta especie de induccin que procede por la va
de la simple enumeracin no es sino un mtodo de nios, que no conduce sino a conclusiones precarias y
que corre los ms grandes riesgos por parte del primer ejemplo contradictorio que puede presentarse; en
general, se pronuncia segn un nmero de hechos demasiado pequeo, y solamente de esa especie de
hechos que se presentan a cada instante. Pero la induccin verdaderamente til en la invencin y en la
demostracin de las ciencias y de las artes hace una eleccin entre observadores y las experiencias,
separando de la masa, por exclusiones y rechazos convenientes, los hechos no concluyentes; luego,
despus de haber establecido proposiciones en nmero suficiente, se detiene al fin en las afirmativas y se
atiene a estas ltimas" (Bacon F, "Novum Organum", I, 105).
Para aclarar estas ideas de Bacon, retomemos brevemente el ejemplo del problema de aprendizaje y
veamos cmo podra resolverse mediante la induccin por enumeracin simple y por la induccin
baconiana.
a) Induccin por enumeracin simple: el primer nio pertenece al colegio B, y tiene problemas de
aprendizaje; el segundo nio tambin pertenece al colegio B y tambin tiene problemas de aprendizaje; y
as sucesivamente con otros nios. Por lo tanto, se concluye que la causa del problema de aprendizaje es
el colegio B.
b) Induccin baconiana: usando por ejemplo el mtodo de la concordancia, vemos que el primer nio
pertenece al colegio B, tiene al maestro C y tiene mala alimentacin, y vemos que tiene problemas de
aprendizaje. El caso del segundo nio es igual, pero est bien alimentado, y el caso del tercer nio es
igual pero est bien alimentado y no va al colegio B. Por lo tanto, puesto que en los tres casos concuerda
siempre el maestro C, esta ser probablemente la causa del problema de aprendizaje. Esta conclusin es
ms firme que aquella otra ofrecida por el mtodo de la induccin por enumeracin simple. Ciertos
autores (por ejemplo Fatone 1969:165) han declarado que la propuesta de F. Bacon se opone a la
induccin llamada completa, consistente en derivar del total de casos una afirmacin general que vale
precisamente para todos esos casos.
En rigor, la propuesta de Bacon iba tanto contra la induccin por enumeracin simple como contra la
induccin completa o matemtica. Para l, ni la experiencia bruta ni los razonamientos vacos,
respectivamente, son el camino de la ciencia. El cientfico no debe ser, deca Bacon en el libro 1, aforismo
95 del "Novum Organum", ni una hormiga, que lo nico que hace es almacenar (comida = informacin),
ni una araa que teje redes con material fabricado por ella misma. El cientfico debe estar en el punto
medio: debe ser una abeja que extrae materiales en los jardines, pero luego puede elaborar esa materia
prima con un 'arte que le es propio'. Esta elaboracin de la informacin que nos brinda la naturaleza es
posible gracias a la utilizacin de una nueva herramienta (un 'novum organon'), constitudo
fundamentalmente por las 'tablas', antepasados directos de los 'mtodos' de Mill.
Las 'tablas' de Bacon son tres: de presencia, de ausencia y de comparacin, y corresponden,
respectivamente, a los mtodos de la concordancia, de la diferencia y de las variaciones concomitantes
(F, G y H del esquema 2).
"En la tabla de presencia se registrarn todos los casos diferentes en que se da el mismo fenmeno; en la
de ausencia, los casos en que el fenmeno que interesa no se da a pesar de que tienen circunstancias
comunes con aquel en que se da; en la tabla de comparacin, los casos en que el fenmeno presenta
variaciones o diferencias [...]. As fundaba Bacon el mtodo, que consiste en buscar los fenmenos tales
que: cuando se da uno de ellos se da el otro; cuando no se da uno de ellos no se da el otro; y cuando
uno de ellos vara, vara el otro. Comprobada esta triple relacin, poda enunciarse la relacin forzosa que
exista entre los hechos" (Fatone, 1969:166).

Los mtodos de Mill y los mtodos experimentales actuales

A partir de Stuart Mill, los mtodos para probar conexiones causales siguieron evolucionando de manera
notable hasta muy entrado el siglo XX. En tren de establecer una comparacin entre los cnones de
prueba de Mill y los actuales, podemos trazar, en forma muy escueta, el siguiente panorama.
Los mtodos experimentales actuales presentan una gran semejanza con los mtodos de la diferencia y
de la variacin concomitante, mientras que tienen poco que ver con los mtodos de la concordancia y de
los residuos.
La semejanza con el mtodo de la diferencia radica en que precisamente en los modelos experimentales
actuales, una situacin tpica es aquella donde se comparan dos grupos: a uno se lo somete a la
influencia de un posible factor causal A y al otro no, en la esperanza de que luego el primer grupo
presente el efecto X y el segundo no. La semejanza con el mtodo de la variacin concomitante radica en
el anlisis cuantitativo, tpico de los mtodos actuales. Muchas veces no basta con someter a un grupo a
la influencia de un posible factor causal A, sino que adems se introducen variaciones cuantitativas en
dicho factor para ver si se produce una variacin concomitante en el efecto X. Un ejemplo son los
experimentos sobre nuevas drogas para curar enfermedades.
El mtodo de los residuos no guarda relacin con los mtodos actuales sencillamente porque no se trata
de un procedimiento experimental. Hemos ya dicho que uno de los motivos por los cuales se utilizaba
este mtodo era para investigar situaciones donde no se podan introducir cambios artificialmente.

Pgina 147 de 325
147
El mtodo de la concordancia, por ltimo, es bastante diferente a ciertos procedimientos experimentales
actuales tpicos. Mediante el mtodo de Mill, comparbamos distintos casos donde se produce el efecto X
y donde hay diferentes causas posibles. Por ejemplo, en un caso tenemos las causas posibles A-B-C y el
efecto X. En cambio, en el procedimiento actual no se hace un descarte progresivo de causas hasta que
quede, por ejemplo, C. En su lugar, se selecciona previamente la causa C y se la somete a prueba y los
dems factores (A y B) son tratados como variables extraas, buscndose controlar su influencia con
procedimientos tales como la aleatorizacin. Un pionero de este procedimiento fue Fisher, que lo propone
alrededor de 1925 (Fisher, 1954).

Pgina 148 de 325
148
CAPTULO 9: LAS ETAPAS DE LA INVESTIGACIN TPICA

A lo largo del presente texto se explicarn los pasos o etapas de una investigacin tpica, es decir,
emprica. Este tipo de investigacin podr ser pura o aplicada, pero en general seguir la pauta de una
investigacin correlacional o explicativa, primaria y cuantitativa.
Cada etapa ser tratada en detalle en los siguientes captulos de este libro:

Etapas de la investigacin tpica (visin panormica) Captulo
1) Planteo del problema
2) Revisin bibliogrfica
3) Planteo del marco terico
4) Planteo de objetivos
Captulo 10
5) Formulacin de la hiptesis
6) Identificacin, categorizacin y operacionalizacin de las variables
Captulo 11
7) Definicin de la poblacin
8) Seleccin de la tcnica de muestreo
9) Seleccin o construccin de los instrumentos de medicin
Captulo 12
10) Seleccin del diseo de investigacin Captulo 13
11) Recoleccin y organizacin de los datos
12) Anlisis e interpretacin de los datos
Captulo 14
13) Presentacin de los resultados Captulo 15

En el presente captulo se presenta una primera vista panormica de las etapas de una investigacin
tpica, y que habitualmente se cumplen en la mayora de las investigaciones que podemos encontrar en
las publicaciones cientficas.
As es que a continuacin se explica brevemente cada etapa utilizando un ejemplo nico: una
investigacin que indague acerca de las relaciones entre estado civil y estado de nimo. Tngase
presente que, dependiendo de cada investigacin en particular, algunos de los pasos indicados pueden
saltearse, cambiarse el orden, e incluso volver sobre alguno de los pasos anteriores.

1) Planteo del problema.- El problema se expresa mediante una pregunta, la cual deber ser contestada
en la investigacin. Por ejemplo: Existe alguna relacin significativa entre estado civil y estado de
nimo?.
Debe diferenciarse el problema del tema. El tema de la investigacin es bsicamente la variable
dependiente. En nuestro ejemplo, cualquiera de ambas podra serlo: el estado civil puede depender del
estado de nimo (estoy triste por lo tanto me divorcio) o el estado de nimo puede depender del estado
civil (estoy soltero y por lo tanto estoy alegre). En este paso, por tanto, deberemos decidir cul ser
nuestra variable dependiente. Por ejemplo, elegimos estado de nimo.

2) Revisin bibliogrfica.- Su funcin bsica es la de conocer qu soluciones dieron otros autores al
mismo problema o problemas similares que pretendemos resolver en nuestra investigacin.
Emprendemos aqu la ardua tarea de revisar todo las investigaciones realizadas concernientes a la
relacin entre estado de nimo y estado civil, para lo cual deberemos recorrer bibliotecas, la red Internet,
etc. La idea es hacer una sntesis de todo lo encontrado utilizando solamente los abstracts de las
investigaciones encontradas. Tal vez podramos encontrarnos con que nuestra investigacin ya fue
realizada, pero ello no debe desilusionarnos: por lo general nuestra investigacin partir de muestras
diferentes, utilizar otros instrumentos de medicin, etc., lo cual la convierte en una investigacin
original que complementar la ya realizada. En todo caso, en nuestro informe final consignaremos en qu
medida nuestra investigacin coincide o no con los resultados de otras investigaciones, y qu razones
podran dar cuenta de las diferencias.

3) Planteo del marco terico.- Las variables elegidas han de ser definidas dentro de un marco terico. Por
ejemplo, para definir estado civil podemos tomar como referencia el Cdigo Civil del pas donde
hacemos la investigacin, mientras que para definir estado de nimo podremos tomar el DSM-IV. Otros
ejemplos de marcos tericos para otras variables pueden ser el psicoanlisis, el cognitivismo, la teora de
la gestalt, la teora del aprendizaje de Skinner, etc. En suma, en este caso se sintetizarn los marcos
tericos utilizados, mientras que las definiciones tericas de las variables se especifican en un paso
ulterior

4) Planteo de objetivos.- Supondremos que en nuestro ejemplo realizaremos una investigacin de campo,
experimental, descriptivo-explicativa y con datos principalmente primarios.
Suelen especificarse un objetivo general y objetivos especficos. En nuestro ejemplo, el objetivo general
podra ser probar si existe o no una relacin significativa entre estado civil y estado de nimo, y algunas
objetivos ms especficos podran ser revisar las investigaciones recientes sobre el tema, discutir las

Pgina 149 de 325
149
diferencias encontradas con otras investigaciones sobre el mismo tema, o examinar la incidencia de las
variables edad y nivel de instruccin en la muestra seleccionada.

5) Formulacin de la hiptesis.- La hiptesis es nuestra respuesta tentativa al problema, y puede
formularse en forma general y especfica. La forma general sera existe una relacin significativa entre
estado civil y estado de nimo. Un ejemplo de hiptesis ms especfica sera las personas solteras
tienden a sufrir estados depresivos. En una hiptesis especfica, pueden especificarse varias cosas: el
vnculo entre las variables (en vez de decir existe una relacin entre decimos es la causa de),
alguna categora de alguna variable (en vez de estado civil decimos casado), o alguna dimensin o
indicador de alguna variable (en vez de estado de nimo decimos presentan desinters por el mundo
exterior). Normalmente, la hiptesis que ser verificada en la investigacin es la hiptesis general.
Si hemos decidido que nuestra investigacin sea exploratoria, en lugar de una hiptesis pueden realizarse
algunas conjeturas acerca de las variables o factores relevantes vinculadas con el tema. Las conjeturas
son meras sospechas que luego, si se encuentran suficientes elementos de juicio para considerarlas
dignas de ser probadas, sern convertidas en hiptesis.

6) Identificacin, categorizacin y operacionalizacin de las variables.- Respecto de la identificacin, nos
preguntaremos qu variables principales vamos a considerar: estado civil y estado de nimo.
Seguidamente, las clasificamos segn diversos criterios: simples o complejas, manifiestas o latentes,
organsmicas o situacionales, etc. En general, las clasificaciones que no pueden obviarse son:
independiente o dependiente (estado civil ser independiente y estado de nimo, dependiente), y
cualitativa o cuantitativa. Esta ltima clasificacin es importante porque especifica en qu nivel de
medicin la mediremos. Por ejemplo, estado civil ser una variable cualitativa nominal, mientras que
estado de nimo ser una variable cualitativa ordinal. En principio no tendra mucho sentido clasificar
estado civil como ordinal, porque no podemos decir ms casado, algo casado o nada casado.
Respecto de la categorizacin, asignaremos categoras a las variables (para estado civil pueden ser
soltero, casado, separado de hecho, divorciado, juntado, viudo, etc., y para estado de nimo
pueden ser muy deprimido, deprimido, alegre y muy alegre).
En cuanto a la operacionalizacin, si las variables son complejas seleccionaremos dimensiones e
indicadores. Dimensiones de estado de nimo podran ser manifestaciones fsicas y manifestaciones
psquicas, y sus respectivos indicadores, postura corporal e inters por el trabajo. Como estado civil
es una variable simple, seleccionaremos un solo indicador. Por ejemplo, aquello que nos responde el
sujeto cuando le preguntamos por su estado civil.

7) Definicin de la poblacin.- Especificamos la poblacin que queremos estudiar. Por ejemplo, todas las
personas entre 20 y 60 aos que vivan en la ciudad de Buenos Aires en un mes y ao determinado. Por
lo tanto, nuestra unidad de anlisis sern personas (y no por ejemplo grupos o familias). La definicin de
la poblacin supone siempre especificar sus componentes, llamados unidades de anlisis.

8) Seleccin de la tcnica de muestreo.- Podramos elegir una muestra de tipo probabilstico: elegimos al
azar una cierta cantidad de nmeros telefnicos. Hay otros procedimientos menos aconsejables porque
no son aleatorios, como elegir a las personas que conocemos de nuestro entorno (familiares, amigos,
vecinos, etc.). Es estos casos la muestra estar sesgada por nuestras preferencias y por un determinado
estrato social o zona geogrfica.
Las muestras sern diferentes segn el tipo de investigacin a realizar. En un estudio descriptivo puede
utilizarse una muestra de 1000 personas extradas de la poblacin, y a las cuales encuestaremos. En un
estudio explicativo experimental, las muestras consistirn por ejemplo en dos grupos: el primero
conformado por personas solteras, y el segundo por personas casadas. Tambin podemos elegir tantos
grupos como categoras tenga la variable estado civil.

9) Seleccin o construccin de los instrumentos de medicin.- Hay varios tests que miden estado de
nimo, como por ejemplo el Cuestionario de Depresin. Si no hemos encontrado ningn instrumento apto
para medir nuestras variables, deberemos construirlos nosotros mismos. En nuestro ejemplo, deberemos
construir un test para medir estado de nimo. Para medir estado civil obviamente no se requiere
ningn test: basta con preguntarle a la persona cul es su estado civil.
La construccin de nuestro test implicar cumplir estos pasos: a) Seleccionar los tems, es decir, las
preguntas o las pruebas que incluir. Para nuestro ejemplo, uno de los tems puede ser la pregunta Se
siente triste la mayor parte de los das?. b) Categorizar los tems, es decir, establecer las respuestas
posibles que podr responder cada sujeto en cada tem. Por ejemplo para el tem anterior, las posibles
categoras pueden ser s y no. c) Construir un sistema de puntuacin de las respuestas. Por ejemplo
asignamos arbitrariamente el nmero 1 si contest que s y 0 si contest que no. Luego, sumando todos
los puntos de cada tem, deberemos obtener un ndice, en este caso, un ndice de estado de nimo.
Tambin aqu estableceremos como interpretar estos ndices. Por ejemplo, si obtuvo ms de 20
categorizaremos al sujeto como muy deprimido, si obtuvo entre 15 y 19 puntos lo ubicaremos como
deprimido, y as sucesivamente. d) Finalmente determinaremos la validez y la confiabilidad del
instrumento as construido.

Pgina 150 de 325
150

10) Seleccin del diseo de investigacin.- Como estamos suponiendo que nuestra investigacin es
explicativa y adems indaga una sola variable causal, se podran elegir alguno de los seis diseos
experimentales bivariados que propone Selltiz, fundamentando adems esta eleccin.

11) Recoleccin y organizacin de los datos.- Para la recoleccin de los datos, aplicamos o administramos
los instrumentos de medicin. Tomamos a los sujetos elegidos un test de estado de nimo y les
preguntamos su estado civil. De todos los pasos de esta investigacin, este es el nico en el cual
tomamos contacto con los sujetos del estudio. Todos los otros pasos los podemos realizar solos en
nuestro lugar de trabajo.
La organizacin de los datos, supone realizar ciertas operaciones como la construccin de una matriz de
datos, la tabulacin, la graficacin y la obtencin de medidas estadsticas de posicin y de dispersin.
a) Construccin de la matriz de datos.- Organizamos y sintetizamos toda la informacin obtenida en una
matriz, que, en nuestro ejemplo puede asumir la siguiente forma:

Sujeto Estado civil Estado de nimo
A Soltero Muy deprimido
B Soltero Alegre
C Casado Deprimido
Etc Etc Etc

En el caso de tratarse de variables cuantitativas, en esta matriz se consignarn en las columnas de las
variables los puntajes brutos, los puntajes estandarizados y/o los percentiles. Por ejemplo, si utilizamos
el WISC-III para medir inteligencia en nios, Juancito pudo haber obtenido respectivamente 121, 114 y
82.
b) Tabulacin.- Toda la informacin de la matriz de datos la organizamos aqu en una tabla de doble
entrada, es decir, una tabla que permita cruzar las dos variables en juego:

Muy deprimido Deprimido Alegre Muy alegre TOTALES
Soltero 7 ? ? ? ?
Casado ? ? ? ? ?
Separado de hecho ? ? ? ? ?
Divorciado ? ? ? ? ?
Juntado ? ? ? ? ?
Viudo ? ? ? ? ?
TOTALES ? ? ? ? ?

Por ejemplo, hemos colocado la frecuencia 7 en el primer casillero porque hemos encontrado siete casos
de sujetos solteros muy deprimidos.
c) Graficacin.- Opcional. Sirve para presentar la informacin de las tablas de una forma ms intuitiva y
rpidamente comprensible.
d) Obtencin de medidas de posicin, dispersin y correlacin.- Generalmente pueden obtenerse a partir
de la tabla de doble entrada. Como en el ejemplo que estamos siguiendo las variables no son
cuantitativas, no podremos utilizar la media aritmtica ni el desvo estndar. Deberemos usar medidas
estadsticas para variables cualitativas, como el modo o la mediana (medidas de posicin), y otras. Por
ejemplo, si la categora que ms se repite para la variable estado de nimo es alegre, entonces alegre
es el modo. Las medidas de correlacin, finalmente, permiten organizar la informacin acerca de la
relacin entre dos o ms variables (en este caso, entre estado civil y estado de nimo).

12) Anlisis e interpretacin de los datos.- Respecto del anlisis de los datos, de acuerdo a los fines que
nos hayamos propuesto y si resultare necesario, podremos optar por varias posibilidades dentro de la
amplia gama de pruebas estadsticas tales como la prueba t, la prueba z, etc., tarea que generalmente se
confa a algn especialista en estadstica. Tales pruebas tienen como finalidad ofrecer una prueba
matemtica que permita decidir si aceptaremos o rechazaremos nuestra hiptesis.
La interpretacin de los datos es opcional pero recomendable. En este paso arriesgamos algunas
conjeturas personales acerca del porqu de la asociacin detectada entre ambas variables. Por ejemplo,
hemos encontrado una alta asociacin entre alegra y casado quiz porque el matrimonio permite
compartir trances y dificultades ms fcilmente, con lo cual hay menor margen para la depresin. La
interpretacin de los datos puede hacerse desde algn marco terico existente o bien, si somos audaces
e imaginativos, podemos crear nuestro propio marco terico porque no hay ninguno que nos satisfaga.

13) Presentacin de los resultados.- Mientras fuimos cumpliendo los pasos anteriores, es muy probable
que hayamos escrito varias hojas en borrador. Con este material redactamos nuestro informe final, luego
el abstract o resumen del mismo, luego seleccionamos un ttulo para nuestro informe y, finalmente,
publicados los resultados (por ejemplo envindolos a una revista cientfica).

Pgina 151 de 325
151
Este proceso se realimenta continuamente: en cuanto damos a conocer nuestro trabajo a la comunidad
cientfica, desde ese momento entra a formar parte de la bibliografa existente sobre el tema y, por
tanto, ser consultado por otro investigador que se encuentre en la etapa de la revisin bibliogrfica.

Este libro presentar en los captulos siguientes cada etapa de la investigacin con mayor detalle, tal
como puede apreciarse en el siguiente esquema:

Etapas de la investigacin tpica (visin ms detallada) Captulo
1) Plantear del problema
2) Revisar bibliogrfica
3) Plantear del marco terico
4) Plantear de objetivos
Captulo 10
5) Plantear la hiptesis
6) Clasificar la hiptesis
7) Definir las unidades de anlisis
8) Definir conceptualmente las variables
9) Clasificar las variables
10) Definir operacionalmente las variables
11) Categorizar las variables
Captulo 11
12) Definir de la poblacin
13) Seleccionar la tcnica de muestreo
14) Seleccionar o construir los instrumentos de medicin
Captulo 12
15) Seleccin del diseo de investigacin Captulo 13
16) Recolectar los datos
17) Organizar los datos
18) Analizar los datos
19) Interpretar los datos
Captulo 14
20) Redactar de los resultados
21) Publicar los resultados
Captulo 15

Pgina 152 de 325
152
CAPTULO 10: PROBLEMA, BIBLIOGRAFA, TEORA Y OBJETIVOS

En este captulo se describirn los cuatro primeros pasos de una investigacin tpica: el planteo del
problema que la investigacin debe resolver, la revisin bibliogrfica, el planteo del marco terico y el
planteo de los objetivos de la investigacin.

1. PLANTEO DEL PROBLEMA

El problema de investigacin es aquel que la investigacin busca resolver, y por tanto el que dar sentido
a sta. El problema suele ser definido tambin como toda situacin considerada como difcil de resolver,
y que por tanto necesita de la investigacin para resolverse (Tamayo, 1999:169), o como aquel mbito
de la investigacin para el que la ciencia no tiene todava una solucin satisfactoria (Len y Montero,
1995:22). Autores como Tamayo destacan que el problema encierra aspectos conocidos y desconocidos,
y que la idea es descubrir los desconocidos que integran la situacin problemtica (Tamayo, 1999:169).

Formulacin.- Si la investigacin cientfica es un automvil, el combustible que la alimenta son los
hechos. Pero lo que la pone en marcha no es un hecho sino un problema y, obviamente, la intencin del
investigador por resolverlo. Lewis Carroll, en "Alicia en el pas de las maravillas", hace decir a uno de
sus personajes que "como no tena respuesta para ninguno de sus problemas, el modo de formularlos
no importaba demasiado". Pero en el caso de la investigacin cientfica s interesa cmo se plantear el
problema. La importancia de formularlo correctamente fue alguna vez destacada por Claude Bernard,
cuando dijo que el experimentador que no sabe lo que est buscando, no comprender lo que
encuentra.
La correcta formulacin de un problema supone:
a) Expresarlo en forma de interrogante. La pregunta es la forma gramatical que asume el problema.
b) Expresarlo en forma lo suficientemente concreta como para que pueda ser resuelto efectivamente por
la va cientfica, es decir, para que sea solucionable cientficamente. As, el problema de la existencia de
Dios no es lo suficientemente concreto pues no hay investigacin cientfica que pueda resolverlo, siendo
mas bien un problema filosfico. Sealan Selltiz y otros (1980) que el problema debe reducirse a
dimensiones manejables o a un cierto nmero de sub-tareas, cada una de las cuales debe ser abordada
en un solo estudio.
c) Expresarlo en forma lo suficientemente clara como para saber qu datos buscar para resolverlo. As,
el problema de si el perro del comisario ladra o no, adems de ser un problema cotidiano y no cientfico,
no es lo suficientemente claro ya que no especifica si el comisario "tiene" un perro o si el comisario "es"
un perro, con lo cual no se sabr qu datos buscar para resolverlo: si los datos sobre el perro o los
datos sobre su dueo. Del mismo modo, no puede decirse simplificadamente "voy a investigar el
problema de la droga". Esta es una afirmacin ambigua que puede apuntar tanto al problema de cules
son las causas de la drogadiccin como al problema de cmo fabricar droga sin que se entere la polica.
En cambio, problemas bien planteados son por ejemplo: qu incentiva el rendimiento escolar?, o
influye la educacin recibida sobre la ideologa poltica de las personas? Se trata de problemas
solucionables y donde se sabe el tipo de informacin a buscar para resolverlos.

El problema es del investigador.- Conviene distinguir claramente el problema que llev a hacer la
investigacin, del problema que se busca resolver con la investigacin. Por ejemplo, una cosa es el
problema que tienen las personas que no pueden superar su miedo a volar, y otra es el problema
de examinar la eficacia de tratamientos para perder ese miedo. El primero es un problema de la
poblacin, que engendra o motiva un nuevo problema, el del investigador.

La justificacin del problema.- En muchos informes de investigacin se especifica porqu es importante el
abordaje del problema. Esta justificacin no se refiere a la importancia personal que el problema puede
tener para el investigador, sino a la importancia que tiene para la comunidad cientfica y la poblacin en
general. Se supone que resolver el problema implicar aumentar en amplitud y profundidad el
conocimiento de la realidad, o bien prestar algn beneficio prctico inmediato. As, aunque un problema
puede ser muy importante en tales sentidos, no alcanza a justificarse si su investigacin es ms de lo
mismo, es decir, si ya hay una gran cantidad de investigaciones que trataron la cuestin de la misma
manera.
La justificacin es lo que orienta la eleccin del problema, que puede seleccionarlo el mismo investigador
o la institucin para la cual trabaja.
Sealan Hernndez Sampieri R y otros (1996:17) que los criterios principales para evaluar el valor
potencial de una investigacin son: conveniencia, relevancia social, implicaciones prcticas, valor terico
y utilidad metodolgica. Agregan que el planteamiento de un problema de investigacin cientfico no
puede incluir juicios morales o estticos, pero debe cuestionarse si es o no tico llevarlo a cabo.

El problema y el tema.- Debe distinguirse claramente el problema del tema de investigacin. Un tema
puede ser el insomnio, mientras que los problemas que pueden tratarse dentro de esa amplia temtica

Pgina 153 de 325
153
pueden ser existen tratamientos eficaces contra el insomnio? cules son las causas del insomnio? o
hay alguna relacin entre insomnio y sedentarismo? Cuando la investigacin contempla variables
independientes y dependientes, es habitual considerar al tema como la variable dependiente.

Problema e hiptesis.- Mientras que el problema es la pregunta, la hiptesis es la respuesta tentativa.
Sealan Selltiz y otros (1980) que si no hay suficientes conocimientos para proporcionar una base para
hacer una hiptesis, como ocurre en los estudios exploratorios, la formulacin del problema incluir una
indicacin de las reas sobre las que se desea establecer una hiptesis. En cambio si ya existen
conocimientos relevantes concernientes al problema, la formulacin de ste ltimo incluir hiptesis
como gua para la recogida de datos y para su anlisis, y como medio para poder relacionar el estudio
con otros similares o con un cuerpo de teora en general.
Sealan Hernndez Sampieri R y otros, (1996:17) que plantear el problema de investigacin es afinar y
estructurar ms formalmente la idea de investigacin, desarrollando tres elementos: objetivos de
investigacin, preguntas de investigacin y la justificacin de sta. Los tres elementos deben ser capaces
de guiar a una investigacin concreta y con posibilidad de prueba emprica. Los objetivos y preguntas de
investigacin deben ser congruentes entre s e ir en la misma direccin. 3. Los objetivos establecen qu
pretende la investigacin, las preguntas nos dicen que respuestas deben encontrarse mediante la
investigacin y la justificacin nos indica porqu debe hacerse la investigacin.

2. REVISIN BIBLIOGRFICA

Slo cuando se tiene el claro el problema a resolver en la investigacin, se pueden comenzar a buscar
qu otras soluciones o respuestas se dieron al mismo. La importancia de esta revisin bibliogrfica reside
en que: a) permite saber si otras investigaciones ya han resuelto eficazmente el problema, con lo cual
toda nueva investigacin ser superflua. En raro encontrar esta situacin porque un problema cientfico
en rigor no termina nunca de resolverse toda vez que siempre podrn aportarse nuevos elementos de
juicio para reforzar la hiptesis o para refutarla; b) permite detectar investigaciones que hayan resuelto
el problema solo parcialmente, con lo cual la nueva investigacin intentar completar la respuesta. Por
ejemplo, puede ocurrir que un problema haya sido tratado solamente en un estudio exploratorio, con lo
cual la nueva investigacin intentar continuarlo mediante una investigacin descriptiva.
Para Tamayo, la revisin bibliogrfica es el fundamento de la parte terica de la investigacin, y permite
conocer a nivel documental las investigaciones relacionadas con el problema planteado. Presenta la teora
del problema aplicada a casos y circunstancias concretas y similares a las que se investiga (Tamayo,
1999:186).

3. PLANTEO DEL MARCO TERICO

En el marco terico se expresan las proposiciones tericas generales, las teoras especficas, los
postulados, los supuestos, categoras y conceptos que han de servir de referencia para ordenar la masa
de hechos concernientes al problema o problemas que son motivo de estudio e investigacin. Tambin,
en las investigaciones avanzadas, puede ser el encuadre en que se sitan las hiptesis a verificar
(Ander-Egg, 1987:154).
Destacan Hernndez Sampieri y otros (1996:54) que para elaborar el marco terico es necesario
detectar, obtener y consultar la literatura y otros documentos pertinentes para el problema de
investigacin, as como extraer y recopilar de ellos la informacin de inters. La construccin del marco
terico depende de lo que encontremos en la revisin de la literatura: a) que existe una teora
completamente desarrollada que se aplica a nuestro problema de investigacin, b) que hay varias teoras
que se aplican al problema de investigacin, c) que hay generalizaciones empricas que se aplican a dicho
problema o d) que solamente existen guas an no estudiadas e ideas vagamente relacionadas con el
problema de investigacin. En cada caso vara la estrategia para construir el marco terico. Con el
propsito de evaluar la utilidad de una teora para nuestro marco terico podemos aplicar cinco criterios:
a) capacidad de descripcin, explicacin y prediccin, b) consistencia lgica, c) perspectiva, d)
fructificacin y e) parsimonia. 8. El marco terico orientar el rumbo de las etapas subsecuentes del
proceso de investigacin (Hernndez Sampieri R y otros, 1996:54).
Las funciones que se atribuyen al marco terico son, entre otras, a) delimitar el rea de la investigacin;
b) sugerir guas de investigacin; c) compendiar los conocimientos existentes en el rea que se va a
investigar; d) Expresar proposiciones tericas generales (Tamayo, 1999:139).
El marco terico incluye tambin las definiciones de los principales conceptos de la investigacin, por
cuanto en rigor toda definicin es una teora acerca de lo definido, en tanto se consideren las llamadas
por Copi (1974) definiciones tericas.
Destacan Selltiz y otros (1980) que sean o no establecidas las hiptesis, la investigacin requiere una
definicin de conceptos a utilizar en la organizacin de los datos. Algunas de estas definiciones sern
formales: dan a conocer la naturaleza general del proceso o fenmeno a indagar y su relacin con otros
estudios o con la teora cientfica existente. Otras sern definiciones de trabajo, las cuales permiten la
recogida de datos que el investigador est dispuesto a aceptar como ndice de sus conceptos (Selltiz y

Pgina 154 de 325
154
otros, 1980). Debe aclararse que las definiciones tericas se explicitan en el marco terico, mientras que
las definiciones operacionales se explicitan ms adelante, cuando se definen las variables.

4. PLANTEO DE OBJETIVOS

Si el problema asume gramaticalmente la forma de una pregunta, los objetivos tienen la forma
gramatical de un verbo en infinitivo. Como el objetivo supone acciones a realizar, deben ser expresados
mediante verbos, tales como explorar, describir, correlacionar o probar.
El planteo de objetivos supone entonces elegir qu tipo de investigacin se realizar. Ser un estudio
exploratorio, descriptivo, explicativo o una combinacin de ellos? Ser una investigacin primaria o
bibliogrfica?
A veces se especifica un objetivo general y objetivos especficos. Estos ltimos corresponden a las
diversas sub-tareas en las cuales se descompone la tarea principal, o bien pueden hacer referencia a
otros objetivos fuera del problema de investigacin pero que por alguna razn han sido considerados
dentro de la misma.

Pgina 155 de 325
155
CAPTULO 11: HIPTESIS Y VARIABLES

Las investigaciones tpicas comienzan planteando una hiptesis que deber ser probada. La excepcin
son las investigaciones exploratorias, donde el poco o nulo conocimiento sobre el tema a investigar puede
impedir su formulacin: a veces slo se alcanzan a plantear conjeturas que podrn o no convertirse en
hiptesis. La diferencia radica en que la conjetura no est apoyada por suficientes elementos de juicio
como para merecer el esfuerzo de disear una investigacin que la pondra a prueba.
Segn Hernndez Sampieri y otros, (1996:103), en efecto, hay investigaciones que no pueden formular
hiptesis porque el fenmeno a estudiar es desconocido o se carece de informacin para establecerlas,
pero ello slo ocurre en los estudios exploratorios y en algunos estudios descriptivos.
Para poder probar una hiptesis, debe estar adecuadamente formulada, y debern estar identificados sus
componentes bsicos: las unidades de anlisis y las variables. En el caso de stas ltimas, en particular,
debern estar adecuadamente definidas y categorizadas.
Ms concretamente, los pasos que deben cumplirse en esta etapa de la investigacin son los siguientes:
1) Plantear la hiptesis.
2) Clasificar la hiptesis.
3) Definir las unidades de anlisis.
4) Definir conceptualmente las variables.
5) Clasificar las variables.
6) Definir operacionalmente las variables.
7) Categorizar las variables.

1. HIPTESIS

Definicin

La hiptesis es bsicamente una respuesta tentativa al problema de investigacin. Si el problema es
porqu lloran los bebs?, una hiptesis puede ser los bebs lloran porque tienen hambre, o los bebs
lloran porque no ven a la madre, etc. De esta forma, un mismo problema puede ser respondido con
varias hiptesis.
Entre las principales caractersticas de las hiptesis pueden mencionarse las siguientes:

1) Una hiptesis es una proposicin general, sinttica y verificable. Es una proposicin, o sea una
afirmacin (o negacin) acerca de algo. Cuando se dice aprendizaje no se est afirmando ni negando
nada, pero cuando se dice que el aprendizaje es estimulado con premios aqu ya se est afirmando
algo. Aunque tambin una negacin es una proposicin (el aprendizaje no es estimulado por premios),
lo habitual en la ciencia es la formulacin de hiptesis en forma positiva o afirmativa.
Mientras los problemas se expresan mediante preguntas, las hiptesis se expresan mediante
proposiciones.
De los varios tipos de proposiciones que hay, y siguiendo la tradicin aristotlica del Organon, las
hiptesis suelen expresarse como proposiciones hipotticas, y, ms concretamente (Len y Montero,
1995:22), en la forma condicional <Si entonces>. La proposicin categrica Los bebs lloran porque
tienen hambre puede convertirse en la proposicin hipottica Si X es un beb que llora, entonces X
tiene hambre.
La proposicin hipottica debe adems ser general: se supone y pretende que la hiptesis sea aplicable a
todos los individuos (incluso a los desconocidos, con lo que la hiptesis tiene tambin un carcter
predictivo). El anterior ejemplo sobre el aprendizaje es una proposicin general; en cambio, "Juancito
aprende ms cuando es premiado" es singular, y en este sentido no es una hiptesis. A lo sumo podr
ser una proposicin deducible de una hiptesis ("el aprendizaje aumenta con los premios") cuando no el
resultado de una observacin. El requisito de la generalidad deriva de una exigencia del conocimiento
cientfico que dice que tiene que ser general pues esto no slo aumenta el saber sobre la realidad sino
que adems, al ser predictivo, tiene una mayor utilidad prctica.

El requisito de la generalidad es importante para diferenciarlo del sentido del trmino hiptesis que suele
utilizarse en la vida cotidiana. Si alguien no llega a la cita, buscamos alguna hiptesis para explicar esta
situacin: haba huelga de transportes, tuvo un accidente, se qued dormido leyendo este libro, etc. Son todas
respuestas tentativas que despus podrn o no verificarse o no. Sin embargo, esta hiptesis no es general sino
singular, porque est destinada a dar una respuesta a ese problema especfico (aqu y ahora alguien no lleg a la
cita), y es inaplicable a todos los casos donde alguien no llega.

La hiptesis tambin debe ser una proposicin sinttica. De acuerdo con cierta clasificacin de inspiracin
kantiana (Mc Guigan, 1978:53), las proposiciones pueden ser analticas, contradictorias y sintticas.
Las proposiciones analticas son siempre verdaderas: "lo que es, es", o "el tringulo tiene tres ngulos",
etc. Las proposiciones contradictorias son siempre falsas: "una empanada no es una empanada", "un
cuadriltero tiene cinco lados", etc. Lo caracterstico de estas proposiciones es que se conoce su verdad o
su falsedad simplemente por el examen de la misma proposicin, con lo que no se requiere confrontarlas

Pgina 156 de 325
156
con la realidad: no se precisa observar un tringulo para saber que tiene tres ngulos, porque el
significado de tringulo ya lo implica.
Si en las proposiciones analticas (o contradictorias) se tiene siempre la certeza de su verdad (o
falsedad), en las proposiciones sintticas no es posible saber de antemano (o "a priori") si son verdaderas
o falsas. Por ejemplo "el lpiz es azul", o "la frustracin genera agresin". Puesto que se desconoce su
verdad o falsedad, requerirn entonces ser verificadas empricamente, lo que constituye otra de las
caractersticas de una hiptesis.
Pero para poder verificar una proposicin sinttica esta deber ser, obviamente, verificable. "Lucifer vive
en el infierno" es una proposicin sinttica pues no se sabe de antemano si esto es cierto o no, pero no
es verificable pues no se cuenta con ninguna experiencia que pueda probarlo. Cabe recordar que una
hiptesis es una respuesta a un problema, y si se desea que ste sea solucionable se deber buscar una
respuesta verificable. "La frustracin genera agresin" s es verificable, por ejemplo dando a las personas
ciertos problemas para resolver que en realidad son insolubles, y luego medir sus niveles de agresin. Es
entonces posible administrar estmulos frustrantes y observar luego si aparecen o no respuestas
agresivas.
Para que una hiptesis sea verificable, deben poder extraerse de ella consecuencias lgicas y por esa va
comprobar su acuerdo con los hechos conocidos o desconocidos. As, la hiptesis todos los cuervos
vuelan es verificable porque puede deducirse de ella el enunciado verificable este cuervo vuela.

2) Las hiptesis surgen de una teora previa y a veces tambin de la experiencia. Aunque formular una
hiptesis requiere cierta dosis de creatividad, se basa siempre en una teora previa, implcita o explcita.
As, para responder a la pregunta por qu los bebs se chupan el dedo?, puede plantearse la hiptesis
de la alucinacin de pecho o la hiptesis de la reaccin circular primaria. En el primer caso se ha tomado
como referencia la teora freudiana, y en el segundo caso la teora piagetiana. En otro ejemplo, frente al
problema de porqu existe el dolor, puede plantearse la hiptesis de que se trata de un aviso natural de
alguna enfermedad para alertar al sujeto y poder combatirla, lo cual supone una teora acerca del
funcionamiento de los seres vivos.
Las hiptesis cientficas requieren que las teoras de base estn claramente explicitadas, y por esta razn
se suele requerir que en la presentacin de una tesis se incluya el marco terico.
A veces las hiptesis surgen de la experiencia. Luego de haber visto muchas veces que luego del
relmpago viene el trueno, se puede formular la hiptesis El relmpago es la causa del trueno,
hiptesis que supone tambin un marco terico que, en este caso, podra ser la teora de que todo tiene
una causa, o la teora de que la sucesin regular de dos sucesos supone causalidad.

Hernndez Sampieri y otros (1996:103), refieren que las hiptesis surgen normalmente del planteamiento del
problema y la revisin de la literatura, y algunas veces de teoras. Por su parte, Selltiz y otros (1980) sealan que
una hiptesis puede originarse a partir de cuatro fuentes: como una simple sospecha, como resultado de otros
estudios, como consecuencia lgica de una teora, o finalmente como resultado de la observacin de ciertas
relaciones entre variables. Tanto si nace de una sospecha como si surge de estudios anteriores, la hiptesis estar
aislada de un cuerpo de teora, lo cual no sucede cuando la hiptesis surge como consecuencia lgica de una
teora. En realidad puede cuestionarse esta ltima afirmacin: toda hiptesis est conectada con algn cuerpo de
teora, aunque no se trate de una teora cientfica sino de un simple cuerpo de creencias, que en sentido amplio es
tambin una teora.

3) Las hiptesis cientficas han de ser relevantes, en el sentido que procuran dar explicaciones
"esperables" de acuerdo al contexto donde se trabaja. En un contexto cientfico no puede afirmarse como
hiptesis que "la neurosis se debe a que existe el universo". Indudablemente esto no carece de sentido,
porque si no habra universo no habra personas y por lo tanto tampoco neurticos, pero sta no es la
explicacin esperable en un contexto psicolgico. Del mismo modo, en el contexto de la qumica sera
irrelevante explicar un incendio diciendo que se debi a que se quera cobrar el seguro. La explicacin
relevante en el mismo contexto es aportada por la teora de la combustin.

4) Tras la aparente complejidad de su indagacin, el cientfico trata de buscar la solucin ms sencilla,
por lo que las hiptesis que plantea suelen ser simples. De hecho, dadas dos hiptesis alternativas que
fueron ambas verificadas con la misma fuerza, se tiende a preferir la ms simple, o sea, aquella que con
los mismos elementos explica ms, o aquella que muestra una realidad ms armnica y uniforme, o
hasta incluso aquella que resulta psicolgicamente ms entendible o ms plausible.

5) Algunas veces se proponen varias hiptesis para resolver un problema (multiplicidad), y luego se va
haciendo una seleccin sobre la base de los elementos de juicio a favor o en contra de cada una de ellas.
Hempel (1977) cita un ejemplo donde para resolver el problema de por qu las mujeres parturientas
contraan la fiebre puerperal, se haban propuesto seis hiptesis alternativas.

6) Las hiptesis son proposiciones tentativas acerca de las relaciones entre dos o ms variables
(Hernndez Sampieri y otros, 1996:103), aunque tambin la hiptesis puede hacer referencia a una sola
variable, como por ejemplo en la mayora de los pacientes psicticos presentan delirios, como en las
investigaciones descriptivas. En las investigaciones correlacionales y explicativas, la hiptesis permite al

Pgina 157 de 325
157
investigador relacionar variables entre s para determinar cmo varan unas en funcin de otras y, de
esta manera, ampliar y profundizar su comprensin de la realidad.

Clasificacin de las hiptesis

De las diversas taxonomas existentes, dos clasificaciones pueden ser de inters para la metodologa de
la investigacin.

1) La primera clasificacin las ordena en hiptesis descriptivas, correlacionales y explicativas o causales,
segn correspondan a investigaciones descriptivas, correlacionales o explicativas, respectivamente.
Las hiptesis descriptivas, por tanto, se refieren a una sola variable, como por ejemplo la mayora de los
grupos humanos tienen alta cohesin, donde la variable es cohesin grupal.
Las hiptesis de correlacin afirman una cierta asociacin estadstica o concomitancia entre dos o ms
factores o variables, como "a mayor cohesin grupal mayor eficacia laboral". Esta hiptesis dice que
cuanto ms unido es un grupo mejor trabaja, o sea informa que los factores cohesin y eficacia estn
altamente correlacionados: cuando aumenta uno tambin aumenta el otro. La correlacin podr ser
directa (ambos factores aumentan, o ambos disminuyen), o inversa (uno aumenta y el otro disminuye, o
viceversa).
Sin embargo, la hiptesis no dice explcitamente que un factor sea la causa del otro (aunque pueda uno
suponerlo ntimamente o leerlo entre lneas), o sea que explcitamente no est formulada como hiptesis
causal. Hubiera sido as en la hiptesis "la causa de la eficacia laboral es la cohesin grupal", o "la
cohesin grupal determina la eficacia laboral", donde la expresin "determina" ya sugiere en forma
explcita la idea de un vnculo causa-efecto.
Las hiptesis causales tienen mayores pretensiones: no solamente afirman que dos factores se
encuentran correlacionados sino que adems arriesgan la idea que hay un vnculo causal entre ellos, o
sea uno es la presunta causa y el otro el efecto. Las hiptesis de este tipo son claramente explicativas
(explican la eficacia a partir de la cohesin), mientras que las hiptesis de correlacin son mas bien
descriptivas, pues resumen las observaciones realizadas sobre cierta cantidad de grupos donde se
constat una cierta regularidad entre la cohesin y la eficacia.
Normalmente, las hiptesis de correlacin van surgiendo en el transcurso de una investigacin
descriptiva, pero a medida que avanza esta descripcin el investigador puede ir alimentando la sospecha
de que entre ciertos factores no slo hay una correlacin sino tambin una relacin causal, que deber
ser probada mediante una investigacin explicativa.
Cuando autores como Selltiz y otros (1980) sealan que la funcin de la hiptesis es sugerir explicaciones
de ciertos hechos y orientar la investigacin de otros, estn probablemente indicando la funcin de las
hiptesis explicativas por un lado, y de las hiptesis descriptivas y correlacionales por el otro.

2) La segunda clasificacin ordena las hiptesis en hiptesis sustantivas e hiptesis estadsticas. Las
primeras son propiamente las hiptesis que se quiere probar en la investigacin. Cuando esta prueba
requiere un procedimiento estadstico, entonces la hiptesis sustantiva se traduce al lenguaje de la
estadstica y se trabaja sobre ella desde este punto de vista.
Otros autores ofrecen clasificaciones ligeramente diferentes encuadrables en este segundo criterio
clasificatorio.
Por ejemplo, Mora y Araujo (1971) refieren que en la investigacin usamos dos tipos de hiptesis:
sustantivas y auxiliares. Las sustantivas relacionan las variables que queremos estudiar. Las auxiliares
pueden ser de validez o estadsticas. Las hiptesis de validez relacionan las variables conceptuales o
latentes con los indicadores u observaciones. Las hiptesis estadsticas relacionan las unidades de anlisis
observadas con el universo al que pertenecen. Los problemas de medicin tienen que ver con las
hiptesis auxiliares de validez.
Otros autores (Hernndez Sampieri y otros, 1996:103) indican que las hiptesis se clasifican en: a)
hiptesis de investigacin, b) hiptesis nulas, c) hiptesis alternativas. A su vez, las hiptesis de
investigacin se clasifican de la siguiente manera:

a) Hiptesis descriptivas del valor de variables que se van a observar en un contexto.
b) Hiptesis
correlacionales
Hiptesis que establecen simplemente relacin entre las
variables
Bivariadas
Multivariadas
Hiptesis que establecen cmo es la relacin entre las
variables (hiptesis direccionales)
Bivariadas
Multivariadas
c) Hiptesis de
la diferencia de
grupos
Hiptesis que slo establecen diferencia entre los grupos a comparar.
Hiptesis que especifican a favor de qu grupo, de los que se comparan, es la
diferencia.
d) Hiptesis
causales
Bivariadas
Multivariadas Hiptesis con varias variables independientes y una dependiente.
Hiptesis con una variable independiente y varias dependientes.
Hiptesis con varias variables tanto independientes como
dependientes.

Pgina 158 de 325
158
Hiptesis con presencia de variables intervinientes.
Hiptesis altamente complejas.

Puesto que las hiptesis nulas y las alternativas se derivan de las hiptesis de investigacin, pueden
clasificarse del mismo modo pero con los elementos que las caracterizan. Las hiptesis estadsticas son la
transformacin de las hiptesis de investigacin, nulas y alternativas en smbolos estadsticos. Se
clasifican en: a) hiptesis estadsticas de estimacin, b) hiptesis estadsticas de correlacin, y c)
hiptesis estadsticas de la diferencia de grupos (Hernndez Sampieri y otros, 1996:103).
Estos mismos autores agregan que la formulacin de hiptesis va acompaada de las definiciones
conceptuales y operacionales de las variables contenidas dentro de las hiptesis, lo que puede
considerarse en relacin con las llamadas hiptesis de validez mencionadas por Mora y Araujo (1971).

Componentes de la hiptesis: los conceptos

Desde el punto de vista lgico la proposicin es una estructura intermedia entre el concepto y el
razonamiento: varios conceptos constituyen una proposicin, y varias proposiciones un razonamiento.
Por consiguiente la hiptesis, al ser una proposicin, puede descomponerse en sus elementos
constitutivos llamados conceptos. El concepto (Selltiz y otros, 1980) es una representacin abreviada de
una diversidad de hechos, o sea que su utilidad es la de simplificar el pensamiento, y sirven para
organizar los datos y relacionarlos entre s.

No debe confundirse el concepto con el trmino: el primero es una idea, mientras que el segundo es una mera
palabra. Muchas teoras utilizan el mismo trmino como por ejemplo, "transferencia", pero cada una lo
conceptualiza de diferente manera y entonces son conceptos diferentes: una cosa es la transferencia en el
psicoanlisis, otra en las teoras del aprendizaje, y otra el ARN de transferencia en biologa. Otro tanto puede
decirse del trmino "resistencia", que puede apuntar a un concepto de la fsica o del psicoanlisis.

Si bien se emplean conceptos en la vida cotidiana ("golosina", "alegra"), y los hay tambin en la filosofa
("ente", "alma"), los conceptos que aqu interesan son aquellos que pueden ser tratados cientficamente,
y que suelen ser llamados constructos.

Respecto del constructo, indica Arnau Gras (1980) que la mejor forma en que el cientfico limita su objeto de
observacin es mediante el concepto, una abstraccin hecha de algn aspecto o rasgo que presentan las cosas
observadas. Por ejemplo: inteligencia, rendimiento, agresin, emocin, tendencia, etc. El constructo es un
concepto creado deliberadamente con fines cientficos y que, a diferencia del concepto propiamente dicho, posee
dos caractersticas: a) se relaciona con otros constructos (aspecto relacional), y b) puede observarse y medirse
(aspecto reductivo).
Para Arnau Gras (1980:129), si un concepto puede observarse y medirse, y si puede vinculrselo con otros
conceptos a travs de una hiptesis, entonces puede usrselo en la investigacin cientfica y recibe el nombre de
"constructo".

Por ejemplo, en la hiptesis "en la provincia de Buenos Aires, a mayor densidad poblacional menor
solidaridad entre los habitantes", los conceptos que la componen son: "rea geogrfica", "densidad
poblacional", "solidaridad", habitantes y la relacin a mayor a menor.
Los conceptos de una hiptesis pueden clasificarse de la siguiente manera:

Conceptos
objetivos
Primera
clasificacin
Empricos: Son directamente observables.
Tericos: Son indirectamente observables.
Segunda
clasificacin
Unidades de anlisis: Son los objetos (o sujetos a estudiar).
Variables: Son las propiedades de los objetos.
Conceptos
relacionales
Relacionan conceptos objetivos entre s.

a) Conceptos objetivos y relacionales.- Como puede apreciarse en el ejemplo anterior, algunos conceptos
se refieren a entidades (habitantes) y propiedades de estas entidades (ser solidarios), mientras que otros
simplemente relacionan dichos conceptos (a mayor a menor). Alguna vez la lgica medieval los
denomin, respectivamente, conceptos categoremticos y sincategoremticos.
En otro ejemplo: la hiptesis hay una asociacin significativa entre inteligencia y rendimiento escolar
contiene como trminos objetivos inteligencia, rendimiento escolar y, tcitamente, alumnos. Contiene
adems el trmino relacional hay una asociacin significativa entre.

b) Conceptos empricos y tericos.- Los conceptos tienen diversos grados de abstraccin, desde los ms
empricos como perro o sexo a los ms abstractos como inteligencia o personalidad: los primeros son
directamente observables, y los segundos no, pero pueden traducirse a otros conceptos ms empricos
mediante un proceso llamado operacionalizacin. Por ejemplo, traducir inteligencia como habilidad para
el clculo. Los conceptos involucrados en una hiptesis deben poder observarse y medirse.

Pgina 159 de 325
159
Un concepto es tanto ms terico cuanto ms distancia hay entre el concepto y el objeto de la realidad
representado, y, como indican Selltiz y otros (1980), ms posibilidad de falsas interpretaciones del
mismo hay.
Esta primera clasificacin de conceptos objetivos se relaciona con la segunda clasificacin de conceptos
objetivos de la siguiente manera: mientras las unidades de anlisis de consideran habitualmente
conceptos empricos, las variables pueden ser conceptos tericos o empricos.

c) Unidades de anlisis.- Las unidades de anlisis son los elementos cuyas propiedades se quieren
investigar. En psicologa, unidades de anlisis pueden ser personas, grupos, familias, instituciones, y
hasta funciones psquicas como la percepcin, la memoria, etc. Cuando debe especificarse la poblacin
que se estudiar, es decir, el conjunto de las unidades de anlisis, se especifican tambin estas, y, por
caso, en lugar de decir genricamente personas se puede decir adultos mayores de 65 aos, masculinos
y que viven en Argentina, o bien pacientes con medicacin antidepresiva registrados durante 2005 en el
Hospital Durand.
En biologa las unidades de anlisis pueden ser organismos vivientes, ecosistemas, clulas, etc. En fsica
tomos o partculas subatmicas, en astronoma, estrellas, planetas o galaxias, etc.
Entre los conceptos objetivos tambin estn las variables, cuya importancia exige un tratamiento ms
extenso en el siguiente tem.

2. VARIABLES

Definicin

Las variables (V) son atributos, propiedades o caractersticas de las unidades de anlisis (UA),
susceptibles de adoptar distintos valores o categoras. Ejemplos de variables como atributos de las
personas son la edad, el sexo, la inteligencia, la estatura, la personalidad, la memoria, la zona de
residencia, la ocupacin, el grado de solidaridad, el color de cabello o el estado civil. Ejemplos de
atributos de una poblacin son la densidad y el tamao.
Los valores o categoras de la variable pueden variar tanto entre sujetos (unos pueden ser ms
inteligentes que otros), como en el mismo sujeto a lo largo del tiempo (por ejemplo la edad). Se las
llama variaciones interindividuales y variaciones intraindividuales.

Las variaciones interindividuales son propias de lo que en psicologa evolutiva se llaman estudios transversales
(se realizan en un aqu y ahora), mientras que las variaciones intraindividuales conciernen mas bien a estudios
longitudinales (que se realizan a lo largo del tiempo).
El sexo puede variar de una persona a otra, pero no dentro de la misma persona (salvo que se haga una
operacin para cambiar de sexo). La preferencia por un equipo de ftbol vara de una persona a otra, pero no
suele variar con el tiempo dentro de la misma persona. La edad, finalmente, es una variable que vara tanto
interindividualmente como intraindividualmente. Lo que nunca puede suceder, por una cuestin lgica, es que
haya variables que varen dentro de una persona y que no puedan nunca variar de una persona a otra. La razn
es que si la propiedad vara dentro de la misma persona, existe la posibilidad de que dos personas tengan
diferentes valores para esa variable, con lo cual habr una variacin interindividual.

La variable puede variar de dos formas: si es asunto de presencia o ausencia, la variacin es factorial, y
si es asunto de grados, es funcional (ONeil, 1968). Por ejemplo, la variable terremoto puede adoptar
dos valores: s (presencia) o no (ausencia). En cambio la variable cantidad de hijos puede adoptar
diversos grados: 1, 2, 3, 4, etc. Muchas variables admiten ambos tipos de variacin, segn el inters del
investigador: la variable cantidad de hijos por ejemplo, puede variar factorialmente, si se eligen
arbitrariamente los valores con hijos (presencia) y sin hijos (ausencia).
Finalmente, refieren Selltiz y otros (1980) que las variables (y, en general, los conceptos) pueden
definirse de dos maneras: formalmente (para relacionarlos con la teora), y prcticamente (para
vincularlos con los hechos y poder hacer la investigacin). O sea que de los conceptos pueden darse
definiciones formales y definiciones de trabajo. La definicin de trabajo de Selltiz no es otra cosa que la
definicin operacional y el proceso de llegar a ella se llama operacionalizacin.

Relacin entre variables y unidades de anlisis

Se enumeran a continuacin algunas reglas bsicas de investigacin, concernientes a las precauciones
que deben tomarse al establecer relaciones entre unidades de anlisis y variables.

1) Unidades de anlisis y variable son conceptos diferentes pero relacionados.- La diferencia entre una
unidad de anlisis y una variable es la misma que hay entre una cosa y una propiedad. Una cosa puede
ser una mesa, y una propiedad puede ser su color, forma o tamao. Una cosa puede ser un metal, y una
propiedad su maleabilidad. Una cosa puede ser un conejo, y una propiedad su talla o el estado de su
sistema inmunolgico. Una cosa tambin puede ser una persona y como propiedades tener el sexo, la
inteligencia, la preferencia poltica, la edad, la raza, etc.

Pgina 160 de 325
160
Ahora bien: la cosa es la unidad de anlisis, mientras las propiedades son las variables, con lo cual stas
ltimas resultan ser atributos, propiedades o caractersticas de las unidades de anlisis.
Una investigacin puede trabajar, por ejemplo, con 200 unidades de anlisis (200 personas) y con slo
dos variables (peso y talla); otra investigacin puede trabajar con 30 unidades de anlisis (30
estudiantes) y cuatro variables (rendimiento, tipo de enseanza recibida, personalidad e inteligencia); y
as sucesivamente.

2) Unidades de anlisis y variables son conceptos relativos.- Lo que en una investigacin es una unidad
de anlisis, en otra puede funcionar como variable: si persona es una cosa, entonces memoria puede
ser una variable; pero si memoria es la cosa, entonces capacidad de almacenamiento puede ser una
variable. Dentro de una misma investigacin el mismo concepto no puede ser ambas cosas, o sea, unidad
de anlisis y variable al mismo tiempo. Por ejemplo, al investigar en los individuos la relacin entre
inteligencia y alimentacin, claramente inteligencia es una variable. Sin embargo, en las investigaciones
emprendidas por Charles Spearman, por citar un ejemplo histrico, la inteligencia es considerada la
unidad de anlisis, de la cual se estudian algunas variables mediante el anlisis factorial, como la
inteligencia verbal y la inteligencia manual, en sus mutuas relaciones.
Las siguientes afirmaciones ilustran la relatividad de las ideas de unidad de anlisis y variable.

Juan (UA) es inteligente (V)
La inteligencia (UA) es inteligencia verbal (V)
La inteligencia verbal (UA) es comprender palabras (V).

La transformacin de una variable en unidad de anlisis (por ejemplo inteligencia en la primera
afirmacin se transforma en inteligencia en la segunda afirmacin) tiene, sin embargo, un lmite. Este
lmite aparece cuando una variable ya no se puede transformar ms en unidad de anlisis. En el ejemplo,
la variable emprica "comprensin de palabras" no puede ya ser considerada unidad de anlisis porque no
se pueden seguir extrayendo variables de ella. En este caso, decimos que la variable se ha convertido en
un indicador. El concepto de indicador ser examinado al tratar el tema de la operacionalizacin.
Un ltimo ejemplo donde un mismo concepto puede ser entendido como una unidad de anlisis o como
una variable es el siguiente: un sonido en tanto 'propiedad de algo' es una variable (por ejemplo
propiedad de un sonajero), pero en tanto 'elemento que tiene una propiedad' es una unidad de anlisis
(por ejemplo el sonido tiene altura, intensidad o timbre).

3) La variable debe ser un atributo atingente o congruente con la unidad de anlisis.- Esto significa que la
variable elegida tiene que ser efectivamente una propiedad de la unidad de anlisis considerada. Por
ejemplo, no tiene sentido decir que el estado civil es una caracterstica de un grupo, o que el sexo sea
una propiedad de una organizacin. Desde ya, puede ocurrir que una misma variable sea aplicable a ms
de una unidad de anlisis: la cohesin puede predicarse tanto de una pareja, como de un grupo o una
organizacin. Ejemplos de unidades de anlisis y variables en psicologa son:

Unidad de anlisis Variables
Individuo Edad, inteligencia, personalidad, preferencia sexual, etc.
Pareja Estado civil, diferencia de edades, promedio de edades, personalidad del cnyuge
masculino, coincidencia de personalidades, cantidad de hijos, etc.
Grupo Cohesin, tamao, tipo de liderazgo, productividad, etc.
Organizacin Cultura organizacional, antigedad, grado de apertura al exterior, etc.

4) Toda investigacin debe incluir al menos una unidad de anlisis, y cada unidad de anlisis una
variable.- Carece de sentido decir "voy a iniciar una investigacin sobre las personas": hay que aclarar
qu aspectos o caractersticas de las personas vamos a investigar, an cuando luego se cambien sobre la
marcha.
Una investigacin sencilla puede considerar solamente un tipos de unidad de anlisis y una variable
(ejemplo, indagar las preferencias polticas de los estudiantes). Una investigacin ms compleja puede
incluir dos unidades de anlisis, cada una con su o sus correspondientes variables (ejemplo, indagar la
relacin entre la inteligencia de las personas y el grado de cohesin de los grupos que integran).

La definicin conceptual de las variables

Para poner a prueba la hiptesis es preciso dar una definicin conceptual de las variables que contiene.
Ello permitir luego clasificarlas, operacionalizarlas y categorizarlas.
En la vida cotidiana lo habitual es usar las palabras, no definirlas. De hecho, a la hora de definirlas se
suelen encontrar dificultades, en parte por falta de entrenamiento. As, cuando se intenta definir
profesin se dice profesin es lo que uno hace, lo cual puede confundirse con oficio o hobby.
En la investigacin cientfica se exigen definiciones explicitas y desprovistas de ambigedad y, adems,
preferiblemente definiciones conceptuales, es decir, que indiquen atributos esenciales y no se limiten a
dar ejemplos.

Pgina 161 de 325
161
Una definicin conceptual de la variable ausentismo laboral puede ser el grado en el cual un trabajador
no se reporta a trabajar a la hora programada para hacerlo (Hernndez Sampieri y otros, 1996:102). Por
tanto, una definicin conceptual no otra cosa que el significado de la palabra, significado que surge a
partir del marco terico utilizado (y por ello algunos autores llaman definicin terica a la definicin
conceptual). Por ejemplo, la variable inteligencia ser definida conceptualmente segn que se considere
la teora de Piaget, la teora de Weschler o la teora de Gardner.
Otras veces la variable es definida lexicogrficamente, es decir, apelando a la definicin del diccionario
comn. As, la variable sexo puede definirse como condicin orgnica que distingue al hombre de la
mujer. A partir de all, la sociologa ampliar la definicin y en funcin de ella buscar algn indicador
sencillo, como por ejemplo la informacin que ofrece el documento de identidad, mientras que la
medicina considerar otra definicin y buscar varios indicadores: la cromatina (sexo cromatnico), los
cromosomas X e Y (sexo cromosmico), la estructura de los genitales (sexo gonadal) y la apariencia
externa (sexo fenotpico) Esta diferente tipificacin del sexo har entonces que la primera variable sea
clasificada como simple y la segunda como compleja. Tambin har que se den diferentes definiciones
operacionales de las variables y que se las categorice de manera diferente (masculino y femenino en el
primer caso, y en el segundo caso masculino normal, femenino normal, sndrome de Turner,
sndrome de Klinefelter, seudohermafroditismo masculino, etc.). Por tanto, dar una definicin
conceptual de la variable es lo que permitir luego clasificarla, operacionalizarla y categorizarla.

Clasificacin de las variables

Las variables se pueden clasificar segn diversos criterios:

Criterio Tipos de variables
Segn su funcin en la investigacin Independientes / Dependientes / Extraas
Segn su nivel de medicin Cualitativas / Cuantitativas (discretas y continuas)
Segn su mbito de accin Organsmicas / Situacionales
Segn su distancia al plano emprico Empricas o manifiestas / Tericas o latentes
Segn su nivel de complejidad Simples / Complejas
Segn su manipulacin Activas / Asignadas

a) Segn su funcin en la investigacin.- Las variables pueden ser independientes, dependientes y
extraas. Se trata de variables relevantes porque por uno u otro motivo deben ser tenidas en cuenta en
las investigaciones.
La variable independiente (VI) es la que hace variar el investigador para ver si se produce tambin una
variacin en la variable dependiente (VD). Esta ltima entonces se define como la variable que vara o
puede variar con la VI: la variable dependiente no necesariamente debe variar, pero s es cierto que
sobre ella recae una expectativa de variacin. Finalmente, la variable extraa (VE) es aquella que
tambin puede hacer variar la variable dependiente pero que se la controla para que no lo haga, o, al
menos, para conocer su grado de influencia para luego descontarlo del efecto de la variable
independiente.
En las hiptesis causales, la VI es la posible causa y la VD es el posible efecto, mientras que en las
hiptesis correlacionales, puede decirse que la VI es aquella de la cual se sospecha que es la causa,
aunque dicha hiptesis no la plantee explcitamente como tal.
En sntesis hasta aqu: la variable dependiente es aquella que supuestamente depende de otra variable,
llamada independiente, y la variable independiente es aquella de la cual supuestamente depende la
variable dependiente. En la hiptesis que dice que "nuestra impresin de las personas depende de cmo
hablan" se est considerando que la impresin es la variable dependiente y el modo de hablar la variable
independiente.

Un tema clsico de la tradicin cientfica norteamericana de la dcada del 40 fue las investigaciones sobre la
relacin entre frustracin y agresin. Un experimento tpico consisti, por ejemplo, en reunir un grupo de
personas y darles para resolver problemas que eran en realidad insolubles, aunque no se les informaba de esto
ltimo. A medida que estas personas intentaban resolver los problemas, iba incrementndose su frustracin, y,
algunos antes y otros despus, empezaban a manifestar comportamientos agresivos con diferentes modalidades
e intensidades contra quienes les haban propuesto los problemas, lo que vena a sugerir que la frustracin
produca agresin. Fuera de estas situaciones experimentales, en la vida cotidiana no es impensable suponer que
cuando a una persona no le ofrecen un trabajo que le haban prometido, o cuando no es correspondida en su
amor (frustracin), puede desarrollar hacia el otro un comportamiento agresivo en una amplia gama que va
desde la calumnia hasta el ataque fsico.
En este contexto, se dice que la agresin depende de la frustracin y, por lo tanto, que la agresin es la variable
dependiente porque depende de la otra variable que es la frustracin, mientras que esta ltima ser la variable
independiente porque es la que supuestamente hace variar la agresin. La expresin supuestamente se aplica
aqu porque un objetivo central de la investigacin ser determinar si hay o no una relacin entre X e Y, es decir,
corroborar o refutar la hiptesis original.


Pgina 162 de 325
162
En psicologa, la variable dependiente es por lo comn la respuesta de la persona y, segn Arnau Gras
(1980), puede adoptar cualquiera de estas caracterizaciones: 1) una reaccin concreta, como la muscular
o la glandular, 2) un movimiento manifiesto y externo, como levantar una pata, donde estn involucrados
varios msculos, 3) una respuesta global en funcin de un fin, como presionar una barra para abrir una
caja, sin importar qu rgano o grupo muscular se emple, 4) una respuesta a una necesidad, como por
ejemplo la conducta de ataque, y 5) respuestas amplias y complejas, como la ansiedad, el poder.
Respecto de las variables extraas, el tema ya fue tratado en otro captulo, donde haban quedado
clasificadas como organsmicas y situacionales y como fuentes de invalidacin interna y externa.
Cabe reiterar, finalmente, tres importantes cuestiones que giran en torno a la relacin entre la variable
independiente X y la variable dependiente Y:
1) Cmo se decide cul es la variable independiente y cul la dependiente? En principio, el criterio
consiste en pensar cul es la causa y cul el efecto. Cuando se quiere investigar si tal droga produce o no
la curacin de una enfermedad, la droga ser claramente la causa (o la supuesta causa), y la curacin el
efecto, es decir, la variable independiente X ser la droga, y la variable dependiente Y ser el efecto
curativo.
Hay casos, sin embargo, donde cualquiera de ambas variables podra ser la causa o el efecto de la otra.
As por ejemplo, en principio, podra suponerse que la agresin depende de la frustracin, pero tambin,
y con el mismo fundamento, que la frustracin depende de la agresin (por ejemplo, cuanto ms
agresiva es una persona ms ser reprimida y, por ende, ms frustrada se sentir). Indudablemente, se
tiene todo el derecho de elegir una u otra posibilidad, y de esta eleccin depender qu se considerare
como X y qu como Y, orientando esta eleccin, en consecuencia, toda la investigacin.
Sea cual fuere la variable elegida como la posible causa (X), un requisito indispensable para poder
avanzar en la investigacin es que dicha variable debe poder ser manipulada por el investigador, es decir,
ste debe poder hacerla variar a voluntad, para ver si se produce o no una variacin en la variable
dependiente Y, o efecto.
Cierto tipo de investigaciones no se interesan, sin embargo, por indagar una relacin causa-efecto, sino
simplemente por averiguar si dos variables estn o no asociadas estadsticamente, es decir, si suelen
darse juntas. En estos casos, la eleccin de la variable independiente no se realizar en funcin de
pensarla como la causa, sino de pensarla como aquella variable que puede ser manipulada por el
investigador para establecer su grado de asociacin estadstica con la variable dependiente.
Este tipo de investigaciones suelen perseguir una finalidad exclusivamente prctica (pues no buscan
indagar vnculos de causalidad). Ejemplos tpicos son las investigaciones de mercado: a una empresa
puede interesarle si hay o no asociacin estadstica entre el nivel socioeconmico de las personas y el
color que prefieren en los envases de la leche, porque de ello depender en qu barrios distribuir los
envases de tal o cual color, y, con ello, podrn maximizarse las ventas.
2) Qu significa la expresin "depende"? Como qued sugerido, que Y depende de X puede significar dos
cosas: una dependencia estadstica o una dependencia causal. Una cosa es que dos variables se den
habitualmente juntas sin que necesariamente una sea la causa y otra el efecto (dependencia
estadstica), y otra es que dos variables estn relacionadas como causa y efecto (dependencia causal).
El color de la piel y la forma del crneo son variables que estn bastante asociadas estadsticamente: las
personas de piel negra son dolicocfalas, las de piel amarilla son braquicfalas y las de piel blanca son
mesocfalas. Esto no significa que el color de la piel sea la causa de la forma del crneo, ni que la forma
del crneo sea la causa del color de la piel: simplemente, ambas variables suelen darse juntas o, dicho
en trminos ms tcnicos, existe entre ellas una alta correlacin.
En cambio, el color de la piel y la aceptacin social, adems de estar asociadas estadsticamente (los
negros no son aceptados en ciertos barrios, etc.), hay tambin una dependencia causal: ciertas personas
son aceptadas o rechazadas debido a su color de piel.
De lo dicho se desprende que una dependencia estadstica no prueba necesariamente que haya una
dependencia causal. Para que hay una dependencia causal deben cumplirse, adems de la dependencia
estadstica, otra serie de condiciones, como por ejemplo la antecedencia temporal (la causa nunca puede
ocurrir despus del efecto).
En ocasiones suele asignarse sin ms un vnculo causal a una mera asociacin estadstica o correlacional.
Refieren Campbell y Stanley que "si pasamos revista a las investigaciones sobre educacin, pronto nos
convenceremos de que son ms los casos en que la interpretacin causal de la informacin correlacional
se exagera que aquellos en que se la desconoce..." (Campbell y Stanley, 1995:124).
3) Habida cuenta que la variable dependiente es aquella que depende de la independiente, de qu
depende a su vez la variable independiente? La variable independiente tiene dos fuentes posibles de
variacin: la variacin natural y la variacin provocada.
Con variacin natural queremos decir que, en la realidad, siempre es posible considerar que sobre la
variable independiente actan otras variables, lo que no es sino un caso particular del principio general
que sostiene que, al estar todas las variables relacionadas, cualquier variable influye sobre otras, y a su
vez recibe la influencia de otras tantas.
Por ejemplo, as como la variable dependiente agresin puede recibir la influencia de la variable
independiente frustracin, esta ltima tambin puede recibir la influencia de la variable educacin (si
consideramos que cierto tipo de educacin ensea al sujeto a tolerar mejor la frustracin), de la variable
edad (si consideramos que un nio se frustra ms fcilmente que un adulto), de variables de ndole

Pgina 163 de 325
163
bioqumica (si consideramos que la presencia de determinados neurotransmisores pueden acentuar o no
la tolerancia a la frustracin), etc.
Todas estas variables que influyen o influiran sobre la variable independiente frustracin ejercer su
accin en forma natural, es decir, sin la presencia de alguien (un investigador) que las haga variar
deliberadamente. Cuando esto ocurre, podemos hablar de una variacin provocada. Las variaciones
provocadas tienen sentido entonces en una situacin experimental donde hay un investigador que
deliberadamente haga variar la variable para producir un determinado efecto sobre la frustracin, con el
fin de estudiar cientficamente la naturaleza de la relacin entre ellas.

b) Segn su nivel de medicin.- Las variables pueden ser cualitativas o cuantitativas segn que se midan
no numricamente o numricamente. Las variables religin o sexo son cualitativas, mientras que las
variables edad o peso son cuantitativas. Sin embargo, depender de una decisin del investigador
considerar una variable como cualitativa o cuantitativa, segn su criterio. Si considera para estatura los
valores alta, media y baja la estar considerando cualitativa; no as si selecciona los valores 1,60m,
1,70m, etc. Si se desea tener precisin en la medicin, deber preferirse siempre que se pueda el nivel
cuantitativo.
En las variables cuantitativas, los nmeros deben ser empleados como indicadores de cantidad, no como
simples etiquetas. La variable jugador de ftbol admite como categoras defensor, atacante,
mediocampista, etc., pero tambin pueden expresarse con los nmeros 1 al 11, lo cual no significa que
esta variable sea cuantitativa.
Las variables cuantitativas pueden a su vez ser discretas y continuas segn como sea la escala numrica.
Por ejemplo, si slo se registran nmeros enteros, es una variable discreta (por ejemplo cantidad de
hijos), pero si se registran adems nmeros intermedios fraccionarios hasta donde el instrumento de
medicin lo permita, es una variable continua (por ejemplo tiempo, que puede admitir los valores una
hora, una hora y 10 minutos y una hora, 10 minutos y 25 segundos). En las variables continuas es
siempre posible agregar otro valor entre dos valores dados cualesquiera hasta donde el instrumento lo
permita, porque hay instrumentos ms precisos y menos precisos.

c) Segn su mbito de accin.- Las variables pueden ser organsmicas y situacionales. Las primeras son
propias del sujeto (temperamento, tolerancia a la frustracin, etc.), mientras que las segundas son
propias del ambiente o la situacin que rodea al sujeto (clima poltico, clima meteorolgico, tipo de tarea
a realizar, etc.). Seala Arnau Gras (1980) que la variable situacional son estmulos provenientes del
medio fsico o social, como la modalidad o tipo de tarea a realizar. Las organsmicas suponen cualquier
caracterstica biolgica, fisiolgica o psicolgica del organismo. Por ejemplo historias de refuerzo,
emotividad, actitudes, motivos, etc.
Variables organsmicas o situacionales pueden ser las variables independientes (Arnau Gras, 1980), las
variables dependientes y las variables extraas.

d) Segn su distancia al plano emprico.- Las variables pueden ser empricas -o manifiestas- y tericas -o
latentes-. Las primeras pueden observarse y medirse directamente (por ejemplo color de ojos) mientras
que las segundas slo pueden observarse y medirse indirectamente traduciendo sus trminos abstractos
a trminos empricos. Inteligencia es una variable terica porque slo puede medirse a travs de sus
indicadores empricos, como por ejemplo "aptitud para comprender refranes".

e) Segn su nivel de complejidad.- Las variables pueden ser simples o complejas. Esta clasificacin es
correlativa de la anterior: las variables simples son empricas, y las variables complejas son tericas. Las
variables simples son aquellas que, para conocerlas, requieren un solo indicador (para conocer la edad de
una persona basta con preguntarle, o bien basta con mirar su documento de identidad, o bien mirar su
partida de nacimiento, etc.). En cambio las variables complejas requieren de varios indicadores (para
conocer la inteligencia de una persona le aplicamos un test donde hay varios tems).

f) Segn su manipulacin.- Las variables pueden ser activas o asignadas segn como sean manipuladas,
entendiendo por manipulacin la accin que realiza el investigador de cambiar sus valores. Refiere Arnau
Gras (1980) que una variable es activa si el experimentador puede manipularla directamente (premios,
castigos) y por ello se la llama tambin variable experimental. La variable asignada en cambio, resulta
difcil o imposible de manipular, como las variables organsmicas. Se las llama asignadas pues se
manipulan por seleccin de los sujetos, pero no pueden ser provocadas directamente por el
experimentador. As, cuando investiga una variable activa, se eligen los grupos al azar pero cuando
emplea una asignada, se seleccionan dos grupos que difieren en las categoras de dicha variable.

g) Otras clasificaciones.- a) Lazarsfeld y Menzel (citados por Korn, 1969) clasifican las variables segn el
tipo de unidad de anlisis al que se refieren. Hay variables que son propiedades de unidades de anlisis
muy amplias (como las propiedades de un grupo o una sociedad), y otras que son propiedades de sujetos
individuales. b) Arnau Gras (1980) utiliza un criterio terico-explicativo segn el cual las variables
pueden ser estmulos, respuestas o variables intermediarias entre el estmulo y la respuesta. Las
variables estmulo son cualquier aspecto mensurable del ambiente fsico o social, presente o pasado, que

Pgina 164 de 325
164
puede afectar la conducta del organismo. Las variables de respuesta son las medidas obtenidas de
diversos aspectos de la conducta de los sujetos. Las variables intermediarias son los procesos que se
intercalan entre las dos anteriores, aunque no todos los psiclogos admiten la necesidad de tales
variables.

Estudiar cmo varan las variables permite obtener conclusiones sobre la aceptacin o rechazo de la
hiptesis. Este paso fundamental, sin embargo, no puede llevarse a cabo si antes no se ha sometido a
todas las variables de la hiptesis a un doble proceso: la operacionalizacin o definicin operacional y la
categorizacin.

Categorizacin de las variables

Es la adjudicacin de categoras o valores a una variable. A su vez, las categoras o valores son las
diferentes posibilidades de variacin que una variable puede tener. Por ejemplo, las categoras de clase
social pueden ser alta, media y baja, y los valores de tiempo de reaccin pueden ser un segundo,
dos segundos, etc.

Se acostumbra a llamar categoras a aquellas que no admiten un tratamiento cuantitativo por medio de clculos,
y por lo tanto regularmente se expresan en palabras. Tales son las categoras de clase social, de raza, de partido
poltico, etc. En cambio suelen llamarse valores a las posibilidades de variacin cuantitativa, por lo que han de
expresarse numricamente. Es el caso de las variables cuantitativas peso, altura, ingreso mensual, edad,
nmero de hijos, cantidad de ingesta diaria de alcohol, etc.

La eleccin del conjunto de categoras o valores depender de la naturaleza de la variable, del objetivo de
la investigacin y del grado de precisin que se quiere alcanzar.
Respecto de la naturaleza de la variable, no pueden elegirse verde o amarillo como categoras de la
variable ocupacin. Respecto del objetivo de la investigacin, seala Korn (1969) que el sistema de
categoras elegido debe tener relevancia para el contexto donde se aplicar, ya que toda variable tiene
una amplitud de variacin tericamente mucho mayor que la que resulta relevante en cada situacin
especfica. Si acaso el estudio se centra en un pas donde slo hay dos clases sociales netamente
diferenciadas, entonces slo se indicarn dos categoras. Respecto del grado de precisin deseable,
muchas veces puede aumentarse este eligiendo categoras intermedias, y agregar a las clases alta, media
y baja las categoras media alta y media baja.
El investigador tiene una cierta libertad para elegir las categoras de su variable. No obstante ello, y sea
cual fuese el sistema de categoras seleccionado, ste debe reunir dos requisitos: a) las categoras deben
ser mutuamente excluyentes. No puede decirse que las categoras de la variable religin son cristianos
y catlicos porque hay una superposicin en las mismas; b) deben ser adems exhaustivas, o sea deben
agotar todas las posibilidades de variacin, con lo cual no podra decirse que las categoras de la variable
raza son solamente blanca y negra. Hay veces en que son muchas las categoras que habra que
agregar para cumplir con este requisito, en cuyo caso pueden agruparse a todas las restantes bajo una
categora residual caratulada como Otras.
Estos dos requisitos sirven en la medida en que permiten ubicar a cualquier sujeto en una y slo una
categora sin que surjan dudas. Si hay que ubicar al Papa no se sabr si ponerlo en cristianos o
catlicos, de aqu que pueda tambin definirse la exclusin mutua como la imposibilidad de que un
sujeto cualquiera pueda adquirir ms de un valor de la variable. En el caso de la variable ocupacin,
puede ocurrir que un individuo sea al mismo tiempo mdico y psiclogo, en cuyo caso se podrn abrir
categoras mixtas (por ejemplo mdico y psiclogo) con lo que queda igualmente salvado el requisito de
la mutua exclusin.
De idntica forma y para el segundo requisito, si hay que ubicar a un japons y slo se cuenta con las
categoras blanco y negro no se podr hacerlo por falta la categora oriental; de aqu que tambin
podamos definir la exhaustividad como la imposibilidad de no poder categorizar a un sujeto cualquiera.

La definicin operacional de las variables u operacionalizacin

Definir operacionalmente una variable es especificar qu operaciones o actividades debe realizar el
investigador para medirla. Estas operaciones se llaman indicadores, y, cuando recogen informacin de la
realidad son capaces de convertirla en datos.
Las variables simples se operacionalizan con un solo indicador, mientras que las variables complejas
requieren varios indicadores.

a) Operacionalizacin de variables simples.- Por ejemplo, operacionalizar la variable sexo significa
especificar qu actividad realizar el investigador para medirla: mirar el documento de identidad,
preguntar al sujeto cual es su sexo, observar su aspecto fsico general, observar si tiene o no la nuez de
Adn, observar sus genitales externos, etc. Estas diversas operaciones se llaman indicadores.
Desde ya, el investigador no realizar todas esas operaciones, sino que elegir alguna que suponga
confiable y representativa de la variable. Nadie elegira como indicador observar si tiene o no pantaln,

Pgina 165 de 325
165
sino mas bien preguntar al sujeto cual es su sexo. Y si acaso existiesen razones para dudar de su
respuesta, podr optarse por un indicador ms confiable: mirar el documento de identidad.

La definicin operacional es el conjunto de procedimientos que describe las actividades que un observador debe
realizar para recibir las impresiones sensoriales (sonidos, impresiones visuales o tctiles, etc.) que indican la
existencia de un concepto terico en mayor o menor grado (Reynolds, 1971:52).
La definicin operacional entonces, indica operaciones para medir una variable, y, aunque estas operaciones
sern denominadas en el presente libro indicadores, no todos los autores coinciden con esta convencin
lingstica o no son explcitos respecto a ella.
Por ejemplo: a) un indicador es una propiedad manifiesta u observable que se supone est ligada
empricamente, aunque no necesariamente en forma causal, a una propiedad latente o no observable que es la
que interesa (Mora y Araujo, 1971); b) se denomina indicador a la definicin que se hace en trminos de
variables empricas de las variables tericas contenidas en una hiptesis (Tamayo, 1999:126); c) un indicador
de una variable es otra variable que traduce la primera al plano emprico (Korn, 1965). Por su parte, Hernndez
Sampieri y otros (1996:242) llaman indicador al dato obtenido con la operacin.

Otros ejemplos de operacionalizacin de variables simples son las siguientes:

Variable simple Indicador
Denticin Observar la cantidad y el tipo de piezas dentarias de una persona
Ambulacin Medir el nmero de veces que una rata cruza una lnea marcada en el piso
(Lores Arnaiz, 2000).
Estrs Medir el nivel de cortisol (Lores Arnaiz, 2000).
Ausentismo laboral Revisar de las tarjetas de asistencia al trabajo, durante el ltimo trimestre
(Hernndez Sampieri y otros, 1996:102).
Profesin Preguntarle al sujeto cul es su profesin.
Enuresis nocturna Averiguar cuantas noches por mes y cuantas veces cada noche se orina
involuntariamente.
Peso Observar el registro en la balanza.
Frecuencia cardaca Tomar el pulso y contar la cantidad de pulsaciones por minuto.
Grado de alfabetizacin Obtener el porcentaje de analfabetos sobre el total de la poblacin (Korn,
1965).

Cuando se realiza la operacin especificada como indicador, se obtiene un dato, el cual a su vez permitir
ubicar al sujeto en alguna categora de la variable:

Variable simple Indicador Dato Categora
Peso Observar el registro en la balanza. 89 Kg 80-90 Kg

Diversas tcnicas pueden utilizarse para operacionalizar variables, como por ejemplo la observacin
(utilizada por ejemplo en la operacin mirar la apariencia de la persona), los tests psicomtricos o
proyectivos (utilizada por ejemplo en la operacin tomar un test), las tcnicas conductuales (utilizadas
por ejemplo en la operacin dar un estmulo tctil a una persona), las tcnicas psicofisiolgicas
(utilizadas por ejemplo en la operacin registrar las respuestas elctricas del tejido vivo), las tcnicas
anatmicas (utilizadas por ejemplo en la operacin de hacer una diseccin del lbulo frontal), el
cuestionario (utilizada por ejemplo en la operacin preguntar al sujeto cul es su profesin), etc.

b) Operacionalizacin de variables complejas.- A diferencia de las variables simples, la operacionalizacin
de variables complejas supone especificar varias operaciones o indicadores, y a veces muchos. Por
ejemplo, la variable inteligencia se explora a travs de tantos indicadores como pruebas o preguntas
tenga el test de inteligencia. Uno puede ser pedir al sujeto que arme un rompecabezas, otro puede ser
pedirle al sujeto que explique el significado de una palabra, otro pedirle al sujeto que haga una
operacin aritmtica, etc.
De la misma forma, la variable clase social se explora a travs de indicadores tales como preguntar al
sujeto cual es su ingreso mensual, preguntarle si utiliza o no tarjeta de crdito, preguntarle en qu
barrio vive, preguntarle por su nivel de instruccin, preguntarle por su ocupacin, etc.
En ciertos pases y culturas las personas de distinta clase social se visten inexorablemente en forma muy
distinta, y basta este solo indicador para saber enseguida a qu clase social pertenece una persona sin
necesidad de investigar su nivel econmico, el prestigio de su ocupacin, su nivel de educacin, etc. En
estos casos clase social pasa a ser una variable simple y se la mide con un nico indicador, que puede
ser la operacin observar como se viste la persona.
Cuando una variable slo puede ser medida a travs de tests, cuestionarios o entrevistas, seguramente
se trata entonces de una variable compleja. Nadie administrara un test a una persona para conocer su
edad o su estatura.
Dos cuestiones ms deben ser tratadas a propsito de la operacionalizacin de las variables complejas: la
seleccin de los indicadores y la especificacin de las dimensiones.


Pgina 166 de 325
166
Respecto de la seleccin de los indicadores, debe partirse de la base que el universo de indicadores es
amplio y complejo. A medida que la discusin del concepto se ampla, se va modificando su definicin
conceptual y el nmero de indicadores posibles se aumenta, lo cual se denomina comnmente universo
de indicadores (Tamayo, 1999:126).
Un problema que debe resolverse es como seleccionar los indicadores necesarios y suficientes para medir
adecuadamente la variable. En principio, dos muestras diferentes de indicadores pueden ser igualmente
eficaces para medirla, como lo sugiere la teora de la intercambiabilidad de ndices, basada en la
experiencia de que, dado un gran universo de tems o indicadores, cualquiera que sea la muestra elegida
para formar el instrumento clasificatorio, no se hallarn grandes diferencias (Lazarsfeld, 1980).
En la prctica, la seleccin de indicadores se basa en parte en la intuicin (Mora y Araujo, 1971), y en
parte en criterios ms objetivos (Lazarsfeld, 1980): elegir indicadores altamente correlacionados con la
variable (indicadores expresivos) o indicadores que supuestamente son el efecto de la variable o causa
(indicadores predictivos).
Por ejemplo (Lazarsfeld, 1980), al buscar indicadores de la variable antisemitismo pueden seleccionarse
dos tipos de indicadores, o una mezcla de ambos: a) la obediencia y el respeto a la autoridad son las
virtudes ms importantes que debe aprender un nio. Esta es una afirmacin que figura en un
cuestionario que mide antisemitismo y el sujeto debe responder si est o no de acuerdo. Pero este
indicador no expresa directamente la variable antisemitismo sino autoritarismo, y si es seleccionado es
solamente porque se sabe que hay una alta correlacin entre ambas variables; b) la mayora de la gente
no se da cuenta hasta qu punto nuestras vidas estn regidas por las conspiraciones de los polticos.
Este indicador ya expresa directamente el antisemitismo, y est en una relacin de causa-efecto con el
mismo: el grado de antisemitismo es la causa de que la persona responda si est o no de acuerdo con
dicha afirmacin.
Lazarfeld (1980) llama al primer tipo indicador expresivo, y al segundo indicador predictivo pues slo se
puede predecir una respuesta con cierta seguridad sobre la base de un vnculo causal. El mismo autor
sugiere buscar primero indicadores expresivos y luego indicadores predictivos
Por ejemplo para la variable personalidad autoritaria se buscan primero indicadores expresivos; por
ejemplo indicadores de convencionalismo, supuestamente correlacionado con personalidad autoritaria
(cmo decorara su pieza?, qu sentimientos le inspira el pelo corto y el pelo corto y el lpiz labial en la
mujer?), indicadores de supersticin, tambin supuestamente correlacionada con la variable principal
(cree en profecas?), etc. Finalmente se buscan indicadores predictivos (quines fueron las
personalidades ms destacadas de Alemania? cul es la mejor forma de gobierno?, etc.) (Lazarsfeld,
1980).
Otras reglas tiles para seleccionar indicadores son las siguientes (Mora y Araujo, 1971): a) seleccionar
indicadores redundantes (preguntas de un cuestionario que indagan los mismo de diferente forma para
ver si el sujeto se contradice), y b) seleccionar indicadores muy diferentes entre s para cubrir todo el
espectro de dimensiones de la variable o todo el espectro de caractersticas del sujeto que responde (en
un cuestionario incluir preguntas personales mezcladas con preguntas impersonales).

Respecto de la especificacin de las dimensiones, muchos autores sealan que, en el caso de las
variables complejas, resulta necesario o conveniente especificar dimensiones y luego, desde all,
especificar los indicadores. Mientras que algunos autores (Hernndez Sampieri y otros, 1996:100) se
limitan a las definiciones conceptuales y operacionales, otros (Tamayo, 1999:159) (Korn, 1969) indican
que los pasos de la operacionalizacin de una variable compleja son la definicin nominal, la definicin
real (o enumeracin de dimensiones) y la definicin operacional (o enumeracin de indicadores). Definir
tericamente, realmente y operacionalmente una variable permitira entonces traducirla en propiedades
observables y medibles, descendiendo cada vez ms desde lo general a lo singular.
El esquema correspondiente sera:



Dimensin 2
Variable
Indicador 1
Dimensin 1 Dimensin 3
Indicador 3
Indicador 2 Indicador 1 Indicador 2

Pgina 167 de 325
167
Las dimensiones son aspectos o facetas de una variable compleja. Por ejemplo, dimensiones de
inteligencia podran ser inteligencia verbal, inteligencia manual e inteligencia social; dimensiones de
memoria podran ser memoria visual, memoria auditiva y memoria cintica, o tambin memoria de corto
plazo y memoria de largo plazo; dimensiones de clase social podran ser nivel socio-econmico y nivel de
instruccin; dimensiones de creatividad podran ser creatividad plstica y creatividad literaria, etc.
Pueden tambin establecerse subdimensiones, como por ejemplo las subdimensiones creatividad en
prosa y creatividad en poesa para la dimensin creatividad literaria. Cuanta ms cantidad y niveles de
dimensiones y subdimensiones requiere una variable, tanto ms compleja ser sta.

La seleccin de las dimensiones depender de cmo se haya definido conceptualmente la variable. Si en la
definicin de clase social se ha recalcado la importancia del nivel econmico y del nivel de instruccin, pueden
adoptarse estos dos aspectos como dimensiones, es decir, se piensa que lo econmico y lo educativo es algo
importante para saber a qu clase social pertenece una persona. De idntica manera, si se adopta la teora de
Gardner de las inteligencias mltiples para dar una definicin conceptual de inteligencia, entonces corresponder
elegir como dimensiones inteligencia verbal, matemtica, artstica, intrapersonal, interpersonal, kinestsica, etc.

Una vez que se han identificado las dimensiones, el proceso contina seleccionando indicadores para
cada dimensin o subdimensin, lo cual es una manera de organizar los indicadores asegurndose de no
omitir ningn aspecto relevante de la variable.
Como puede apreciarse, a medida que se especifican dimensiones y luego indicadores, hay un
acercamiento cada vez mayor al plano emprico. Para la variable clase social se pasa, por ejemplo, de la
dimensin nivel socio-econmico a la subdimensin nivel econmico, y desde aqu al indicador
preguntar cual es su patrimonio actual o al indicador preguntar si es propietario, que constituirn
elementos de juicio para decidir a qu clase social pertenece el sujeto.

Si un profano pregunta qu es la inteligencia y recibe una definicin terica o conceptual, mucho no habr
entendido, pero si le enumeran dimensiones como inteligencia verbal, manual o social, habr comprendido algo
ms porque es algo ms prximo a la realidad; y finalmente, su comprensin ser ms completa si se
mencionan indicadores como preguntar si sabe utilizar palabras, si es hbil con las manos, si es hbil para tratar
con personas, si puede encontrar el absurdo en frases del tipo qu lstima que el sol se ponga de noche porque
ese es justo el momento donde ms lo necesitamos! o como llova, Juan se sumergi en el ro para no mojarse.

Conviene aclarar tambin que un mismo indicador puede corresponder a dos dimensiones distintas. Por
ejemplo el indicador preguntar a qu colegio asiste puede corresponder a nivel de instruccin pero
tambin a nivel socio-econmico.
Conviene tambin aclarar que lo que en una investigacin es considerada una dimensin, en otra puede
funcionar como variable principal. Por ejemplo, en un estudio sobre creatividad, creatividad literaria ser
una dimensin, pero en un estudio ms especfico sobre creatividad literaria, esta pasar a ser la
variable.

Relaciones entre la categorizacin y la operacionalizacin

Las dimensiones, subdimensiones e indicadores de una variable son a su vez, estrictamente hablando,
tambin variables, porque son susceptibles de variar segn sus propias categoras. Por ejemplo, la
dimensin nivel de instruccin puede variar como primaria, secundaria o universitaria, y por ende es
una variable. A medida que se pasa de las dimensiones a las subdimensiones y de estas a los
indicadores, dichas variables se tornan cada vez menos simples y ms empricas o manifiestas.
El siguiente esquema ilustra la idea de que las variables, dimensiones, subdimensiones e indicadores
pueden todos categorizarse. Por ejemplo, para la variable actitud discriminatoria se pueden especificar
tres categoras: alta, media y baja. Para la subdimensin discriminacin sexual hacia el sexo opuesto
tambin, y para el indicador discriminacin sexual en la eleccin de puestos (por ejemplo, preguntar al
sujeto si deben darse puestos de trabajo a hombres o a mujeres), se han indicado dos categoras:
hombre y mujer. Cuando el sujeto elige una de las categoras (por ejemplo hombre) se dice que se ha
obtenido un dato.


Pgina 168 de 325
168


Suele a veces confundirse categoras con dimensiones, y al respecto deben tenerse en cuenta las
siguientes precisiones:
a) A un determinado sujeto puede incluirselo solamente en una categora (o es de clase alta, o es de
clase baja, o es de clase media, etc.), mientras que el mismo sujeto incluye todos los aspectos o
dimensiones (tiene determinado nivel socio-econmico, determinado nivel de instruccin, etc.).
b) Lo anterior de debe a una cuestin lgica: las categoras son excluyentes (o) y las dimensiones estn
en conjuncin (y). Para la variable clase social se habla de alta o baja, pero en las dimensiones se
habla de nivel-socioeconmico y nivel de instruccin. El o indica exclusin mutua, y el y indica
conjuncin.
c) Dos variables relacionadas en una hiptesis pueden tener distintas categoras pero no las mismas
dimensiones, pues seran la misma variable.
d) Las categoras son los valores posibles de una variable, mientras que las dimensiones son los aspectos
discernibles que sirven para describirla.
A M B

ACTITUD DISCRIMINATORIA

Operacionalizacin

Categorizacin

SEXUAL

RACIAL

HACIA SEXO OPUESTO

HACIA HOMOSEXUALES

ELECCION PUESTO

INTELIGENCIA

DATO 1
Elige hombre

H M

H M

A M B


Pgina 169 de 325
169
CAPTULO 12: TCNICAS DE MUESTREO E INSTRUMENTOS DE
MEDICIN

En este captulo se desarrollarn los siguientes pasos de la investigacin cientfica tpica: a) definir la
poblacin, b) decidir como extraer de ella una muestra, y c) seleccionar o construir los instrumentos de
medicin que se aplicarn a los individuos seleccionados.

1. DEFINICIN DE LA POBLACIN

Antes de seleccionar la tcnica de muestreo adecuada al problema y a los objetivos de la investigacin,
se requiere definir la poblacin y las unidades de anlisis que la compondrn. Las unidades de anlisis
son aquellas entidades cuyas propiedades son las variables que quieren estudiarse. Las unidades de
anlisis pueden ser personas (alumnos, pacientes, lderes, payasos, soldados, etc.), organizaciones
(comerciales, no gubernamentales, hospitales, medios de comunicacin, etc.), familias, grupos de
autoayuda, etc. Deben tambin definirse sus propiedades y sus coordenadas de lugar y tiempo. Por
ejemplo, una poblacin estar constituida por todos los alumnos varones de quinto grado de las escuelas
pblicas (propiedades) de la ciudad de Buenos Aires (lugar) durante el ao 2005 (tiempo).

2. SELECCIN DE LA TCNICA DE MUESTREO

Una tcnica de muestreo es un procedimiento para extraer una muestra de una poblacin, mientras que
una muestra es una parte de la poblacin que est disponible, o que se selecciona expresamente para el
estudio de la poblacin.

Representatividad de la muestra.- Es deseable y hasta imprescindible que una muestra sea
representativa de la poblacin. Cuatro mujeres no es una muestra representativa de los habitantes de
una ciudad, porque las mujeres son la mitad de los habitantes. Que la muestra sea representativa es
importante porque luego se podrn extender a toda la poblacin las conclusiones que se hayan extrado
de ella.
De acuerdo a Tamayo (1999:185), son cuatro las condiciones que garantizan la representatividad de una
muestra: a) definir y delimitar la poblacin a la que deben extenderse las conclusiones obtenidas a partir
de la muestra; b) garantizar que cada unidad de poblacin tenga igual probabilidad de ser incluida en la
muestra; c) utilizar un muestreo no viciado por posibles relaciones existentes entre las unidades de
poblacin; y d) tomar una muestra amplia a fin de reducir al mximo el error de muestreo.
De una manera ms simplificada, puede decirse que una muestra es representativa si: a) si tiene un
tamao adecuado, y b) si fue elegida al azar. Esta ltima condicin introduce el tema de las diferentes
tcnicas de muestreo, clasificables como probabilsticas y no probabilsticas.

Tamao de la muestra.- El tamao de la muestra es la cantidad de datos que sern extrados de la
poblacin para formar parte de la muestra (Valds F, 1998).
Si bien existen procedimientos matemticos para calcular el tamao de una muestra, esta tarea puede a
veces tornarse compleja dado el tipo de problema a investigar y la poblacin considerada. Hernndez
Sampieri (1996:228) sugieren tomar como referencia los tamaos de muestra elegidos por otros
investigadores. Por ejemplo, es habitual que para poblaciones nacionales (por ejemplo un pas) se tome
una muestra al azar no menor a 1000 sujetos, mientras que para poblaciones regionales (por ejemplo
una provincia, una ciudad), se consideren de 300 a 700 sujetos para estudios sobre conducta y actitudes,
de 500 sujetos para estudios mdicos, y de 100 sujetos para experimentos de laboratorio y estudios
econmicos.
Seala Tamayo (1999:198) que el tamao de la muestra depende del grado de error que sea tolerable en
las estimaciones muestrales y de los objetivos de investigacin. En otras palabras, si uno est dispuesto
a tolerar un mayor error, puede tomar una muestra de menor tamao por cuanto ser menos
representativa.
En general, el tamao de la muestra no debe ser ni muy grande (porque entonces, si bien es
representativa, supone un esfuerzo adicional intil trabajar con ella), ni muy pequea (porque entonces
puede no ser representativa). La estadstica ha desarrollado ciertas frmulas especiales para calcular
tamaos de muestra de acuerdo al grado de error que se est dispuesto a cometer, al grado de
homogeneidad de la muestra y a otras consideraciones. Refiere Tamayo (1999:147) que a mayor grado
de heterogeneidad de las unidades de poblacin y menor tamao de la muestra, mayor probabilidad de
que sta resulte insuficiente.
El tamao de la muestra se calcula con base a la varianza de la poblacin y la varianza de la muestra.
Esta ltima expresada en trminos de probabilidad de ocurrencia. La varianza de la poblacin se calcula
con el cuadrado del error estndar, el cual determinamos. Cuanto menor sea el error estndar, mayor
ser el tamao de la muestra (Hernndez Sampieri y otros, 1996:233).


Pgina 170 de 325
170
Tcnicas de muestreo.- Las tcnicas para recoger muestras pueden clasificarse de acuerdo a dos criterios
diferentes:

a) Segn el nmero de muestras tomadas de la poblacin, los muestreos pueden ser simples, dobles o
mltiples (Rodas y otros, 2001) segn que elijan una muestra, dos muestras o ms de dos muestras. A
veces es preciso extraer una segunda muestra cuando los resultados de la primera no alcanzan o no son
definitivos. Por ejemplo el investigador toma una segunda muestra al azar entre aquellos que no
respondieron un cuestionario y entrevista a los sujetos seleccionados a fin de obtener la informacin y
mayor confiabilidad de los datos (Tamayo, 1999:148). En otro ejemplo, al probar la calidad de un lote
de productos manufacturados, si la primera muestra arroja una calidad muy alta, el lote es aceptado; si
arroja una calidad muy pobre, el lote es rechazado. Solamente si la primera muestra arroja una calidad
intermedia, ser requerir la segunda muestra (Rodas y otros, 2001).
Los muestreos dobles o mltiples pueden a su vez ser transversales o longitudinales, segn que las
muestras sean extradas simultnea o sucesivamente en el tiempo. Algunos autores (Tamayo, 1999:148)
denominan a estos ltimos muestreos cronolgicos, como el caso donde se requieren extraer varias
muestras de conducta a lo largo del tiempo, a intervalos regulares, con el fin de estudiar su evolucin.
Otros ejemplos de muestreos dobles o mltiples son los muestreos estratificados o los muestreos por
conglomerados, que sern mencionados ms adelante como modalidades de los muestreos
probabilsticos.

b) Segn el modo de elegir los individuos de la muestra, los muestreos pueden ser de dos grandes tipos:
probabilsticos (los individuos son elegidos al azar), y no probabilsticos (no elegidos al azar). En el primer
caso, cualquier individuo tiene la misma probabilidad de ser incluido en la muestra, y en el segundo caso
no. Adems, en el primer caso la generalizacin de los resultados a toda la poblacin es ms vlida que
en el segundo.
En los muestreos probabilsticos pueden usarse tres procedimientos de seleccin: la tmbola, la tabla de
nmeros random (al azar) y la seleccin sistemtica. Todo procedimiento de seleccin depende de
listados, ya sea existentes o construidos ad hoc, como por ejemplo el directorio telefnico, listas de
asociaciones, listas de escuelas oficiales, etc. Cuando no existen listas de elementos de la poblacin se
recurren a otros marcos de referencia que contengan descripciones del material, organizaciones o sujetos
seleccionados como unidades de anlisis. Algunos de estos pueden ser los archivos, hemerotecas y los
mapas (Hernndez Sampieri y otros, 1996:233).
Algunos tipos de muestreo probabilstico o aleatorio son los siguientes:
Muestreo simple.- Se eligen los individuos utilizando, por ejemplo, una tabla de nmeros aleatorios.
Refieren Rodas y otros (2001) que si la poblacin es infinita, esta tarea se torna imposible, por lo cual se
recurre a otros tipos de muestreo aleatorio como el sistemtico, el estratificado o el muestreo por
conglomerados.
Muestreo sistemtico.- Consiste en la seleccin de las unidades de muestreo de acuerdo con un nmero
fijo k, es decir, se elige una unidad cada k veces (Tamayo, 1999:150). Ms especficamente, una
muestra sistemtica es obtenida cuando los elementos son seleccionados en una manera ordenada. La
manera de la seleccin depende del nmero de elementos incluidos en la poblacin y el tamao de la
muestra. El nmero de elementos en la poblacin es, primero, dividido por el nmero deseado en la
muestra. El cociente indicar si cada dcimo, cada onceavo, o cada centsimo elemento en la poblacin
va a ser seleccionado. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una
muestra sistemtica puede dar la misma precisin de estimacin acerca de la poblacin, que una muestra
aleatoria simple cuando los elementos en la poblacin estn ordenados al azar (Rodas y otros, 2001). El
muestreo sistemtico se llama tambin muestreo a intervalos regulares (Tamayo, 1999:147).
Muestreo estratificado.- Se divide la poblacin en estratos (por ejemplo por clase social, por edades, etc.)
y de cada estrato, que es ms homogneo que la poblacin, se extrae una muestra mediante muestreo
aleatorio simple o sistemtico. En general, la estratificacin aumenta la precisin de la muestra, es decir,
presenta menor error muestral que el muestreo simple (Vallejo Ruiloba J y otros, 1999:70) (Hernndez
Sampieri y otros, 1996:233) (Rodas O y otros, 2001).
Cuando la cantidad de individuos seleccionada en cada estrato es proporcional a la cantidad total del
estrato poblacional, se habla de muestreo proporcional. En oposicin, en un muestreo no proporcional el
nmero de casos sacado de cada uno de los diversos estratos del universo en cuestin no guarda relacin
con el nmero de unidades del estrato (Tamayo, 1999:149).

Muestreo por conglomerados.- Se divide la poblacin en conglomerados, generalmente geogrficos como
por ejemplo en barrios o en ciudades, y de cada uno se extrae una muestra mediante un procedimiento
aleatorio simple o sistemtico, pudiendo no considerarse en el proceso algunos conglomerados.
Si bien es til para poblaciones grandes (Vallejo Ruiloba y otros, 1999:70), usualmente es menos preciso
o sea, tiene mayor error muestral que los otros procedimientos, a igual tamao de la muestra (Vallejo
Ruiloba y otros, 1999:70). Sin embargo, una muestra de conglomerados puede producir la misma
precisin en la estimacin que una muestra aleatoria simple, si la