Sunteți pe pagina 1din 17

Apuntes de estadística.

Capítulo 1: Estadística y datos.


¿Qué es la estadística?
En términos técnicos, “la disciplina de la estadística trata de los principios y procedimientos para recopilar,
describir y sacar conclusiones de los datos”.

En efecto, la estadística nos permite:

(1) Recopilar datos (proporcionando un conjunto de métodos y reglas para obtener los datos en forma
adecuada).
(2) Describir los datos en forma directa sobre la base de una población o en forma indirecta a través del
uso de una muestra.
(3) Apoyar o rechazar explicaciones acerca de la forma en que diferentes elementos del mundo real se
relacionan entre sí.
(4) Tratar de predecir sucesos futuros basándonos en los sucesos del pasado. En este curso trataremos
principalmente el tema de la descripción.

¿Qué es un dato?
Lo que llamamos datos es cualquier “información empírica acerca de algún aspecto del mundo
real en el cual estamos interesados”.

Son un el conjunto básico de hechos referentes a una persona, cosa o transacción.


Incluyen cosas como: tamaño, cantidad, descripción, volumen, tasa, nombre o lugar.

Un conjunto de datos “es una colección de valores observados que representan una o más
características de algunos objetos o unidades”.
a. Las “unidades de análisis” son aquellas cosas (objetos o sujetos) sobre los cuales
estamos principalmente interesados en obtener información.

b. Cuando hablamos de “características” nos referimos a las características de las unidades


de análisis.

c. Las "observaciones" son las unidades de análisis ‘observadas’ en el mundo real,


Específicamente ¿cuáles unidades de análisis de todas las que tenemos a nuestra
disposición estamos observando? Desde la perspectiva de la estadística no son las
observaciones sobre las unidades individuales las que son de interés, sino el
‘comportamiento agregado’, es decir, lo que en estadísticas se llama la ‘distribución’ de las
observaciones.

d. Finalmente, los "valores" son los resultados concretos obtenidos de las ‘mediciones’ de
cada una de las observaciones respecto de cada una de las características relevantes. En
otras palabras, obtenemos un valor cada vez que medimos las características de un objeto o
sujeto.
Unidad de análisis Características Observaciones Valores
Maestro Experiencia Calificaciones Método de Salario mensual
(años) enseñanza (US$)
Ali 5 Educación terciaria B 300
Educación
María 36 A 550
secundaria
Lee 22 Educación terciaria C 450
Descripción de los datos.
Una función principal de la estadística es la descripción de datos. El proceso consta al menos de
tres pasos: recopilación, organización y análisis (o interpretación) de los datos.

1) Se deben recopilar los datos según estrictos procedimientos que minimicen la


probabilidad de error, de modo que los datos recopilados realmente representen lo que se
desea describir.

2) Los datos deben estar organizados de modo que permitan su análisis y comparación.
Los estadísticos organizan los datos en lo que denominan ‘distribuciones’ o ‘distribuciones
de frecuencias’ (un tema que trataremos más adelante).

3) Los datos, organizados en forma de distribuciones, deben ser analizados. Para


describir una distribución se requiere usar al menos dos tipos de indicadores: medidas de
tendencia central y medidas de dispersión; estos indicadores también se tratarán en la
parte III de esta guía.

Recopilación de datos.
Los datos necesitan ser primero recopilados antes de poder ser interpretados y transformados en
información útil, sobre cuya base tomar decisiones. La manera en que este procedimiento de
recopilación de datos se lleva a cabo es clave para determinar el posterior valor de cualquier
descripción, explicación y predicción que se realice con dichos datos. Como consumidor de
información, usted no debería olvidar jamás que el modo en que los datos son recolectados es
siempre crítico para su valor posterior como información. Es así de simple: si la base del análisis
es basura, el resultado del análisis, no importa cuán sofisticado, también será basura. Si
utiliza datos recogidos con procedimientos inadecuados, entonces sus conclusiones y decisiones
basadas en el análisis de dichos datos serán igualmente inadecuadas.

Desafortunadamente, cuando consumimos información no siempre (y de hecho casi nunca) tenemos


acceso a los métodos utilizados para recoger los datos. Este es un problema serio, incluso para
profesionales de la estadística. Pero esta no es la única “mina” que usted encontrará en el peligroso
campo de la interpretación y uso de información estadística. Lamentablemente, la manipulación de
la información (o ‘estatistipulación’ como la llama Darrel Huff, 1954, p.100), a pesar de ser
tremendamente dañina, es práctica común y, a veces, extremadamente sofisticada.

Poblaciones y muestras
Una distinción crucial en la estadística descriptiva es aquella entre la descripción propiamente tal y la
inferencia. Esta distinción descansa en los conceptos de “población” y “muestra”.

 Una población consta del universo de todos los objetos (o sujetos) que nos interesa describir.
 Una muestra, consta sólo de una porción de la población de interés.

Supongamos que nos interesa averiguar qué métodos de enseñanza utilizan los maestros primarios de India. Es
decir, deseamos obtener una descripción de la distribución de los métodos de enseñanza en las escuelas. En
este caso, ¿cuál es nuestra población de interés? Nos interesa conocer una de entre las muchas características
de (todos) los maestros primarios de India: sus métodos de enseñanza.

¿Cómo podemos obtener la información que buscamos acerca de nuestra población de interés? En realidad,
tenemos dos opciones mutuamente excluyentes.
 Opción 1: ‘Observar’ a todos los maestros de escuelas primarias de India y así obtener los datos acerca
de los métodos de enseñanza que utilizan.
 Opción 2: ‘Observar’ sólo una porción (relativamente pequeña) de los maestros primarios de India y
luego ‘inferir’ de los métodos de enseñanza de estos, los métodos de enseñanza utilizados por todos los
maestros primarios de India.

En la jerga estadística, la opción 1 se denomina realizar un ‘censo’, mientras que la opción 2 consiste en llevar a
cabo un ‘muestreo’.

Un censo es muy poco eficaz y costoso, dado que un muestreo utilizando las técnicas estadísticas adecuadas,
nos proveería normalmente de información bastante confiable y precisa sobre dicha población a un costo
muchísimo menor que el de un censo. Es por esto que los profesionales de la estadística prefieren normalmente
el método de muestreo por sobre los censos.

Inferencia
Utilizamos una muestra (o múltiples muestras) para recopilar datos cuando resulta relativamente efectivo desde
un punto de vista económico o cuando no es posible acceder a toda la población. En este caso, las características
de la población se infieren sobre la base de los datos obtenidos en la muestra. En otras palabras, lo que
aprendemos sobre la base de la muestra se usa como medio para describir la población.

Para los reformadores de la educación, la inferencia es un área fundamental de la disciplina de la estadística, ya


que, como se decía antes, normalmente los profesionales favorecen el uso del muestreo antes que del censo
para describir y analizar realidades sociales complejas.

El mayor desafío del muestreo consiste en lograr un grado razonable de “confianza” (o probabilidad) en que las
inferencias realizadas acerca de la población sobre la base de la muestra sean adecuadas.

Para tener “confianza” en que una inferencia realizada sobre la base de una muestra representa
adecuadamente a la población, la muestra se debe seleccionar y luego interpretar siguiendo determinados
procedimientos estadísticos estrictos que aseguren un grado de mínimo de certeza. En otras palabras, se deben
recopilar y analizar los datos de la muestra utilizando métodos que permitan inferir con precisión (o con una
probabilidad mínima de error) las características de la población sobre la base de esa muestra.

La precisión de la inferencia depende, entre otros factores, del tamaño de la muestra. Esta relación, sin
embargo, no es obvia, es decir, la mejor muestra no es la que contiene un mayor número de observaciones. A
medida que la muestra aumenta de tamaño, el costo de recopilar y analizar la información también aumenta.
Hasta cierto punto, podríamos ganar en precisión, pero pagar demasiado caro por ella. Además, después de
determinado punto, el costo de cada observación se eleva vertiginosamente con respecto a lo que se gana en
precisión, que se vuelve poco o nada. Lo que hacen los estadísticos es determinar el ‘grado de precisión’ que
desean para obtener para sus inferencias (esto es, determinar la probabilidad de error que están dispuestos a
tolerar) y luego emplear procedimientos técnicos para calcular el tamaño de la muestra que necesitan para
lograr dicho objetivo. Se puede lograr un grado de precisión razonablemente alto mediante muestras
relativamente pequeñas.
Es importante mantener una permanente actitud de escepticismo frente a la información estadística recibida.
Como consumidor de información estadística, usted al menos necesita estar al tanto de la importancia que el
método de selección de una muestra tiene sobre el valor de la información. Es necesario preguntarse, a lo
menos, si dicha información fue producida sobre la base de una muestra adecuada que es de hecho
representativa de la población de interés.

Para aquellos que tengan un interés en estudiar en mayor detalle estos importantes temas, Phillips (1996,
capítulos 7 y 8) provee una muy accesible introducción a la inferencia estadística.

Explicación y predicción
Como reformador de la educación, usted no sólo está interesado en la descripción, sino también, y
principalmente, en la relación entre diferentes ‘objetos’ (o ‘variables,’ en la jerga estadística). Usted quisiera
saber qué explica o qué causa la realidad educativa de su país.

Los profesionales de la estadística miden lo que denominan “correlación” para determinar la fuerza de la
relación entre dos elementos. Otra herramienta usada en forma generalizada para medir las relaciones entre
variables es el análisis de regresión. El objetivo del análisis de regresión no sólo es medir la fuerza de una
relación, sino también generar un modelo de esa relación (llamado “función”), de modo de poder predecir el
comportamiento de una cosa basándose en el comportamiento de la otra. Por ejemplo, se usa la regresión para
tratar de predecir la oferta de maestros sobre la base del pago que ellos reciben. Esta regresión o relación
específica entre salario y oferta de trabajo se usa de manera generalizada en economía y se denomina “curva de
oferta de trabajo”.

Es necesario ser siempre muy cautelosos en nuestras conclusiones respecto de explicaciones y predicciones
estadísticas. En el mejor de los casos, la estadística puede establecer lo que los especialistas llaman una
“correlación” entre diferentes elementos (“variables”). Por cierto, también puede establecer que no hay
ninguna relación entre los objetos estudiados. Pero la estadística no puede establecer causalidad. En otras
palabras, no se puede inferir causalidad sobre la base de una correlación.

Por ejemplo, si en un país se midiera la relación entre las habilidades aritméticas de los estudiantes primarios
y sus estaturas, se concluiría que existe una correlación positiva entre habilidades y estatura, o sea, que
mientras mayor es la altura del estudiante, mayores son sus habilidades aritméticas. Ahora, obviamente
afirmar que las habilidades aritméticas de un individuo son consecuencia de su estatura no tiene sentido. Lo
que ocurre en este caso es que existe un tercer factor que es la causa simultánea del aumento de las
habilidades aritméticas de los estudiantes y del aumento en su estatura, este factor es la ‘edad’ de los
estudiantes. De modo que no es que los estudiantes más altos sean mejores para la aritmética, sino que los
estudiantes de más edad son más altos y al mismo tiempo tienen mayores habilidades aritméticas.

Debemos ser muy cuidadosos. La presencia de causalidad sólo podrá sostenerse en forma razonable luego de
haber propuesto una teoría aceptable para explicar la relación meramente fáctica entre los elementos o
‘variables’. En términos estrictos, aun cuando se haya propuesto una teoría aceptable para explicar una relación
que también parece estar respaldada por los hechos, ésta será siempre una “hipótesis” en espera de ser, tarde
o temprano, rebatida.

Una hipótesis es una afirmación acerca de la relación empírica existente entre dos variables. Una hipótesis
nunca podrá ser comprobada definitivamente ya que incluso cuando los hechos del mundo real nunca han
contradicho dicha hipótesis, siempre existe la posibilidad de que ello ocurra en el futuro. La estadística sólo
puede apoyar o rechazar una determinada hipótesis acerca de las relaciones entre los objetos que nos
interesan, pero nunca probarla.

Capítulo 2: Estadística y datos.

Variables y constantes.
En el lenguaje de las ciencias, lo que se trata de describir, explicar y/o predecir —es decir, las unidades de
análisis—se denomina ‘variables’. Naturalmente, también son los objetos (o sujetos) que se intentan medir. Las
unidades de análisis se llaman variables simplemente porque cuando se observan en el mundo real, sus
características ‘varían’ de una observación a otra.

Las características de los elementos que deseamos medir varían de una observación a otra, porque no todos los
maestros ganan lo mismo, no todos los países invierten lo mismo en educación, no todos los niños obtienen las
mismas calificaciones en las pruebas, etc. En las ciencias sociales, prácticamente todos los objetos en los que
podamos estar interesados serán una “variable”. Las “constantes” son extremadamente raras en las ciencias
sociales.

Una ‘constante’, a diferencia de una variable, siempre tiene el mismo valor. En educación no existen constantes,
pero existen varias en física y matemáticas, por ejemplo, la fuerza de gravedad o el número p (3.14159…).

Una constante, como la velocidad de la luz, se comporta en forma muy diferente a una variable, como las tasas
de matrícula primaria. Estas tasas “varían” de modo significativo según el ingreso medio de un país, la eficacia
de las escuelas, el mercado laboral y la cultura, entre otras cosas. A diferencia de la tasa de matrícula primaria,
la velocidad de la luz es una constante y por lo tanto siempre mantiene el mismo valor. El cuadro 2 proporciona
una estimación de la tasa de matrícula primaria (variable) y la velocidad de la luz (constante) en algunos países
de Latinoamérica.

País Tasa de Matrícula Velocidad


en Educación Primaria de la Luz

Brasil 89.3% 300,000 km/seg.

Jamaica 98.5% 300,000 km/seg.

Nicaragua 70.9% 300,000 km/seg.

Perú 96.3% 300,000 km/seg.

Existen diversos tipos de variables, discretas y continuas, dependientes e independientes, etc.

Escalas de medición
Para medir variables necesitamos una “escala de medición”. En términos técnicos, una escala es “un conjunto
de reglas para cuantificar o asignar calificaciones numéricas a una variable determinada”. En términos más
simples, las escalas son los instrumentos que usamos para ordenar elementos con el objeto de medirlos y
compararlos. En realidad no todas las escalas son numéricas. Diferentes escalas miden distintos tipos de
variables. El nivel de sofisticación de un análisis estadístico depende en buena parte de la naturaleza de las
variables que se desea analizar. Algunas variables no permiten el uso de escalas de medición muy complejas. El
tipo de escala que se use determinará también el nivel de complejidad y sofisticación que podrá alcanzar el
análisis estadístico.

Existen cuatro tipos de escalas:

 Nominal
 Ordinal
 De intervalo
 De razón

Las escalas nominales son las más simples y permiten sólo un limitado análisis estadístico. Las escalas de razón
son las más complejas y permiten el uso más completo del instrumental estadísticos para su análisis.

Escalas Nominales
Las escalas nominales sólo trabajan con información cualitativa que no puede ser ordenada. Este tipo de escala
es la menos informativa de todas. En una escala como estas se clasifica a las unidades de estudio (objetos,
personas, etc.) en categorías, basándose en una o más características, atributos o propiedades distintivas y
observadas, dándole a cada categoría un nombre (de ahí lo de «nominal»). Los nombres que se emplean en la
aplicación de la escala nominal de medida no necesitan ser nombres (alfabéticos o alfanuméricos) en el sentido
estricto de la palabra. En consecuencia, una escala nominal “no mide, sino que más bien nombra”.

La magnitud de los números no refleja orden (ascendente o descendente) o jerarquía (mayor o menor) de alguna
de las cosas a las que fueron asignados, más bien sólo sirven como códigos de identidad. Las observaciones no
pueden ser ordenadas de menor a mayor o de pequeño a grande, es decir, ninguna de las categorías tiene mayor
jerarquía que la otra, únicamente están reflejando diferencias en la variable. Cualquier cuestión perteneciente a
la magnitud de la variable fundamental es irrelevante para la medición nominal. La única cuestión comparativa
relevante para los datos nominales pertenece a si dos observaciones son o no la misma.

Hay 2 tipos de escalas nominales:

Dicotómicas: Las variables con dos categorías.

Policotómicas: Las variables con tres o más categorías.

Escalas Ordinales
Una escala de medición ordinal se logra cuando las observaciones pueden colocarse en un orden relativo con
respecto a la característica que se evalúa, es decir, las categorías de datos están clasificadas u ordenadas de
acuerdo con la característica especial que poseen.

Aquí, las etiquetas o símbolos de las categorías sí indican jerarquía. Si utilizamos números, la magnitud de estos
no es arbitraria sino que representa el orden del rango del atributo observado.

En este tipo de escalas, los datos son mutuamente excluyentes (un individuo o medición pertenece únicamente
a una categoría), y exhaustiva (cada individuo, objeto o medición, debe pertenecer, obligatoriamente, a una
cualquiera de las categorías).
Para mayor claridad tomemos como referencia la clasificación de los cargos en una determinada empresa como
se muestra a continuación:

CARGO CÓDIGO
Presidente 10
Vicepresidente 9
Director General 8
Gerente de área 7
Subgerente 6
Jefe de sección 5
Empleado A 4
Empleado B 3
Empleado C 2
Intendencia 1

Sabemos que el Presidente (10) es más que el Vicepresidente (9), éste más que el Director General (8), a su vez
este último más que el Gerente de área (7) y así sucesivamente; pero no puede precisarse en cada caso cuánto
más. Tampoco podemos utilizar las operaciones aritméticas básicas: no podríamos decir que 4 (empleado A) + 5
(jefe de sección) = 9 (vicepresidente); ni que 10 (presidente) + 5 (jefe de sección) = 2 (empleado C). Sería
absurdo, no tiene sentido.

Escalas de Intervalo
Este tipo de escalas nos proveen de información mucho más precisa, a la vez que nos permiten llevar a cabo
mediciones mucho más sofisticadas que las escalas nominales u ordinales. Las escalas de intervalo no sólo nos
informan acerca del orden de unos objetos, sino que también acerca de las distancias o diferencias numéricas
entre dichos objetos. De hecho, estas escalas nos permiten medir y comparar esas distancias o diferencias con
precisión. En otras palabras (y de aquí el nombre de escalas de intervalo), las distancias o ‘intervalos’ de igual
tamaño en la escala son de hecho iguales no importando dónde en la escala se realice la medición. Por ejemplo,
los resultados numéricos de los exámenes académicos pueden ser medidos usando escalas de intervalo.

Las escalas de intervalo, sin embargo, no poseen una definición única del valor cero. En otras palabras, el cero es
arbitrario en el sentido de que no representa ausencia absoluta de la característica que se desea medir. En este
sentido las escalas de intervalo son equivalentes a termómetros, en los que el valor cero no representa la ausencia
absoluta de calor. En nuestro ejemplo anterior, si un estudiante obtiene un resultado de cero puntos en un
examen, ello obviamente no significa que el estudiante no sepa absolutamente nada acerca de la materia
evaluada. El comportamiento humano es casi siempre medido utilizando escalas de intervalo.

A diferencia de las variables de intervalo, las variables ordinales son adimensionales aun cuando las categorías
ordenadas estén numeradas.

Por ejemplo, al terminar una carrera de autos Fórmula 1, la ubicación de los competidores (1, 2, 3, etc.) es sólo
ordinal puesto que los números indican simplemente qué autos cruzaron la línea de meta en primero, segundo,
tercer lugar, y así sucesivamente; pero no nos clarifican qué tan cerca o alejados llegaron los unos de los otros.
Para considerar esta variable ordinal como una de intervalo, los autos deberían haber llegado al mismo tiempo,
en un solo orden y a distancias iguales entre ellos. Por ejemplo, el auto ganador debió haberle tomado una
diferencia de 20 m al segundo; este una de 20 m al tercero; a su vez el tercero, haber llegado a la meta a una
distancia de 20 m del cuarto y así sucesivamente.
La resta entre los números que identifican la posición de una variable ordinal en la escala correspondiente
proporciona sólo diferencias entre rangos y no la distancia entre las puntuaciones. Por ejemplo, si tomamos el
auto que llegó en cuarto lugar (Renault) con relación al que llegó en noveno lugar (Ferrari), la diferencia (9 - 4
=5) entre sus posiciones indica, únicamente, que el coche de Renault llegó cinco puestos adelante del coche de
la Ferrari. Estos pudieron haber llegado a la meta, separados unas decenas de metros o a dos vueltas de
distancia.

Ritchey considera que para tratar una variable ordinal como de intervalo, se deben verificar dos condiciones:

a. Que la variable ordinal tenga al menos siete categorías o puntuaciones de clasificación (cuantas más,
mejor).
b. Que la distribución de las puntuaciones no debe estar sesgada o ser bimodal. Esto significa que las
puntuaciones se distribuyan normalmente o de forma rectangular (esto es, uniformemente a lo largo de
su rango con una frecuencia parecida en cada punto de la escala).

Escalas de Razón
Las escalas de razón proveen el mayor grado de información posible acerca de los objetos medidos y permiten las
descripciones e inferencias estadísticas más sofisticadas. Este tipo de escalas se distingue de las de intervalo por
que poseen un cero que no es arbitrario, es decir, que representa la ausencia absoluta de la cualidad que se está
midiendo. Ello nos permite comparar ‘razones’ (de ahí el nombre de la escala) o relaciones numéricas del tipo,
por ejemplo, “A es tres veces más pesado que B”, sobre la simple base de que en la escala el valor de A es tres
veces mayor que el de B.

En el ejemplo anterior sobre las áreas geográficas de cuatro países, el valor de dichas áreas en kms2 podría ser
medido utilizando una escala de razón. En este caso un valor de cero significaría la completa ausencia de área
geográfica (¿un país ‘virtual’?). Así, por ejemplo, simplemente dividiendo el área de Rusia (17,075,200 kms2) por
el área de Fiji (18,270 kms2), uno puede afirmar con certeza que el territorio de Rusia es 935 veces más extenso
que el de Fiji. En educación, las escalas de razón se utilizan, por ejemplo, en el área del financiamiento de la
educación. Por ejemplo, algunos distritos podrían recibir “dos veces” o “tres veces” más dólares por estudiante
que otros.

Trate de explicar con sus palabras las diferencias entre cada una de estas cuatro escalas de medición. Dé ejemplos
de lo que podría medir con cada escala. El tema puede ser algo complicado. Tómese su tiempo.

En esta escala sólo es arbitraria la unidad de medida. El hecho de fijar el origen permite hacer comparaciones
no sólo de los intervalos de los objetos, sino también de los valores de los números asignados a estos objetos. Es
así que en este tipo de escala tiene sentido las ‘razones’, y puede decirse, por ejemplo, que «el valor x es el
doble que el de y». El peso, la longitud y la masa se miden en una escala de razones. Las distancias expresadas
en kilómetros, millas o pies son ejemplos de mediciones en una escala de razones, ya que en todos estos casos
las escalas tienen un origen común. En la medición del valor de las cosas o de los ingresos también se emplea
una escala de razones. Ya sea que la unidad empleada sea el peso, el dólar o la peseta, la ganancia cero es
siempre la misma.

Conversión de escalas

Es muy fácil convertir las escalas de alto nivel en escalas de nivel inferior, pero las escalas de nivel inferior, en
general, no se pueden convertir en escalas de nivel superior. Esto nos lleva otra vez a un importante punto ya
planteado: el nivel de sofisticación del análisis estadístico (es decir, las descripciones e inferencias) que podemos
llevar a cabo depende directamente del tipo de escala que se use; y las escalas de razones permiten un máximo
de complejidad.
El tipo de escala que se puede usar no es asunto de gusto, sino que, como ya indicamos, depende de la
naturaleza de la variable con la cual se esté trabajando. Entre los ejemplos que ilustran este punto se incluyen
las variables nominales (tales como tipo de escuela o nombre del país), las variables ordinales (tamaño del país
según su representación en un mapa), las variables de intervalos (calificaciones de pruebas) y las variables de
razón (el área geográfica medida en kilómetros cuadrados o dólares empleados en la educación).

Conversión de escalas

Es muy fácil convertir las escalas de alto nivel en escalas de nivel inferior, pero las escalas de nivel inferior, en
general, no se pueden convertir en escalas de nivel superior. Esto nos lleva otra vez a un importante punto ya
planteado: el nivel de sofisticación del análisis estadístico (es decir, las descripciones e inferencias) que podemos
llevar a cabo depende directamente del tipo de escala que se use; y las escalas de razones permiten un máximo
de complejidad.

El tipo de escala que se puede usar no es asunto de gusto, sino que, como ya indicamos, depende de la naturaleza
de la variable con la cual se esté trabajando. Entre los ejemplos que ilustran este punto se incluyen las variables
nominales (tales como tipo de escuela o nombre del país), las variables ordinales (tamaño del país según su
representación en un mapa), las variables de intervalos (calificaciones de pruebas) y las variables de razón (el área
geográfica medida en kilómetros cuadrados o dólares empleados en la educación).

Es importante indicar el nivel de medición de todas las variables e ítems de la investigación, porque dependiendo
de dicho nivel se selecciona uno u otro tipo de análisis estadístico. Por ejemplo, la prueba estadística para
correlacionar dos variables de intervalo es muy distinta a la prueba para correlacionar dos variables ordinales. Así,
es necesario hacer una relación de variables, ítems y niveles de medición.

Tipo de relación La cuestión es relevante para:


entre dos ¿Datos nominales? ¿Datos de intervalo? ¿Datos ordinales? ¿Datos de proporción?
observaciones.
¿Es X1 diferente de X2? Sí Sí Sí Sí
¿Es X1 mayor que X2? No Sí Sí Sí
¿En cuántas unidades No No Sí Sí
X1 excede a X2?
¿En qué porcentaje No No No Sí
X1 excede a X2?

Relación entre escalas y variables.

Razón 0 absoluto (Igualdad de Razón)


Intervalo Distancia (Igualdad entre intervalos)
Ordinal Relación de Orden (Mayor a menor o viceversa)
Nominal Relación de Identidad (Determinación de Igualdad)

Medición: confiabilidad y validez

Todas las mediciones se caracterizan por la mayor o menor presencia de dos atributos: (a) confianza (o qué tan
confiable es la medición) y (b) validez (o qué tan válida es una medición).
Una medición es “confiable” si podemos esperar en forma razonable que los resultados de dicha medición sean
sistemáticamente precisos. Esto requiere que el instrumento usado para realizar la medición (como por ejemplo
una prueba o examen a estudiantes) sea confiable. Por ejemplo, una pistola es por completo confiable si
siempre da en el blanco al ser apuntada exactamente en la misma dirección. En otras palabras, si la bala que
dispara siempre da en el punto al cual se apunta la pistola. O sea, que si la pistola no da en el blanco es porque
la persona que la disparó falló, o sea, no apuntó correctamente.

Una medición es “válida” si mide lo que en realidad trata de medir. Por ejemplo, una prueba de matemática no
es válida para medir el rendimiento de alfabetización de los estudiantes. Tampoco sería válida una prueba
culturalmente sesgada. En el caso de la pistola, si ésta no es apuntada en la dirección del blanco, sino que fuera
de él, simplemente jamás dará en el blanco, por muy confiable que sea.

El problema de la validez, entonces, consiste asegurarnos de que estamos midiendo lo que deseamos medir o,
de acuerdo con nuestro ejemplo, que estamos apuntando en la dirección correcta. El problema de la
confiabilidad, en cambio, se resuelve utilizando un instrumento preciso (una pistola en perfecto estado).

Observe que la confiabilidad es una condición necesaria, pero no suficiente para la validez. Así, para tener
confianza de que vamos a dar en el blanco necesitamos una pistola en perfecto estado, pero esto no es
suficiente: además necesitamos apuntar al blanco y no fuera de él. Podemos medir con precisión, pero si
medimos el objeto incorrecto, la información obtenida no será válida para describir o explicar la población.

Distribución de frecuencias.
Variables discretas y continuas

La manera lógica de organizar datos es crear categorías y luego asignar las observaciones a una categoría. Pero
nuestra capacidad de categorizar está limitada por la naturaleza de las variables que usamos. Además, no todas
las variables se pueden categorizar con la misma facilidad. En términos estadísticos, las variables que interesa
medir pueden ser (a) discretas o (b) continuas.

Las variables discretas son aquellas cuyas observaciones se agrupan ‘inherentemente’ o ‘naturalmente’ en
categorías, porque dichas variable por su naturaleza sólo pueden tomar ciertos valores muy específicos. El
“género” de un sujeto es un buen ejemplo de una variable discreta: los seres humanos pueden ser mujeres u
hombres, se ajustan a una u otra categoría y no hay continuidad ni puntos intermedios entre ellas. Un ejemplo
son las calificaciones o educación de los maestros. Podemos crear las siguientes categorías para describir esta
última variable:

(a) educación primaria completa,


(b) educación secundaria completa,
(c) educación superior incompleta,
(d) educación superior completa y
(e) educación de postgrado.

Sin embargo, existe otra clase de variables, conocidas como variables “continuas”, que no son tan fáciles de
categorizar como las variables discretas. A diferencia de las variables discretas, las variables continuas, como su
nombre lo indica, sólo se pueden agrupar en forma arbitraria en categorías, porque por su naturaleza pueden
tomar cualquier valor a lo largo de un continuo (o de una escala numérica continua). La estatura de los
habitantes de un país es un ejemplo de variable continua, así como el ingreso de las familias en dicho país. Un
buen ejemplo en el área de la educación son las “calificaciones de pruebas”, que sólo se pueden agrupar
arbitrariamente creando ‘intervalos’ artificiales, como por ejemplo 1-20, 21-40, etc. Note que los intervalos
también podrían ser 1-10, 11-20, 21-30, etc, o cualquier otro intervalo que se prefiera, ya que la variable no se
ajusta naturalmente a categorías predeterminadas como en el caso de las variables discretas.

La distinción entre variables discretas y continuas es de gran aplicabilidad en la estadística. Pero su importancia
sólo queda clara después de comprender el concepto estadístico fundamental de ‘distribución’ o ‘distribución de
frecuencias’. (Los estadísticos por lo general usan la primera versión, la más corta, para referirse a la distribución
de frecuencias.)

¿Qué es una distribución de frecuencias?

En estadística, los datos se organizan en distribuciones. En una distribución de frecuencias, las observaciones se
clasifican de acuerdo a categorías de valores. En otras palabras, una distribución de frecuencias nos indica
cuántas veces se observó cada categoría. En otras palabras, una distribución proporciona datos sobre el número
de observaciones que corresponde a cada categoría. En el caso de las variables discretas, esto es más intuitivo,
pero también se aplica a las variables continuas. El siguiente ejemplo nos ayudará a ilustrar el concepto.

En el Cuadro 3 se muestra un ejemplo de la distribución de frecuencias de las matrículas primarias en


Balochistán, Pakistán, clasificadas según la variable “género”. Las categorías del ejemplo son “niños” y “niñas”. El
“género” de los estudiantes (femenino o masculino) es una variable discreta. Los individuos observados simple y
naturalmente pertenecen a uno u otro género. Así, el procedimiento para clasificar según el género es simple y
directo. El género, como todas las variables discretas, dispone naturalmente de sus categorías.

Género Total matriculado (1998)


Niños 315.111
Niñas 80.260

En la Figura 11 se muestra la misma distribución de frecuencias en forma de gráfico o “histograma”. Un


“histograma” es simplemente el nombre que los estadísticos dan a un gráfico que representa una distribución
de frecuencia.

La información presentada en el Cuadro 2 nos indica que si bien hay 315.111 niños matriculados en la educación
primaria en Balochistán, Pakistán, las niñas matriculadas son sólo 80.260.
El histograma (distribución) o gráfico de barras de la distribución representada en la Figura 11 se creó sobre la
base de la información proporcionada por el Cuadro 2. Este histograma (Figura 11) nos muestra que aunque hay
un poco más de 300.000 niños matriculados en la educación primaria, hay menos de 100.000 niñas
matriculadas. Por sí misma, esta información es en extremo valiosa y tiene importantes implicaciones en
términos de políticas públicas. Evidentemente es un llamado a aplicar medidas correctivas, aunque por otro lado
es lógico que se requeriría bastante más información que aquella proporcionada en este cuadro para diseñar el
contenido específico de una política efectiva.

Si alguien estuviera interesado en saber la proporción o porcentajes relativos de niños y niñas matriculados en la
educación primaria en Balochistán, los podría calcular basándose en el cuadro o estimarlos en forma
aproximada a partir del gráfico. Pero también podemos utilizar lo que los estadísticos llaman una “distribución
de frecuencias relativa” para describir directamente las proporciones o porcentajes relativos de los niños y niñas
matriculados en la educación primaria en Balochistán. Una distribución (en el caso de las variables discretas) se
puede transformar fácilmente en distribuciones de frecuencia relativas.

Distribuciones de frecuencia relativas

Una distribución de frecuencia relativa describe los porcentajes del número total de observaciones
correspondiente a cada categoría. Una distribución de frecuencia relativa no nos indica cuál es el número de
observaciones en cada categoría, sino cuál es el porcentaje de observaciones en cada categoría. Esta
información es muy valiosa.

Cuadro 4. Distribución de frecuencia relativa de matrículas primarias por género en Balochistán.

Género Porcentaje del total matriculado (1998)


Niños 79,7 %
Niñas 20,3 %

En el Cuadro 4 se representa la distribución de frecuencias relativa correspondiente al Cuadro 3 anterior. Las


distribuciones de frecuencias pueden ser relativamente simples, como en el Cuadro 4, pero también pueden ser
más complejas y proporcionar mucha más información, como veremos más adelante.

Hasta ahora, nuestros ejemplos se han limitado a variables discretas, que se representan fácilmente mediante
gráficos de barras. Pero los gráficos de barras no son la mejor forma de representar variables continuas, sino
que es mejor usar distribuciones de frecuencia continuas.

Medidas de “Tendencia Central”


Si deseamos describir la distribución de una variable, como por ejemplo las calificaciones nacionales en las
pruebas de octavo año por lo menos necesitaríamos saber cuál es la calificación promedio obtenida en dichas
pruebas por los estudiantes. (Aunque para describir en forma más completa también necesitaríamos describir la
‘variabilidad’ de las calificaciones de los estudiantes, o sea, si la mayoría de los estudiantes obtuvo calificaciones
alrededor del promedio o si estas calificaciones fueron más ‘dispersas’.) Existen varios diferentes tipos de
‘promedios’ en estadística. Los más comunes son la media, la mediana y la moda.

La media de un conjunto de datos (o población) es lo que aprendemos en la escuela como el promedio


aritmético o sólo “promedio” y que de ahora en adelante llamaremos “media”. La media de una población es la
suma de los valores de todas las observaciones de una población dada, dividida por el número total de
observaciones de esa misma población. La media representa el valor del promedio aritmético de todas las
observaciones.

La moda es otro indicador estadístico que proporciona información descriptiva acerca del valor ‘promedio’ de
un conjunto de datos. La moda simplemente es el valor que se da con mayor frecuencia en las observaciones de
una población. En una distribución continua, la moda está representada por el punto ‘más alto’ en la curva de
distribución.

La mediana es el valor en las observaciones que divide una distribución en dos mitades. Es decir, la mediana es
el valor de la observación que está ubicado en el centro de la distribución, una vez que todas las observaciones
se han ordenado de acuerdo a su valor. Así, cuando las observaciones se ordenan de acuerdo a su valor, la
mediana divide la distribución en dos partes iguales, dejando el mismo número total de observaciones a cada
lado de ella.

Comparación de las Medidas de Tendencia Central

Las ventajas y limitaciones de usar la media, la moda y la mediana para describir un conjunto de datos dependen
estrictamente de la forma (tipo) de la distribución de datos. Siempre que se pueda usar, en general se prefiere la
media para describir la tendencia central, aunque algunas distribuciones se describen mejor por medio de la moda
y la mediana. A continuación evaluaremos la aplicabilidad de nuestros tres ‘promedios’ a diferentes tipos de
distribuciones.

(1) En una distribución normal, la media, moda y mediana tienen un valor idéntico (Figura 15). Esto en realidad
es evidente, dado que una distribución normal es perfectamente simétrica, y la curva tiene un sólo punto máximo
(moda) que también se encuentra en el centro. Así, la media debe ser nuestra medida preferida de tendencia
central para los conjuntos de datos que se distribuyen normalmente, puesto que es más fácil de calcular y de usar
en forma matemática.

(2) Una distribución bimodal tiene dos puntos máximos. Esto hace que la media y la mediana no sean de utilidad,
puesto que sus valores estarán en algún lugar entre los dos puntos máximos y distorsionarán enormemente la
descripción de la distribución. La moda, y observe que en este caso hay dos modas, pasa a ser la única medida útil
de tendencia central. Sin embargo, una distribución bimodal es poco común y en general podemos decir que
consta de dos distribuciones que se pueden analizar en forma independiente.

(3) Cuando se describen distribuciones asimétricas (sesgadas) positivas o negativas, la media no es la mejor
medida de tendencia central disponible. Mientras mayor sea la asimetría o sesgo de los datos, mayor utilidad
tendrá la mediana (y más engañosa será la media), porque la mediana estará más cerca del ‘valor promedio’ real
de las observaciones. Por ejemplo, en el caso de una distribución asimétrica positiva, la media se encuentra
‘inflada’ por la minoría de las observaciones que tienen un valor mayor. Esto sucede, por ejemplo, con el ingreso
per cápita, puesto que las distribuciones del ingreso son asimétricas positivas. En las siguientes figuras se muestran
las posiciones relativas de la media, la moda y la mediana en cuatro distribuciones asimétricas.

Observe que cuando la distribución es asimétrica ‘positiva’, (es decir, el extremo más largo de la distribución
apunta hacia el este o hacia su derecha), la moda está a la izquierda de la mediana, y a su vez, la mediana está a
la izquierda del promedio. Sucede lo contrario cuando la distribución es asimétrica negativa o sesgada
negativamente. Esto nos lleva a una consideración final: si una distribución es asimétrica, es decir, notoriamente
sesgada, la mediana será mejor que la media (promedio aritmético) para describir la tendencia central de la
distribución de los datos. Observe las figuras anteriores. Note que en todas las distribuciones asimétricas, la
mediana efectivamente se acerca más que la media al valor ‘promedio o ‘normal’ de las observaciones o, en otras
palabras, refleja mejor la existencia de un sesgo en los datos.

Mediana versus media

Como sabemos, si la mediana es una mejor medida de la tendencia central para distribuciones asimétricas que la
media, ¿por qué casi siempre se usa la media y no la mediana para describir este tipo de distribuciones? El caso
típico es la medición del ingreso promedio de un país, es decir, el ingreso per cápita. Las distribuciones del ingreso
son asimétricas positivas y, por lo tanto, la mediana constituye un mejor indicador que la media del ingreso
‘normal’ o ‘promedio’ de los residentes de cualquier país determinado. Cuando hablamos del ingreso per cápita,
tendemos a suponer que en realidad es el ingreso ‘normal’ de un ciudadano de ese país. Pero, desde luego, esto
no es efectivo. El hecho de que unas pocas personas adineradas ganen una parte desproporcionada del ingreso
nacional origina un ingreso promedio ‘inflado’, por decirlo de algún modo.
Ejemplo. Según el Banco Mundial (1999), Brasil y la Eslovaquia tenían niveles de ingreso per cápita comparables
en 1997, pero al mismo tiempo sus distribuciones de ingreso eran una de las más desiguales (Brasil) y más
equitativas (Eslovaquia) del mundo (ver Cuadro 12).

Cuadro 12. Ingreso per cápita y distribución del ingreso en Brasil y Eslovaquia (1997).

Ingreso Ingreso Ingreso Ingreso per Ingreso Ingreso


per cápita per cápita per cápita cápita (Q3 o per cápita per cápita
(media (Q1 o 20% (Q2 o 20% 20% medio) (Q4 o 20% (Q5 o 20%
nacional) más pobre) siguiente siguiente más rico)
más pobre) más rico)
Brasil US$4.716 US$589 US$1.344 US$2.334 US$4.174 US$15.138
Eslovaquia US$3.960 US$2.356 US$3.128 US$3.703 US$4.396 US$6.217

Observe que en el caso de Eslovaquia, el ingreso per cápita del país sólo es un poco mayor que el ingreso per
cápita del quintil de ingreso medio de la población y algo menor que el ingreso per cápita del cuarto quintil. En
términos estadísticos, esto significa que la media está relativamente cerca de la mediana, la cual sabemos que
está ubicada en el tercer quintil. (¿Por qué? Porque la mediana divide a los datos, observados de mayor a menos,
en dos partes iguales y por lo tanto es la misma que la observación en medio del tercer quintil.) Sin embargo, en
el caso de Brasil, el ingreso promedio no sólo es mucho mayor que el ingreso per cápita del quintil de ingreso
medio, sino también mayor que el del cuarto quintil. Esto significa que en el caso de Brasil, la media es
significativamente mayor que la mediana. Esto se debe a que mientras que en Eslovaquia el 20% más rico (Q5)
gana el 31,4% del ingreso nacional total, esta cifra es 64,2% en el caso de Brasil. A pesar de que Brasil tuvo en
1997 un ingreso per cápita superior en US$756 al de Eslovaquia (es decir, casi 20% superior), el ingreso per cápita
por quintil es mayor en la República Eslovaca para cuatro de los cinco respectivos quintiles de ingreso (por favor
observe y confirme esta afirmación en el Cuadro 12). Esto significa que la medida del ingreso per cápita (media)
es un indicador inadecuado del ingreso promedio, y espectacularmente inadecuado si queremos conocer el
ingreso “medio” de un brasileño. La mediana es un indicador superior es este caso.

Entonces, ¿por qué usamos la media en lugar de la mediana para describir el ingreso promedio de un país?
Sencillo. Lo anterior se debe a que resulta muy complicado calcular la mediana y, por lo tanto, también se vuelve
muy difícil obtenerla. En segundo lugar, matemáticamente es mucho más difícil trabajar estadística con la mediana
que con la media. Por último, y esto es sumamente importante, la estadística nos proporciona otros instrumentos
para que complementemos la información obtenida por la media con información acerca de la forma de la
distribución, lo que evita que la media nos lleve a conclusiones erróneas, como en nuestro ejemplo anterior (vea
el Cuadro 12). En el caso del ingreso per capita, necesitamos complementarlo con información sobre la
distribución del ingreso, dato que en la práctica no es siempre fácilmente accesible o que tendemos a no tomar
en debida consideración.

La lección que nos deja la comparación de Brasil y Eslovaquia es que los ‘promedios’ siempre deben estar
complementados con medidas de la dispersión cuando describen conjuntos de datos. Los promedios por sí solos
pueden llevar a conclusiones erróneas, puesto que entregan una imagen sólo parcial de una distribución de datos.
Nuevamente, en nuestro ejemplo, al comprender cómo se distribuye el ingreso entre los distintos quintiles de la
población, se conoce el sesgo oculto en el promedio y se obtiene una descripción más exacta de la distribución
del ingreso.

Medidas de Dispersión
Las medidas de tendencia central no son suficientes para describir una distribución o conjunto de datos. Una
buena descripción de una distribución requiere, además de un valor ‘promedio’ de las observaciones (es decir,
una medida de tendencia central), alguna medida de la dispersión o variabilidad de los valores observados. Esta
información es proporcionada por indicadores que se conocen como ‘medidas de dispersión’ (también ‘medidas
de variabilidad’). Los más comunes, que constituyen el contenido de esta sección, son la desviación estándar y la
varianza.

Para describir la forma real de una distribución, se debe tener, evidentemente, alguna medida de la dispersión o
variabilidad de los datos; es decir, información acerca de cuán ‘dispersa’ es la distribución. Por ejemplo, para
describir el perfil de una colina que usted está observando a través de la ventana, no será suficiente la altura de
la colina, sino que también necesitará observar su forma, es decir, si es más bien plana o empinada, si es más
bien simétrica o no, si tiene una o varias cumbres y dónde, etc. Desde este punto de vista, una distribución no es
diferente a una colina.

La manera más fácil de explicar el concepto de dispersión o variabilidad es con un ejemplo. En la Figura 17
(arriba) se muestran dos distribuciones normales que representan las calificaciones de exámenes
internacionales de matemática correspondientes a muestras representativas de estudiantes de octavo año de
dos países ficticios: País A y País B. Dado que ambas distribuciones son normales, la media de las calificaciones
de las pruebas de los estudiantes de ambos países es la misma (observe que también la mediana y la moda son
las mismas). Pero, naturalmente, las distribuciones de las calificaciones de las pruebas son diferentes. La
distribución es más ‘dispersa’ en el País A que en el País B. Esto nos entrega información valiosa. Nos indica que
en el octavo año existen diferencias considerables en la distribución del aprendizaje matemático entre los Países
A y B. Según los datos, y suponiendo que el examen efectivamente mide nivel de aprendizaje en forma
adecuada, la distribución del aprendizaje de matemática es más ‘equitativo’ en el País A.
La figura 17-b (abajo) provee otro buen ejemplo de la importancia de las medidas de dispersión cuando
queremos describir distribuciones. Observe que el ejemplo es difiere del anterior en que las medidas de
tendencia central (media, mediana y moda) son ahora distintas en las dos distribuciones (curvas I y II) de la
figura, y mayores en valor en todos los casos para la distribución II. La distribución I muestra una situación en la
que la mayoría de los estudiantes de un país se concentran alrededor del valor X, cuando se la compara con la
distribución II, donde la dispersión del nivel de conocimientos entre los estudiantes del país es mucho mayor.

Finalmente, observe que, en la Figura 17-b, el país I presenta una menor dispersión y por lo tanto un mayor
grado de equidad relativa en la distribución del nivel de conocimientos. Pero, al mismo tiempo, en el país I al
menos la mitad de los estudiantes tiene un nivel de conocimientos inferiores a X, mientras que en el país II la
gran mayoría de los estudiantes (más del 80%) tienen un nivel de conocimientos superiores a X. En términos
técnicos, esto significa que el grado de equidad absoluta de la distribución de conocimientos en el país II es
superior a la del país I, si consideramos X como un estándar mínimo en el nivel de conocimientos deseado. Esta
información es importante para la toma de decisiones de política educativa.

Como ya se mencionó, los descriptores o indicadores de dispersión o variabilidad más comunes son la desviación
estándar y la varianza. A continuación explicaremos estos dos importantísimos indicadores, los cuales se usan en
forma generalizada en investigación en ciencias sociales, incluida la investigación sobre educación.

S-ar putea să vă placă și