Documente Academic
Documente Profesional
Documente Cultură
Estadística es un grupo de técnicas o metodologías que estudia y aplica métodos para recolectar,
organizar, analizar e interpretar información, extraída de una población o de una muestra
representativa de la misma, con el propósito de tomar decisiones, relativas al desarrollo social,
económico, científico y tecnológico del país. Las estadísticas son como la biquini ocultan lo más
importante. “Es una ciencia que sirve para demostrar que dos personas han comido medio pollo
cada una, cuando en realidad una se ha comido uno y otra, ninguno”. Se clasifica en:
Estadística descriptiva: Colección de métodos para la organización y presentación de datos.
Estadística inferencial: Conjunto de técnicas para obtener, con determinado grado de confianza,
información de una población con base en la información de una muestra.
La población y la muestra:
Una población es un conjunto de todos los elementos, sobre el que se hace un estudio estadístico.
Estos elementos pueden ser: personas, animales, plantas, artículos elaborados, consumidores,
bacterias, estudiantes, votantes, niveles de ventas, etc.
La muestra es una parte de la población que se selecciona para realizar el estudio, debido a la
imposibilidad o no conveniencia de tener información de todos y cada uno de los elementos de la
población. Una muestra debe ser representativa, es decir, debe reflejar las características esenciales
de la población que se desea estudiar. El estudio de muestras es más sencillo que el estudio de la
población completa; cuesta menos y lleva menos tiempo. Una muestra representativa contiene las
características relevantes de la población en las mismas proporciones que están incluidas en tal
población. Una población es un todo y una muestra es una fracción o segmento de ese todo.
Variables y tipos de variables:
Variables: Una variable estadística es una propiedad que se puede estudiar en una población y que
permite clasificar a los individuos o elementos de la misma. Por ejemplo si la población consta de
personas, las siguientes son variables que podrían ser de interés: sexo, edad, peso y estatura (por
edad) y trastornos de salud. Cada uno de los valores que puede tomar una variable se conoce como
dato. Las variables se pueden clasificar, en:
Cuantitativas: Cuando se pueden medir y expresar con un número: el peso, la altura y la edad.
Cualitativas: Cuando expresan una característica que no se puede medir: el sexo, los trastornos de
salud, el estado civil, el color de piel, de cabello, etc.
Entre estas variables se distinguían, a su vez, dos categorías diferentes:
Las variables cuantitativas discretas, que toman valores pertenecientes a conjuntos numéricos
discretos, por ejemplo, la edad. Se obtienen mediante conteo.
Las variables cuantitativas continuas, que toman valores pertenecientes a conjuntos numéricos
continuos, como la estatura y el peso. Se obtienen mediante mediciones.
Ejemplo: Se les preguntó a diez estudiantes de séptimo grado por su número de hermanos y se
obtuvieron estos datos:
a) Organiza la información en una tabla y halla las frecuencias absolutas, las frecuencias relativas y
las frecuencias absolutas acumuladas.
b) ¿Cuál es la frecuencia absoluta acumulada del dato “dos hermanos” y qué representa esta
frecuencia en el contexto del problema?
c) ¿Qué porcentaje de personas tiene un hermano?
Con la información ordenada en la tabla, se confeccionan los gráficos de barras, que también se
utilizan para representar distribuciones de variables cuantitativas discreta, como en este caso.
2) Variable cuantitativa continua (Datos agrupados):
Ejemplo: En una biblioteca se van a reubicar los libros en cinco estantes, de manera que los más
pesados se ubiquen en los estantes inferiores y los más livianos en la parte
superior. Carlos, el encargado, debe presentar un reporte que permita
conocer la cantidad de libros que hay en la biblioteca de acuerdo con su
peso ¿Cómo puede presentar el reporte?
Para presentar el reporte, Carlos puede realizar una tabla en la cual agrupe
los libros de acuerdo con su peso en intervalos disjuntos de igual amplitud.
De la tabla se puede inferir que hay 258 libros en la biblioteca, que los más
livianos pesan entre 100 g y 200 g, y los más pesados entre 600 g y 700 g.
Si una variable estadística es cuantitativa continua o cuantitativa discreta con un número grande
de datos, conviene agrupar dichos datos en intervalos o clases que tengan la misma amplitud, es
decir la misma cantidad de números en cada intervalo; la distribución que se obtiene es llamada
distribución de frecuencias por intervalos de clases.
En cada intervalo se toma un valor representativo llamado marca de clase, que corresponde al
valor medio del intervalo. Para hallar la marca de clase, se suman los extremos del intervalo y se
divide el resultado entre dos. Cada uno de los intervalos en los que se agrupan los datos incluye el
extremo izquierdo pero no el derecho. Por ejemplo, el intervalo [9, 11) indica que este incluye el
valor 9 pero no el valor 11.
El número de clases en las que se pueden agrupar los datos es variable, pero existe un criterio que aconseja
hacer un número de clases aproximadamente igual a la raíz cuadrada del número de datos.
Ejemplo: A cuarenta estudiantes se les solicitó medir el tiempo (en minutos) que navegaron por
internet durante un fin de semana. Los resultados obtenidos ordenados de forma ascendente son:
Ejemplo: En la tabla se muestran los datos obtenidos sobre las preferencias deportivas de un grupo
de 127 estudiantes. Para calcular la amplitud del ángulo central que le corresponde a cada dato en
un diagrama circular, se multiplica cada frecuencia relativa ( ) por 360. La figura presenta el
diagrama circular correspondiente al estudio.
Los gráficos o diagramas de líneas muestran un conjunto de puntos conectados mediante una sola
línea. Estos gráficos se usan principalmente para mostrar las variaciones de una o más variables
estadísticas con respecto al cambio de otra variable, comúnmente el tiempo
Ejemplo: La tabla presenta la variación del número de estudiantes matriculados en los primeros
años de un colegio desde 1995 hasta 2011, y la figura el diagrama de líneas correspondiente.
MEDIDAS ESTADÍSTICAS:
Son datos que resumen el estudio realizado en la población. Pueden ser de dos tipos:
Medidas de tendencia central: Permiten conocer cómo se concentran los datos de una distribución
alrededor de ciertos valores: Media, Moda y Mediana.
Medidas de dispersión o de variabilidad: Permiten analizar cómo se encuentran esparcidos los
datos respecto a los parámetros de centralización. Nos van a dar una idea sobre la representatividad
de las medidas centrales, a mayor dispersión menor representatividad: Rango, Varianza y
Desviación estándar
Medidas de tendencia central
1) La Media o media aritmética: Es el promedio de las observaciones. La media aritmética , de
una variable es el cociente entre la suma de todos los valores de la misma y la cantidad total N:
Para calcular el promedio se pueden sumar todos los valores de la distribución y dividir el resultado por el
número total de observaciones. Pero el cálculo resulta más sencillo si se utilizan las frecuencias absolutas
que figuran en la tabla; agregamos una nueva columna donde multiplicamos xi . fi y obtenemos la suma de
esta cantidad y hacemos:
b) Media aritmética para datos agrupados: Se determina el cociente de la suma de los productos de
cada marca de clase xi y su correspondiente frecuencia fi dividido entre el total de los datos, N.
Donde xmi es la marca de clase; fi la frecuencia absoluta del intervalo y N, el total de observaciones.
b) En caso de la estatura de 30 estudiantes de un curso, la media será:
2) La moda (Mo) de una variable estadística es el valor de la variable que tiene mayor frecuencia
absoluta. Si los datos están agrupados en clases, se toma como valor aproximado de la moda la
marca de la clase modal, correspondiente al intervalo de mayor frecuencia absoluta. El intervalo al
cual pertenece la moda, se denomina intervalo modal o clase modal. La clase moda para la
distribución de estatura de los alumnos es [156, 163). Una distribución puede tener una moda
Estadísticas Gráficos y tablas Página 4
(unimodal), dos modas (bimodal), tres modas (trimodal), etc. Si todos los valores se repiten el
mismo número de veces, se considera que la distribución no tiene moda.
3) La mediana (Me) de una variable estadística es el valor de la variable tal que el número de
valores menores que él es igual al número de valores mayores que él.
La mediana depende del orden de los datos y no de su valor. Es el valor de la variable
correspondiente a la posición central de la distribución, cuyos datos están ordenados en forma
creciente. Para calcular se agrega una columna de frecuencia absoluta acumuladas y se calcula la
mitad de los datos, cuando supera la mitad de los datos esa es la mediana.
4) Cuartiles: En ocasiones es conveniente distribuir los datos estadísticos en cuatro partes iguales.
Para ello se calculan tres valores que se llaman cuartilesy se representan por Q1, Q2 y Q3. El
segundo cuartil coincide con la mediana.
Ejemplo: Se realizó un cuestionario de 80 preguntas a 60 personas y se obtuvieron los resultados
Q1: La clase que contiene el primer cuartil es [30, 40), ya que su frecuencia acumulada excede por
primera vez la cuarta parte de los datos, 60: 4 = 15.
Así, el primer cuartil será la marca de la clase, es decir, Q1 = 35.
Q3: La clase que contiene el tercer cuartil es [50, 60), ya que su frecuencia acumulada es la primera
que excede las tres cuartas partes de los datos, ¾ .60 = 45
Por lo tanto, el tercer cuartil será la marca de la clase, es decir, Q3 = 55
El primer cuartil, Q1, deja a su izquierda la cuarta parte de la distribución.
El segundo cuartil, Q2, deja a su izquierda la mitad de la distribución; por lo tanto, coincide con la
mediana, Q2 = Me.
El tercer cuartil, Q2, deja a su izquierda las tres cuartas partes de la distribución.
Medidas de variabilidad
Para conocer el comportamiento general de una distribución de frecuencias no alcanza con
determinar su valor central. Es necesario, además analizar la variabilidad de los datos, lo que
implica estudiar cómo se encuentran esparcidos dentro de la distribución, que permiten completar la
información que proporciona la media.
a) El rango: El rango de una distribución es la diferencia entre el mayor valor y el menor valor de
la variable estadística. También se llama recorrido. En la Tabla, se representa el número de libros
que se venden cada día en una librería a lo largo de un mes.
La cantidad de ejemplares vendidos varía desde los 12 hasta los 49, por lo que se dice que el rango
de esta distribución es: Rango = 49 – 12 = 37 libros.
b) La varianza: Se conoce como desviación respecto a la media, di, a la diferencia entre cada valor
de la variable estadística, xi, y la media aritmética . Es decir:
La varianzas s2 de una variable estadística x es la media aritmética de los cuadrados de las
desviaciones respecto a la media. Para datos agrupados es:
Para una distribución con intervalos de clase, se reemplaza xi por la marca de clase xmi
Una expresión más sencilla para calcular la varianza es:
La varianza es
La desviación
Ejemplo 2: Calcular la varianza y la desviación estándar de la distribución que se presenta en la
tabla. Esta corresponde a una muestra de 96 niños de 4 años cuyos pesos son:
Peso (kg) fi xmi xmi.fi ( ) ( )2 ( )2.fi
xi
12 – 13,5 10 12,75 127,5 –2,921875 8,5373535 85,373535
13,5 – 15 20 14,25 285 –1,421875 2,0217285 40,43457
15 – 16,5 36 15,75 567 0,078125 0,0061035 0,2197265
16,5 – 18 25 17,25 431,25 1,578125 2,4904785 62,261963
18 – 19,5 5 18,75 93,75 3,078125 9,4748535 47,374268
Totales 96 1504,5 235,664
La media de la muestra es
La cuarta parte del número de datos es 58/4 = 14,5. El primer cuartil es el primer valor cuya frecuencia
acumulada supera ese valor: Q1 = 2 libros
La mitad del número de datos es 58/2 = 29. El segundo cuartil es el primer valor cuya frecuencia acumulada
supera ese valor: Q2 = 3 libros
Tres cuartos del número de datos es 3* 58/4 = 43,5. El tercer cuartil es el primer valor cuya
frecuencia acumulada supera ese valor: Q3 = 4 libros.
d) Determina el rango de esta distribución: rango =7 1 = 6 libros.
e) Calcula la varianza y la desviación típica de esta distribución.
ó
libros libros
b) Halla los cuartiles: Se realiza una tabla con las frecuencias absolutas acumuladas Fi
35/4 = 8,75. Q1 es la marca de la primera clase cuya frecuencia acumulada supera ese valor, que es [0, 2): Q1
= 1 año.
35/2 = 17,5. Q2 es la marca de la primera clase cuya frecuencia acumulada supera ese valor, que es [2, 4): Q2
= 3 años.
¾ * 35 = 26,25. Q3 es la marca de la primera clase cuya frecuencia acumulada supera ese valor, que es [6, 8):
Q3 = 7 años.
Ejemplo 5: a) Determina la mediana de la distribución.