Sunteți pe pagina 1din 7

ESTADÍSTICA

Estadística es un grupo de técnicas o metodologías que estudia y aplica métodos para recolectar,
organizar, analizar e interpretar información, extraída de una población o de una muestra
representativa de la misma, con el propósito de tomar decisiones, relativas al desarrollo social,
económico, científico y tecnológico del país. Las estadísticas son como la biquini ocultan lo más
importante. “Es una ciencia que sirve para demostrar que dos personas han comido medio pollo
cada una, cuando en realidad una se ha comido uno y otra, ninguno”. Se clasifica en:
Estadística descriptiva: Colección de métodos para la organización y presentación de datos.
Estadística inferencial: Conjunto de técnicas para obtener, con determinado grado de confianza,
información de una población con base en la información de una muestra.
La población y la muestra:
Una población es un conjunto de todos los elementos, sobre el que se hace un estudio estadístico.
Estos elementos pueden ser: personas, animales, plantas, artículos elaborados, consumidores,
bacterias, estudiantes, votantes, niveles de ventas, etc.
La muestra es una parte de la población que se selecciona para realizar el estudio, debido a la
imposibilidad o no conveniencia de tener información de todos y cada uno de los elementos de la
población. Una muestra debe ser representativa, es decir, debe reflejar las características esenciales
de la población que se desea estudiar. El estudio de muestras es más sencillo que el estudio de la
población completa; cuesta menos y lleva menos tiempo. Una muestra representativa contiene las
características relevantes de la población en las mismas proporciones que están incluidas en tal
población. Una población es un todo y una muestra es una fracción o segmento de ese todo.
Variables y tipos de variables:
Variables: Una variable estadística es una propiedad que se puede estudiar en una población y que
permite clasificar a los individuos o elementos de la misma. Por ejemplo si la población consta de
personas, las siguientes son variables que podrían ser de interés: sexo, edad, peso y estatura (por
edad) y trastornos de salud. Cada uno de los valores que puede tomar una variable se conoce como
dato. Las variables se pueden clasificar, en:
Cuantitativas: Cuando se pueden medir y expresar con un número: el peso, la altura y la edad.
Cualitativas: Cuando expresan una característica que no se puede medir: el sexo, los trastornos de
salud, el estado civil, el color de piel, de cabello, etc.
Entre estas variables se distinguían, a su vez, dos categorías diferentes:
Las variables cuantitativas discretas, que toman valores pertenecientes a conjuntos numéricos
discretos, por ejemplo, la edad. Se obtienen mediante conteo.
Las variables cuantitativas continuas, que toman valores pertenecientes a conjuntos numéricos
continuos, como la estatura y el peso. Se obtienen mediante mediciones.

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS


Los datos de un estudio estadístico se disponen en forma de tablas las cuales permiten clasificar y
organizar la información recolectada. Las tablas se llaman de distribución de frecuencias. La 1°
columna de una tabla está formada por los valores o atributos que toma la variable, la 2° columna
por la frecuencia absoluta y en 3° lugar la frecuencia relativa.
Frecuencia absoluta ( : Número de veces que aparece un dato , en el estudio estadístico.
Frecuencias relativas : Es el cociente entre la frecuencia absoluta de un dato y el número
total de datos o observaciones realizadas

Frecuencia absoluta acumulada : Es la suma de la frecuencia absoluta de un dato y la de


datos menores que él.
Las frecuencias relativas expresan el % o tanto por ciento de la población que tiene ese dato.
La suma de las frecuencias relativas es siempre igual a uno. La suma N de las frecuencias
absolutas es igual al número de datos.
Estadísticas Gráficos y tablas Página 1
CONFECCIÓN DE TABLAS ESTADÍSTICAS:
1) Variable cuantitativa discreta:
Ejemplo: En un centro recreativo para adultos mayores se realizó una encuesta a 25 personas con el
fin de saber cuántos días por semana van a este centro. En la encuesta se obtuvieron los siguientes
resultados:
Los datos recogidos se organizaron en la Tabla
En esta tabla se observa que, por ejemplo, hay seis adultos
mayores que van al centro recreativo cuatro veces por semana; esto significa que la frecuencia
absoluta del dato “van cuatro veces por semana” es 6.

Ejemplo: Se les preguntó a diez estudiantes de séptimo grado por su número de hermanos y se
obtuvieron estos datos:
a) Organiza la información en una tabla y halla las frecuencias absolutas, las frecuencias relativas y
las frecuencias absolutas acumuladas.
b) ¿Cuál es la frecuencia absoluta acumulada del dato “dos hermanos” y qué representa esta
frecuencia en el contexto del problema?
c) ¿Qué porcentaje de personas tiene un hermano?
Con la información ordenada en la tabla, se confeccionan los gráficos de barras, que también se
utilizan para representar distribuciones de variables cuantitativas discreta, como en este caso.
2) Variable cuantitativa continua (Datos agrupados):
Ejemplo: En una biblioteca se van a reubicar los libros en cinco estantes, de manera que los más
pesados se ubiquen en los estantes inferiores y los más livianos en la parte
superior. Carlos, el encargado, debe presentar un reporte que permita
conocer la cantidad de libros que hay en la biblioteca de acuerdo con su
peso ¿Cómo puede presentar el reporte?
Para presentar el reporte, Carlos puede realizar una tabla en la cual agrupe
los libros de acuerdo con su peso en intervalos disjuntos de igual amplitud.
De la tabla se puede inferir que hay 258 libros en la biblioteca, que los más
livianos pesan entre 100 g y 200 g, y los más pesados entre 600 g y 700 g.
Si una variable estadística es cuantitativa continua o cuantitativa discreta con un número grande
de datos, conviene agrupar dichos datos en intervalos o clases que tengan la misma amplitud, es
decir la misma cantidad de números en cada intervalo; la distribución que se obtiene es llamada
distribución de frecuencias por intervalos de clases.
En cada intervalo se toma un valor representativo llamado marca de clase, que corresponde al
valor medio del intervalo. Para hallar la marca de clase, se suman los extremos del intervalo y se
divide el resultado entre dos. Cada uno de los intervalos en los que se agrupan los datos incluye el
extremo izquierdo pero no el derecho. Por ejemplo, el intervalo [9, 11) indica que este incluye el
valor 9 pero no el valor 11.
El número de clases en las que se pueden agrupar los datos es variable, pero existe un criterio que aconseja
hacer un número de clases aproximadamente igual a la raíz cuadrada del número de datos.
Ejemplo: A cuarenta estudiantes se les solicitó medir el tiempo (en minutos) que navegaron por
internet durante un fin de semana. Los resultados obtenidos ordenados de forma ascendente son:

Para resumir la información y organizarla en una tabla de


frecuencias, se pueden agrupar los datos en seis intervalos,
cada uno de amplitud 40 min, y hallar su frecuencia. A partir
del conteo de los datos que pertenecen a cada intervalo, se
obtiene la tabla de frecuencias absolutas.

Estadísticas Gráficos y tablas Página 2


GRÁFICAS ESTADÍSTICAS
Los gráficos permiten visualizar el comportamiento de la distribución de frecuencias. Estos
gráficos pueden ser:
Gráficas estadísticas para datos no agrupados:
Ejemplo: En 5° año de un secundario se realiza una encuesta sobre el destino preferido para
realizar la excursión de fin de año. Los datos obtenidos se organizan en la tabla: Si se quieren
mostrar los resultados a los padres de familia de una forma clara y fácil de entender,
¿Cuál es la manera más práctica de hacerlo?
La información que se recogió en la
encuesta puede representarse con una
gráfica de barras rectangulares, cuyas
longitudes sean proporcionales a los datos
recolectados o frecuencias absolutas. La
gráfica comunica de manera efectiva los
resultados de la encuesta.
Un diagrama de barras se utiliza para presentar datos cualitativos o datos cuantitativos de tipo
discreto. En el eje horizontal se ubican las variables y en el eje vertical, las frecuencias. Los gráficos
de barras sirven para comparar los distintos valores de la variable en cuestión mirando solamente
cuál de las barras es más larga (la de mayor frecuencia) y cuál es más corta (la de menor
frecuencia). En el eje horizontal del gráfico, se colocan los atributos que adquiere la variable
cualitativa. En el eje vertical, se pueden indicar las frecuencias absolutas o las frecuencias
relativas. La altura de cada barra representa la frecuencia de la categoría correspondiente.
Para representar datos de variables cualitativas o cuantitativas discretas también es útil el uso de
diagramas circulares. Este tipo de diagramas distribuye la superficie de un círculo en sectores de
amplitud proporcional a la frecuencia relativa de cada dato.
Gráfico circular o gráficos de sectores: La manera de determinar el ángulo central
correspondiente a cada sector circular es:

Ejemplo: En la tabla se muestran los datos obtenidos sobre las preferencias deportivas de un grupo
de 127 estudiantes. Para calcular la amplitud del ángulo central que le corresponde a cada dato en
un diagrama circular, se multiplica cada frecuencia relativa ( ) por 360. La figura presenta el
diagrama circular correspondiente al estudio.

Los gráficos o diagramas de líneas muestran un conjunto de puntos conectados mediante una sola
línea. Estos gráficos se usan principalmente para mostrar las variaciones de una o más variables
estadísticas con respecto al cambio de otra variable, comúnmente el tiempo
Ejemplo: La tabla presenta la variación del número de estudiantes matriculados en los primeros
años de un colegio desde 1995 hasta 2011, y la figura el diagrama de líneas correspondiente.

Estadísticas Gráficos y tablas Página 3


Gráficas estadísticas para datos agrupados:
Para hacer la representación gráfica de datos agrupados en clases, se utilizan los histogramas y los
polígonos de frecuencias.
Para construir un histograma se siguen estos pasos.
1) Se dibujan los extremos de las clases sobre el eje de abscisas.
2) Se construyen rectángulos cuyas bases son la amplitud del intervalo. Si son todas iguales, las
alturas son proporcionales a las frecuencias absolutas.
Un polígono de frecuencias se forma uniendo los puntos medios de las barras de un histograma en
su parte superior mediante segmentos.
Ejemplo: Haz un histograma y el polígono de frecuencias con los datos recogidos en la tabla
correspondientes a la estatura de los 30 estudiantes de un curso:

MEDIDAS ESTADÍSTICAS:
Son datos que resumen el estudio realizado en la población. Pueden ser de dos tipos:
Medidas de tendencia central: Permiten conocer cómo se concentran los datos de una distribución
alrededor de ciertos valores: Media, Moda y Mediana.
Medidas de dispersión o de variabilidad: Permiten analizar cómo se encuentran esparcidos los
datos respecto a los parámetros de centralización. Nos van a dar una idea sobre la representatividad
de las medidas centrales, a mayor dispersión menor representatividad: Rango, Varianza y
Desviación estándar
Medidas de tendencia central
1) La Media o media aritmética: Es el promedio de las observaciones. La media aritmética , de
una variable es el cociente entre la suma de todos los valores de la misma y la cantidad total N:

a) Para distribuciones de variable discreta, donde n es el número de observaciones, xi cada uno de


los distintos valores que toma la variable y k, la cantidad de distintos valores de la variable:

Para calcular el promedio se pueden sumar todos los valores de la distribución y dividir el resultado por el
número total de observaciones. Pero el cálculo resulta más sencillo si se utilizan las frecuencias absolutas
que figuran en la tabla; agregamos una nueva columna donde multiplicamos xi . fi y obtenemos la suma de
esta cantidad y hacemos:

b) Media aritmética para datos agrupados: Se determina el cociente de la suma de los productos de
cada marca de clase xi y su correspondiente frecuencia fi dividido entre el total de los datos, N.

Donde xmi es la marca de clase; fi la frecuencia absoluta del intervalo y N, el total de observaciones.
b) En caso de la estatura de 30 estudiantes de un curso, la media será:

2) La moda (Mo) de una variable estadística es el valor de la variable que tiene mayor frecuencia
absoluta. Si los datos están agrupados en clases, se toma como valor aproximado de la moda la
marca de la clase modal, correspondiente al intervalo de mayor frecuencia absoluta. El intervalo al
cual pertenece la moda, se denomina intervalo modal o clase modal. La clase moda para la
distribución de estatura de los alumnos es [156, 163). Una distribución puede tener una moda
Estadísticas Gráficos y tablas Página 4
(unimodal), dos modas (bimodal), tres modas (trimodal), etc. Si todos los valores se repiten el
mismo número de veces, se considera que la distribución no tiene moda.
3) La mediana (Me) de una variable estadística es el valor de la variable tal que el número de
valores menores que él es igual al número de valores mayores que él.
La mediana depende del orden de los datos y no de su valor. Es el valor de la variable
correspondiente a la posición central de la distribución, cuyos datos están ordenados en forma
creciente. Para calcular se agrega una columna de frecuencia absoluta acumuladas y se calcula la
mitad de los datos, cuando supera la mitad de los datos esa es la mediana.
4) Cuartiles: En ocasiones es conveniente distribuir los datos estadísticos en cuatro partes iguales.
Para ello se calculan tres valores que se llaman cuartilesy se representan por Q1, Q2 y Q3. El
segundo cuartil coincide con la mediana.
Ejemplo: Se realizó un cuestionario de 80 preguntas a 60 personas y se obtuvieron los resultados

Q1: La clase que contiene el primer cuartil es [30, 40), ya que su frecuencia acumulada excede por
primera vez la cuarta parte de los datos, 60: 4 = 15.
Así, el primer cuartil será la marca de la clase, es decir, Q1 = 35.
Q3: La clase que contiene el tercer cuartil es [50, 60), ya que su frecuencia acumulada es la primera
que excede las tres cuartas partes de los datos, ¾ .60 = 45
Por lo tanto, el tercer cuartil será la marca de la clase, es decir, Q3 = 55
El primer cuartil, Q1, deja a su izquierda la cuarta parte de la distribución.
El segundo cuartil, Q2, deja a su izquierda la mitad de la distribución; por lo tanto, coincide con la
mediana, Q2 = Me.
El tercer cuartil, Q2, deja a su izquierda las tres cuartas partes de la distribución.
Medidas de variabilidad
Para conocer el comportamiento general de una distribución de frecuencias no alcanza con
determinar su valor central. Es necesario, además analizar la variabilidad de los datos, lo que
implica estudiar cómo se encuentran esparcidos dentro de la distribución, que permiten completar la
información que proporciona la media.
a) El rango: El rango de una distribución es la diferencia entre el mayor valor y el menor valor de
la variable estadística. También se llama recorrido. En la Tabla, se representa el número de libros
que se venden cada día en una librería a lo largo de un mes.

La cantidad de ejemplares vendidos varía desde los 12 hasta los 49, por lo que se dice que el rango
de esta distribución es: Rango = 49 – 12 = 37 libros.
b) La varianza: Se conoce como desviación respecto a la media, di, a la diferencia entre cada valor
de la variable estadística, xi, y la media aritmética . Es decir:
La varianzas s2 de una variable estadística x es la media aritmética de los cuadrados de las
desviaciones respecto a la media. Para datos agrupados es:

Para una distribución con intervalos de clase, se reemplaza xi por la marca de clase xmi
Una expresión más sencilla para calcular la varianza es:

c) La desviación estándar: La desviación estándar es la raíz cuadrada positiva de la varianza.


Desviación estándar: . También se denomina desviación típica.
Estadísticas Gráficos y tablas Página 5
Ejemplo1: Se han pesado 200 paquetes de un producto químico y los pesos en gramos, se muestran
en la tabla de frecuencias. La media es gramos
Peso
fi xi . fi ( ) ( )2 ( )2.fi
xi
298 8 2384 – 1,8 3,24 25,92
299 60 17940 – 0,8 0,64 38,4
300 102 30600 0,2 0,04 4,08
301 24 7224 1,2 1,44 34,56
302 6 1812 2,2 4,84 29,04
Total 200 59960 132,00

La varianza es
La desviación
Ejemplo 2: Calcular la varianza y la desviación estándar de la distribución que se presenta en la
tabla. Esta corresponde a una muestra de 96 niños de 4 años cuyos pesos son:
Peso (kg) fi xmi xmi.fi ( ) ( )2 ( )2.fi
xi
12 – 13,5 10 12,75 127,5 –2,921875 8,5373535 85,373535
13,5 – 15 20 14,25 285 –1,421875 2,0217285 40,43457
15 – 16,5 36 15,75 567 0,078125 0,0061035 0,2197265
16,5 – 18 25 17,25 431,25 1,578125 2,4904785 62,261963
18 – 19,5 5 18,75 93,75 3,078125 9,4748535 47,374268
Totales 96 1504,5 235,664
La media de la muestra es

La varianza es: y la desviación:


Ejemplo 3: El número de libros leídos por los miembros de un círculo de lectores en un mes se resume en
esta tabla.

a) Halla la media de libros leídos a lo largo de un mes.

b) Hallar la moda de la distribución: Mo= 3


c) Hallar los cuartiles: Se realiza una tabla con las frecuencias absolutas acumuladas Fi

La cuarta parte del número de datos es 58/4 = 14,5. El primer cuartil es el primer valor cuya frecuencia
acumulada supera ese valor: Q1 = 2 libros
La mitad del número de datos es 58/2 = 29. El segundo cuartil es el primer valor cuya frecuencia acumulada
supera ese valor: Q2 = 3 libros
Tres cuartos del número de datos es 3* 58/4 = 43,5. El tercer cuartil es el primer valor cuya
frecuencia acumulada supera ese valor: Q3 = 4 libros.
d) Determina el rango de esta distribución: rango =7 1 = 6 libros.
e) Calcula la varianza y la desviación típica de esta distribución.
ó
libros libros

Estadísticas Gráficos y tablas Página 6


Ejemplo 4: a) Estas son las edades de los niños que acuden al servicio de Urgencias de un hospital
pediátrico. Halla la moda

b) Halla los cuartiles: Se realiza una tabla con las frecuencias absolutas acumuladas Fi

35/4 = 8,75. Q1 es la marca de la primera clase cuya frecuencia acumulada supera ese valor, que es [0, 2): Q1
= 1 año.
35/2 = 17,5. Q2 es la marca de la primera clase cuya frecuencia acumulada supera ese valor, que es [2, 4): Q2
= 3 años.
¾ * 35 = 26,25. Q3 es la marca de la primera clase cuya frecuencia acumulada supera ese valor, que es [6, 8):
Q3 = 7 años.
Ejemplo 5: a) Determina la mediana de la distribución.

Se realiza una tabla con las frecuencias absolutas acumuladas Fi:


La mitad del número de datos es 20/2 = 10, luego la clase mediana es [10, 15), ya que es la primera cuya
frecuencia acumulada supera ese valor. La mediana es la marca de esta clase: Me = 12,5
b) Halla el coeficiente de variación de la distribución: Utilizamos las marcas de clase

Ejemplo 6: Calcula la media y la varianza de esta distribución

Ejemplo 7: Halla la media y la desviación típica de la distribución

Ejemplo 8: Observa el siguiente diagrama de barras.


Halla la media, la mediana y la moda de la distribución

Ejemplo 9: El siguiente diagrama de barras muestra el número


de horas que dedica diariamente a practicar deporte un grupo de 25 estudiantes.
a) Calcula la media, la mediana y la moda de la distribución.
b) Halla el rango, la desviación típica y el coeficiente de variación.

Estadísticas Gráficos y tablas Página 7

S-ar putea să vă placă și