Documente Academic
Documente Profesional
Documente Cultură
UNIDAD 3
ESTASDISTICA DESCRIPTIVA
IV SEMESTRE
2018-II
INTRODUCCIÓN
DECILES: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los
resultados.
Estas medidas son utilizadas con mucha frecuencia en aquellas poblaciones que pueden ser
dividas en grupos o estratos, cada una de ellas con una condición especial; por ejemplo,
una población de personas clasificadas ya sea por edades, estaturas, pesos, etc.
II. ¿CÓMO SE HALLAN LOS CUARTILES DE UN CONJUNTO DE DATOS?
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
Ordenados en cuatro partes iguales.Q1, Q2 y Q3 determinan los valores correspondientes al 25%,
al 50% y al 75% de los datos. Q2 coincide con la mediana.
Halle las medidas de tendencia central para datos no agrupados (realizar procesos
completos).
Media Aritmética Simple: se suma la cantidad de hijos por familia la dividimos por le total de
la muestra: 87/ 40 = 2.17
Mediana (Me): Se ordena la muestra de mayor a menor
Mediana = ( n + 1) / 2 = 20.5
0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 5 5
La fórmula me indica que la mediana se ubica en la posición 20,5 en la cual está el No 2, es decir
que la mediana es equivalente al No 2
0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 5 5
Lo cual indica que el 50% de la muestra a es decir de la cantidad d de hijos por familia a está
entre 0 y 2 hijos, y la otra mitad de la muestra a está entre e 2 a 5 hijos.
Moda (Md): Md = X1 es decir que Md = 2, debido a que es el valor de la variable que se repite
más de una vez. Eso quiere decir que la cantidad de muestra de las 40 familias, 9 de ellas tienen 2
hijos siendo el valor más repetitivo de la muestra.
0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 5 5
Q1: el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N =
40 resulta que N/4 = 10; el primer cuartil es la media aritmética de dicho valor es:
Q1= (1 + 1) / 2 = 1
Q2: el Segundo Cuartil es, variable que ocupa el lugar central en un conjunto de datos ordenados.
Como N/2 = 20; la mediana es la media aritmética de dicho valor y el siguiente:
Me = Q2 = (2 + 2)/ 2 = 2
Q3: el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En este
caso, 3N / 4 = 3(40)/4= 30, tenemos que:
Q3 = (3+ 3) / 2 = 3
CONSTRUYA EL DIAGRAMA DE CAJA Y BIGOTES.
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que los hogares
comprendidos entre el 25% y el 50% están más dispersa que entre el 50% y el 75%.
El bigote de la izquierda es más corto que el de la derecha; por ello el 25% de la cantidad de
hijos por hogares están más concentrados que el otro 25%.
El rango intercuartílico = Q3 - Q1 = 3-1 =2; es decir, el 50% de los hogares está en el promedio
de tener de 0 a 2 hijos.
2. Los siguientes datos corresponden a los días de vacaciones que tomaron los empleados durante
el último año:
a. Complete la tabla de frecuencias.
b. Halle las medidas de tendencia central (realizar procesos completos).
c. Desarrolle el diagrama de caja y bigotes.
d. Halle el percentil 25, 60 y 90 del conjunto de datos.
NUMERO DE CANTIDAD DE
DÍAS (xi) EMPLEADOS
(fi)
0 10
1 6
2 12
3 9
4 4
5 3
6 1
Tabla de frecuencias
Yi ni hi Ni Hi
0 10 22% 10 22%
1 6 13% 16 36%
2 12 27% 28 62%
3 9 20% 37 82%
4 4 9% 41 91%
5 3 7% 44 98%
6 1 2% 45 100%
N= 45
b. Medidas de tendencia central.
Media Aritmética:
Yi ni hi Ni Hi yini
0 10 22% 10 22% 0
1 6 13% 16 36% 6
2 12 27% 28 62% 24
3 9 20% 37 82% 27
4 4 9% 41 91% 16
5 3 7% 44 98% 15
6 1 2% 45 100% 6
N=45 94
𝑋=∑ 𝑌𝑖𝑛𝑖/𝑛
94/45= 2.09
El promedio de los días de vacaciones que tomaron los empleados es de 2.09 días.
Buscar la mitad de las observaciones por medio de n/2 n=45 n/2 = 45/2 = 22,5
Localizar el resultado anterior n/2 en las columnas de las frecuencias absolutas acumuladas. Si no
aparece, se toma el valor inmediatamente anterior y se simboliza con Nj-1 y al inmediatamente
superior por Ni.
Nj-1 n/2
16 < 22,5
Me = Yj
Me = 2
La cantidad de días que más se repite en días tomados de vacaciones por parte de los empleados
es 2.
MIN = 0
Q1 = 1
MEDIANA = 2
Q3 = 3
MAX = 6
La parte izquierda de la caja es igual que la de la derecha; ello quiere decir que los empleados
entre el 25% y el 50% pidieron entre uno y dos días de vacaciones y es proporcional al
porcentaje de empleados entre el 50% y el 75% que pidieron de dos a tres días.
El bigote de la izquierda (X mín., Q1) es más corto que el de la derecha (Q3, Xmax); por tanto el
25% de los empleados solicitaron entre cero y un día de vacaciones y del 75% al 100% pidieron
de tres a seis días de vacaciones
El rango intercuartílico = Q3 - Q1 = 3-1 =2; es decir, el 50% de los empleados que solicitaron sus
vacaciones están en el promedio de 0 a 2 días de vacaciones pedidos.
El bigote de la izquierda (X mín., Q1) es más corto que el de la derecha (Q3, Xmax); por ello el
25% de los empleados solicitaron entre cero y cuatro de vacaciones y del 75% al 100% pidieron
de seis a catorce días de vacaciones
JUGADOR 1
Yi ni hi Ni Hi yini
1 6 40% 6 40% 6
2 3 20% 9 60% 6
3 0 0% 9 60% 0
4 3 20% 12 80% 12
5 3 20% 15 100% 15
n= 15 39
JUGADOR 2
Yi ni hi Ni Hi yini
1 0 0% 0 0% 0
2 7 47% 7 47% 14
3 7 47% 14 93% 21
4 1 7% 15 100% 4
5 0 0% 15 100% 0
n= 15 39
La mediana de los puntos realizados por el jugador 1 es 2 y el número de puntos que más se
repite es el 1
La mediana de los puntos realizados por el jugador 2 es 3 y el número de puntos que más se
repite es el 2
El promedio de puntos realizados por cada jugador es de 3 puntos.
JUGADOR 1
MIN 1 MIN=1
Q1 1 Q1=1
MEDIANA 2 MEDIANA=2
Q3 4 Q3=4
MAX 5 MAXIMO=5
JUGADOR 2
MIN 2 MIN=2
Q1 2 Q1=2
MEDIANA 3 MEDIANA=3
Q3 3 Q3=3
MAX 4 MAXIMO=4
c. Realice el diagrama de caja y bigotes y analice los resultados de los dos conjuntos de
datos.
(Nota: hacer la tabla de frecuencias para el puntaje de cada jugador).
JUGADOR 1
JUGADOR 2
De acuerdo al diagrama de Bigotes y cajas de los jugadores podemos evidenciar; que el jugador 1
realizó mayor número de anotación entre 2 y 4 puntos, mientras que el jugador 2 realizó mayor
número de anH8otaciones entre 2 y 3 puntos. Ambos jugadores completaron un total de 15
puntos, el jugador 1 alcanzó tres veces el mayor puntaje, mientras que el jugador 2 realizó un
mayor número de anotaciones entre 2 y 3 puntos. En los cuartiles Q1, Q2 y Q3 tuvo mayor
relevancia el jugador 1 mientras que el jugador 2 tuvo relevancia sobre el Q2 Y Q3
BIBLIOGRAFÍA