Documente Academic
Documente Profesional
Documente Cultură
ESTADISTICA I
21 DE OCTUBRE DE 2019
Definición de Histograma.
Las medidas de tendencia central son valores que se ubican al centro de un conjunto de
datos ordenados según su magnitud. Generalmente se utilizan 4 de estos valores también
conocidos como estadigrafos, la media aritmética, la mediana, la moda y al rango medio.
La Mediana, es el valor que ocupa la posición central en un conjunto de datos, que deben
estar ordenados, de esta manera la mitad de las observaciones es menor que la mediana y
la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen
observaciones extremas.
12 15 14 15 16
18 19 14 15 17
15 17 18 16 19
16 17 15 15 17
16 18 17 19 17
23 16 17 18 19
_ 500
X = ------------ = 16.6667
30
Para la mediana deberá ordenarse el grupo de datos, como n = 30, utilizaremos la posición
p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.
La moda estaría determinada por observación directa, y correspondería al valor 17, que se
presenta hasta 7 veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2
= 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se
obtiene tuvo que ordenar la información (así lo específica la definición), sin embargo
podemos también observar que este ordenamiento no afecta de manera directa ninguno
de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida Valor Calculado Observaciones
Media 16.6667
Mediana 17 Se requirió el cálculo de la frecuencia
acumulada
Moda 17
Rango 17.5
Medio
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de
17, no se notan cambios en los resultados comparados con los datos originales, sin
embargo las formulas si se ven modificadas.
Agrupados
Recurramos ahora al agrupamiento de los datos discretos del ejercicio que hemos estado
utilizando:
Clase Repeticiones Total de Años de la
clase
12 1 12
14 2 28
15 6 90
16 5 80
17 7 119
18 4 72
19 4 76
23 1 23
Total 30 500
En donde podemos observar la suma de las frecuencias y de los años multiplicados por la
clase que agrupa a los datos coinciden con los datos utilizados cuando no se agruparon en
la sección anterior, utilizando ahora las formulas de la siguiente tabla:
Medida Formula Observaciones
Media Donde xi se refiere a todo y cada
uno de los elementos de la
muestra y n es el número total de
elementos en la muestra y fi se
refiere a la frecuencia de la clase.
Es la posición en donde se
encuentra la mediana.
Se ubica en la tabla el primer valor
Mediana p = (n/2) de frecuencia acumulada mayor a
la posición calculada, si ese valor
es mayor, entonces la mediana es
la clase correspondiente al
mismo. Si el valor es igual a la
posición, entonces se suman el
valor anterior más el valor
obtenido y se divide entre 2.
Moda Se obtiene el valor por
observación de la mayor
frecuencia
Rango (Valor máximo + Valor
Medio Mínimo) / 2
Aplicando, se obtienen los siguientes valores:
Para la media:
12*1+14*2+15*6+16*5+1*7+18*4+19*4+23*1 12+28 +90+ 80+119+72+76+23
X = --------------------------------------------------------- = -----------------------------------------
30 30
_ 500
X = ------------ = 16.6667
30
Para la Mediana, utilizaremos la frecuencia acumulada:
La moda estaría determinada por observación directa, y correspondería al valor 17, que se
presenta hasta 7 veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2
= 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se
obtiene tuvo que ordenar la información (así lo específica la definición), sin embargo
podemos también observar que este ordenamiento no afecta de manera directa ninguno
de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida Valor Calculado Observaciones
Media 16.6667
Mediana 17 Se requirió el cálculo de la frecuencia
acumulada
Moda 17
Rango 17.5
Medio
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de
17, no se notan cambios en los resultados comparados con los datos originales, sin
embargo las formulas si se ven modificadas.
Datos Continuos
No agrupados
Las medidas de tendencia central para datos continuos no agrupados no tienen mayor
significación, ya que el comportamiento es similar al de datos discretos no agrupados, por
ello utilizaremos las mismas formúlas, pero ahora con los datos continuos del ejercicio de
la sección correspondiente:
1.25 1.2 1.28 1.29 1.2 1.24
1.27 1.21 1.32 1.27 1.18 1.29
1.2 1.23 1.25 1.28 1.24 1.28
1.27 1.25 1.24 1.25 1.27 1.28
1.29 1.18 1.21 1.24 1.2 1.23
1.25 1.27 1.28 1.24 1.29 1.21
Aplicando, se obtienen los siguientes valores:
Para la media, aplicando la fórmula de la media para datos no agrupados (vista en la sección
de datos discretos):
_ 1.25 + 1.2 + 1.28+1.29+1.2 + 1.24 + 1.27 + 1.21 + 1.32 + 1.27 + 1.18 + 1.29 + 1.2 + 1.23
+ 1.25 + 1.28 + 1.24 + 1.28 + 1.27 + 1.25 + 1.24 + 1.25 + 1.27 + 1.28 + 1.29 + 1.28 + 1.21 +
1.24 + 1.2 + 1.23 + 1.25 + 1.27 + 1.28 + 1.24 + 1.29 + 1.21
X = ------------------------------------------------------------------------------------------------------------------
30
_ 44.93
X = ------------ = 1.24805556
30
La moda estaría determinada por observación directa, y corresponderían a los valores 1.24,
1.25 y 1.27 que se repiten en la muestra 5 veces, por lo que la característica según la moda
es una muestra trimodal (normalmente se le conoce como multimodal).
El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2
= 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se
tuvo que ordenar la información (así lo específica la definición), sin embargo podemos
también observar que este ordenamiento no afecta de manera directa ninguno de los
cálculos, de esta manera se puede construir la siguiente tabla:
Medida Valor Calculado Observaciones
Media 1.24805556
Mediana 1.25 Se requirió del ordenamiento de los datos
Moda 1.24,1.25, 1.27 Muestra multimodal
Rango 1.25
Medio
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de
1.25.
Agrupados
Retomando los cálculos realizados en la sección correspondiente a organización y
presentación de datos continuos agrupados.
Clases Li Ls Mc F fa fc fr fra frc
I 1.175 1.203 1.189 6 6 30 16.67% 16.67% 83.33%
II 1.213 1.241 1.227 10 16 20 27.78% 44.44% 55.56%
III 1.251 1.279 1.265 10 26 10 27.78% 72.22% 27.78%
IV 1.289 1.317 1.303 9 35 1 25.00% 97.22% 2.78%
V 1.327 1.355 1.341 1 36 0 2.78% 100.00% 0.00%
En ella se pueden observar los límites superiores e inferiores de cada clase, lo que indica
(de no conocer los datos originales) que por ejemplo esos 6 valores de la clase pueden
ubicarse en cualquier valor del rango, pueden ser por ejemplo 1.17, 1.171, 1.20, 1.202,
1.18, 1.1901.
Es decir pueden tomar cualquier valor dentro del rango lo que dificulta tomar estos
parámetros como elementos para el cálculo de las medidas de tendencia central, por ello
se realizó el cálculo de la Mc (Marca de Clase) que en otras palabras es el rango medio de
cada clase, que servirá para el cálculo de la media como lo establecemos en la siguiente
tabla de cálculo para las medidas de tendencia central:
Medida Formula Observaciones
Media Donde Mc se refiere a la marca de
clase de cada clase, n es el número
total de elementos en la muestra y
fi se refiere a la frecuencia de la
clase.
Es la posición en donde se encuentra
la mediana.
Mediana p = (n/2) Se ubica en la tabla el primer valor
de frecuencia acumulada mayor a la
posición calculada.
El valor de la mediana se calcula
tomando la formula del 5to. Decil.
Moda Donde Li es el límite inferior de la
clase que tiene la mayor frecuencia.
fm es la frecuencia modal (aquella
donde se encuentra la
frecuencia mayor)
f(m -1) es la frecuencia anterior a la
frecuencia modal, en caso de
encontrarse en la primera clase, este
valor es cero.
F(m+1) es la frecuencia posterior a la
frecuencia modal, en caso de
encontrarse en la última clase, este
valor es cero.
A es la amplitud de la clase modal.
Rango (Valor máximo + Valor
Medio Mínimo) / 2
Aplicándolas para calcular la media y complementando la tabla anterior:
Clases Li Ls Mc F fa fc fr fra frc Mc * f
I 1.175 1.203 1.189 6 6 30 16.67% 16.67% 83.33% 7.134
II 1.213 1.241 1.227 10 16 20 27.78% 44.44% 55.56% 12.27
III 1.251 1.279 1.265 10 26 10 27.78% 72.22% 27.78% 12.65
IV 1.289 1.317 1.303 9 35 1 25.00% 97.22% 2.78% 11.727
V 1.327 1.355 1.341 1 36 0 2.78% 100.00% 0.00% 1.341
36 45.122
Con fundamento en la tabla podemos entonces obtener:
45.122
Media = ---------------- = 1.253388889
36
Para el cálculo de la mediana, se utiliza la formula del 5to. Decil (puede ser el 50tavo
percentil), para ello determinamos la posición de este estadígrafo, p = (36/10)*5 = 3.6 * 5
= 18.
Con este valor recurrimos a la columna de la frecuencia acumulada y observarmos que el
primer elemento mayor al valor calculado se ubica en la clase III, aplicando la fórmula
obtenemos:
((36/10)*5 – 16) (18 – 16)
Mediana = 1.251 + (----------------------------) * 0.028 = 1.251 + (---------------) * 0.028
10 10
2
Mediana = 1.251 + ( ---------) * 0.028 = 1.251 + (0.2 * 0.028) = 1.251 + 0.0056 = 1.2566
10
La moda se encontraría en las clases II y III, son las que mayores frecuencias manifiestan,
por lo tanto podemos definir que existen una característica de multimodalida en la
muestra, calculemos la primera moda (dejamos como actividad complementaria el cálculo
de la segunda moda).
( 10 – 6) 4
Mo = 1.213 + ( -------------------------) 0.028 = 1.213 + (--------) * 0.028 = 1.213 + 0.028
(2* 10 – 6 – 10) 4
Mo = 1.241
El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2
= 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se
tuvo que ordenar la información (así lo específica la definición), sin embargo podemos
también observar que este ordenamiento no afecta de manera directa ninguno de los
cálculos, de esta manera se puede construir la siguiente tabla:
Medida Valor Calculado Observaciones
Media 1.253388889
Mediana 1.2566 Se requirió del uso de fórmulas del 5to decil,
se pudieron usar las de 50tavo centil.
Moda 1.241 Muestra multimodal, solo se calculó la
primera moda
Rango 1.25
Medio
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de
1.25.
Construyamos una tabla comparativa de resultados de cálculo de estas medidas;
Medida No Agrupados
agrupados
Media 1.24805556 1.253388889
Mediana 1.25 1.2566
Moda 1.24,1.25, 1.241
1.27
Rango 1.25 1.25
Medio
Puede en esta tabla observarse una diferencia marcada en los valores obtenidos por
agrupamiento y no agrupamiento para la media, la mediana y la moda, la última, por
observación en el caso de no agrupamiento nos presenta 3 modas, mientras que en el
agrupamiento, se obtienen 2 modas, la realidad es que el agrupar datos continuos se tiene
una pérdida de valores por la aproximación que se tiene al calcular por ejemplo la marca
de clase como valor representativo medio de la misma.