Sunteți pe pagina 1din 15

INSTITUCION UNIVERSITARIA ITSA.

GESTION DE SISTEMAS ELECTROMECANICOS.

ESTADISTICA I

HISTOGRAMAS/ POLIGONO DE FRECUENCIA


MEDIDAS DE TENDENCIA CENTRAL

JORGE MARIO ESTRADA MORELO

INSTRUCTOR: JAIME ENRIQUE MONCADA

21 DE OCTUBRE DE 2019
Definición de Histograma.

El histograma es aquella representación gráfica de estadísticas de diferentes


tipos. La utilidad del histograma tiene que ver con la posibilidad de
establecer de manera visual, ordenada y fácilmente comprensible todos los
datos numéricos estadísticos que pueden tornarse difíciles de entender. Hay
muchos tipos de histogramas y cada uno se ajusta a diferentes necesidades
como también a diferentes tipos de información.
Los histogramas son utilizados siempre por la ciencia estadística. Su función es
exponer gráficamente números, variables y cifras de modo que los resultados
se visualicen más clara y ordenadamente. El histograma es siempre una
representación en barras y por eso es importante no confundirlo con otro tipo
de gráficos como las tortas. Se estima que por el tipo de información brindada
y por la manera en que ésta es dispuesta, los histogramas son de especial
utilidad y eficacia para las ciencias sociales ya que permiten comparar datos
sociales como los resultados de un censo, la cantidad de mujeres y/o hombres
en una comunidad, el nivel de analfabetismo o mortandad infantil, etc.
Para un histograma existen dos tipos de informaciones básicas (que pueden
ser complementados o no de acuerdo a la complejidad del diseño): la
frecuencia de los valores y los valores en sí. Normalmente, las frecuencias son
representadas en el eje vertical mientras que en el horizontal se representan
los valores de cada una de las variables (que aparecen en el histograma como
barras bi o tridimensionales).
Existen diferentes tipos de histogramas. Los histogramas de barras simples son
los más comunes y utilizados. También están los histogramas de barras
compuestas que permiten introducir información sobre dos variables. Luego
están los histogramas de barras agrupadas según información y por último
el polígono de frecuencias y la ojiva porcentual, ambos sistemas utilizados
normalmente por expertos. Trabajar con histogramas es muy simple y
seguramente proveerá con una mejor comprensión de diferente tipo de datos
e información.
Medidas de Tendencia Central.
Definiciones:

Las medidas de tendencia central son valores que se ubican al centro de un conjunto de
datos ordenados según su magnitud. Generalmente se utilizan 4 de estos valores también
conocidos como estadigrafos, la media aritmética, la mediana, la moda y al rango medio.

La media aritmética es la medida de posición utilizada con más frecuencia. Si se tienen n


valores de observaciones, la media aritmética es la suma de todos y cada uno de los valores
dividida entre el total de valores: Lo que indica que puede ser afectada por los valores
extremos, por lo que puede dar una imagen distorsionada de la información de los datos.

La Mediana, es el valor que ocupa la posición central en un conjunto de datos, que deben
estar ordenados, de esta manera la mitad de las observaciones es menor que la mediana y
la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen
observaciones extremas.

La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No


depende de valores extremos, pero es más variables que la media y la mediana.

Rango Medio es la media de las observaciones menor y mayor. como intervienen


solamente estas observaciones, si hay valores extremos, se distorsiona como medida de
posición, pero
Ofrece un valor adecuado, rápido y sencillo para resumir al conjunto de datos.
Datos Discretos
No Agrupados
Analicemos para ello las edades que utilizamos cuando se vio la organización y
presentación de datos discretos:

12 15 14 15 16
18 19 14 15 17
15 17 18 16 19
16 17 15 15 17
16 18 17 19 17
23 16 17 18 19

Estos fueron los datos mostrados originalmente, no se han ordenado ni agrupado,


determinemos ahora los valores de la Media, la Mediana y la moda, para ello recurramos
a las fórmulas de estas medidas que resumimos en la siguiente tabla:
Medida Formula Observaciones
Media Donde xi se refiere a todo y
cada uno de los elementos de
la muestra y n es el número
total de elementos en la
muestra.
Mediana a) p = (n/2) Es la posición en donde se
encuentra la mediana.
Si n es impar, entonces es la
b) p = (n/2) + 1 opción a, en caso contrario, la
b.
El valor de la mediana se
obtiene por observación
Moda Se obtiene el valor por
observación
Rango (Valor máximo + Valor
Medio Mínimo) / 2
Aplicando, se obtienen los siguientes valores:
Para la media:
_ 12 + 15 + 14 + 15 + 16 + 18 + 19 + 14 + 15 + 17 + 15 + 17 + 18 + 16 + 19 + 16 + 17 + 15 +
15 + 17 + 16 + 18 + 17 + 19 + 17 + 23 + 16 + 17 + 18 + 19
X = ------------------------------------------------------------------------------------------------------------------
30

_ 500
X = ------------ = 16.6667
30
Para la mediana deberá ordenarse el grupo de datos, como n = 30, utilizaremos la posición
p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.

La moda estaría determinada por observación directa, y correspondería al valor 17, que se
presenta hasta 7 veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2
= 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se
obtiene tuvo que ordenar la información (así lo específica la definición), sin embargo
podemos también observar que este ordenamiento no afecta de manera directa ninguno
de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida Valor Calculado Observaciones
Media 16.6667
Mediana 17 Se requirió el cálculo de la frecuencia
acumulada
Moda 17
Rango 17.5
Medio
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de
17, no se notan cambios en los resultados comparados con los datos originales, sin
embargo las formulas si se ven modificadas.
Agrupados
Recurramos ahora al agrupamiento de los datos discretos del ejercicio que hemos estado
utilizando:
Clase Repeticiones Total de Años de la
clase
12 1 12
14 2 28
15 6 90
16 5 80
17 7 119
18 4 72
19 4 76
23 1 23
Total 30 500
En donde podemos observar la suma de las frecuencias y de los años multiplicados por la
clase que agrupa a los datos coinciden con los datos utilizados cuando no se agruparon en
la sección anterior, utilizando ahora las formulas de la siguiente tabla:
Medida Formula Observaciones
Media Donde xi se refiere a todo y cada
uno de los elementos de la
muestra y n es el número total de
elementos en la muestra y fi se
refiere a la frecuencia de la clase.
Es la posición en donde se
encuentra la mediana.
Se ubica en la tabla el primer valor
Mediana p = (n/2) de frecuencia acumulada mayor a
la posición calculada, si ese valor
es mayor, entonces la mediana es
la clase correspondiente al
mismo. Si el valor es igual a la
posición, entonces se suman el
valor anterior más el valor
obtenido y se divide entre 2.
Moda Se obtiene el valor por
observación de la mayor
frecuencia
Rango (Valor máximo + Valor
Medio Mínimo) / 2
Aplicando, se obtienen los siguientes valores:
Para la media:
12*1+14*2+15*6+16*5+1*7+18*4+19*4+23*1 12+28 +90+ 80+119+72+76+23
X = --------------------------------------------------------- = -----------------------------------------
30 30

_ 500
X = ------------ = 16.6667
30
Para la Mediana, utilizaremos la frecuencia acumulada:

Clase Frecuencia Frecuencia


Acumulada
12 1 1
14 2 3
15 6 9
16 5 14
17 7 21
18 4 27
19 4 29
23 1 30
Total 30

Como n = 30, utilizaremos la posición p = (30/2) = 15, el primer valor mayor a 15


corresponde a la clase 17.

La moda estaría determinada por observación directa, y correspondería al valor 17, que se
presenta hasta 7 veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2
= 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se
obtiene tuvo que ordenar la información (así lo específica la definición), sin embargo
podemos también observar que este ordenamiento no afecta de manera directa ninguno
de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida Valor Calculado Observaciones
Media 16.6667
Mediana 17 Se requirió el cálculo de la frecuencia
acumulada
Moda 17
Rango 17.5
Medio
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de
17, no se notan cambios en los resultados comparados con los datos originales, sin
embargo las formulas si se ven modificadas.
Datos Continuos
No agrupados
Las medidas de tendencia central para datos continuos no agrupados no tienen mayor
significación, ya que el comportamiento es similar al de datos discretos no agrupados, por
ello utilizaremos las mismas formúlas, pero ahora con los datos continuos del ejercicio de
la sección correspondiente:
1.25 1.2 1.28 1.29 1.2 1.24
1.27 1.21 1.32 1.27 1.18 1.29
1.2 1.23 1.25 1.28 1.24 1.28
1.27 1.25 1.24 1.25 1.27 1.28
1.29 1.18 1.21 1.24 1.2 1.23
1.25 1.27 1.28 1.24 1.29 1.21
Aplicando, se obtienen los siguientes valores:
Para la media, aplicando la fórmula de la media para datos no agrupados (vista en la sección
de datos discretos):
_ 1.25 + 1.2 + 1.28+1.29+1.2 + 1.24 + 1.27 + 1.21 + 1.32 + 1.27 + 1.18 + 1.29 + 1.2 + 1.23
+ 1.25 + 1.28 + 1.24 + 1.28 + 1.27 + 1.25 + 1.24 + 1.25 + 1.27 + 1.28 + 1.29 + 1.28 + 1.21 +
1.24 + 1.2 + 1.23 + 1.25 + 1.27 + 1.28 + 1.24 + 1.29 + 1.21
X = ------------------------------------------------------------------------------------------------------------------
30
_ 44.93
X = ------------ = 1.24805556
30

Para la Mediana, como n = 36, es par, utilizaremos la posición p = (36/2) = 18


Por lo que la mediana se encontrará entre los valores que se ubiquen (de manera
ordenada) entre las posiciones 18 y 19 (observa que antes de esa posición hay 17 y después
también hay 17 valores), se encuentran 1.25 y 1.25, por lo que la mediana sería 1.25.

La moda estaría determinada por observación directa, y corresponderían a los valores 1.24,
1.25 y 1.27 que se repiten en la muestra 5 veces, por lo que la característica según la moda
es una muestra trimodal (normalmente se le conoce como multimodal).
El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2
= 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se
tuvo que ordenar la información (así lo específica la definición), sin embargo podemos
también observar que este ordenamiento no afecta de manera directa ninguno de los
cálculos, de esta manera se puede construir la siguiente tabla:
Medida Valor Calculado Observaciones
Media 1.24805556
Mediana 1.25 Se requirió del ordenamiento de los datos
Moda 1.24,1.25, 1.27 Muestra multimodal
Rango 1.25
Medio
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de
1.25.
Agrupados
Retomando los cálculos realizados en la sección correspondiente a organización y
presentación de datos continuos agrupados.
Clases Li Ls Mc F fa fc fr fra frc
I 1.175 1.203 1.189 6 6 30 16.67% 16.67% 83.33%
II 1.213 1.241 1.227 10 16 20 27.78% 44.44% 55.56%
III 1.251 1.279 1.265 10 26 10 27.78% 72.22% 27.78%
IV 1.289 1.317 1.303 9 35 1 25.00% 97.22% 2.78%
V 1.327 1.355 1.341 1 36 0 2.78% 100.00% 0.00%
En ella se pueden observar los límites superiores e inferiores de cada clase, lo que indica
(de no conocer los datos originales) que por ejemplo esos 6 valores de la clase pueden
ubicarse en cualquier valor del rango, pueden ser por ejemplo 1.17, 1.171, 1.20, 1.202,
1.18, 1.1901.
Es decir pueden tomar cualquier valor dentro del rango lo que dificulta tomar estos
parámetros como elementos para el cálculo de las medidas de tendencia central, por ello
se realizó el cálculo de la Mc (Marca de Clase) que en otras palabras es el rango medio de
cada clase, que servirá para el cálculo de la media como lo establecemos en la siguiente
tabla de cálculo para las medidas de tendencia central:
Medida Formula Observaciones
Media Donde Mc se refiere a la marca de
clase de cada clase, n es el número
total de elementos en la muestra y
fi se refiere a la frecuencia de la
clase.
Es la posición en donde se encuentra
la mediana.
Mediana p = (n/2) Se ubica en la tabla el primer valor
de frecuencia acumulada mayor a la
posición calculada.
El valor de la mediana se calcula
tomando la formula del 5to. Decil.
Moda Donde Li es el límite inferior de la
clase que tiene la mayor frecuencia.
fm es la frecuencia modal (aquella
donde se encuentra la
frecuencia mayor)
f(m -1) es la frecuencia anterior a la
frecuencia modal, en caso de
encontrarse en la primera clase, este
valor es cero.
F(m+1) es la frecuencia posterior a la
frecuencia modal, en caso de
encontrarse en la última clase, este
valor es cero.
A es la amplitud de la clase modal.
Rango (Valor máximo + Valor
Medio Mínimo) / 2
Aplicándolas para calcular la media y complementando la tabla anterior:
Clases Li Ls Mc F fa fc fr fra frc Mc * f
I 1.175 1.203 1.189 6 6 30 16.67% 16.67% 83.33% 7.134
II 1.213 1.241 1.227 10 16 20 27.78% 44.44% 55.56% 12.27
III 1.251 1.279 1.265 10 26 10 27.78% 72.22% 27.78% 12.65
IV 1.289 1.317 1.303 9 35 1 25.00% 97.22% 2.78% 11.727
V 1.327 1.355 1.341 1 36 0 2.78% 100.00% 0.00% 1.341
36 45.122
Con fundamento en la tabla podemos entonces obtener:
45.122
Media = ---------------- = 1.253388889
36

Para el cálculo de la mediana, se utiliza la formula del 5to. Decil (puede ser el 50tavo
percentil), para ello determinamos la posición de este estadígrafo, p = (36/10)*5 = 3.6 * 5
= 18.
Con este valor recurrimos a la columna de la frecuencia acumulada y observarmos que el
primer elemento mayor al valor calculado se ubica en la clase III, aplicando la fórmula
obtenemos:
((36/10)*5 – 16) (18 – 16)
Mediana = 1.251 + (----------------------------) * 0.028 = 1.251 + (---------------) * 0.028
10 10

2
Mediana = 1.251 + ( ---------) * 0.028 = 1.251 + (0.2 * 0.028) = 1.251 + 0.0056 = 1.2566
10
La moda se encontraría en las clases II y III, son las que mayores frecuencias manifiestan,
por lo tanto podemos definir que existen una característica de multimodalida en la
muestra, calculemos la primera moda (dejamos como actividad complementaria el cálculo
de la segunda moda).
( 10 – 6) 4
Mo = 1.213 + ( -------------------------) 0.028 = 1.213 + (--------) * 0.028 = 1.213 + 0.028
(2* 10 – 6 – 10) 4
Mo = 1.241

El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2
= 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se
tuvo que ordenar la información (así lo específica la definición), sin embargo podemos
también observar que este ordenamiento no afecta de manera directa ninguno de los
cálculos, de esta manera se puede construir la siguiente tabla:
Medida Valor Calculado Observaciones
Media 1.253388889
Mediana 1.2566 Se requirió del uso de fórmulas del 5to decil,
se pudieron usar las de 50tavo centil.
Moda 1.241 Muestra multimodal, solo se calculó la
primera moda
Rango 1.25
Medio
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de
1.25.
Construyamos una tabla comparativa de resultados de cálculo de estas medidas;
Medida No Agrupados
agrupados
Media 1.24805556 1.253388889
Mediana 1.25 1.2566
Moda 1.24,1.25, 1.241
1.27
Rango 1.25 1.25
Medio
Puede en esta tabla observarse una diferencia marcada en los valores obtenidos por
agrupamiento y no agrupamiento para la media, la mediana y la moda, la última, por
observación en el caso de no agrupamiento nos presenta 3 modas, mientras que en el
agrupamiento, se obtienen 2 modas, la realidad es que el agrupar datos continuos se tiene
una pérdida de valores por la aproximación que se tiene al calcular por ejemplo la marca
de clase como valor representativo medio de la misma.

Después de estos ejercicios que realizamos para la determinación de las medidas de


tendencia central, para datos discretos y continuos tanto agrupados como no agrupados,
realicemos los ejercicios de evaluación de esta sección, para ello baja el documento
correspondiente en la sección de archivador (Ejercicios de Medidas de Tendencia
Central.pdf) , resuelve los ejercicios (de preferencia en Excel o en un software estadístico
(spss, minitab, etc.) posteriormente envíalo a: leonardo.hernandez@gmai.com o sube tus
respuestas en los archivos adjuntos de esta página.

S-ar putea să vă placă și