Documente Academic
Documente Profesional
Documente Cultură
Figura 1. Histograma
y polígonos de
frecuencia de la
humedad de la
semilla de amaranto.
DISTRIBUCIONES DE FRECUENCIAS
RELATIVAS
La frecuencia relativa de una clase es la frecuencia de
la clase dividida por la frecuencia total de todas las
clases y generalmente se expresa como un porcentaje.
Cuadro 2. Frecuencia relativa de la humedad de 25
semillas de amaranto.
Figura 2. Número de
semillas acumuladas para
los diferentes intervalos
de clase
DISTRIBUCIONES DE FRECUENCIAS
ACUMULATIVAS U OJIVAS
Para algunos propósitos es aconsejable considerar una distribución de
frecuencia acumulativa de todos los valores mayores o iguales al
límite de clase inferior real década intervalo de clase. Como
consideramos en este caso las humedades de 7.345 ó mayor, 7.375 % ó
mayor, algunas veces esta distribución acumulativa se llama “ó
mayor” mientras la considerada anteriormente es una distribución
acumulativa “menor que”.
Curva forma de U
Curva bimodal
Curva multimodal
Ejemplos:
Parámetros y estadísticos
MEDIA ARITMÉTICA
La media de un conjunto de N números X1, X2, X3, …, XN se
denota por y se define como:
Si los números X1, X2, X3, …, XK aparecen f1, f2, f3, …,
fK veces respectivamente (es decir, aparecen con
frecuencias f1, f2, f3, …, fK ), la media aritmética es:
Ec. 2
Ec. 6
Donde:
Ej. 15 o 20
n
Datos organizados en tabla
si está en intervalos usar como xi las marcas de clase. Si
no ignorar la columna de intervalos.
Media x
xn i i i
n
Variable fr. fr. ac.
Cuantil de orden α
L0 – L 1 x1 n1 N1 i es el menor intervalo que tiene frecuencia
L1 – L 2 x2 n2 N2 acumulada superior a α ·n
... α=0,5 es mediana
n N i 1
Lk-1 – Lk xk nk Nk C Li 1 ( Li Li 1 )
n ni
MEDIANA
Para los datos agrupados la mediana obtenida por
interpolación está dada por:
Donde:
L1, es el límite de clase real inferior de la clase mediana ( es decir, la
clase que contiene la mediana)
N, es el número de datos observados ( es decir frecuencia total)
MODA
En el caso de datos agrupados donde una curva de frecuencia ha sido construida para ajustarse a los datos, la moda será el
valor (o valores) de X correspondiente al punto máximo (o puntos) de la curva. Este valor de X algunas veces se denota
por .
En una distribución de frecuencia o histograma la moda puede ser obtenida a partir de la ecuación:
Donde:
L1, es el límite de clase real inferior de la clase modal (es decir, que contiene la moda)
Δ1, es el exceso de la frecuencia modal sobre la frecuencia de la clase inferior más
próxima
Δ2, es el exceso de la frecuencia modal sobre la frecuencia de la clase superior más
próxima
c, es el tamaño del intervalo de clase modal.
RELACIÓN EMPÍRICA ENTRE LA MEDIA, LA
MEDIANA Y LA MODA
Para las curvas de frecuencia unimodales que son
moderadamente asimétricas tenemos la relación empírica:
Los valores que dividen los datos en cien partes iguales son
denominados percentiles y son denotados por P1, P2, P3, …, P99.
r xmax xmin
Ejemplo: El recorrido de un conjunto 2, 3, 3, 5, 5, 5, 8, 10 y 12 es 12 – 2 = 10.
RECORRIDO O RANGO
Aunque es una medida muy fácil de calcular, ignora
toda la información de la muestra entre las
observaciones más grande y más pequeña. Sin
embargo, vale la pena resaltar que el rango se utiliza
mucho en aplicaciones estadísticas al control de
calidad, donde lo común es emplear muestras con
tamaños n = 4 o 5, ya que en estos casos la pérdida de
información no se considera relevante.
RECORRIDO O RANGO
En general, se desea una medida de variabilidad que
dependa de todas las observaciones y no sólo de unas
pocas; así que parece razonable medir la variación en
términos de las desviaciones relativas a alguna
medida de localización (generalmente esta medida es
la media)
DESVIACIÓN MEDIA O DESVIACIÓN
PROMEDIO O DESVIACIÓN ABSOLUTA
La desviación media de un conjunto de N números X1, X2,
X3, …, XN se define por:
Donde:
, es el valor absoluto de la desviación de Xj con respecto a (El valor
absoluto de un número es el número sin el signo asociado y se indica por las
dos líneas verticales colocadas junto al número.
Media aritmética = 6
DESVIACIÓN MEDIA O DESVIACIÓN
PROMEDIO O DESVIACIÓN ABSOLUTA
Si X1, X2, X3, …, XK aparecen con frecuencias f1, f2, f3, …,fK
respectivamente, la desviación media puede ser escrita
como:
Donde:
. Esta norma es útil para datos agrupados donde las Xj representan los
puntos medios y las fj son las correspondientes frecuencias de clase.
Ocasionalmente la desviación media se define en términos de
desviaciones absolutas de la mediana o de otro promedio en vez de la
media. Una interesante propiedad de la suma es que es un mínimo
cuando a es la mediana, es decir, la desviación media sobre la mediana es un
mínimo.
EJEMPLO DE DESVIACIÓN MEDIA
=12.99
Ej. 6
RECORRIDO SEMI-INTERCUARTÍLICO O
DESVIACIÓN CUARTÍLICA
La desviación cuartílica de un conjunto de datos se define
por:
EJEMPLO RECORRIDO SEMI-INTERCUARTÍLICO O
DESVIACIÓN CUARTÍLICA
EJEMPLO RECORRIDO SEMI-INTERCUARTÍLICO O
DESVIACIÓN CUARTÍLICA
Ej. 8
Donde: P10 y P90 son los percentiles 10mo y 90mo de los datos (ver Problema 8). El recorrido del semi-percentílico 10-90, ½(P90 – P10), puede emplearse también pero no es comúnmente usado.
RECORRIDO DEL PERCENTIL 10-90
DESVIACIÓN ESTÁNDAR
La desviación estándar de un conjunto de N números X1,
X2, X3, …, XN se denota por s y se calcula como:
Ec. 5
Ec. 6
Donde:
i
( x x ) 2
S2 i 1
n 1
Ej.27
PROPIEDADES DE LA DESVIACIÓN
ESTANDAR
1. La desviación estándar puede ser definida como
Donde a es cualquier promedio además de la media aritmética. De todas
esas desviaciones estándar la mínima es aquella en que , en virtud de la
propiedad (2) de la media. Esta propiedad ofrece una importante razón para
definir la desviación estándar del modo anterior.
VARIABLE ESTANDARIZADA.
PUNTUACIONES ESTANDAR
La variable
Ec. 2
Ec. 5
Ec. 6
Donde . Las ecuaciones (4), (5) y (6) son adecuadas para calcular los
momentos de datos agrupados.
EJEMPLO DE CÁLCULO DE MOMENTOS
Como estudio preliminar a una encuesta de tráfico,
fue necesario recabar cierta información acerca del
número de ocupantes en los automóviles, que
entraban a una población el domingo por la tarde;
para ello se contó el número de ocupantes en 40
automóviles. Los resultados fueron:
1, 3, 2, 2, 3, 1, 1, 2, 2, 1, 1, 4, 3, 1, 3, 2, 3, 2, 2, 2,
1, 2, 5, 1, 3, 1, 2, 1, 3, 1, 4, 1, 1, 3, 4, 2, 2, 1, 1, 4
Calcular los momentos ordinario y central de orden 4
de los datos.
EJEMPLO DE CÁLCULO DE MOMENTOS
Solución: Aplicamos directamente la fórmula para
calcular el momento ordinario
(14
*15) ( 2 4
*12) (3 4
* 8) ( 4 4
* 4 5 4
*1) 2504
X4 62.6
40 40
y sabiendo que la media es 2.1 calculamos el momento
central
2.1 1
Asimetría 0.92 0
1.19
n
(1 / n) ( xi x )3 En otras palabras es la relación
entre el momento de orden 3 y la
g1 i 1
3
desviación estándar
s
n, total de datos
xi, cada dato del conjunto
X media, la media aritmética
s desviación típica o estándar
ASIMETRÍA
Los resultados pueden ser los siguientes:
g1 = 0 (distribución simétrica; existe la misma
concentración de valores a la derecha y a la
izquierda de la media)
g1 > 0 (distribución asimétrica positiva; existe
mayor concentración de valores a la derecha de la
media que a su izquierda)
g1 < 0 (distribución asimétrica negativa; existe
mayor concentración de valores a la izquierda de
la media que a su derecha)
CURTOSIS
La curtosis es el grado de esbeltez de una
distribución, tomado por lo general en relación a una
distribución normal y analiza el grado de
concentración que presentan los datos alrededor de la
zona central de la distribución.
TIPOS DE DISTRIBUCIONES SEGÚN EL
GRADO DE CURTOSIS
Una distribución que tiene un pico relativamente
alto, como la curva de la Figura (a) se llama
leptocúrtica, mientras que la curva de la Figura (b)
que es achatada se llama platicúrtica. La distribución
normal, Figura (c) que no es muy apuntada ni muy
achatada se llama mesocúrtica.
DEFINICIÓN DE LAS DISTRIBUCIONES
SEGÚN EL GRADO DE CURTOSIS
Distribución mesocúrtica: presenta un grado
de concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta
una distribución normal).
Distribución leptocúrtica: presenta un elevado
grado de concentración alrededor de los valores
centrales de la variable.
Distribución platicúrtica: presenta un reducido
grado de concentración alrededor de los valores
centrales de la variable.
COEFICIENTE DE CURTOSIS
Una medida de curtosis usa el cuarto momento con
respecto a la media expresada en forma adimensional y
viene dada por: