Sunteți pe pagina 1din 30

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA

CENTRO UNIVERSITARIO DE ORIENTE


CARRERAS DE INGENIERIA
ESTADISTICA II
MAP Ingeniero Industrial Manuel Eduardo Alvarez Ruiz

Folleto no. 0
MEDIDAS DE TENDENCIA CENTRAL, VARIACIÓN Y FORMA
 La media aritmética o simplemente media es la medida más común de la
tendencia central. La media es la medida más común en la que todos los
valores desempeñan el mismo papel. La media sirve como punto de
equilibrio para un conjunto de datos.
Su forma de expresión a través de fórmula es la siguiente: X = (suma de
los valores) / (número de valores).
 La mediana es el valor que divide en dos partes iguales a un conjunto de
datos ya ordenado. La mediana no se ve afectada por los valores extremos,
de manera que puede utilizarse cuando están presentes. El 50% de los
valores son menores que la mediana y el otro 50% son mayores.
 La moda es el valor del conjunto de datos que aparece con mayor
frecuencia. Al igual que la mediana y a diferencia que la media, los valores
extremos no afectan a la moda.
 Los cuartiles dividen el conjunto de datos en cuatro partes iguales.
 La media geométrica mide la razón de cambio de una variable en el tiempo.
 El rango es la medida numérica descriptiva más sencilla de la variación de un
conjunto, se obtiene al restar el dato mayor del dato menor de una muestra
o población.
 Varianza de una muestra es la suma de las diferencias con respecto a la
media elevada al cuadrado y dividida por el tamaño de la muestra menos
uno. Por el contrario, a la varianza de una población al tamaño no se le
resta uno.

Página 1 de 30
 La desviación estándar de la muestra es la raíz cuadrada de la suma de los
cuadrados de las diferencias con respecto a la media dividida por el tamaño
de la muestra menos uno. Para obtener la desviación estándar de la
población al tamaño no se le resta uno.
 Coeficiente de variación es una medida relativa de la variación que siempre
se expresa como porcentaje, y no en términos de las unidades de datos.
Este mide la dispersión de los datos con respecto a la media. Se obtiene al
dividir la desviación estándar entre la media, todo multiplicado por 100%.
 Forma es una propiedad que describe a un conjunto de datos numéricos de
acuerdo a la forma de la curva que dibujan en un plano. La forma es el
patrón de distribución de los valores de los datos a través del rango de todos
los valores. La forma es simétrica cuando los valores pequeños y grandes se
equilibran entre sí y puede ser asimétrica cuando existe un desequilibrio
entre los valores pequeños y grandes.
o Media < mediana, asimétrica negativa o sesgo izquierdo.
o Media = mediana, simétrica o asimetría cero.
o Media > mediana, asimétrica positiva o sesgo derecho.

MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS

Una descripción más completa de un conjunto de datos se obtiene si se logra medir qué
tan dispersos se encuentran estos, tomando como referencia su punto central. Esto se
logra a partir de varias medidas cuya finalidad es describir la dispersión o variabilidad
de los datos alrededor de dicho punto.

Las medidas de dispersión permiten evaluar la confiabilidad del promedio de un


conjunto de datos, y en su caso, hacer comparaciones entre conjuntos. Una dispersión

Página 2 de 30
pequeña, señala que los datos se encuentran cercanamente agrupados alrededor de su
media, en cuyo caso, se considera esta bastante representativa del conjunto de datos.
Lo contrario también es valido.

AMPLITUD
Es la medida de dispersión más sencilla y menos útil, pues solo se basa en dos valores
del conjunto de datos, ignorando el resto, no es mas que la diferencia entre el valor
mayor y menor.
Rango o Amplitud total = valor mayor – valor menor

Ejemplo: el Banco Agromercantil para los clientes clase B, para el último semestre de
2003, concedió las siguientes tasas de interés en sus de cuentas de ahorro a plazo fijo:

Monto Tasa
Q 450,000.00 8.150%
Q 500,000.00 8.375%
Q 550,000.00 8.760%
Q 600,000.00 8.790%
Q 650,000.00 9.020%
Q 700,000.00 9.290%
Q 750,000.00 10.300%
Q 800,000.00 14.000%
Q 850,000.00 15.000%
Q 900,000.00 15.250%
Q 950,000.00 15.625%
Q 1,000,000.00 16.125%

Amplitud = 16.125% - 8.150% = 7.975%

Desviación media

Página 3 de 30
Es el promedio de las diferencias absolutas de los valores de un conjunto de datos con
respecto con su media, lo cual es necesario tomar en cuenta, puesto que las
desviaciones positivas y negativas sumarian cero.

También es conocida como desviación promedio o desviación absoluta media. Su


fórmula es la siguiente:

DM 
XX
n

En donde:

X Es el valor de cada observación


X Es la media aritmética del conjunto de datos
n Es el número de observaciones de la muestra
Símbolo que indica que se debe tomar en cuenta el valor absoluto de las
diferencias entre los datos con su media

Ejemplo: los pesos en libras, de una muestra de alumnos de quinto año primaria son:
103, 97, 101, 106 y 103. ¿Cuál es la desviación media?, ¿cómo la interpreta?

Núm e ro P e sos X - X m
DM 
 XX
1 103 1
2 97 5
n
3 101 1
4 106 4 DM = 2.4 lbs
5 103 1
Tota le s 510 12
M e dia 102

Ejemplo: se realizo un estudio de mercado por una conocida marca de galletas, un


grupo de niños entre los 13 y 16 años calificaron una galleta en una escala de 1 a 50.
Sus calificaciones fueron: 34, 35, 41, 28, 26, 29, 32, 36, 38 y 40.

Página 4 de 30
a) ¿Cuál es la amplitud de las calificaciones?
b) ¿Cuál es su media aritmética?
c) ¿Cuál es su desviación media e interprete este resultado?
d) Un segundo grupo de niños comprendidos en las mismas edades calificó el
mismo producto. La amplitud total fue 8, la media 33.90 y la desviación media
de 1.90. Compare la dispersión en estas calificaciones con la del primer grupo
de expertos.

N ú m e r o C a l i fi c a c i ó n X - X m
1 26 7 .9 DM 
 X  X
2 28 5 .9 n
3 29 4 .9
4 32 1 .9 D M = 4 .1 2 p ts
5 34 0 .1
6 35 1 .1 A m p l i tu d = 15
7 36 2 .1
8 38 4 .1
9 40 6 .1
10 41 7 .1
T o ta l e s 339 4 1 .2
M e d ia 3 3 .9

Pese a que la media es idéntica, 33.90 = 33.90, pero en lo que respecta a las medidas de
variabilidad, la amplitud 15  8 y la desviación media 4.12  1.90, se concluye que la
dispersión en el primer grupo es mayor.

Ejemplo: una muestra de los archivos personales de ocho empleados de Mini Despensa
El Oasis indicó que durante un periodo de seis meses, no asistieron el siguiente número
de días por enfermedad: 2, 0, 6, 3, 10, 4, 1 y 2.

a) ¿Cuál es la amplitud de las inasistencias?


b) ¿Cuál es la media aritmética?

Página 5 de 30
c) ¿Cuál es la desviación media? Interprete su resultado
d) Una muestra de los archivos personales de empleadas reveló que faltaron en
promedio 3.48 días durante el mismo periodo de seis meses, debido a la
enfermedad. Se calculó la amplitud como 10 y la desviación media como 2.381.
Compare los dos grupos.

N ú m e ro C a lific a c ió n X - X m
1 0 3.5 DM 
 X  X
2 1 2.5 n
3 2 1.5
4 2 1.5 DM = 2.3 75 pts
5 3 0.5
6 4 0.5 A m p litu d = 10
7 6 2.5
8 10 6.5
T o ta le s 28 1 9.0
M e d ia 3.5

Las medias son 3.50 y 3.48 respectivamente, la amplitud 10 = 10, y por último la
desviación media 2.375 y 2.381, lo cual permite concluir que no existen diferencias
significativas entre las medias y las medidas de variabilidad, es decir, no existen
diferencias significativas entre las distribuciones.

VARIANZA Y DESVIACIÓN ESTÁNDAR DE UNA POBLACIÓN


La varianza o variancia y la desviación estándar son medidas de dispersión más útiles
que las anteriores, indican cuánto se dispersan las observaciones alrededor de su
media. Por corresponder a valores de una población se le conocen como parámetros.

Página 6 de 30
La varianza se define como el promedio de las diferencias de las observaciones respecto
a su media elevadas al cuadrado. Es de hacer notar que la fórmula de la varianza
poblacional no es igual a la varianza muestral, su fórmula es la siguiente:

  X  
2

 2

N

En donde:
2 La letra griega sigma minúscula elevada al cuadrado es el símbolo que se
utiliza para representar la varianza de una población
X Es el valor de la observación en la población
 Es la media de la población
N Es el número total de observaciones en la población.

Es importante resaltar que debido a que se está trabajando con una población, la media
es “  ”y no “ X ”, y el número de observaciones es “N” y no “n”, como en el caso de las
muestras.

Otra fórmula con la cual se obtiene el mismo resultado es la siguiente:

X X
2
2

2   
N  N 
 

La desviación estándar para las poblaciones se define como la raíz cuadrada de la


varianza, es la medida de dispersión más utilizada por ser de más fácil comprensión,
esto se debe a que la varianza se expresa en unidades al cuadrado, la desviación
estándar no. Como formula se puede escribir de las siguientes maneras:

Página 7 de 30
 X   X X
2 2
2

  2
   
N N  N 
 

  2

Ejemplo: las edades de los trabajadores de una oficina contable son las siguientes: 38,
26, 13, 41 y 22 años. ¿Cuál es la varianza y la desviación estándar?

 X   
2
Número Edad X - sigma (X - sigma)2 X - sigma
1 13 -15.00 225 15  2

2 22 -6.00 36 6
N
3 26 -2.00 4 2 = 106.8
4 38 10.00 100 10
5 41 13.00 169 13  
Totales 140.00 0.00 534.00 46.00
Media 28.00 = 10.33
Amplitud 28.00
DM 9.20

Utilizando la otra formula obtenemos el mismo resultado:

X X
2
2

 2
  
N  N 
 

2 
 38 2   26 2  13 2   41 2   22 2  38  26  13  41  22 

2
4454  140 
2

     106.8
5  5  5  5 

Ejemplo: En valor en quetzales de cinco diferentes modelos de bolsones escolares es el


siguiente: 110, 145, 125, 95 y 150. ¿Cuál es la varianza y la desviación estándar de la
población?

Página 8 de 30
 X  
2
Número Precio X - sigma (X - sigma)2 X - sigma
1 Q 95.00 -30.00 900 30  2

2 Q 110.00 -15.00 225 15
N
3 Q 125.00 0.00 0 0 = 430
4 Q 145.00 20.00 400 20
5 Q 150.00 25.00 625 25  
Totales 625.00 0.00 2150.00 90.00
Media 125.00 = 20.74
Amplitud 55.00
DM 18.00

Ejemplo: usted es el administrador de Almacén “La Nueva”, la dueña se encuentra


interesada en las tasas de rendimiento a plazo fijo por seis meses, del Banco
Reformador e Industrial. La tasa de interés del Banco Reformador para los últimos
cinco años fueron 12, 10, 13, 9 y 11%, mientras que la del Banco Industrial: 13, 12, 14,
10 y 6%. ¿Cuál sería su consejo?

Para el Banco Reformador tenemos:

 X  
2
Número Porcentaje X - sigma (X - sigma)2 X - sigma
1 9 -2.00 4 2 2 
2 10 -1.00 1 1
N
3 11 0.00 0 0 =2
4 12 1.00 1 1
5 13 2.00 4 2  
Totales 55.00 0.00 10.00 6.00
Media 11.00 = 1.41
Amplitud 4.00
DM 1.20

Por último, para el Banco Industrial:

Página 9 de 30
 X  
2
Número Porcentaje X - sigma (X - sigma)2 X - sigma
1 6 -5.00 25 5  2

2 10 -1.00 1 1
N
3 12 1.00 1 1 =8
4 13 2.00 4 2
5 14 3.00 9 3  
Totales 55.00 0.00 40.00 12.00
Media 11.00 = 2.83
Amplitud 8.00
DM 2.40

Debido a que la media para ambos conjuntos de tasas de interés es la misma, se debe
escoger como opción más segura las tasas de interés del Banco Reformador, porque la
variabilidad de sus tasas es menor, de acuerdo a la comparación que se puede hacer
entre estas medidas de dispersión y la tasa de rendimiento que ofrecen ambos bancos.

Ejemplo: de acuerdo con el informe anual de Bic de Guatemala, S.A., los ingresos
anuales en dólares de los cinco subgerentes de división son: $ 75,000.00, $ 78,000.00, $
72,000.00, $ 83,000.00 y $ 90,000.00. Determine:
a) ¿Cuál es la amplitud total?
b) ¿Cuál es la media aritmética?
c) ¿Cuál es la varianza poblacional y la desviación estándar?
d) Los subgerentes de división de Bic de Guatemala tuvieron acceso a un informe,
donde se detallaban los ingresos anuales de los cinco subgerentes de Bic de
Honduras. Después de procesar los datos, se pudo determinar que:  = $
79,000.00 y  = $ 8,612.00. Compare e interprete las medias y las dispersiones
entre los sueldos de los subgerentes de las divisiones de Bic de Guatemala y
Honduras.

Página 10 de 30
 X  
2
Número Ingreso X - sigma (X - sigma)2 X - sigma
1 $75,000.00 -4600.00 21160000 $4,600.00  2

2 $78,000.00 -1600.00 2560000 $1,600.00
N
3 $72,000.00 -7600.00 57760000 $7,600.00 = 40240000.00
4 $83,000.00 3400.00 11560000 $3,400.00
5 $90,000.00 10400.00 108160000 $10,400.00  
Totales $398,000.00 0.00 201200000.00 $27,600.00
Media $79,600.00 = $6,343.50
Amplitud $15,000.00
DM $5,520.00

Para Bic de Guatemala:


 = $ 79,600.00
 = $ 8,343.50

Para Bic de Honduras:


 = $ 79,000.00
 = $ 8,612.00

De acuerdo a los datos se logró establecer que el ingreso medio de los cinco
subgerentes de división es $ 600.00 más alto para Bic de Guatemala, y su dispersión es
menor. Por lo que se puede concluir que de manera general se encuentran mejor
remunerados.

VARIANZA Y DESVIACIÓN ESTÁNDAR DE UNA MUESTRA


No es común que se calculen parámetros, puesto que muchas veces no es viable
hacerlo, por lo común se estimarán a través de una muestra, que es utilizada para
calcular los estadísticos o estimadores correspondientes.

Página 11 de 30
Se calculan de manera parecida a los parámetros de una población, con una pequeña
modificación en el denominador, puesto que en lugar de sustituir “n” (número de datos
en la muestra) por “N” (número de datos en la población), se sustituye por n – 1, con lo
cual la fórmula de la variancia muestral utilizada como estimador de la varianza
poblacional es:

X  X 
2

s 2

n 1

En donde:
s2 Es el símbolo empleado para representar la varianza muestral.
X Es el valor de la observación en la muestra
X Es la media de la muestra
n Es el número de observaciones en la muestra

La razón de esta sustitución es porque al trabajar con muestras se tiene n – 1 grados de


libertad (gl: = n – 1). En estadística el número de grados de libertad se define como el
número de observaciones menos toda restricción impuesta a dichas observaciones.

Es de resaltar que la media de la fórmula ya no se expresa como  , por corresponder


esta media a una media poblacional, en su lugar se utiliza X pues se está trabajando
con muestras, y este es el símbolo para referirse a una media muestral.

Si convertimos la fórmula más directa para la varianza poblacional  2 a la varianza


muestral s 2 , tenemos que:

 X  2

X 2

n
s2 
n 1

Página 12 de 30
Ejemplo: el sueldo por hora de los trabajadores temporales en la Supertienda Paiz de
Chiquimula, es el siguiente: Q 7.85, Q 10.00, Q 8.00, Q 9.00 y Q 7.95. ¿Cuál es la
varianza muestral?

 X  X 
2
Número Ingreso X - sigma (X - sigma)2 X - sigma s 2

1 Q 7.85 -0.71 0.5041 Q 0.71 n 1
2 Q 7.95 -0.61 0.3721 Q 0.61
3 Q 8.00 -0.56 0.3136 Q 0.56 = 0.86
4 Q 9.00 0.44 0.1936 Q 0.44
5 Q 10.00 1.44 2.0736 Q 1.44  
Totales Q 42.80 0.00 3.46 Q 3.76
Media Q 8.56 = Q 0.93
Amplitud Q 2.15
DM Q 0.75

LA DESVIACIÓN ESTANDAR MUESTRAL


Esta se utiliza como un estimador de la desviación estándar de la población. Al igual
que la desviación estándar de una población es la raíz cuadrada de la varianza
poblacional, la desviación estándar muestral es la raíz cuadrada de la varianza muestral.
Su fórmula se expresa de la siguiente manera:

s
 (X  X ) 2

n 1

En su caso, también es posible utilizar la siguiente fórmula:

 X  2

X 2

n
s
n 1

Página 13 de 30
Ejemplo: las producciones por hora de un grupo de empleados que ensamblan aparatos
eléctricos se seleccionaron al azar. Las producciones de la muestra fueron: 8, 9, 8, 10, 9,
10, 12 y 10. ¿Cuál es la desviación estándar de la muestra?

X  X 
2
Número Producción X - sigma (X - sigma)2 X - sigma
1 8.00 -1.50 2.25 1.50 s 2

2 8.00 -1.50 2.25 1.50
n 1
3 9.00 -0.50 0.25 0.50
4 9.00 -0.50 0.25 0.50 = 1.71
5 10.00 0.50 0.25 0.50
6 10.00 0.50 0.25 0.50
7 10.00 0.50 0.25 0.50
8 12.00 2.50 6.25 2.50  
Totales 76.00 0.00 12.00 8.00
Media 9.50 = 1.31
Amplitud 4.00
DM 1.00

Ejemplo: las edades de una muestra de turistas canadienses que vuelan a Hong Kong
fueron: 32, 21, 60, 47, 54, 17, 72, 55, 33 y 41. ¿Cuál es la desviación estándar de la
muestra?

 X  2
Nú m e ro Ed a d X - sig m a (X - sig m a )2 X - sig m a  X
1 17.00 -26.20 686.44 26.20 s 2

2 21.00 -22.20 492.84 22.20
n 1
3 32.00 -11.20 125.44 11.20
4 33.00 -10.20 104.04 10.20 = 310.62
5 41.00 -2.20 4.84 2.20
6 47.00 3.80 14.44 3.80
7 54.00 10.80 116.64 10.80
8 55.00 11.80 139.24 11.80
9 60.00 16.80 282.24 16.80
10 72.00 28.80 829.44 28.80   
T o ta le s 432.00 0.00 2795.60 144.00
M e d ia 43.20 = 17.62
Am p litu d 55.00
DM 14.40

Página 14 de 30
Ejemplo: la Rainbow Trout, Inc., alimenta truchas pequeñas en estanques especiales y
las vende cuando llegan a cierto peso. Se aisló una muestra de 10 truchas en un
estanque y se les alimentó con una mezcla especial denominada Grow Em Fast. Al final
del experimento los pesos de las truchas fueron (en gramos): 124, 125, 125, 123, 120,
124, 127, 125, 126 y 121.
a) ¿Cuál es la amplitud total de la muestra?
b) ¿Cuál es la media aritmética?
c) ¿Cuál es la varianza muestral?
d) ¿Cuál es la desviación estándar de la muestra?
e) Se utilizó otra mezcla especial, Fatso, en otro estanque. Se calculó la media de
una muestra como 126.9 gramos y la desviación estándar como 1.2 gramos.
¿Qué alimento da como resultado un peso más uniforme?

 X  X
2
Núm e ro Gra m os X - sigm a (X - sigm a )2 X - sigm a
1 120.00 -4.00 16.00 4.00 s 2

n 1
2 121.00 -3.00 9.00 3.00
3 123.00 -1.00 1.00 1.00
4 124.00 0.00 0.00 0.00 = 4.67
5 124.00 0.00 0.00 0.00
6 125.00 1.00 1.00 1.00
7 125.00 1.00 1.00 1.00
8 125.00 1.00 1.00 1.00
9 126.00 2.00 4.00 2.00
10 127.00 3.00 9.00 3.00   
Tota le s 1240.00 0.00 42.00 16.00
M e dia 124.00 = 2.16
Am plitud 7.00
DM 1.60

De acuerdo a la evidencia estadística, el alimento que da como resultado un peso más


uniforme es Fatso.

Página 15 de 30
INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR
La desviación estándar se utiliza para ayudar a describir un conjunto de datos midiendo
el grado de dispersión de las observaciones individuales alrededor de la media. Esto
permite que se pueda emplear para comparar la dispersión en dos o más conjuntos de
observaciones.

Además de estos usos, tiene dos aplicaciones más, la primera en el teorema de


Chebyshev y la segunda en la regla empírica.

TEOREMA DE CHEBYSHEV
Este teorema conocido también como teorema de Tchebysheff, fue formulado por el
matemático ruso P. L. Chebyshev (1821 – 1894). Establece que, para todo conjunto de
datos, independientemente de su forma,
el porcentaje de valores que se encuentra a una distancia de k desviaciones estándar o

 1 
menos de la media, debe ser por lo menos igual a 1  2 100%  de las observaciones
 k 
están dentro de k desviaciones estándar de la media, en donde k es cualquier número
mayor que 1.
 1 
Regla de Chebyshev = 1  2 100% 
 k 
La regla de Chebyshev es muy general y se aplica a cualquier tipo de distribución. La
regla señala por lo menos el porcentaje de valores que quedan dentro de una distancia
dada de la media. Sin embargo, entre más se aproxime la forma del conjunto de datos
a una distribución normal, la regla empírica reflejará con mayor precisión la mayor
concentración de datos cerca de la media.

Página 16 de 30
Sobre la base del teorema de Chebyshev es posible determinar que al menos el 75% de
los datos se encuentra entre la media más dos veces la desviación estándar y la media
menos dos veces la desviación estándar.

Ejemplo: la cantidad media quincenal depositada por los empleados de una empresa en
el plan de participación de utilidades fue de Q 51.04 y se obtuvo una desviación
estándar de Q 7.51. Al menos:

a) ¿qué porcentaje de las contribuciones se encuentran a una distancia de más dos


desviaciones estándares y menos dos desviaciones estándares de la media?

Utilizando el teorema de Chebyshev tenemos que:


1 1 1
1 2
 1  2  1   75.00%
K 2 4

b) ¿qué porcentaje de las contribuciones al plan se encuentran a una distancia de


tres desviaciones estándares de la media?
1 1 1
1 2
 1  2  1   88.89%
K 3 9

Ejemplo: un estudio previo en una aerolínea reveló una media de 78.70 pasajeros por
día, con una desviación estándar de 12.14. Para programar los tiempos para una nueva
ruta que abrió la aerolínea, la gerencia desea saber con qué frecuencia los pasajeros
están dentro de dos desviaciones estándar de la media, y cuál es dicho intervalo.

Página 17 de 30
Si se transportan dos desviaciones estándar (2 x 12.14 = 24.28) por encima y por debajo
de la media de 78.70, se tendrá un intervalo inferior de 54.42 (78.70 – 24.28 = 54.42) y
un intervalo superior de 102.98 pasajeros (78.70 + 24.28 = 102.98). Pudiéndose estar
seguro de que por lo menos el 75.00% del tiempo el número de pasajeros estuvo entre
54.42 y 102.98.
1 1 1
1 2
 1  2  1   75.00%
K 2 4

Ejemplo 3.7. Webster, Allen L. Estadística aplicada a los negocios y la economía.


Colombia: Editorial McGraw Hill. Tercera edición. 2002.
Una empresa de transporte de pasajeros reveló una media de 78.70 por día con una
desviación estándar de 12.14. Para programar los tiempos para una nueva ruta, la
gerencia desea saber con qué frecuencia (porcentaje) los pasajeros están dentro de dos
desviaciones estándar de la media y cuál es dicho intervalo.

 1   1 
Regla de Chebyshev = 1  2 100%  = 1  2 100%  = 75.00%
 k   2 
Límite del intervalo superior = (78.7) – (2)(12.14) = 102.98
Límite del intervalo inferior = (78.7) + (2)(12.14) = 54.42

DISTRIBUCIÓN NORMAL Y LA REGLA EMPÍRICA


En el caso de que la curva de distribución sea normal, se puede ser más preciso al
momento explicar la dispersión en esta. Estas conclusiones relacionadas con la media y
la desviación estándar se incluyen en el enunciado conocido como regla empírica o
normal. Una curva normal o distribución normal es una distribución de datos continuos
(no discretos) que produce una curva simétrica en forma de campana, es decir, la mitad

Página 18 de 30
de las observaciones está por encima de la media y la mitad está por debajo. Esto
significa que la mitad del área que está bajo la curva está a la izquierda de la media y la
otra mitad del área que está debajo de la curva está a la derecha de la media.

En la mayoría de conjunto de datos, los valores tienden a agruparse cerca de la media.


Si los datos tienen simetría con respecto a su agrupamiento cercano a la media, y
además la media coincide con la mediana, la distribución tiene forma de campana.

En la distribución de esta clase y de acuerdo a la regla empírica, tenemos:


 Aproximadamente el 68% de los valores se encuentra a una distancia de  1
desviación estándar de la media.
 Aproximadamente el 95% de los valores se encuentra a una distancia de  2
desviaciones estándar de la media.
 Aproximadamente el 99.7 % de los valores se encuentra a una distancia de  3
desviaciones estándar de la media.

Ejemplo: una muestra de las cantidades mensuales (en dólares) destinadas a alimentos
por familias de cuatro personas que reciben vales alimentarios, sigue aproximadamente
una distribución de frecuencias simétrica de campana.

La media muestral es $ 150.00 y la desviación estándar es $ 20.00. Utilizando la regla


empírica:
a) Aproximadamente, ¿entre cuáles dos cantidades está el 68% de los gastos
mensuales de alimentos?
El 68% de los datos se encuentra entre: X  1s = $150.00  1($20.00) =
$130.00 y $170.00.

Página 19 de 30
b) Aproximadamente, ¿entre cuáles dos cantidades está el 95% de los gastos
mensuales de alimentos?
El 95% de los datos se encuentra entre: X  2s = $150.00  2($20.00) =
$110.00 y $190.00.
c) Aproximadamente, ¿entre cuáles dos cantidades están todos los gastos
mensuales?
El 99.70% de los datos se encuentra entre: X  3s = $150.00  3($20.00) =
$90.00 y $210.00.

Ejemplo 3.12: la cantidad de llenado de una población integrada por 12 latas de


gaseosa es de 12.06 onzas con una desviación estándar de 0.02. También se sabe que
esta población tiene forma de campana. Describa la distribución de la cantidad de
llenado de latas. ¿Existe una gran probabilidad de que una lata tenga menos de 12
onzas de gaseosas?
 Para el 68.00% de los datos:   1  = 12.06  1(0.02) = (12.04, 12.08)
 Para el 95.00% de los datos:   2  = 12.06  2(0.02) = (12.02, 12.10)
 Para el 99.70% de los datos:   3  = 12.06  3(0.02) = (12.00, 12.12)

La probabilidad de que la lata tenga menos de 12 onzas es (1 – 0.9970)/2 = 0.0015.

Ejemplo: utilizando el teorema de Chebyshev, ¿al menos qué porcentaje de cualquier


conjunto de observaciones se encontrará a 1.80 desviaciones estándares de la media?

1 1 1
1 2
1 2
1  69.13%
K 1.80 3.24

Página 20 de 30
Ejemplo: la distribución de los pesos de una muestra de 1,400 contenedores para carga
marítima sigue aproximadamente una distribución normal. Con base en la regla
empírica, ¿qué porcentaje de los pesos se encontrará:

a) ¿entre X - 2s y X + 2s?
El 95.5%.

b) ¿entre X y X + 2s? Por debajo de X - 2s?


Entre X y X + 2s se encuentra el 47.5%.
Por debajo de X - 2s se encuentra el 2.5%.

SESGO
Una distribución simétrica si tiene la misma forma con respecto del eje central, para
ello es necesario que la moda, la mediana y la media estén localizadas en el centro de la
distribución, es decir, sean iguales. Tal y como lo muestra la figura:

Media = mediana, simétrica o asimetría cero.

Si una distribución no es normal, es asimétrica o sesgada. Puede estar sesgada a la


izquierda o a la derecha.

Página 21 de 30
Sesgada a la derecha Sesgada a la izquierda
Distribución asimétrica positiva Distribución asimétrica negativa
Ejemplo: moda = 200, mediana = 450 y media = 600. Ejemplo: moda = 600, mediana = 450 y media = 200.
Media > mediana, asimétrica positiva o sesgo Media < mediana, asimétrica negativa o sesgo
derecho. izquierdo.

Una distribución sesgada a la derecha o con asimetría positiva, la media aritmética es el


mayor de los tres promedios, seguido de la mediana. En este caso la media se ve
afectada por valores altos. Pero en el caso de una distribución con asimetría negativa o
sesgada a la izquierda, sucede lo inverso, es decir, la media es la menor de los tres
promedios, porque se ve afectada por valores bajos.

La denominación de sesgo positivo o negativo, se hace con respecto a la cola, es decir, si


la cola está a la derecha de la distribución se dice que es un sesgo a la derecha o
positivo. En caso contrario, si la cola se encuentra a la izquierda de la distribución, es
un sesgo negativo o la izquierda.

El sesgo se puede medir mediante el coeficiente de sesgo de Pearson:


Coeficiente de sesgo de Pearson: 3 X  mediana 
P
s

Este se interpreta de la siguiente manera: si P  0, los datos están sesgados a la


izquierda, si P  0, entonces se encuentran sesgados a la derecha, si P = 0, estamos ante
una distribución normal.

Página 22 de 30
Ejemplo: si X = 78.70, s = 12.14 y la mediana = 78.33, establezca hacia donde es el
sesgo y su grado.

El sesgo es hacia la derecha, y su grado de variación se establece mediante el


coeficiente de sesgo de Pearson de la siguiente manera:
3 78.70  78.33
P  0.03
12.14

COEFICIENTE DE VARIACIÓN
Las medidas de dispersión, así como tienen utilidad, tienen sus limitaciones, por
ejemplo, cuando se consideran dos o más distribuciones, especialmente cuando se
encuentran medidas en unidades distintas que no tienen equivalencias o aunque estén
en las mismas unidades, pero con medias muy distintas, lo que no facilita el hacer
comparaciones con el fin de obtener conclusiones relacionadas con la dispersión.

En estos casos es conveniente utilizar el coeficiente de variación, pues este es una


medida relativa de dispersión expresada en forma de porcentaje. Este coeficiente
establece el grado de dispersión de un conjunto de datos con respecto a su media,
siendo su formula la siguiente:
s
CV  (100)
X

Ejemplo: un estudio de las calificaciones obtenidas en el curso de métodos cuantitativos


II y la edad de los estudiantes, dio como resultados estas estadísticas: la calificación

Página 23 de 30
media fue 80, la desviación estándar de 15. Le media de la edad fue 20 años, y su
desviación estándar de 2 años. Compare la dispersión relativa de las dos distribuciones
empleando el coeficiente de variación.

Para las calificaciones:


s 15
CV  (100)  (100)  18.75%
X 80
La desviación estándar es el 18.75% de la media.

Para la edad:
s 2
CV  (100)  (100)  10.00%
X 20
En este caso, la desviación estándar es el 10.00% de su respectiva media.

Como se puede apreciar existe más dispersión relativa en la distribución relacionada


con las calificaciones, en comparación con la distribución relacionada con la edad.

Ejemplo: una aerolínea reporta una media de 78.70 pasajeros por día, con una
desviación estándar de 12.14 pasajeros. Para el mismo período de tiempo se reportan
un promedio de millas de vuelo de 1,267.50 con una desviación estándar de 152.70. Se
desea saber si estos conjuntos de datos presentan una variación mayor.

Para los pasajeros:


s 12.14
CV  (100)  (100)  15.43%
X 78.70

Para las millas:

Página 24 de 30
s 152.70
CV  (100)  (100)  12.05%
X 1267.50

La variación de la distribución relacionada con las millas es menor que la relacionada


con los pasajeros.

Ejemplo: un conjunto de datos sobre el peso del contenido de 1000 bolsas de comida
para perros marca Puppy Chow tiene una media de 50 libras y una desviación estándar
de 2.3 libras. No se sabe si los datos están distribuidos normalmente. Los fabricantes
de Puppy Chow esperan que por lo menos 750 de tales bolsas pesen entre 45.4 y 54.6
libras. ¿Qué seguridad puede darles?

Repuesta: como no se sabe si los datos están distribuidos normalmente se utiliza para la
solución el teorema de Chebyshev.
1 1
Teorema de Chebyshev = 1  2
 1  2  0.75
k 2

De acuerdo al teorema de Chebyshev, se tiene una seguridad del 75.00%.

Ejemplo: un conjunto de datos distribuidos normalmente tiene una media de 5,000 y


una desviación de 450. ¿Qué porcentaje de las observaciones están?

a) ¿Entre 4,550 y 5,450?


El 68.30% de los datos.

b) ¿Entre 4,100 y 5,900?


El 95.50% de los datos.

Página 25 de 30
c) ¿Entre 3,650 y 6,350?
El 99.70% de los datos

d) ¿Por encima de 6,350?


1  0.9970
Repuesta:  0.0015
2
Se divide entre dos para obtener el porcentaje de datos que está en ese extremo
de la cola.

e) ¿Por debajo de 4,550?


1  0.9970
Repuesta:  0.0015
2
Se divide entre dos para obtener el porcentaje de datos que está en ese extremo
de la cola.

Nota: la resolución de este problema se hace de acuerdo a lo establecido por la regla


empírica.

Ejemplo: Shard Lumbre corta troncos a una longitud media de 20 pies, con una
desviación estándar de 3.50 pies. Si los cortes están distribuidos normalmente, qué
porcentaje de troncos tiene menos de:

a) ¿16.50 pies?
1  0.6830
Repuesta:  0.1585
2

b) ¿13.00 pies?

Página 26 de 30
1  95.5
Repuesta:  0.0225
2

Ejemplo: datos sobre las edades de los 100 mejores ejecutivos de las mejores 500
firmas de la revista Fortune revelan una edad media de 56.20 años y una desviación
estándar de 12.70 años. Su ingreso medio es $ 89,432.00, con s = $ 16,097.00. ¿Cuál
variable, edad o ingreso, presenta mayor variación?

Variación con respecto a la edad:


s 12.70
CV  (100)  (100)  22.60%
X 56.20

Variación con respecto al ingreso:


s $16,097.00
CV  (100)  (100)  18.00%
X $89,432.00

La variable que presenta mayor variación es la edad.

Ejemplo: el analista de investigación para la empresa de corretaje de acciones Sidde


Financial desea comparar la dispersión de las razones precio–rendimiento para un
grupo de acciones comunes con la distribución de su pago sobre la inversión. Para las
razones precio-rendimiento la media es 10.90 y la desviación estándar 1.80. El
rendimiento medio sobre inversión es 25.00% y la desviación 5.20%

a) ¿Por qué debe utilizarse el coeficiente de variación para comparar la dispersión?


Porque en este caso se trata de unidades diferentes que se van a comparar.

Página 27 de 30
b) ¿Compare la dispersión relativa para las razones precio-rendimiento y el
rendimiento sobre la inversión?

Porcentaje de variabilidad para el precio


s 1.80
CV  (100)  (100)  16.51%
X 10.90

Porcentaje de variabilidad para el rendimiento


s 5.20
CV  (100)  (100)  20.80%
X 25.00

Presenta mayor variabilidad el rendimiento en relación con el precio de las


acciones.

Ejemplo: se van a comparar la variabilidad en los precios anuales de las acciones que se
venden a menos de $ 10.00 y la dispersión en los precios de aquellas que se venden por
arriba de $ 60.00. El precio medio de las acciones que se venden a menos de $ 10.00 es
$ 5.25, y la desviación, $ 1.52. El precio medio de las acciones que se venden a más de
$ 60.00 es $ 92.50, y la desviación estándar, $ 5.28.

a) ¿Por qué debe utilizarse el coeficiente de variación para comparar la dispersión?


Porque, aunque las dimensionales son iguales, las medias presentan una
diferencia sustancial.

b) ¿Calcule el coeficiente de variación y explique cualquier diferencia?

Página 28 de 30
Porcentaje de variabilidad para el precio de las acciones que se venden a menos
de $ 10.00
s 1.52
CV  (100)  (100)  28.95%
X 5.25

Porcentaje de variabilidad para el precio de las acciones que se venden a más de


$60.00.
s 5.28
CV  (100)  (100)  5.52%
X 95.50

La variabilidad del precio de las acciones que se venden arriba de los $ 60.00 es
mucho menor que la variabilidad de las acciones que se venden a menos de $
10.00.

Ejemplo: diez salones de primer año de primaria de una muestra de escuelas públicas
de la cabecera municipal de Chiquimula tienen la siguiente cantidad de alumnos cada
uno: 47, 52, 69, 72, 112, 36, 28, 68, 69 y 41. Suponga que el supervisor municipal de
educación desea evaluar estos datos con base en sus medidas de tendencia central y de
dispersión. Establezca cual es la media, la variancia y la desviación estándar.

X 
 Xi  594  59.40
n 10

  Xi  X 
2
5264.40
s 2
   584.93
n 1 9

s s2  584.93  24.185

BIBLIOGRAFÍA
1) Webster, Allen L. Estadística aplicada a los negocios y la economía. Colombia:
editorial Irwin McGraw – Hill. Tercera edición. 2002.

Página 29 de 30
2) Mason, Robert D. y Lind, Douglas A. Estadística para administración y economía.
México: editorial Alfaomega. Séptima edición. 1992.

Página 30 de 30

S-ar putea să vă placă și