Sunteți pe pagina 1din 36

Lectura 6

MEDIDAS DE TENDENCIA CENTRAL Y DISPOSICIÓN EN


DISTRIBUCIONES DE FRECUENCIA

ESTADÍSTICA SUMARIA

Tendencia central
Se refiere al punto medio de una distribución. Las medidas de tendencia central
se conocen también como medidas de disposición. En la siguiente figura la
posición central de la curva B está a la derecha de la disposición central de la
curva A y C; observe que la posición central de la curva A es la misma que la de
la curva C.

Figura 3.1 Comparación de la posición central de las tres curvas

Dispersión
Se refiere a la extensión de los datos en una distribución, es decir, el grado en
que las observaciones se distribuyen. Note que la curva A de la Fig. 3.2 tiene
una mayor extensión o dispersión que la curva B.

Figura 3.2 Comparación de la dispersión de dos curvas

1
Sesgo

Las curvas que representan los puntos de datos de un conjunto de datos


pueden ser simétricas o sesgadas. La que mostramos en la Fig. 3.3 tiene una
forma tal que una línea vertical que pase por el punto más alto de la curva
dividirá el área de ésta en dos partes iguales. Cada parte es un espejo de la
otra.

Figura 3.3 Curva simétrica

Las curvas A y B de la Fig. 3.4 son curvas sesgadas. Están sesgadas porque
los valores de su distribución de frecuencias están concentrados en el extremo
inferior o superior de la escala de medición del eje horizontal. Los valores no
están igualmente distribuidos. La curva A tiene sesgo derecho o positivo. La
curva B tiene un sesgo izquierdo o negativo.

2
Figura 3.4 Comparación de dos curvas sesgadas

Curtosis
Cuando medimos la curtosis de una distribución, estamos midiendo la agudeza
en grados, o su grado de agudez.
En la Fig. 3.5, por ejemplo, las curvas difieren entre sí solamente en que una
tiene un pico más agudo que la otra. Tienen la misma posición, la misma
dispersión y ambas son simétricas.

Figura 3.5 Dos curvas con la misma posición central pero diferente curtosis.

3
PRIMERA MEDIDA DE TENDENCIA CENTRAL: LA MEDIA
ARITMÉTICA

Casi siempre, cuando nos referimos al promedio de algo, estamos


hablando de la media aritmética, por ejemplo, en la tabla 3.1 presentamos el
número de días en que se encuentran fuera de servicio los generadores de una
planta de energía.

Tabla 3.1 Tiempo sin funcionar de los generadores de la planta de energía.

Generador 11 2 3 4 5 6 7 8 9 10
Días fuera de servicio 7 7 23 4 8 2 12 6 13 9 4

Para encontrar la media aritmética, sumaremos los valores y éstos serán


divididos entre el número de observaciones, esto para obtener el promedio en
días en el periodo de un año en que algunos de los generadores estuvieron
fuera de servicio.

Media aritmética = 7+23+4+8+2+12+6+13+9+4 = 88 = 8.8 días


10 10

SÍMBOLOS CONVENCIONALES

Para manejar y representar la Estadística necesitamos manejar símbolos


convencionales que a continuación veremos.
La muestra de una población consiste en n observaciones, con una
media de ¯X (léase equis testada). Recuerde que las medidas que calculamos
con una muestra se conocen como Estadística.

La notación es diferente cuando calculamos medidas para la población


entera. La media de una población se simboliza con µ (letra griega conocida
como mi) el número de elementos de una población se le denota con la letra
mayúscula N (Letra ene cursiva).

4
CÁLCULO DE LA MEDIA A PARTIR DE DATOS NO AGRUPADOS

Para escribir las fórmulas correspondientes a estas dos medias,


combinamos nuestros símbolos matemáticos y los pasos que utilizamos para
determinar nuestra media aritmética. Si sumamos los valores de las
observaciones y dividimos esta suma entre el número de observaciones,
tenemos:

Media de la población Suma de los valores de todas las observaciones

µ = x ( 3.1 )
N

Número de elementos de
la población

Pero en nuestro ejemplo de generadores esos diez son una fracción del
banco total de 30 generadores, entonces estamos hablando de:

Media de la muestra Suma de los valores de todas las observaciones

¯X = x ( 3.2)
n

Número de elementos de
de la muestra

Otro ejemplo: En la tabla 3.2 se representa la lista del aumento percentil


en los resultados de un examen de admisión obtenido por 7 alumnos distintos
que tomaron un curso de preparación para dicho examen. Calcularemos la
media para esos 7 estudiantes.

5
Tabla 3.2 Aumento percentil en resultados de examen de admisión

Estudiante 1 2 3 4 5 6 7

Aumento 9 7 7 6 4 4 2

¯X = x = 9+7+7+6+4+4+2 = 39 = 5.6 puntos por estudiante


n 7 7

CÁLCULO DE LA MEDIA DE DATOS AGRUPADOS

Una distribución de frecuencia consta de datos agrupados en clases;


cada valor de una observación cae dentro de alguna de las clases.
Suponga que tenemos una distribución de frecuencias del salario
promedio mensual de la cuenta de cheques de 600 clientes de Bancomer.

Es una estimación debido a que no utilizamos el total de 600 puntos de la


muestra.

Tabla 3.3 Saldos promedio mensuales de 600 cuentas de cheques

Clase (dólares) Frecuencia


00.00 – 49.99 78
50.00 – 99.99 123
100.00 – 149.99 187
150.00 – 199.99 82
200.00 – 249.99 51
250.00 – 299.99 47
300.00 – 349.99 13
350.00 – 399.99 9
400.00 – 449.99 6
450.00 – 499.99 4
600

Para encontrar la media aritmética de datos agrupados, primero calculamos el


punto medio de cada clase. Para lograr que los puntos medios queden en cifras
cerradas, redondeamos las cantidades. Así, por ejemplo, el punto medio de la

6
primera clase: 24.995, se convierte en 25.00 después multiplicamos cada punto
medio por la frecuencia de las observaciones de dicha clase, sumamos todos
los resultados y dividimos esta suma entre el número total de las observaciones
de la muestra. La fórmula es la siguiente:

¯X =  (ƒ  x) ( 3-3)
N

En la cual:

¯X = Media de la muestra
 = Símbolo que significa “la suma de”
ƒ = Frecuencia (número de observaciones) de cada clase
x = Punto medio de cada clase de la muestra
n = Número de observaciones de la muestra

En la tabla 3.4 se muestra cómo calcular la media aritmética de una


colección de datos agrupados utilizando la fórmula anterior. Calcularla.

Tabla 3.4 Cálculo de la media aritmética de la muestra de datos


agrupados de la tabla 3.3

7
Clase Punto medio Frecuencia ƒxx
(1) (x) (f) [(3) (2)] = 4
(2) (3) (4)

00.00 – 49.99 25.00 x 78 = 1,950


50.00 – 99.99 75.00 x 123 = 9,225
100.00 – 149.99 125.00 x 187 = 23,375
150.00 – 199.99 175.00 x 82 = 14,350
200.00 – 249.99 225.00 x 51 = 11,475
250.00 – 299.99 275.00 x 47 = 12,925
300.00 – 349.99 325.00 x 13 = 4,225
350.00 – 399.99 375.00 x 9 = 3,375
400.00 – 449.99 425.00 x 6 = 2,550
450.00 – 499.99 475.00 x 4 = 1,900=
ƒ= n = 600 85,350
 (ƒ x x )

¯X =  (ƒ x x)
n

= 85,350
600

= 142.25

Nota: Aquí variará un poco el estilo de trabajo; como pueden notar, la tabla
siguiente cuenta con varias columnas, de las cuales, algunas contienen datos y
otras hay que obtener el cálculo de esos datos por lo cual están en blanco.
Cada columna con su nombre y por debajo de ella una serie de números, los
cuales son la fórmula de obtención pero dichos números son el número de las
columnas, hay que multiplicarlo, sumarlo o restarlo según sea el caso y no es
por ejemplo en el caso anterior [(3) (2)] = 4, ya que: (3)(2)= 6, ESTO
SIGNIFICA QUE: La columna 3 la vamos a multiplicar con la 2 y el resultado
será la columna 4. La literal que está entre paréntesis es su símbolo para
obtención del cálculo en la fórmula.

En nuestro ejemplo anterior vemos que los puntos medios van siendo
acumulativos clase por clase, por los rangos de cada una de las clases. Si no lo
hiciéramos así no obtendríamos nuestra media muestral de 142.25. Esta es
nuestra aproximación hecha a partir de la distribución de frecuencias. Observa
que debido a que no conocemos cada uno de los puntos de datos de la
muestra, suponemos que todos los valores que están en una clase son iguales
a su punto medio. Nuestros resultados, entonces, sólo pueden ser una
aproximación del promedio real del saldo mensual.

CODIFICACIÒN

8
En aquella situación en donde no se cuente con una máquina
calculadora y tengamos que realizar operaciones manualmente podemos
simplificar mucho el trabajo si hacemos uso de una técnica a la que se conoce
como “codificación”; con dicha técnica podemos eliminar el problema de tener
puntos medios muy grandes e inadecuados. En lugar de utilizar los puntos
medios reales para llevar a efecto nuestros cálculos, se asignan valores
enteros consecutivos de valor pequeño, conocidos como códigos a cada uno
de los puntos medios. El entero cero puede ser asignado a cualquier punto
medio, pero para que nuestros enteros sean pequeños, asignaremos el entero
cero al punto medio de la parte media de la distribución o la parte más cercana
a ésta. Entonces podemos asignar enteros negativos a los valores menores a
dicho punto medio y enteros positivos a valores más grandes de la siguiente
manera:

Clase: 1 - 5 6 -10 11-15 16 -20 21-25 26 -30 31-35 36 - 40 41 - 45


Código ( u) -4 -3 -2 -1 0 1 2 3 4
X0

Simbólicamente, la Estadística usa el X0 para representar el punto medio


al que se le asigna el código cero y la literal u, para el punto medio codificado.
Para calcular la media aritmética mediante codificación hacemos uso de
la siguiente fórmula:

(uxf) ( 3-4)
¯X = X 0 + W n

Donde:

¯X = Media de la muestra
X 0 = Valor del punto medio al que se le asignó el código cero
W = Ancho numérico del intervalo de clase
u = Código asignado a cada punto medio de clase
f = Frecuencia o número de observaciones de cada clase
n = Número total de observaciones de la muestra
Veamos un ejercicio para aplicación de nuestra formula anterior. En la
siguiente tabla se ilustra cómo codificar los puntos medios y encontrar la
media de la muestra de la caída pluvial anual en el estado de Zacatecas:

Tabla 3.5 Caída anual pluvial en la ciudad de Zacatecas en 20 días.

9
Clase Punto medio Código frecuencia uxf
(1) (x) (u) (f) [(3) (4)] = 5
(2) (3) (4) (5)

0- 7 3.5 -2 x 2 = -4
8 – 15 11.5 -1 x 6 = -6
16 - 23 19.5 X 0 0 x 3 = 0
24 – 31 27.5 1 x 5 = 5
32 – 39 35.5 2 x 2 = 4
40 – 47 43.5 3 x 2 = 6
20 5

Aplicamos la fórmula y ¿cuántos milímetros de H 2O obtenemos?


Calcúlalo en el espacio en blanco debajo de la fórmula.

( u x f ) ( 3-4)
¯X = X 0 + W n

= 19.5 + 8 (5/ 20) =19.5 + 2 = 21.5 mm. de caída de agua promedio

Como vemos, la media aritmética es confiable en el sentido de tomar


en cuenta todos los valores del conjunto de datos, pero puede verse
afectada por los valores extremos que no son representativos del resto de
los datos.

SEGUNDA MEDIDA DE TENDENCIA CENTRAL:

LA MEDIA PESADA

Nos permite calcular el promedio que toma en cuenta la importancia de


cada valor con respecto al total.
Para ejemplificarlo nos basaremos en la tabla 3.8, la cual utiliza 3 niveles
de trabajo: no calificado, semi - calificado y calificado para la producción, de
sus dos productos finales. La compañía desea saber si el costo de trabajo por
hora de cada uno de sus productos, es el indicado. Un simple promedio nos
bastaría para saber el salario pagado por ese trabajo. Nos basaremos en los
datos de la siguiente tabla para ello.

Tabla 3.8 Entrada de trabajo por proceso de manufactura

Horas de trabajo invertido

10
por unidad producida
Nivel de Salario por hora Producto 1 Producto 2
trabajo (x)
No calificado $ 5.00 1 4
Semi 7.00 2 3
calificado
Calificado 9.00 5 3
8 10

¯X = x
n

¯X = 5 + 7 + 9 = 21 = $7.00
3 3

¿Este salario es acorde al trabajo realizado?

Usando esta tasa promedio podríamos calcular el costo del trabajo


invertido en una unidad del producto 1 como $7(1 + 2 + 5)=$56, y el de una
unidad del producto 2 como $7(4 + 3 + 3)=$70, pero estos promedios son
incorrectos, usando la media aritmética estamos mal.

Para que nuestros cálculos sean correctos debemos tomar en cuenta


que se utilizan tres niveles diferentes de trabajo. Podemos determinar los
promedios correctos de la siguiente manera:

Producto 1: el costo total de trabajo por unidad será:


($5 x 1) + ($7 x 2) + ($9 x 5) = $64 pesos
Pero, como invertimos 8 horas de trabajo, ahora tenemos:
64 / 8 = $8 pesos

Producto 2: el costo total de trabajo por unidad será:


($5 x 4) + ($7 x 3) + ($9 x 3) = $68 pesos
Aquí invertimos 10 horas de trabajo, así que:
68 / 10 = $6.80 pesos.

11
Pero esto no es lo más sano…

La respuesta correcta a lo anterior es la media pesada, que es otra


forma de calcular el promedio por hora para el trabajo invertido en los dos
productos. Cosiste en tomar un promedio peso del costo de los tres niveles de
trabajo, o sea, deberemos pesar el salario por hora de cada nivel mediante la
fracción total requerida para fabricar el producto x. Ejemplo:

La unidad del producto 1 requiere 8 horas de trabajo, por lo tanto:

1 / 8 de trabajo no calificado, 2 / 8 de trabajo semi calificado y 5 / 8 de trabajo


calificado, entonces, 1 hora de trabajo en el producto 1 cuesta en promedio:
(1/8 x 5 ) + ( 2/8 x 7 ) + ( 5/8 x 9 ) = 8.

La unidad del producto 2 requiere 10 horas de trabajo, por lo tanto:

4 /10 de trabajo no calificado, 3/10 en trabajo semi calificado y 3/10 de trabajo


calificado, entonces, 1 hora de trabajo en el producto 2 cuesta en promedio:
( 4/10 x 5) + ( 3/10 x 7 ) + ( 3/10 x 9 ) = 6.80.

Estos promedios pesados nos dan el valor correcto para los costos
promedio por hora de trabajo para los dos productos, ya que toma en cuenta
las diferentes cantidades de cada nivel de trabajo que se utilizan en la
elaboración de los productos. Para calcular la media pesada deberemos de
utilizar la siguiente fórmula:

¯Xw =  (w x x) (3.5)
w
Donde:

¯Xw = Media pesada


W = Peso asignado a cada observación
 (w x x) = Suma de los productos del peso de cada elemento por el elemento
correspondiente
w = Suma de todos los pesos

Siguiendo la fórmula, tenemos que:

12
Producto 1: ¯Xw = ( 1/8 x 5) + (2/8 x 7) + (5/8 x 9)
1/8 + 2/8 + 5/8

= 0.625 + 1.75 + 5.625 = 8 = $ 8.00


8/8 1

Producto 2: ¯Xw = (4/10 x 5) + (3/10 x 7) + (3/10 x 9)


4/10 + 3/10 + 3/10

= 2 + 2.1 + 2.7 = 6.8 = $ 6.80.


10/10 1

La media pesada toma en cuenta no nada más el valor de cada punto de


dato, sino también con qué frecuencia éste se presenta en la población. Y
vemos que la media aritmética es inadecuada para ciertos aspectos, por eso no
debemos abusar de su manejo.

UNA TERCERA MEDIDA DE TENDENCIA CENTRAL:


LA MEDIA GEOMÉTRICA

En ocasiones trabajamos con cantidades que cambian en cierto periodo,


necesitamos entonces conocer una tasa promedio de cambio, como la tasa de
crecimiento promedio en un periodo de varios años. En tales casos, la media
aritmética resulta inapropiada, pues nos da resultados inapropiados. Lo que
necesitamos encontrar es la media geométrica, conocida como MG.

Consideremos por ejemplo el crecimiento de una cuenta de ahorros en


la cual depositamos $100 inicialmente y dejamos que acumule intereses a
diferentes tasas durante 5 años. El crecimiento se resume en la tabla 3.9.

Tabla 3.9 Crecimiento de un depósito de $100 en una cuenta de ahorros

Año Tasa de interés Factor de crecimiento Ahorros al final

13
del año
1 7% 1.07 107.00
2 8 % 1.08 115.56
3 10 % 1.10 127.12
4 12 % 1.12 142.37
5 18 % 1.18 168.00

La entrada del encabezado “factor de crecimiento” es igual a:

1 + tasa de interés
100

El factor de crecimiento es la cantidad por la cual multiplicamos los


ahorros al inicio del año para obtener el saldo final del mismo. El factor de
crecimiento considerado como la media aritmética simple sería (1.07 + 1.08 +
1.10 + 1.12 + 1.18)/5 = 1.11, que corresponde a una tasa de interés promedio
de 11% anual. Sin embargo, si el banco diera intereses a una tasa constante de
11% anual, un depósito de $100 daría un crecimiento en cinco años de:

$100 x 1.11 x 1.11 x 1.11 x 1.11 x 1.11 = $168.51

Como vemos tenemos un error de 51 centavos en referencia a nuestra


tabla anterior.
En la tabla 3.9 se muestra que la cifra real es sólo $168.00. Así pues, el
factor de crecimiento promedio correcto debe ser ligeramente menor a 1.11.
Para encontrar el factor de crecimiento promedio correcto podemos multiplicar
los factores de crecimiento de los 5 años y luego tomar la raíz del producto (es
decir, encontrar un número que al multiplicarse por sí mismo dé como resultado
el producto con el que empezamos). El resultado es el factor de crecimiento
como media geométrica. La fórmula de la media geométrica es:

MG = n
 producto de todos los valores de x

Si aplicamos esta fórmula a nuestro ejemplo de la cuenta de ahorros


anterior, obtendremos el crecimiento promedio correcto

14
= 5
1.07 x 1.08 x 1.10 x 1.12 x 1.18

= 5
1.679965 = 1.1093 ≈ 10.93%

(≈) Este símbolo representa: es similar o igual a

Observe que la tasa promedio correcta de 10.93% anual obtenida con la


media geométrica está muy cerca a la tasa promedio incorrecta del 11% anual
obtenida con la media aritmética.

$ 100 x 1.1093 x 1.1093 x 1.1093 x 1.1093 x 1.1093 = $ 167.97 = $ 168.00

En 1994 con una economía con altas tasas de inflación, los bancos
pagaron altas tasas de intereses para captar ahorradores. Supón que en un
periodo de 5 años en régimen económico que se estaba viviendo con un
increíble alto índice de inflación, los bancos pagaban tasas de interés anual del
100, 200, 250, 300, 400 y 500% que corresponden a un factor de crecimiento
de 2, 3, 3.5, 4 y 5. Entonces un depósito inicial de $100 en cinco años crecerá:

$100 x 2 x 3 x 3.5 x 4 x 5 = $ 42,000.

El factor de crecimiento como media aritmética es de:

(2 + 3 + 3.5 + 4 + 5 / 5) = 3.5

Esto en realidad corresponde a una tasa de interés promedio real anual


de 250%. Sin embargo, si el banco en realidad pagara intereses a una tasa
constante de 250% anual entonces crecerían a $52,521.88
Entonces utilizaremos nuestra fórmula de la media geométrica para
determinar el factor de crecimiento correcto:

MG = n
 producto de todos los valores de x

= 5
2 x 3 x 3.5 x 4 x 5

15
=  420
5
= 3.347 Factor de crecimiento promedio

Este factor de crecimiento corresponde a una tasa de interés promedio


de 235% anual. En este caso, el uso de la media apropiada conduce a una
diferencia significativa.

$ 100 x 3.347 x 3.347 x 3.347 x 3.347 x 3.347 = $42 002

El cálculo de la media geométrica es una buena forma de tomar en


cuenta efectos multiplicativos como la inflación o el interés compuesto.

UNA CUARTA MEDIDA DE TENDENCIA CENTRAL:


LA MEDIANA

La mediana es diferente a cualquiera de las medias que hemos tratado.


La mediana es sólo un valor calculado a partir del conjunto de datos que mide
la observación central de éstos. Esta sola observación es la más central o la
que está más en medio en el conjunto de números. La mitad de los elementos
están por arriba de este punto y la otra mitad está por debajo.

CÁLCULO DE LA MEDIANA A PARTIR DE DATOS NO


AGRUPADOS

Primero organizaremos el conjunto de datos en orden ascendente o


descendente. Si el conjunto de datos contiene un número impar de elementos,
el de en medio en el arreglo es la mediana. Si tenemos un número par de
observaciones, la mediana es el promedio de los dos elementos de en medio.
Para ello utilizaremos la siguiente fórmula:

Mediana = n + 1 = ésimo término del arreglo de datos

16
2
Donde: n = número de elementos del arreglo

NUMERO IMPAR DE ELEMENTOS: Suponga que deseamos encontrar la


mediana de 7 elementos en un arreglo de datos. De acuerdo a nuestra
ecuación anterior, la mediana es el cuarto término del arreglo de datos, o sea:

Mediana = 7 + 1 = 4
2

Si aplicamos el ejemplo anterior a los tiempos de un equipo de atletismo


con 7 miembros, y observamos la tabla 3.10, descubriremos que el cuarto
elemento del arreglo es 4.8 minutos. Ésta es la mediana del tiempo del equipo
de atletismo.

Tabla 3.10 Tiempos para los miembros de un equipo de atletismo

Elemento del
Arreglo de datos 1 2 3 4 5 6 7

Tiempo en 4.2 4.3 4.7 4.8 5.0 5.1 9.0


minutos

Mediana

Observemos que a diferencia de la media aritmética, que calculamos


anteriormente, en comparación con la mediana que calculamos en la tabla
3.10, ésta no se ve distorsionada por la presencia del último valor que es 9.0,
éste pudo haber sido 15.0 o incluso 45.0 y la mediana seguiría siendo la
misma, no en cambio la media aritmética que sí se ve afectada.

NÚMERO PAR DE ELEMENTOS: Calculamos la mediana en la tabla 3.11,


concerniente a pacientes tratados en la sala de emergencia de un hospital. Los
datos están organizados en forma descendiente.

Tabla 3.11 Pacientes tratados en la sala de emergencias durante ocho días


consecutivos

17
Elemento del
Arreglo de datos 1 2 3 4 5 6 7 8

Número de pacientes 86 52 49 43 35 31 30 11

Mediana de 39

Mediana = 8 + 1 = 4.5
2

Como la mediana es el elemento número 4.5 del arreglo, necesitamos


calcular el promedio de los elementos cuarto y quinto. El cuarto elemento de la
tabla 3.11 es 43 y el quinto 35.

El promedio de estos dos elementos es igual a (43 + 35) / 2 = 39. Por


consiguiente, 39 es el número que representa la mediana de los pacientes
tratados diariamente en la sala de emergencias durante el periodo de ocho
días.

CÁLCULO DE LA MEDIANA A PARTIR DE DATOS AGRUPADOS

Muy a menudo tenemos acceso a los datos después que han sido
agrupados en una distribución de frecuencia. Por ejemplo, aquí no conocemos
cada observación que nos llevó a la construcción de la tabla 3.12, la cual
representa el saldo mensual bancario de 600 clientes. En este caso tenemos
10 intervalos de clase y un registro de frecuencia con las cuales las
observaciones aparecen en cada uno de los intervalos.

Localice la clase mediana.

No obstante, podemos calcular la mediana de saldo de la cuenta de


cheques de estos 600 clientes de BANCOMER, determinando cuál de los 10
intervalos de clase contiene la mediana.

Tabla 3.12

18
Clase en pesos frecuencia Frecuencia
acumulada
00.00 – 49.99 78 78
50.00 – 99.99 123 201 Para
llevar a 100.00 – 149-99 187 388 cabo
esto 150.00 – 199.99 82 470
200.00 – 249.99 51 521
250.00 – 299.99 47 568
300.00 – 349.99 13 581
350.00 – 399.99 9 590
400.00 – 449.99 6 596
450.00 – 499.99 4 600
600
debemos sumar las frecuencias que aparecen en la respectiva columna de la
tabla anterior hasta que alcancemos el elemento número ( n + 1 ) / 2. Como
tenemos 600 cuentas el valor para ( n + 1 ) / 2 es 300.5 que es el promedio de
los elementos número 300 y 301.

El problema consiste en encontrar los intervalos de clase que contengan


el número de elementos 300 y 301. La frecuencia acumulada de las dos
primeras clases será de 78+ 123 = 201, pero cuando tomamos en cuanta el
tercer intervalo de clase, debemos de sumar esos 187 elementos a los 201 ya
acumulados y tendremos un total de 388, en consecuencia de las
observaciones de 300 y 301 deben de estar en la tercera clase del intervalo
que comprende de $100.00 a $149.99 pesos.

La clase mediana de este conjunto de datos contiene187 observaciones.


Si suponemos que estos 187 elementos empiezan en 100 pesos y se
encuentran igualmente espaciados en todo el intervalo de clase de $100 hasta
$149.99 pesos, entonces podremos interpolar y encontrar valores para los
elementos 300 y 301. Primero determinamos que el evento número 300 es la
observación número 99 de la clase mediana.
(Interpolar). Restar los dos elementos de las primeras dos clases al tercer
elemento.

Interpolamos: 300 – 201 (elemento de las primeras dos clases) = 99

Y que el elemento 301 es la observación 100 o número 100 de la clase


media porque:

Volvemos a interpolar: 301-201 =100

Entonces podemos calcular el ancho de los 187 pasos iguales desde


$100 hasta $149.99 de la manera siguiente:

19
1° Elemento de la clase
siguiente 1° Elemento de la
clase mediana

$150.00 - $100.00 = $ 0. 267 de ancho, cada uno de los 187


187 pasos iguales.

Ahora, si existen 187 pasos de $0.267 pesos cada uno y necesitamos


98 pasos para llegar al elemento 99, entonces éste será:

($0.267 x 98) + $100 = $126.17

Y el elemento número 100 está un paso más adelante, o sea:

$126.17 + $0.267 = $126.44

Por lo tanto, podemos utilizar $126.17 y $126.44 pesos como valor de


los elementos 300 y 301 respectivamente.

La mediana real de este conjunto de datos es el valor que calculamos


anteriormente: 300.5, es decir, la mitad o promedio de 300 y 301.

Entonces nuestro promedio será:

126.17 + 126.44 = $126.30 pesos.


2

La cantidad de $126.30 es el saldo mensual de la cuenta de cheques


estimado a partir de los datos agrupados de nuestra tabla inmediata anterior.

La mediana es mucho mejor que la media aritmética para eliminar el


efecto de uno o dos elementos externos o sea, puntos de dato extremos.
Cuando escuches que utilizan el término de “mediana” estamos hablando que
el 50% de los valores estarán por debajo y el otro 50% por arriba.

Para hacer más corto este procedimiento, la Estadística utiliza la


siguiente fórmula o ecuación para determinar la mediana de un conjunto de
datos agrupados. Para una muestra, la fórmula sería:

20
m = ( n+1 ) / 2 – ( F + 1 ) W + Lm ( 3- 8)

fm

En donde:

m = Mediana de la muestra.
n = Número total de elementos de la distribución
F = Suma de todas las frecuencias de clase hasta, pero sin incluir, la clase
mediana
fm = Frecuencia de la clase mediana
W = Ancho del intervalo de clase
Lm = Limite inferior del intervalo de clase mediano

Si utilizamos la ecuación anterior para calcular la mediana de nuestra


muestra referente a los saldos de cuentas de cheques, entonces diremos que:
n = 600, F = 201, fm = 187, W = $ 50 , LM = $ 100. Por lo tanto, ¿cuál será la
mediana de la muestra?

m = ( n+1 ) / 2 – ( F + 1 ) W + Lm ( 3- 8)

fm

m = 601 / 2 – 202 $ 50 + $ 100


187

= 98.5 $50 + $100 = (0.527) ($50) + $100 = $ 126.35

21
LA MEDIDA FINAL DE TENDENCIA CENTRAL: LA MODA

Esta tendencia central es muy diferente a la media pero es muy parecida


a la mediana; no se calcula con un proceso aritmético ya que es el valor que
más se repite en un conjunto de datos; aquí lo importante y que tomaremos en
cuenta es el azar. Dentro de la organización de los datos, el azar muchas veces
es el que ayuda para que se repita ese valor representativo más frecuente en el
conjunto de datos; por ejemplo, veamos la tabla siguiente:

Tabla 3.13

Viajes diarios de un camión de concreto en un periodo de 20 días.

0 2 5 7 15
0 2 5 7 15 Moda
1 4 6 8 15
1 4 6 12 19

Como se ve, los viajes están organizados en orden ascendente.

El valor modal es 15 una moda de 15 implica que la actividad de la


planta es mayor que 6.7, o sea el resultado obtenido si calculamos la media.

Entonces la moda nos dice que 15 es el número más frecuente de


clases. Pero no nos dice que la mayor de esa cantidad de viajes está por
debajo de 12.

CLASE MODAL DE DATOS AGRUPADOS

Ahora veremos la distribución de frecuencias de estos datos en la tabla


3.14. Aquí seleccionaremos la clase que tiene mayor número de observaciones
y la llamamos clase modal, ella es la más representativa de la planta
revolvedora de concreto, siendo que su moda son 15 viajes diarios.

Tabla 3.14 Distribución de frecuencia de los viajes entregados de la planta


concretera

Clase de N° de 0–3 4-7 8 – 11 12 – o más


entregas
Frecuencia 6 8 1 5

Clase Modal

22
Cuando los datos ya se encuentran agrupados en una distribución de
frecuencias, podemos suponer que la moda está localizada en la clase que
contiene el mayor número de elementos, es decir la clase que tiene mayor
frecuencia. Para determinar un solo valor de esta moda partiendo de la clase
modal, utilizaremos la siguiente ecuación:

Mo = Lmo + d1 . W
d1 + d 2 (3-9)

En donde:

Mo = Moda
Lmo = Limite inferior de la clase modal
d1= Frecuencia de la clase modal menos la frecuencia de la clase que se
encuentra inmediatamente por debajo de ella
d2= Frecuencia de la clase modal menos la frecuencia de la clase que se
encuentra inmediatamente por encima de ella
W= Ancho del intervalo de clases

Para utilizar la ecuación anterior tomaremos en cuenta el ejemplo de


saldo de las cuentas de cheques de BANCOMER, así obtenemos el valor de la
moda; decimos así:

Lmo = 100, d1 =187 –123 = 64, d2 = 187- 82 =105, w = 50

Mo = Lmo + d1 . W
d1 + d 2

Mo = $100 + 64 . $ 50 = 64 + 105

= $100 + (0.38) ($50) = $100 + $19 = $ 119.00 Moda.

El resultado obtenido de $119 es la estimación de la moda.

COMPARACIÓN DE LA MEDIA, LA MEDIANA Y LA MODA

Cuando trabajamos un problema de Estadística, deberemos de hacer


una selección de qué medida de tendencia central vamos a utilizar.
23
La distribución simétrica sólo contiene una moda, siempre tiene el mismo
valor para la media, la mediana y la moda. En tales casos, no es necesario
escoger la medida de tendencia central, pues ya está hecha la selección.

No en cambio si tenemos una distribución positivamente sesgada (con


sesgo hacia la derecha), como lo mostramos en la siguiente figura: la moda se
encuentra en el punto más alto de la distribución, la mediana está hacia la
derecha de la moda y la media se encuentra más a la derecha de la moda y la
mediana.

En una distribución negativamente sesgada (con sesgo hacia la


izquierda), como lo mostramos en la siguiente figura, la moda sigue siendo el
punto más alto de la distribución, la mediana está hacia la izquierda de aquélla
y la media se encuentra todavía más a la izquierda de la moda y la mediana.

Cuando la población está sesgada negativamente o positivamente, con


frecuencia la mediana resulta ser la mejor medida de tendencia central a usar,
debido a que siempre está entre la moda y la media. La mediana no se ve
alterada por la aparición de un solo valor como en el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media aritmética.

DISPERSIÓN. MEDIDA DE DESVIACIÓN PROMEDIO

24
Dos medidas son también importantes dentro del estudio de la
estadística: la Varianza y la Desviación Estándar, ambas nos dan una distancia
promedio de cualquier observación de un conjunto de datos con respecto a la
media de distribución.

Varianza de la Población

Toda población tiene un varianza, la cual se simboliza con la letra griega


Sigma y se eleva al cuadrado (σ2). Para calcular la varianza de la población
dividiremos la suma de las distancias al cuadrado entre la media y cada
elemento de población entre el número total de observaciones de dicha
población. Al elevar al cuadrado cada una de las distancias obtenemos que
todos los números sean positivos y logramos más peso en las desviaciones
más grandes.

σ² =  (x - µ)² =  x² - µ² (3-12)
N N

En donde:
σ ² = varianza de población
x = elemento u observación
µ = media de población
N = número total de elementos de la población
 = suma de todos los valores (x - µ)² o valor de todas la x 2

Como se ve en la primera expresión  (x - µ)² es la definición de σ ². La


N
segunda expresión  x² - µ² es la equivalencia matemática de esa definición.
N

A menudo resulta más conveniente utilizar la equivalencia matemática ya


que nos libera al cálculo de las desviaciones con respecto a la media, pero
cuando los valores de x son grandes y los valores de x – µ son menores o
pequeños, es muy conveniente utilizar la primera expresión para calcular σ ².

DESVIACIÓN ESTÁNDAR DE LA POBLACIÓN

La expresamos con la letra griega sigma (σ ) y esto es simplemente


extraerle la raíz cuadrada a la varianza de la población antes calculada. La
varianza es el promedio de las distancias el cuadrado que van de las
observaciones a la media; en cambio, la desviación estándar es la raíz
cuadrada de promedio de las distancias al cuadrado que van de las
observaciones de la media, y se utiliza la siguiente fórmula:

25
Desviación estándar de la población

σ = √σ² =  (x - µ)² =  (x - µ)² (3.13)


N N

En donde:

σ ² = Varianza de la población
σ = Desviación estándar de la población
= Suma de todos los valores ( x - µ ) 2 o todos los valores de x2
µ = Media de la población
N = Número total de elementos de la población
x = Observaciones

La raíz cuadrada de un número positivo puede ser positiva o negativa ya


que a2 = (-a)2. Cuando tomamos la raíz de la varianza para calcular su
desviación estándar, se consideran raíces cuadradas positivas exclusivamente.

Para hacer los cálculos tanto de la varianza como de la desviación


estándar de datos no agrupados en clases, debemos construir una tabla
haciendo uso de todos los elementos de la población. Veamos el siguiente
ejemplo para su aplicación:

Tenemos un población de 15 frascos de compuesto que se producen en


un día dentro de un laboratorio y probamos cada frasco para determinar la
pureza del compuesto. Los datos que obtengamos podrían verse como los de
la tabla siguiente; deseamos comprobar la pureza de cada frasco de
compuesto que se produce en un día.

Tabla 3.18

Resultado de la prueba de pureza del compuesto.

Porcentaje de impurezas observado


0.04 0.14 0.17 0.19 0.22
0.06 0.14 0.17 0.21 0.24
0.12 0.15 0.18 0.21 0.25

Con la anterior tabla trabajaremos en la construcción de la tabla 3.19 en


la cual mostraremos la forma de utilizar esos datos para calcular la media
(suma de los valores de la primera columna, dividida entre N = (2.49 / 15) , la

26
desviación estándar de cada valor con respecto a la media (columna 3);el
cuadrado de la desviación de cada valor con respecto a la media (columna 4 )
y por último la suma de cuadrado de las desviaciones. Teniendo todo esto
podemos ya calcular la varianza e inmediatamente después extraerle la raíz de
esa varianza y poder obtener el cálculo de la desviación estándar, las cuales
serán: de varianza 0.0034 % al cuadrado, y desviación estándar de 0.058%,
comprobarlo, para ello veamos el ejemplo que manejamos en la siguiente tabla.

Tabla 3.19 Determinación de varianza y desviación estándar del porcentaje de


impurezas del compuesto anterior (para datos no agrupados)

Observaciones Media Desviación Desviación² Observaciones al


(μ) = 2.49/15 (x – μ) (x – μ)² cuadrado.
(X²)
(x) (μ) (3) = ( 1) – (2) (4)= [(1 )–(2)]2 (5)= (1)2
(1) (2) (3) (4) (5)
0.04 0.166 -0.126 0.016 0.0016
0.06 0.166 -0.106 0.011 0.0036
0.12 0.166 -0.046 0.002 0.0144
0.14 0.166 -0.026 0.001 0.0196
0.14 0.166 -0.026 0.001 0.0196
0.15 0.166 -0.016 0.000 0.0225
0.17 0.166 0.004 0.000 0.0289
0.17 0.166 0.004 0.000 0.0289
0.18 0.166 0.014 0.000 0.0324
0.19 0.166 0.024 0.001 0.0361
0.21 0.166 0.044 0.002 0.0441
0.21 0.166 0.044 0.002 0.0441
0.22 0.166 0.054 0.003 0.0484
0.24 0.166 0.074 0.005 0.0576
0.25 0.166 0.084 0.007 0.0625
x = 2.49 (x-μ)2=0.051 x2= 0.4643

Apliquemos las fórmulas y obtengamos la varianza y la desviación estándar, así:

σ² =  (x - µ)² = 0.051 = 0.0034% al cuadrado (3.12)


N 15

σ² =  x² - µ² = 0.4643 - (0.166) 2 = 0.0034% al cuadrado


N 15

27
σ = √ σ² = √ 0.0034 = 0.058% (3.13)

USOS DE LA DESVIACIÓN ESTÁNDAR


(Teorema de Chebyshev)

La desviación estándar nos permite determinar, con un buen grado de


precisión, dónde están localizados los valores de una distribución de
frecuencias con relación a la media. Podemos hacer esto de acuerdo con el
teorema establecido llamado el Teorema de Chebyshev. Dicho teorema dice
que no importa qué forma tenga la distribución, al menos el 75% de valores
caerán en ± 2 desviaciones estándares a partir de la media de distribución y
que al menos el 0.89% de los valores caerán dentro de ± 3 de desviaciones
estándares a partir de la media de distribución.

Podemos medir aún con más precisión el porcentaje de observaciones


que caen dentro de un alcance específico de curvas simétricas en forma de
campana como la que a continuación presentamos:

En estos casos podemos decir:

1.- Aproximadamente el 68% de los valores de la población cae dentro


de ± 1 desviación estándar a partir de la media.

2.- Aproximadamente el 95% de los valores estarán dentro de ± 2


desviaciones estándar a partir de la media de distribución.

28
3.- Aproximadamente el 99% de los valores estarán en el intervalo que
va desde 3 desviaciones estándar por debajo de la media hasta 3
desviaciones estándar por arriba de la media de distribución.

Ahora veamos cómo trabaja y cuál es el Teorema de Chebyshev.

Teorema de Chebyshev:

Para cualquier conjunto de datos y cualquier constante “K” mayor que 1


al menos la proporción 1 – 1/ K2 de los datos se encuentra la más a K
desviaciones estándar a partir de la media de distribución.

¿Qué significa este teorema? por ejemplo: si K =2 al menos 1 – 1 / K 2


= 1 – 1/22 = 1 – 1/4 = ¾ = 75%, de los datos deben de estar a dos desviaciones
estándar de la media de distribución.

Veamos un ejemplo de aplicación para el teorema:

Una empresa papelera que vende paquetes de hojas para copiadora


tiene el siguiente problema: sus paquetes tienen una media de 500 hojas, con
una desviación estándar de 0.6. ¿Cuál es el mínimo porcentaje de paquetes
que contienen entre 498 y 502 hojas?

En este caso estamos permitiendo que haya una variación de 2 hojas


por paquete; al expresar esto en términos de desviación estándar, tenemos lo
siguiente: (Aplicamos el Teorema de Chebyshev y obtendremos lo deseado)

Nuestros datos nos dicen que: 2 = 0.6K, despejamos K, y tenemos:

K = 2 / 0.6 = 3.33, entonces tenemos que K = 3.33 por lo tanto diremos que:

Aplicamos nuestra proporción del Teorema de Chevyshev: 1 – 1 / k 2,


sustituimos y decimos que: 1 – 1 / (3.33) 2 = 0.91, entonces aplicando el
Teorema de Chevyshev nos garantiza que cuando menos el 91% de los
paquetes contienen entre 498 y 502 hojas. O sea que el 91% de los paquetes
contienen 500 hojas en promedio.

Con todo esto sabemos que el teorema de Chebyshev se aplica a


cualquier conjunto de datos y nos dice por lo menos un porcentaje de eso se
encuentra dentro de ciertos límites.

29
En el caso del ejemplo anterior obtuvimos el 91% entre 498 y 502 hojas,
pero podría haber un porcentaje mayor dentro de estos límites, todo esto se
puede graficar en distribución de frecuencias, muy comunes en la curva normal
en forma de campana donde obtenemos más información sobre la variabilidad
de los datos.

Ahora retomamos nuestro ejemplo del compuesto químico, y a la luz del


Teorema de Chebyshev, analicemos los datos que obtuvimos en nuestra tabla
3.19. En éstos, la impureza media de los 15 frascos de compuesto es de
0.166% y la desviación estándar es de 0.058%. El Teorema de Chebyshev nos
dice que al menos el 75% de los valores o sea (11 de los 15 frascos) están
entre 0.166 – 2 (0.058) = 0.050% y 0.166 +2 (0.058) = 0.282% de impurezas
del compuesto.

Ahora aplicamos nuestra proporción y obtendremos nuestro porcentaje


para el límite de confianza, que es de:

0.282 = 0.58K = 4

Donde: 1 – 1/42 = 0.93 = 93%

De hecho 93% de las observaciones o sea (14 de los 15 frascos) está


realmente en el intervalo. Nota que la distribución es notablemente simétrica y
que el 93% es muy cercano al 95% teórico para un intervalo de ±2
desviaciones estándares a partir de la media de curva en forma de campana.

La desviación estándar es también útil para describir qué tan lejos las
desviaciones individuales de una distribución se apartan de la media de
distribución. Una medida que se conoce como resultado estándar, nos da el
número de observaciones estándar que una observación en particular ocupa
por debajo o por encima de la media. Si hacemos que X simbolice la
observación, entonces el resultado estándar calculado a partir de los datos de
la población es:

Resultado estándar de la población: (x - µ) (3.14)


σ

En donde:

x = Observaciones tomadas de la población


µ = Media de población
σ = Desviaciones estándar de la población

30
Para hacer uso de nuestra fórmula anterior veamos el siguiente ejemplo:

Supón que observamos un frasco de compuesto que tiene 0.108% de


impurezas. Debido a que nuestra población tiene una media de 0.166 (ver tabla
3.19) y una desviación estándar de 0.058%, ¿qué resultado estándar tendrá
esta observación?

Aplicamos la fórmula:

(x - µ) = (3.14)
σ

= 0.108 – 0.166 = 0.058 = -1


0.058 0.058

Y una impureza de 0.282 % tendrá un resultado estándar de:

(x - µ) = 0.282- 0.166 = 0.116 = + 2


σ 0.058 0.058

El resultado estándar indica por ejemplo que una pureza de 0.282% se


desvía de la media en 2(0.058) = 0.166 unidades, que es igual a +2, en
términos de desviación estándar, alejado de la media de distribución.

CÁLCULO DE LA VARIANZA Y DESVIACIÓN ESTÁNDAR


DE DATOS AGRUPADOS

Para aplicar y hacer el cálculo de lo anterior nos basaremos en el


siguiente ejemplo:

El vicepresidente de mercadotecnia de una cadena de restaurantes de


comida rápida está estudiando el desarrollo de las ventas de 100 sucursales
que se encuentran en la República Mexicana. Él ha construido la siguiente
distribución de frecuencias para sus ventas anuales:

Venta clase Frecuencia


700 – 799 4

31
800 – 899 7
900 –999 8
1000 – 1099 10
1100 – 1199 12
1200 – 1299 17
1300 – 1399 13
1400 – 1499 10
1500 – 1599 9
1600 – 1699 7
1700 – 1799 2
1800 – 1899 1

Al vicepresidente le gustaría comparar las ventas del Distrito Federal con


las ventas de otros estados de la República Mexicana. Para llevarse a cabo
esto, se hará un resumen de la distribución, poniendo especial cuidado en el
acopio de la información sobre la tendencia central de los datos.

Con tales datos, después de haber construido nuestra tabla siguiente la


cual será la 3.20, podemos utilizar las siguientes fórmulas para el cálculo de la
varianza y desviación estándar:

σ² =  ƒ(x - µ)² =  ƒ x² - µ² (3-15)


N N

(3-16)
σ= σ² =  ƒ (x - µ)² =  ƒ x² - µ²
N N

En donde:
σ² = Varianza de población
σ = Desviación estándar de población
ƒ = Frecuencia de cada una de las clases
x = Punto medio de cada clase
µ = Media de población
N = Tamaño de la población

En la tabla 3.20 se muestra cómo aplicar estas ecuaciones para calcular


la varianza y la desviación estándar de la venta de los restaurantes de comida
rápida.

32
Tabla 3.20 Determinación de la varianza y la desviación estándar de la
venta de 100 restaurantes de comida rápida (datos agrupados en clases x
1000)

Clase Punto frecuencia media


medio
(f) fxx (μ) x–μ (x – μ )2 f (x – μ )2
(x) (2) (2)(1)=3 (4) (1) – (4)= 5 [(1)-(4)] = 6 (2)[(1)- (4)]2= 7
2

(1) (3) (5) (6) (7)

700- 799 750 4 3,000 1,250 - 500 250,000 1,000,000


800- 899 850 7 5,950 1,250 - 400 160,000 1,120.000
900- 999 950 8 7,600 1,250 - 300 90,000 720,000
1000- 1099 1,050 10 10,500 1,250 - 200 40,000 400,000
1100- 1199 1,150 12 13,800 1,250 - 100 10,000 120,000
1200- 1299 1,250 17 21,250 1,250 0 0 0
1300- 1399 1,350 13 17,550 1,250 100 10,000 130,000
1400- 1499 1,450 10 14,500 1,250 200 40,000 400,000
1500- 1599 1,550 9 13,950 1,250 300 90,000 810,000
1600- 1699 1,650 7 11,550 1,250 400 160,000 1,120,000
1700- 1799 1,750 2 3,500 1,250 500 250,000 500,000
1800- 1899 1,850 1 1,850 1,250 600 360,000 360,000

100 125,000 6,680,000

Ahora calcularemos la varianza y la desviación estándar utilizando las fórmulas


anteriores.

¯X =  (ƒ x x) = 125,000 = 1, 259 pesos media


n 100

σ² =  ƒ(x - µ)² = 6,680,000 = 66,800 pesos al cuadrado varianza


N 100

σ = √ σ² = √ 66,800 = 258.5 = $ 258,500 desviación estándar

CÁLCULO DE LA VARIANZA Y LA DESVIACIÓN ESTÁNDAR DE


UNA MUESTRA

33
Ahora ya estamos listos para calcular la Estadística de muestra análoga
a la varianza de población ( σ2 ) y a la desviación estándar de la población (σ).
Se trata de la Varianza de la muestra la cual se representa (S2) y la Desviación
Estándar de la muestra (S). Como podemos observar, hemos cambiado la
notación de letras griegas (que denotan parámetros de población) a literales
latinas que corresponden a la estadística de muestra.

Para calcular la varianza y la desviación estándar de una muestra,


utilizamos las mismas formulas que representamos en las ecuaciones 3.12 y
3.13, sustituyendo, μ con x, y N con n – 1. Y la fórmula es la siguiente

S2 = ( x – ¯x ) 2 = x 2 - n¯x 2 ( 3 – 17 )
n–1 n -1 n -1

S= S2 = ( x – ¯x ) 2 = x 2 - n¯x 2 ( 3 – 18 )
n -1 n -1 n -1

En donde:

S2 = Varianza de la muestra
S = Desviación estándar de la muestra
X = Valor de cada una de las n observaciones
¯x = Media de la muestra
n – 1= Número de observaciones de la muestra menos 1

Las ecuaciones anteriores nos permitirán calcular la varianza y la


desviación estándar de la muestra; para ello tomaremos el ejemplo de los
donativos hechos a dos hospitales por la asociación altruista, un ejemplo que
manejamos anteriormente. Este ejemplo nos permitirá la construcción de la
siguiente tabla; nota que las dos partes de las fórmulas producen el mismo
resultado.

Tabla 3.21

Determinación de varianza y desviación estándar de la muestra de los


donativos hechos anualmente por la asociación altruista

Observaciones Media X – ¯X (X –¯X)2 x2

X X [(1)-(2)] = [(1)-(2)]2 = 4 (1)2 = 5

34
3
(1) (2) (3) (4) (5)

863 1351 -488 218144 744796


905 1351 -488 200704 815409
957 1351 -394 165236 995849
1041 1351 -310 96100 1083681
438 1351 -213 45369 1295044
1204 1351 -147 21609 1449616
1354 1351 3 9 1833316
1624 1351 247 74529 2637376
1698 1351 347 120409 2885204
1745 1351 394 150236 3045025
1802 1351 451 203401 3247204
1883 1351 532 203024 3545689

 (X -¯X)2=1,593,770 x2 =23,496,182

Ahora calcularemos la varianza y la desviación estándar utilizando


nuestras fórmulas.

S2 = ( x – ¯x ) 2
n -1

= 1,593,770 = 144,888 ( $ 1,44,888 millones al cuadrado) varianza de la


11 muestra

x2 - n¯x 2 = 23,496,182 - 12 ( 1,351) = 1,593,770 = 144,888


n -1 n -1 11 11 11

S= S2 = ( x – ¯x ) 2 = x 2 - n¯x 2
n -1 n -1 n -1

= 144,888 = 380.64 es decir… $ 380,64

Al igual que utilizamos la desviación estándar de la población para


derivar los resultados estándar de la misma, podemos también usar la
35
desviación estándar de la muestra para calcular los resultados estándar de la
muestra. Estos resultados indican cuántas desviaciones estándar se halla una
observación en particular por abajo o por arriba de la media de la muestra. La
fórmula adecuada es la siguiente:

Resultado estándar de la muestra = x – ¯x (3-19)


s

En donde:

X = Observaciones tomadas de la muestra


¯X = Media de la muestra
S = Desviación estándar de la muestra

En el ejemplo anterior vemos que la primera observación que es de 863. ¿Qué


resultado estándar le correspondería?

Sustituimos la fórmula: X - ¯X = 863 – 1,351 = - 488 = -1.28


S 380.64 380.64

En este capítulo hemos demostrado por qué la desviación estándar es la


medida de dispersión que más se utiliza para calcular las distribuciones y para
calcular los resultados estándar, que son unos elementos importantes en el
estudio de la estadística.

36

S-ar putea să vă placă și