Documente Academic
Documente Profesional
Documente Cultură
Medidas de tendencia
central y de dispersin
Introduccin
Si bien, todas tienen como objetivo obtener un valor tpico que describa hacia dnde se
agrupan los valores de un conjunto de datos, cada una de ellas tiene ventajas y desventajas que
hacen que las distingamos entre s.
Sin embargo, en el anlisis de muchos fenmenos tambin necesitamos conocer la manera
en que los valores de una serie se dispersan entre s. Para ello acudimos a otro tipo de medidas
10 3
descriptivas, las medidas de dispersin o de variabilidad, las cuales son tan importantes en el estudio
de una serie de datos, como lo es localizar sus valores centrales.
Lasmedidasde dispersin proporcionan unaideamental con la cual seconocequtanto varan
o qu tanto se dispersan los valores de un conjunto de datos. Si la variacin es muy pequea, las
medidas de dispersin tambin tendran un valor muy pequeo e indicaran una gran uniformidad
de los elementos de una serie. Por el contrario, si se obtiene un valor grande de las medidas de
dispersin, sealara gran variacin entre los valores de los datos. La ausencia de dispersin es seal
de uniformidad perfecta, lo cual quiere decir que todos los datos tienen el mismo valor.
En el estudio de algunosmercadoslasmedidasde dispersin son utilizadaspara medir la volatilidad,
el nerviosismo o el riesgo que se presenta en una variable. Por ejemplo, cuando existe mucho nerviosismo
entre los inversionistas en un mercado, se observar una enorme variacin o volatilidad en sus precios.
Existen diversas medidas de dispersin que son utilizadas segn la naturaleza del fenmeno que
se quiere investigar. Las medidas de dispersin que se analizarn en esta unidad son:
3.1.1. Media
a)
Cuando tenemos una serie con datos no agrupados: X1, X2, X3,, Xn, la media se calcula sumando los
valores de cada uno de los datos y su resultado se divide entre el nmero de datos que tiene la serie.
Para una poblacin compuesta por los datos X 1, X2, X3,..., XN, la frmula de la media poblacional
para datos no agrupados se describe de la siguiente manera:
10 4
( X1
X2
X3
N
Xn )
Xi
N
ESTADSTICA PARA NEGOCIOS
Donde:
= Media aritmtica de la poblacin.
= Suma.
N = Nmero de datos en la poblacin.
Xi = El valor que toma cada uno de los datos.
Para una muestra que contenga X1, X2, X3, ..., Xn datos, la media muestral para datosno agrupados
se obtiene mediante la siguiente frmula:
X
( X1
X2
X3
N
Xn )
Xi
N
Donde:
X = Media aritmtica de la muestra.
= Suma.
n = Nmero de datos incluidos en la muestra.
Xi = El valor que toma cada uno de los datos.
Ejemplo 1
En la tabla 3.1 se expone la cotizacin mensual del tipo de cambio entre el peso mexicano y el dlar
estadounidense observada en algunas casas de cambio durante el ao 2000.
a)
Si se realiza una inspeccin visual, cul sera tu opinin si alguien dijera que el tipo de
cambio en el ao 2000 estuvo alrededor de los 10.50 pesos por dlar?
b) Encuentra la media para el tipo de cambio entre el peso y el dlar estadounidense en el
ao 2000.
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
10 5
Por lo tanto, es de esperarse que la media se encuentre muy cercana a los 9.40 o 9.50 pesos por
dlar. Si nos preguntaran cul sera un valor representativo o tpico para describir el nivel del tipo de
cambio durante el ao 2000, llevamos a cabo la estimacin de la media.
Debido a que el Banco de Mxico nicamente seleccion la paridad de algunas casas de cambio
y no el total de las transacciones realizadas durante el ao 2000, los datos de la tabla se refieren a
una muestra. Adicionalmente, observamos que los datos no estn agrupados, pues la tabla 3.1 no los
organiz de acuerdo con su frecuencia, por lo que procedemos a estimar la media muestral para datos
no agrupados de la siguiente manera:
X
113.39
12
9.44
El promedio del tipo de cambio durante el ao 2000 fue 9.44 pesos por dlar, confirmando la
apreciacin hecha en el inciso a) de que el tipo de cambio estara alrededor de los 9.40 o 9.50 pesos
por dlar. El resultado 9.44 es utilizado como una medida tpica o representativa que seala por
dnde se concentraron las cotizaciones del dlar durante el ao 2000. Si realizamos nuevamente una
inspeccin visual a la tabla 3.1, se observa que en la mayora de los meses existe un nivel cercano a
los 9.44 pesos por dlar y nicamente durante el mes de julio la paridad se presion ligeramente a los
9.79, como resultado del nerviosismo generado por las elecciones presidenciales del ao 2000.
Ejemplo 2
En la tabla 3.2 se expone la participacin mensual de la inversin extranjera en el mercado accionario
de la Bolsa Mexicana de Valores, entre los meses de enero del ao 2000 a octubre del 2001.
Encuentra el promedio de la participacin extranjera en el mercado accionario para el periodo
bajo estudio.
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
2000
44.01
46.58
44.78
47.25
45.07
46.69
44.07
44.96
44.72
44.62
43.03
41.31
2001
43.55
40.17
39.93
41.24
41.21
40.95
39.87
45.97
42.76
43.85
10 6
anterior, estimamos la media aritmtica, pues en ocasionesresulta difcil determinar de manera visual
hacia dnde se concentran los valores en un conjunto de datos.
=
44
42
40
38
36
b)
Cuando tenemos una serie con datos agrupados, es decir, que son presentados mediante una tabla de
distribucin de frecuencias, la media muestral X y la media poblacional se obtienen mediante las
siguientes frmulas:
X
(m1 f1 m2 f2 ... mn fn )
( f1 f2 ... fn )
mj fi
(m1 f1 m2 f2 ... mn fn )
(f1 f2 ... fn )
mj fi
fi
fi
107
Donde:
=
X
=
mj =
fi =
fi =
mj fi =
A diferencia de la frmula para datos no agrupados, en este caso mj representa el punto medio
de cada clase, el cual se obtiene sumando el lmite inferior y el lmite superior de cada clase, y
dividiendo este resultado entre 2.
Ejemplo 3
Unacompaaareadetransportacin depaqueteradeseaconocer cul esel peso promedio en kilogramos
delospaquetestransportados, yaquedestedependeel costo yel nmero depaquetesquepuedetransportar
sin violar los reglamentos de carga establecidos. Para ello, la compaa realiz un muestreo del peso en
algunos paquetes cuyosresultados se presentan en la siguiente tabla de distribucin de frecuencias:
Peso en kg
10.0 10.9
11.0 11.9
12.0 12.9
13.0 13.9
14.0 14.9
15.0 15.9
16.0 16.9
17.0 17.9
18.0 18.9
19.0 19.9
f i (frecuencia)
1
4
6
8
12
11
8
7
6
2
mj (punto medio)
10.45
11.45
12.45
13.45
14.45
15.45
16.45
17.45
18.45
19.45
fi
mj f i
1
4
6
8
12
11
8
7
6
2
65
10.45
45.8
74.7
107.6
173.4
169.95
131.6
122.15
110.7
38.9
985.25
Tabla 3.4. Distribucin de frecuencias del peso de los paquetes transportados, incluyendo
el punto medio de cada clase.
10 8
Los resultados de la columna mjfi se obtienen multiplicando cada uno de los puntos medios
por la frecuencia de cada clase. Estos resultados se suman dando un monto de 985.25. Una vez
realizadas estas operaciones procedemos a calcular la media muestral dividiendo 985.25 entre el
monto obtenido por la suma de las frecuencias (65), tal como se seala en la siguiente frmula:
X
mj fi
fi
985.25
= 15.15
65
El peso promedio de los 65 paquetes transportados por esta compaa es de 15.15 kilogramos
por paquete, lo que permitir determinar el costo promedio de los paquetes que transporta esta
compaa, adems de conocer cuntos paquetes pueden ser transportados segn el peso de carga
permitido en cada vuelo que se realiza.
Ejemplo 4
De la informacin proporcionada por el XII Censo de Poblacin y Vivienda, obtn la edad promedio
de la poblacin en Mxico en el ao 2000.
Edades
Frecuencia f i
0 9 aos
10 19 aos
20 29 aos
30 39 aos
40 49 aos
50 59 aos
60 69 aos
70 79 aos
80 89 aos
90 ms aos
Total
4.5
14.5
24.5
34.5
44.5
54.5
64.5
74.5
84.5
94.5
21 850 480
20 728 628
17 228 877
13 489 061
9 266 924
5 917 184
3 858 931
2 110 944
773 927
184,598
95 409 554
mj f i
98 327 160.0
300 565 106.0
422 107 486.5
465 372 604.5
412 378 118.0
322 486 528.0
248 901 049.5
157 265 328.0
65 396 831.5
17 444 511.0
2 510 244 723.0
Tabla 3.5. Tabla de frecuencia de la poblacin en Mxico, incluyendo el punto medio de cada clase.
En este ejemplo se calcula la media poblacional para conocer la edad promedio en
Mxico, pues la informacin consultada fue obtenida de un censo de poblacin. Cada uno
de los puntos medios se multiplica por la frecuencia, que en este caso son los habitantes que
corresponden a esa clase. Al obtener estos resultados, procedemos a calcular la media a travs
de la siguiente frmula:
=
mj fi
fi
La edad promedio de la poblacin en Mxico fue de 26.31 aos, es decir, las edades de los
habitantes en Mxico tienden a concentrarse alrededor de los 26.31 aos, lo que confirma la misma
apreciacin realizada en la unidad 2 de que la poblacin en Mxico est compuesta en su mayora por
gente joven. Incluso, se podra sealar que una persona con 26 aos de edad es un habitante tpico o
representativo de la poblacin en Mxico.
Cabe sealar que en este clculo fueron excluidas 2 073 858 personas que no especificaron su
edad y suponemos que la marca de clase para las personas con 90 o ms aos es 94.5.
10 9
2.
Un conjunto de datos numricos tiene una y solo una media, de modo que siempre es nica.
3.
La media aritmtica, en su carcter de ser un solo nmero que representa a todo conjunto de
datos, tiene importantes ventajas.
Ejemplo 5
Estima la media para la siguiente serie de datos: 0, 1, 1, 3, 5 y 110.
Si se realiza una inspeccin visual se observa la presencia de un valor atpico, pues existe una
gran diferencia entre los primeros cinco datos y el ltimo dato de la serie, por lo que es de esperarse
que la media aritmtica no refleje un valor tpico.
=
(0 1 1 3 5 110)
6
120
20
6
1.
2.
Nmero de estudiantes
30 34
35 39
40 44
45 50
18
18
10
2
3.
4.
30
40
64
40
26
23
58
42
57
13
46
43
28
59
42
42
39
21
42
38
Una fbrica quiere conocer el tiempo que tardan 200 obreros en producir una pieza cada uno.
Si la fbrica desea determinar el tiempo promedio que tarda cada obrero para establecer el
tiempo de produccin, con el fin de mejorar la eficiencia, calcula la media con la informacin
de la siguiente tabla:
Tiempo de produccin
fi
mj
mjf i
mf
Fa
20.00 25.00
25.01 30.00
30.01 35.00
35.01 40.00
40.01 45.00
45.01 50.00
50-01 55.00
10
20
30
60
50
20
10
200
22.5
27.5
32.5
37.5
42.5
47.5
52.5
225
550
975
2250
2125
950
525
7 600
10
30
60
120
170
190
200
111
5.
Una fbrica de ropa desea conocer cuntas chamarras terminadas y listas para ser entregadas
produce en promedio, para de esta manera establecer un plan de ventas y mercadotecnia con la
finalidad de lograr una mayor penetracin en el mercado. Las chamarras terminadas y listas para
ser entregadas por una fbrica de ropa por da contabilizadas durante un periodo de 20 das son:
142
132
136
137
6.
163
135
133
131
108
130
146
129
157
140
137
144
124
128
149
139
fi
7
19
27
13
6
3
75
Fa
7
26
53
66
72
75
112
Se ordenan los datos de la serie del valor ms pequeo al valor ms grande, es decir, se organiza
la serie en orden creciente.
2.
Observamos cul es el tamao de la muestra (n) o de la poblacin (N) que se pretende analizar
y procedemos a encontrar la mediana bajo uno de los siguientes criterios:
a)
b)
Ejemplo 6
Estima la mediana para la serie de datos: 0, 1, 1, 3, 5, y 110.
Si se realiza una inspeccin visual se observa la presencia de un valor atpico, pues existe una
gran diferencia entre los primeros cinco datos y el ltimo dato de la serie, por lo que procedemos a
calcular la mediana.
Al tener una serie con n = 6 (nmero par), promediamos los dos valores centrales de la serie
ordenada y obtenemos la mediana:
Md
1 3
2
4
2
113
Ejemplo 7
En la siguiente tabla se muestra el ndice de Precios y Cotizaciones (IPC) de la Bolsa Mexicana
de Valores para cinco das del mes de noviembre del ao 2001. Se desea conocer una medida de
tendencia central del IPC para resumir el comportamiento burstil durante esa semana.
Fecha
IPC
26/11/2001
27/11/2001
28/11/2001
29/11/2001
30/11/2001
5 759.49
5 860.44
5 848.21
5 841.34
5 832.83
Siguiendo los pasos para encontrar la mediana, ordenamos a la serie de datos del menor al
mayor valor para quedar de la siguiente manera:
Posicin
IPC
1
2
3
4
5
5759.49
5832.83
5841.34
5848.21
5860.44
Mediana
(n 1)
2
(5 1)
2
6
2
Donde Nd indica la posicin del dato de la serie ordenada cuyo valor ser la mediana.
El resultado anterior indica que se va a tomar el valor que se encuentre en la posicin nmero
tres de la serie ordenada, que en este caso viene representado por M d = 5841.34. De esta manera se
puede sealar que el nivel representativo del IPC de la Bolsa Mexicana de Valores observado durante
la ltima semana del mes de noviembre de 2001 se ubic en 5841.43 unidades. Alrededor de este
nmero se ubicaron dos jornadas con valores superiores y dos jornadas con valores inferiores.
Ejemplo 8
En la siguiente tabla se muestra el tipo de cambio mensual observado por el Banco de Mxico en
algunas casas cambiarias del pas durante el ao 2000. Encuentra la mediana con la finalidad de que
sea utilizada como medida representativa del tipo de cambio del ao 2000.
114
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
9.47
9.44
9.29
9.37
9.50
9.79
9.46
9.28
9.33
9.51
9.51
9.44
Siguiendo los pasos para encontrar la mediana, ordenamos a la serie de datos del menor al
mayor valor para quedar de la siguiente manera:
Posicin
1
2
3
4
5
6
7
8
9.28
9.29
9.33
9.37
9.44
9.44
9.46
9.47
9
10
11
12
9.50
9.51
9.51
9.79
Nd1
Nd2
n
2
12
2
Nd2
(n 2)
2
(12 2)
2
14
7
2
Donde Nd1 y Nd2 indican la posicin de los dos datos de la serie ordenada cuyos valores son
utilizados para obtener la mediana. Ahora promediamos dichos valores y obtenemos la mediana.
Md
(9.44 9.46)
2
18.9
2
9.45
115
El resultado de la mediana es Md = 9.45, que puede ser utilizado como un valor representativo
del nivel que mantuvo el tipo de cambio entre el peso y el dlar durante el ao 2000. Tambin
seala que 50% de los datos de la serie tiene un valor superior a 9.45 y el restante 50% tiene valores
inferiores a 9.45. Observa que este valor difiere muy poco del valor obtenido en el ejemplo 1, donde la
media muestral fue 9.44. Por esta razn, la media y la mediana son medidas de tendencia central que
difieren muy poco cuando no se tiene la presencia de valores extremos o atpicos.
Md
Li
n
Fa
2
fm
Donde:
Li = Lmite inferior de la clase mediana.
n = Nmero de datos observados.
Fa = Frecuencia acumulada anterior a la clase mediana.
I = Amplitud del intervalo.
fm = Frecuencia de la clase mediana.
Para localizar correctamente los componentes de esta frmula debemos tomar en cuenta los
siguientes puntos:
1.
Las clases de la tabla de frecuencias deben estar organizadas en orden creciente y a la tabla
se le debe adicionar una columna que contenga las frecuencias acumuladas de cada clase.
2.
3.
4.
El lmite real inferior de la clase mediana (Li) es un lmite terico que se obtiene sumando el
lmite inferior de la clase y el lmite superior de la clase anterior y dividiendo esa suma entre dos.
Lmitereal inferior =
116
5.
6.
Cabe sealar que esta frmula supone que los datos son continuos y que los valores observados
dentro de cada clase forman una progresin aritmtica
Ejemplo 9
Con el fin de conocer cul es la situacin del mercado laboral, una empresa recab informacin de
los salarios pagados en pesos por hora; esta informacin fue recolectada mediante una muestra
de 100 obreros. Encuentra la mediana para determinar un salario representativo pagado por hora a
los obreros. Los resultados de la muestra se observan en la tabla 3.10.
Salarios por hora
fi
Fa
50 59.99
60 - 69.99
70 79.99
80 89.99
90 99.99
100 109.99
110 119.99
120 129.99
130 139.99
140 149.99
8
10
16
14
10
5
2
15
8
12
100
8
18
34
48
58
63
65
80
88
100
Clase mediana
Li
n
Fa
2
fm
89.995
100
48
2
10
10 89.995
(50 48)
10=89.995
10
2
10
10
Md = 89.995 + 2 = 91.995
El resultado obtenido por la empresa seala que 91.995 esel salario representativo de losobreros
de esta empresa. Segn la clase mediana del mercado laboral, 50% de los obreros perciben como
mximo un salario de $91.995 por hora y el 50% restante gana un salario mnimo de $91.995.
Ejemplo 10
De acuerdo con la informacin proporcionada por el XII Censo de Poblacin y Vivienda en Mxico,
encuentra la edad mediana para la poblacin en Mxico.
117
Edades
Frecuencia f i
Frecuencia acumulada
0 9 aos
10 19 aos
20 29 aos
30 39 aos
40 49 aos
50 59 aos
60 69 aos
70 79 aos
80 89 aos
90 ms aos
Total
21 850 480
20 728 628
17,228,877
13 489 061
9 266 924
5 917 184
3 858 931
2 110 944
773 927
184 598
95 409 554
21 850 480
42 579 108
59 807 985
73 297 046
82 563 970
88 481 154
92 340 085
94 451 029
95 224 956
95 409 554
Clase mediana
Md
Li
n
Fa
2
fm
19.995
95 409 554
42 579 108
2
17 228 877
10 19.995
5 125 669
10
17 228 877
118
1.
Una distribuidora de automviles est interesada en conocer la eficiencia de diez de sus vendedores,
segn las ventas que realizan, con el fin de establecer cuntos autos es posible vender. El nmero de
automvilesvendidospor cada vendedor es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15. Calcula la mediana si
ahora la distribuidora quiere conocer cul es el nmero de autos vendidos ms cerca del promedio.
2.
Los pesos de una muestra de paquetes de una oficina de mensajera son: 21, 18, 30, 12, 14, 17,
28, 10, 16 y 25 kg. La oficina de paquetera quiere conocer el peso por paquete ms cercano al
peso promedio. Calcula la mediana.
3.
Los salarios anuales (en pesos) de los ejecut ivos de una corporacin son 150 000,
100 000, 50 000, 40 000, 35 000, 35 000, 33 000, 30 000, 30 000, 30 000 y 28 000.
Determina el salario que ms se aproxima al promedio calculando la mediana.
4.
El departamento de personal de una compaa ha tomado el tiempo que duran las entrevistas de
trabajo para de esa manera determinar cunto tiempo se debe destinar a cada entrevista. Para ello,
se desea determinar la mediana. El tiempo de duracin de cada entrevista (en minutos) es:
37
18
55
57
5.
30
40
64
40
23
58
42
57
46
43
28
59
42
39
21
42
Una fbrica quiere conocer el tiempo que tardan 200 obreros en producir una pieza cada uno.
Si la fbrica desea determinar el tiempo que ms se acerca al tiempo promedio que tarda cada
obrero para establecer el tiempo de produccin con el fin de mejorar la eficiencia, calcula la
mediana con la informacin de la siguiente tabla:
Tiempo de produccin
fi
mj
mjfi
mf
Fa
20.00 25.00
25.01 30.00
30.01 35.00
35.01 40.00
40.01 45.00
45.01 50.00
50-01 55.00
10
20
30
60
50
20
10
200
22.5
27.5
32.5
37.5
42.5
47.5
52.5
225
550
975
2250
2125
950
525
7 600
10
30
60
120
170
190
200
119
6.
La siguiente tabla muestra la distribucin de las cantidadesde tiempo que un cliente permanece
en espera en la fila de un banco para pasar a cajas de una muestra de 75 clientes.
Tiempo de espera
fi
Fa
0 14
15 29
30 44
45 59
60 74
75 89
7
19
27
13
6
3
75
7
26
53
66
72
75
12 0
3.1.3. Moda
Es una medida de tendencia central cuyo valor es el ms comn en una serie de datos. La moda es
representada por la expresin Mo y puede ser utilizada para describir series de datos con variables
cuantitativas o variables cualitativas. En muchas ocasiones, esta medida es de gran utilidad en los
negocios. Por ejemplo, algunas tiendas de autoservicio necesitan conocer cul es el producto ms
demandado y en qu magnitud, con el propsito de tener al da sus inventarios.
Ejemplo 11
En la siguiente tabla se muestra el tipo de cambio mensual observado por el Banco de Mxico en
algunas casas cambiarias del pas durante el ao 2000. Encuentra la moda con la finalidad de que sea
utilizada como medida representativa del tipo de cambio del ao 2000.
Mes
Tipo de cambio
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
9.47
9.44
9.29
9.37
9.50
9.79
9.46
9.28
9.33
9.51
9.51
9.44
121
Ejemplo 12
En el primer semestre del 2001, Mxico coloc en lasbolsasde Nueva York y Chicago 11 286 contratos
de opciones put y call clasificados segn el producto de la siguiente manera:
Producto
Algodn
Caf
Crtamo
Maz
Sorgo
Soya
Trigo
Contratos
254
1
7
1,955
7,043
218
1,808
Li
Donde:
Mo =
Li =
=
1
=
2
I
=
2)
Moda.
Lmite real inferior de la clase modal (la que tiene la mayor frecuencia).
Diferencia entre la mayor frecuencia y la frecuencia anterior.
Diferencia entre la mayor frecuencia y la frecuencia que le sigue.
Amplitud del intervalo de la clase modal.
Ejemplo 13
Una casa de bolsa realiz un estudio comparativo de los rendimientos de ciertas acciones con el
fin de conocer cules rendimientos fueron ms atractivos para los compradores, segn las acciones
que fueron ms vendidas. Mediante el clculo de la moda determina el rendimiento de las acciones
que fue ms atractivo, considerando que la casa de bolsa elabor la siguiente distribucin sobre los
rendimientos al vencimiento de una muestra de 65 acciones.
Rendimientos
50 59.99
60 69.99
70 79.99
80 89.99
90 99.99
100 109.99
110 119.99
fi
8
10
16
14
10
5
2
65
Clase modal
12 2
La clase que presenta una mayor frecuencia (16) es 70-79.99, por lo que el lmite real inferior de
la clase modal es: Li = 69.995. La diferencia entre la mayor frecuencia y la frecuencia anterior se define
por: 1 = 16 10 = 6 y la diferencia entre la mayor frecuencia y la frecuencia posterior es: 2 = 16 14 = 2. La
amplitud del intervalo de clase donde se encuentra la mayor frecuencia es: I = 79.99 69.99 = 10. En este
caso, las clases muestran entre qu valores flucta el rendimiento ms atractivo y la frecuencia
representa el nmero de acciones que presentan tales rendimientos.
Al aplicar la frmula de la moda con los datos anteriores se tiene:
Mo
Li
2)
69.995
6
10 69.995
(6 2)
6
10 69.995 + (0.75)(10)
8
Ejemplo 14
De acuerdo con la informacin proporcionada por el XII Censo de Poblacin y Vivienda en Mxico,
encuentra la edad moda para la poblacin en Mxico.
Edades
0 9 aos
10 19 aos
20 29 aos
30 39 aos
40 49 aos
50 59 aos
60 69 aos
70 79 aos
80 89 aos
90 ms aos
Total
Frecuencia f i
21 850 480
20 728 628
17 228 877
13 489 061
9 266 924
5 917 184
3 858 931
2 110 944
773 927
184 598
95 409 554
Frecuencia acumulada
21 850 480
42 579 108
59 807 985
73 297 046
82 563 970
88 481 154
92 340 085
94 451 029
95 224 956
95 409 554
Clase modal
Tabla 3.15. Tabla de frecuencia de la poblacin en Mxico, incluyendo el punto medio de cada clase.
La clase modal es (0 9), por lo que en este caso excepcional se toma el lmite inferior Li = 0,
y no el lmite real inferior. La razn radica en que la clase modal es la primera clase en la cual
se encuentra contenido el nmero cero como lmite inferior. En este caso no habra forma de
tomar el lmite real inferior para estimar la moda, pues al tratarse de un lmite terico, el lmite
real inferior resultara un nmero negativo, el cual no tendra lgica alguna al estar manejando
edades (no se puede hablar de edades negativas). Por otra parte, la diferencia entre la frecuencia
mayor y su anterior es: 1 = 21 850 480 0 = 21 850 480 y la diferencia con la posterior es: 2 = 21
850 480 20 728 628 = 1 121 852. El valor del intervalo de clase de la mayor frecuencia es:
I = 19 9 = 10.
Al aplicar la frmula de la moda con los datos anteriores se tiene:
Mo
Li
2)
21 850 480
10 0
21 850 480 1121 852
(0.951)(10)
9.51
12 3
M o = 0 + 9.51 = 9.51
La moda de las edades en Mxico es de 9.51 aos.
Si no hay datos repetidos no existir moda; por ejemplo, si se tienen los datos siguientes:
32, 45, 62, 35, 44.
2.
Si hay datos repetidos que tengan valor cero, la moda es cero, pero no puede decirse que
no hay moda; por ejemplo, si se tienen los siguientes datos de ventas de automviles de
lujo por da: 1, 0, 2, 0, 3, 0, 5.
3.
La ventaja ms sobresaliente de la moda es que puede ser utilizada para conocer una medida
representativa de un conjunto de datos con valores cualitativos. Otra ventaja es que la moda no se ve
afectada por datos extremos o atpicos. Sin embargo, la principal desventaja es que en algunas series
de datos no existe la moda, lo que limita el propsito de conocer una medida representativa de un
conjunto de datos.
Por ltimo, se ha mencionado que en algunas series de datos puede presentarse el caso de
que existen varias modas, lo que puede representar una ventaja o desventaja, dependiendo del
problema que se estudie. La desventaja es que no tendramos una medida representativa nica de
la serie de datos. Sin embargo, cuando la media y la mediana no son representativas, las modas
pueden convertirse en las medidas ms representativas para describir una serie de datos.
12 4
1.
2.
Los pesos de una muestra de paquetes de una oficina de mensajera son: 21, 18, 30, 12, 14, 17,
28, 10, 16 y 25 kg. Calcula la moda si ahora la oficina de paquetera quiere conocer cul es el
peso por paquete que ms se repite.
3.
Los salarios anuales (en pesos) de los ejecutivos de una corporacin son 150 000, 100 000,
50 000, 40 000, 35 000, 35 000, 33 000, 30 000, 30 000, 30 000 y 28 000. Calcula la moda
para determinar cul es el salario que predomina en la corporacin.
4.
El departamento de personal de una compaa ha tomado el tiempo que duran las entrevistas
de trabajo para de esa manera determinar cunto tiempo se debe destinar a cada entrevista.
Calcula la moda para estimar el tiempo ms usual que tarda una entrevista. El tiempo de
duracin de cada entrevista (en minutos) es:
37
18
55
57
35
5.
30
40
64
40
26
23
58
42
57
13
46
43
28
59
42
42
39
21
42
38
Una fbrica quiere conocer el tiempo que tardan 200 obreros en producir una pieza cada uno.
Si la fbrica desea determinar el tiempo que ms se repite, calcula la moda con la informacin
de la siguiente tabla:
Tiempo de produccin
20.00 25.00
25.01 30.00
30.01 35.00
35.01 40.00
40.01 45.00
45.01 50.00
50-01 55.00
fi
10
20
30
60
50
20
10
200
Fa
10
30
60
120
170
190
200
fi
7
19
27
13
6
3
75
0 14
15 29
30 44
45 59
60 74
75 89
Fa
7
26
53
66
72
75
125
126
f
Moda 2
Media
Mediana
Moda 2
Moda
Mediana
Media
127
f
Moda
Mediana
Media
12 8
1.
2.
3.
4.
12 9
Cuartiles (Qi)
Los cuartiles son aquellos valores que dividen una distribucin de datos en cuatro partes y se
representan por Qi , Q2 y Q3, denominados primero, segundo y tercer cuartil, respectivamente.
Existen tres cuartiles, el primer cuartil (Q1) es un punto tal que deja a la izquierda 25% de los
datos que son menores que l y es menor que 75% de los datos restantes. El segundo cuartil (Q2) tiene
un valor igual a la mediana. El tercer cuartil Q3 tiene un valor tal que sobrepasa en valor a 75% de los
datos y es menor que el 25% restante.
Lo anterior se puede apreciar en la figura siguiente:
f
Primer cuartil
Mediana o segundo cuartil
Tercer cuartil
13 0
Los cuartiles para datosno agrupados en una serie se localizan de la siguiente manera: primero
se ordenan los valores observados de acuerdo con su magnitud y, posteriormente, se determina el
lugar que cada cuartil debe ocupar en la serie.
El lugar que debe tomar el primer cuartil se obtiene dividiendo el nmero de datos(n) entre cuatro.
Esto se debe a que el valor de este cuartil deja a la izquierda 25% de los datos que son ms pequeos y a
la derecha 75% de los datos con valores mayores. La posicin del primer cuartil se define por:
n
NOQ1
4
El lugar que debe ocupar el segundo cuartil se define dividiendo el nmero de datos (n) entre dos,
ya que al ser igual que la mediana deja a la izquierda 50% de los datosmenoresy a la derecha 50% de los
datos con mayores valores. Por ello, la frmula para determinar la posicin del segundo cuartil es:
NOQ2
(2 n)
4
n
2
El lugar que le corresponde al tercer cuartil se obtiene multiplicando el nmero de datos (n)
por tres y dividiendo entre cuatro, debido a que considera que a su izquierda se encuentra 75% de
los datos ms pequeos y a la derecha 25% de los datos con valores mayores, siendo la frmula para
definir al tercer cuartil:
NOQ3
(3 n)
4
Ejemplo 15
El departamento de recursos humanos de una empresa desea dividir en cuatro partes iguales las
solicitudes de empleo que recibe constantemente, con el fin de determinar los das en que la carga
de trabajo aumenta. Para ello tom una muestra de 18 das hbiles donde la cantidad de solicitudes de
empleo, ordenadas de manera ascendente, fueron: 22, 26, 28, 31, 33, 34, 37, 39, 49, 50, 52, 59, 60,
62, 67, 69, 74 y 76. Para esto, se quiere hacer suposiciones mediante el clculo de los cuartiles.
Los nmeros de orden para cada uno de los cuartiles son:
Para el primer cuartil
NOQ1
NOQ2
NOQ3
18
4.5
4
18
9
2
(3 18) 54
4
4
27
13.5
2
Los nmeros de orden 4.5, 9 y 13.5 indican los lugares que ocupan en la serie ordenada cada
uno de los cuartiles.
Para obtener los valores de los cuartiles de esta serie de datos se procede de la manera siguiente:
El primer cuartil est situado entre el cuarto y el quinto trmino, se suma el valor de estos
trminos y la suma se divide entre dos, lo cual da:
(31 33)
2
64
2
131
Esto quiere decir que 25% de los das se recibe menos de 32 solicitudes, mientras que 75%
se recibe ms de 32. Mostrando que el mnimo de solicitudes que se recibi en un da fue de 22
y el mximo fue 76, de lo que podemos concluir que el departamento tuvo una mayor carga de
trabajo 75% de las veces.
El segundo cuartil tiene el nmero de orden 9, por lo tanto tiene como valor 49 que es el
localizado en el noveno lugar, indicando que 50% de los das se recibe menos de 49 solicitudes
y el otro 50% ms de 49 solicitudes.
El tercer cuartil est entre el trmino 13 y 14, lo cual da Q3
60 62
2
122
2
los das recibe menos de 61 solicitudes, mientras que slo 25% de los das recibe ms de 61 solicitudes.
El nmero de orden que ocupan los cuartiles para una serie de datos agrupados en una serie
de frecuencias se obtiene mediante las relaciones: n/ 4, n/ 2 y 3n/ 4. Al tener estos nmeros de orden
se procede a buscar la frecuencia acumulada que los contenga. Una vez localizada esa frecuencia se
elige la clase que contiene los distintos valores de la variable y el valor que corresponde a ese rengln
es el valor del cuartil.
Este mtodo exige que los datos sean continuos y que los valores observados en cada clase se
distribuyan regularmente (en forma de progresin aritmtica). Para situar cada uno de los cuartiles,
primero hay que encontrar los nmeros de orden que dividen a la serie en cuatro partes iguales,
mediante las relaciones n/ 4, n/ 2 y 3n/ 4. Posteriormente, se aplica la frmula:
Qi
Li
(No Fa )
I
fc
Donde:
Li = Lmite real inferior de la clase donde se encuentra el cuartil.
No = Lugar o posicin que le corresponde al cuartil.
Fa = Frecuencia acumulada anterior a la clase donde se encuentra el cuartil.
I = Amplitud del intervalo donde se ubica el cuartil.
fc = Frecuencia de la clase donde est el cuartil.
La cual es semejante a la utilizada en el clculo de la mediana.
Ejemplo 16
Se desea conocer a partir de los cuartiles Q1, Q2 y Q3 la variacin existente entre los salarios pagados
por hora a 65 obreros. Los datos se presentan a continuacin y se retoman de la tabla siguiente.
Salarios
50 59.99
60 69.99
70 79.99
80 89.99
90 99.99
100 109.99
110 119.99
fi
8
10
16
14
10
5
2
65
Fa
8
18
34
48
58
63
65
Li =
No =
Fa =
fc =
I =
Li
(N o Fa )
I
fc
59.995
16.25
8
10
69.99 59.99 = 10
Los datos se obtienen de la manera siguiente: la posicin del primer cuartil es No = 16.25,
por lo que la frecuencia de la clase donde se encuentra el primer cuartil es fc = 10 y la frecuencia
acumulada es = 18, correspondientes a la segunda clase 60 69.99. Como el cuartil se encuentra
en la segunda clase, la frecuencia acumulada de la clase anterior es Fa = 8; el lmite real inferior de
la segunda clase es Li = 59.995 y la amplitud del intervalo de esa clase se obtiene restando al lmite
superior, de esa clase, el lmite superior de la clase anterior.
Por lo tanto:
Q1
Li
(No Fa )
I
fc
59.995
(16.25 8)
10
10
59.995
8.25
10
10
59.995
82.5
10
El dato muestra que 25% de los obreros recibe un salario por hora menor que 68.245 pesos,
mientras que 75% recibe un salario mayor.
Para el cuartil 2:
NoQ2 = n/ 2 = 65/ 2 = 32.5 que se localiza en la tercera frecuencia acumulada que es 34,
correspondiente a la tercera clase, por lo tanto:
Li =
No =
Fa =
fc =
I =
69.995
32.5
18
16
79.99 69.99 = 10
Sustituyendo en la frmula.
Q2
Li
(N o Fa )
I
fc
69.995
(32.5 18)
10
16
69.995
14.5
10
16
69.995
145
16
13 3
fc = 10
I = 99.99 89.99 = 10
Sustituyendo en la frmula:
Q3
(No Fa )
I
fc
Li
89.995
(48.75 48)
10
10
89.995
0.75
10
10
89.995
7.5
10
Deciles
Los deciles son aquellos valores que dividen en diez partes una serie de datos y se representan por
D1, D2,, D9, denominados primer decil, segundo decil,..., noveno decil.
Si se desea dividir la serie ordenada de observaciones en diez partes iguales, resultan los deciles,
desde el primero hasta el noveno, que dejan desde 10% hasta 90% de observaciones con categoras
menores, respectivamente.
Para datos no agrupados, el primero, segundo, tercero,, noveno decil son los valores que se
obtienen para los nmeros de orden n/ 10, 2 n/ 10,, 9 n/ 10 de los casos observados comenzando
por la primera clase.
Ejemplo 17
Considerando el ejemplo 9 delassolicitudesdeempleo recibidaspor el departamento derecursoshumanos
de una empresa se pide calcular del decil D1 al D5, con el fin de conocer las variaciones que presenta la
distribucin. Los datos son: 22, 26, 28, 31, 33, 34, 37, 39, 49, 50, 52, 59, 60, 62, 67, 69, 74 y 76.
Los nmeros de orden para cada decil son:
N oD1
n
10
18
1.8
10
N oD2
(2 n)
10
N oD3
(3 n)
10
(3 18)
10
N oD4
(4 n)
10
(4 18)
10
N oD5
(5 n)
10
(2 18)
10
(5 18)
10
36
10
54
10
3.6
5.4
72
7.2
10
90
10
El primer decil muestra que le corresponde la posicin 1.8 que est situada entre el primero y el
segundo dato (22 y 26), por lo que su valor es:
13 4
(22 26) 48
24
2
2
El decil muestra que 10% de los das se recibi 24 solicitudes o menos y 90% se recibi 24
solicitudes o ms.
El segundo decil muestra que le corresponde la posicin 3.6 por lo que su valor se encuentra
entre el 28 y el 31, por lo que podemos tomar 30 como una aproximacin del segundo decil. De esto se
desprende que 20% de los das se recibi 30 solicitudes o menos y 80% se recibi 30 solicitudes o ms.
D1=
Al trabajar deciles para datos agrupados es necesario seguir con una metodologa similar a la
de la mediana y de los cuartiles. Por ello, la frmula para obtener el valor de los deciles es:
(No Fa )
I
fc
D1= L i
Donde:
Li = Lmite real inferior de la clase donde se encuentra el decil.
No = Lugar o posicin que le corresponde al decil.
Fa = Frecuencia acumulada anterior a la clase donde se encuentra el decil.
I = Amplitud del intervalo donde se ubica el decil.
fd = Frecuencia de la clase donde est el decil.
Ejemplo 18
Retomando los datos del ejemplo 16 y aplicando la frmula para interpolar (datos agrupados), que es
la misma que la que se aplic en el caso de los cuartiles, calcular los valores de los deciles 1, 2 y 5.
Salarios
50 59.99
60 69.99
70 79.99
80 89.99
90 99.99
100 109.99
110 119.99
fi
8
10
16
14
10
5
2
65
Fa
8
18
34
48
58
63
65
6.5
49.995
0
8
69.99 59.99 10
Estos datos se obtienen de la manera siguiente: la posicin del primer decil es No = 6.5, por lo
que la frecuencia de la clase donde se encuentra el primer decil fd = 8 y la frecuencia acumulada es
Fa = 8, correspondiente a la primera clase que es 50 59.99. Como el decil se encuentra en la primera
13 5
clase, la frecuencia acumulada de la clase anterior es Fa = 0, el lmite real inferior de la primera clase es
Li = 49.995 y la longitud del intervalo de esa clase se obtiene restando al lmite superior de la siguiente
clase, el lmite superior de esta clase.
D1
49.995
(6.5 0)
10
8
6.5
10 49.995
8
49.995
65
8
49.995
8.125
58.125
El primer decil muestra que 10% de los obreros recibe 58.12 pesos o menos por hora y 90%
recibe 58.12 pesos por hora o ms.
D2
59.995
(13 8)
10 = 59.995
10
5
10 = 59.995
10
50
= 59.995 + 5 = 64.995
10
Del decil dos se tiene que 20% de los obreros recibe 64.995 pesos por hora o menos, mientras
que 80% recibe 64.995 pesos o ms.
D5
69.995
(32.5 18)
10 = 69.995
16
14.5
10 =69.995
16
145
= 69.995 + 9.0625 = 79.0625
16
El quinto decil muestra que 50% de los obreros recibe por hora 79.06 pesos o menos y el otro
50% recibe por hora 79.06 pesos o ms.
Percentiles
El percentil p es un valor tal que a lo ms p por ciento de los datos es menor que l y a lo ms (10 0 p)
por ciento de los datos es mayor.
Por ejemplo, el percentil 90 para un conjunto de datos es un valor que excede 90% de los datos
y es menor que 10% de los datos.
En ocasiones se acostumbra tambin dividir una serie ordenada de observaciones en 100
partes iguales, dando lugar a los percentiles, desde el 1 hasta 99, que dejan desde 1% hasta 99% de
observaciones con categoras menores. El primero, segundo, tercero,, nonagsimo noveno percentil,
son los valores que corresponden a los nmeros de orden n/ 100, 2n/ 100, 3n/ 100 ,, 99n/ 100 de los
casos observados, comenzando por la primera clase.
La frmula que define el clculo de los percentiles es:
Pi
Li
(No Fa )
I
fp
Donde:
Li = Lmite real inferior de la clase donde se encuentra el percentil.
No = Lugar o posicin que le corresponde al percentil.
Fa = Frecuencia acumulada anterior a la clase donde se encuentra el percentil.
I = Amplitud del intervalo donde se ubica el percentil.
fp = Frecuencia de la clase donde est el percentil.
13 6
Ejemplo 19
Considerando los datos de la tabla 3.17, el percentil 35, representado por P35, es el valor que se
obtiene para el nmero de orden 35n/ 100, en este caso 35(65)/ 100 = 22.75, que se considera est
contenido en la tercera frecuencia acumulada 34 correspondiente a la tercera clase, aplicando la
frmula se obtiene:
P35
69.995
(22.75 18)
10 69.995
16
4.75
10 69.995
16
47.5
16
P75
89.995
(48.75 48)
10 89.995
10
0.75
10
10
7.5
10
89.995
De aqu que 35% de los trabajadores gana $72.955 o menos, 75% gana $90.74 o menos, y
as sucesivamente.
137
1.
Una fbrica quiere conocer el tiempo que tardan 200 obreros en producir una pieza cada uno.
Si la fbrica desea determinar la variacin que existe en el tiempo de produccin al respecto
tiempo promedio que tarda cada obrero, con el fin de mejorar la eficiencia, con los datos
siguientes calcula:
a)
b)
c)
El cuartil 1.
El decil 4.
El percentil 63.
Tiempo de produccin
fi
Fa
20.00 25.00
25.01 30.00
30.01 35.00
35.01 40.00
40.01 45.00
45.01 50.00
50-01 55.00
10
20
30
60
50
20
10
200
10
30
60
120
170
190
200
fi
Fa
0 14
15 29
30 44
45 59
60 74
75 89
7
19
27
13
6
3
75
7
26
53
66
72
75
13 8
El cuartil 3.
El decil 5.
El percentil 36.
Ejemplo 20
Una compaa de seguros desea conocer la variacin que existe en las ventas de sus ocho vendedores
y de esa manera determinar la productividad de cada uno de ellos. Calcula el rango empleando la
siguiente informacin de seguros vendidos durante un mes: 8, 11, 5, 14, 11, 8, 11, 16.
Si se desea hallar el rango de tales observaciones slo hay que identificar el valor mximo (16) y
el valor mnimo (5) y obtener la diferencia entre ellos.
Rango = Valor mximo Valor mnimo = 16 5 = 11
El rango es 11, lo cual quiere decir que la diferencia entre el nmero de seguros vendidos por dos
vendedores distintos, el mejor vendedor y el peor vendedor, es de 11, indicando una gran dispersin
o variabilidad, ya que sera ilgico que si un vendedor logra vender 16 seguros, el otro slo venda 5 si
se trata de los mismos seguros. Lo anterior puede atribuirse a la experiencia, a la capacitacin o a la
cartera de clientes que cada vendedor tiene.
Ejemplo 21
Un analista desea comparar el desempeo de la Bolsa Mexicana de Valores de dos meses:
septiembre y octubre de 2001. Para esto toma su principal indicador, el ndice de Precios y
Cotizaciones (I PC), y obtiene las siguientes grficas.
6 400
Mximo
6 200
6 233.29
6 000
5 800
5 600
5 400
Mnimo
5 200
5 081.92
5 000
Septiembre 2001
13 9
6 400
6 200
6 000
Mximo
5 808.22
5 800
5 600
5 400
Mnimo
5 361.8
5 200
5 000
4 800
Octubre 2001
Si se desea conocer en cul de los dos meses se present mayor volatilidad en el mercado de
valores encontramos los rangos del IPC en cada uno de ellos:
Rango en septiembre 2001 = 6 233.29 5 081.92 = 1 151.37
Rango en octubre
2001 = 5 808.22 5 361.8 = 446.42
Se puede decir que en el mes de septiembre de 2001, la Bolsa Mexicana de Valores registr
mayor volatilidad que en el mes de octubre, pues su rango de 1 151.37 fue superior al observado
durante el mes de octubre de 446.42.
Este resultado tambin puede apreciarse de manera visual en las figuras 3.6. y 3.7., donde los
rangos se representan por el diferencial existente entre el nivel mximo y el nivel mnimo del IPC.
En el mes de septiembre se observa un rango mucho ms ancho que el del mes de octubre, el cual se
atribuy al nerviosismo generado por los ataques terroristas del da 11 de septiembre en el Pentgono
y en el World Trade Center de Nueva York.
14 0
1.
2.
3.
5.
4.
5
4
2
6
El departamento de crdito y cobranza de una empresa quiere conocer la variacin que existe
en una muestra de 15 datos, correspondientes a los prximos cobros (en pesos) que debe hacer.
Calcula el rango para los datos siguientes:
10 000
9 000
13 200
12 000
13 500
12 600
15 000
12 700
14 000
16 000
9 700
18 700
15 000
18 000
16 500
141
3.4.2. Varianza
Es una medida de variabilidad que toma en cuenta la dispersin que los valores de los datos
tienen respecto a su media. Es decir, aquellos conjuntos de datos que tengan valores ms
alejados de la media, sea muestral o poblacional, tendrn una mayor varianza. Su resultado se
expresa en unidades al cuadrado.
Existen dos smbolos para representar la varianza ( 2 y S2). La S2 se refiere a un estadstico, es
decir, a la varianza de una muestra; mientras que 2 se refiere a un parmetro, es decir, a la varianza
de una poblacin. A la S2se le conoce como la varianza muestral mientras que a 2 se le conoce como
la varianza poblacional.
La manera de obtener la varianza de un conjunto de datos depende de la forma como se
encuentren organizados los datos, ya sea que estn agrupados o no agrupados, as como del tipo de
informacin con la que se trabaje, ya sea que provenga de una muestra o de una poblacin.
V (X )
(X
)2
N
Donde:
(Xi )2= Suma de los cuadrados de las desviaciones del valor de cada dato de la serie
respecto a la media poblacional.
Xi = El valor de cada dato de la serie.
= La media poblacional.
N = Tamao de la poblacin.
Es decir, la varianza de una poblacin para datos no agrupados es el promedio del cuadrado de
las desviaciones respecto a su media .
Cuando tenemos una variable cuya serie de datos no se encuentra agrupada, X1, X2, X3,, Xn, la
varianza muestral se calcula mediante la siguiente frmula:
S2
(X X)2
n 1
Donde:
(X i
X)2 = Suma de los cuadrados de las desviaciones del valor de cada dato de la serie
respecto a la media muestral.
Xi = El valor de cada dato de la serie.
X = La media muestral.
N = Tamao de la muestra.
A diferencia de lo que ocurre con otras frmulas, la varianza de una muestra no equivale
exactamente, en trminos de clculo, a la varianza de una poblacin. El denominador de la frmula
de la varianza poblacional es el total de la poblacin N, mientras que en la varianza muestral se
incluye un factor de correccin n 1.
14 2
2. Obtn cada una de las desviaciones respecto a la media, es decir, a cada uno de los
datos X1, X2,..., Xn se le resta la media obtenida en el paso anterior para quedar los
siguientes valores:
(X1 ), (X2 ),..., (Xn )
(X1 X), (X2 X),..., (Xn X)
3.
Eleva al cuadrado cada una de las desviaciones obtenidas en el paso anterior y sma las
entre s, para obtener la suma del cuadrado de las desviaciones:
(X )2 = (X1 )2 + (X2 )2 ++ (Xn )2
(X X)2 = (X1 X)2 + (X2 X)2 +...+ (Xn X)2
4.
La suma del cuadrado de las desviaciones respecto a su media se divide entre N, en caso de
una poblacin; o entre n 1, en caso de una muestra.
Varianza poblacional
V (X)
Varianza muestral
S2
X2i nX
n 1
X2i
N
Estas frmulas tienen la ventaja de simplificar las operaciones que se deben realizar cuando
se calcula la varianza, sea poblacional o muestral. Cabe sealar que las frmulas establecidas por el
mtodo corto nos conducen al mismo resultado que si se hubieran empleado las frmulas anteriores,
siempre y cuando no se hayan omitido algunos dgitos en las distintas operaciones. La conveniencia
de utilizar una u otra frmula queda sujeta a la libre eleccin del lector, segn la comodidad que le
produzca cada una de ellas para realizar las operaciones.
Ejemplo 22
Emplea los datos de las ventas de seguros del ejemplo 20 y calcula la varianza, suponiendo que los
datos constituyen la poblacin total de los agentes de seguro de la compaa.
Se tiene que la media es:
X
N
(8 11 5 14 11 8 11 16)
8
84
8
10.5
14 3
Para calcular la varianza se requiere obtener cada una de las diferencias o desviaciones de los
datos respecto a la media (X ), elevarlas al cuadrado (X )2 y sumar estos resultados:
(X )
X
8
11
5
14
11
8
11
16
(X )2
6.25
0.25
30.25
12.25
0.25
6.25
0.25
30.25
86
2.5
0.5
5.5
3.5
0.5
2.5
0.5
5.5
0
V (X)
(X i
N
)2
86
10.75
8
Puede apreciarse que la varianza es de 10.75. Sin embargo, esta medida de variacin no tiene
un significado prctico debido a que el resultado obtenido est expresado en trminos cuadrados, es
decir, la variabilidad de seguros vendidos es de 10.75 seguros cuadrados.
Por esa razn, la varianza slo tiene sentido lgico cuando comparamos diferentes conjuntos de
datos con la misma unidad de medida, es decir, su interpretacin es una medida relativa en el sentido
de que aquel conjunto que tenga la mayor varianza ser el de mayor grado de dispersin.
Por otra parte, si el lector hubiera optado por el mtodo corto para estimar la varianza
poblacional, el resultado hubiera sido el mismo. Para ello debemos estimar Xi2 y 2:
Xi2 = 82 + 112 + 52 + 142 + 112 + 82 + 112 + 162
= 64 + 121 + 25 + 196 + 121 + 64 + 121 +256 = 968
2
= 10.52 = 110.25
V (X)
X2i
N
968
8
Si se compara este resultado mediante el mtodo corto con el primer mtodo, se puede apreciar
que los resultados no fueron distintos.
Ejemplo 23
En las tablas 3.21 y 3.22 se exponen las cotizaciones mensuales del tipo de cambio entre el peso
mexicano y el dlar estadounidense para los aos de 1995 y 2000. Observa cuidadosamente la
informacin contenida en cada tabla.
a)
14 4
Realizando una inspeccin visual, en cul de losdosaosse observa una mayor estabilidad
en el tipo de cambio?
b)
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Se observa que los valores del tipo de cambio en el ao de 1995 se encuentran muy dispersos
entre s, lo que indica una gran variabilidad o inestabilidad en el mercado cambiario. En contraste,
en el ao 2000 se puede observar que los valores de la divisa estadounidense se encuentran poco
dispersos por lo que se esperara que la varianza en este ao sea menor a la de 1995.
Como losdatosno seencuentran organizadosmediantetablasdefrecuencias, procedemosaencontrar
la varianza muestral para datos no agrupados, obteniendo en primer lugar sus medias respectivas:
La media de 1995 es: X
X
N
77.84
12
X
N
113.39
12
6.48
9.44
Procedemos a encontrar la suma del cuadrado de las desviaciones del tipo de cambio respecto a
la media, de acuerdo con las siguientes tablas:
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Suma
(X X)
0.79
0.65
0.33
0.70
0.31
0.18
0.40
0.17
0.07
0.69
1.17
1.16
(X X)2
0.6241
0.4225
0.1089
0.49
0.0961
0.0324
0.16
0.0289
0.0049
0.4761
1.3689
1.3456
5.1584
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Suma
(X X)
0.03
0
0.15
0.07
0.06
0.35
0.02
0.16
0.11
0.07
0.07
0
(X X)2
0.0009
0
0.0225
0.0049
0.0036
0.1225
0.0004
0.0256
0.0121
0.0049
0.0049
0
0.2023
14 5
De los resultados obtenidos en las tablas 3.23. y 3.24., se divide la suma del cuadrado de las
desviaciones entre n 1 y as se obtiene la varianza muestral del tipo de cambio para los aos de
1995 y 2000.
Para el ao de 1995
S2
(X i X)2
n 1
5.1584
11
Para el ao 2000
S2
(X i X)2
n 1
0.2023
0.0183
11
0.4689
pesos al cuadrado
pesos al cuadrado
Si bien los pesos al cuadrado continan siendo una idea abstracta, ambas varianzas tienen sentido
lgico cuando son comparadasentre s, puesse encuentran expresadasen la misma unidad de medida. En
este caso, el tipo de cambio en el ao de 1995 tiene una mayor dispersin que el observado en el ao 2000,
tal como lo sealan ambas varianzas y tal como lo apreciamos de manera visual en el inciso anterior.
Este contraste se debe a la diferencia en losescenariosmacroeconmicosque se vivieron durante
esos aos. Al ser mayor la varianza del ao 1995, se refleja una gran volatilidad y nerviosismo en el
mercado cambiario producido por una fuerte crisis econmica que se viva en ese ao. En el ao 2000
podemos observar que el peso mexicano goz de una gran fortaleza, pues su cotizacin se mantuvo
muy estable en el transcurso de los 12 meses, incluso en el mes de junio, cuando se presentaba la recta
final de un proceso electoral en el pas.
i)
)2 f j ]
[(mj
N
Donde:
2
= Varianza de la poblacin.
mj = Punto medio de clase.
= Media de la poblacin.
N = Tamao de la poblacin.
f = Frecuencia de la clase.
ii)
[(mj
X)2 fj ]
n 1
Donde:
S2 = Varianza de la muestra.
mj = Punto medio de clase.
14 6
X = Media de la muestra.
n = Tamao de la muestra.
f = Frecuencia de la clase.
Para obtener la varianza para datos agrupados, sea muestral o poblacional, se tienen que realizar
los siguientes pasos:
1.
Se obtiene la media muestral o poblacional para datos agrupados, segn corresponda. Por
ejemplo, si se pretende obtener la varianza muestral, entonces procedemos a encontrar la
media a travs de la siguiente frmula:
X
2.
mj f
f
Se encuentran los puntos medios para cada una de las clases m1,m2,...,mn y a cada uno se
resta la media muestral o poblacional segn corresponda. Por ejemplo, para el caso de la
varianza muestral se encontraran las siguientes desviaciones:
(m1 X), (m2
3.
Se eleva al cuadrado cada una de las desviaciones de los puntos medios de clases respecto
a la media. Por ejemplo, en caso de una poblacin:
(X1
4.
)2 , (X2
)2 ,..., (X n
)2
Cada uno de los cuadrados se multiplica por su respectiva frecuencia de clase. Por ejemplo,
en el caso de una poblacin:
(X1
5.
X),..., (mn X)
)2 f1, (X2
)2 f2 ,..., (X n
)2 fn
Se suma cada uno de estos resultados y se divide, en el caso de la varianza poblacional, entre
el nmero total de datos de la poblacin (N), y en el caso de una muestra entre el n 1.
Ejemplo 24
Una gran empresa de ventas por telfono quiere conocer la variacin existente en las ventasrealizadas
(en miles de pesos) por sus operadores. Para esto realiza una muestra de 25 operadores telefnicos,
obteniendo los resultados de la siguiente tabla. Calcula la varianza muestral.
Ventas (miles $)
5.00 8.99
9.00 12.99
13.00 16.99
17.00 20.99
21.00 24.99
25.00 28.99
f
3
5
7
6
3
1
25
147
Las clases denotan las ventas realizadas en miles de pesos y la frecuencia del nmero de
operadores telefnicos.
Ventas (miles de $)
mj
(mj f)
(mj X)
(mj X)2
[(mj X)2] f
5.00 8.99
9.00 12.99
13.00 16.99
17.00 20.99
21.00 24.99
25.00 28.99
3
5
7
6
3
1
25
6.995
10.995
14.995
18.995
22.995
26.995
20.985
54.975
104.965
113.97
68.985
26.995
390.875
8.64
4.64
0.64
3.36
7.36
11.36
74.6496
21.5296
0.4096
11.2896
54.1696
129.0496
223.9488
107.648
2.8672
67.7376
162.5088
129.0496
693.76
mj f
n
390.875
=15.635
25
Se obtiene la varianza restndole a cada punto medio de clase la media muestral, elevando cada
una de estas diferencias al cuadrado y multiplicando cada diferencia cuadrtica por la frecuencia
respectiva de clase de la manera siguiente:
S2
[(mj X)2 f j ]
n 1
693.76
(25 1)
693.76
24
La varianza obtenida seala que la dispersin existente entre las ventas entre
(n 1) es de 28.90666667 miles de pesos al cuadrado.
14 8
1.
a)
b)
c)
d)
2.
3.
Cualquier valor.
Un valor mayor o igual a cero.
Un valor igual a cero.
Tanto valores positivos como negativos, excepto el cero.
5.
Si tenemos cinco datos cuyos valores son las constantes: 2, 2, 2, 2 y 2; entonces la varianza es:
a)
b)
c)
d)
4.
2
4
0
1
Con los siguientes datos de crdito y cobranza, calcula la varianza para datos no agrupados, con
el fin de determinar la variabilidad de los datos de los prximos cobros (en pesos).
10 000
9 000
13 200
6.
12 000
13 500
12 600
15 000
12 700
14 000
16 000
9 700
18 700
15 000
18 000
16 500
f
25
31
42
45
52
42
35
28
300
Distribucin de salarios.
UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL
14 9
(X X)2
n 1
Cuando se trabaja con datosagrupados, la desviacin estndar tambin se calcula sacando la raz
cuadrada, pero empleando las frmulas respectivas de la varianza para datos agrupados:
)2 f j ]
[(mj
N
[(mj X )2 f j ]
n 1
Tanto en datos no agrupados como en datos agrupados, indica la desviacin estndar para
una poblacin, mientras que la Srepresenta la desviacin estndar para una muestra.
Ejemplo 25
Una casa de bolsa desea realizar un comparativo entre los rendimientos anuales y los riesgos de dos
instrumentos financieros que han estado operando durante los ltimos siete aos. Sus rendimientos
anuales, expresados en porcentajes, son los siguientes:
Instrumento A: 4.0% 14.3% 19.5% 14.7% 26.5% 37.2% 23.8%
Instrumento B: 6.5% 4.4% 4.8% 6.9% 8.5% 5.8% 5.1%
Obtener la media y la desviacin estndar de los rendimientos observados por los dos
instrumentos financieros.
En primer lugar se obtiene el rendimiento promedio por instrumento:
A
X
N
140
7
X
N
6%
42
7
20%
Accin A
(X )2A = (4 20)2 + (14.3 20)2 ++(23.8 20)2 = 669.36
(X
)2
N
V ( X )A
(X
)2
N
669.36
7
95.62285714
95.62285714
9.778694041
Accin B
(X )2B = (6.5 6)2 + (4.4 6)2 + + (5.1 6)2 = 12.16
(X
)2
N
V (X)B
(X
)2
N
12.16
1.737142857
7
1.737142857 1.318007154
Puede observarse que el instrumento A tiene una variabilidad de 9.778694041%, mient ras
que el i nst r ument o B t uvo una variabi lidad de 1.318007154%. Esto indicaquelosrendimientos
del instrumento A tienen una mayor dispersin que los rendimientos del instrumento B.
En el contexto de este ejemplo puede pensarse en la desviacin estndar como una medida de
la incertidumbre o riesgo de la rentabilidad de una inversin. Es decir, la rentabilidad promedio fue
mayor para el instrumento A, pero su riesgo en trminos de la desviacin estndar de la rentabilidad
tambin fue mayor.
Por otra parte, para obtener la desviacin estndar cuando se trabaja con datos agrupados se
utiliza la misma metodologa que en el caso de los datos no agrupados. En primer lugar se encuentra
la varianza a travs de su respectiva frmula y posteriormente se le saca la raz cuadrada.
Ejemplo 26
Con los datos del ejemplo 5 calcula la desviacin estndar.
(mj
X)2 fj
n 1
693.76
24
28.90666667 5.376492041
Con este resultado se deduce que la variacin promedio que existe en las ventas realizadas por
telfono es de 5.38 miles de pesos. Esto puede ayudar a la empresa a analizar las ventas que realizan
los operadores de una manera ms sencilla que utilizando ventas al cuadrado.
151
Es utilizada para comparar la dispersin entre distintos conjuntos de datos. Aquellos conjuntos
que tengan valores ms alejados de la media tendrn una mayor desviacin estndar, mientras que
aquellos conjuntos con valores ms cercanos a la media mostrarn una menor desviacin estndar.
Al igual quelavarianza, unadesventajadeladesviacin estndar esquetampoco puedecomparar
la dispersin de dos conjuntos de datos que se expresan en diferentes unidades de medida.
152
1.
Con los datos de crdito y cobranza que se presentan a continuacin, calcula la desviacin
estndar de los prximos cobros.
10 000
9 000
13 200
2.
12 000
13 500
12 600
15 000
12 700
14 000
16 000
9 700
18 700
15 000
18 000
16 500
Con los siguientes datos de los ingresos anuales (en miles de pesos) de 300 familias, calcula
la desviacin estndar.
Ingreso (miles de $)
1.50 2.999
3.00 4.999
5.00 6.999
7.00 8.999
9.00 10.999
11.00 12.999
13.00 14.999
15.00 16.999
f
25
31
42
45
52
42
35
28
300
Distribucin de salarios.
15 3
Xi
Xi
X
S
Ejemplo 27
Si tenemos una muestra cuya media es X= 50.5 y su desviacin estndar es S= 10, y se desea conocer
a qu distancia de la media se encuentra un dato en especfico de la muestra, por ejemplo X = 18.5,
aplicamos la siguiente frmula:
Z
Xi
X
S
18.5 50.5
10
3.2
Lo anterior quiere decir que el nmero 18.5 se encuentra a 3.2 veces la desviacin estndar por
debajo de la media 50.5. Observa que el 18.5 es inferior al valor 50.5 de la media.
Ejemplo 28
Si tenemos una poblacin cuya media es = 300 y su desviacin estndar es = 100, y se desea
conocer a qu distancia de la media se encuentra un dato en especfico de la poblacin, por ejemplo
X = 450, aplicamos la siguiente frmula:
Z
Xi
450 300
1.5
100
Es decir, el nmero 450 se encuentra a 1.5 veces la desviacin estndar por encima de la media
50.5. Observa que el 450 es superior al valor 300 de la media.
Teorema de Tchebysheff
El teorema de Tchebysheff seala cul esel porcentaje mnimo de datos que se acumulan alrededor de
la media dentro de una distancia equivalente a Z veces la desviacin estndar de la media. Para esto
se utiliza la siguiente frmula:
15 4
1
100%
Z2
Donde:
Z = Nmero de desviaciones estndar
Por lo tanto, el teorema de Tchebysheff seala que para cualquier tipo de distribucin de datos
se cumple lo siguiente:
1.
Al considerar una distancia de dos desviaciones estndar (Z = 2), al menos 75% de los
1
100% = 75%) debe estar contenido dentro del rango que se encuentra a
datos 1
(22 )
2 desviaciones estndar por encima de la media ( + 2 ) y a 2 desviaciones estndar
por debajo de la media ( 2 ).
2.
Al tomarse en cuenta una distancia de tres desviaciones estndar (Z=3), al menos 88.89%
1
de los datos 1
100% = 88.89%) debe estar contenido dentro del rango que se
(32 )
encuentra a 3 desviaciones estndar por encima de la media ( + 3 ) y a 3 desviaciones
estndar por debajo de la media ( 3 ).
3.
+3
Media
+2
75 %
88.89 %
93.75 %
15 5
Ejemplo 29
Con los datos del ejemplo 22, calcula el porcentaje mnimo de los datos que se encuentran dentro
del rango de 2.5 desviaciones estndar por encima y por debajo de la media, as como los valores que
delimitan este rango.
La media de los datos es 10.5, la varianza 10.75 y la desviacin estndar 3.278719262. A una
distancia de 2.5 desviaciones estndar (Z = 2.5):
1
1
100%
(2.5)2
1
84)(100) = 84%
100% [1 (0.16)] 100 = (0.8
6.25
El resultado implica que al menos 84% de las ventas debe estar a una distancia de 2.5 veces la
desviacin estndar por encima y por debajo de la media.
Para calcular los valores exactos que delimitan el rango de 2.5 veces la desviacin estndar, por
encima y por debajo de la media, se realizan las siguientes operaciones:
Valor inferior:
Valor superior:
Es decir, dentro del intervalo denotados por los valores 2.3032 y 18.6967 se encontrarn
concentrados como mnimo 84% de los datos alrededor de la media, = 10.5. Si verificamos en el
ejemplo 22, los datos de la serie 8, 11, 5, 14, 11, 8, 11 y 16 observamos que en este ejemplo se cumple
con facilidad el teorema de Tchebysheff, pues dentro del intervalo arriba expuesto se encuentran
depositados todos los datos de la serie (100% de los datos), superando as el porcentaje mnimo
sealado de 84% del total de los datos. Estos resultados se pueden apreciar en la figura siguiente.
Media = 10.5
84 %
2.5
+2.5
10.5
2.3032
18.6967
Ejemplo 30
En la tabla siguiente se expone la participacin mensual de la inversin extranjera en el mercado
accionario de la Bolsa Mexicana de Valores, durante el ao 2000.
15 6
a)
Calcula el porcentaje mnimo de datos que se encuentra dentro del rango de 1.5 veces la
desviacin estndar por arriba y por debajo de la media.
b)
Mes
2000
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
44.01
46.58
44.78
47.25
45.07
46.69
44.07
44.96
44.72
44.62
43.03
41.31
1
100%
(1.5)2
1
100% [1 (0.4444)] 100 (0.5556) (100) 55.56%
2.25
Al menos 55.56% de los datos debe estar a una distancia de 1.5 veces la desviacin estndar por
encima y por debajo de la media. Los valores exactosque delimitan el rango de 1.5 veces la desviacin
estndar, por encima y por debajo de la media, son los siguientes:
Valor inferior:
Valor superior:
Como mnimo, 55.56% de los 12 datos registrados en la tabla anterior debe estar a
una distancia de 1.5 desviaciones estndar respecto a su media (44.7575), es decir, entre los
valores 42.3083 y 47.2067. Para constatar que se cumple el teorema de Tchebysheff se expone
esta informacin en el siguiente diagrama:
48
47.25
47
46
Media = 44.7575
45
44
43
42
41
40
39
38
157
En la figura anterior se observa que nicamente dos valores, 47.25 y 41.31, quedaron excluidos
del rango determinado por los valores 47.2067 y 42.3083. De esta manera observamos que 10
datos de los 12 que t iene la serie est n incluidos dent ro del rango sealado por los valores
1.5 y + 1.5 , lo que representa un porcentaje de 83.33% [(10/ 12)*100], cumpliendo con facilidad
el mnimo requerido por el teorema de Tchebysheff, de 55.55%, para una desviacin estndar de 1.5.
La regla emprica
Un caso particular de los conceptos sealados por el teorema de Tchebysheff es cuando tenemos un
conjunto de datos cuya distribucin tiene la figura acampanada y simtrica. En este caso, la relacin
que existe entre el porcentaje de datos que se encuentran contenidos dentro de un intervalo y la
desviacin estndar respecto a la media que determina este intervalo es la siguiente:
1.
Aproximadamente ms de dos terceras partes centrales del conjunto de datos (68%) estn
comprendidasentre dosvaloresque se encuentran a una distancia de la media equivalente a
la desviacin estndar, tanto por la parte superior como por la parte inferior de la media.
2.
3.
A este conjunto de relaciones se le conoce como la regla emprica. Por ejemplo, en el caso de una
distribucin de frecuencias simtrica podemos observar el siguiente grfico:
Media
La distancia indica el espacio donde se concentra 68%de los
datos que tiene una variacin de dos desviaciones estndar.
15 8
15 9
Asimismo, McDonalds est afiliado con organizaciones como Disney Co., Mattel, Copa
Mundial de Futbol Soccer (FIFA), NFL, Juegos Olmpicos y NBA.
Ahora bien, se realiz lo siguiente y se pide cierta informacin e intepretacin.
Se tom una muestra de ventas anuales en miles de pesos en 100 sucursales diferentes de
McDonalds en el pas, complementa el siguiente cuadro:
Resultados de las ventas una muestra de 100 sucursales de McDonalds en el pas
16 0
Clase
Punto
medio mi
Frecuencia
fi
500 599
600 699
700 799
800 899
900 999
1 000 1 099
1 100 1 199
1 200 1 299
1 300 1 399
1 400 1 499
1 500 1 599
1 600 1 699
550
650
750
850
950
1 050
1 150
1 250
1 350
1 450
1 550
1 650
4
7
8
10
12
17
13
9
8
7
3
2
fi mi
Media X
mi X
(mi X)2
fi (mi X)2
1.
2.
3.
Proceso de elaboracin:
Caso McDonalds.
Punto
medio mi
Clase
500 599
600 699
700 799
800 899
900 999
1 000 1 099
1 100 1 199
1 200 1 299
1 300 1 399
1 400 1 499
1 500 1 599
1 600 1 699
Frecuencia
fi
550
650
750
850
950
1 050
1 150
1 250
1 350
1 450
1 550
1 650
1 100
1.
Media X
2.
Varianza S2
4
7
8
10
12
17
13
9
8
7
3
2
100
fi M i
n
fi mi
Media X
mi X
(mi X)2
fi (mi X)2
2 200
4 550
6 000
8 500
11 400
17 850
14 950
11 250
10 800
10 150
4 650
3 300
105 600
1 056
1 056
1 056
1 056
1 056
1 056
1 056
1 056
1 056
1 056
1 056
1 056
506
406
306
206
106
6
94
194
294
394
494
594
256 036
164 836
93 636
42 436
11 236
36
8 836
37 636
86 436
155 236
244 036
352 836
1 024 144
1 153 852
729 088
424 360
134 832
612
114 868
338 724
691 488
1 086 652
732 108
705 672
7 156 400
105 600
1 056
100
fi (Mi X)2
n 1
7 156 400
99
72 286.9
Este resultado nos dice que tenemos una dispersin de 72,286.9 [$]2respecto de la media;
esta medida de dispersin por s misma no proporciona informacin relevante; si nosotros
comparsemos este resultado con la varianza resultante de las ventas anuales de 100 tiendas
de McDonalds de otro pas, podramos comparar ambos resultados y la que tenga la mayor
varianza ser la que tenga un mayor grado de dispersin y por tanto podramos decir que las
ventas anuales son menos estables que en el pas que tiene menor grado de dispersin.
3.
Desviacin estndar S
S2
72 286.9 268.7
Se obtiene una desviacin estndar de 268 pesos; con este dato podemos determinar la
distancia, en unidades de desviacin estndar, a la que se encuentran distanciadas las ventas
anuales de cada tienda de McDonalds respecto de la media. Por ejemplo, una sucursal que
tiene ventas anuales de 520 mil pesos, a cuntas desviaciones estndar estar alejada de la
media de las ventas anuales de todas las tiendas?
161
1.
2.
En una distribucin de datos, al menos 75% de los datos est contenido dentro de:
a)
b)
c)
d)
3.
16 2
La regla emprica seala que aproximadamente 68% de los datos se encuentra entre los valores
que encuentran a:
a)
b)
c)
d)
6.
Seala el porcentaje mnimo de los datos centrales que deben estar contenidos a una distancia
de 3 veces la desviacin estndar por encima y por debajo de la media (k = 3):
a)
b)
c)
d)
5.
En cualquier distribucin, al menos 93.75 % de los datos se encuentran contenidos dentro del
rango que se encuentra a:
a)
b)
c)
d)
4.
5 desviaciones estndar.
3.33 desviaciones estndar.
1.66 desviaciones estndar.
0.3 desviaciones estndar.
Asimtricas y acampanadas.
Acampanadas y simtricas.
De cualquier tipo.
Simtricas y no acampanadas.
7.
La regla emprica seala que los valores que se encuentran a 3 veces la desviacin estndar por
encima y por debajo de la media, aproximadamente, se observa el:
a)
b)
c)
d)
8.
Si en una distribucin cuya media es 16.5 y desviacin estndar de 4.3, calcula el porcentaje
mnimo que se encuentra dentro del rango de tresveces la desviacin estndar por encima y por
debajo de la media, as como sus respectivos valores que delimitan este rango.
9.
Si en una distribucin cuya media es 2000 y desviacin estndar de 300, calcula el porcentaje
mnimo que se encuentra dentro del rango de 1.2 veces la desviacin estndar por encima y por
debajo de la media, as como sus respectivos valores que delimitan este rango.
10.
16 3
S
100%
X
CV
100%
Donde:
CV = Coeficiente de variacin.
S = Desviacin estndar de la muestra.
X = Media de los datos.
= Desviacin estndar de la poblacin.
= Media poblacional.
Ejemplo 31
Con los datos del ejemplo 25, calcula el coeficiente de variacin con el fin de hacer una comparacin
de los rendimientos de las acciones:
CVA
CVB
SA
100%
9.778694041
100 (0.488934702) (1
100)
20
100%
1.318007154
100 (0.219667859) (100) 21.9667859%
6
SB
B
48.8934702%
16 4
Ejemplo 32
Losanalistasde un centro financiero desean comparar el desempeo del tipo de cambio y el porcentaje
de la participacin extranjera en el mercado accionario de la Bolsa Mexicana de Valores durante el
ao 2000. Para esto se calcula el coeficiente de variacin para cada uno de los mercados.
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Tipo de cambio en el
2000
9.47
9.44
9.29
9.37
9.50
9.79
9.46
9.28
9.33
9.51
9.51
9.44
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Inversin extranjera
en el 2000
44.01
46.58
44.78
47.25
45.07
46.69
44.07
44.96
44.72
44.62
43.03
41.31
Las variables que se desean comparar vienen expresadas en diferentes unidades de medida; el tipo
de cambio se expresa en pesos mientras que la inversin extranjera se representa en proporciones. Por tal
razn, se calculan loscoeficientesde variacin para cada una delasvariablesy as se compara lavariabilidad
de ambos mercados. Para ello tomamos las medias y las desviaciones estndar de los ejemplos 4 y 11.
CVTipodecambio
CVInv. extranjera
S
100%
X
S
100%
X
0.1352
100 (0.0143)(100) 1.43%
9.44
1.6328
100 (0.03
364) (100) 3.64%
44.7575
Los analistas de este centro financiero pueden concluir que el mercado cambiario durante el ao
2000 tuvo mayor estabilidad que la participacin extranjera en el mercado accionario, puesel coeficiente
de variacin del primero fue de 1.43%, mientras que el del segundo fue de 3.64%. De esta forma, los
analistas comparan la variacin de dos mercados que tienen distintas unidades de medicin.
16 5
1.
El coeficiente de variacin es una medida de dispersin que expresa sus resultados como:
a)
b)
c)
d)
2.
3.
4.
Unidades mtricas.
Desviaciones estndar.
Porcentajes.
Desviaciones respecto a la media.
Una casa de cambio desea conocer la variacin existente entre el valor de dos monedas (pesos/
dlar y pesos/ libra ) en las transacciones de 10 das para determinar qu moneda es la que
representa una mayor estabilidad. Con los siguientes datos, calcula el coeficiente de variacin.
Dlar 150 125 120 200 250 175 200 250 180 140
Libra 200 275 180 195 280 250 240 200 300 290
16 6
(Xj
)3
N
3 Poblacional
3 Muestral
( )3
(S)3
Para el caso de datos agrupados, las frmulas del ndice de asimetra son:
[ ( mj X)3 ] f
n 1
)3 ] f
[(mj
N
3 Poblacional
3 Muestral
( )3
Donde:
= Coeficiente de asimetra.
3
mj = Punto medio de clase.
= Media poblacional.
=
Media muestral
X
n = Tamao de la muestra.
f =
=
S=
N=
(S)3
Frecuencia de clase.
Desviacin estndar de la poblacin.
Desviacin estndar de la muestra.
Tamao de la poblacin.
2.
16 7
3.
= 0.
Moda
Mediana
Media
Cola
> 0.
Moda
Mediana
Media
< 0.
Ejemplo 33
Calcula el ndice de asimetra para determinar qu tipo de sesgo tiene la siguiente serie de datos
de una poblacin: 1, 1, 2, 2, 2, 3, 3, 4, 5 y 6.
Para obtener el ndice de asimetra, primero debemos encontrar cada uno de los elementos de
su frmula.
Se encuentra la media poblacional:
X
N
16 8
(1 1 2 ... 6)
10
29
2.9
10
V (X)
24.9
10
2.49
3.86
(Xj
24.48
10
3.86
n
3
( )3
2.448
3.86
0.6341
Se obtiene un ndice de asimetra positivo, por lo que se puede decir que la distribucin tiene
un pequeo sesgo positivo o derecho. Si se observa la figura de la distribucin de frecuencias, se
notar que tiene una cola que se alarga hacia el lado derecho de la distribucin:
Moda
Mediana
Media
Ejemplo 34
Con la informacin del ejemplo 5, calcula el coeficiente de asimetra para saber hacia qu lado se
carga la cola de la curva de estos datos.
Tiempo de servicio
mj
5.00 8.99
9.00 12.99
13.00 16.99
17.00 20.99
21.00 24.99
25.00 28.99
3
5
7
6
3
1
25
6.995
10.995
14.995
18.995
22.995
26.995
(mj f)
20.985
54.975
104.965
113.97
68.985
26.995
390.875
(mj X)
8.64
4.64
0.64
3.36
7.36
11.36
(mj X)3
644.972544
99.897344
0.262144
37.933056
398.688256
1 466.003456
[(mj X)3] f
1 934.917632
499.48672
1.835008
227.598336
1 196.064768
1 466.003456
453.4272
16 9
390.875
15.635
25
X)2 f
(mj
S2
n 1
X)2 f
(mj
n 1
693.76
(25 1)
693.76
24
28.90666667
28.90666667 5.376492041
X)3 f
453.4272
18.8928
24
n 1
( mj
n 1
3
(S)
18.8928
(5.376492041)3
18.8928
0.121562411
155.4164633
170
1.
2.
3.
> 0:
En una distribucin
a)
b)
c)
d)
= 0:
< 0:
4.
5.
f
25
31
42
45
52
42
35
28
300
Distribucin de salarios.
171
3.7.1. Kurtosis
El ndice de kurtosis es una medida de dispersin mediante la cual se conoce qu tan concentrados
o qu tan dispersos se encuentran los datos alrededor de la media. Su resultado representa el grado
de apuntamiento de una distribucin, es decir, qu tan puntiaguda o qu tan aplanada es la curva de
una distribucin. Cuando es muy puntiaguda se dice que los datos se encuentran muy concentrados
alrededor de la media, mientrasque si es muy chata o aplanada, se dice que existe una gran dispersin
de los datos alrededor de la media.
Para encontrar el ndice de kurtosis, las frmulas dependen de la informacin con la que se
trabaje y de la manera en que se encuentren organizados los datos, ya sea que se trate de una muestra
o de una poblacin, o que los datos se encuentren no agrupados o agrupados. Se representa mediante
la expresin 4.
Para el caso de datos no agrupados, la kurtosis poblacional y muestral se expresan mediante las
siguientes frmulas:
( X j X)4
n 1
)4
(X j
N
4 Poblacional =
4 Muestral
( )4
(S)4
Para el caso de datos agrupados, la kurtosis poblacional y muestral se obtienen utilizando las
siguientes frmulas:
( mj X )4 f
n 1
)4 f
( mj
N
4 Poblacional
( )4
Donde:
= Coeficiente de kurtosis.
4
mj = Punto medio de clase.
X = Media de la muestra.
f = frecuencia de la clase.
= Media poblacional.
4 Muestral
n=
=
=
=
(S)4
Tamao de la muestra.
Tamao de la poblacin.
Desviacin estndar poblacional.
Desviacin estndar de la muestra.
172
1.
2.
3.
Si el ndice de kurtosis es menor a tres ( 4 < 3), la distribucin es muy plana, es decir, los
datos se encuentran muy dispersos del valor de la media. A este tipo de distribucin se le
conoce como distribucin platicrtica.
> 3
=3
< 3
Ejemplo 35
Empleando los datos del ejemplo 5, calcula el coeficiente de kurtosis para saber cmo es la forma de
la curva de estos datos.
Tiempo de servicio
5.00 8.99
9.00 12.99
13.00 16.99
17.00 20.99
21.00 24.99
25.00 28.99
mj
3
5
7
6
3
1
25
6.995
10.995
14.995
18.995
22.995
26.995
(mj f)
20.985
54.975
104.965
113.97
68.985
26.995
390.875
(mj X)
(mj X)4
[(mj X)4] f
8.64
4.64
0.64
3.36
7.36
11.36
5 572.56278
463.5236762
0.16777216
127.4550682
2 934.345564
16 653.79926
1 6717.68834
2 317.618381
1.17440512
764.7304092
8 803.036692
16 653.79926
45 258.04749
(mj f )
n
390.875
15.635
25
S2
(mj X)2 f
n 1
(mj X)2 f
n 1
693.76
(25 1)
693.76
24
28.90666667
28.90666667 5.376492041
17 3
X)4 f
45258.049
1 885.751979
24
n 1
(S)
1 885.751979
(5.376492041)4
1 885.751979
2.25677646
835.5953778
Con el resultado se puede observar que el coeficiente es menor a tres, por lo que la
distribucin se caracteriza por ser platicrtica, es decir, que la curva tiene una forma tal que
su apuntamiento es achatado, tal y como se muestra a continuacin:
174
1.
2.
Si el ndice de kurtosis
a)
b)
c)
d)
3.
5.
La distribucin es asimtrica.
La distribucin es mesocrtica.
La distribucin es leptocrtica.
La distribucin es platicrtica.
Si el ndice de kurtosis
a)
b)
c)
d)
La distribucin es asimtrica.
La distribucin es mesocrtica.
La distribucin es leptocrtica.
La distribucin es platicrtica.
Si el ndice de kurtosis
a)
b)
c)
d)
4.
La distribucin es asimtrica.
La distribucin es mesocrtica.
La distribucin es leptocrtica.
La distribucin es platicrtica.
Con los siguientes datos de los ingresos anuales (en miles) de 300 familias, calcula el coeficiente
de kurtosis para conocer cmo es la forma de la curva de distribucin:
Ingreso (miles de $)
1.50 2.999
3.00 4.999
5.00 6.999
7.00 8.999
9.00 10.999
11.00 12.999
13.00 14.999
15.00 16.999
f
25
31
42
45
52
42
35
28
300
Distribucin de salarios.
175
wi X i
wi
Donde:
X i = valor del dato i.
wi = frecuencia o peso del dato i.
Para el caso de una poblacin aplica la misma frmula pero sustituimos la Xw por
Resumiendo, si el origen de los datos es una muestra, entonces estaremos hablando de la media
ponderada de la muestra; pero si el origen es una poblacin, entonces nos referiremos a la media
ponderada poblacional.
Ejemplo 36
Un almacn general necesita actualizar sus tarifas de almacenaje por da para mejorar su
competitividad. El administrador del almacn solicit informacin sobre el costo promedio por
metro cbico de almacenaje.
176
Contrato
Costo por m3
m3
1
2
3
4
5
6
7
8
9
10
$50.00
$43.00
$38.00
$30.00
$40.00
$43.00
$39.00
$50.00
$45.00
$40.00
1
8
25
30
10
9
27
4
6
15
5154
135
De acuerdo con el clculo realizado, el costo promedio diario ponderado por m3 almacenado
es de $38.18.
Este resultado lo utilizaremos ms adelante para tomar decisiones al respecto.
Continuando con el almacn general, el administrador necesita conocer cul es el tiempo
promedio que se almacenan las diferentes mercancas, para lo cual se desarroll la siguiente
distribucin de frecuencias.
Das de almacenaje
Frecuencia (fi)
1 a 10
11 a 20
21 a 30
31 a 40
41 a 50
51 a 60
61 a 70
71 a 80
81 a 90
20
28
19
30
12
14
25
8
15
Para determinar el punto medio de cada clase mi , realizamos lo siguiente: (lmite inferior +
lmite superior)/ 2, as que el punto medio para la primera clase ser (1+10)/ 2 = 5.5, para la segunda
clase ser (11+20)/ 2=15.5 y as sucesivamente.
Posteriormente realizamos el producto de la frecuencia (fi) por el punto medio (mi) de cada clase
obteniendo la tabla siguiente:
Das de almacenaje
Frecuencia (fi )
1 a 10
11 a 20
21 a 30
31 a 40
41 a 50
51 a 60
61 a 70
71 a 80
81 a 90
20
28
19
30
12
14
25
8
15
171
5.5
15.5
25.5
35.5
45.5
55.5
65.5
75.5
85.5
fi mi
110.0
434.0
484.5
1 065.0
546.0
777.0
1 637.5
604.0
1 282.5
6 940.5
fi mi
fi
6 940
171
17 7
Das de almacenaje
Punto medio de
clase (mi)
Frecuencia (fi)
Desviacin (mi X)
1 a 10
11 a 20
21 a 30
31 a 40
41 a 50
51 a 60
61 a 70
71 a 80
81 a 90
5.5
15.5
25.5
35.5
45.5
55.5
65.5
75.5
85.5
20
28
19
30
12
14
25
8
15
35.08
25.08
15.08
5.08
4.92
14.92
24.92
34.92
44.92
(mi X)2
1 230.61
629.01
227.41
25.81
24.21
222.61
621.01
1 219.41
2 017.81
fi (mi X)2
24 612.13
17 612.18
4 320.72
774.19
290.48
3 116.49
15 525.16
9 755.25
30 267.10
106 273.69
fi (mi X)2
n 1
106 273.69
170
625.14
La desviacin estndar:
S
625.14
25.0027 25 das
17 8
1.
2.
Es el valor que ocupa el lugar central en una serie de datos, ubicndose 50% por encima de los
datos con mayor valor y 50% por debajo de los datos con menor valor:
a)
b)
c)
d)
3.
8
3
4
1
7.
6
3
2
4
6.
5.
Media.
Percentil.
Mediana.
Moda.
4.
6
5
4
No hay moda.
El rango.
La moda.
La varianza.
La desviacin estndar.
17 9
8.
La medida de tendencia central que toma en cuenta todos los datos de la serie es:
a)
b)
c)
d)
9.
10.
11.
La moda.
La mediana.
El cuartil.
La media.
Un banco toma una muestra de 20 analistas financieros y les pide que hagan una prediccin
sobre las ganancias por accin (dlares por accin) de una gran empresa para el prximo ao.
Los resultados que obtuvieron son:
Prediccin (dlares por accin)
Fa
9.950 10.449
10.450 10.949
10.950 11.449
11.450 11.949
11.950 12.449
2
8
6
3
1
20
2
10
16
19
20
10.4720
11.0245
11.1034
12.0130
18 0
9.9895
10.3745
10.995
10.949
10.8245
11.9450
12.3445
9.9745
10.0235
11.1035
10.9745
10.9495
11.3425
10.9350
10.8245
10.4584
El rango se obtiene:
a)
b)
c)
d)
13.
14.
10.0130
11.1161
11.1040
12.3020
181
15.
16.
17.
18 2
La distribucin es asimtrica.
La distribucin es mesocrtica.
La distribucin es leptocrtica.
La distribucin es platicrtica.
Si el ndice de kurtosis
a)
b)
c)
d)
La distribucin es asimtrica.
La distribucin es mesocrtica.
La distribucin es leptocrtica.
La distribucin es platicrtica.
Si el ndice de kurtosis
a)
b)
c)
d)
21.
Distribucin mesocrtica.
Distribucin de frecuencias.
Distribucin platicrtica.
Distribucin leptocrtica.
Si el ndice de kurtosis
a)
b)
c)
d)
20.
19.
18.
La distribucin es asimtrica.
La distribucin es mesocrtica.
La distribucin es leptocrtica.
La distribucin es platicrtica.
22.
23.
24.
Una empresa mayorista distribuidora de aparatos elctricos desea estudiar sus cuentas por
cobrar (en miles de pesos) para dos meses sucesivos (abril y mayo). Se seleccionan dos muestras
independientesde cincuenta cuentas para cada uno de losmeses. Losdatos que se recolectaron son:
Monto (miles $)
0 1.999
2.000 3.999
4.000 5.999
6.000 7.999
8.000 9.999
10.000 11.999
f (abril)
6
13
17
10
4
0
50
Monto (miles $)
0 1.999
2.000 3.999
4.000 5.999
6.000 7.999
8.000 9.999
10.000 11.999
f (mayo)
10
14
13
10
0
3
50
4.7195 y 4.3995
4.0078 y 4.4475
3.9945 y 4.5785
4.1975 y 4.9935
5.5065 y 6.9958
5.0628 y 7.0612
5.2145 y 7.1628
5.0325 y 7.0022
2.3465 y 2.6449
2.2835 y 2.6763
2.2500 y 2.6572
2.2433 y 2.6461
18 3
47.67% y 60.39%
58.54% y 59.46%
57.16% y 58.45%
53.44% y 52.99%
2.3456 y 3.2658
2.5546 y 3.2245
2.1033 y 3.1555
2.2893 y 3.0866
0.3022 y 0.8854
0.2547 y 0.4458
0.1029 y 0.6630
0.0547 y 0.7078
18 4
Leptocrtica.
Platicrtica.
Mesocrtica.
Asimtrica positiva.
X
n
1.
2.
3.
X
n
5.
X
n
4.
6.
1.
Md
2.
Md
3.
Nd
mj fi
1 757
36.60 aos.
48
fi
mj fi
fi
mj fi
fi
995
25
39.8 minutos.
2 740
137 chamarras.
20
1 757
36.60 minutos.
48
2 790
75
37.2
(10 10) 20
10 . La mediana indica que se vendieron 10 automviles.
2
2
(17 18) 35
17.5 . El peso por paquete que se encuentra en la mediana es de17.5 kg.
2
2
(n 1)
2
(11 1)
2
12
2
5.
Md
Li
Md
29.5
n
Fa
2
fm
172.5
27
35.005
200
60
2
60
5 35.005
(100 60)
5 35.005
60
40
5
60
18 5
6.
Md
Li
Md
29.5
n
Fa
2
fm
172.5
27
29.5
75
26
2
15 29.5
27
37.5 26
15 29.5
27
11.5
15
27
1.
2.
3.
4.
5.
Mo
Li
1
*I
35.005
30
5 35.005
(30 10)
30
5 35.005
40
150
40
Mo
Li
1
*I
2
29.5
8
15 29.5
8 14
8
15 29.5
22
120
22
18 6
1.
2.
3.
4.
b)
c)
d)
Inciso a) Diagrama de frecuencias para la poblacin en Mxico.
4.
Inciso b) La grfica tiene la cima cargada hacia el lado derecho y su cola se encuentra en la parte
izquierda, por lo que es una distribucin de frecuencias asimtrica con sesgo derecho o positivo.
Adems, se observa que las medidas de tendencia central se encuentran de la siguiente manera:
1.
a) N0 = n / 4 = 50
Q1
1
b)
D4
Li
(N o Fa )
I
fc
(50 30)
5
30
30.005
20
5 30.005
30
30.005
100
30
(80 60)
5 35.005
60
20
5 35.005
60
100
60
35.005
1.66
36.665
40.005
(126 120)
5
50
40.005
6
5
50
40.005
30
50
40.005
0.6
40.605
2.
a)
N0 = 3n / 4 = 56.25
Q3
3
b)
D5
c)
P36
1.
2.
3.
4.
5.
Li
No Fa
I
fc
44.5
56.25 53
15 44.5
13
3.25
15 44.5
13
48.75
13
37.5 26
15 29.5
27
11.5
15
27
29.5
172.5
27
29.5
6.38 35.88
N0 = 36n / 100 = 27
29.5
27 26
15 29.5
27
1
14 29.5
27
14
27
29.5
0.55 30.51
a)
d)
b)
a)
Para hallar el rango se debe identificar el valor ms alto y el valor ms bajo. El valor mximo es
18 700 y el valor mnimo es 9 000. Por esto, el rango es:
Rango = Valor mximo Valor mnimo = 18 700 9 000 = 9 700
El rango es 9 700, por lo que la diferencia existente entre los cobros es de 9 700 pesos,
mostrando que la variabilidad es considerable por la diferencia existente.
18 7
1.
2.
3.
4.
5.
b)
d)
c)
b)
En primer lugar, hay que calcular la media de losdatos para posteriormente obtener lasdesviacionesy
lasdesviacionescuadradas.
La media se define por:
X
X
N
205 900
15
X 13 726.66667
Como el clculo de la varianza requiere obtener las diferencias de los datos con respecto a
la media ( X X) y las diferencias cuadradas ( X X)2, se tiene:
X
10 000
12 000
15 000
16 000
15 000
9 000
13 500
12 700
(X X)
3 726.666667
1 726.666667
1 273.333333
2 273.333333
1 273.333333
4 726.666667
226.6666666
1 026.666667
( X X)2
13 888 044.45
2 981 377.779
1 621 377.777
5 168 044.443
1 621 377.777
18 289 877.78
51 377.77775
1 054 044.445
X
9 700
18 000
13 200
12 600
14 000
18 700
16 500
( X X)
4 026.666667
7
4 273.333333
3
526.6666666
1 126.666667
7
273.3333334
4 973.333333
3
2 773.333333
3
( X X)2
16 214 044.45
18 261 377.77
277 377.7777
1 269 377.779
74 711.11115
24 734 044.44
7 691 377.776
113 197 833.3
(X X)2
n 1
Puede apreciarse que la varianza es de 8 085 559.521, pero no tiene significado prctico
esta medida de variabilidad.
6.
Las clases denotan el ingreso familiar anual y la frecuencia el nmero de familias encuestadas.
Ingreso (miles de $)
1.50 2.999
3.00 4.999
5.00 6.999
7.00 8.999
9.00 10.999
11.00 12.999
13.00 14.999
15.00 16.999
f
25
31
42
45
52
42
35
28
300
mj
2.2495
3.9995
5.9995
7.9995
9.9995
11.9995
13.9995
15.9995
(m
mj f)
56.2375
123.9845
251.979
359.9775
519.974
503.979
489.9825
447 986
2 754.100
(m
mj X)
6.93083
8.78083
3.18083
1.18083
0.81917
2.81917
4.81917
6.81917
(m
mj X)2
48.03640449
77.10297549
10.11767949
1.39435949
0.67103949
7. 94771949
23. 22439949
46.50107949
[(m
mj X)2] f
1 200.910112
2 390.192240
424. 942539
62.746177
34.894053
333.804219
812.853982
1 302.030226
6 562.373548
18 8
Para obtener la varianza, en primer lugar, se debe calcular el punto medio de clase
sumando los lmites inferior y superior de cada clase y, posteriormente, dividir la suma entre
dos. Al haber calculado el punto medio de cada clase, debe multiplicarse ste por la frecuencia
y sumar los productos para obtener la media, tal y como se muestra a continuacin:
X
(mj f )
2 754
300
9.18033
Despus de calcular la media se debe restar a cada punto medio de clase la media, elevar
la diferencia al cuadrado y multiplicar esta diferencia cuadrtica por la frecuencia respectiva
para obtener la varianza de la manera siguiente:
S2
[(mj
X )2 f ]
n 1
6 562.373548
(300 1)
6 562.3735
21.94773762
299
La varianza obtenida no tiene un sentido lgico, slo puede deducirse que la clase que
presenta la mayor variacin es la quinta, donde el rango promedio de ingresos familiares est
entre 9 y 10.999 miles de pesos, para 52 familias.
1.
(X X)2
n 1
El resultado muestra que los cobros de la empresa tienen una variacin de 2 843.511829
pesos, es decir, que puede cobrar 2 843.511829 pesos por abajo o por encima de la media.
2.
(mj
X)2 f
n 1
21.94773762
4.684841259
Esto muestra que la variacin que existe entre los ingresos recibidos por las familias es en
promedio de 4.684841259 miles de pesos.
1.
2.
3.
4.
5.
6.
7.
c)
a)
d)
d)
a)
b)
d)
18 9
8.
1
1
100%
(3)2
1
100% [1 (0.1111)]100 (0.8889) (100) 88.89%
9
1
100%
(1.2)2
1
100% [1 (0.6944)] 100 (0.3056) (100) 30.56%
1.44
1
100%
(2.4)2
1
100% [1 (0.1736)] 100 (0.8263) (100) 82.63%
5.76
1.
2.
3.
4.
c)
a)
d)
En primer lugar se debe obtener la media de losrendimientos, esdecir, el rendimiento promedio
por accin para calcular las desviaciones cuadradas de los datos con respecto a la media:
XD
XL
X
n
X
n
(150 125 120 200 250 175 200 250 180 140) 1 790
179
10
10
(200 275 180 195 280 250 240 200 300 290) 2 410
241
10
10
con una venta promedio de 247 transacciones diarias, mientras que el dlar tiene una venta
promedio de 179 transacciones diarias.
El siguiente paso esobtener lasdiferencias de cada valor con respecto a su media, elevarlas
al cuadrado y sumarlas para obtener la varianza y, posteriormente, sacarles la raz cuadrada
para obtener la desviacin estndar:
Dlar:
(X X )2D (150 179)2
(125 179)2
... (140 179))2 19 740
Libra:
(X X )2L
(200 247)2
(275 247)2
...
(290 247))2
18 200
Una vez calculadas las sumas de las desviaciones cuadradas se procede a definir las varianzas:
19 0
V (X)D
S2
(X X)2
n 1
19 740
9
V (X )L
S2
(X X )2
n 1
18 200
2 022.222222
9
2 193.333333
Puede observarse que la varianza de las transacciones de la libra es menor que la varianza
de las transacciones del dlar. Esto indica que la venta de dlares tiene una mayor dispersin,
pero no se puede tener una interpretacin coherente del resultado debido a que se emplean
cuadrados, por lo cual se sacan las races para obtener las desviaciones estndar:
SD
(X X)2
n 1
2 193.333333 46.83303677
SL
(X X)2
n 1
2 022.222222
44.96912521
Puede observarse que la libra tiene una mayor venta promedio con una variabilidad de
44.96922521, pero la venta del dlar tiene una variabilidad mayor (46.83303677).
Con estos datos es posible calcular el coeficiente de variacin y comparar la variabilidad
de las transacciones de ambas monedas en trminos porcentuales.
CVD
SD
100%
XD
46.83303677
100 (0.261637076) (100) 26.1637076%
179
SL
44.96912521
100%
100 (0.182061235) (100) 18.2061235%
247
XL
Con losresultadosse aprecia que lastransaccionesde libraspresentan la menor variacin, por
lo que se puede concluir que la libra resulta ser una moneda ms estable en cuanto a su venta.
CVL
1.
2.
3.
4.
b)
c)
d)
Se obtiene la desviacin estndar de la serie: S = 2.
Se obtiene la suma del cubo de las desviaciones.
(X X)3 = (2)3 + (1)3 +(1)3 + (3)3 + (5)3 = 8 1 1 +1 +27 =18
Se obtiene el ndice muestral de asimetra para datos no agrupados:
(Xj X)3
n 1
5.
18
4
0.56 . Tiene sesgo derecho o positivo.
3
(S)3
(2)3
Empleando los datos se tiene lo siguiente:
Ingreso (miles de $)
1.50 2.999
3.00 4.999
5.00 6.999
7.00 8.999
9.00 10.999
11.00 12.999
13.00 14.999
15.00 16.999
f
25
31
42
45
52
42
35
28
300
mj
2.2495
3.9995
5.9995
7.9995
9.9995
11.9995
13.9995
15.9995
(m
mj f)
56.2375
123.9845
251.979
359.9775
519.974
503.979
489.9825
447 986
2 754.100
(m
mj X)
6.93083
8.78083
3.18083
1.18083
0.81917
2.81917
4.81917
6.81917
(m
mj X)2f
1200.91
2390.1899
424.9392
62.7435
34.892
333.8034
812.8505
1302.028
6568.3565
(m
mj X)4
2 307.496156
6
5 944.868829
9
102.3674382
1.944238384
0.450293995
63.16624507
539.3727316
2 162.350394
4
[(m
mj X)4] f
57 687.4039
184 290.9337
4 299.432404
87.49072728
23.41528774
2 652.982293
18 878.04561
60 545.81103
328 465.5149
191
(mj f )
2 754.1
9.18
300
X)2 f
(mj
S2
6 562.3565
21.9476
299
n 1
X)2 f
(mj
n 1
(mj
X)4 f
n 1
21.9476
4.6848
328 465.5149
1 098.546872
299
1 098.546872
(S)4
(4.685)2
1 098.546872
481.768478
28.407967
Con el resultado se puede observar que el coeficiente es mayor a tres, por lo que la
distribucin se caracteriza por ser leptocrtica, es decir, que la curva tiene una forma tal que su
apuntamiento es muy alto.
1.
2.
3.
4.
5.
d)
b)
d)
c)
Los datos a emplear son:
Ingreso (miles de $)
1.50 2.999
3.00 4.999
5.00 6.999
7.00 8.999
9.00 10.999
11.00 12.999
13.00 14.999
15.00 16.999
mj
25
31
42
45
52
42
35
28
300
2.2495
3.9995
5.9995
7.9995
9.9995
11.9995
13.9995
15.9995
(m
mj f)
(m
mj X)
56.2375
123.9845
251.979
359.9775
519.974
503.979
489.9825
447 986
2 754.100
6.93083
8.78083
3.18083
1.18083
0.81917
2.81917
4.81917
6.81917
(m
mj X)3
[(m
mj X)3] f
332.9321533 8 323.303833
677.0281203 20 987.87173
32.18261845 1 351.669975
1.646501515 74.09256818
0.549695418
28.58416174
22.40597235
941.0508387
111.9223293
3 917.281526
317.0987662 8 878.765454
16 971.25623
19 2
(mj f )
n
2 754.1
9.18
300
(mj
S2
X)2 f
6 562.3565
21.9476
299
n 1
X)2 f
(mj
n 1
21.9476
4.6848
X)3 f
16 971.25623
299
n 1
54.160054
(S)
54.160054
(4.685)3
0.5519676
Con el resultado se puede observar que el coeficiente es negativo, por lo que la distribucin
se caracteriza por ser sesgada negativamente, es decir, que la curva tiene una forma tal que la cola
izquierda es ms larga.
19 3
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
19 4
a)
c)
d)
c)
c)
a)
b)
d)
c)
d)
11.1.
11.2.
11.3.
11.4.
11.5.
b)
a)
c)
d)
a)
d)
d)
b)
d)
c)
b)
a)
b)
d)
a)
d)
c)
24.1.
24.2.
24.3.
24.4.
24.5.
24.6.
24.7.
a)
b)
c)
a)
d)
c)
b)