Sunteți pe pagina 1din 95

Unidad 3

Medidas de tendencia
central y de dispersin
Introduccin

L
os mtodos tabulares y grficos tienen algunas limitaciones para describir y analizar un
conjunto de datos. Por ejemplo, si tenemos que realizar la descripcin de un fenmeno
ante un grupo de personas, estaramos en seria desventaja si no contamos con el material
y equipo necesario paraelaborar tabulacioneso grficas. Anteestasituacin, acudimosal auxilio
de otras herramientas proporcionadas por la estadstica descriptiva: las medidas de tendencia
central y de dispersin.
Las medidasdetendencia central son medidas descriptivas que sealan hacia dnde tienden
a concentrarse los valores contenidos en un conjunto de datos. Su resultado debe ser un valor
tpico o representativo de la muestra o poblacin, el cual es utilizado para describir o analizar
un fenmeno. Al ser una idea abstracta y representativa del conjunto de datos, las medidas de
tendencia central tienen la ventaja de poder ser transmitidas de manera verbal.
Por ejemplo, los medios de informacin dan a conocer el promedio semanal del ndice de
precios y cotizaciones de la bolsa de valores o el promedio mensual de las tasas de inters. Estos
promediosson ejemplosdemedidasdetendenciacentral, puesson datostpicoso representativos
que nos describen la actividad burstil en el piso de remates o el desempeo del mercado de
dinero en un periodo determinado. Al ser una medida resumen puede ser transmitida con
facilidad para dar una idea de la informacin contenida en un conjunto de datos.
Existen diversas medidas de tendencia central que son utilizadas segn la naturaleza del
fenmeno que se quiere investigar. Las medidas de tendencia central que se analizarn en esta
unidad son:

Si bien, todas tienen como objetivo obtener un valor tpico que describa hacia dnde se
agrupan los valores de un conjunto de datos, cada una de ellas tiene ventajas y desventajas que
hacen que las distingamosentre s.
Sin embargo, en el anlisisdemuchosfenmenostambin necesitamosconocer la manera
en que los valores de una serie se dispersan entre s. Para ello acudimos a otro tipo de medidas

10 3
descriptivas, lasmedidasde dispersin o de variabilidad, lascualesson tan importantesen el estudio
de una serie de datos, como lo eslocalizar sus valorescentrales.
Lasmedidasdedispersin proporcionan unaideamental con lacual seconocequtanto varan
o qu tanto se dispersan los valores de un conjunto de datos. Si la variacin es muy pequea, las
medidasde dispersin tambin tendran un valor muy pequeo eindicaran una gran uniformidad
de los elementos de una serie. Por el contrario, si se obtiene un valor grande de las medidas de
dispersin, sealaragran variacin entrelosvaloresdelosdatos. Laausenciadedispersin esseal
de uniformidad perfecta, lo cual quiere decir que todos los datos tienen el mismo valor.
En el estudio dealgunosmercadoslasmedidasdedispersin son utilizadasparamedir lavolatilidad,
el nerviosismo o el riesgo quesepresentaen unavariable. Por ejemplo, cuando existemucho nerviosismo
entrelosinversionistasen un mercado, seobservarunaenormevariacin o volatilidad en susprecios.
Existen diversasmedidasdedispersin queson utilizadassegn lanaturalezadel fenmeno que
se quiere investigar. Lasmedidas de dispersin que se analizarn en esta unidad son:

3.1. Media, mediana y moda


Tambin conocida como la media aritmtica o el promedio, lamedia esla medida detendencia central
msutilizadaen losnegociosy en lascienciassociales, puesseempleacon muchafrecuenciaen trabajos
empricos. La mediaseutilizanicamenteparadescribir el comportamiento devariablescuantitativas.
Existen dossmbolospararepresentar alamedia(X y ). La X serefiereaun estadstico, esdecir, es
lamediadeunamuestra; mientrasque serefiereaun parmetro, esdecir, eslamediadeunapoblacin.
A la X se le conoce como la media muestral mientras que a la seleconocecomo lamediapoblacional.
Lamaneradeobtener lamediamuestral o poblacional dependedelaformacomo seencuentren
organizados los datos, ya sea que estn no agrupados o agrupados. Se dice que trabajamos con datos
noagrupadoscuando se expone cada uno de los datos de la serie, mientras que los datosagrupadosson
aquellos que se encuentran organizadosmediante tablas de frecuencias.

3.1.1. Media

a) Media para datos no agrupados


Cuando tenemosunaseriecon datosno agrupados: X , X , X ,, X , lamediasecalculasumando los
1 2 3 n
valoresde cadauno de losdatosy su resultado sedivide entreel nmero dedatosque tienela serie.
Parauna poblacin compuesta por losdatos X , X , X ,..., X , lafrmuladela media poblacional
1 2 3 N
para datos no agrupados se describe de la siguiente manera:

( X1 X2 X3 Xn ) Xi
N N

104 ESTADSTICA PARA NEGOCIOS


Donde:
= Media aritmtica de la poblacin.
= Suma.
N = Nmero de datos en la poblacin.
Xi = El valor que toma cada uno de los datos.

ParaunamuestraquecontengaX , X , X , ..., X datos, lamediamuestral paradatosno agrupados


1 2 3 n
se obtiene mediante la siguiente frmula:

( X1 X X3 Xn ) Xi
2
X N N

Donde:
X = Media aritmtica de la muestra.
= Suma.
n = Nmero de datos incluidos en la muestra.
Xi = El valor que toma cada uno de los datos.

Ejemplo 1

En la tabla 3.1 se expone la cotizacin mensual del tipo de cambio entre el peso mexicano y el dlar
estadounidense observada en algunas casasde cambio durante el ao 2000.

a) Si se realiza una inspeccin visual, cul sera tu opinin si alguien dijera que el tipo de
cambio en el ao 2000 estuvo alrededor de los 10.50 pesos por dlar?
b) Encuentra la media para el tipo de cambio entre el peso y el dlar estadounidense en el
ao 2000.

Mes Tipo decambioenel 2000


Enero 9.47
Febrero 9.44
Marzo 9.29
Abril 9.37
Mayo 9.50
Junio 9.79
Julio 9.46
Agosto 9.28
Septiembre 9.33
Octubre 9.51
Noviembre 9.51
Diciembre 9.44

Fuente: Banco de Mxico, www.banxico.org.mx


Tabla 3.1. Tipo de cambio mensual peso-dlar en el ao 2000.

Contestando la pregunta del inciso a), desde luego queesta aseveracin no esvlida, puesen la
tabla 3.1 los valores adquiridos por el tipo de cambio distan mucho de los 10.50 pesos por dlar. Si
damosun vistazo alatabla3.1, podemosdecir quelosvalorestienden aconcentrarsealrededor delos
9.40 o 9.50 pesos por dlar.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 105


Por lo tanto, es de esperarse que la media se encuentre muy cercana a los 9.40 o 9.50 pesos por
dlar. Si nospreguntaran cul sera un valor representativo o tpico para describir el nivel del tipo de
cambio durante el ao 2000, llevamos a cabo la estimacin de la media.
Debido a que el Banco de Mxico nicamenteseleccion la paridad dealgunascasasdecambio
y no el total de las transacciones realizadas durante el ao 2000, los datos de la tabla se refieren a
una muestra. Adicionalmente, observamosque los datosno estn agrupados, puesla tabla 3.1 no los
organiz deacuerdo con su frecuencia, por lo queprocedemosaestimar lamediamuestral paradatos
no agrupados de la siguiente manera:

(9.47 9.44 9.29 ... 9.44) 113.39


X 9.44
12 12

El promedio del tipo de cambio durante el ao 2000 fue 9.44 pesos por dlar, confirmando la
apreciacin hecha en el inciso a) de que el tipo de cambio estara alrededor de los 9.40 o 9.50 pesos
por dlar. El resultado 9.44 es utilizado como una medida tpica o representativa que seala por
dndese concentraron lascotizacionesdel dlar durante el ao 2000. Si realizamosnuevamente una
inspeccin visual a la tabla 3.1, se observa que en la mayora de los meses existe un nivel cercano a
los9.44 pesospor dlar y nicamenteduranteel mesde julio la paridad sepresion ligeramentea los
9.79, como resultado del nerviosismo generado por las eleccionespresidenciales del ao 2000.

Ejemplo 2

En latabla3.2 seexponelaparticipacin mensual delainversin extranjeraen el mercado accionario


de la Bolsa Mexicana de Valores, entre losmeses de enero del ao 2000 a octubre del 2001.

Encuentra el promedio de la participacin extranjera en el mercado accionario para el periodo


bajo estudio.

Mes 2000 2001


Enero 44.01 43.55
Febrero 46.58 40.17
Marzo 44.78 39.93
Abril 47.25 41.24
Mayo 45.07 41.21
Junio 46.69 40.95
Julio 44.07 39.87
Agosto 44.96 45.97
Septiembre 44.72 42.76
Octubre 44.62 43.85
Noviembre 43.03
Diciembre 41.31

Fuente: Bolsa Mexicana de Valores, www.bmv.com.mx


Tabla 3.2. Participacin mensual de la inversin extranjera en la Bolsa Mexicana
de Valores.

En este ejemplo los datos tampoco se encuentran organizados mediante una tabla de
frecuencias, por lo que se trata de un conjunto de datos no agrupados. Realizando una inspeccin
visual, apreciamosquelosvaloresse concentran alrededor de losnmeros43 o 44. Paraconfirmar lo

106 ESTADSTICA PARA NEGOCIOS


anterior, estimamoslamediaaritmtica, puesen ocasionesresultadifcil determinar demaneravisual
hacia dnde se concentran los valores en un conjunto de datos.

(44.01 46.58 44.78 47.25 45.07 ... 43.85) 956.59


= 22 = 22 = 43.48

Sepuede decir queel promedio delaparticipacin extranjeraen el mercado accionario dela Bolsa
Mexicana de Valores, entre enero del 2000 a octubre del 2001, fue de 43.48. ste es un valor tpico o
representativo delaproporcin decapitalesextranjerosen labolsadevalores, por lo quesepuededecir que
en esteperiodo 43.48% del capital negociado en el piso derematesfuedeprocedenciaextranjera.
Ahora bien, cmo podramosmostrar de manera visual que la inversin extranjera represent
un monto promedio de 43.48% respecto al total de las inversiones efectuadas en la bolsa de valores?
Para ello construimos un grfico de lneas en el que se muestren lasparticipaciones mensuales de las
inversionesextranjeras y su promedio en este periodo.

48

46

44 Mediana= 43.48

42

40

38

36

Grfico 3.1. Participacin mensual de la inversin extranjera en la Bolsa Mexicana de Valores.

En el grfico 3.1 observamos de manera visual el significado de la media de 43.48. Si bien es


cierto que la participacin extranjera en la Bolsa Mexicana de Valores tuvo un comportamiento
irregular al presentarse una cada entre noviembre del 2000 a julio del 2001 como producto de
la desaceleracin econmica mundial, la lnea recta mostrada en la grfica es una referencia que
seala por dnde se concentr la participacin extranjera en la bolsa de valores durante el periodo
bajo estudio.

b) La media para datosagrupados

Cuando tenemosunaseriecon datosagrupados, esdecir, queson presentadosmedianteunatablade


distribucin de frecuencias, la media muestral X y la media poblacional se obtienen mediante las
siguientes frmulas:

mj fi
(m1 f1 m2 f2 ... mn fn )
X
(f1 f2 ... fn ) fi

(m1 f1 m2 f2 ... mn fn ) mj fi
=
(f1 f2 ... fn ) fi

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 107


Donde:
X = Media aritmtica de la muestra.
= Media aritmtica de la poblacin.
mj = Punto medio para clase.
fi = Frecuencia de cada clase.
fi = Suma de las frecuenciasde todas las clases.
mfj i = Suma del producto de los puntos mediospor lasfrecuencias de todas las clases.

A diferencia de la frmula para datosno agrupados, en este caso mj representa el punto medio
de cada clase, el cual se obtiene sumando el lmite inferior y el lmite superior de cada clase, y
dividiendo este resultado entre 2.

Ejemplo 3
Unacompaaareadetransportacin depaqueteradeseaconocer cul esel pesopromedio en kilogramos
delospaquetestransportados, yaquedestedependeel costoyel nmerodepaquetesquepuedetransportar
sin violar los reglamentos de carga establecidos. Para ello, la compaa realiz un muestreo del peso en
algunospaquetescuyosresultadossepresentan en lasiguientetabladedistribucin defrecuencias:

Pesoenkg f i (frecuencia)
10.0 10.9 1
11.0 11.9 4
12.0 12.9 6
13.0 13.9 8
14.0 14.9 12
15.0 15.9 11
16.0 16.9 8
17.0 17.9 7
18.0 18.9 6
19.0 19.9 2

Tabla 3.3. Di stribucin de frecuenciasde lospaquetestransportados.

En estecaso tenemosunaseriecon datosagrupados, puessusvaloresson presentadosmediante


unatabladedistribucin de frecuencias. Con losdatoscontenidosen la tabla3.3 sepuedeobtener el
punto medio de cada clase (vase la tabla 3.4), el cual sirve para el clculo de la media aritmtica.

Pesoen kg mj (puntomedio) fi mjfi


10.0 10.9 10.45 1 10.45
11.0 11.9 11.45 4 45.8
12.0 12.9 12.45 6 74.7
13.0 13.9 13.45 8 107.6
14.0 14.9 14.45 12 173.4
15.0 15.9 15.45 11 169.95
16.0 16.9 16.45 8 131.6
17.0 17.9 17.45 7 122.15
18.0 18.9 18.45 6 110.7
19.0 19.9 19.45 2 38.9
65 985.25

Tabla 3.4. Distribucin de frecuenciasdel peso de lospaquetestransportados, incluyendo


el punto medio de cada clase.

108 ESTADSTICA PARA NEGOCIOS


Los resultados de la columna mf se obtienen multiplicando cada uno de los puntos medios
j i
por la frecuencia de cada clase. Estos resultados se suman dando un monto de 985.25. Una vez
realizadas estas operaciones procedemos a calcular la media muestral dividiendo 985.25 entre el
monto obtenido por la suma de las frecuencias (65), tal como se seala en la siguiente frmula:
mj fi 985.25
X = 15.15
fi 65

El peso promedio de los 65 paquetes transportados por esta compaa es de 15.15 kilogramos
por paquete, lo que permitir determinar el costo promedio de los paquetes que transporta esta
compaa, adems de conocer cuntos paquetes pueden ser transportados segn el peso de carga
permitido en cada vuelo que se realiza.

Ejemplo 4
Dela informacin proporcionadapor el XII Censo de Poblacin y Vivienda, obtn la edad promedio
de la poblacin en Mxico en el ao 2000.

Edades Puntomediode clase mj Frecuenciaf i


mf
j i

0 9 aos 4.5 21 850 480 98 327 160.0


10 19 aos 14.5 20 728 628 300 565 106.0
20 29 aos 24.5 17 228 877 422 107 486.5
30 39 aos 34.5 13 489 061 465 372 604.5
40 49 aos 44.5 9 266 924 412 378 118.0
50 59 aos 54.5 5 917 184 322 486 528.0
60 69 aos 64.5 3 858 931 248 901 049.5
70 79 aos 74.5 2 110 944 157 265 328.0
80 89 aos 84.5 773 927 65 396 831.5
90 msaos 94.5 184,598 17 444 511.0
Total 95 409 554 2 510 244 723.0

Fuente: XII Censo General de Poblacin y Vivienda 2000, www.inegi.gob.mx


Tabla3.5. Tabla defrecuencia dela poblacin en Mxico, incluyendo el punto medio de cada clase.

En este ejemplo se calcula la media poblacional para conocer la edad promedio en


Mxico, pues la informacin consultada fue obtenida de un censo de poblacin. Cada uno
de los puntos medios se multiplica por la frecuencia, que en este caso son los habitantes que
corresponden a esa clase. Al obtener estos resultados, procedemos a calcular la media a travs
de la siguiente frmula:
mj fi 2 510 244 723
= 26.31
fi 95 409 554

La edad promedio de la poblacin en Mxico fue de 26.31 aos, es decir, las edades de los
habitantes en Mxico tienden a concentrarse alrededor de los 26.31 aos, lo que confirma la misma
apreciacin realizadaen launidad 2 dequelapoblacin en Mxico est compuestaen su mayora por
gente joven. Incluso, se podra sealar que una persona con 26 aosde edad esun habitante tpico o
representativo de la poblacin en Mxico.
Cabe sealar que en este clculo fueron excluidas 2 073 858 personas que no especificaron su
edad y suponemosque la marca de clase para las personascon 90 o msaos es 94.5.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 109


Ventajasy desventajasde la media

Lamediaaritmticatienediversascaractersticasquelahacen muy til paralosestudiosrealizadosen


los negocios y en las ciencias sociales.

1. Se puede calcular en cualquier conjunto de datos numricos.

2. Un conjunto dedatosnumricostieneunay solo unamedia, demodo quesiempreesnica.

3. Toma en cuenta todoslos datos de una muestra o poblacin.

La media aritmtica, en su carcter de ser un solo nmero que representa a todo conjunto de
datos, tiene importantes ventajas.

confusiones en el anlisis de datos.

comparacin de medias entre diferentesconjuntosde datos.

El clculo de la media se basa en todos los valores que toman los datos de una serie. Ninguna
otra medidadetendencia central poseeestacaracterstica. Si bien escierto queestapeculiaridad puede
convertirseen unaventajasobreotrasmedidasdetendenciacentral, lamediaaritmticaresultaafectada
por valores extremos o atpicos, es decir, por valores muy pequeos o valores demasiado grandes
respecto al resto de los datos. En tales casos, la media aritmtica representa una imagen distorsionada
delainformacin quecontienen losdatosdeun conjunto y no seraadecuado utilizarlaparadescribir un
fenmeno ni paraser empleadacomo unamedidatpicao representativadeunamediao unapoblacin.

Ejemplo 5

Estima la media para la siguiente serie de datos: 0, 1, 1, 3, 5 y 110.

Si se realiza una inspeccin visual se observa la presencia de un valor atpico, pues existe una
gran diferencia entre los primeros cinco datos y el ltimo dato de la serie, por lo que es de esperarse
que la media aritmtica no refleje un valor tpico.

(0 1 1 3 5 110) 120
= 20
6 6
Al obtener comoresultadodelamediaaritmticaun valor igual a20, observamosqueestamedida
de tendencia central no cumple con su propsito de describir hacia dnde tienden a concentrarse los
valores de una serie o de proporcionar un dato tpico o representativo del conjunto de datos. De la
serie de datos se puede observar que ningn valor se encuentra cercano al 20, por lo que este valor
no puedeser representativo delapoblacin. Estadistorsin esocasionadapor lapresenciadeun dato
atpico en la serie de datos, que en este caso es110.
Ante estas circunstancias necesitamos manejar otro tipo de medidas de tendencia central que
no sean afectadas por valores atpicos. En el caso de la media aritmtica su utilizacin nicamente es
vlida cuando los valores se encuentran muy cercanos entre s, de lo contrario, no sera una medida
de tendencia central confiable para analizar fenmenos.

110 ESTADSTICA PARA NEGOCIOS


1. De acuerdo con la informacin proporcionada por el Banco de Mxico (www.banxico.org.mx)
y el Instituto Nacional de Estadstica, Geografa e Informtica (www.inegi.gob.mx) en el ao
2000 el Producto Interno Bruto a pesos corrientes fue de 5 432 354 825.00 miles de pesos y la
poblacin en el pas era de 97 483 412 habitantes.

Estima el Producto Interno Bruto per cpita o por habitante para el ao 2000.

2. Una alto ejecutivo se encuentra interesado en estudiar la maestra en negocios (Stanford


Sloan Program) ofrecida por la Universidad de Stanford a personas con ms de ocho aos de
experiencia en puestos de alta gerencia. Encuentra la edad promedio de los estudiantes de este
programa de estudios, si se sabe que las edades de losestudiantes inscritos en este programa se
encuentran distribuidasde la siguiente manera:

Edad Nmerodeestudiantes
30 34 18
35 39 18
40 44 10
45 50 2

Fuente: www.gsb.stanford.edu/ sloan

3. El departamento de personal de una compaa ha tomado el tiempo que duran diferentes


entrevistasde trabajo para que, de esa manera, se determine cunto tiempo se debe destinar a
cadaentrevista. Paraello, sedeseadeterminar lamedia. El tiempo deduracin decadaentrevista
observada (en minutos) es:

37 30 23 46 42
18 40 58 43 39
55 64 42 28 21
57 40 57 59 42
35 26 13 42 38

4. Una fbrica quiere conocer el tiempo que tardan 200 obreros en producir una pieza cada uno.
Si la fbrica desea determinar el tiempo promedio que tarda cada obrero para establecer el
tiempo de produccin, con el fin de mejorar la eficiencia, calcula la media con la informacin
de la siguiente tabla:
Tiempode produccin f f F
j j

20.00 25.00 10 22.5 225 10


25.01 30.00 20 27.5 550 30
30.01 35.00 30 32.5 975 60
35.01 40.00 60 37.5 2250 120
40.01 45.00 50 42.5 2125 170
45.01 50.00 20 47.5 950 190
50-01 55.00 10 52.5 525 200
200 7 600

Tiempo de produccin de una pieza en minutos.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 111


5. Una fbrica de ropa desea conocer cuntas chamarras terminadas y listas para ser entregadas
produce en promedio, para de esta manera establecer un plan de ventas y mercadotecnia con la
finalidad delograr unamayor penetracin en el mercado. Laschamarrasterminadasy listaspara
ser entregadaspor una fbricaderopa por da contabilizadasduranteun periodo de20 dasson:

142 163 108 157 124


132 135 130 140 128
136 133 146 137 149
137 131 129 144 139

6. En la siguiente tabla se expone la distribucin del tiempo que 75 clientes permanecieron en


espera en la fila de un banco para pasar a cajas.

Tiempode espera fi Fa
0 14 7 7
15 29 19 26
30 44 27 53
45 59 13 66
60 74 6 72
75 89 3 75
75

Tiempo de espera en un banco.

Si el banco quiereconocer el tiempo promedio que los clientes permanecen en espera en la fila
para proporcionarles un mejor servicio, calcula la media.

112 ESTADSTICA PARA NEGOCIOS


3.1.2. La mediana (M d)

Es una medida de tendencia central cuyo valor se encuentra exactamente a la mitad de una serie
ordenada de datos. Por encima de la mediana se encuentra 50% de los datos con mayor valor de la
serie y por debajo de ella 50% de los datos con menor valor de la serie. De esta forma, la mediana
describehacia dndetienden a concentrarselosvaloresdeuna serieo deproporcionar un dato tpico
o representativo del conjunto de datos.
La mediana es representada por la expresin M d y puede ser utilizada cuando la serie tiene
valores extremos o atpicos, es decir, cuando existen diferencias significativas entre los valores que
conforman la muestra o la poblacin bajo estudio.

a) La mediana para datosno agrupados

Para encontrar la mediana muestral o poblacional de un conjunto de datos no agrupados se realizan


los siguientes pasos:

1. Seordenan losdatosdelaserie del valor mspequeo al valor msgrande, esdecir, seorganiza


la serie en orden creciente.

2. Observamoscul esel tamao de lamuestra (n) o de la poblacin (N) quese pretendeanalizar


y procedemos a encontrar la mediana bajo uno de los siguientes criterios:

a) Si el total de datos analizados es un nmero impar, entonces la mediana es el valor que se


encuentra exactamente en el centro de la serie ordenada. Es decir, es el valor del dato que
ocupa la posicin (n +1) de la serie ordenada.
2
b) Si el total dedatosanalizadosesun nmero par, entonceslamedianaesel promedio delos
dosvaloresqueseencuentran en el centro delaserie ordenada. Esdecir, esel promedio de
los valores de los datos que ocupan las posiciones n y (n 2) de la serie ordenada.
2 2

Ejemplo 6

Estima la mediana para la serie de datos: 0, 1, 1, 3, 5, y 110.

Si se realiza una inspeccin visual se observa la presencia de un valor atpico, pues existe una
gran diferencia entre los primeros cinco datos y el ltimo dato de la serie, por lo que procedemos a
calcular la mediana.
Al tener una serie con n = 6 (nmero par), promediamos los dos valores centrales de la serie
ordenada y obtenemos la mediana:

1 3 4
Md 2
2 2

Como se puede apreciar, la mediana M d = 2 no es afectada por la presencia de un dato atpico


(110), por lo que puede ser utilizada como un dato tpico o representatvo del conjunto de datos.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 113


Ejemplo 7

En la siguiente tabla se muestra el ndice de Precios y Cotizaciones (IPC) de la Bolsa Mexicana


de Valores para cinco das del mes de noviembre del ao 2001. Se desea conocer una medida de
tendencia central del IPC para resumir el comportamiento burstil durante esa semana.

Fecha IPC
26/11/2001 5 759.49
27/11/2001 5 860.44
28/11/2001 5 848.21
29/11/2001 5 841.34
30/11/2001 5 832.83
Fuente: Bolsa Mexicana de Valores, www.bmv.com.mx
Tabla 3.6. IPC de la Bolsa Mexicana de Valores.
Si serealizaunainspeccin visual alatabla3.6seobservaqueel nivel del IPC del da26denoviembre
representa un dato atpico (5 759.49 unidades), puesse encuentra muy por debajo del nivel registrado en
el resto de la semana. En este caso la media no sera una medida de tendencia central apropiada para
describir el nivel queel IPC mantuvo duranteestasemana, por lo queconvieneestimar lamediana.

1. Siguiendo los pasospara encontrar la mediana, ordenamosa la serie de datosdel menor al


mayor valor para quedar de la siguiente manera:

Posicin IPC
1 5759.49
2 5832.83
3 5841.34 Mediana
4 5848.21
5 5860.44

Tabla 3.7. Serie en orden creciente del IPC.

2. Al tener un nmero deobservacionesimpar (son 5 observaciones) seprocedealaaplicacin


de la siguiente frmula:
(n 1) (5 1) 6
Nd 3
2 2 2

Donde Nd indica la posicin del dato de la serie ordenada cuyo valor ser la mediana.

El resultado anterior indica que se va a tomar el valor que se encuentre en la posicin nmero
tres de la serie ordenada, que en este caso viene representado por M d = 5841.34. De esta manera se
puedesealar que el nivel representativo del IPC de la Bolsa Mexicana de Valoresobservado durante
la ltima semana del mes de noviembre de 2001 se ubic en 5841.43 unidades. Alrededor de este
nmero se ubicaron dos jornadas con valores superiores y dosjornadascon valoresinferiores.

Ejemplo 8
En la siguiente tabla se muestra el tipo de cambio mensual observado por el Banco de Mxico en
algunascasascambiariasdel pasduranteel ao 2000. Encuentra lamediana con la finalidad de que
sea utilizada como medida representativa del tipo de cambio del ao 2000.

114 ESTADSTICA PARA NEGOCIOS


Mes Tipode cambioen el 2000
Enero 9.47
Febrero 9.44
Marzo 9.29
Abril 9.37
Mayo 9.50
Junio 9.79
Julio 9.46
Agosto 9.28
Septiembre 9.33
Octubre 9.51
Noviembre 9.51
Diciembre 9.44

Fuente: Banco de Mxico, www.banxico.org.mx


Tabla 3.8. Tipo de cambio mensual peso-dlar en el ao 2000.

En estainformacin nosetienelapresenciadevaloresextremosoatpicos. Noobstantesedemostrar


quecuando no setienelapresenciadedatosatpicos, el valor delamedianaun muy cercano al valor dela
media, esdecir, ambaspueden ser utilizadascomo medidasrepresentativasdelaseriededatos.

1. Siguiendo los pasospara encontrar la mediana, ordenamosa la serie de datosdel menor al


mayor valor para quedar de la siguiente manera:

Posicin Tipodecambioen el 2000


1 9.28
2 9.29
3 9.33
4 9.37
5 9.44
6 9.44 Nd1
7 9.46 Nd2
8 9.47
9 9.50
10 9.51
11 9.51
12 9.79

Tabla 3.9. Tipo de cambio mensual peso-dlar en el ao 2000.

2. Al tener un nmero deobservacionespar (son 12 observaciones) se procedea la aplicacin


de la siguiente frmula:
n 12 (n 2) (12 2) 14
N 6 Nd2 7
d1
2 2 2 2 2
Donde Nd1 y Nd2 indican la posicin de los dos datos de la serie ordenada cuyos valores son
utilizados para obtener la mediana. Ahora promediamos dichosvalores y obtenemos la mediana.
(9.44 9.46) 18.9
Md 9.45
2 2

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 115


El resultado de la mediana es M d = 9.45, que puede ser utilizado como un valor representativo
del nivel que mantuvo el tipo de cambio entre el peso y el dlar durante el ao 2000. Tambin
seala que 50% de los datos de la serie tiene un valor superior a 9.45 y el restante 50% tiene valores
inferioresa9.45. Observaqueestevalor difieremuy poco del valor obtenido en el ejemplo 1, dondela
media muestral fue 9.44. Por esta razn, la media y la mediana son medidasde tendencia central que
difieren muy poco cuando no se tiene la presencia de valores extremoso atpicos.

La mediana para datosagrupados

Cuando analizamos datos que se encuentran organizados mediante una tabla de frecuencias, la
mediana para datosagrupadosse obtiene utilizando la siguiente frmula:

n
2 Fa
Md Li I
fm

Donde:
Li = Lmite inferior de la clase mediana.
n = Nmero de datos observados.
Fa = Frecuencia acumulada anterior a la clase mediana.
I = Amplitud del intervalo.
fm = Frecuencia de la clase mediana.

Para localizar correctamente los componentes de esta frmula debemos tomar en cuenta los
siguientes puntos:

1. Las clasesdela tabla de frecuenciasdeben estar organizadasen orden creciente y a la tabla


se le debe adicionar una columna que contenga las frecuenciasacumuladas de cada clase.

2. Identificamos la clase en donde se encuentra la mediana. Para ello se divide el total de


datos que tiene la serie entre dos (n/ 2); posteriormente localizamos en la columna de las
frecuenciasacumuladas la clase en la que se encuentra el nmero (n/ 2).

3. saesprecisamentelaclasedondeselocalizalamediana, delacual setomasu lmiteinferior


(Li), su frecuencia(f m) y la amplitud del intervalo (I), el cual seobtiene deladiferencia entre
el lmite superior y el lmite inferior de la clase.

4. El lmite real inferior de la clase mediana (L)i es un lmite terico que se obtiene sumando el
lmite inferior delaclasey el lmitesuperior delaclaseanterior ydividiendo esasumaentredos.

Lmiteinferior declase+Lmitesuperior dela claseanterior


Lmitereal inferior = 2

5. Laamplitud del intervalodelaclasemediana(I) seobtienededosformas, yaseacon ladiferencia


dedoslmitessuperioresdeclaseconsecutivoso doslmitesinferioresdeclaseconsecutivos.

6. Se localiza la frecuencia acumulada inmediatamente inferior a la clase en donde se


encuentra la mediana (Fa).

116 ESTADSTICA PARA NEGOCIOS


Cabe sealar que esta frmula suponeque losdatosson continuosy que losvaloresobservados
dentro de cada clase forman una progresin aritmtica

Ejemplo 9

Con el fin de conocer cul es la situacin del mercado laboral, una empresa recab informacin de
los salarios pagados en pesos por hora; esta informacin fue recolectada mediante una muestra
de 100 obreros. Encuentra la mediana para determinar un salario representativo pagado por hora a
los obreros. Losresultados de la muestra se observan en la tabla 3.10.

Salariospor hora fi Fa
50 59.99 8 8
60 - 69.99 10 18
70 79.99 16 34
80 89.99 14 48
90 99.99 10 58 Clasemediana
100 109.99 5 63
110 119.99 2 65
120 129.99 15 80
130 139.99 8 88
140 149.99 12 100
100

Tabla 3.10. Distribucin de frecuenciasde lossalariospagados.

Con los datos presentados, el tamao de muestra esn = 100. La clase mediana est definida por
n/ 2 = 100/ 2 = 50, por lo que la clase que contiene la mediana es donde se encuentra la mitad de los
obreros, siendo stalaquintaclaseen lacual lossalariosfluctan de90 a99.99 pesospor hora. El lmite
real inferior de laclasemediana se obtiene sumando el lmiteinferior dela clase mediana (90) al lmite
superior de la clase anterior a la mediana (89.99) y el resultado deesta suma se divide entre dos, dando
L = 89.995. La frecuencia acumulada de la clase anterior a la clase mediana (8089.99) es: F = 48. La
i a
amplitud del intervalo de la clase mediana se define al hacer la diferencia de dos lmites superiores de
clasesconsecutivas, por ejemplo: I = 99.9989.99 = 10 y lafrecuenciade la clase mediana es: f m = 10.
n 100
F 48
2 a 2 (50 48) 10=89.995 2
Md Li I 89.995 10 89.995 10
fm 10 10 10

Md = 89.995 + 2 = 91.995

El resultado obtenido por laempresasealaque91.995 esel salario representativo delosobreros


de esta empresa. Segn la clase mediana del mercado laboral, 50% de los obreros perciben como
mximo un salario de $91.995 por hora y el 50% restante gana un salario mnimo de $91.995.

Ejemplo 10

De acuerdo con la informacin proporcionada por el XII Censo de Poblacin y Vivienda en Mxico,
encuentra la edad mediana para la poblacin en Mxico.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 117


Edades Frecuenciaf i Frecuencia acumulada
0 9 aos 21 850 480 21 850 480
10 19 aos 20 728 628 42 579 108
20 29 aos 17,228,877 59 807 985 Clasemediana
30 39 aos 13 489 061 73 297 046
40 49 aos 9 266 924 82 563 970
50 59 aos 5 917 184 88 481 154
60 69 aos 3 858 931 92 340 085
70 79 aos 2 110 944 94 451 029
80 89 aos 773 927 95 224 956
90 msaos 184 598 95 409 554
Total 95 409 554
Fuente: XII Censo General de Poblacin y Vivienda 2000, www.inegi.gob.mx
Tabla 3.11. Tabla de frecuencia de la poblacin en Mxico, incluyendo el punto medio
de cada clase.

n 95 409 554
F 42 579 108
2 a 2 5 125 669
Md Li I 19.995 10 19.995 10
fm 17 228 877 17 228 877

Md = 19.995 + 2.975 = 22.48

Laedad medianaen Mxico esde22.48, por lo quesepuededecir que50% deloshabitantesen


Mxico tiene una edad mayor a los 22.48 aosy el otro 50% tiene una edad menor a 22.48 aos.

Ventajasy desventajasde la mediana

La mediana tiene diversas ventajas sobre otras medidasde tendencia central. Una de ellases que nos
seala el valor que se encuentra exactamente a la mitad de una serie ordenada de datos, por lo cual
esconsideradacomo el lmiteo el lindero quedivideal 50% de losdatoscon mayor valor del 50% de
los datos con menor valor.
La mediana tambin cuenta con algunas caractersticas de la media aritmtica. Por ejemplo,
tambin proporciona un solo nmero que representa a todo el conjunto de datos, por lo que
es un trmino fcil de comprender y es intuitivamente claro; todas las muestras o poblaciones
tienen una sola mediana; adems, la mediana tambin es til para la comparacin de diferentes
conjuntos de datos.
Sin embargo, la mediana no toma en cuenta todos los datos de una serie, sino nicamente el
valor del dato que se encuentra exactamente a la mitad de la serie ordenada, en caso de que n sea
impar, o los valores de los dos datos que se encuentran a la mitad de la serie ordenada, en caso de
que n sea par. Esta peculiaridad puede considerase como una ventaja o desventaja, dependiendo de
la naturaleza del conjunto de datos.
Por ejemplo, a diferencia de la media, la mediana no seve afectada cuando se tiene la presencia
de datos extremos o atpicos, pues nicamente toma en cuenta uno o dos valores que se encuentran
en el centro de la serie ordenada. Por esta razn, la mediana es la medida de tendencia central que
ms se utiliza cuando se tienen datosextremos.

118 ESTADSTICA PARA NEGOCIOS


1. Unadistribuidoradeautomvilesestinteresadaen conocer laeficienciadediezdesusvendedores,
segn lasventasquerealizan, con el fin deestablecer cuntosautosesposiblevender. El nmero de
automvilesvendidospor cadavendedor es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15. Calculalamedianasi
ahoraladistribuidoraquiereconocer cul esel nmero deautosvendidosmscercadel promedio.

2. Los pesos de una muestra de paquetes de una oficina de mensajera son: 21, 18, 30, 12, 14, 17,
28, 10, 16 y 25 kg. La oficina de paquetera quiere conocer el peso por paquete ms cercano al
peso promedio. Calcula la mediana.

3. Los sal ari os anuales (en pesos) de l os ejecut i vos de una cor por aci n son 150 000,
100 000, 50 000, 40 000, 35 000, 35 000, 33 000, 30 000, 30 000, 30 000 y 28 000.
Determina el salario que msse aproxima al promedio calculando la mediana.

4. El departamento depersonal deunacompaahatomado el tiempo queduran lasentrevistasde


trabajo paradeesamaneradeterminar cunto tiempo sedebedestinar acadaentrevista. Paraello,
se deseadeterminar la mediana. El tiempo de duracin decada entrevista(en minutos) es:

37 30 23 46 42
18 40 58 43 39
55 64 42 28 21
57 40 57 59 42

5. Una fbrica quiere conocer el tiempo que tardan 200 obreros en producir una pieza cada uno.
Si la fbrica desea determinar el tiempo que ms se acerca al tiempo promedio que tarda cada
obrero para establecer el tiempo de produccin con el fin de mejorar la eficiencia, calcula la
mediana con la informacin de la siguiente tabla:

Tiempode produccin f f F
j j

20.00 25.00 10 22.5 225 10


25.01 30.00 20 27.5 550 30
30.01 35.00 30 32.5 975 60
35.01 40.00 60 37.5 2250 120
40.01 45.00 50 42.5 2125 170
45.01 50.00 20 47.5 950 190
50-01 55.00 10 52.5 525 200
200 7 600

Tiempo de produccin de una pieza en minutos.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 119


6. Lasiguientetablamuestraladistribucin delascantidadesdetiempo queun clientepermanece
en espera en la fila de un banco para pasar a cajas de una muestra de 75 clientes.

Tiempode espera fi Fa
0 14 7 7
15 29 19 26
30 44 27 53
45 59 13 66
60 74 6 72
75 89 3 75
75

Tiempo de espera en un banco.

Si el banco quiereconocer el tiempo quemsseacercaal tiempo promedio quepermanecen los


clientesen espera en la fila para proporcionarles un mejor servicio, calcula la mediana.

120 ESTADSTICA PARA NEGOCIOS


3.1.3. Moda

Es una medida de tendencia central cuyo valor es el ms comn en una serie de datos. La moda es
representada por la expresin M o y puede ser utilizada para describir series de datos con variables
cuantitativas o variables cualitativas. En muchas ocasiones, esta medida es de gran utilidad en los
negocios. Por ejemplo, algunas tiendas de autoservicio necesitan conocer cul es el producto ms
demandado y en qu magnitud, con el propsito de tener al da sus inventarios.

a) La moda para datosno agrupados

La moda para datos no agrupados se define como el valor de la variable que se presenta con mayor
frecuencia en una serie de datos.

Ejemplo 11

En la siguiente tabla se muestra el tipo de cambio mensual observado por el Banco de Mxico en
algunascasascambiariasdel pasduranteel ao 2000. Encuentralamoda con lafinalidad dequesea
utilizada como medida representativa del tipo de cambio del ao 2000.

Mes Tipode cambio


Enero 9.47
Febrero 9.44
Marzo 9.29
Abril 9.37
Mayo 9.50
Junio 9.79
Julio 9.46
Agosto 9.28
Septiembre 9.33
Octubre 9.51
Noviembre 9.51
Diciembre 9.44

Fuente: Banco de Mxico, www.banxico.org.mx


Tabla 3.12. Tipo de cambio mensual en el 2000.

En este ejemplo se observa que los valores 9.44 y 9.51 aparecen en dos ocasiones cada uno, por
lo que podemos sealar que en esta serie de datos existen dos modas Mo 1= 9.44 y Mo 2= 9.51, que son
los datos ms comuneso representativos del tipo de cambio durante el ao 2000. Cuando existen dos
modasen una seriede datos, como esel caso deesteejemplo, sedicequelaserie esdetipo bimodal.

b) La moda para datosagrupados

Cuando se analizan datos cualitativos que estn organizados mediante una tabla de frecuencias, la
moda esla clase que tiene la mayor frecuencia.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 121


Ejemplo 12

En el primer semestredel 2001, Mxico coloc en lasbolsasdeNuevaYork y Chicago 11 286 contratos


de opciones put y call clasificados segn el producto de la siguiente manera:

Producto Contratos
Algodn 254
Caf 1
Crtamo 7
Maz 1,955
Sorgo 7,043
Soya 218
Trigo 1,808

Fuente: Claridades agropecuarias, ASERCA-SAGARPA, www.sagarpa.gob.mx


Tabla 3.13. Colocaciones de productosagrcolas.

En este ejemplo se puede apreciar que el producto agrcola que ms contratos de cobertura
de precios celebr durante el primer semestre del ao 2001 fue el sorgo con 7 043 contratos,
convirtindose as en lamodadelas colocacionesmexicanasen losmercadosde futurosde lasbolsas
de Nueva York y Chicago.
Por otra parte, cuando se tiene la presencia de datos cuantitativos agrupados en una tabla de
frecuencias, la moda se obtiene utilizando la siguiente frmula:
1
Mo Li I
( 1 2)
Donde:
Mo = Moda.
Li = Lmite real inferior de la clase modal (la que tiene la mayor frecuencia).
1
= Diferencia entre la mayor frecuencia y la frecuencia anterior.
2
= Diferencia entre la mayor frecuencia y la frecuencia que le sigue.
I = Amplitud del intervalo de la clase modal.

Ejemplo 13

Una casa de bolsa realiz un estudio comparativo de los rendimientos de ciertas acciones con el
fin de conocer culesrendimientosfueron ms atractivos para los compradores, segn las acciones
quefueron msvendidas. Mediante el clculo de lamoda determina el rendimiento de lasacciones
que fue msatractivo, considerando que la casa de bolsa elabor la siguiente distribucin sobre los
rendimientos al vencimiento de una muestra de 65 acciones.

Rendimientos fi
50 59.99 8
60 69.99 10
70 79.99 16 Clase modal
80 89.99 14
90 99.99 10
100 109.99 5
110 119.99 2
65

Tabla 3.14. Distribucin de los rendimientosde acciones.

122 ESTADSTICA PARA NEGOCIOS


La clase que presenta una mayor frecuencia (16) es 70-79.99, por lo que el lmite real inferior de
la clase modal es: L i = 69.995. La diferencia entre la mayor frecuencia y la frecuencia anterior se define
por: 1 = 16 10 = 6 yladiferenciaentrelamayor frecuenciaylafrecuenciaposterior es: 2 = 16 14= 2. La
amplitud del intervalo declasedondeseencuentralamayor frecuenciaes: I = 79.99 69.99 =10. En este
caso, las clases muestran entre qu valores flucta el rendimiento ms atractivo y la frecuencia
representa el nmero de acciones que presentan tales rendimientos.
Al aplicar la frmula de la moda con losdatos anteriores se tiene:

6 6
Mo Li 1 I 69.995 10 69.995 10 69.995 + (0.75)(10)
( 1 2)
(6 2) 8

Mo = 69.995 + 7.5 = 77.495

Debido alo anterior el valor delamodaesigual a77.495, por lo quelacasadebolsapuedeconcluir que


el rendimiento quefuemsatractivo paralas16 accionesquemssedemandaron (frecuencia) esde77.495.

Ejemplo 14

De acuerdo con la informacin proporcionada por el XII Censo de Poblacin y Vivienda en Mxico,
encuentra la edad moda para la poblacin en Mxico.

Edades Frecuenciaf i Frecuencia acumulada


0 9 aos 21 850 480 21 850 480 Clase modal
10 19 aos 20 728 628 42 579 108
20 29 aos 17 228 877 59 807 985
30 39 aos 13 489 061 73 297 046
40 49 aos 9 266 924 82 563 970
50 59 aos 5 917 184 88 481 154
60 69 aos 3 858 931 92 340 085
70 79 aos 2 110 944 94 451 029
80 89 aos 773 927 95 224 956
90 msaos 184 598 95 409 554
Total 95 409 554

Fuente: XII Censo General de Poblacin y Vivienda 2000, www.inegi.gob.mx


Tabla3.15. Tablade frecuenciadelapoblacin en Mxico, incluyendo el punto medio de cadaclase.

La clase modal es (0 9), por lo que en este caso excepcional se toma el lmite inferior Li = 0,
y no el lmite real inferior. La razn radica en que la clase modal es la primera clase en la cual
se encuentra contenido el nmero cero como lmite inferior. En este caso no habra forma de
tomar el lmite real inferior para estimar la moda, pues al tratarse de un lmite terico, el lmite
real inferior resultara un nmero negativo, el cual no tendra lgica alguna al estar manejando
edades (no se puede hablar de edades negativas). Por otra parte, la diferencia entre la frecuencia
mayor y su anterior es: 1 = 21 850 480 0 = 21 850 480 y la diferencia con la posterior es: 2 = 21
850 480 20 728 628 = 1 121 852. El valor del inter valo de clase de l a mayor frecuenci a es:
I = 19 9 = 10.
Al aplicar la frmula de la moda con losdatos anteriores se tiene:

Mo 1
I 0 21 850 480 10 0 (0.951)(10) 9.51
Li
( 1 2)
21 850 480 1 121 852

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 123


Mo = 0 + 9.51 = 9.51
La moda de lasedadesen Mxico es de 9.51 aos.

Ventajasy desventajasde la moda

Al obtener la moda de un conjunto de datospueden darse los siguientes casos:

1. Si no hay datos repetidos no existir moda; por ejemplo, si se tienen los datos siguientes:
32, 45, 62, 35, 44.

2. Si hay datos repetidos que tengan valor cero, la moda es cero, pero no puede decirse que
no hay moda; por ejemplo, si se tienen los siguientes datos de ventas de automviles de
lujo por da: 1, 0, 2, 0, 3, 0, 5.

3. Si hay ms de un dato repetido igual nmero de veces existir ms de una moda, es


decir, es una distribucin multimodal, lo que representa una desventaja como medida
de tendencia central; por ejemplo, si el siguiente conjunto de datosesel nmero de veces
que aparece un comercial de tres productos (A, B, C) en la televisin en una hora: A,
C, A, B, C, A, B, C, B. Con esos datos se tienen tres modas, ya que los comerciales de
los productos A, B y C aparecen tres veces en una hora, por lo que la moda de los tres
productos es tres.

La ventaja ms sobresaliente de la moda es que puede ser utilizada para conocer una medida
representativa de un conjunto dedatos con valorescualitativos. Otra ventaja esque la moda no se ve
afectada por datos extremos o atpicos. Sin embargo, la principal desventaja es que en algunas series
de datos no existe la moda, lo que limita el propsito de conocer una medida representativa de un
conjunto de datos.
Por ltimo, se ha mencionado que en algunas series de datos puede presentarse el caso de
que exi sten varias modas, lo que puede representar una ventaja o desventaja, dependiendo del
problema quese estudie. La desventaja es que no tendramosuna medida representativa nica de
la serie de datos. Sin embargo, cuando la media y la mediana no son representativas, las modas
pueden convertirse en las medidas ms representativas para describir una serie de datos.

124 ESTADSTICA PARA NEGOCIOS


1. Unadistribuidoradeautomvilesestinteresadaen conocer laeficienciadediezdesusvendedores,
segn lasventas que realizan con el fin de establecer cuntos autoses posible vender. El nmero
deautomvilesvendidospor cada vendedor es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15. Calcula la moda
si ladistribuidorade autosdeseaconocer el nmero deautosquemssevende.

2. Los pesos de una muestra de paquetes de una oficina de mensajera son: 21, 18, 30, 12, 14, 17,
28, 10, 16 y 25 kg. Calcula la moda si ahora la oficina de paquetera quiere conocer cul es el
peso por paquete que ms se repite.

3. Los salarios anuales (en pesos) de los ejecutivos de una corporacin son 150 000, 100 000,
50 000, 40 000, 35 000, 35 000, 33 000, 30 000, 30 000, 30 000 y 28 000. Calculalamoda
para determinar cul es el salario que predomina en la corporacin.

4. El departamento de personal de una compaa ha tomado el tiempo que duran las entrevistas
de trabajo para de esa manera determinar cunto tiempo se debe destinar a cada entrevista.
Calcula la moda para estimar el tiempo ms usual que tarda una entrevista. El tiempo de
duracin de cada entrevista (en minutos) es:

37 30 23 46 42
18 40 58 43 39
55 64 42 28 21
57 40 57 59 42
35 26 13 42 38

5. Una fbrica quiere conocer el tiempo que tardan 200 obreros en producir una pieza cada uno.
Si la fbrica desea determinar el tiempo que ms se repite, calcula la moda con la informacin
de la siguiente tabla:

Tiempode produccin fi F
20.00 25.00 10 10
25.01 30.00 20 30
30.01 35.00 30 60
35.01 40.00 60 120
40.01 45.00 50 170
45.01 50.00 20 190
50-01 55.00 10 200
200
Tiempo de produccin de una pieza en minutos.

6. Lasiguientetablamuestraladistribucin delascantidadesdetiempoquelosclientespermanecen
en espera en la fila de un banco para pasar a cajas, la muestra esde 75 clientes.

Tiempode espera fi Fa
0 14 7 7
15 29 19 26
30 44 27 53
45 59 13 66
60 74 6 72
75 89 3 75
75
Tiempo de espera en un banco.
Calcula la moda para conocer el tiempo que ms tardan los clientesdel banco en espera.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 125


3.2. Relacin entre la media, la mediana y la moda
Cuando se tiene que decidir cul medida de tendencia central es la mejor para describir la forma en
quetienden a concentrarse losdatos, larespuesta depender delafiguraque adquiera ladistribucin
de frecuencias de los datos, pues sta hace posible comparar la media, la mediana y la moda de
manera simultnea.
Ladistribucin defrecuenciasseencuentramuy relacionadacon el histogramavisto en launidad
pasada. El eje vertical representa las frecuencias que adquieren los valores de la serie de datos y el eje
horizontal incluye los valores que toma la variable a lo largo de la serie. Si la serie est compuesta de
muchosdatos, seobservaquelagrficaseencuentramssuavizadaquelo observado en loshistogramas
dela unidad pasada. Lasdistribucionesdefrecuenciaspueden adquirir lassiguientesfiguras:

Simtrica con una sola moda.


Simtrica con dos o ms modas.
Asimtrica con sesgo positivo o derecho.
Asimetra con sesgo negativo o izquierdo.

Una distribucin simtrica es muy fcil de identificar. Su grfica tiene la caracterstica de que
una mitad de la distribucin es idntica a la otra mitad, con la salvedad de que sus posiciones son
distintas. Es decir, si la grfica de una distribucin es dividida exactamente a la mitad, y la figura de
la primera mitad esmuy similar con la otra, se dice que tenemos una distribucin simtrica.

media = mediana = moda

Figura 3.1. Distribucin simtrica con una moda.

Por ejemplo, si trazamosunagrficade distribucin defrecuenciasy lacortamosexactamente a


la mitad, tal como se muestra en la figura 3.1, se puede observar que una mitad es idntica a la otra,
con la diferenciade que ocupan posicionesdistintas. Tambin se puedeobservar la existencia de una
sola moda, pues nicamente existe una cima o joroba en la distribucin de frecuencias (recuerda
que la moda ocupa el valor donde se encuentra la mayor frecuencia).
Cuando se tiene una distribucin perfectamente simtrica, media, mediana y moda
coinciden en el mismo valor. En este caso dara lo mismo utili zar cualquiera de las tres medidas
de tendencia central. Sin embargo, cuando l a di str ibucin de frecuenci as no es exactamente
si mtr ica y tiene una sola moda, es recomendable uti li zar l a mediana como la mejor medida
de tendencia central.
En el caso de una distribucin simtrica con dos o ms modas es recomendable utilizar
las modas como las mejores medidas de tendencia central, pues describe hacia dnde tienden a
concentrarse los valoresde la serie de datos.

126 ESTADSTICA PARA NEGOCIOS


f Media
Moda2 Mediana Moda2

Figura 3.2. Distribucin simtrica con dos modas.

En la figura 3.2. puede observarse una distribucin simtrica con dos modas, las cuales nos
sealan hacia dnde tienden a concentrarse los valores de los datos: hacia los valores de la moda 1
y de la moda 2. En este caso no sera recomendable tomar la media o la mediana como medidas de
tendenciacentral, puesseapreciaqueningn dato tiendeaagruparsealrededor delosvaloresdeestas
medidas descriptivas.
Si se divide una grfica de distribucin de frecuencias exactamente a la mitad, y una de ellas
es muy distinta a la otra, se dice que es una di str ibucin asimtr ica. En estos casos se observar
que la parte ms alta o la cima de la figura queda cargada hacia uno de los lados, mientras que
en el otro se observar que la figura tiende a alargarse dando el aspecto similar a una cola. A las
distribuciones asimtricas tambin se le conoce como distribuciones sesgadas o distribuciones con
algn tipo de sesgo.
Existen dostiposdedistribucionesasimtricas: lasdistribucionescon sesgo positivo o derecho y
lasdistribucionescon sesgo negativo o izquierdo. En lasdistribucionesasimtricascon sesgo positivo
o derecho se observar que la cola de la figura se encuentra a la derecha de la distribucin, mientras
que en su parte izquierda se ubicar la cima o el valor ms alto de la distribucin. En este caso, el
valor de la media es superior al valor de la mediana; tambin se observar que el valor de la mediana
es superior a la moda, tal como se seala en la figura 3.3.

Moda
Mediana
Media

Figura 3.3. Distribucin asimtrica positiva.

En lasdistribucionesasimtricascon sesgo negativo o izquierdo seobservarquelacoladelafigura


se encuentra a la izquierda de la distribucin, mientras que en su parte derecha se ubicar la cima
o el valor ms alto de la distribucin. En este caso, el valor de la media es inferior al valor de
la mediana; tambin se observar que el valor de la mediana es inferior a la moda, tal como se
seala en la figura 3.4.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 127


f

Moda
Mediana
Media

Figura 3.4. Distribucin asimtrica negativa.

Cuando setienen distribucionesasimtricassesealaqueexistelapresenciadevaloresextremos


o atpicosen la seriededatos. Losvaloresatpicosse encuentran cargadoshaciael lado dela cola. Por
esarazn, el lado dela cola esel mismo hacia donde apuntael sesgo dela distribucin, puesesen ese
lugar donde se encuentran los valores extremos o atpicos.
Cuando se tiene la presencia de una distribucin asimtrica no es recomendable utilizar la
media como medida de tendencia central, puesal tener valoresatpicos, obtendramos una medida
distorsionada. En el caso dedi stribucionesasimtricasesrecomendableutili zar lamediana como
la mejor medida de tendencia central, pues no se toman en cuenta los valores extremos de la serie
de datos.

128 ESTADSTICA PARA NEGOCIOS


1. En una distribucin simtrica:

a) Media, mediana y moda son diferentes.


b) Media, mediana y moda coinciden en el mismo valor.
c) La media esmayor que la mediana y la moda.
d) La moda es mayor que la media y la mediana.

2. En una distribucin asimtrica sesgada hacia la derecha:

a) La mediana esmayor que la media y la moda.


b) Media, mediana y moda coinciden en el mismo valor.
c) La media esmayor que la mediana y la moda.
d) La moda es mayor que la mediana y la moda.

3. En una distribucin asimtrica sesgada hacia la izquierda:

a) La mediana esmayor que la media y la moda.


b) Media, mediana y moda coinciden en el mismo valor.
c) La media esmayor que la mediana y la moda.
d) La moda es mayor que la mediana y la media.

4. De losejemplos 4, 10 y 14 se sabe que la edad media de la poblacin en Mxico es = 26.31, la


edad mediana esM d = 22.48 y la edad modal esM = 9.51.

a) Elabora la grfica de distribucin de frecuenciaspara la poblacin en Mxico, utilizando


la informacin contenida en los ejemplos4, 10 y 14.
b) Seala qu tipo de sesgo se observa en la grfica de distribucin de frecuencias para la
poblacin en Mxico.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 129


3.3. Cuartiles, decilesy percentiles
Una vez localizado el centro de la distribucin de un conjunto de datos, el siguiente paso es analizar
ms detalladamente la manera en que se distribuye el resto de los valores. Por ejemplo, en algunas
ocasionesresulta importanteconocer la maneraen quequedan distribuidoslosdatosdeacuerdo con
ciertosporcentajesqueseobservan en la seriededatos. Lo anterior tambin proporcionauna imagen
mental de la distribucin de frecuencias.
En adicin a las medidas de tendencia central, hay algunas medidas tiles de posicin no
central que suelen utilizarse al resumir o descubrir propiedades de grandes conjuntos de datos. A
estas medidas se les denomina cuantiles. Algunos de los cuantiles ms empleados son los cuartiles,
losdecilesy lospercentiles, medidasquehacen posibleun anlisismsdetallado deunadistribucin,
representando qu porcentaje de los datos es ms pequeo (si estn a su izquierda) y qu porcentaje
de losdatos es ms alto en valor (si estn a su derecha).
En tanto que la mediana divide una distribucin en dos partes iguales, donde 50% de los
datos son menores y el otro 50% de los datos son mayores, los cuartiles son medidas descriptivas
que dividen la distribucin en cuatro partes, los deciles la dividen en diez partes y los percentiles la
dividen en cien partes.

Cuartiles (Qi)

Los cuartiles son aquellos valores que dividen una distribucin de datos en cuatro partes y se
representan por Q i, Q 2 y Q ,3 denominados primero, segundo y tercer cuartil, respectivamente.

Existen tres cuartiles, el primer cuartil (Q1) es un punto tal que deja a la izquierda 25% de los
datosqueson menoresquel y esmenor que75% delosdatosrestantes. El segundo cuartil (Q2) tiene
un valor igual a la mediana. El tercer cuartil Q 3tieneun valor tal quesobrepasaen valor a 75% delos
datos y esmenor que el 25% restante.
Lo anterior se puede apreciar en la figura siguiente:

Primercuartil
Mediana osegundocuartil

Tercercuartil

X
Figura 3.5. Cuartiles.
En la figura anterior 25% del rea queda a la izquierda del primer cuartil, mostrando que un
cuarto del conjunto de datos tiene un valor menor y 75% a la derecha indica que tres cuartas partes
de los datos son superiores en valor. El tercer cuartil muestra que 75% del rea queda a la izquierda,
con lo quetrescuartaspartesdelosdatosson demenor valor y 25% aladerecha mostrando que una
cuarta parte de los datostiene un valor superior.

130 ESTADSTICA PARA NEGOCIOS


Loscuartilesparadatosno agrupadosen unaserieselocalizan delasiguientemanera: primero
se ordenan los valores observados de acuerdo con su magnitud y, posteriormente, se determina el
lugar que cada cuartil debe ocupar en la serie.
El lugar quedebetomar el primer cuartil seobtienedividiendo el nmero dedatos(n) entrecuatro.
Esto sedebeaqueel valor deestecuartil dejaalaizquierda25% delosdatosqueson mspequeosy a
la derecha75% delosdatoscon valoresmayores. Laposicin del primer cuartil sedefine por:
n
N Q
O 1
4
El lugar quedebeocupar el segundo cuartil sedefinedividiendo el nmero dedatos(n) entredos,
yaqueal ser igual quelamedianadejaalaizquierda50% delosdatosmenoresy aladerecha50% delos
datoscon mayoresvalores. Por ello, la frmula para determinar laposicin del segundo cuartil es:
(2 n) n
N Q
O 2
4 2
El lugar que le corresponde al tercer cuartil se obtiene multiplicando el nmero de datos (n)
por tres y dividiendo entre cuatro, debido a que considera que a su izquierda se encuentra 75% de
los datos ms pequeos y a la derecha 25% de los datos con valores mayores, siendo la frmula para
definir al tercer cuartil:
(3 n)
NOQ3
4

Ejemplo 15

El departamento de recursos humanos de una empresa desea dividir en cuatro partes iguales las
solicitudes de empleo que recibe constantemente, con el fin de determinar los das en que la carga
detrabajo aumenta. Paraello tom unamuestrade18 dashbilesdondelacantidad desolicitudesde
empleo, ordenadasdemaneraascendente, fueron: 22, 26, 28, 31, 33, 34, 37, 39, 49, 50, 52, 59, 60,
62, 67, 69, 74 y 76. Para esto, se quiere hacer suposiciones mediante el clculo de los cuartiles.
Los nmeros de orden para cada uno de los cuartilesson:
18
Para el primer cuartil NOQ1 4.5
4
Para el segundo cuartil NOQ2 18
9
2
(3 18) 54 27
Para el tercer cuartil NOQ3
4 4 2 13.5

Los nmeros de orden 4.5, 9 y 13.5 indican los lugares que ocupan en la serie ordenada cada
uno de los cuartiles.
Para obtener losvaloresdeloscuartilesde esta seriede datosse procede dela manera siguiente:
El primer cuartil est situado entre el cuarto y el quinto trmino, se suma el valor de estos
trminos y la suma se divide entre dos, lo cual da:

(31 33) 64 32 que esel valor de Q1.


2 2

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 131


Esto quiere decir que 25% de los das se recibe menos de 32 solicitudes, mientras que 75%
se recibe ms de 32. Mostrando que el mnimo de solicitudes que se recibi en un da fue de 22
y el mximo fue 76, de lo que podemos concluir que el departamento tuvo una mayor carga de
trabajo 75% de las veces.
El segundo cuartil tiene el nmero de orden 9, por lo tanto tiene como valor 49 que es el
localizado en el noveno lugar, indicando que 50% de los das se recibe menos de 49 solicitudes
y el otro 50% msde 49 solicitudes.
60 62 122
El tercer cuartil estentreel trmino 13 y 14, lo cual da Q3 61 . Por lo tanto, 75% de
2 2
losdasrecibemenosde61 solicitudes, mientrasqueslo 25% delosdasrecibe msde61 solicitudes.
El nmero de orden que ocupan los cuartiles para una serie de datos agrupados en una serie
de frecuencias se obtiene mediante las relaciones: n/ 4, n/ 2 y 3n/ 4. Al tener estos nmeros de orden
se procede a buscar la frecuencia acumulada que los contenga. Una vez localizada esa frecuencia se
elige la clase que contiene losdistintos valores de la variable y el valor que corresponde a ese rengln
es el valor del cuartil.
Este mtodo exige que los datos sean continuos y que los valores observados en cada clase se
distribuyan regularmente (en forma de progresin aritmtica). Para situar cada uno de los cuartiles,
primero hay que encontrar los nmeros de orden que dividen a la serie en cuatro partes iguales,
mediante las relacionesn/ 4, n/ 2 y 3n/ 4. Posteriormente, se aplica la frmula:

(No Fa )
Qi Li I
fc

Donde:
Li = Lmite real inferior de la clase donde se encuentra el cuartil.
No = Lugar o posicin que le corresponde al cuartil.
Fa = Frecuencia acumulada anterior a la clase donde se encuentra el cuartil.
I = Amplitud del intervalo donde se ubica el cuartil.
fc = Frecuencia de la clase donde est el cuartil.

La cual essemejante a la utilizada en el clculo de la mediana.

Ejemplo 16
Se desea conocer a partir de los cuartiles Q Q y Q la variacin existente entre los salarios pagados
1, 2 3
por hora a 65 obreros. Los datos se presentan a continuacin y se retoman de la tabla siguiente.

Salarios fi Fa
50 59.99 8 8
60 69.99 10 18
70 79.99 16 34
80 89.99 14 48
90 99.99 10 58
100 109.99 5 63
110 119.99 2 65
65
Tabla 3.16 . Distribucin de salariospagadospor hora.
NQ = n/ 4 = 65/4 = 16.25
1
El nmero de orden 16.25 queda dentro de la segunda frecuencia acumulada, que es 18, que
corresponde a la segunda clase de 60.00 a 69.99.

132 ESTADSTICA PARA NEGOCIOS


Si se aplica la frmula, el resultado es:

(No Fa )
Qi Li I
fc

Li = 59.995
No = 16.25
Fa = 8
fc = 10
I = 69.99 59.99 = 10

Los datos se obtienen de la manera siguiente: la posicin del primer cuartil es N o = 16.25,
por lo que la frecuencia de la clase donde se encuentra el primer cuartil es f c = 10 y la frecuencia
acumulada es = 18, correspondientes a la segunda clase 60 69.99. Como el cuartil se encuentra
en la segunda clase, la frecuencia acumulada de la clase anterior es Fa = 8; el lmite real inferior de
la segunda clase es Li = 59.995 y la amplitud del intervalo de esa clase se obtiene restando al lmite
superior, de esa clase, el lmite superior de la clase anterior.
Por lo tanto:
(No Fa ) (16.25 8) 8.25 82.5
Q Li I 59.995 10 59.995 10 59.995
1
fc 10 10 10

Q1 = 59.995 + 8.25 = 68.245


El dato muestra que 25% de los obreros recibe un salario por hora menor que 68.245 pesos,
mientras que 75% recibe un salario mayor.
Para el cuartil 2:
N Q = n/ 2 = 65/ 2 = 32.5 que se localiza en la tercera frecuencia acumulada que es 34,
o 2
correspondiente a la tercera clase, por lo tanto:

Li = 69.995
No = 32.5
Fa = 18
fc = 16
I = 79.99 69.99 = 10

Sustituyendo en la frmula.
(N o Fa) (32.5 18) 14.5 145
Q Li I 69.995 10 69.995 10 69.995
2
fc 16 16 16
Q2 = 69.995 + 9.0625 = 79.0575

Con esto se concluye que 50% de los obreros recibe un salario por hora menor que 79.0575
pesos, mientrasque el otro 50% recibe un salario por hora mayor.
Para el cuartil 3:
N Q = 3n/ 4 = 3(65)/ 4 = 195/ 4 = 48.75 queselocalizaen laquinta frecuenciaacumuladaquees
o 3
58, correspondiente a la quinta clase, por lo tanto, el valor del tercer cuartil es:

Li = 89.995
No = 48.75
Fa = 48

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 133


fc = 10
I = 99.99 89.99 = 10
Sustituyendo en la frmula:
(No Fa ) 0.75 7.5
Q3 Li I 89.995 (48.75 48) 10 89.995
fc 10 89.995
10 10 10
Q3 = 89.995 + 0.75 = 90.745

El 75% de los obreros recibe un salario por hora menor que 90.745 pesos y 25% recibe un
salario mayor.

Deciles

Los deciles son aquellos valores que dividen en diez partes una serie de datos y se represent an por
D , D ,, D , denominados primer decil, segundo decil,..., noveno decil.
1 2 9

Si sedeseadividir laserieordenadadeobservacionesen diezpartesiguales, resultan losdeciles,


desde el primero hasta el noveno, que dejan desde 10% hasta 90% de observaciones con categoras
menores, respectivamente.
Para datos no agrupados, el primero, segundo, tercero,, noveno decil son los valores que se
obtienen paralosnmeros de orden n/ 10, 2 n/ 10,, 9 n/ 10 de loscasosobservadoscomenzando
por la primera clase.

Ejemplo 17

Considerandoel ejemplo 9 delassolicitudesdeempleo recibidaspor el departamentoderecursoshumanos


de una empresa se pide calcular del decil D 1al D 5, con el fin de conocer las variaciones que presenta la
distribucin. Losdatosson: 22, 26, 28, 31, 33, 34, 37, 39, 49, 50, 52, 59, 60, 62, 67, 69, 74 y 76.
Los nmeros de orden para cada decil son:
18
n 1.8
ND
o 1
10 10
(2 n) (2 18) 36
ND 3.6
o 2
10 10 10

(3 n) (3 18) 54
NoD3 5.4
10 10 10
(4 n) (4 18) 72
ND 7.2
o 4
10 10 10

(5 n) (5 18) 90
NoD5 9
10 10 10

El primer decil muestra que lecorrespondela posicin 1.8 que est situadaentreel primero y el
segundo dato (22 y 26), por lo que su valor es:

134 ESTADSTICA PARA NEGOCIOS


(22 26) 48
D1= 24
2 2
El decil muestra que 10% de los das se recibi 24 solicitudes o menos y 90% se recibi 24
solicitudeso ms.
El segundo decil muestra que le corresponde la posicin 3.6 por lo que su valor se encuentra
entreel 28 y el 31, por lo que podemostomar 30 como unaaproximacin del segundo decil. Deesto se
desprendeque 20% de losdasserecibi 30 solicitudeso menosy 80% se recibi 30 solicitudeso ms.

Al trabajar deciles para datos agrupados es necesario seguir con una metodologa similar a la
de la mediana y de loscuartiles. Por ello, la frmula para obtener el valor de losdeciles es:

(No Fa)
D1= Li I
fc
Donde:
Li = Lmite real inferior de la clase donde se encuentra el decil.
No = Lugar o posicin que le corresponde al decil.
Fa = Frecuencia acumulada anterior a la clase donde se encuentra el decil.
I = Amplitud del intervalo donde se ubica el decil.
fd = Frecuencia de la clase donde est el decil.

Ejemplo 18

Retomando los datosdel ejemplo 16 y aplicando la frmula para interpolar (datos agrupados), que es
la misma que la que se aplic en el caso de los cuartiles, calcular los valores de los deciles 1, 2 y 5.

Salarios fi Fa
50 59.99 8 8
60 69.99 10 18
70 79.99 16 34
80 89.99 14 48
90 99.99 10 58
100 109.99 5 63
110 119.99 2 65
65

Tabla 3.17. Di stribucin de salariospagadospor hora.

Los datos para obtener el valor del primer decil son lossiguientes:

No = 6.5
Li = 49.995
Fa = 0
fd = 8
I = 69.99 59.99 10

Estos datosse obtienen de la manera siguiente: la posicin del primer decil es No = 6.5, por lo
que la frecuencia de la clase donde se encuentra el primer decil fd = 8 y la frecuencia acumulada es
Fa = 8, correspondientea la primera clasequees50 59.99. Como el decil se encuentra en la primera

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 135


clase, lafrecuenciaacumuladadelaclaseanterior esFa = 0, el lmitereal inferior delaprimeraclasees
Li = 49.995 y lalongitud del intervalo deesaclaseseobtienerestando al lmitesuperior delasiguiente
clase, el lmite superior de esta clase.

6.5 65
D1 49.995 (6.5 0) 49.995 10 49.995 49.995 8.125 58.125
8 10 8 8

El primer decil muestra que 10% de los obreros recibe 58.12 pesos o menos por hora y 90%
recibe 58.12 pesospor hora o ms.

(13 5 50
D2 . 10 = 59.995 10 = 59.995 = 59.995 + 5 = 64.995
8) 10 10
59 995
10

Del decil dos se tiene que 20% de los obreros recibe 64.995 pesos por hora o menos, mientras
que 80% recibe 64.995 pesoso ms.

(32.5 18) 14.5 14


D5 69.995 10 = 69.995 10 =69.995 = 69.995 + 9.0625 = 79.0625
16 16 5
16

El quinto decil muestra que 50% de los obreros recibe por hora 79.06 pesos o menos y el otro
50% recibe por hora 79.06 pesoso ms.

Percentiles

El percentil p es un valor tal que a lo ms p por ciento de los datos es menor que l y a lo ms (10 0 p)
por ciento de los datos es mayor.

Por ejemplo, el percentil 90 paraun conjunto de datosesun valor que excede 90% delosdatos
y es menor que 10% de losdatos.
En ocasiones se acostumbra tambin dividir una serie ordenada de observaciones en 100
partesiguales, dando lugar a lospercentiles, desde el 1 hasta 99, que dejan desde 1% hasta 99% de
observacionescon categorasmenores. El primero, segundo, tercero,, nonagsimo noveno percentil,
son los valoresque corresponden a losnmeros de orden n/ 100, 2n/ 100, 3n/ 100 ,, 99n/ 100 de los
casos observados, comenzando por la primera clase.
La frmula que define el clculo de lospercentiles es:
(No Fa )
Pi Li I
fp

Donde:
Li = Lmite real inferior de la clase donde se encuentra el percentil.
No = Lugar o posicin que le corresponde al percentil.
Fa = Frecuencia acumulada anterior a la clase donde se encuentra el percentil.
I = Amplitud del intervalo donde se ubica el percentil.
fp = Frecuencia de la clase donde est el percentil.

136 ESTADSTICA PARA NEGOCIOS


Ejemplo 19

Considerando los datos de la tabla 3.17, el percentil 35, representado por P35, es el valor que se
obtiene para el nmero de orden 35n/ 100, en este caso 35(65)/ 100 = 22.75, que se considera est
contenido en la tercera frecuencia acumulada 34 correspondiente a la tercera clase, aplicando la
frmula se obtiene:

4.75 47.5
P35 69.995 (22.75 18) 69.995+ 2.975 =72.975
10 69.995 10 69.995
16 16 16

0.75 7.5
P75 89.995 48) 10 89.995 89.995 0.75 90.74
10 10 89.995 10 10

De aqu que 35% de los trabajadores gana $72.955 o menos, 75% gana $90.74 o menos, y
as sucesivamente.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 137


1. Una fbrica quiere conocer el tiempo que tardan 200 obreros en producir una pieza cada uno.
Si la fbrica desea determinar la variacin que existe en el tiempo de produccin al respecto
tiempo promedio que tarda cada obrero, con el fin de mejorar la eficiencia, con los datos
siguientes calcula:

a) El cuartil 1.
b) El decil 4.
c) El percentil 63.

Tiempode produccin f F
20.00 25.00 10 10
25.01 30.00 20 30
30.01 35.00 30 60
35.01 40.00 60 120
40.01 45.00 50 170
45.01 50.00 20 190
50-01 55.00 10 200
200

Tabla 3.18. Tiempo de produccin de una pieza en minutos.

2. La siguiente es la distribucin de lascantidadesde tiempo que un cliente permanece en espera


en la fila de un banco para pasar a cajasde una muestra de 75 clientes.

Tiempode espera f F
0 14 7 7
15 29 19 26
30 44 27 53
45 59 13 66
60 74 6 72
75 89 3 75
75

Tabla 3.19. Tiempo de espera en un banco.

El banco desea conocer cul es la variacin en el tiempo de espera en la fila.


Calcula:

a) El cuartil 3.
b) El decil 5.
c) El percentil 36.

138 ESTADSTICA PARA NEGOCIOS


3.4. Rango, varianza y desviacin estndar
3.4.1. Rango

Tambin conocido con el nombre de amplitud o recorrido, el rango se define como la diferencia que
existeentreel valor mximo yel valor mnimo deun conjunto dedatos. Eslamedidadedispersin ms
fcil de calcular, y es especialmente til en aquellas situaciones en que el objetivo de la investigacin
slo consiste en averiguar el alcance de las variacionesextremas.
Por ejemplo, el desempeo del precio de las accionesen el mercado burstil se suele reconocer por
losrangos, al citar lospreciosmximosy mnimosdecadasesin. Esdecir, lavariacin en el precio deuna
accin puedemedirseobteniendo el rango existenteentrelosdosvaloresmsextremosy as interpretar
qu tanta volatilidad manifest la accin en una jornada o periodo. Si se comparan dos acciones, se
puedeinterpretar quelaaccin quetienemayor variacin esaquellaquetienemayor rango.

Ejemplo 20

Una compaa desegurosdesea conocer la variacin que existe en lasventasde susocho vendedores
y de esa manera determinar la productividad de cada uno de ellos. Calcula el rango empleando la
siguiente informacin de segurosvendidos durante un mes: 8, 11, 5, 14, 11, 8, 11, 16.

Si se desea hallar el rango de tales observaciones slo hay que identificar el valor mximo (16) y
el valor mnimo (5) y obtener la diferencia entre ellos.
Rango= Valor mximo Valor mnimo = 16 5 = 11
El rangoes11, lo cual quieredecir queladiferenciaentreel nmero desegurosvendidospor dos
vendedores distintos, el mejor vendedor y el peor vendedor, es de 11, indicando una gran dispersin
o variabilidad, ya que sera ilgico que si un vendedor logra vender 16 seguros, el otro slo venda 5 si
se trata de los mismos seguros. Lo anterior puede atribuirse a la experiencia, a la capacitacin o a la
cartera de clientes que cada vendedor tiene.

Ejemplo 21

Un anali sta desea comparar el desempeo de la Bolsa Mexicana de Valores de dos meses:
septiembre y octubre de 2001. Para esto toma su principal indicador, el ndice de Precios y
Coti zaciones (I PC), y obtiene las siguientes grficas.

6 400

Mximo
6 200
6 233.29

6 000

5 800

5 600

5 400

Mnimo
5 200
5 081.92

5 000

Septiembre 2001

Figura 3.6. Bolsa Mexicana de Valoresen septiembre de 2001.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 139


6 400

6 200
Mximo
6 000 5 808.22

5 800

5 600
Mnimo
5 400
5 361.8
5 200

5 000

4 800
Octubre 2001

Figura 3.7. Bolsa Mexicana de Valoresen octubre de 2001.

Si se desea conocer en cul de los dos meses se present mayor volatilidad en el mercado de
valores encontramos los rangos del IPC en cada uno de ellos:
Rango en septiembre 2001 = 6 233.29 5 081.92 = 1 151.37
Rango en octubre 2001 = 5 808.22 5 361.8 = 446.42
Se puede decir que en el mes de septiembre de 2001, la Bol sa Mexicana deValoresregistr
mayor volatilidad que en el mes de octubre, pues su rango de 1 151.37 fue superior al observado
durante el mes de octubre de 446.42.
Este resultado tambin puede apreciarse de manera visual en las figuras 3.6. y 3.7., donde los
rangos se representan por el diferencial existente entre el nivel mximo y el nivel mnimo del IPC.
En el mes de septiembre se observa un rango mucho ms ancho que el del mes de octubre, el cual se
atribuy al nerviosismo generado por losataquesterroristasdel da11 de septiembreen el Pentgono
y en el World Trade Center de Nueva York.

Ventajasy desventajasdel rango

La principal ventaja del rango radica en que es la medida de dispersin ms fcil de obtener, pues
nicamentesetoman losdosvaloresextremosysediferencian entres. Adems, al medirselaamplitud
entre los dos valores ms extremos en una serie de datos, esta medida de dispersin suele ser muy
til cuando se desea conocer qu tan extremos son los lmites mximos y mnimos de una variable;
por ejemplo, lastemperaturas de ciertasciudades del pas o la ganancia de lascasasde cambio que se
obtienen diferenciando losprecios de compra y los precios de venta para cada divisa.
Sin embargo, el hecho de que se tomen en cuenta nicamente los dos valores ms extremos
de un conjunto de datos, el rango puede ser una medida de dispersin que resulta afectada ante la
presencia de datos atpicos.

140 ESTADSTICA PARA NEGOCIOS


1. El rango se define como:

a) La amplitud entre el valor msgrande y el valor ms pequeo de la serie de datos.


b) Lasuma del valor msgrandey el valor mspequeo dela serie dedatos.
c) Ladiferenciaentrelosvaloresextremosy el valor central delaseriededatos.
d) La diferencia entre losvalores centrales de la serie de datos.

2. El rango presenta fallas como medida de dispersin cuando:

a) Se tiene la presencia de medias desproporcionadas.


b) Se realiza un muestreo aleatorio.
c) Los datos emanan de una muestra y no de una poblacin.
d) Se tiene la presencia de datosatpicos.

3. Es una de lasventajas de utilizar el rango:

a) Es una medida que seala hacia dnde se concentran los datos.


b) Es la medida de dispersin ms fcil de calcular.
c) Es la medida de dispersin ms exacta que existe en una serie.
d) Seala cmo se dispersan los datosde la media.

4. Si tenemos los siguientes datos: 0, 1, 1, 3, y 5, entoncesel rango es:

a) 5
b) 4
c) 2
d) 6

5. El departamento de crdito y cobranza de una empresa quiere conocer la variacin que existe
en una muestra de 15 datos, correspondientesa losprximoscobros(en pesos) quedebe hacer.
Calcula el rango para losdatos siguientes:

10 000 12 000 15 000 16 000 15 000


9 000 13 500 12 700 9 700 18 000
13 200 12 600 14 000 18 700 16 500

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 141


3.4.2. Varianza

Es una medida de variabi lidad que toma en cuenta la dispersin que los valores de los datos
tienen respecto a su media. Es decir, aquellos conjuntos de datos que tengan valores ms
alejados de la media, sea muestral o poblacional, tendrn una mayor varianza. Su resultado se
expresa en unidades al cuadrado.
Existen dos smbolos para representar la varianza ( 2 y S2). La S2 se refiere a un estadstico, es
decir, a la varianza de una muestra; mientras que 2 se refiere a un parmetro, esdecir, a la varianza
de unapoblacin. A la S2sele conocecomo la varianza muestral mientrasque a 2 sele conocecomo
la varianza poblacional.
La manera de obtener la varianza de un conjunto de datos depende de la forma como se
encuentren organizados los datos, ya sea que estn agrupados o no agrupados, as como del tipo de
informacin con la que se trabaje, ya sea que provenga de una muestra o de una poblacin.

a) La varianza para datosno agrupados


Cuando tenemos una variable cuya serie de datos no se encuentra agrupada, X , X , X ,, X , la
1 2 3 n
varianza poblacional se calcula mediante la siguiente frmula:
2 (X )2
V(X )
N
Donde:
(Xi )2= Suma de los cuadrados de las desviaciones del valor de cada dato de la serie
respecto a la media poblacional.
Xi = El valor de cada dato de la serie.
= La media poblacional.
N = Tamao de la poblacin.

Es decir, la varianza de una poblacin para datosno agrupadosesel promedio del cuadrado de
las desviaciones respecto a su media .
Cuando tenemosunavariable cuyaseriededatosno seencuentra agrupada, X , X , X ,, X , la
1 2 3 n
varianza muestral se calcula mediante la siguiente frmula:

(X X)2
S2
n 1
Donde:
(X i X)2 = Suma de los cuadrados de las desviaciones del valor de cada dato de la serie
respecto a la media muestral.
Xi = El valor de cada dato de la serie.
X = La media muestral.
N = Tamao de la muestra.
A diferencia de lo que ocurre con otras frmulas, la varianza de una muestra no equivale
exactamente, en trminos de clculo, a la varianza de una poblacin. El denominador de la frmula
de la varianza poblacional es el total de la poblacin N, mientras que en la varianza muestral se
incluye un factor de correccin n 1.

142 ESTADSTICA PARA NEGOCIOS


Lospasosparaobtener lavarianzamuestral o poblacional paradatosno agrupadosson lossiguientes:

1. Encuentra la media muestral o poblacional, segn sea el caso.

2. Obtn cada una de las desviaciones respecto a la medi a, es deci r, a cada uno de los
datos X , X ,..., X se le resta la medi a obtenida en el paso anterior para quedar los
1 2 n
siguientes valores:

(X1 ), (X2 ),..., (Xn ) en caso de una poblacin.


(X1 X), (X2 X),..., (Xn X) en caso de una muestra.

3. Eleva al cuadrado cada una de las desviaciones obtenidas en el paso anterior y sma las
entre s, para obtener la suma del cuadrado de las desviaciones:

(X )2 = (X1 )2 + (X2 )2 ++ (Xn )2 en caso de una poblacin.


(X X)2 = (X X)2 + (X X)2 +...+ (X X)2 en caso deuna muestra.
1 2 n

4. La suma del cuadrado de las desviaciones respecto a su media se divide entre N, en caso de
unapoblacin; o entren 1, en caso deuna muestra.

Tantoparaunapoblacin como paraunamuestra, lafrmuladelavarianzapuedeser transformada


en lassiguientesexpresiones, lascualesson conocidascomo el mtodo corto de la varianza:

2
Varianza poblacional V(X) 2 Xi 2

N
2
2 X 2i nX
Varianza muestral S
n 1

Estas frmulas tienen la ventaja de simplificar las operaciones que se deben realizar cuando
se calcula la varianza, sea poblacional o muestral. Cabe sealar que las frmulas establecidas por el
mtodo corto nosconducen al mismo resultado quesi se hubieran empleado lasfrmulasanteriores,
siempre y cuando no se hayan omitido algunos dgitos en las distintas operaciones. La conveniencia
de utilizar una u otra frmula queda sujeta a la libre eleccin del lector, segn la comodidad que le
produzca cada una de ellas para realizar las operaciones.

Ejemplo 22

Emplea los datos de las ventas de seguros del ejemplo 20 y calcula la varianza, suponiendo que los
datos constituyen la poblacin total de los agentesde seguro de la compaa.
Se tiene que la media es:

X (8 11 5 14 11 8 11 16) 84
10.5
N 8 8

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 143


Para calcular la varianza se requiere obtener cada una de las diferencias o desviaciones de los
datos respecto a la media (X ), elevarlas al cuadrado (X )2 y sumar estosresultados:

X (X ) (X )2
8 2.5 6.25
11 0.5 0.25
5 5.5 30.25
14 3.5 12.25
11 0.5 0.25
8 2.5 6.25
11 0.5 0.25
16 5.5 30.25
0 86
Tabla 3.20. Desviacionesde la venta de seguros.

Ahora aplicamos la frmula de varianza poblacional para datosno agrupados y obtenemos:

2 (Xi )2 86
V(X) 10.75
N 8

Puede apreciarse que la varianza es de 10.75. Sin embargo, esta medida de variacin no tiene
un significado prctico debido a que el resultado obtenido est expresado en trminos cuadrados, es
decir, la variabilidad de seguros vendidoses de 10.75 seguroscuadrados.
Por esarazn, lavarianzaslo tiene sentido lgico cuando comparamosdiferentesconjuntosde
datoscon lamismaunidad demedida, esdecir, su interpretacin esuna medida relativaen el sentido
de que aquel conjunto que tenga la mayor varianza ser el de mayor grado de dispersin.
Por otra parte, si el lector hubiera optado por el mtodo corto para estimar la varianza
poblacional, el resultado hubiera sido el mismo. Para ello debemosestimar X 2i y 2:

Xi2 = 82 + 112 + 52 + 142 + 112 + 82 + 112 + 162

= 64 + 121 + 25 + 196 + 121 + 64 + 121 +256 = 968

2
= 10.52 = 110.25
2
V(X) 2 Xi 2 968
110.25 121 110.25 10.75
N 8

Si secompara esteresultado medianteel mtodo corto con el primer mtodo, sepuede apreciar
que los resultadosno fueron distintos.

Ejemplo 23

En las tablas 3.21 y 3.22 se exponen las cotizaciones mensuales del tipo de cambio entre el peso
mexicano y el dlar estadounidense para los aos de 1995 y 2000. Observa cuidadosamente la
informacin contenida en cada tabla.

a) Realizando unainspeccin visual, en cul delosdosaosseobservaunamayor estabilidad


en el tipo de cambio?

144 ESTADSTICA PARA NEGOCIOS


b) Encuentra la varianza para el tipo de cambio entre el peso y el dlar estadounidense en
cada uno de los dos aos.

Mes Tipode cambioen1995 Mes Tipode cambioenel 2000


Enero 5.69 Enero 9.47
Febrero 5.83 Febrero 9.44
Marzo 6.81 Marzo 9.29
Abril 5.78 Abril 9.37
Mayo 6.17 Mayo 9.50
Junio 6.30 Junio 9.79
Julio 6.08 Julio 9.46
Agosto 6.31 Agosto 9.28
Septiembre 6.41 Septiembre 9.33
Octubre 7.17 Octubre 9.51
Noviembre 7.65 Noviembre 9.51
Diciembre 7.64 Diciembre 9.44
Fuente: Banco de Mxico: www.ban xico.org.mx Fuente: Banco de Mxico: www.ban xico.org.mx
Tabla 3.21. Tipo de cambio mensual Tabla 3.22. Tipo de cambio mensual
peso-dlar en el ao 1995. peso-dlar en el ao 2000

Se observa que los valores del tipo de cambio en el ao de 1995 se encuentran muy dispersos
entre s, lo que indica una gran variabilidad o inestabilidad en el mercado cambiario. En contraste,
en el ao 2000 se puede observar que los valores de la divisa estadounidense se encuentran poco
dispersos por lo que se esperara que la varianza en este ao sea menor a la de 1995.
Comolosdatosnoseencuentran organizadosmediantetablasdefrecuencias,procedemosaencontrar
lavarianzamuestral paradatosno agrupados, obteniendo en primer lugar susmediasrespectivas:

X (5.69 5.83 6.81 ... 7.67) 77.84


La media de 1995 es: X 6.48
N 12 12
X (9.47 9.44 9.29 ... 9.44) 113.39
La media de 2000 es: X 9.44
N 12 12

Procedemosa encontrar lasumadel cuadrado delasdesviacionesdel tipo decambio respecto a


la media, de acuerdo con las siguientes tablas:

Mes (X X) (X X)2 Mes (X X) (X X)2


Enero 0.79 0.6241 Enero 0.03 0.0009
Febrero 0.65 0.4225 Febrero 0 0
Marzo 0.33 0.1089 Marzo 0.15 0.0225
Abril 0.70 0.49 Abril 0.07 0.0049
Mayo 0.31 0.0961 Mayo 0.06 0.0036
Junio 0.18 0.0324 Junio 0.35 0.1225
Julio 0.40 0.16 Julio 0.02 0.0004
Agosto 0.17 0.0289 Agosto 0.16 0.0256
Septiembre 0.07 0.0049 Septiembre 0.11 0.0121
Octubre 0.69 0.4761 Octubre 0.07 0.0049
Noviembre 1.17 1.3689 Noviembre 0.07 0.0049
Diciembre 1.16 1.3456 Diciembre 0 0
Suma 5.1584 Suma 0.2023
Tabla 3.23. Desviaciones del tipo Tabla 3.24. Desviaciones del tipo
de cambio en el ao 1995. de cambio en el en el ao 2000.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 145


De los resultados obtenidos en las tablas 3.23. y 3.24., se divide la suma del cuadrado de las
desviaciones entre n 1 y as se obtiene la varianza muestral del tipo de cambio para los aos de
1995 y 2000.

(Xi X)2 5.1584


Para el ao de 1995 S2 0.4689 pesos al cuadrado
n 1 11

(Xi X)2 0.2023


Para el ao 2000 S2 0.0183 pesos al cuadrado
n 1 11

Si bien lospesosal cuadrado continan siendo una idea abstracta, ambasvarianzas tienen sentido
lgico cuando son comparadasentres, puesseencuentran expresadasen lamismaunidad demedida. En
estecaso, el tipo decambio en el ao de1995 tieneunamayor dispersin queel observado en el ao2000,
tal como lo sealan ambasvarianzasy tal como lo apreciamosdemaneravisual en el inciso anterior.
Estecontrastesedebealadiferenciaen losescenariosmacroeconmicosquesevivieron durante
esos aos. Al ser mayor la varianza del ao 1995, se refleja una gran volatilidad y nerviosismo en el
mercado cambiario producido por unafuertecrisiseconmicaquesevivaen eseao. En el ao 2000
podemos observar que el peso mexicano goz de una gran fortaleza, pues su cotizacin se mantuvo
muy estableen el transcurso delos12 meses, incluso en el mesdejunio, cuando sepresentabalarecta
final de un proceso electoral en el pas.

b) La varianza para datosagrupados

En el caso dedatosagrupados, paraencontrar lavarianzaesnecesario conocer el punto medio decada


clase. El mtodo se basa en la suposicin de que el punto medio de cada clase es aproximadamente
igual a la media aritmtica delas medidascontenidasen un intervalo. El punto medio dela clase j se
denota por m.j

i) La varianza poblacional para datosagrupadosse define como:


[(mj )2 f ]
2 j
N

Donde:
2
= Varianza de la poblacin.
mj = Punto medio de clase.
= Media de la poblacin.
N = Tamao de la poblacin.
f = Frecuencia de la clase.

ii) La frmula para calcular la varianza muestral es:

[(mj X)2 fj ]
2
S n 1
Donde:
S2 = Varianza de la muestra.
mj = Punto medio de clase.

146 ESTADSTICA PARA NEGOCIOS


X = Media de la muestra.
n = Tamao de la muestra.
f = Frecuencia de la clase.

Paraobtener lavarianzaparadatosagrupados, seamuestral o poblacional, setienen querealizar


los siguientes pasos:

1. Se obtiene la media muestral o poblacional para datos agrupados, segn corresponda. Por
ejemplo, si se pretende obtener la varianza muestral, entonces procedemos a encontrar la
mediaa travsdela siguientefrmula:

mj f
X
f

2. Se encuentran los puntos medios para cada una de las clases m ,m ,...,m y a cada uno se
1 2 n
resta la media muestral o poblacional segn corresponda. Por ejemplo, para el caso de la
varianza muestral se encontraran lassiguientesdesviaciones:

(m1 X), (m2 X),..., (mn X)

3. Se eleva al cuadrado cada una de las desviaciones de los puntos medios de clases respecto
a la media. Por ejemplo, en caso de una poblacin:

(X1 2
) , (X 2 )2,..., (X n )2

4. Cada uno deloscuadradossemultiplicapor su respectivafrecuenciadeclase. Por ejemplo,


en el caso de una poblacin:
2
(X1 ) f1, (X2 )2 f2,..., (X n )2 fn

5. Sesuma cada uno deestosresultadosy se divide, en el caso delavarianza poblacional, entre


el nmero total de datos de la poblacin (N), y en el caso de una muestra entre el n 1.

Ejemplo 24

Unagran empresadeventaspor telfono quiereconocer lavariacin existenteen lasventasrealizadas


(en miles de pesos) por sus operadores. Para esto realiza una muestra de 25 operadores telefnicos,
obteniendo losresultados de la siguiente tabla. Calcula la varianza muestral.

Ventas(miles$) f
5.00 8.99 3
9.00 12.99 5
13.00 16.99 7
17.00 20.99 6
21.00 24.99 3
25.00 28.99 1
25
Tabla 3.25 Distribucin de las ventaspor telfono.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 147


Las clases denotan las ventas realizadas en miles de pesos y la frecuencia del nmero de
operadores telefnicos.

Ventas(milesde $) F mj (mj f) (mj X) j X)


(m 2
[(mj X)2] f
5.00 8.99 3 6.995 20.985 8.64 74.6496 223.9488
9.00 12.99 5 10.995 54.975 4.64 21.5296 107.648
13.00 16.99 7 14.995 104.965 0.64 0.4096 2.8672
17.00 20.99 6 18.995 113.97 3.36 11.2896 67.7376
21.00 24.99 3 22.995 68.985 7.36 54.1696 162.5088
25.00 28.99 1 26.995 26.995 11.36 129.0496 129.0496
25 390.875 693.76

Tabla 3.26 Distribucin de las ventaspor telfono.

Paraobtener lavarianza, en primer lugar sedebecalcular lamediamuestral paradatosagrupados,


encontrando el punto medio de clase, multiplicarlo por su frecuencia de la clase correspondiente, y
sus resultadosse suman para obtener la media, tal y como se muestra a continuacin:

mj f 390.875
X =15.635
n 25

Seobtienelavarianzarestndolea cadapunto medio declasela media muestral, elevando cada


una de estas diferencias al cuadrado y multiplicando cada diferencia cuadrtica por la frecuencia
respectiva de clase de la manera siguiente:

[(mj X)2 f ] 693.76 693.76


j 28.90666667 pesos al cuadrado
S2
n 1 (25 1) 24

La varianza obtenida seala que la dispersin existente entre las ventasentre

(n 1) esde 28.90666667 miles de pesos al cuadrado.

Ventajasy desventajasde la varianza

La varianza mide la variabi lidad tomando en cuenta la dispersin que los valores de los datos
tienen respecto a su medi a. Es decir, aquellos conjuntos que tengan valores ms alejados de
la medi a, sea muestral o poblacional, tendrn una mayor varianza, mientras que aquellos
conjuntos con valores ms cercanos a la medi a mostrarn una mayor uniformidad al contar
con una varianza menor.
La varianza nicamente adquiere valores mayores o iguales a cero, nunca valores negativos, y
se utiliza para comparar la dispersin de doso msconjuntosde datosque se encuentren expresados
en la misma unidad de medida; por ejemplo, para observar la variacin existente entre dos lneas de
produccin, latasade intersdedosinstrumentosfinancieros, lasventasdeproductosexpresadosen
la misma moneda, etctera.
La principal desventaja de la varianza es que su resultado se expresa en unidades al cuadrado,
resultando darle una interpretacin lgica. Adems, la varianza no puede comparar la dispersin de
dos conjuntos de datos expresados en diferentes unidades de medida; por ejemplo, chamarras con
coches, diferentesdivisas, el IPC delaBolsaMexicanadeValorescon el ndiceDow JonesdelaBolsa
de Nueva York, etctera.

148 ESTADSTICA PARA NEGOCIOS


1. Grandes varianzas implican:

a) Que los datos no varan.


b) Que hay gran variacin en los datos.
c) Que hay poca variacin en los datos.
d) Que las medias son desproporcionadas.
2. Uno delosinconvenientesdeutilizar lavarianzacomo medidadedispersin esque:
a) La varianza muestral es sesgada y la poblacional no.
b) La varianza se ve afectada por el tipo de dato que estamos utilizando.
c) Las varianzas poblacionales y muestralesson distintas.
d) Los resultados se expresan en unidades al cuadrado.

3. Si tenemos cinco datoscuyos valores son las constantes: 2, 2, 2, 2 y 2; entonces la varianza es:
a) Cualquier valor.
b) Un valor mayor o igual a cero.
c) Un valor igual a cero.
d) Tanto valores positivos como negativos, excepto el cero.

4. Unaseriecompuestacon lossiguientesdatos: 0, 1, 1, 3 y 5, su varianzaser:

a) 2
b) 4
c) 0
d)

5. Con lossiguientesdatosdecrdito y cobranza, calculalavarianzaparadatosno agrupados, con


el fin de determinar la variabilidad de los datos de los prximoscobros (en pesos).

10 000 12 000 15 000 16 000 15 000


9 000 13 500 12 700 9 700 18 000
13 200 12 600 14 000 18 700 16 500

6. Un despacho deconsultoraen cuestionesdemercado haceunaencuestadelosingresosanuales


(en miles de pesos) de 300 familias para clasificarlas por nivel de ingreso y con esto establecer
qu artculos son susceptibles de promocionarse y posicionar en el mercado, considerando las
variaciones existentes. Con la informacin siguiente calcula la varianza:

Ingreso(miles de $) f
1.50 2.999 25
3.00 4.999 3
5.00 6.999 42
7.00 8.999 45
9.00 10.999 52
11.00 12.999 42
13.00 14.999 35
15.00 16.999 28
300
Distribucin de salarios.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 149


3.4.3. Desviacin estndar

Al igual que la varianza, la desviacin estndar es una medida de variabilidad que tambin toma en
cuentaladispersin delosvaloresdelosdatosrespecto asu media. Sin embargo, su significado esms
valioso que el de la varianza, pues su resultado se encuentra expresado en las mismas unidades de la
variable que se examina y no en valoreselevados al cuadrado como lo hace la varianza.
La desviacin estndar se representa mediante la letra griega para el caso de una poblacin,
o por Sen el caso de una muestra. Se obtiene sacando la raz cuadrada al resultado de la varianza,
no importa si sta se trata de una varianza para datos no agrupados o para datos agrupados, o
provenientes de una muestra o de una poblacin. Al proporcionar sus resultados en unidades no
cuadradas, ladesviacin estndar esmuy fcil deinterpretar y su resultado tienemayor significado en
el anlisis de un fenmeno.
Las frmulaspara la desviacin estndar para datosno agrupadosson:

(X (X X)2
)2 S
N o n 1

Cuando setrabaja con datosagrupados, la desviacin estndar tambin secalculasacando la raz


cuadrada, pero empleando lasfrmulas respectivas de la varianza para datosagrupados:

[(mj )2 f j ] [(mj X)2 f j ]


o S
N n 1

Tanto en datos no agrupados como en datos agrupados, indica la desviacin estndar para
una poblacin, mientrasque la Srepresenta la desviacin estndar para una muestra.

Ejemplo 25

Una casa de bolsa desea realizar un comparativo entre los rendimientos anuales y los riesgos de dos
instrumentos financierosque han estado operando durante los ltimos siete aos. Sus rendimientos
anuales, expresados en porcentajes, son los siguientes:

Instrumento A: 4.0% 14.3% 19.5% 14.7% 26.5% 37.2% 23.8%


Instrumento B: 6.5% 4.4% 4.8% 6.9% 8.5% 5.8% 5.1%

Obtener la media y la desviacin estndar de los rendimientos observados por los dos
instrumentos financieros.
En primer lugar se obtiene el rendimiento promedio por instrumento:
X (4 14.3 19.5 14.7 26.5 37.2 23.8) 140
A 20%
N 7 7

X (6.5 4.4 4.8 6.9 8.5 5.8 5.1) 42


B 6%
N 7 7

Como puede observarse, el instrumento que presenta el mayor rendimiento promedio es A


con 20%, mientras que el instrumento B tiene un rendimiento promedio de 6%. En ese sentido,
resultara ms atractivo invertir en el fondo A que en el fondo B.
Paramedir el riesgo decadauno delosfondosencontramossusdesviacionesestndar; paraesto,
primero se deben obtener lasvarianzas poblacionalesy posteriormente se les saca la raz cuadrada:

150 ESTADSTICA PARA NEGOCIOS


Accin A

(X )2A = (4 20)2 + (14.3 20)2 ++(23.8 20)2 = 669.36


2
669 36
2 (X ) .
V(X) A 95.62285714
N 7

(X )2
95.62285714 9.778694041
A
N

Accin B

(X )2B = (6.5 6)2 + (4.4 6)2 + + (5.1 6)2 = 12.16


2
12 16
V(X)B 2 (X ) .
1.737142857
N 7

(X )2
B 1.737142857 1.318007154
N

Puede observarse que el instrumento A tiene una variabilidad de 9.778694041%, mi ent r as


que el i nst r ument o B t uvo una var i abi l i dad de 1.318007154%. Estoindicaquelosrendimientos
del instrumento A tienen una mayor dispersin que losrendimientos del instrumento B.
En el contexto de este ejemplo puede pensarse en la desviacin estndar como una medida de
la incertidumbre o riesgo de la rentabilidad de una inversin. Es decir, la rentabilidad promedio fue
mayor para el instrumento A, pero su riesgo en trminosde la desviacin estndar de la rentabilidad
tambin fue mayor.
Por otra parte, para obtener la desviacin estndar cuando se trabaja con datos agrupados se
utiliza la misma metodologa que en el caso de los datosno agrupados. En primer lugar se encuentra
la varianza a travsde su respectiva frmula y posteriormente se le saca la raz cuadrada.

Ejemplo 26

Con los datosdel ejemplo 5 calcula la desviacin estndar.

2
(mj X) fj 693.76
28.90666667 5.376492041
S n 1 24
Con este resultado se deduce que la variacin promedio que existe en las ventas realizadas por
telfono es de 5.38 miles de pesos. Esto puede ayudar a la empresa a analizar las ventas que realizan
los operadores de una manera ms sencilla que utilizando ventas al cuadrado.

Ventajasy desventajasde la desviacin estndar

La principal ventaja de la desviacin estndar es que indica la manera en que se dispersan los datos
respecto a la media en las mismas unidades de la variable que se examina y no en valores elevados
al cuadrado. Al igual que la varianza, la desviacin estndar nicamente adquiere valores mayores o
iguales a cero, nunca valores negativos.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 151


Esutilizadaparacomparar ladispersin entredistintosconjuntosdedatos. Aquellosconjuntos
que tengan valores ms alejados de la media tendrn una mayor desviacin estndar, mientras que
aquellos conjuntos con valores mscercanos a la media mostrarn una menor desviacin estndar.
Al igual quelavarianza, unadesventajadeladesviacin estndar esquetampoco puedecomparar
la dispersin de dos conjuntos de datos que se expresan en diferentes unidadesde medida.

152 ESTADSTICA PARA NEGOCIOS


1. Con los datos de crdito y cobranza que se presentan a continuacin, calcula la desviacin
estndar de los prximoscobros.

10 000 12 000 15 000 16 000 15 000


9 000 13 500 12 700 9 700 18 000
13 200 12 600 14 000 18 700 16 500

2. Con los siguientes datos de los ingresos anuales (en miles de pesos) de 300 familias, calcula
la desviacin estndar.

Ingreso(miles de $) f
1.50 2.999 25
3.00 4.999 31
5.00 6.999 42
7.00 8.999 45
9.00 10.999 52
11.00 12.999 42
13.00 14.999 35
15.00 16.999 28
300

Distribucin de salarios.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 153


3.5. Interpretacin de la desviacin estndar y su aplicacin en losnegocios
Ladesviacin estndar esutilizadacomo unidad demedidaparaconocer aqudistanciaseencuentra
alejado el valor deun dato respecto alamedia, esdecir, acuntasvecesladesviacin estndar seubica
del valor X de la media. Para esto requerimos de la siguiente frmula:

Xi X En el caso de una muestra


Z S
Xi
Z En el caso de una poblacin

Esta frmula es conocida con el nombre de estandarizacin, donde Z indica a qu distancia


se encuentra un valor alejado de la media en trminos de la desviacin estndar como unidad de
medida. Si el resultado de Z es negativo, se dice que el valor X es inferior al valor de la media y se
encuentra Z veces la desviacin estndar por debajo de la media. Si el resultado de Z es positivo, se
dice que el valor X es superior al valor de la media y se encuentra Z veces la desviacin estndar por
encima de la media.

Ejemplo 27

Si tenemosuna muestra cuya media es X= 50.5 y su desviacin estndar esS= 10, y se desea conocer
a qu distancia de la media se encuentra un dato en especfico de la muestra, por ejemplo X = 18.5,
aplicamos la siguiente frmula:

Xi X 18.5 50.5
Z 3.2
S 10

Lo anterior quiere decir que el nmero 18.5 seencuentra a 3.2 veces la desviacin estndar por
debajo de la media 50.5. Observa que el 18.5 es inferior al valor 50.5 de la media.

Ejemplo 28

Si tenemos una poblacin cuya media es = 300 y su desviacin estndar es = 100, y se desea
conocer a qu distancia de la media se encuentra un dato en especfico de la poblacin, por ejemplo
X = 450, aplicamos la siguiente frmula:

Xi 450 300
Z 1.5
100

Es decir, el nmero 450 se encuentra a 1.5 vecesla desviacin estndar por encima de la media
50.5. Observa que el 450 essuperior al valor 300 de la media.

Teorema de Tchebysheff

El teoremadeTchebysheff sealacul esel porcentajemnimo dedatosqueseacumulan alrededor de


la media dentro de una distancia equivalente a Z veces la desviacin estndar de la media. Para esto
se utiliza la siguiente frmula:

154 ESTADSTICA PARA NEGOCIOS


1
Porcentaje mnimo de los datos de un conjunto 1 100%
2
Z
Donde:
Z = Nmero de desviaciones estndar

Por lo tanto, el teorema de Tchebysheff seala que para cualquier tipo de distribucin de datos
se cumple lo siguiente:

1. Al considerar una di stancia de dos desviaciones estndar (Z = 2), al menos 75% de los
1
datos 1 100% = 75%) debe estar contenido dentro del rango que se encuentra a
(22 )
2 desviaciones estndar por encima de la media ( + 2 ) y a 2 desviaciones estndar
por debajo de la medi a ( 2 ).

2. Al tomarse en cuenta una distancia de tres desviaciones estndar (Z=3), al menos 88.89%
1
de los datos 1 100% = 88.89%) debe estar contenido dentro del rango que se
(32 )
encuentra a 3 desviaciones estndar por encima de la media ( + 3 ) y a 3 desviaciones
estndar por debajo de la media ( 3 ).

3. Si la distancia es de cuatro desviaciones estndar (Z=4), al menos 93.75% de los datos


1 100% = 93.75%) debe estar incluido dentro del rango que se encuentra a 4
1
(42 )
desviaciones estndar por encima de la media ( + 4 ) y a 4 desviaciones estndar por
debajo de la media ( 4 .

Por ejemplo, si tenemos un conjunto de datos cuya distribucin de frecuencias se representa


mediante la siguiente figura, entonces la relacin que existe entre el mnimo de datos acumulados
alrededor de la media y la desviacin estndar es:
4 +3

Media

2 +2

75 %

88.89 %

93.75 %

Figura 3.8. Dispersin de datos.

Lafiguraanterior indicaqueal medir ladispersin delosdatos, si stossealejan delamediadela


distribucin aunadistanciade2 desviacionesestndar, en el intervalo comprendido por losextremos
derecho (+2 ) eizquierdo (2 ) estarn agrupadosal menos75% delosdatos, concentrndose37.5%
(75% / 2) a la derecha de la media y el restante 37.5% a la izquierda de la media. Cabe destacar que
mientras msse alejen losdatos de la media, mayor ser la desviacin estndar y, por lo tanto, mayor
ser la dispersin.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 155


Ejemplo 29

Con los datos del ejemplo 22, calcula el porcentaje mnimo de los datos que se encuentran dentro
del rango de 2.5 desviacionesestndar por encima y por debajo dela media, as como losvalores que
delimitan este rango.
La media de los datos es 10.5, la varianza 10.75 y la desviacin estndar 3.278719262. A una
distancia de 2.5 desviaciones estndar (Z = 2.5):

1 100% 1
1 1 100% [1 (0.16)] 100 = (0.84)(100) = 84%
(2.5)2 6.25

El resultado implica que al menos 84% de las ventas debe estar a una distancia de 2.5 veces la
desviacin estndar por encima y por debajo de la media.
Para calcular los valoresexactosque delimitan el rango de 2.5 vecesla desviacin estndar, por
encima y por debajo de la media, se realizan lassiguientesoperaciones:

Valor inferior: Z = 10.5 (2.5) (3.278719262) = 2.3032


Valor superior: + Z = 10.5 + (2.5) (3.278719262) = 18.6967

Es decir, dentro del intervalo denotados por los valores 2.3032 y 18.6967 se encontrarn
concentrados como mnimo 84% de los datos alrededor de la media, = 10.5. Si verificamos en el
ejemplo 22, los datos de la serie 8, 11, 5, 14, 11, 8, 11 y 16 observamos que en este ejemplo se cumple
con facilidad el teorema de Tchebysheff, pues dentro del intervalo arriba expuesto se encuentran
depositados todos los datos de la serie (100% de los datos), superando as el porcentaje mnimo
sealado de 84% del total de los datos. Estosresultados se pueden apreciar en la figura siguiente.

Media = 10.5

84 %

2.5 +2.5

10.5

2.3032 18.6967

Figura 3.9. Dispersin de datos.

Ejemplo 30

En la tabla siguiente se expone la participacin mensual de la inversin extranjera en el mercado


accionario de la Bolsa Mexicana de Valores, durante el ao 2000.

a) Calcula el porcentaje mnimo de datos que se encuentra dentro del rango de 1.5 veces la
desviacin estndar por arriba y por debajo de la media.

b) Encuentra los valores superior e inferior que determinan este rango.

156 ESTADSTICA PARA NEGOCIOS


Mes 2000
Enero 44.01
Febrero 46.58
Marzo 44.78
Abril 47.25
Mayo 45.07
Junio 46.69
Julio 44.07
Agosto 44.96
Septiembre 44.72
Octubre 44.62
Noviembre 43.03
Diciembre 41.31

Fuente: Bolsa Mexicana de Valores: www.bmv.com.mx


Tabla 3.27. Participacin mensual de la inversin extranjera en la Bolsa Mexicana de Valores.

La media de los datos es 44.7575 y la desviacin estndar 1.6328. A una distancia de 1.5
desviacionesestndar de la media (Z = 1.5):

1 100% 1
1 1 100% [1 (0.4444)] 100 (0.5556) (100) 55.56%
(1.5)2 2.25

Al menos55.56% delosdatosdebeestar aunadistanciade1.5 vecesladesviacin estndar por


encimay por debajo delamedia. Losvaloresexactosquedelimitan el rango de1.5 vecesladesviacin
estndar, por encima y por debajo de la media, son lossiguientes:

Valor inferior: Z = 44.7575 (1.5)(1.6328) = 42.3083


Valor superior: + Z = 44.7575 + (1.5)(1.6328) = 47.2067

Como mni mo, 55.56% de los 12 datos regi strados en la tabla anterior debe estar a
una di stancia de 1.5 desvi aciones estndar respecto a su media (44.7575), es deci r, entre los
valores 42.3083 y 47.2067. Para constatar que se cumple el teorema de Tchebysheff se expone
esta i nformacin en el si guiente di agrama:
48
47.25 Valor superior 47.2067
47

46

45 Media= 44.7575

44

43

42 Valor inferior 42.3083


41
41.31
40

39

38

Fi gura 3.10 Par ticipacin de la inversin extranjera en la


Bol sa Mexicana de Valores.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 157


En la figura anterior se observa que nicamente dos valores, 47.25 y 41.31, quedaron excluidos
del rango determinado por los valores 47.2067 y 42.3083. De esta manera observamos que 10
datos de los 12 que t iene l a ser ie est n i ncluidos dent ro del rango seal ado por los valores
1.5 y + 1.5 , lo querepresentaun porcentajede83.33% [(10/ 12)*100], cumpliendo con facilidad
el mnimo requerido por el teorema de Tchebysheff, de 55.55%, para una desviacin estndar de 1.5.

La regla emprica

Un caso particular de los conceptos sealados por el teorema de Tchebysheff es cuando tenemos un
conjunto de datos cuya distribucin tiene la figura acampanada y simtrica. En este caso, la relacin
que existe entre el porcentaje de datos que se encuentran contenidos dentro de un intervalo y la
desviacin estndar respecto a la media que determina este intervalo es la siguiente:

1. Aproximadamente ms de dos terceras partes centrales del conjunto de datos (68%) estn
comprendidasentredosvaloresqueseencuentran aunadistanciadelamediaequivalentea
la desviacin estndar, tanto por la parte superior como por la parte inferior de la media.

2. Aproximadamente 95% de losdatos centrales de un conjunto de datos estn contenidos a


una distancia de la media equivalente dos veces la desviacin estndar, tanto por la parte
superior como por la parte inferior de la media.

3. Aproximadamente 99% de losdatos centralesde un conjunto de datos estn contenidosa


unadistanciadela mediaequivalentea tresvecesla desviacin estndar, tanto por la parte
superior como por la parte inferior de la media.

A esteconjunto derelacionesseleconocecomo lareglaemprica. Por ejemplo, en el caso deuna


distribucin de frecuencias simtrica podemos observar el siguiente grfico:

Media
Ladistanciaindicael espaciodondeseconcentra68%delos
datos quetieneunavariacindedos desviacionesestndar.

Figura 3.11. Agrupamiento de datos.

Por esto, la desviacin estndar como medida de dispersin promedio alrededor de la media
ayuda a comprender cmo se distribuyen los datos por encima (o la derecha) y por debajo (o la
izquierda) del valor de la media.

158 ESTADSTICA PARA NEGOCIOS


3.5.1. Interpretacin de la desviacin estndar

Ahorabien, laaplicacin einterpretacin en losnegociostienemuchosejemplosy paraello podemos


ejemplificar el caso de McDonalds Corporation.
LahistoriadeMcDonaldsseinici en 1948, cuando loshermanosRichard yMauriceMcDonald
abrieron en San Bernardino (California) su primer restaurante McDonalds, establecimiento en el
que se hacan los pedidos sin tener que bajarse del coche. Por aquella poca, Ray Kroc, un pequeo
empresario de mquinas de batidos, consigui la cesin del derecho de la marca convencido de sus
posibilidadesdeexpansin. Un men limitado y un alto volumen deventascaracterizaron el xito del
nuevo restaurante. En 1954, Ray Kroc, por entoncesproveedor delamquinadebatidos, sorprendido
por la magnitud del pedido de equipos multi-mixers solicitado, visit el local de los hermanos
McDonald y lespropuso abrir mslocales. Un ao mstarde, loshermanosMcDonald leotorgaron a
Kroc los derechos exclusivospara la comercializacin y explotacin del negocio de McDonalds.
De esta manera abri su primer restaurante en Des Plaines, Illinois (1955), estableciendo un
nuevo concepto de restaurante basado en ofrecer al cliente los ms altos estndares de calidad,
servicio y limpieza, los valores bsicos sobre los que se ha constituido la compaa, al tiempo que
pona en marcha el sistema de franquicia. Posteriormente, McDonalds aadi a estas tres premisas
de funcionamiento un cuarto principio: valor, es decir, la mejor relacin calidad-precio.
A partir de ese momento, Ray Kroc hizo de los McDonalds la mayor organizacin de servicio
rpido del mundo, basando su xito en la filosofa operativa del sistema McDonalds: "calidad, servicio,
limpieza y valor".
McDonalds es la compaa lder en el sector de restauracin de servicio rpido en el mundo
con ms de 30,000 restaurantes en 119 pases.
Ladcadadelossesentarepresentael periodo deexpansin deMcDonaldspor EstadosUnidos,
una etapa que culmin con tres hitos destacados. A mediados de 1967, McDonalds Corporation
abra su primer restaurante en Canad, inicindose as el periodo de expansin de McDonalds por
todo el mundo. Un ao despus, Jim Delligatti, franquiciado de Pittsburg, creaba la hamburguesa
que se acabara convirtiendose en el producto estrella de la compaa: el Big Mac. Y en 1969 se
fundaba la Universidad de la Hamburguesa, en Illinois, uno de loscentros de formacin corporativa
ms avanzados del mundo, por el que pasan anualmente ms de 3,000 estudiantes (entre directivos,
franquiciadosy empleados).
En 1967 la cadena abri su primerasucursal fuera delosEstadosUnidosy en 1990 seinaugur
el primer McDonaldsen Mosc, todo un smbolo de los nuevos tiempos.
McDonalds es una empresa que cambi la forma de hacer los negocios en el mundo. Es una
marca basada en la filosofa de Ray Kroc, quien impuls el negocio y tuvo la visin de construir una
gran familiadehombresy mujeresquetrabajan con todo el mundo paraservir al cliente, ofrecindole
una comida de la mejor calidad en forma rpida, en un ambiente limpio y seguro y con una atencin
amistosa y amable.
McDonalds es la mayor red de locales de servicio rpido de comidas del mundo con un
importante potencial de crecimiento: 45 millones de personas de la poblacin mundial comen por
da en uno de los 27 000 localesMcDonalds distribuidos en los 120 pases de los 5 continentes.
El 29 de octubre de 1985 McDonalds abri su primer restaurante en Mxico, en el sur de la
Ciudad de Mxico.
La imagen corporativa de McDonalds son los arcosdorados, los cualesson un smbolo que da
la bienvenida a la persona no importando su edad o estilo de vida.
En Mxico actualmente existen restaurantes McDonalds en 48 ciudades de la Repblica
Mexicana, donde se atiende cada mes a ms de 4 millonesde mexicanos.
LosprincipalesproveedoresdeMcDonaldsen Mxico son CocaCola, Bimbo y Grupo Lala, su
proveedor de carne 100% de ganado bovino es Trosi.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 159


Asimismo, McDonalds est afiliado con organizaciones como Disney Co., Mattel, Copa
Mundial de Futbol Soccer (FIFA), NFL, Juegos Olmpicos y NBA.
Ahora bien, se realiz lo siguiente y se pide cierta informacin e intepretacin.
Se tom una muestra de ventas anuales en miles de pesos en 100 sucursales diferentes de
McDonalds en el pas, complementa el siguiente cuadro:

Resultadosde las ventas una muestra de 100 sucursalesde McDonaldsenel pas

Punto Frecuencia
Clase f i mi Media X m X (mi X)2 fi (mi X)2
mediomi fi i

500 599 550 4


600 699 650 7
700 799 750 8
800 899 850 10
900 999 950 12
1 000 1 099 1 050 17
1 100 1 199 1 150 13
1 200 1 299 1 250 9
1 300 1 399 1 350 8
1 400 1 499 1 450 7
1 500 1 599 1 550 3
1 600 1 699 1 650 2

1. De lasiguiente muestradeventasen 100 localesde McDonaldsen el pas, determina la media.

2. Dela muestra de ventas en 100 sucursales o franquicias de McDonalds en el pas, determina


la varianza.

3. De la siguiente muestra de ventas en 100 establecimientos o franquicias de McDonalds en el


pas, determina la desviacin estndar.

160 ESTADSTICA PARA NEGOCIOS


Proceso de elaboracin:
Caso McDonalds.

Punto Frecuencia
Clase
mediomi fi f i mi Media X mi X (mi X)2 fi (mi X)2

500 599 550 4 2 200 1 056 506 256 036 1 024 144
600 699 650 7 4 550 1 056 406 164 836 1 153 852
700 799 750 8 6 000 1 056 306 93 636 729 088
800 899 850 10 8 500 1 056 206 42 436 424 360
900 999 950 12 11 400 1 056 106 11 236 134 832
1 000 1 099 1 050 17 17 850 1 056 6 36 612
1 100 1 199 1 150 13 14 950 1 056 94 8 836 114 868
1 200 1 299 1 250 9 11 250 1 056 194 37 636 338 724
1 300 1 399 1 350 8 10 800 1 056 294 86 436 691 488
1 400 1 499 1 450 7 10 150 1 056 394 155 236 1 086 652
1 500 1 599 1 550 3 4 650 1 056 494 244 036 732 108
1 600 1 699 1 650 2 3 300 1 056 594 352 836 705 672
1 100 100 105 600 7 156 400

fi Mi 105 600
1. Media X 1 056
n 100

fi (Mi X)2 7 156 400


2. Varianza S2 72 286.9
n 1 99
Este resultado nos dice que tenemos una dispersin de 72,286.9 [$]2respecto de la media;
esta medida de dispersin por s misma no proporciona informacin relevante; si nosotros
comparsemos este resultado con la varianza resultante de las ventas anuales de 100 tiendas
de McDonalds de otro pas, podramos comparar ambos resultados y la que tenga la mayor
varianza ser la que tenga un mayor grado de dispersin y por tanto podramos decir que las
ventas anuales son menos estables que en el pasque tiene menor grado de dispersin.

3. Desviacin estndar S S2 72 286.9 268.7

Se obtiene una desviacin estndar de 268 pesos; con este dato podemos determinar la
distancia, en unidadesde desviacin estndar, a la que se encuentran distanciadaslas ventas
anuales de cada tienda de McDonalds respecto de la media. Por ejemplo, una sucursal que
tiene ventas anuales de 520 mil pesos, a cuntas desviaciones estndar estar alejada de la
media de las ventas anuales de todas las tiendas?

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 161


1. Si tenemos una di stribucin de datos cuya media es X = 20 y su desviacin estndar es
= 6, encuentra, en trminos de la desviacin estndar (Z), a qu distancia est de la media el
valor X = 30

a) 5 desviaciones estndar.
b) 3.33 desviacionesestndar.
c) 1.66 desviaciones estndar.
d) 0.3 desviaciones estndar.

2. En una distribucin de datos, al menos 75% de los datos est contenido dentro de:

a) 2 desviaciones estndar por encima y por debajo de la media.


b) 1 desviacin estndar por encima y por debajo de la media.
c) 3 desviaciones estndar por encima y por debajo de la media.
d) 4 desviaciones estndar por encima y por debajo de la media.

3. En cualquier distribucin, al menos 93.75 % de los datos se encuentran contenidos dentro del
rango que se encuentra a:

a) 2 desviaciones estndar por encima y por debajo de la media.


b) 1 desviacin estndar por encima y por debajo de la media.
c) 3 desviaciones estndar por encima y por debajo de la media.
d) 4 desviaciones estndar por encima y por debajo de la media.

4. Seala el porcentaje mnimo de los datoscentrales que deben estar contenidos a una distancia
de 3 vecesla desviacin estndar por encima y por debajo de la media (k = 3):

a) 32.5 % de los datos.


b) 50 % de losdatos.
c) 75 % de los datos.
d) 88.89 % de los datos.

5. La regla emprica seala que aproximadamente 68% de los datos se encuentra entre losvalores
que encuentran a:

a) 1 desviacin estndar por encima y por debajo de la media.


b) 2 desviaciones estndar por encima y por debajo de la media.
c) 3 desviaciones estndar por encima y por debajo de la media.
d) 4 desviaciones estndar por encima y por debajo de la media.

6. La regla emprica se cumple para distribuciones:

a) Asimtricas y acampanadas.
b) Acampanadasy simtricas.
c) De cualquier tipo.
d) Simtricas y no acampanadas.

162 ESTADSTICA PARA NEGOCIOS


7. La regla emprica seala que los valores que se encuentran a 3 vecesla desviacin estndar por
encima y por debajo de la media, aproximadamente, se observa el:

a) 68% de los datos.


b) 75% de los datos.
c) 90% de los datos.
d) 99% de los datos.

8. Si en una distribucin cuya media es 16.5 y desviacin estndar de 4.3, calcula el porcentaje
mnimo queseencuentradentro del rango detresvecesladesviacin estndar por encimay por
debajo de la media, as como susrespectivos valores que delimitan este rango.

9. Si en una distribucin cuya media es 2000 y desviacin estndar de 300, calcula el porcentaje
mnimo queseencuentradentro del rango de1.2 vecesladesviacin estndar por encima y por
debajo de la media, as como susrespectivos valores que delimitan este rango.

10. Si en una distribucin cuya media es 95 y desviacin estndar de 25, calcula el porcentaje
mnimo queseencuentradentro del rango de2.4 vecesla desviacin estndar por encimay por
debajo de la media, as como susrespectivos valores que delimitan este rango.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 163


3.6. Coeficiente de variacin
Es una medida de dispersin que seala qu tan grande es la magnitud de la desviacin estndar
respecto alamediadel conjunto dedatosqueseexamina. A diferenciadeotrasmedidasdevariabilidad,
el coeficiente de variacin midela dispersin en trminosdeporcentaje y no en unidadesde medida.
De esta manera, este coeficiente se utiliza para comparar la dispersin entre dos conjuntos de datos
expresados en diferentes unidades de medidas.
Por ejemplo, si losanalistas de un despacho de bienes races estn interesados en determinar si
el valor de un avalo tiene mayor variabilidad que el tamao del lote, resultara imposible comparar
en forma directa la dispersin mediante el rango, la varianza o la desviacin estndar, pues el valor
del avalo se mide en unidades monetarias, por ejemplo en miles de pesos, mientras que el
tamao del lotesemideen metroscuadrados. En estecaso, losanalistaspueden utilizar el coeficiente
de variacin, expresado en porcentajes, y as comparar la dispersin de dos variables expresadas en
distintas unidadesde medida.
El coeficiente devariacin se representa mediante la expresin CV y se obtienedividiendo
la desviacin estndar entre la media, multiplicando este resultado por 100, no importando
si se trata de datos no agrupados o de datos agrupados, o que provengan de una muestra o de
una poblacin.
El coeficiente de variacin se puede calcular mediante la frmula siguiente:

S
CV 100% En caso de una muestra
X

CV 100% En caso de una poblacin

Donde:
CV = Coeficiente de variacin.
S = Desviacin estndar de la muestra.
X = Media de losdatos.
= Desviacin estndar de la poblacin.
= Media poblacional.

Ejemplo 31

Con losdatosdel ejemplo 25, calcula el coeficientede variacin con el fin de hacer una comparacin
de losrendimientosde las acciones:

SA 100% 9.778694041
CVA 100 (0.488934702) (100) 48.8934702%
A 20

SB 100% 1.318007154 100 (0.219667859) (100) 21.9667859%


CVB
B 6

La accin que presenta la menor variabilidad es la B, que como ya se haba mencionado es


la que presenta un menor rendimiento promedio y una menor desviacin estndar (menor riesgo),
con lo que se concluye que la accin ms conveniente para invertir sin incurrir en un gran riesgo
es la accin B.

164 ESTADSTICA PARA NEGOCIOS


Ejemplo 32

Losanalistasdeun centro financiero desean comparar el desempeo del tipo decambio yel porcentaje
de la participacin extranjera en el mercado accionario de la Bolsa Mexicana de Valores durante el
ao 2000. Para esto se calcula el coeficiente de variacin para cada uno de losmercados.

Tipode cambioenel Inversinextranjera


Mes Mes
2000 en el 2000
Enero 9.47 Enero 44.01
Febrero 9.44 Febrero 46.58
Marzo 9.29 Marzo 44.78
Abril 9.37 Abril 47.25
Mayo 9.50 Mayo 45.07
Junio 9.79 Junio 46.69
Julio 9.46 Julio 44.07
Agosto 9.28 Agosto 44.96
Septiembre 9.33 Septiembre 44.72
Octubre 9.51 Octubre 44.62
Noviembre 9.51 Noviembre 43.03
Diciembre 9.44 Diciembre 41.31

Fuente: Banco de Mxico: www.banxico.org.mx Fuente: Banco de Mxico: www.banxico.org.mx


Tabla 3.28. Tipo de cambio mensual Tabla 3.29. Participacin extranjera
peso-dlar en el ao 2000. en la bolsa en el ao 2000.

Lasvariables que se desean comparar vienen expresadas en diferentes unidades de medida; el tipo
decambio seexpresaen pesosmientrasquelainversin extranjerase representaen proporciones. Por tal
razn, secalculan loscoeficientesdevariacin paracadaunadelasvariablesyas secomparalavariabilidad
de ambosmercados. Para ello tomamoslasmediasy las desviacionesestndar de los ejemplos4 y 11.

S 0.1352
CV 100% 100 (0.0143)(100) 1.43%
Tipodecambio
X 9.44
S 1.6328 100 (0.0364) (100)
CV 100% 3.64%
Inv. extranjera 44.7575
X

Losanalistasdeestecentro financiero pueden concluir queel mercado cambiario duranteel ao


2000 tuvo mayor estabilidad quelaparticipacin extranjeraen el mercado accionario, puesel coeficiente
de variacin del primero fue de 1.43%, mientras que el del segundo fue de 3.64%. De esta forma, los
analistascomparan la variacin dedosmercadosquetienen distintasunidadesdemedicin.

Ventajasy desventajasdel coeficiente de variacin

El coeficiente devariacin estil cuando pretende comparar la variabilidad de doso ms conjuntosde


datosexpresadosen diferentesunidadesdemedicin, puesel resultado sersealado en porcentajes.
La nica desventaja que adolece el coeficiente de variacin es cuando se tienen que comparar
dos conjuntos de datos donde uno tiene una media con valores negativos y el otro tiene una media
positiva. Parael primer conjunto, el coeficientedevariacin sernegativo; mientrasqueparael segundo,
el coeficiente de variacin ser positivo, haciendo difcil la comparacin entre ambos. Esto puede
solucionarse tomando losvaloresabsolutosdel resultado queseobtenga en amboscoeficientes.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 165


1. El coeficiente de variacin esuna medida de dispersin que expresa sus resultados como:

a) Unidades mtricas.
b) Desviaciones estndar.
c) Porcentajes.
d) Desviaciones respecto a la media.

2. El coeficiente de variacin tiene la ventaja de:

a) Comparar conjuntosdedatosexpresadosen diferentesunidadesdemedicin.


b) Comparar conjuntosdedatosexpresadosen diferentesunidadescuadradas.
c) Comparar conjuntos de datos expresados en desviaciones.
d) Comparar conjuntos de datos expresados en porcentajes.

3. Si tenemos tres diferentes acciones A B C, y el coeficiente de variacin de sus precios son


CV =13%, CV =15% y CV =7%, entonces:
A B C

a) La accin A es la de mayor variabilidad y la accin B es la de menor variabilidad.


b) La accin B es la de mayor variabilidad y la accin A es la de menor variabilidad.
c) La accin C es la de mayor variabilidad y la accin A es la de menor variabilidad.
d) La accin B es la de mayor variabilidad y la accin C es la de menor variabilidad.

4. Una casa de cambio desea conocer la variacin existente entre el valor de dosmonedas (pesos/
dlar y pesos/ libra ) en las transacciones de 10 das para determinar qu moneda es la que
representa una mayor estabilidad. Con los siguientes datos, calcula el coeficiente de variacin.

Dlar 150 125 120 200 250 175 200 250 180 140
Libra 200 275 180 195 280 250 240 200 300 290

166 ESTADSTICA PARA NEGOCIOS


3.7. ndice de asimetra y kurtosis
Cuando se estudiaron las medidas de tendencia central se analiz la relacin que existe entre la
media, la mediana y la moda, sealando que esta relacin depende de la forma en que se distribuyen
los datos. Se dijo que el posicionamiento de las medidas de tendencia central estaba en funcin del
tipo de sesgo que se observaba en la distribucin de frecuencias.
Por ejemplo, cuando se tiene sesgo positivo o derecho, la media es mayor que la mediana y que la
moda, esdecir, lamediaseencuentramsaladerechadelamoda, dando as unadistribucin con unacola
alargadaqueseextiendehaciael lado derecho. En el casocontrario, cuando lamediaesmenor quelamoda,
ladistribucin tieneun sesgo negativo o izquierdo, dando as unadistribucin con unacolaalargadaque
se extiende hacia el lado izquierdo. Tambin se seal que cuando las tres medidas de tendencia central
coinciden con el mismo valor, ladistribucin defrecuenciaseraacampanaday simtrica.
En estaseccin seanalizardemaneramsformal laasimetradeunadistribucin defrecuencias
a travs del ndice de asimetra. Este aspecto es sumamente importante en el anlisis de datos, pues
dependiendo del tipo y de la magnitud del sesgo queseobserve en una distribucin defrecuenciasse
conocer con ms detalle la forma en que se dispersan los datos de una serie, detectando con mayor
facilidad la presencia de datos atpicos.
El ndice de asimetra es una medida de dispersin mediante la cual se conozce el tipo y la
magnitud de sesgo en una distribucin de frecuencias. Se representa mediante la expresin 3.
Para el caso de datos no agrupados, lasfrmulas del ndice de asimetra son:

(Xj )3 (Xj X)3


N n 1
3 Poblacional 3 Muestral
( )3 (S)3

Para el caso de datos agrupados, lasfrmulas del ndice de asimetra son:

[(mj )3] f [ ( mj X)3 ] f


N n 1
3 Muestral 3
3 Poblacional (S)
( )3

Donde:
= Coeficiente de asimetra. f = Frecuencia de clase.
3
mj = Punto medio de clase. = Desviacin estndar delapoblacin.
= Media poblacional. S= Desviacin estndar de la muestra.
X = Media muestral N= Tamao de la poblacin.
n = Tamao de la muestra.

La interpretacin del ndice de asimetra se define segn el caso que se trate:

1. Si el ndice de asimetra es igual o cercano a cero ( 3 = 0), la distribucin es simtrica o


insesgada; es decir, si la distribucin es dividida exactamente a la mitad, y la figura de la
primera mitad esidntica a la otra mitad.

2. Si el ndice de asimetra es mayor que cero ( 3 > 0), la distribucin es asimtricamente


positiva o sesgada hacia la derecha, es decir, si la distribucin es dividida exactamente a la
mitad, se observar que la cola de la figura se extiende hacia la derecha de la distribucin,
mientras que su cima o valor msalto de la distribucin se ubicar en la parte izquierda.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 167


3. Si el ndice de asimetra es menor que cero ( 3 < 0), la distribucin es asimtrica
negativao sesgadahacialaizquierda. Esdecir, si ladistribucin esdivididaexactamente
a l a mitad, se obser var que l a cola de la fi gura se encuentra hacia la i zquierda de
la distribucin, mientras que su cima o valor ms alto de la distribucin se ubicar en
la parte derecha.

media = mediana = moda

Figura 3.12. Distribucin simtrica 3


= 0.

Moda
Mediana

Media

Cola

Figura 3.13. Distribucin sesgada a la derecha 3


> 0.

Moda
Mediana

Media

Figura 3.14. Distribucin sesgada a la i zquierda 3


< 0.

Ejemplo 33

Calcula el ndice de asimetra para determinar qu tipo de sesgo tiene la siguiente serie de datos
de una poblacin: 1, 1, 2, 2, 2, 3, 3, 4, 5 y 6.
Para obtener el ndice de asimetra, primero debemos encontrar cada uno de los elementos de
su frmula.
Se encuentra la media poblacional:
X (1 1 2 ... 6) 29
2.9
N 10 10

168 ESTADSTICA PARA NEGOCIOS


Se encuentra la varianza poblacional:
2
24 9
2 (X ) .
V(X) 2.49
N 10
Se encuentra la desviacin estndar:

(X )2
1.57
N
Se eleva al cubo la desviacin estndar:
3
3.86
Se obtiene la suma del cubo de lasdesviaciones con respecto a la media:
(X )3 = 24.9
Finalmente, se sustituyen estosresultadosen la frmula del ndice deasimetra:

(Xj )3 24.48
n 10 2.448 0.6341
3
( )3 3.86 3.86

Se obtiene un ndice de asimetra positivo, por lo que se puede decir que la distribucin tiene
un pequeo sesgo positivo o derecho. Si se observa la figura de la distribucin de frecuencias, se
notar que tiene una cola que se alarga hacia el lado derecho de la distribucin:

Moda
Mediana
Media

Figura 3.15. Distribucin asimtrica positiva.

Ejemplo 34

Con la informacin del ejemplo 5, calcula el coeficiente de asimetra para saber hacia qu lado se
carga la cola de la curva de estosdatos.

Tiempode servicio f mj (mj f) (m j X) (m j X)3 [(mj X)3] f


5.00 8.99 3 6.995 20.985 8.64 644.972544 1 934.917632
9.00 12.99 5 10.995 54.975 4.64 99.897344 499.48672
13.00 16.99 7 14.995 104.965 0.64 0.262144 1.835008
17.00 20.99 6 18.995 113.97 3.36 37.933056 227.598336
21.00 24.99 3 22.995 68.985 7.36 398.688256 1 196.064768
25.00 28.99 1 26.995 26.995 11.36 1 466.003456 1 466.003456
25 390.875 453.4272
Tabla 3.30. Distribucin de lasventas por telfono.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 169


Los datos obtenidos son:
(mj f ) 390.875
X 15.635
n 25

(mj X)2 f 693.76 693.76


S2 28.90666667
n 1 (25 1) 24

(mj X)2 f
S 28.90666667 5.376492041
n 1

El numerador delafrmulaempleadaparacalcular el coeficientesedenotapor:

(mj X)3 f 453.4272 18.8928


n 1 24

Con los datosanteriores, el coeficiente de asimetra es:

( mj X)3 f
n 1 18.8928 18.8928
3
0.121562411
3 3
(S) (5.376492041) 155.4164633

Con el resultado se puede observar que el coeficiente es cercano a cero, as la distribucin se


caracterizapor ser insesgada, esdecir, quelacurva tieneunaformasimtricatal quelascolastienden
a ser iguales.

Figura 3.16. Di stribucin insesgada de lasventas por telfono.

170 ESTADSTICA PARA NEGOCIOS


1. En una distribucin con 3
= 0:

a) Media, mediana y moda son diferentes.


b) Media, mediana y moda coinciden en el mismo valor.
c) La media esmayor que la mediana y la moda.
d) La moda es mayor que la media y la mediana.

2. En una distribucin con 3


> 0:

a) La mediana esmayor que la media y la moda.


b) Media, mediana y moda coinciden en el mismo valor.
c) La media esmayor que la mediana y la moda.
d) La moda es mayor que la mediana y la moda.

3. En una distribucin 3
< 0:

a) La mediana esmayor que la media y la moda.


b) Media, mediana y moda coinciden en el mismo valor.
c) La media esmayor que la mediana y la moda.
d) La moda esmayor que la mediana y la moda.

4. Encuentrael ndicedeasimetraparaunaserieconformadapor lossiguientesdatosprovenientes


de una muestra: 0, 1, 1, 3 y 5, y seala qu tipo de distribucin es.

5. Con losdatosdelosingresosanuales(en miles) de300familiasquesepresentan acontinuacin,


calcula el coeficiente de asimetra para saber cmo es el sesgo de la distribucin.

Ingreso(miles de $) f
1.50 2.999 25
3.00 4.999 31
5.00 6.999 42
7.00 8.999 45
9.00 10.999 52
11.00 12.999 42
13.00 14.999 35
15.00 16.999 28
300

Di stribucin de salarios.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 171


3.7.1. Kurtosis

El ndice de kurtosis es una medida de dispersin mediante la cual se conoce qu tan concentrados
o qu tan dispersos se encuentran los datos alrededor de la media. Su resultado representa el grado
de apuntamiento deuna distribucin, esdecir, qu tan puntiaguda o qutan aplanada esla curva de
una distribucin. Cuando es muy puntiaguda se dice que los datos se encuentran muy concentrados
alrededor delamedia, mientrasquesi esmuy chatao aplanada, sedicequeexisteunagran dispersin
de losdatos alrededor de la media.
Para encontrar el ndice de kurtosis, las frmulas dependen de la informacin con la que se
trabaje y de lamaneraen quese encuentren organizadoslosdatos, ya sea que setratedeuna muestra
o deunapoblacin, o quelosdatosseencuentren no agrupadoso agrupados. Serepresenta mediante
la expresin 4.
Parael caso de datosno agrupados, lakurtosispoblacional y muestral seexpresan mediantelas
siguientes frmulas:

(Xj )4 ( X j X)4
N n 1
4 Poblacional = 4 4 Muestral 4
( ) (S)

Para el caso de datos agrupados, la kurtosis poblacional y muestral se obtienen utilizando las
siguientes frmulas:

( mj )4 f ( mj X)4 f
N n 1
4 Muestral
4 Poblacional
( )4 (S)4

Donde:
= Coeficiente dekurtosis. n = Tamao de lamuestra.
4
mj = Punto medio declase. = Tamao de lapoblacin.
X = Mediade lamuestra. = Desviacin estndar poblacional.
f = frecuencia dela clase. = Desviacin estndar delamuestra.
= Mediapoblacional.

La interpretacin del ndice de kurtosis se define segn el caso que se trate:

1. Si el ndicedekurtosisesigual atres( 4 = 3), ladistribucin no esni tan puntiagudani tan


plana. A este tipo de distribucin se le conoce como distribucin mesocrtica.

2. Si el ndice de kurtosis es mayor a tres ( 4 > 3), la distribucin es muy puntiaguda, es


decir, los datos se encuentran muy concentrados alrededor de la media. A este tipo de
distribucin se le conoce como distribucin leptocrtica.

3. Si el ndice de kurtosis es menor a tres ( 4 < 3), la distribucin es muy plana, es decir, los
datos se encuentran muy dispersos del valor de la media. A este tipo de distribucin se le
conoce como distribucin platicrtica.

172 ESTADSTICA PARA NEGOCIOS


4 > 3

Figura3.17. Distribucin leptocrtica.

4
=3 4
< 3

Figura3.18. Distribucin Figura3.19. Distribucin


mesocrtica. platicrtica.

Ejemplo 35

Empleando los datos del ejemplo 5, calcula el coeficiente de kurtosis para saber cmo es la forma de
la curva de estos datos.

Tiempode servicio f mj (mj f) (mj X) (mj X)4 [(mj X)4] f


5.00 8.99 3 6.995 20.985 8.64 5 572.56278 1 6717.68834
9.00 12.99 5 10.995 54.975 4.64 463.5236762 2 317.618381
13.00 16.99 7 14.995 104.965 0.64 0.16777216 1.17440512
17.00 20.99 6 18.995 113.97 3.36 127.4550682 764.7304092
21.00 24.99 3 22.995 68.985 7.36 2 934.345564 8 803.036692
25.00 28.99 1 26.995 26.995 11.36 16 653.79926 16 653.79926
25 390.875 45 258.04749

Tabla 3.31. Distribucin de las ventas por telfono.

Obtenemos la informacin necesaria para encontrar la kurtosis:

(mj f ) 390.875
X 15.635
n 25
2
2 (mj X) f 693.7 693.76 28.90666667
S 6
n 1 (25 1) 24
2
(mj X) f 28.90666667 5.376492041
S n 1

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 173


El numerador delafrmulaempleadaparacalcular el coeficientesedenotapor:

(mj X)4 f 45258.049 1 885.751979


n 1 24

Con los datosanteriores, el coeficiente de kurtosises:

( mj X)4 f
n 1 1 885.751979 1 885.751979
4
2.25677646
4 4
(S) (5.376492041) 835.5953778

Con el resultado se puede obser var que el coeficiente es menor a tres, por lo que la
di stribucin se caracteri za por ser platicrtica, es deci r, que la curva tiene una forma tal que
su apuntamiento es achatado, tal y como se muestra a continuacin:

Figura 3.20. Distribucin de las ventaspor telfono.

174 ESTADSTICA PARA NEGOCIOS


1. El ndice de kurtosis mide:

a) La simetra de una distribucin.


b) Un valor tpico o representativo de la distribucin.
c) La dispersin existente entre el valor mayor y el menor.
d) El grado de apuntamiento de una distribucin.

2. Si el ndice de kurtosis 4
es igual a tres, entonces:

a) La distribucin es asimtrica.
b) La distribucin es mesocrtica.
c) La distribucin es leptocrtica.
d) La distribucin es platicrtica.

3. Si el ndice de kurtosis 4
es menor a tres, entonces:

a) La distribucin es asimtrica.
b) La distribucin es mesocrtica.
c) La distribucin es leptocrtica.
d) La distribucin es platicrtica.

4. Si el ndice de kurtosis 4
es mayor a tres, entonces:

a) La distribucin es asimtrica.
b) La distribucin es mesocrtica.
c) La distribucin es leptocrtica.
d) La distribucin es platicrtica.

5. Con lossiguientesdatosdelosingresosanuales(en miles) de300 familias, calculael coeficiente


de kurtosis para conocer cmo es la forma de la curva de distribucin:

Ingreso(miles de $) f
1.50 2.999 25
3.00 4.999 3
5.00 6.999 42
7.00 8.999 45
9.00 10.999 52
11.00 12.999 42
13.00 14.999 35
15.00 16.999 28
300

Di stribucin de salarios.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 175


3.8. Agrupamiento dedatosmuestralesen el proceso decisorio delosnegocios
El manejo de datos agrupados en los negocios proporciona mayor facilidad en la manipulacin y
procesamiento de la informacin que requerimosparalatoma dedecisiones al interior dela organizacin.
Cuando iniciamos con mediciones del comportamiento de un determinado proceso podemos analizar
todoslosdatosobtenidossin lanecesidad deagruparlospero con el inconvenientedequesi sedecideampliar
el nmero de observacionesla complejidad puede aumentar y el tiempo de procesamiento tambin.
Otraopcin esel uso deagrupacionesdedatosqueconsisteen establecer clases(lmitesinferior
y superior) y estimar lafrecuenciadecadauno deellos, con esto estaremosdando un peso ponderado,
en otras palabras se generar una distribucin de frecuencias.
Si sedecideampliar el nmerodeobservacionesnocomplicarlamanipulacin delainformacin
dado que slo incrementaremos la frecuencia que corresponda o generaremos msrangos.
En muchos casos se requiere dar un peso o valor o grado de importancia a los datos recabados
durantelasobservacionestal como peso, volumen, costo, etc., y serequiere conocer la media de estas
observaciones, a este clculo se le da el nombre de media ponderada.
Para calcular la media ponderada utilizaremos la frmula siguiente:
wi X i
Xw
wi
Donde:
X i = valor del dato i.
wi = frecuencia o peso del dato i.

Para el caso de una poblacin aplica la misma frmula pero sustituimos la X w por .
w

Resumiendo, si el origen delosdatosesunamuestra, entoncesestaremoshablando delamedia


ponderada de la muestra; pero si el origen es una poblacin, entonces nos referiremos a la media
ponderada poblacional.

Ejemplo 36

Un almacn general necesita actualizar sus tarifas de almacenaje por da para mejorar su
competitividad. El administrador del almacn solicit informacin sobre el costo promedio por
metro cbico de almacenaje.

Contrato Costopor m3 m3
1 $50.00 1
2 $43.00 8
3 $38.00 25
4 $30.00 30
5 $40.00 10
6 $43.00 9
7 $39.00 27
8 $50.00 4
9 $45.00 6
10 $40.00 15

176 ESTADSTICA PARA NEGOCIOS


Para obtener la media ponderada aplicamos la frmula descrita anteriormente, as que:

50(1) 43(8) 38(25) 30(30) 40(10) 43(9) 39(27) 50(4) 45(6) 40(15)
Xw
1 8 25 30 10 9 27 4 6 15
5154
38.18 Media ponderada.
135

De acuerdo con el clculo realizado, el costo promedio diario ponderado por m3 almacenado
esde $38.18.
Este resultado lo utilizaremos ms adelante para tomar decisionesal respecto.

Continuando con el almacn general, el administrador necesita conocer cul es el tiempo


promedio que se almacenan las diferentes mercancas, para lo cual se desarroll la siguiente
distribucin de frecuencias.

Dasde almacenaje Frecuencia(f )


i

1 a10 20
11 a20 28
21 a30 19
31 a40 30
41 a50 12
51 a 60 14
61 a70 25
71 a80 8
81 a90 15

Para determinar el punto medio de cada clase m, i


realizamos lo siguiente: (lmite inferior +
lmite superior)/ 2, as que el punto medio para la primera clase ser (1+10)/ 2 = 5.5, para la segunda
clase ser (11+20)/ 2=15.5 y as sucesivamente.
Posteriormente realizamosel producto de lafrecuencia(f ) por el punto medio (m) decadaclase
i i
obteniendo la tabla siguiente:

Das dealmacenaje Frecuencia(f i ) Puntomedio declase(m)i f i mi

1 a10 20 5.5 110.0


11 a20 28 15.5 434.0
21 a30 19 25.5 484.5
31 a40 30 35.5 1 065.0
41 a50 12 45.5 546.0
51 a 60 14 55.5 777.0
61 a70 25 65.5 1 637.5
71 a80 8 75.5 604.0
81 a90 15 85.5 1 282.5
171 6 940.5

Aplicamos la frmula para determinar el promedio muestral:

fimi 6 940
X 40.58 das de almacenaje.
fi 171

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 177


Continuando con el ejemplo procedemosacalcular lavarianzayladesviacin estndar:

Puntomedio de
Das dealmacenaje Frecuencia(f )i Desviacin(m X) (m X)2 f i(m X)2
clase(m)i i i i

1 a10 5.5 20 35.08 1 230.61 24 612.13


11 a20 15.5 28 25.08 629.01 17 612.18
21 a30 25.5 19 15.08 227.41 4 320.72
31 a40 35.5 30 5.08 25.81 774.19
41 a50 45.5 12 4.92 24.21 290.48
51 a 60 55.5 14 14.92 222.61 3 116.49
61 a70 65.5 25 24.92 621.01 15 525.16
71 a80 75.5 8 34.92 1 219.41 9 755.25
81 a90 85.5 15 44.92 2 017.81 30 267.10
106 273.69

Aplicando la frmula de la varianza para una muestra:


2
S
2 fi (mi X) 106 273.69 625.14
n 1 170

La desviacin estndar:

S 625.14 25.0027 25 das

Conclusin sobre el problema.


Un costo promedio diario ponderado por m3 de almacenaje de $38.18.
El promedio de das de almacenaje es de 40.58 das.
La varianza es igual a 625.14 dis2.
La desviacin estndar es de 25 das.

Con esta informacin el administrador puede fomentar mediante tarifas preferenciales a los
contratos que tengan sus mercancas por menos de 40 das, con la finalidad de disponer de espacio
en corto plazo, en otras palabras, rentar el espacio un mayor nmero de veces.

178 ESTADSTICA PARA NEGOCIOS


1. Una medida de tendencia central seala:

a) Hacia dnde se concentran losvalores de una serie de datos.


b) El grado de dispersin de una muestra o una poblacin.
c) Un valor que divide una serie de datos en cuatro partes iguales.
d) Una frmula que presenta informacin de los percentiles.

2. Es el valor que ocupa el lugar central en una serie de datos, ubicndose 50% por encima de los
datos con mayor valor y 50% por debajo de los datos con menor valor:

a) Media.
b) Percentil.
c) Mediana.
d) Moda.

3. La frmula de la media se define como:

a) La variable que se presenta con mayor frecuencia en una distribucin.


b) Una medida de dispersin.
c) Una medida que se divide en dospartes.
d) La suma total de las observacionesdividida entre el nmero de valores

4. En la serie simple: 2, 4, 5, 1, 2, 5, 6, 8, el cuartil Q 1 est representado por:

a) 6
b) 3
c) 2
d) 4

5. En la serie simple: 2, 4, 5, 1, 2, 5, 6, 8, el decil D 5est representado por:

a) 8
b) 3
c) 4
d)

6. En la serie 2, 4, 6, 5, 1, 7, 11, 6, 8, la moda est representada por:

a) 6
b) 5
c) 4
d) No hay moda.

7. Es una medida de tendencia central:

a) El rango.
b) La moda.
c) La varianza.
d) La desviacin estndar.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 179


8. La medida de tendencia central que toma en cuenta todoslos datos de la serie es:

a) La moda.
b) La mediana.
c) El cuartil.
d) La media.

9. Los datos agrupados se refieren:

a) A los datos que se obtienen en forma aleatoria.


b) Los datos que se ordenan en forma ascendente.
c) Los datos organizados en una distribucin de frecuencias.
d) Todos losvaloresobservadosde la variable que se enlistan.

10. Cuando la distribucin de frecuencia essimtrica:

a) La moda es diferente que la media.


b) La mediana esigual que la moda pero diferente que la media.
c) La moda y mediana son diferentes.
d) La media, la moda y la mediana son iguales.

11. Un banco toma una muestra de 20 analistas financieros y les pide que hagan una prediccin
sobre las ganancias por accin (dlares por accin) de una gran empresa para el prximo ao.
Los resultados que obtuvieron son:

Prediccin(dlarespor accin) f F
a

9.950 10.449 2 2
10.450 10.949 8 10
10.950 11.449 6 16
11.450 11.949 3 19
11.950 12.449 1 20
20

Tabla 3.31. Di stribucin de lasgananciaspor accin.

Con los datosanteriores:

11.1. La media es:

a) 10.4720
b) 11.0245
c) 11.1034
d) 12.0130

11.2. La mediana es:

a) 9.9895
b) 10.3745
c) 10.995
d) 10.949

180 ESTADSTICA PARA NEGOCIOS


11.3. El valor de la moda es:

a) 10.8245
b) 11.9450
c) 12.3445
d) 9.9745

11.4. El valor del cuartil dos (Q 2) es:

a) 10.0235
b) 11.1035
c) 10.9745
d) 10.9495

11.5. El valor del decil cuatro (D 4) es:

a) 11.3425
b) 10.9350
c) 10.8245
d) 10.4584

11.6. El valor del percentil sesenta ( ) es:


60

a) 10.0130
b) 11.1161
c) 11.1040
d) 12.3020

12. El rango se obtiene:

a) Sumando el valor mnimo y el valor mximo deun conjunto dedatos.


b) Restando al valor mximo, el valor mnimo de un conjunto de datos.
c) Restando al valor mnimo, el valor mximo de un conjunto de datos.
d) Promediando el valor mximo yel valor mnimo deun conjunto dedatos.

13. El rango tiene la siguiente caracterstica:

a) Es sensible a valores desproporcionados de un conjunto de datos.


b) No essensibleavaloresdesproporcionadosdeun conjunto dedatos.
c) Es til para calcular variacionescon datos desproporcionados.
d) No sirve para calcular variacionescon datos proporcionados.

14. Una desventaja de la varianza radica en que:

a) No seala la manera en que se concentran losdatos.


b) No se puede encontrar la desviacin estndar.
c) Sus resultadosson expresados en unidades al cuadrado.
d) No considera las desviaciones respecto a la media.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 181


15. Para calcular la varianza con datos agrupados:

a) Se debe conocer la mediana.


b) Sedebe conocer la moda.
c) Se debe conocer la frecuencia relativa.
d) Se debe conocer el punto medio de clase.

16. En los conjuntos cuya distribucin es simtrica y acampanada:

a) Gran parte de los datos se encuentran cercanosde la media.


b) Gran parte de los datos se encuentran cercanosa la varianza.
c) Gran parte de los datos se encuentran cercanos al cero.
d) Pocosdatos se agrupan alrededor de la moda.

17. El ndice de kurtosis mide:

a) La simetra de una distribucin.


b) Un valor tpico o representativo de la distribucin.
c) La dispersin existente entre el valor mayor y el menor.
d) El grado de apuntamiento de una distribucin.

18. Una distribucin que tiene un pico muy alto se denomina:

a) Distribucin mesocrtica.
b) Distribucin de frecuencias.
c) Distribucin platicrtica.
d) Distribucin leptocrtica.

19. Si el ndice de kurtosis 4


es igual a tres, entonces:

a) La distribucin es asimtrica.
b) La distribucin es mesocrtica.
c) La distribucin es leptocrtica.
d) La distribucin es platicrtica.

20. Si el ndice de kurtosis 4


es menor a tres, entonces:

a) La distribucin es asimtrica.
b) La distribucin es mesocrtica.
c) La distribucin es leptocrtica.
d) La distribucin es platicrtica.

21. Si el ndice de kurtosis 4


es mayor a tres, entonces:

a) La distribucin es asimtrica.
b) La distribucin es mesocrtica.
c) La distribucin es leptocrtica.
d) La distribucin es platicrtica.

182 ESTADSTICA PARA NEGOCIOS


22. El coeficiente de asimetra mide:

a) La altitud de la curva de distribucin.


b) El sesgo de la curva de distribucin.
c) La media de una distribucin.
d) La varianza de una distribucin

23. Una distribucin asimtrica negativa se caracteriza por:

a) Tener un sesgo hacia la izquierda.


b) No tener sesgo.
c) Tener sesgo hacia la derecha.
d) Es simtrica.

24. Una empresa mayorista distribuidora de aparatos elctricos desea estudiar sus cuentas por
cobrar (en miles de pesos) para dos meses sucesivos (abril y mayo). Se seleccionan dos muestras
independientesdecincuentacuentasparacadauno delosmeses. Losdatosqueserecolectaron son:

Monto(miles$) f (abril) Monto(miles$) f (mayo)


0 1.999 6 0 1.999 10
2.000 3.999 13 2.000 3.999 14
4.000 5.999 17 4.000 5.999 13
6.000 7.999 10 6.000 7.999 10
8.000 9.999 4 8.000 9.999 0
10.000 11.999 0 10.000 11.999 3
50 50

Tabla 3.32. Distribucin de lascuentaspor cobrar.

Con los datosanteriores, para losmeses de abril y mayo respectivamente:


24.1. Las medias son:

a) 4.7195 y 4.3995
b) 4.0078 y 4.4475
c) 3.9945 y 4.5785
d) 4.1975 y 4.9935

24.2. Las varianzas son:

a) 5.5065 y 6.9958
b) 5.0628 y 7.0612
c) 5.2145 y 7.1628
d) 5.0325 y 7.0022

24.3. Las desviacionesestndar son:

a) 2.3465 y 2.6449
b) 2.2835 y 2.6763
c) 2.2500 y 2.6572
d) 2.2433 y 2.6461

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 183


24.4. Los coeficientes de variacin son:

a) 47.67% y 60.39%
b) 58.54% y 59.46%
c) 57.16% y 58.45%
d) 53.44% y 52.99%

24.5. Los coeficientes de kurtosis son:

a) 2.3456 y 3.2658
b) 2.5546 y 3.2245
c) 2.1033 y 3.1555
d) 2.2893 y 3.0866

24.6. Los coeficientes de asimetra son:

a) 0.3022 y 0.8854
b) 0.2547 y 0.4458
c) 0.1029 y 0.6630
d) 0.0547 y 0.7078

24.7. Segn el apuntamiento del mes de abril, la distribucin es:

a) Leptocrtica.
b) Platicrtica.
c) Mesocrtica.
d) Asimtrica positiva.

184 ESTADSTICA PARA NEGOCIOS


X 5 432 354 825.00
1. X 55.72594 miles de pesos por habitante.
n 97 483 412

mj fi 1 757
2. X 36.60 aos.
fi 48

X (37 30 23 ... 26 13 42 38) 995


3. X 39.8 minuto
n 25 25

X (142 163 108 ... 139) 2 740


5. X 137 chamarras.
n 20 20
mj fi 1 757
4. X 36.60 minutos.
fi 48
mf 2 790
6. X j i
37.2
fi 75

(10 10) 20
1. Md 10 La mediana indica que se vendieron 10 automviles.
2 2
(17 18) 35
17.5 El peso por paquete que se encuentra en la mediana esde17.5 kg.
2. Md 2
2
3. N (n 1) (11 1) 12
d
6 El valor que se encuentra colocado en el nmero 6 es $35 000,
2 2 2
queeslamedianadelossalariosdelosejecutivos.
n
4. Como es nmero par se toma el promedio de los valores que se encuentran en N y
d1
2
n 2
N d2
2
20
Nd1 10 N n 2
11
2
d2 2
El valor que ocupa el lugar 10 es42 y el lugar 11 es 42, por tanto la mediana es42, siendo
la mediana del tiempo en minutosque duran las entrevistas.
n 200
F 60
2 a 2 (100 60)
5. Md Li I 35.005 5 35.005 5 35.005 40
fm 60 60 60 5

172.5
Md 29.5 29.5 6.39 35.89
27

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 185


n 75
F 26
2 a 2
Md Li I 29.5 15 29.5 37.5 26 11.5
6. 15 29.5 15
fm 27 27 27

172.5
Md 29.5 29.5 6.39 35.89
27

1. La observacin 10 representa la moda, ya que esla observacin que se repite ms veces.


2. No hay moda, ya que ninguna observacin se repite.
3. El $30 000 representa la moda, ya que es la observacin que ms se repite.
4. El 42 representa la moda, ya que es la observacin que se repite ms veces.
30 30 150
5. Mo Li 1
*I 35.005 5 35.005 5 35.005
1 2 (30 10) 40 40
Mo = 29.5 + 5.45 = 34.95
8 8 120
1
6. Mo Li *I 29.5 15 29.5 15 29.5
1 2 8 14 22 22
Mo = 29.5 + 5.45 = 34.95

1. b)
2. c)
3. d)
4. Inciso a) Diagrama de frecuencias para la poblacin en Mxico.

4. Inciso b) La grfica tiene la cima cargada hacia el lado derecho y su cola se encuentra en la parte
izquierda, por lo que es una distribucin de frecuencias asimtrica con sesgo derecho o positivo.
Adems, seobserva quelasmedidasde tendencia central se encuentran de la siguientemanera:

186 ESTADSTICA PARA NEGOCIOS


Moda es(9.512) < Mediana (22.97) < Media (26.31)
Lo que confirma el resultado de que la distribucin tiene sesgo derecho o positivo.

1.
a) N0 / 4 = 50
20 100
(N o Fa) (50 30) 5 30 005
Q Li I 30.005 5 30.005 .
1
fc 30 30 30

1
= 30.005 + 3.33 = 33.335

b) N0 = 4 / 10 = 80
(80 60) 20 100
D4 35.005 5 35.005 5 35.005 35.005 1.66 36.665
60 60 60
c) N0 = 63 / 100 = 126
(126 120) 6 30
P63 40.005 5 40.005 5 40.005 40.005 0.6 40.605
50 50 50
2.
a) N0 = 3 / 4 = 56.25

Q3 No Fa 56.25 53 15 44 5 3.25 48.75


Li I 44.5 . 15 44.5
fc 13 13 13

3
= 44.5 + 3.75 = 48.25

b) N0 = 5 / 10 = 37.5
37.5 26 11.5 172.5
D5 29.5 15 29.5 15 29.5 29.5 6.38 35.88
27 27 27
c) N0 = 36 / 100 = 27
27 26 1 14
P36 29.5 15 29.5 14 29.5 29.5 0.55 30.51
27 27 27

1. a)
2. d)
3. b)
4. a)
5. Para hallar el rango se debe identificar el valor msalto y el valor msbajo. El valor mximo es
18 700 y el valor mnimo es9 000. Por esto, el rango es:
Rango Valor mximo Valor mnimo = 18 700 9 000 = 9 700
El rango es 9 700, por lo que la diferencia exi stente entre los cobros es de 9 700 pesos,
mostrando que l a vari abil idad es considerable por la diferencia exi stente.

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 187


1. b)
2. d)
3. c)
4. b)
5. En primer lugar, hay quecalcular lamediadelosdatosparaposteriormenteobtener lasdesviacionesy
lasdesviacionescuadradas.
La media se define por:

X (10 000 12 000 15 000 ... 14 00 18 700 16 500) 205 900


X
N 15 15

X 13 726.66667

Como el clculo de la varianza requiere obtener las diferencias de los datos con respecto a
la media ( X X) y lasdiferenciascuadradas( X X)2, setiene:

X (X X) ( X X)2 X ( X X) ( X X)2
10 000 3 726.666667 13 888 044.45 9 700 4 026.666667 16 214 044.45
12 000 1 726.666667 2 981 377.779 18 000 4 273.333333 18 261 377.77
15 000 1 273.333333 1 621 377.777 13 200 526.6666666 277 377.7777
16 000 2 273.333333 5 168 044.443 12 600 1 126.666667 1 269 377.779
15 000 1 273.333333 1 621 377.777 14 000 273.3333334 74 711.11115
9 000 4 726.666667 18 289 877.78 18 700 4 973.333333 24 734 044.44
13 500 226.6666666 51 377.77775 16 500 2 773.333333 7 691 377.776
12 700 1 026.666667 1 054 044.445 113 197 833.3
Desviaciones de los cobros.
Cadadiferenciaseobtuvorestandoacadavalor deXlamedia, yladiferenciacuadradaelevando
al cuadrado cada diferencia. Empleando la frmula para determinar la varianza, considerando que
losdatosdecobrosconstituyen lamuestra:

V(X) S2 (X X)2 113 197 833.3 8 085 559.521


n 1 14
Puede apreciarse que la varianza es de 8 085 559.521, pero no tiene significado prctico
esta medida de variabilidad.

6. Las clases denotan el ingreso familiar anual y la frecuencia el nmero de familias encuestadas.

Ingreso(miles de$) f mj ( j
f) ( j
X) (mj X)2 [( j
X)2] f
1.50 2.999 25 2.2495 56.2375 6.93083 48.03640449 1 200.910112
3.00 4.999 3 3.9995 123.9845 8.78083 77.10297549 2 390.192240
5.00 6.999 42 5.9995 251.979 3.18083 10.11767949 424. 942539
7.00 8.999 45 7.9995 359.9775 1.18083 1.39435949 62.746177
9.00 10.999 52 9.9995 519.974 0.81917 0.67103949 34.894053
11.00 12.999 42 11.9995 503.979 2.81917 7. 94771949 333.804219
13.00 14.999 35 13.9995 489.9825 4.81917 23. 22439949 812.853982
15.00 16.999 28 15.9995 447 986 6.81917 46.50107949 1 302.030226
300 2 754.100 6 562.373548
Di stribucin de los ingresosfamiliares.

188 ESTADSTICA PARA NEGOCIOS


Para obtener la varianza, en primer lugar, se debe calcular el punto medio de clase
sumando los lmites inferior y superior de cada clase y, posteriormente, dividir la suma entre
dos. Al haber calculado el punto medio de cada clase, debe multiplicarse ste por la frecuencia
y sumar losproductos para obtener la media, tal y como se muestra a continuacin:

(mj f ) 2 754
X 9.18033 Laclasequepresentalamediaeslaquinta.
n 300

Despus de calcular la media se debe restar a cada punto medio de clase la media, elevar
la diferencia al cuadrado y multiplicar esta diferencia cuadrtica por la frecuencia respectiva
para obtener la varianza de la manera siguiente:

[(m X)2 f ] 6 562.373548 6 562.3735


2 j 21.94773762
S
n 1 (300 1) 299
La varianza obtenida no tiene un sentido lgico, slo puede deducirse que la clase que
presenta la mayor variacin es la quinta, donde el rango promedio de ingresos familiares est
entre 9 y 10.999 miles de pesos, para 52 familias.

1. Partiendo de los datosdel punto 1 del ejercicio se tiene:


2
= 8 085 559.521
La desviacin estndar es la raz cuadrada de la varianza:

(X X)2
S 8 085 559.521 2 483.511829
n 1

El resultado muestra que los cobros de la empresa tienen una variacin de 2 843.511829
pesos, es decir, que puede cobrar 2 843.511829 pesospor abajo o por encima de la media.

2. Con losdatosdel punto 2 ejercicio, ladesviacin estndar ser:


2
= 21.94773762

2
(mj X) f 21.94773762 4.684841259
S n 1
Esto muestraquelavariacin queexiste entre losingresosrecibidospor lasfamiliasesen
promedio de 4.684841259 milesde pesos.

1. c)
2. a)
3. d)
4. d)
5. a)
6. b)
7. d)

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 189


8.
1
1 100% 1 100% [1 (0.1111)]100 (0.8889) (100) 88.89%
1
(3)2 9

Valor superior: 16.5 + (3) (4.3) = 29.4


9.
1 100% 1
1 1 100% [1 (0.6944)] 100 (0.3056) (100) 30.56%
(1.2)2 1.44
Valor inferior: 2000 (1.2) (300) = 1 640
Valor superior: 2000 + (1.2) (300) = 2 360
10.

1 100% 1
1 1 100% [1 (0.1736)] 100 (0.8263) (100) 82.63%
(2.4)2 5.76
Valor inferior: 95 (2.4) (25) = 35
Valor superior: 95 + (2.4) (25) = 155

1. c)
2. a)
3. d)
4. En primer lugar sedebeobtener lamediadelosrendimientos, esdecir, el rendimiento promedio
por accin para calcular las desviacionescuadradas de los datos con respecto a la media:

X (150 125 120 200 250 175 200 250 180 140) 1 790
X 179
D 10 10
n
X (200 275 180 195 280 250 240 200 300 290) 2 410
X 241
L 10 10
n

con una venta promedio de 247 transacciones diarias, mientras que el dlar tiene una venta
promedio de 179 transacciones diarias.
El siguientepaso esobtener lasdiferenciasdecadavalor con respecto asu media, elevarlas
al cuadrado y sumarlas para obtener la varianza y, posteriormente, sacarles la raz cuadrada
para obtener la desviacin estndar:
Dlar:
2 2 2 2
(X X)D (150 179) (125 179) ... (140 179) 19 740
Libra:
2 2 2 2
(X X)L (200 247) (275 247) ... (290 247) 18 200
Una vez calculadaslas sumas de las desviacionescuadradas se procede a definir las varianzas:

V(X) 2 (X X)2 19 740


D S 2 193.333333
n 1 9
2
V(X) 2 (X X) 18 200
L S 2 022.222222
n 1 9

190 ESTADSTICA PARA NEGOCIOS


Puede observarsequelavarianzadelastransaccionesdela libra esmenor que la varianza
de las transacciones del dlar. Esto indica que la venta de dlares tiene una mayor dispersin,
pero no se puede tener una interpretacin coherente del resultado debido a que se emplean
cuadrados, por lo cual se sacan lasraces para obtener las desviacionesestndar:
(X X)2
S . .
D 2 193 333333 46 83303677
n 1
(X X)2
S .
L 2 022 222222 44.96912521
n 1
Puede observarse que la libra tiene una mayor venta promedio con una variabilidad de
44.96922521, pero la venta del dlar tiene una variabilidad mayor (46.83303677).
Con estos datos es posible calcular el coeficiente de variacin y comparar la variabilidad
de lastransacciones de ambas monedas en trminos porcentuales.
SD 46.83303677 100 (0.261637076) (100)
CV 100% 26.1637076%
D
XD 179

SL
CV 100% 44.96912521
L 100 (0.182061235) (100) 18.2061235%
XL 247
Con losresultadosseapreciaquelastransaccionesdelibraspresentan lamenor variacin, por
lo quesepuedeconcluir quelalibraresultaser unamonedamsestableen cuanto asu venta.

1. b)
2. c)
3. d)
4.
Se obtiene la desviacin estndar de la serie: S= 2.
Se obtiene la suma del cubo de lasdesviaciones.
(X X)3 = (2)3 + (1)3 +(1)3 + (3)3 + (5)3 = 8 1 1 +1 +27 =18
Se obtiene el ndice muestral de asimetra para datosno agrupados:
3
(Xj X) 18
n 1 4
3 0.56 Tiene sesgo derecho o positivo.
(S)3 (2)3
5. Empleando los datos se tiene lo siguiente:

j j

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 191


5.00 6.999 42 5.9995 251.979 3.18083 424.9392 102.3674382 4 299.432404
7.00 8.999 45 7.9995 359.9775 1.18083 62.7435 1.944238384 87.49072728
9.00 10.999 52 9.9995 519.974 0.81917 34.892 0.450293995 23.41528774
11.00 12.999 42 11.9995 503.979 2.81917 333.8034 63.16624507 2 652.982293
13.00 14.999 35 13.9995 489.9825 4.81917 812.8505 539.3727316 18 878.0456
15.00 16.999 28 15.9995 447 986 6.81917 1302.028 2 162.350394 60 545.81103
300 2 754.100 6568.3565 328 465.5149

Di stribucin de los ingresosfamiliares.

192 ESTADSTICA PARA NEGOCIOS


(mj f ) 2 754.1
X 9.18
n 300
(mj X)2 f 6 562.3565
S2 21.9476
n 1 299
2
(mj X) f 21.9476 4.6848
S n 1

(mj X)4 f 328 465.5149 1 098.546872


n 1 299

Con los datosanteriores, el coeficiente de kurtosises:

(mj X)4 f
n 1 1 098.546872 1 098.546872
4
28.407967
4 2
(S) (4.685) 481.768478
Con el resultado se puede observar que el coeficiente es mayor a tres, por lo que la
distribucin secaracterizapor ser leptocrtica, esdecir, que la curva tiene una forma tal quesu
apuntamiento es muy alto.

1. d)
2. b)
3. d)
4. c)
5. Los datos a emplear son:

Ingreso(miles de $) f mj ( j f) ( j X) ( j X)3 [( j X)3] f


1.50 2.999 25 2.2495 56.2375 6.93083 332.9321533 8 323.303833
3.00 4.999 3 3.9995 123.9845 8.78083 677.0281203 20 987.87173
5.00 6.999 42 5.9995 251.979 3.18083 32.18261845 1 351.669975
7.00 8.999 45 7.9995 359.9775 1.18083 1.646501515 74.09256818
9.00 10.999 52 9.9995 519.974 0.81917 0.549695418 28.58416174
11.00 12.999 42 11.9995 503.979 2.81917 22.40597235 941.0508387
13.00 14.999 35 13.9995 489.9825 4.81917 111.9223293 3 917.281526
15.00 16.999 28 15.9995 447 986 6.81917 317.0987662 8 878.765454
300 2 754.100 16 971.25623
Di stribucin de los ingresosfamiliares.

Los datos obtenidos son:

(mj f ) 2 754.1
X 9.18
n 300

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 193


(mj X)2 f 6 562.3565
S2 21.9476
n 1 299
2
(mj X) f 21.9476 4.6848
S n 1

El denominador de la frmula empleada para calcular el coeficiente se denota por:

(mj X)3 f 16 971.25623 54.160054


n 1 299

Con los datosanteriores, el coeficiente de asimetra es:

(mj X)3 f
n 1 54.160054
3 0.5519676
(S)3 (4.685)3

Con el resultado se puede observar que el coeficiente es negativo, por lo que la distribucin
se caracteriza por ser sesgada negativamente, es decir, que la curva tiene una forma tal que la cola
izquierda esms larga.

194 ESTADSTICA PARA NEGOCIOS


1. a)
2. c)
3. d)
4. c)
5. c)
6. a)
7. b)
8. d)
9. c)
10. d)
11.
11.1. b)
11.2. d)
11.3. a)
11.4. d)
11.5. c)
12. b)
13. a)
14. c)
15. d)
16. a)
17. d)
18. d)
19. b)
20. d)
21. c)
22. b)
23. a)
24.
24.1. a)
24.2. b)
24.3. c)
24.4. a)
24.5. d)
24.6. c)
24.7. b)

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 195

S-ar putea să vă placă și