Sunteți pe pagina 1din 101

Estadstica Gerencial

T utor: D ra. Lourdes Ziga L.



1
UNIDAD I

EL PAPEL DE LA ESTADSTICA

1.1 INTRODUCCIN

A medida que aumenta la complejidad de nuestro mundo, se hace cada vez ms difcil
tomar decisiones inteligentes y bien documentadas. Con frecuencia tales decisiones
deben tomarse con mucho menos que un conocimiento adecuado y experimentando una
gran incertidumbre. Sin embargo, las soluciones a estos problemas son esenciales para
nuestro bienestar e incluso para nuestra supervivencia final. Continuamente estamos
recibiendo presiones debido a problemas econmicos angustiosos como una inflacin
galopante, el sistema tributario engorroso y oscilaciones excesivas en el ciclo
empresarial. Todo nuestro tejido econmico y social est amenazado por la
contaminacin ambiental, la deuda publica, la tasa de criminalidad que siempre va en
aumento y las impredecibles tasas de inters.

Si estas condiciones parecen ser caractersticas del estilo de vida actual, no debe olvidarse
que problemas de esta naturaleza contribuyeron a la cada de la antigua Roma ms que la
invasin de las hordas de brbaros provenientes del norte. Un periodo de xito en este
planeta, relativamente corto, no es garanta de una supervivencia futura. A menos que
puedan encontrarse soluciones viables a estos apremiantes problemas, podramos
acompaar en el olvido al dinosaurio y al ave dodo. Como ya lo hicieron los antiguos
romanos.

Este captulo aportar una visin general sobre lo que es la estadstica y cmo puede
utilizarse. Esta visin general sobre la naturaleza de la estadstica y los beneficios que
puede proporcionarnos se efectuara revisando:

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

2
Las definiciones bsicas de las herramientas estadsticas.
Cmo llevar a cabo el muestreo para realizar anlisis estadsticos.
Las funciones que cumple la estadstica.
Cmo puede ayudar la estadstica en la profesin.
1.2 LA IMPORTANCIA DE LA ESTADSTICA

Virtualmente cada rea de la investigacin cientfica seria puede beneficiarse del anlisis
estadstico. Para quien formula las polticas econmicas y para quien asesora al presidente y
a otros funcionarios pblicos sobre procedimientos econmicos apropiados, la estadstica
ha demostrado ser una herramienta valiosa. Las decisiones sobre las tasas tributarias, los
programas sociales, el gasto de defensa y muchos otros asuntos pueden hacerse de manera
inteligente tan slo con la ayuda del anlisis estadstico. Los hombres y mujeres de
negocios, en su eterna bsqueda de la rentabilidad, consideran que la estadstica es esencial
en el proceso de toma de decisiones. Los esfuerzos en control de calidad, minimizacin de
costos, combinacin de productos e inventarios, y una gran cantidad de otros asuntos
empresariales, pueden manejarse efectivamente a travs del uso de procedimientos
estadsticos comprobados.

Para quienes estn en el rea de la investigacin de mercados, la estadstica es de gran
ayuda en el momento de determinar qu tan probable es que un producto nuevo sea exitoso.
La estadstica tambin es muy til para evaluar las oportunidades de inversin por parte de
asesores financieros. Los contadores, los jefes de personal, y los fabricantes encuentran
oportunidades ilimitadas de beneficiarse con el uso del anlisis estadstico. Incluso un
investigador en el campo de la medicina, interesado en la efectividad de un nuevo
medicamento, considera la estadstica una aliada imprescindible.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

3
Tales aplicaciones y muchas otras se ilustran a lo largo de esta unidad. Se mostrar cmo
utilizar la estadstica en el mejoramiento del desempeo laboral y en muchos otros aspectos
de la vida diaria.

1.3 LAS FUNCIONES DE LA ESTADSTICA

En repetidas ocasiones se ha enfatizado la utilidad de la estadstica y la amplia variedad de
problemas que puede resolver. Para ilustrar de manera ms completa esta amplia
aplicabilidad, es necesario analizar las diversas funciones de la estadstica. La estadstica
es la ciencia que tiene que ver con la (1) recoleccin, (2) organizacin. (3) presentacin..
(4) anlisis, e (5) interpretacin de datos.

Aunque en todo estudio estadstico el primer paso es la recoleccin de datos, es usual en un
curso bsico de estadstica asumir que los datos ya han sido recolectados y que ahora estn
disponibles. Por consiguiente, el trabajo comienza con el esfuerzo por organizar y presentar
estos datos de manera significativa y descriptiva. Los datos deben colocarse en un orden
lgico que revele rpida y fcilmente el mensaje que contienen. Este procedimiento
constituye el proceso de la estadstica descriptiva, tal como se define y se discute en los
captulos siguientes. Luego de que los datos se han organizado y se han presentado para su
revisin, el estadstico debe analizarlos e interpretarlos. Estos procedimientos se basan en la
estadstica inferencial y constituyen un importante beneficio para el anlisis estadstico,
mediante la ayuda en el proceso de toma de decisiones y solucin de problemas.

Se descubrir que a travs de la aplicacin de procedimientos estadsticos precisos, es
posible predecir el futuro con cierto grado de exactitud. Toda empresa que se enfrenta a las
presiones competitivas puede beneficiarse considerablemente de la capacidad para anticipar
las condiciones del negocio, antes que stas ocurran. Si una empresa sabe cmo van a estar
sus ventas en cierto momento en el futuro cercano, la gerencia puede hacer planes ms
exactos y efectivos respecto a las operaciones actuales. Si se calcula las ventas futuras con
un grado de exactitud confiable, la gerencia puede tomar fcilmente decisiones importantes
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

4
respecto a los niveles de inventario, pedidos de materia prima, contrataciones de empleados
y, virtualmente, sobre cada aspecto de las operaciones del negocio en si.

1.4.- BENEFICIOS DE LA ESTADSTICA

Es factible que en pocos aos abandone la relativa seguridad del ambiente acadmico y est
metido de cabeza en el mundo competitivo. Desde el punto de vista practico, usted debe
conocer la manera de utilizar los conocimientos en estadstica despus de graduarse. No
existe duda alguna acerca de que una experiencia acadmica. adecuadamente relacionada
con unos firmes cimientos ampliara significativamente las oportunidades de encontrar
empleo y, posteriormente, le permitir demostrar la competividad laboral.

Cuando encuentre ese trabajo anhelado que le ponga en la rpida ruta del xito profesional,
su jefe espera que usted haga dos cosas:
1. Tomar decisiones.
2. Solucionar problemas.
Estos dos cometidos pueden lograrse a travs de la aplicacin de procedimientos
estadsticos.
1.4.1 LA APLICACIN UNIVERSAL DE LA ESTADSTICA

Al ser capaz de solucionar problemas y tomar decisiones, se obtendr una excelente
posicin en la demanda del mercado laboral. Si logra tomar decisiones incisivas cuando se
est solucionando los problemas de alguien, dicha persona estar dispuesta a proporcionarle
una recompensa generosa. El mundo laboral paga ms a las personas que son capaces de
plantear las preguntas correctas para alcanzar los objetivos fundamentales, que a quienes
tienen la responsabilidad de resolverlas. Con frecuencia, las respuestas son bastante
evidentes una vez que se han planteado las preguntas. El anlisis estadstico probar ser de
gran utilidad en la acertada formulacin de estas preguntas esenciales.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

5
Los empresarios reconocen que los problemas complejos que enfrenta el mundo actual
requieren soluciones cuantitativas. Si usted no est en capacidad de aplicar la estadstica y
otros mtodos cuantitativos a muchos de los problemas comunes que sin duda se le
presentarn, estar en gran desventaja en el mercado laboral.

Casi todas las reas del saber requieren del pensamiento estadstico. Las disciplinas de
estudio que dependen ampliamente del anlisis estadstico, incluyen - pero no se limitan a-
markting, finanzas, economa e investigacin de operaciones. Los principios aprendidos en
contabilidad y gerencia administrativa tambin se basan en la preparacin estadstica.

Los analistas financieros y econmicos con frecuencia se basan en sus habilidades
cuantitativas para proporcionar soluciones a problemas difciles. La comprensin de los
principios financieros y econmicos permitir aplicar las tcnicas estadsticas para hallar
soluciones viables y tomar decisiones. Quienes aspiran a cargos en el rea contable o
administrativa, a ser independientes, o a desempear otra profesin en el sector industrial.
Descubrirn que comprender la estadstica no slo mejora las oportunidades de obtener un
empleo, sino que tambin aumenta la probabilidad de promocin mediante el
enriquecimiento en el desempeo laboral.

Las personas empleadas en tareas cuantitativas que trabajan con procedimientos
estadsticos, con frecuencia gozan de salarios ms altos y estn ms protegidos de los
trabajos sin futuro. Adems, muy al inicio de sus carreras, generalmente se encuentran en
contacto cercano con personas en cargos de alto nivel. La proximidad a la lite ejecutiva es
inevitable porque la alta gerencia necesita de la informacin y asistencia que la gente con
entrenamiento en estadstica puede proporcionarle. En el mercado laboral actual, los
empresarios sencillamente no desean contratar o conservar a quienes no saben estadstica.

Bien sea que las aspiraciones profesionales tiendan hacia la industria privada, el servicio
publico, el gobierno, o hacia alguna otra fuente de retribucin remunerada, la experiencia
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

6
acadmica ser ms completa si se adquiere una slida formacin en fundamentos de
anlisis estadstico.

1.4.2 GERENCIA DE CALIDAD TOTAL

A medida que la competencia mundial se Intensifica, surge, de parte de los negocios, un
esfuerzo por promover la calidad de sus productos. Este esfuerzo, conocido ampliamente
como Gerencia de Calidad Total (Total Quality Managemem, TQM), tiene como propsito
central la promocin de las cualidades del producto que el consumidor considera
importantes. Tales atributos van desde la ausencia de defectos hasta el servicio eficiente y
la respuesta rpida a las posibles quejas del consumidor. Hoy da. la mayora de los grandes
negocios (as como tambin muchos negocios pequeos) tienen departamentos de Control
de Calidad {Quality Control. QC) cuya funcin es recolectar datos sobre el desempeo y
solucionar problemas de calidad. As, la TQM representa un rea creciente de
oportunidades para quienes tienen conocimientos en estadstica.

La TQM involucra el uso de equipos administrativos integrados conformados por
ingenieros, expertos en marketing, especialistas en diseo, estadsticos, y otros
profesionales que pueden contribuir a la satisfaccin del cliente. La formacin de estos
equipos, denominada Despliegue de la Funcin de Calidad (Quality Function Deployment,
QFD), est diseada para reconocer y agenciar las inquietudes de los consumidores. Los
especialistas actan conjuntamente para promover la calidad del producto y para que supla
de manera efectiva las necesidades y preferencias del consumidor.

Otro mtodo comn para mejorar la calidad de un producto es el uso de los crculos de
Control de Calidad (Quality Control, QC). Los crculos de control de calidad constan de un
grupo pequeo de empleados (generalmente entre 5 y 12) que se renen regularmente para
solucionar problemas relacionados con el trabajo. Con frecuencia se conforman tanto con
trabajadores en lnea como con representantes de la gerencia, los miembros de estos
crculos QC son todos de la misma rea de trabajo y reciben capacitacin formal en control
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

7
estadstico de calidad y en planeacin de grupos. A travs de discusiones abiertas y del
anlisis estadstico, los crculos QC pueden lograr mejoras significativas en diversas reas
que van desde el mejoramiento de la calidad- el diseo del producto. la productividad y los
mtodos de produccin, hasta la reduccin de costos y seguridad. Se estima que ms del
90% de las 500 mejores compaas que aparecen en la revista Fortune utilizan de manera
efectiva los crculos de control de calidad.

Uno de los elementos ms importantes del TQM es un conjunto de herramientas y mtodos
estadsticos utilizados para promover el Control Estadstico de Calidad (Statistical Quality
Control, SQC). Tales herramientas ayudan a organizar y analizar datos para efectos de
solucionar problemas. Una de estas herramientas es el diagrama de Prelo, denominado as
en honor al economista italiano Vilfredo Pareto. Este diagrama identifica los problemas de
calidad que se presentan con mayor frecuencia o que han demostrado ser los ms costosos.
La figura 1.1 muestra un diagrama de Pareto de los defectos que afectan la produccin de
hornos microondas. comercializados por JC Penney.

Figura 1. Diagrama de Pareto
38
35
10
8
5
0
5
10
15
20
25
30
35
40
Dispositivo de
descogelacin
automtica
Dispositivo de
conservacin de
la temperatura
Arranque
automtico
Pulsadores Coccin por
fases
Defecto
P
o
r
c
e
n
t
a
j
e

d
e

D
e
f
e
c
t
o
s

Fuente: QC, JC Penney,

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

8
Los diagramas de Prelo con frecuencia expresan la regla 80/20: el 80% de lodos lo
problemas se debe al 20% de las causas. Como lo demuestra la figura 1.1.
aproximadamente el 75% de todos los problemas es causado por el dispositivo de
descongelacin automtico y por el de conservacin de la temperatura del horno.

Hablando en trminos generales, el SQC esta diseado para asegurar que los productos
cumplan con unas normas y especificaciones mnimas de produccin. Este objetivo con
frecuencia se promueve a travs del uso del muestreo de aceptacin, el cual es parte
integral del SQC. El muestreo de aceptacin implica probar una muestra aleatoria de
productos existentes para determinar si se debe aceptar o rechazar todo el envo, o el lote.
Esta decisin se basa en parte en un nivel de calidad aceptable (Acceptable Quality Level,
AQL), o nmero mximo de defectos que una empresa est dispuesta a tolerar.

En las organizaciones se es cada vez ms consciente de la necesidad de mantener la calidad
del producto. Si una firma va a competir de manera exitosa, debe tomar todas las
precauciones para garantizar que sus productos cumplan con ciertos estndares bsicos. Por
tanto, no es ninguna exageracin insistir en la importancia de la TQM. Los principios
inherentes al TQM estn aumentando en popularidad; representan la direccin futura del
anlisis estadstico, aplicada al mundo de los negocios.
1.4.3 NECESIDAD DE LA FORMACIN EN ESTADSTICA

Se podra pensar que el tipo de trabajo a que se aspira no necesitar del anlisis estadstico.
O quizs podra argumentarse que el personal de estadsticos de la compaa realizar el
trabajo estadstico pertinente y que no existe la necesidad de manejar los detalles del
anlisis estadstico.

Este no es el caso. Incluso si los estadsticos profesionales de la organizacin realizan el
trabajo estadstico pertinente, es esencial poseer un cierto nivel de formacin en este
campo. Para determinar cmo puede ayudar el staff de estadstica al desempeo del trabajo
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

9
de los otros, se debe conocer qu es la estadstica, qu hacen los estadsticos y cmo lo
hacen. Cuando los problemas surgen se debe determinar cmo puede ayudar la estadstica.
Para lograrlo, es necesario comprender los procedimientos estadsticos, y poder
comunicarse con los estadsticos, en un esfuerzo conjunto para disear soluciones
adecuadas y tomar decisiones ptimas. Una vez se ha adquirido esta familiaridad con el
anlisis estadstico, se sorprender de las infinitas formas en que la estadstica puede ayudar
en la solucin de problemas que surgen con frecuencia en un escenario empresarial.
1.5 ALGUNAS DEFINICIONES BSICAS

Toda rama de la investigacin cientfica tiene su vocabulario propio y la estadstica no es la
excepcin. Esta seccin revisa algunos de los trminos comunes utilizados en el anlisis
estadstico. Las definiciones y expresiones que siguen son esenciales para la comprensin
de cmo se realizan las pruebas estadsticas.

1.5.1 ESTADSTICA .-Se refiere a las tcnicas o mtodos de recoleccin, representacin,
procesamiento y anlisis de un conjunto de datos los cuales ha sido recolectados luego de
realizar algunos experimentos, o simplemente considerar algunos aspectos de la vida diaria.

1.5.2 RAMAS DE LA ESTADSTICA.-

1.5.2.1 ESTADSTICA DESCRIPTIVA.- Consiste en organizar, resumir y simplificar en
trminos generales informacin que a menudo resulta bastante compleja. Ej. Promedio de
calificaciones, rendimiento medio de un automvil, etc.

1.5.2.2 TEORA DE LA PROBABILIDAD.- Sirve para analizar situaciones en las que
intervienen el azar. Ej., lanzamiento de una dado, resultado de un partido de ftbol,
elecciones presidenciales, etc.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

10
1.5.2.3 INFERENCIA ESTADSTICA.- Se refiere al anlisis e interpretacin de una
muestra de datos para poder as dar conjeturas sobre un grupo mayor denominado
poblacin.

1.5.3 POBLACIONES Y PARMETROS.- En todo estudio estadstico, el investigador
est interesado en una determinada coleccin o conjunto de observaciones denominadas
poblacin, (o universo). Si los ingresos de los 121 millones de asalariados de los Estados
Unidos son de inters para un economista que asesore al Congreso en la formulacin del
plan nacional tributario, entonces los 121 millones de ingresos constituyen la poblacin. Si
se est considerando un plan tributario para los perceptores de ingresos superiores a US
$100.000. entonces tales ingresos superiores a US $100,000 constituyen la poblacin.

Si el director ejecutivo (ChiefExecutive Officer, CEO) de una gran empresa manufacturera
desea estudiar la produccin de todas las plantas de propiedad de la firma, entonces la
produccin de todas estas plantas es la poblacin.

Se puede decir tambin que poblacin es un conjunto de medidas, o el recuento de todos
los elementos o individuos que presentan una caracterstica comn. Pudiendo ser estos por
ejemplo un estudiante, un animal (entidad simple) o un curso, una familia (entidad
compleja).

La poblacin es la coleccin completa de todas las observaciones de inters.

Un parmetro es toda medida descriptiva de una poblacin. Algunos ejemplos son: el
ingreso promedio de todos los asalariados de Estados Unidos, o la produccin total de
todas las plantas manufactureras.

El punto clave para recordar es que un parmetro describe una poblacin.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

11
Parmetro es una medida descriptiva de la poblacin total de todas las observaciones de
inters para el investigador.

1.5.4 MUESTRAS Y ESTADSTICOS.- Aunque generalmente los estadsticos se
interesan en algn aspecto de toda la poblacin, generalmente descubren que las
poblaciones son demasiado grandes para ser estudiadas en su totalidad. Calcular el ingreso
promedio de cada uno de los 121 millones de asalariados seria una tarea abrumadora. Por
consiguiente. generalmente debe ser suficiente estudiar tan slo una pequea porcin de
dicha poblacin. A esta porcin ms pequea y ms manejable se le denomina muestra.
Una muestra es un subconjunto de la poblacin seleccionado cientficamente o ser
seleccionados al azar, es decir todos los elementos de la poblacin tienen la misma
posibilidad de ser seleccionados ya sea por sorteo, por las tablas de nmeros aleatorios, o
cualquier mtodo al azar.
Muestra es una parte representativa de la poblacin que se selecciona para ser
estudiada ya que la poblacin es demasiado grande como para analizarla en su
totalidad.

Cada mes el Ministerio de Trabajo de Estados Unidos (U.S. Department of Labor) calcula
el ingreso promedio de una muestra de varios miles de asalariados seleccionados entre la
poblacin total de 121 millones de trabajadores. El promedio de esta muestra se utiliza
luego como una estimacin del ingreso promedio para toda la poblacin. Las muestras son
necesarias porque estudiar las poblaciones completas resulta muy costoso y consume
demasiado tiempo.

Un estadstico es una medida descriptiva de una muestra. El ingreso promedio de esos
varios miles de trabajadores, calculado por el Ministerio de Trabajo, es un estadstico. El
estadstico es a la muestra lo que el parmetro es a la poblacin. El estadstico sirve como
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

12
una estimacin del parmetro. Aunque en realidad el inters se fija en el valor del
parmetro de la poblacin, con frecuencia debe haber conformidad con slo calcularlo con
un estadstico de la muestra que se ha seleccionado.
Estadstico Elemento que describe una muestra y sirve como una estimacin del
parmetro de la poblacin correspondiente.

1.5.5 CARACTERSTICAS DE UNA POBLACIN.- Corresponde a ciertos rasgos,
cualidades, propiedades que poseen los individuos de una muestra. Estos pueden ser:
Cuantitativos los cuales son mesurables (medibles) se describen numricamente estos
pueden ser continuos o discretos; o Cualitativos (o por Atributos) no medibles se
expresan mediante palabras, smbolos (nmeros).

1.5.6 VARIABLE.- Las variables son las caractersticas de la muestra o de la poblacin
que se esta observando.

1.5.6.1 VARIABLE ALEATORIA- Si una caracterstica es observada sobre una muestra
o poblacin y los individuos observados son elegidos al azar entonces este carcter se
denomina variable aleatoria.(v.a)

Una v.a puede ser cuantitativa ( da como referente cantidades) o cualitativa (da como
referentes atributos).

Tambin las variables aleatorias cuantitativas se pueden dividir en continuas y discretas.

Una variable continua es aquella que puede tomar cualquier valor dentro de un rango
dado. No importa que tan cerca puedan estar dos observaciones, si el instrumento de
medida es lo suficientemente preciso, puede hallarse una tercera observacin que se
encuentre entre las dos primeras. Una variable continua generalmente resulta de la
medicin.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

13
Los datos que se obtienen acerca de estas variables reciben el nombre de datos continuos.
Ejemplo altura, peso, velocidad, espesor, etc.

Las variable discretas pueden asumir solo ciertos valores, por lo general enteros. Nunca
sern fraccionarios. Los datos que se obtienen se denominan datos discretos. Estos surgen
al contar el nmero de conceptos y objetos que poseen ciertas caractersticas. Ejemplo
Cantidad de alumnos en un saln de clase, nmero de accidentes de trabajo , las casa de un
barrio, etc.

Las variables cualitativas (atributos) son de dos clases la nominales y de orden (jerarqua)

Las v.a nominales comprenden categoras Ejemplo sexo (femenino, masculino), color de
ojos (negro, caf, azul). No son numricos pero pueden asignarse valores para cada
categora. Los datos nominales se obtienen cuando se definen las categoras y se cuentan el
nmero de observaciones que queda en cada una.

Las v.a de orden son cuando los conceptos se jerarquizan segn la preferencia o logro.
Los datos de orden o jerarquizados constan de valores relativos asignados para denotar
orden. Ejemplo: primero, segundo; mayor, menor, aceptable no aceptable, ms caro, mas
feo, muy alto, muy bajo, etc.


automovil.
un de valor DAS. JERARQUIZA O ORDEN

ojos de piel, de color sexo, NOMINALES.
AS CUALITATIV
colegio un de
cursos hijos, de # DISCRETAS.
estatura peso, CONTINUAS.
VAS CUANTITATI
STICAS) (CARACTERI VARIABLES

POBLACION
(1)

En una misma poblacin se pueden obtener varios tipos de datos esto depende del objetivo
del estudio que se realice. Daremos entonces una tabla en la cual se pueden ver los
diferentes tipos de datos desde una misma poblacin
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

14



TIPO DE DATOS
CONTINUOS DISCRETOS NOMINALES JERARQUIZADOS
Clase de tercer grado Edad, peso N en el grupo Nios / Nias 3 grado
Automviles Kph. Kpg N de defectos/auto colores Ms sucio
Ventas de bienes
races
Valores en USD. N de ofertas sobrevaluado Ms caro
1.6 LA IMPORTANCIA DEL MUESTREO
Gran parte del trabajo de un estadstico se realiza con muestras. Las muestras son
necesarias debido a que con frecuencia las poblaciones son demasiado grandes para ser
estudiadas en su totalidad. Es muy costoso y demanda mucho tiempo examinar la poblacin
total por tanto, debe seleccionarse una muestra de la poblacin, calcular el estadstico de la
muestra, y utilizarlo para estimar el parmetro correspondiente de la poblacin.

Este anlisis sobre las muestras implica una distincin entre las dos principales ramas del
anlisis estadstico: (1) la estadstica descriptiva y (2) la estadstica inferencial, como ya se
dijo la estadstica descriptiva es el proceso de recolectar, agrupar y presentar datos de una
manera tal que describa fcil y rpidamente dichos datos mientras que la estadstica
inferencial involucra la utilizacin de una muestra para sacar alguna inferencia o
conclusin sobre la poblacin de la cual hace parte la muestra.
Cuando el Ministerio de Trabajo utiliza el ingreso promedio de una muestra de varios miles
de trabajadores para calcular el ingreso promedio de los 121 millones de trabajadores, est
utilizando una forma simple de estadstica inferencial.

La exactitud de toda estimacin es de enorme importancia. Esta exactitud depende en gran
parte de la forma como se tom la muestra, y del cuidado que se tenga para garantizar que
la muestra proporcione una imagen confiable de la poblacin. Sin embargo, con mucha
frecuencia se comprueba que la muestra no es del todo representativa de la poblacin y
resultar un error de muestreo. El error de muestreo es la diferencia entre el estadstico de
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

15
la muestra utilizada para calcular el parmetro de la poblacin y el valor real pero
desconocido del parmetro.

Error de muestreo Es la diferencia entre el parmetro desconocido de la poblacin y
el estadstico de la muestra utilizado para calcular el parmetro.

Existen dos causas posibles del error de muestreo. La primera fuente del error de muestreo
es el azar en el proceso de muestreo. Debido al factor azar en la seleccin de elementos de
la muestra, es posible seleccionar sin darse cuenta, elementos atpicos que no representan
la poblacin. Por ejemplo, en el esfuerzo por estimar la media poblacional es factible que
se seleccionen elementos en la muestra que sean anormalmente grandes, produciendo as
una sobreestimacin de la media poblacional. Por otro lado, el azar puede producir un gran
nmero de elementos de muestra que sean inusualmente pequeos, produciendo una
subestimacin del parmetro. En cualquiera de los dos casos, ha ocurrido un error de
muestreo.

Una forma ms, seria de error de muestreo es el sesgo muestral. El sesgo muestral ocurre
cuando hay alguna tendencia a seleccionar determinados elementos de muestra en lugar de
otros. Si el proceso de muestreo se disea de manera incorrecta y tiende a promover la
seleccin de demasiadas unidades con una caracterstica en especial, a expensas de las
unidades que no tienen dicha caracterstica, se dice que la muestra est sesgada. Por
ejemplo, el proceso de muestreo puede favorecer de manera inherente la seleccin de
hombres excluyendo a las mujeres, o de personas casadas excluyendo a las solteras.
Sesgo muestral Es la tendencia a favorecer la seleccin de ciertos elementos de
muestra en lugar de otros.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

16
ACTIVIDADES RECOMENDADAS

1.- Describa en sus propias palabras cmo puede utilizarse la estadstica para solucionar
problemas en varias disciplinas y ocupaciones.
2.- De qu forma utilizar los servicios del estadstico profesional en su organizacin una
vez que usted encuentre empleo? Por qu es poco probable escaparse de la necesidad de
tener un conocimiento bsico en estadstica?
3.- Describa en sus propios trminos la diferencia entre una poblacin y una muestra; entre
un parmetro y un estadstico.
4.- Cul es la diferencia entre una variable cuantitativa y una variable cualitativa? D
ejemplos.
5.- Diferencie entre una variable continua y una variable discreta. D ejemplos de cada una.
6.- Un informe reciente en la revista Fortune revel que los japoneses pronto controlarn
hasta un 35% de las ventas de autos en los Estados Unidos; comparado con el 28% de
finales de los aos 80 est apenas un 8% por encima de lo ocurrido en 1970. Esta
informacin contiene estadstica descriptiva, inferencial, o ambas? Explique.
7.- Cul es la diferencia entre la estadstica descriptiva y la estadstica inferencial? Cul
cree usted que constituye una forma ms elevada de anlisis estadstico y por qu?

AUTOEVALUACION

1.- En qu usos o funciones se puede aplicar la estadstica? Cmo cree usted que pueda
utilizarse para solucionar problemas comerciales y administrativos en el mundo real? D
ejemplos de problemas especficos que puedan surgir y explique cmo podra utilizarse la
estadstica para desarrollar soluciones y respuestas.
2.- Si los estadsticos estn interesados realmente en poblaciones, por qu generalmente
trabajan con muestras?
3.- Indique lo siguiente en trminos de datos:
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

17
a) 17 gramos b) 3 correctas, 7 incorrectas c) ms lento
d) 25 segundos e) 3 casas f) kilmetros por hora
g) tallas de camisas h) el mas encantador i) helados de vainilla
4.- Analice si las siguientes variables son discretas o continuas:
a. Nmero de carreras que oferta su facultad.
b. Nmero de pases atrapados por el beisbolista Tim Brown, receptor de los LA Raiders.
c. Peso de los integrantes del equipo de ftbol nacional
d. Peso del contenido de las cajas de cereal que se producen en una determinada empresa
e. Nmero de libros que usted ley el ao pasado.
5.- Seleccione una poblacin cualquiera que sea de su inters. Identifique variables
cuantitativas (discretas continuas) y cualitativas (nominales de orden) de esa poblacin
que puedan seleccionarse para ser estudiadas.
6.- Defina el error de muestreo y explique qu lo causa.












Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

18
UNIDAD II

DESCRIPCIN DE LOS CONJUNTOS DE DATOS


2.1 INTRODUCCIN

Casi todos los trabajos que se hacen en estadstica comienzan con el proceso de recoleccin
de datos necesarios para formar con ellos un conjunto que se utilizara en el estudio. Para
propsitos generales, se adoptar la suposicin conveniente de que esta labor, con
frecuencia tediosa, ya ha sido realizada y que los datos estn disponibles.

Esta recoleccin de datos originales revela muy poco por si sola. Es extremadamente difcil
determinar el verdadero significado de un grupo de nmeros que simplemente se han
registrado en un papel. Nuestra labor es organizar y describir tales datos de manera concisa
y significativa. Para determinar su significancia, los datos se organizan de manera que, con
un simple vistazo, se pueda tener una idea de lo que pueden decirnos.

Entre las herramientas estadsticas que resultan de particular utilidad para organizar los
datos se incluyen;
Tablas de frecuencia que colocan todos los datos en clases especficas.
Diversos grficos que pueden proporcionar una representacin visual de los datos.
Tablas de contingencia y diagramas de "tallo y hoja", los cuales tambin permiten la
presentacin de un conjunto grande de datos de manera concisa y discernible.

2.2 MTODOS DE AGRUPACIN DE DATOS

Los mtodos principales para organizar datos estadsticos comprenden el ordenamiento de
elementos en subconjuntos que presenten cualidades semejantes (por ejemplo, misma edad,
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

19
misma finalidad, misma escuela, misma ciudad, etc.) Los datos agrupados se pueden
resumir grficamente, o en tablas, y mediante el uso de medidas numricas, como la media,
la amplitud o rango , la desviacin estndar, y otras ms. El nombre que reciben los datos
ordenados en grupos o categoras es el de distribucin de frecuencia.

2 2. .3 3 DISTRIBUCIN DE FRECUENCIAS

Como estadstico residente de Pigs and People (P&P) Airlines, el director de la divisin de
anlisis estadstico le pide recolectar y agrupar los datos sobre el nmero de pasajeros que
han decidido viajar con P&P. Tales datos correspondientes a los ltimos 50 das aparecen
en la tabla 2.1. Sin embargo, con estos datos en bruto, es improbable que el director pueda
obtener informacin til y significativa respecto a las operaciones de vuelo. Los datos no
estn organizados y es difcil llegar a una conclusin significativa simplemente revisando
una serie de nmeros anotados en un papel. Es preciso agrupar y presentar los datos de
manera concisa y reveladora para facilitar el acceso a la informacin que contienen.
Primero se analizar cmo puede utilizarse una distribucin de frecuencia para organizar el
conjunto de datos.

Tabla 2.1 Datos brutos sobre el numero de pasajeros de P&P Airlines
68 71 77 83 79 72 74 57 67 69
50 60 70 66 76 70 84 59 75 94
65 72 85 79 71 83 84 74 82 97
77 73 78 93 95 80 81 79 90 83
80 84 91 101 86 93 92 102 80 69


Una distribucin de frecuencia es un mtodo de clasificacin de datos en clases o
intervalos, de manera tal que se pueda establecer con facilidad el nmeros o porcentaje (es
decir la frecuencia) de cada clase. Esto proporciona una forma de observar un conjunto de
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

20
nmeros sin que se tenga que considerar cada nmero, y pueda ser extremadamente til al
manejar grandes cantidades de datos. El nmero o porcentaje en una clase se denomina
frecuencia de clase.

Una distribucin de frecuencia es un agrupamiento de datos en clases, que muestra el
nmero o porcentaje de observaciones de cada una de ellas. Una distribucin de
frecuencia se puede presentar en forma tabular y grfica. Tambin se las conoce como
Serie estadstica de frecuencias o de intervalos

El procedimiento para elaborar realmente una distribucin de frecuencias para un conjunto
de datos dado, depende del tipo de datos particulares (esto es, continuos, discretos,
nominales, de orden o jerarquizados). Consideraremos primeramente el caso de que los
datos de estudio sean de tipo continuo.

2.4 ORDENACIN DE DATOS EN TABLAS DE FRECUENCIA
2.4.1 ELABORACIN DE UNA DISTRIBUCIN DE FRECUENCIAS PARA
DATOS CUANTITATIVOS (CONTINUOS DISCRETOS)

Una vez que se han recolectado los datos de una determinada variable, el paso siguiente
para la ordenacin de los mismos es la elaboracin de una distribucin de frecuencia
conocida tambin como S SE ER RI IE E E ES ST TA AD D S ST TI IC CA A D DE E I IN NT TE ER RV VA AL LO OS S o o S SE ER RI IE E
E ES ST TA AD D S ST TI IC CA A D DE E F FR RE EC CU UE EN NC CI IA AS S, , d de ep pe en nd di ie en nd do o d de el l t ti ip po o d de e d da at to os s q qu ue e s se e h ha an n o ob bt te en ni id do o. .

Los pasos principales en la elaboracin de una distribucin de frecuencias para datos
mustrales cuantitativos se enumeran a continuacin:

1.- Obtener el rango de los datos (amplitud de variacin a)

a = X mayor X menor
Siendo:
a = Amplitud
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

21
X mayor = valor mayor
X menor = valor menor

La amplitud de variacin, recorrido o rango se define entonces como la diferencia que
se establece entre el valor mayor y el valor menor de la variable.

2.- Hallar el nmero de clases o intervalos , k ( se sugiere usar la regla de que le nmero de
clases se puede tomar como la raz cuadrada del nmero de observaciones de estudio (n) es
decir,
n k ~
. NOTA: Es conveniente utilizar un nmero de intervalos no menor a 5 ni
mayor a 15. Si el nmero de intervalos es menor a 5 , las frecuencias estaran muy
concentradas, con lo cual no se permite un anlisis mas real de los datos. As mismos, si es
mayor a 15 las frecuencias estaran muy dispersas, dificultando la elaboracin de la tabla,
su representacin grfica y sus clculos matemticos.

3.- Calcular la amplitud de clase (dimetro del intervalo, o tamao del intervalo, ancho de
intervalo); se obtiene dividiendo el rango para el nmero de clases (a/k) redondeado a un
nmero conveniente. Una alternativa para conseguir el numero de clases o intervalos es
dividiendo el rango o amplitud para el ancho del intervalo y sumando 1 (a/k+1). Y por
ultimo tambin se puede tomar este valor de acuerdo al criterio personal.

4.- Determinar los lmites de clase preliminares. Revisarlos de manera que los datos se
toquen pero que no se superpongan.

5.- Enumerar los intervalos y efectuar un conteo por marcas de datos segn sus clase. (se
debe comprobar que el total de marcas sea igual a n)

6.- Elaborar una tabla o un grafico de frecuencias (histograma)

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

22
Nota.- En algunas tablas de distribucin de frecuencias se suele hallar la marca de clase que
es el promedio de los valores de los limites inferir y superior de cada clase.
EJEMPLO: ELABORACIN DE UNA DISTRIBUCIN DE FRECUENCIAS CON
LOS DATOS DE LA TABLA 2.1

1.- RANGO O AMPLITUD DE VARIACIN DE LA VARIABLE

Desde los datos de la tabla 2.1 se puede apreciar que el numero ms alto es 102 y el mas
bajo 50. La diferencia entre estos dos valores es 52 (a = 102 - 50 = 52). Este valor
representa la amplitud de variacin o rango de la variable.

2.- NMEROS DE CLASE O INTERVALOS DE CLASE ( DEPENDE DEL TIPO
DE DATOS)

Como
7 07 7 50 k 50 n ~ = = = ,
entonces el total de los datos se ordenaran en 7
clases.

3.-AMPLITUD DE CLASES
Se divide la amplitud de variacin para el numero de clases as:
a.c =
7 42 7 7 52 ~ = , /
o a.c =
8 1 42 7 1
7
52
~ + = + ,

4.- LIMITES DE CLASE

primera clase: limite inferior: 50 limite superior: 50 + 7 = 57 (lim inf+a.c)(50 a <57)
segunda clase: limite inferior: 57 limite superior 57 + 7 = 64 (57 a < 64)
tercera clase: limite inferior: 64 limite superior 64 + 7 = 71 (64 a < 71)
cuarta clase : limite inferior: 71 limite superior 71 + 7 = 78 (71 a < 78 )
quinta clase: limite inferior: 78 limite superior 78 + 7 = 85 (78 a < 85)
sexta clase: limite inferior: 85 limite superior 85 + 7 = 92 (85 a < 92)
sptima clase: limite inferior: 92 limite superior 92 + 7 = 99 (92 a < 99)
octava clase: limite inferior: 99 limite superior 99 + 7 = 106 (99 a < 106)
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

23

Una vez que se han establecido las clases, a cada dato se colocar en la clase adecuada
mediante un conteo por marcas de la siguiente manera

Tabla 2.2.- DISTRIBUCIN DE FRECUENCIA EN FORMA TABULAR DE LA
VARIABLE: Nmero de pasajeros que viajan en P&P durante 50 das

NDICE CLASES MARCAS
CONTEO
( FRECUENCIA)
1 50 a <57 [50 57) I 1
2 57 a < 64 III 3
3 64 a < 71 IIIII III 8
4 71 a < 78 IIIII IIIII I 11
5 78 a < 85 IIIII IIIII IIIII 15
6 85 a < 92 IIII 4
7 92 a < 99 IIIII I 6
8 99 a < 106 I1 2
total 50

Para completar la tabla anterior se debe sacar la frecuencia acumulada , frecuencia relativa
y la frecuencia porcentual (Porcentaje).

Tabla 2.3.- DISTRIBUCIN DE FRECUENCIAS (ABSOLUTAS, ACUMULADAS,
RELATIVAS) DE LA VARIABLE: Nmero de pasajeros que viajan en P&P durante
50 das

CLASES
(pasajeros)
f
(Das)

fr
(f/n)
f %
(f*100)

Fa


Fra

Fa%
50 a <57 1 0,02 2 % 1 0,02 2%
57 a < 64 3 0,06 6% 1+3 = 4 0,02 + 0,06 = 0,08 8%
64 a < 71 8 0,16 16% 4+8 = 12 0,08 + 0,16 = 0,24 24%
71 a < 78 11 0,22 22% 12+11 = 23 0,24 + 0,22 = 0,46 46%
78 a < 85 15 0,30 30% 23+15 = 38 0,46 + 0,30 = 0,76 76%
85 a < 92 4 0,08 8% 38+4 = 42 0,76 + 0,08 = 0,84 84%
92 a < 99 6 0,12 12% 42+6 = 48 0,84 + 0,12 = 0,96 86%
99 a < 106 2 0,04 4% 48+2 = 50 0,96 + 0,04 = 1 100%


N =
50
1 100%
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

24
Donde:
Frecuencia absoluta: f (conteo de datos)
Frecuencia Relativa: fr (Frecuencia / # total de casos) Es decir:
n
f
fr =


Frecuencia Porcentual: f% Es el porcentaje de la frecuencia absoluta.
Es decir
100
n
f
100 fr f * * % = =

De igual manera se pueden obtener las diferentes frecuencias acumuladas.

Frecuencia acumulada: Fa (F) ( conteo y suma de datos)
Frecuencia Acumulada Relativa : Far (Frecuencia acumulada / # total de casos)
Es decir:
n
Fa
Far =


Frecuencia Acumulada Porcentual: Fa% Es el porcentaje de la frecuencia acumulada
Es decir
100
n
Fa
100 Far Fa * * % = =

Luego de construir la tabla es importante la interpretacin que se la de . Por ejemplo para la
frecuencia absoluta se puede decir que: Un da han viajado entre 50 y 56 pasajeros que
corresponde al 2 por ciento, tambin que 15 de los 50 das han viajado entre 78 y 84 (78 a <
85) que corresponde al 30 % del tiempo en observacin . Mientras que para la frecuencia
acumulada: Hubo 23 das en los cuales menos de 78 pasajeros volaron en la mencionada
compaa. Con un equivalente del 46% del tiempo estimado para la investigacin.

EJEMPLO.- FORMA ALTERNATIVA PARA CONSTRUIR LA DISTRIBUCIN
DE FRECUENCIA

Se realizo una encuesta a ciertos estudiantes y al ser preguntados por su estatura, dieron los
siguientes datos en cm.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

25
Tabla 2.4 .- Estatura de los estudiantes de primer semestre de la escuela de Ingenieria
de la ESPOCH.

149 147 165 160 161 164 168 169 170 159 158
164 162 170 160 157 149 162 165 171 168 167
151 152 154 149 153 153 154 162 169 168 167
164 168 167 168 161 150 163 167 167 165 166
169

1.- AMPLITUD DE VARIACIN: a = 171 147 = 24

2.- NMERO DE INTERVALOS: a diferencia del ejemplo anterior aqu no se calcula la
amplitud de la clase si no que se asigna una cantidad usando el criterio del estadstico en
este caso he ha tomado como a.c = 3 y luego se saca el numero de clases o intervalos
dividiendo la amplitud de variacin o rango para el ancho del intervalo que se eligi
arbitrariamente. As:
9 1 8 1
3
24
k = + = + =


3.- LIMITES DE CLASE

primera clase: limite inferior: 145 limite superior: 145 + 3 = 148 o 145 a < 148 ( 147)
segunda clase: limite inferior: 148 limite superior 151 (o 150)
tercera clase: limite inferior: 151 limite superior 154 (o 153)
cuarta clase : limite inferior: 154 limite superior 157 (o 156)
quinta clase: limite inferior: 157 limite superior 160 (o 159)
sexta clase: limite inferior: 160 limite superior 163 (o 162)
sptima clase: limite inferior: 163 limite superior 166 (o 165)
octava clase: limite inferior: 166 limite superior 169 (o 168)
novena clase: limite inferior: 169 limite superior 172 (o 171)


Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

26
4.- MARCA DE CLASE
La marca de clase se calcula para cada una de las clases o intervalos as sacando la suma de
los lmites de clases y dividiendo para dos .

2
sup lim inf
Xm Mc
+
= =
lim


Para completar la tabla anterior se debe sacar la frecuencia acumulada , frecuencia relativa,
la frecuencia porcentual (Porcentaje)y la marca de clase .

Tabla 2.5.- DISTRIBUCIN DE FRECUENCIAS (ABSOLUTAS, ACUMULADAS,
RELATIVAS) DE LA VARIABLE: Estatura de los estudiantes de primer semestre de
la escuela de Ingenieria de la ESPOCH.


CLASES
X
Mc
Xm
f
(Das)
fr
(f/n)
f %
(f*100)
Fa Fra Fa%
145 147 146 1 0.02 2 1 0.022 2.22
148 150 149 4 0.09
9
5 0,114
11.11
151 -153 152 4 0.09 9 9 0,20 20.00
154 -156 155 2 0.04 4 11 0,244 24.44
157 -159 158 3 0.07
7
14 0,31
31.11
160 - 162 161 7 0.16 16 21 0,4667 46.67
163 - 165 164 7 0.16 16 28 0,6222 62.22
166 - 168 167 11 0.24 24 39 0,8667 86.67
169 - 171 170 6 0.13 13 45
1 100.00
45 1 100
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

27
2.4.2 ELABORACIN DE UNA DISTRIBUCIN DE FRECUENCIAS PARA
DATOS CUALITATIVOS (NOMINALES Y DE ORDEN O
JERARQUIZADOS)

Quiz las distribuciones de frecuencias ms fciles sean las que se utilizan para datos
nominales y jerarquizados. Esta simplicidad radica en el hecho en que las clases se ponen
de manifiesto con ms facilidad, de modo que los clculos son mnimos. Por ejemplo,
considerar los datos nominales de la tabla 2.3, que representan las ventas de gaseosas,
ordenados en una tabla de frecuencia.

Las categoras son los diversos sabores de las gaseosas. Obsrvese la ltima categora.
Varios. Puede haber algunos sabores que se vendan poco, como: fresa, tamarindo y toronja,
los cuales se agruparn en una sola categora para simplificar la comprensin de los datos.


Tabla 2.6 DATOS DE LA VENTA DE GASEOSAS EN UN DA

SABOR VENTAS
Cola (negra) 600
Limn 200
Naranja 100
Uva 50
Fresa 40
Otros 10
Total 1000

Con la informacin de la tabla 2.6 se puede determinar la frecuencia absoluta como las
ventas reales que se tuvo durante ese da, para luego proceder a determinar las frecuencias
acumulada, relativa y porcentual de la misma manera que para los datos cuantitativos
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

28
Tabla 2.7.- DISTRIBUCIN DE FRECUENCIAS (ABSOLUTAS, RELATIVAS Y
PORCENTUALES) DE LA VARIABLE : Venta de gaseosas en un da

CLASES
Categoras
X
F
(ventas
reales)
fr
(f/n)
f %
(f*100)
Cola negra 600 0.6 60 %
Limn 200 0.2 20%
Naranja 100 0.1 10%
Uva 50 0..5 5%
Fresa 40 0.04 4%
Otros 10 0.01 1%
Total 1000 1 100%

La presentacin de datos jerarquizados es bastante semejante. Considrense los datos del
promedio de calificaciones que se presentan a continuacin en un formato un tanto
diferente al de las tablas de frecuencias anteriores, slo para demostrar otra forma de
elaborarlas

Tabla 2.8- DISTRIBUCIN DE FRECUENCIAS ABSOLUTAS Y
PORCENTUALES DE LA VARIABLE: Calificaciones de un curso en la asignatura
de Matemtica.

CALIFICACIONES DEL CURSO
MALA REGULAR BUENA MUY BUENA EXCELENTE TOTALES
NUMERO 2 4 20 10 4 40
PORCENTAJE 5% 10% 50% 25% 10% 100%

2.5 GRFICOS ESTADSTICOS
2.5.1.- GRFICOS PARA DATOS CUANTITATIVOS CONTINUOS.
A menudo se dice que una imagen vale ms que mil palabras. De hecho, los estadsticos
han empleado las tcnicas grficas para describir de manera mas vivida series de datos. En
particular, los histogramas y los polgonos se usan para describir datos numricos que han
sido agrupados en distribuciones de frecuencia, de frecuencia relativa o de porcentaje.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

29
2.5.1.1.- HISTOGRAMAS DE FRECUENCIAS.-
Los histogramas son diagramas de barras verticales en los que se construyen barras
rectangulares en los lmites de cada clase. Al graficar histogramas, la variable aleatoria o
fenmeno de inters se despliega a lo largo del eje horizontal; el eje vertical representa el
nmero, proporcin o porcentaje de observaciones por intervalo de clase, dependiendo de
,si el histograma particular es, respectivamente, un histograma de frecuencia, un histograma
de frecuencia relativa o un histograma de porcentaje.

Un histograma de frecuencia se describe a continuacin con los datos de la tabla 2.5 que
reflejan las estaturas de los estudiantes de primer semestre de la escuela de Ingeniera de la
ESPOCH. En el eje horizontal estn las marcas de clase y en el vertical las frecuencias
absolutas.

Figura 2.1 . Histograma de Frecuencia Absoluta
ESTATURA
171 168 165 162 159 156 153 150 147
F
R
E
C
U
E
N
C
I
A

A
B
S
O
L
U
T
A
12
10
8
6
4
2
0
6
11
7 7
3
2
4 4
1

Fuente: Datos tomados de la tabla 2.5

Se puede tambin graficar histogramas de frecuencias tanto para la frecuencia relativa
como para la frecuencia porcentual.


Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

30
2.5.1.2.- POLGONOS DE FRECUENCIAS ABSOLUTAS

Al igual que con los histogramas, al graficar polgonos el fenmeno de inters se despliega
a lo largo del eje horizontal y el eje vertical representa el nmero, proporcin o porcentaje
de observaciones por intervalo de clase.

El polgono de porcentaje se forma permitiendo que el punto medio o marca de clase
represente los datos de esa clase en el eje horizontal y luego conectando la sucesin de
puntos medios con sus respectivos valores ya sea de las frecuencias o de los porcentajes de
clase en el eje vertical.

Debido a que los puntos medios consecutivos son conectados por una serie de lneas rectas,
el polgono algunas veces est dentado en apariencia. Sin embargo, al tratar con una serie
de datos muy grande, si tuviramos que crear los lmites de las clases en su distribucin de
frecuencia ms juntos (incrementando as el numero clases en esa distribucin), las lneas
dentadas del polgono se "suavizaran".

Figura 2.2. Polgono de Frecuencia Absoluta.

0
2
4
6
8
10
12
146 149 152 155 158 161 164 167 170
ESTATURAS ( MEDIAS)
F
R
E
C
U
E
N
C
I
A
S

A
B
S
O
L
U
T
A
S

Fuente: Datos tomados de la tabla 2.5


Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

31
2.5.1.3.- POLGONOS DE FRECUENCIAS ACUMULADAS

La variacin de este polgono con relacin al de las frecuencias absolutas es que en el eje
vertical se ubican las frecuencias acumuladas ya sean absolutas, relativas o porcentual
generando un grafico estadstico conocido con el nombre de OJIVA o POLGONO DE
FRECUENCIA ACUMULADA .

Figura 2.3 . Polgono de frecuencia acumulada.( datos tabla 2.5)
0
5
10
15
20
25
30
35
40
45
50
146 149 152 155 158 161 164 167 170
ESTATURA
F
R
E
C
U
E
N
C
I
A

A
C
U
M
U
L
A
D
A

Fuente: Datos tomados de la tabla 2.5
Al igual que los histogramas los polgonos se pueden construir con las frecuencias
absolutas y acumuladas tanto relativas como porcentuales.

2.5.2.- GRFICOS PARA DATOS CUANTITATIVOS DISCRETOS Y
CUALITATIVOS NOMINALES Y DE ORDEN.

2.5.2.1 DIAGRAMAS DE BARRAS.-
Un diagrama de barras es parecido a un histograma, este puede mostrar cantidades o
porcentajes para una , dos o mas valores sobre el eje vertical. En los diagramas de barras,
cada clase o categora se describe mediante una barra cuya longitud representa la
frecuencia o porcentaje de observaciones que caen en una categora.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

32
Para construir un diagrama de barras se hacen las siguientes sugerencias:
a) Todas las barras deben tener el mismo ancho, solo el largo diferir dependiendo de
la frecuencia que presente cada categora o clase
b) Las barras pueden ser horizontales o verticales.
c) Los espacios entre las barras deben variar entre la mitad del ancho de una barra
hasta el ancho de una barra
d) Las escalas y guas son auxiliares tiles en la lectura de una grfica y deben
incluirse. El punto cero debe indicarse
e) Los ejes de la grafica deben etiquetarse claramente

EJEMPLO.- Mediante una encuesta se logro recabar los siguientes datos sobre el tipo de
colegio en el que obtuvieron su ttulo de bachiller 272 estudiantes de la Universidad, y con
ellos se elaboro una distribucin de frecuencia tabular la cual se detalla a continuacin.

Tabla 2.9.- TABLA DE DISTRIBUCIN DE FRECUENCIA PARA LA VARIABLE
Tipo de colegio en el que obtuvieron su ttulo de bachiller 272 estudiantes de la
Universidad.

TIPO DE COLEGIO
f fr fr%
Particular 44 0,162 16,2
Fiscal 206 0,757 75,7
Fiscomisional 22 0,081 8,1
Total 272 100,0 100,0

Figura 2.4. Diagrama de barras de los datos de la tabla 2.9
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

33
TIPO DE COLEGIO
fiscomisional fiscal particular
F
R
E
C
U
E
N
C
I
A

A
B
S
O
L
U
T
A
300
200
100
0
22
206
44

Fuente: Datos tomados de la tabla 2.9

2.5.2.2 DIAGRAMA DE BARRAS COMPUESTAS

Mediante este diagrama se puede representar dos series de datos y as efectuar
comparaciones.

EJEMPLO.- Representar en un diagrama de barras compuestas los resultados definitivos
de la segunda vuelta electoral realizada el 6 de mayo de 1984. Correspondiente a la Costa,
para el Ing. Len Fbres Cordero y para el Dr. Rodrigo Borja.

Tabla 2.10.- RESULTADOS DEFINITIVOS DE LA SEGUNDA VUELTA ELECTORAL
REALIZADA EL 6 DE MAYO DE 1984. CORRESPONDIENTE A LA COSTA, PARA EL ING.
LEN FEBRES CORDERO Y PARA EL DR. RODRIGO BORJA.

provincias Ing. Len Fbres Cordero Dr. Rodrigo Borja
Guayas
Manab
Los Ros
El Oro
Esmeraldas
493581
129622
68309
48771
28180
232410
104730
56321
70963
39262


Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

34
Para obtener el diagrama de barras compuestas utilizamos el siguiente procedimiento:
Primero sumamos las votaciones de los dos candidatos para cada una de las provincias.

Tabla 2.11 DISTRIBUCIN DE FRECUENCIA PARA RESULTADOS
DEFINITIVOS DE LA SEGUNDA VUELTA ELECTORAL REALIZADA EL 6 DE
MAYO DE 1984. CORRESPONDIENTE A LA COSTA, PARA EL ING. LEN
FEBRES CORDERO Y PARA EL DR. RODRIGO BORJA.

Provincias Ing. Len Febres
Cordero
Dr. Rodrigo Borja TOTAL
Guayas
Manab
Los Ros
El Oro
Esmeraldas
493581
129622
68309
48771
28180
232410
104730
56321
70963
39262
725991
234352
124630
119734
67442

Luego utilizamos el primer cuadrante del sistema de coordenadas, para representar las
provincias en el eje horizontal y las frecuencias en el eje vertical. Representamos en cada
una de las barras el total de la votacin de los dos candidatos para cada provincia.
Ubicamos en cada una de las barras la frecuencia de cada candidato identificndolo con la
leyenda correspondiente. Entonces el grafico queda as:

Figura 2.5 . Diagrama de Barras compuestas para los datos de la tabla 2.11.
0
200000
400000
600000
800000
Guayas Manab Los Rios El Oro Esmeraldas
Ing. Len Febres Cordero Dr. Rodrigo Borja

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

35
Fuente: Tribunal Supremo Electoral Boletn oficial de los escrutinios de las votaciones del
6 Mayo de 1984.

2.5.2.3 DIAGRAMA PASTEL O DE SECTORES
Para construir una grfica de pastel o diagrama pastel cuando no se dispone de software
apropiado se usa comps y transportador ( graduador) el primero para dibujar el crculo y el
segundo para la medir los sectores del pastel apropiados. Puesto que el circulo tiene 360 el
transportador puede usarse para dividir el pastel basndose en rebanadas de porcentaje
deseadas. Los grados que le corresponde a cada clase o rebanada se los obtiene
realizando una regla de tres simple y se la ubica en la tabla de distribucin de frecuencia
que se elaborara para el efecto de la misma manera que para los diagramas de barras.

Tabla 2.12 TABLA DE DISTRIBUCIN DE FRECUENCIA PARA LA VARIABLE:
Tipo de colegio en el que obtuvieron su ttulo de bachiller 272 estudiantes de la
Politcnica.

TIPO DE COLEGIO
F fr %
Particular 44 0,162 16 59
Fiscal 206 0,757 76 272
Fiscomisional 22 0,081 8 29
Total 272 100,0 100,0 360

Figura 2.6. Diagrama Pastel de los datos de la tabla 2.10







Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

36
TIPO DE COLEGIO
22 / 8%
206 / 76%
44 / 16%
fiscomisional
fiscal
particular

Fuente: Datos tomados de la tabla 2.12.

2.5.2.4 DIAGRAMA DE PARETO
El diagrama de Pareto es un tipo especial de grfica de barras verticales en la que las
respuestas categorizadas se grafican en el orden de rango descendiente de sus frecuencias y
se combinan con un polgono acumulativo en la misma escala. El principio bsico detrs de
este dispositivo grfico es su capacidad de distinguir los pocos vitales de los muchos
triviales, permitindonos enfocar las respuestas importantes. As pues, el diagrama logra
su mayor utilidad cuando la variable categrica de inters contiene muchas categoras. El
diagrama de Pareto se usa ampliamente en el control estadstico de procesos y calidad de
productos

Al construir el diagrama de Pareto, el eje vertical contiene los porcentajes (de 100 en el
extremo superior a 0 en el extremo inferior) y el eje horizontal contiene las categoras de
inters. Las barras igualmente espaciadas tambin deben ser de igual ancho y, para un
impacto visual, sugerimos que las barras sean del mismo color. El punto del polgono de
porcentaje acumulativo para cada categora se centra en el punto medio de cada barra
respectiva. Por tanto, al estudiar un Diagrama Pareto, debemos concentrarnos en dos cosas,
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

37
las magnitudes de las diferencias en las longitudes de las barras correspondientes a las
categoras descendientes adyacentes y los porcentajes acumulativos de estas categoras.

Figura 2.7. Diagrama Pareto de los datos de la tabla 2.10
TIPO DE COLEGIO
fiscomisional particular fiscal
F
R
E
C
U
E
N
C
I
A
S
300
200
100
0
P
O
R
C
E
N
T
A
J
E
S
100
75
50
25
0
22
44
206

Fuente: Datos tomados de la tabla 2.12

2.5.2.5 CARTOGRAMA
Consiste en un mapa sobre el cual se destacan diferentes motivo, sea rayando coloreando o
utilizando diversas figuras o signos convencionales que estn en relacin con el hecho o
fenmeno que se quiere resaltar. Por ejemplo El cartograma de Amrica de Sur en el cual
se hallan localizados los diferentes pases que lo forman.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

38

2.5.2.6 PICTOGRAMA

Es un recurso que se utiliza para efectuar la representacin de los fenmenos investigados
mediante signos o figuras que atraigan la atencin; por lo cual es el grfico que se utiliza
con gran ventaja en situaciones publicitarias, antes que en representaciones estadsticas, en
las que tambin existe inconveniente de no poder representar la fraccin.

EJEMPLO.- Vamos a representar la poblacin de seis provincias del Ecuador segn datos
estimados por el INEC.

Tabla 13.- Datos del nmero de habitantes de seis provincias del Ecuador segn los
datos proporcionados por el INEC.

PROVINCIAS MAS DENSAMENTE POBLADAS DEL
ECUADOR
GUAYAS
PICHINCHA
MANAB
LOS ROS
AZUAY
LOJA
2038703
1330076
1025858
516840
438760
410509


Grficamente de los puede representar de la siguiente manera:





Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

39
Figura 2.8. Pictograma de los datos de la tabla 2.13

Guayas

Pichincha

Manab

Los Ros

Azuay

Loja


Donde: = 100 000 habitantes
= 25 000 a 38 000 habitantes.
Fuente: INEC 2000.


ACTIVIDADES RECOMENDADAS

1.- Un conjunto tiene 100 observaciones; la ms grande es 315 y la ms pequea es 56.
a) Cuntas clases debera tener la tabla de frecuencia?. Por qu?
b) Cual es la amplitud del intervalo ?
c) Qu valores debern ir en cada clase como limites superior e inferior?
d) Cules son las marcas de clase para estos intervalos

2.- En un estudio reciente sobre 500 graduados en administracin de negocios, el salario
inicial ms alto que se report fue de $27.500 al ao y el ms bajo fue de $19.900. Usted
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

40
desea crear la tabla de frecuencias para analizar y comparar estos datos con las ofertas de
trabajo que Ud. ha recibido
a) Cuntas clases pondra en su tabla de frecuencias . Porqu?
b) Cul es la amplitud del intervalo ?
c) c) Cules son los limites y puntos medios de cada clase?

3.- Elabore una distribucin de frecuencia en forma tabular y grfica. Los datos obtenidos
son del nmero de accidentes ocurridos durante 60 das tomados al azar en la ciudad de
Riobamba los cuales han sido proporcionados por la Polica Nacional . comente los
resultados.
9 7 4 3 6 5 8 2 3 6 2 3 0 3 0 2 1 3 1 5
11 7 4 2 3 2 4 7 3 2 1 3 2 1 0 1 2 2 2 3
3 2 5 4 3 6 2 8 2 3 4 1 2 1 6 1 3 2 1 1

4.- Los siguientes datos pertenecen a las precipitaciones pluviales (anuales) de los ltimos
50 aos, registradas en la zona del estado de Ohio. Elabore una tabla de distribucin de
frecuencias y un histograma de frecuencias relativas tanto absolutas como acumuladas.
Interprete los datos que se obtienen en la tabla como en los grficos estadsticos.

15.2 14.6 27.9 24.9 20.0 43.5 30.7 30.0 35.7 40.9
23.4 17.8 26.9 30.8 19.9 36.8 33.4 19.8 29.6 38.2
25.1 42.0 35.2 15.6 25.5 29.7 27.8 14.6 22.1 24.3
30.1 30.1 22.1 24.4 28.7 35.0 26.1 28.2 19.4 28.7
28.0 25.3 31.8 31.0 28.3 13.5 32.1 25.4 26.7 36.8

5.- Los siguientes datos son los ingresos de 60 ejecutivos de marketing para una empresa
X ( ponga Ud. el nombre a la empresa). Los datos estn expresados en miles de dlares
58 76 89 45 67 34
64 76 34 65 45 39
79 74 56 71 85 87
74 38 69 79 61 71
69 62 56 38 69 79
71 54 31 69 62 39
65 79 47 46 77 66
55 75 62 57 77 36
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

41
73 72 64 69 51 50
40 50 74 61 69 73
a) Construya una tabla y grafico de frecuencia absoluta para los datos. Interprete los
resultados tanto de la tabla como del grfico
b) Construya una tabla y grafico de frecuencia acumulada para los datos. Interprete los
resultados tanto de la tabla como del grfico

6.-La junta de directores de una gran cooperativa de vivienda desea investigar la posibilidad
de contratar a un supervisor para un campo de juegos al aire libre. Se sondearon las 616
casas de la cooperativa, cada una con un voto, sin importar su tamao. Se recolectaron los
siguientes datos:
Debera la cooperativa contratar un Supervisor?
Si 146
No 91
No est seguro 58
Sin respuesta 321
Total 616

a) Convierta los datos en porcentaje y construya
1.- Un diagrama de barras
2.- Un diagrama pastel
b) Eliminando el gripo sin respuesta, convierta las 295 respuestas a porcentajes y
construya
1.- Un diagrama de barras
2.- Un diagrama pastel
c) Cul de estos grficos prefiere y porqu?
d) Basndose en los resultados de a) y c) Que recomendara hacer a la junta de
directores?.

7.- Los siguientes datos representan acciones de mercado ( en porcentaje ) propiedad de
fabricantes de telfonos celulares porttiles vendidos durante 1999.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

42
Fabricante
Acciones del mercado
(%)
Motorota 22
Nokia 14
Mitsubishi 10
Toshiba 9
Samsung 8
Todos los dems 37
Total 100
Fuente: The New York Times, 31 de Octubre de 1993, Pg. 1

Construya:
a) Un diagrama de barras
b) Un diagrama pastel
c) Describa estos resultados en un breve informe y sugiera algunos planteamientos
para que Samsung pueda mejorar su posicin en el mercado.

8.- Las importaciones a los Estados Unidos provenientes de pases en desarrollo
constituyeron el 41,4% de un total estimado de 575.9 miles de millones de dlares en el ao
1993. Por otra parte, las exportaciones de los Estados Unidos hacia pases en desarrollo
constituyeron 40.7% de un total estimado de 459.600 de millones de dlares en ese mismo
ao. La siguiente tabla presenta un desglose por pas o regin ( en porcentaje ) de
importaciones y exportaciones de Estados Unidos para el ao 1993:

Pas o Regin
Acciones del mercado
de importaciones a los
EE.UU %
Acciones del mercado de
las exportaciones de los
EE.UU (%)
frica 2.3 1.6
Asia ( excluyendo Japn) 23.5 17.2
Canad 19.2 21.7
Comunidad Europea 16.6 20.8
Japn 18.4 10.4
Latinoamrica 12.9 16.8
Medio Oriente 2.7 4.7
Otro 4.4 6.8
Total 100 100
Fuente: The New York Times, 19 de Diciembre de 1993, Pg. F7.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

43
Construya:
a) Diagramas de barras separadas para importaciones y exportaciones
b) Diagramas pastel separados para importaciones y exportaciones
c) Diagramas de barras unidas para importaciones y exportaciones
d) Cul de estas graficas prefiere y por que?
e) Realice un resumen interpretativo de una de las graficas construidas.

9.- Recoja datos de su empresa o lugar de trabajo y elabore un cartograma

10.- Recoja datos de su empresa o lugar de trabajo y elabore un pictograma.

AUTOEVALUACION

1.- Un conjunto de datos concreto tiene 130 observaciones. Alrededor de cuantas clases
deber contener la distribucin de frecuencias?

2.- Porque es necesario organizar los datos de un modo sistemtico despus de
recogerlos?. Por qu no dejarlos en su forma bruta para preservar su integridad y no
traicionar su verdadero significado?

3.- Definir y poner ejemplos de los mtodos de organizacin de datos que se han explicado.
Cules son las ventajas de cada uno de ellos?
- Distribucin de frecuencias
- Distribucin de frecuencias acumuladas
- Distribucin de frecuencias relativas
- Grfico circular
- Histograma

4.- Cul es la relacin entre un polgono de frecuencias y una ojiva?

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

44
5.- En qu forma resultarn afectados los limites de clase de una distribucin de
frecuencias si trabajamos con datos continuos en lugar de discretos?

6.- Exponer con brevedad las reglas que se han de observar para establecer intervalos y
lmites de clase en una distribucin de frecuencias. Qu consideraciones habremos de
tener en cuenta si trabajamos con datos continuos?






















Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

45
UNIDAD III

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN PARA
DATOS NO AGRUPADOS


3.1 INTRODUCCIN

El anlisis de datos suele realizarse de diversas maneras, dependiendo de si existe una
cantidad pequea o grande de datos que se deba analizar. Cuando existen, digamos, 30 o
menos puntos de datos, se utilizan los mtodos que presentaremos a continuacin; para
mayores cantidades de datos, son ms prcticas las computadoras o tcnicas en las que es
necesario llevar a cabo, en primer lugar, el agrupamiento de los datos antes del anlisis.
Tales tcnicas se explicarn con mayor detalle ms adelante.

Con frecuencia un conjunto de nmeros se puede reducir a una o unas cuantas medidas
numricas sencillas que resumen el conjunto total. Tales medidas son mas fciles de
comprender que los datos originales, no procesados. Ms an, son esenciales para tcnicas
de clculo. Dos importantes caractersticas de los datos que las medidas numricas pueden
poner de manifiesto son: 1) el valor central o tpico del conjunto y 2) la dispersin de los
nmeros.

El objetivo de esta parte es presentar los mtodos ms tiles para resumir datos. Mientras
no exista una medida mejor para este objeto, diferentes situaciones suelen inclinarse ms
por una tcnica que por otra. La siguiente exposicin presenta una gran variedad de
tcnicas y sugiere algunas consideraciones generales que se pueden utilizar para seleccionar
entre diversas medidas.


Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

46

3.2 MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central se utilizan para indicar un valor que tiende a tipificar o a
ser el ms representativo de un conjunto de nmeros. Las tres medidas que ms
comnmente se emplean son la media, la mediana y la moda.

3.2.1 MEDIA ARITMTICA

La media aritmtica es lo que viene a la mente de la mayora de las personas cuando se
menciona la palabra "promedio". Como este trmino tiene ciertas propiedades matemticas
deseables, es la ms importante de las tres medidas que estudiaremos. La media aritmtica
se calcula al sumar los valores de un conjunto y al dividir el producto de esta suma entre el
nmero de valores del mismo. De este modo, la media de los valores 70, 80 y 120 es

90
3
270
3
120 80 70
= =
+ +


Si un alumno present cuatro exmenes y obtuvo calificaciones de 83, 94, 95 y 86, la
calificacin promedio del alumno es 89,5:

5 , 89
4
86 95 94 83
=
+ + +


La media de una muestra se representa por el smbolo
x
(que se lee "x con raya"), y su
clculo se puede expresar en notacin sigma como se observa a continuacin.

n
x
x
n
1 i
i
=
=
o, en forma ms simple como
n
x
x

=

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

47
El procedimiento para calcular la media aritmtica es el mismo, independientemente de si
un conjunto de valores representa las observaciones de la muestra o todos los valores
obtenidos de una poblacin. Sin embargo, se utiliza el smbolo
u
para la media de una
poblacin y N para el nmero de elementos de la misma:

n
x

= u


La media presenta ciertas propiedades tiles e interesantes, que explican por qu es la
medida central que se utiliza ms ampliamente:

1. La media siempre se puede calcular para un conjunto de nmeros.
2. Existe una media nica para un conjunto dado de nmeros.
3. La media es sensible a (o afectada por) cada valor del conjunto. De este modo, si cambia
algn valor, la media tambin cambiar.
4. Si se suma una constante a cada valor del conjunto, la media aumentar por la misma
cantidad. De manera que si se suma una constante de 4.5 a cada valor, la media aumentar
en 4.5. En forma similar, el restar de cada valor una constante, o bien, multiplicarlo o
dividirlo por la misma, har que la media disminuya en la misma cantidad, o resulte
multiplicada o dividida por dicha constante.
5.- La suma de las desviaciones de los nmeros de un conjunto a partir de la media, es
cero:
( )

= 0 x x
i

Por ejemplo, la media de los nmeros 2, 4 y 6 es 4:
4
3
6 4 2
x =
+ +
=

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

48
Si restamos 4 de cada nmero, tenemos,
2 4 = -2
4 4 = 0
6 4 = +2
0

3.2.2 MEDIA PONDERADA


La frmula anterior para calcular la media aritmtica supone que cada observacin
es de igual importancia. En trminos generales, esto suele suceder as, no obstante,
hay algunas excepciones. Tomemos, por ejemplo, la situacin en la que un profesor
informa a su clase que les har dos exmenes de una hora, cada uno de los cuales
equivaldr al 30% de la calificacin de todo el curso, y un examen final que
corresponder al 40%.

El clculo de la media deber considerar las diferentes ponderaciones de los
exmenes. Se aplica la siguiente frmula:

=
=
=
n
1 i
i
n
1 i
i i
w
x w
ponderada media


donde w es el valor de la observacin i-sima. As, un alumno que obtenga 80 en el primer
examen, 90 en el segundo y 96 en el final, obtendr un promedio de 89,4:


Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

49

Examen Calificacin Ponderacin
no. 1 80 0,30
no. 2 90 0,30
final 96 0,40


media ponderada = 0.30(80) + 0.30(90) + 0.40(96) = 89.4
0.30 + 0.30 + 0.40

Supngase que en otra asignatura hay un examen de medio curso y otro final, y que este
ltimo va a valer el doble que el primero. Un alumno que obtenga 95 en el primer examen y
89 en el segundo, tendra un promedio de 91.0.

Examen Calificacin Ponderacin
Intermedio 95 1
Final 89 2

0 . 91
2 1
) 89 ( 2 ) 95 ( 1
ponderada media =
+
+
=


3.2.3 MEDIANA

La segunda medida de tendencia central de un conjunto de nmeros es la mediana. Su
caracterstica principal es que divide un conjunto ordenado en dos grupos iguales; la mitad
de los nmeros tendr valores que son menores que la mediana, y la otra mitad alcanzar
valores mayores que est. Para encontrar la mediana, primeramente es necesario ordenar los
valores (generalmente) de menor a mayor. Posteriormente se deber separar la mitad de los
valores para obtener la mediana.
Por ejemplo, la mediana del grupo 5, 6 y 8 es 6, en el cual el 6 est en medio. En trminos
generales, la mediana ocupa la posicin (n + 1)/2. Por tanto, para tres nmeros, la posicin
es (3 + 1)/2 = 2 o sea, la segunda posicin.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

50
Considrese un segundo ejemplo: Obtener la mediana de estos valores: 7, 8, 9 y 10. Segn
la frmula, la posicin de la mediana es (4 + 1)/2 = 2.5 que se encuentra a la mitad de los
dos valores intermedios, o sea 8.5 en este caso. Esto deja dos valores menores y dos
mayores.
El procedimiento para obtener la mediana es como sigue:

1. Ordenar o clasificar los valores.

2. Contar para saber si existe un nmero de valores par o impar.

3. En caso de que se tenga un nmero impar de valores, la mediana es el valor
intermedio. En cambio, para un nmero par de valores, la mediana es el
promedio de los dos valores intermedios.

A continuacin presentamos algunos ejemplos.

Par Mediana Impar Mediana
a.- 2.3. 3.4 3 a.- 1. 2. 3. 3,3.4. 7 3
b.-1,18, 19,20 18.5 b.- 9, 40, 80, 81,100, 80


La mediana de un conjunto de nmeros es mayor que la mitad de los valores y menor que
la otra mitad de los mismos.



3.2.4 COMPARACIN ENTRE LA MEDIA Y MEDIANA

Elegir el uso de la media o la mediana como medidas de tendencia central de un conjunto
de nmeros depende de varios factores. La media se ve afectada o es influida por todo valor
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

51
del conjunto, incluyendo los extremos. La mediana, por otra parte, es relativamente
insensible a valores extremos.

En trminos generales, la media posee ciertas propiedades matemticas que la hacen ms
atractiva. Adems, ordenar los datos para encontrar la mediana puede resultar aburrido, y
para determinarla no es posible utilizar una calculadora como sucede al obtener la media.

3.2.5 MODA

La moda es el valor que con ms frecuencia se presenta en un conjunto. Por ejemplo, en el
conjunto 10, 10, 8, 6 y 10, el 10 se presenta tres veces, en tanto que cada uno de los otros
valores, slo una vez. El valor ms frecuente, la moda, es 10. El valor moda es descriptivo
cuando se trabaja con canteo de datos.

En comparacin con la media y mediana, la moda es la menos til para la mayora de los
problemas estadsticos, ya que no se inclina por un anlisis matemtico en el mismo sentido
que lo hacen las otras dos(media y mediana) Sin embargo, desde un punto de vista
puramente descriptivo, la moda es indicativa del valor "tpico" en trminos del valor que se
presenta con mayor frecuencia. La moda es ms til cuando uno o dos valores, o un grupo
de stos, ocurren con mayor frecuencia que otros. Por el contrario, cuando la mayora o
todos los valores se presentan casi con la misma frecuencia, la moda no sirve para describir
datos.

La moda es el valor que ocurre con mayor frecuencia.

Esta es una medida que sirve para datos continuos, discretos, nominales y jerarquizados. Es
decir es la nica medida de tendencia central que sirve para todo tipo de datos.



Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

52
3.2.6 COMPARACIN ENTRE LA MEDIA, LA MEDIANA Y LA MODA

Definicin Ventajas Limitaciones
Media
n
x
x
n
1 i
i
=
=

1.- refleja cada valor
2.- propiedades matemticas
atractivas
1.- puede ser
excesivamente influida
por los extremos
Mediana
La mitad de los
valores son
mayores, la otra
mitad es menor
1.- es menos sensible que la
media
1.- difcil de determinar si
hay gran cantidad de datos
Moda
Valor con la
frecuencia ms alta
1.- valor tpico; ms
valores en este punto que en
cualquier otro
1.-no se presta para
anlisis matemtico.
2.- puede o no haber un
valor modal para algunos
conjuntos de datos.


3.3 MEDIDAS DE DISPERSIN

Para describir en forma adecuada un conjunto de datos, es necesario dos tipos de medidas
de resumen. Adems, para obtener informacin respecto a la parte media de un conjunto de
nmeros, es conveniente tambin tener un mtodo para expresar la cantidad de dispersin o
difusin que hay entre los nmeros.

Por ejemplo, las medidas de dispersin indican si los valores estn relativamente cercanos
uno del otro o si se encuentran dispersos. En una forma esquemtica, esto se ilustra en la
figura 1 en las partes (a) y (b). Las observaciones en la figura 1 (a) tienen valores que estn
relativamente cercanos entre si, en comparacin con los de la figura 1 (b).



Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

53
. . ........... .
(a) Baja dispersin
. . . . . . . . . . .
(b) Alta dispersin

Figura 3.1 la dispersin mide cuan prximos estn los valores del grupo entre si.

Es conveniente considerar cuatro variables de dispersin: la amplitud de variacin (rango),
la desviacin media, la varianza y la desviacin estndar. Todas estas medidas excepto el
rango toman a la media como punto de referencia. En cada caso, un valor cero indica que
no hay dispersin, en tanto que la dispersin aumenta a medida que se incrementa el valor
de la medida del rango , varianza, etc.

3.3.1 RANGO

El rango o amplitud de variacin de un grupo de datos es generalmente la medida mas
sencilla de calcular y comprender, Se concentra en el nmero mayor y el nmero menor
del grupo (es decir, los puntos extremos). Dicha medida se puede expresar en dos formas:

1. La diferencia entre los valores extremos (mayor menor)
2. Los valores mayor y menor del grupo (del menor al mayor)

El uso de una u otra manera de expresar el rango depende de la naturaleza del conjunto de
datos y de la magnitud de los mismos.

Por ejemplo saber solo que el rango de un conjunto de datos es 44, no dice nada ms
respecto a los nmeros; sin embargo, si se establece que el rango es de 300 a 344, se
proporciona ms informacin acerca de la magnitud de los nmeros.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

54
El rango se puede expresar, estableciendo la diferencia entre los nmeros mayor y
menor de un grupo, o bien, identificando ambos nmeros

EJEMPLOS:

RANGO O AMPLITUD DE VARIACIN
NMEROS DIFERENCIA DEL MAS BAJO AL MAS ALTO
1,5,7,13 13 1 = 12 1 al 13
14,3,17,4,8,73,36,48 73 3 = 70 3 al 73
3,2;4,7;5,6;2,1;1,9;10,3 10,3 1,9 = 8,4 1,9 al 10,3

La ventaja de utilizar esta medida como medida de dispersin, se base en el hecho de que
su obtencin es relativamente sencilla, an cuando se trate de un conjunto bastante grande
de nmeros.

La principal limitacin que tiene en cambio es que se considera solamente los valores
extremos del conjunto, y no proporciona mayor informacin respecto a los dems valores
del mismo.
. ... . .. ... ..
(1)
. ... ............ .
(2)
. . . . . . . . . . . . .
(3)

Figura 3.2 Tres grupos de datos, todos con el mismo rango.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

55
En la figura 3.2 se presentan tres conjuntos de datos bastante diferentes, que poseen el
mismo rango, pero no as la misma dispersin. En el primero, los valores se distribuyen en
forma uniforme, y esta medida cumple con su objetivo. En el segundo conjunto, los
nmeros se encuentran ms agrupados, aunque el rango an proporciona una cruda
medida de dispersin. No obstante, el tercer conjunto demuestra cmo se puede influir
fcilmente en el rango mediante unos cuantos valores extremos, y representar informacin
bastante engaosa respecto a la dispersin de una serie de nmeros.

Debido a estos problemas el rango no es suficiente para medir la dispersin de datos
entonces citaremos algunas medidas de este tipo pero que utilizan a la media como punto
de referencia.

3.3.2 MEDIDAS DE DISPERSIN QUE UTILIZAN LA MEDIA COMO PUNTO DE
REFERENCIA

Dadas sus propiedades matemticas, la media de un conjunto de datos casi siempre se
calcula. En consecuencia, se ha encontrado determinado nmero de medidas de dispersin
que utilizan esta medida como punto de referencia.

Todas estas incluyen la obtencin de la desviacin o diferencia entre cada valor del y la
media
( ) x x
i

. Se consideran tres de estas medidas, la primera trata sobre la desviacin
absoluta respecto de la media, mientras que las otras dos se concentran en desviaciones
cuadradas a partir de la media.

El anlisis se llevara a cabo principalmente con clculos que comprendan datos muestrales,
en oposicin a datos obtenidos a partir de poblaciones enteras, con la idea de que la
estadstica muestral se utilizar para aproximar los parmetros de la poblacin.


Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

56
3.3.3 DESVIACIN ABSOLUTA MEDIA (DAM)

La desviacin absoluta media (DAM) mide la desviacin promedio de valores con respecto
a la media del grupo, sin tomar en cuenta el signo de la desviacin. Se obtiene al restar la
media de cada valor del grupo, eliminando el signo (+ 0 - ) de la desviacin (es decir
tomando el valor absoluto de esta resta), hallando despus el promedio (dividir para el
nmero de las observaciones n). Por definicin se debe tener en cuenta que la suma de las
desviaciones positiva y negativas de la media siempre ser igual a cero. La DAM se calcula
mediante la siguiente frmula:


n
x x
DAM
n
1 i
i
=

=
donde n es el nmero de observaciones.

Ejemplo.- Obtenga la DAM para el siguiente conjunto de valores
1, 2, 3, 4, 5
Solucin.-

Primero calculamos la media
3
5
5 4 3 2 1
5
x
x
5
1 i
i
=
+ + + +
= =

=

para facilitar los clculos se sugiere realizar la siguiente tabla:

x
i x

x x
i


x x
i


1
2
3
4
5
3
3
3
3
3
-2
-1
0
1
2
2
1
0
1
2


0 6
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

57
Luego sacamos el promedio:
2 . 1
5
6
=
y esta ser la DAM es decir :
DAM = 1.2

La desviacin absoluta media de un conjunto de datos es la desviacin promedio de los
valores del conjunto con respecto a la media sin tomar en cuenta el signo de la
diferencia.

Es relativamente sencillo comprender la desviacin media, no obstante, no se la emplea tan
ampliamente como medida de dispersin, ya que otras medidas presentan propiedades
matemticas mas atractivas, a la DAM se le utiliza de diferentes manera en control de
inventarios.

3.3.4 VARIANZA

La varianza de una muestra se calcula casi en la misma forma que la desviacin media, con
dos pequeas diferencias:

1.- Las desviaciones se elevan al cuadrado antes de sumarlas y

2.- Se obtienen el promedio, utilizando n-1 en lugar de n, ya que esta pretende
proporcionar un mejor clculo de la varianza de la poblacin del obtenido mediante
el uso de n.

La varianza muestral se puede calcular mediante la siguiente formula:


( )
1 n
x x
s s
n
1 i
2
i
2
x
2

= =

=

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

58

Si un conjunto de datos constituye una poblacin, o bien, si el objeto de resumir los datos
es nicamente para describir un conjunto de datos en lugar de sacar inferencias respecto a
una poblacin, entonces se deber sustituir en el denominador (n-1) por n.


Ejemplo: Calcular la varianza de la siguiente muestra: 1,2,3,4,5

Solucin.- Para facilitar los clculos se sugiere realizar la siguiente tabla:

x
i x

( ) x x
i


( )
2
i
x x

1
2
3
4
5
3
3
3
3
3
-2
-1
0
1
2
4
1
0
1
4


0 10

Luego aplicamos la frmula de la varianza:
( )
5 , 2
4
10
1 5
x x
s
5
1 i
2
i
2
= =

=

=


Nota.- si tales valores hubieran sido todos los valores de una poblacin, su varianza sera
10/5 = 2.

A la varianza la podemos definir como:

La desviacin promedio de los valores obtenidos a partir de la media, elevada al
cuadrado y calculada mediante n-1 en lugar de n.

En resumen los pasos necesarios para calcular la varianza son los siguientes:
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

59
1.- Calcular la media
2.- Restar la media de cada valor del conjunto
3.- Elevar al cuadrado cada una de estas desviaciones
4.- Sumar los cuadrados de las desviaciones
5.- Dividir entre (n-1) en el caso de datos muestrales; dividir entre n simplemente para
resumir el conjunto o si los datos equivales a todos los valores de una poblacin.

Una frmula alternativa que suele emplearse para calcular la varianza muestral es
1 n
n x x
s s
2
n
1 i
i
n
1 i
2
i
2
x
2

|
.
|

\
|

= =

= =


una vez ms se sustituye n-1 por n en el denominador , para obtener la varianza de la
poblacin.

Esta frmula algunas veces es ms fcil de utilizar que la anterior ya que no se requiere
calcular la media y no es necesario obtener cada una de las desviaciones. Y en el caso de
que una media se por ejemplo 3,333333333, el mtodo anterior da lugar a errores, debido al
redondeo de nmeros.

Mediante los datos anteriores podemos ver que la varianza calculada con esta frmula es
igual a la que resulto anteriormente.


x
i
2
i
x

1
2
3
4
5
1
4
9
16
25


15 55


Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

60
La varianza ser:

5 , 2
4
10
4
45 55
1 5
) 5 / 15 ( 55
1 n
n x x
s
2
2
n
1 i
i
n
1 i
2
i
2
= =

|
.
|

\
|

=

= =


3.3.5 DESVIACIN ESTNDAR

La desviacin estndar es simplemente la raz cuadrada positiva de la varianza. De este
modo si la varianza es 81 la desviacin estndar ser 9; si la varianza es 10 la desviacin
estndar es
10
= 3,16. Para obtener la desviacin estndar se debe calcular la varianza y
hallar su raz cuadrada. Las frmulas para la desviacin estndar son:

( )
1 n
n x x
1 n
x x
s
2
n
1 i
i
n
1 i
2
i
n
1 i
2
i

|
.
|

\
|

= =
=


Al igual que para la varianza si se desea calcular la desviacin estndar de la poblacin
basta sustituir en el denominador n -1 por n.

La desviacin estndar es una de las medidas de resumen que ms se suele utilizar para
distribuciones, y desempea un papel importante en la estadstica. Es importante observar
que las unidades de la desviacin estndar son las mismas que las de la media.

Por ejemplo, si la media esta en unidades monetarias, la desviacin estndar tambin lo
estar, Si la media esta en metros lo mismo ocurrir con la desviacin estndar. Por otro
lado, la varianza se expresa en unidades al cuadrado ( es decir, unidades monetarias
2
,
metros
2
).

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

61
EJEMPLO: Estime la desviacin estndar de la muestra dada anteriormente.

Como la varianza era
5 , 2 s
2
=
entonces
= = 5 , 2 s
1,58.

En si la

Desviacin estndar de un conjunto de datos se define como la raz cuadrada positiva de
la varianza.

3.3.6 COEFICIENTE DE VARIACIN

La desviacin estndar es un trmino absoluto del que se pueden sacar conclusiones
errneas sobre la dispersin de la muestra. As para una muestra de
x
= 30 y s = 4 y otra de
x
= 60 y s = 6 parece que en principio la segunda es ms dispersa. Sin embargo reduciendo
los datos a una misma escala sucede lo contrario.

Para evitar lo anterior utilizamos el coeficiente de variacin, que es el cociente que resulta
de dividir la desviacin estndar entre la media aritmtica.
) (100
x
s
CV =

Ser ms dispersa la muestra que tenga mayor coeficiente de variacin.
En el caso anterior C
p
= 4/30 = 0.13 para la primera muestra y C
p
=6/60 = 0.1 para la
segunda. La primera tiene ms dispersin que la segunda teniendo en cuenta la media de
cada una.
Este coeficiente no es conveniente usarlo cuando la media se halla muy prxima a 0. En los
dems casos es la medida de dispersin ms representativa
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

62
3.3.7 OTRAS MEDIDAS

Las medidas presentadas anteriormente se utilizan cuando los datos son de tipo
cuantitativo, con excepcin de la moda, que sirve tambin con datos cualitativos
(nominales).
Otra medida que se emplea con datos de este tipo es la proporcin que es la fraccin o
porcentaje de elementos de un grupo o clase particular. La proporcin se calcula mediante
la frmula
n
x
proporcin =


en la cual x es el nmero de elementos que tienen determinada caracterstica y n es el
nmero total de observaciones.

Por ejemplo si observamos que 10 personas de una muestra de 40 tienen color de ojos
negros, decimos que la proporcin es 10/40 = 0,25 o 25%.

ACTIVIDADES RECOMENDADAS

1.- a) Puede la desviacin tener valor de cero?.Puede ser negativa? Explique.
b) Puede ser negativa la desviacin absoluta media? Explique

2.- Calcule la media y la desviacin estndar de las ventas diarias si se obtuvieron ingresos
de: $8100, $9000, $5600, $7680, $4800, $10640.

3.- Obtenga la media y la mediana para cada uno de los siguientes conjuntos de datos.
a. 7, 9, 2, 1, 5, 4, 5, 7, 6, 2
b. 30, 2, 79, 50, 38, 17, 9
c. 90, 87, 92, 81, 78, 85, 95, 80
d. 1, 2, 10, 7, 7, 9, 8, 5, 2, 11
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

63
e. 0.0011, 0.032, 0.027, 0.035, 0.042
f. 42, 30, 27, 40, 35, 32, 33.

4.- Calcule las medidas de tendencia central y de dispersin para el siguiente conjunto de
datos : 83, 92, 100, 57, 85, 88, 84, 82, 94, 93, 91, 95, 87; suponiendo que son:
a) muestrales
b) de la poblacin.
Realice un comentario sobre las respuestas y justifquelo.

5.- Determine la desviacin estndar para los valores del ejercicio 4 en trminos muestrales
y de poblacin.

6.- Calcule la mediana, la media y la moda para el nmero de clientes que estn formados
en colas de 12 cajas en la oficina matriz de un importante banco. Si los datos son: 1, 3, 4, 3,
4, 2, 4, 1, 2, 2, 1, 0

7.- Calcule la media y la desviacin estndar para los tiempos de reaccin para los
siguientes datos muestrales:
2.2, 2.5, 2.7, 2.3, 2.4, 2.0, 2.7, 2.3, 2.4, 2.4, 2.8

8.- Considere los siguientes datos obtenidos sobre una muestra de precios de oferta:
26.5, 27.5, 25.5, 26, 27, 23.4, 25.1, 26.2, 26.8
a) Determine el rango
b) Obtenga la DAM
c) Encuentre la varianza
d) Calcule la desviacin estndar.
9.Convierta cada uno de los siguientes enunciados en una proporcin:
a) 5 nios de 25
b) 7 de nueve pacientes
c) 3 rojos, 4 azules y 5 verdes de 12 canicas.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

64

10.- Calcule cada una de las siguientes proporciones por medio de la tabla que se muestra a
en la figura 3.3:

a) Das soleados del mes de junio
b) Das parcialmente nublados del mes de junio
c) Domingos soleados
d) Fines de semanas lluviosos (viernes, sbado, domingo)
e) Das con nieve.
f) Jueves nublados

Figura 3.3.- Tiempo del mes de Junio
D L M M J V S




1

2

3

4


5

6

7

8

9

10

11

12

13


14

15

16


17

18

19

20

21

22

23


24

25


26

27

28

29


30

Soleado Parcialmente nublado:

Nublado; lluvioso; nevado





Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

65
AUTOEVALUACION

1.- Definir y poner ejemplos de una medida de tendencia central y una medida de
dispersin.
2.- En qu condiciones preferira usted la mediana a la madia aritmtica como medida de
tendencia central? Explquelo.
3.- Como propietario de una agencia de publicidad prspera de Chicago, George Kay gana
110000 dlares al ao. Sus siete empleados ms recientes ganan 15000, 21000, 18500,
17900, 21200, 15900 y 22500 dlares. Qu medida de tendencia central piensa usted que
es la mejor indicacin del promedio de estos ocho sueldos? Calcule el promedio.
4.- Helen es directora de los servicios de personal de un gran banco de la ciudad. Tiene que
contratar a una secretaria por su eficiencia en mecanografa. Una candidata al trabajo
mecanografo seis veces un manuscrito con el siguiente nmero de errores: 5, 6, 2, 1, 2, 0.
Otra candidata mecanografo el mimo manuscrito seis veces con: 3, 4, 5, 3, 4 y 5 faltas.
Qu candidata debe contratar Helen?















Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

66
UNIDAD IV

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN PARA
DATOS AGRUPADOS.

4.1 INTRODUCCIN
En la unidad anterior se dieron las nociones bsicas de estas medidas, aplicadas a casos en
los cuales las observaciones eran pocas, en esta unidad se ampliaran estos conceptos para
series estadsticas, ya sean de intervalos o de frecuencias.

4.2 MEDIDAS DE TENDENCIA CENTRAL

4.2.1 LA MEDIA ARITMTICA

4.2.1.1 LA MEDIA ARITMTICA DE UNA SERIE ESTADSTICA DE
FRECUENCIAS.

Para obtenerla se multiplica la variable por la frecuencia correspondiente, luego se halla la
suma de todos estos productos y dividimos por el nmero de casos.

Esta descripcin se puede sintetizar con la frmula:
n
f X
X
n
1 i
i i
=
=


En donde:
X
= Media Aritmtica
EX
i
. f
i
= Sumatoria del producto de la variable por la frecuencia de cada clase
n = nmero de casos u observaciones.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

67

Media Aritmtica =
casos de nmero
frecuencia la por variable la de producto del atoria Sum


EJEMPLO: Los datos de una encuesta aplicada a estudiantes, en relacin al nmero de
hermanos, una vez tabulados quedan as:

X f
1
2
3
4
5
6
7
8
9
10
11
12
3
10
10
16
14
7
8
7
1
0
2
1
79

Determinar la Media Aritmtica: Para ello construimos la siguiente tabla

x f X.f
1
2
3
4
5
6
7
8
9
10
11
12
3
10
10
16
14
7
8
7
1
0
2
1.
3
20
30
64
70
42
56
56
9
0
22
12
79 384

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

68
Aplicando la frmula
n
f X
X
n
1 i
i i
=
=
tendremos
5 86 4
79
384
X ~ = = .

Como conclusin tenemos que los 79 alumnos encuestados tiene un promedio de 5
hermanos.

4.2.1.2 LA MEDIA ARITMTICA DE UNA SERIE ESTADSTICA DE
INTERVALOS

A este procedimiento lo podemos sintetizar de la siguiente manera:

1. Encontramos los puntos medios de la serie.
2. Multiplicamos las frecuencias por los puntos medios correspondientes.
3. Sumamos todos los productos de las frecuencias por los puntos medios.
4. Dividimos la suma anterior por el nmero de elementos de la serie.

Todo este procedimiento lo podemos sintetizar con la frmula:

n
f Xm
X
n
1 i
i i
=
=


Siendo:
X
= Media Aritmtica
Ef . Xm = Sumatoria de los productos de las frecuencias por los puntos medios
n = nmero de elementos

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

69
Media Aritmtica =
elementos de Nmero
medios puntos los por s frecuencia las de productos los de a Sum


EJEMPLO: Si la edad de los profesores del Nivel Medio de la Ciudad de Riobamba,
Provincia de Chimborazo en el ao 2002 fue:

X f
21 25
26 30
31 35
36 40
41 45
46 50
51 55
56 60
61 - 65
83
191
99
67
41
27
16
7
4

Calcular la Media Aritmtica:

X F Xm f.Xm
21 25
26 30
31 35
36 40
41 45
46 50
51 55
56 60
61 - 65
83
191
99
67
41
27
16
7
4
23
28
33
38
43
48
53
58
63
1.909
5.348
2.267
2.546
1.763
1.296
848
406
252

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

70
De donde:
Ef . Xm = 17.635
n = 535
Si:
n
f Xm
X
n
1 i
i i
=
=



Entonces: 96 . 32
535
635 . 17
= = X


La edad promedio de los 535 profesores ha sido de 32.96 aos es decir 33 aos.

4.2.1.3 PROPIEDADES Y APLICACIONES

4.2.1.3.1 PROPIEDADES
1 A la formula de la media aritmtica se le puede despejar cualquiera de sus
elementos es decir puede ser tratada matemticamente.

2 La media aritmtica es un promedio que depende de todos los valores de la serie, es
afectada por los valores extremos.
3 La suma de las desviaciones con respecto a la media aritmtica es igual a cero.

4 Se puede establecer la media aritmtica de un conjunto de promedios o lo que es lo
mismo, determinar la media de las medias aritmticas.

5 Se puede establecer la media aritmtica de un conjunto de promedio o lo que es lo
mismo, determinar la media de las medias aritmticas.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

71
4.2.1.3.2 APLICACIONES
Se utiliza:
1 Obtener un promedio representativo en la serie.
2 Comparar dos o ms series.
3 Calcular otro tipo de medidas. Como medidas de dispersin, medidas de
correlacin, etc.
4.2.2 LA MEDIANA

4.2.2.1. MEDIANA DE UNA SERIE ESTADSTICA DE FRECUENCIA.
Para determinar el valor de la mediana, hemos utilizado el siguiente procedimiento:

1. Calculamos la columna de la frecuencia acumulada
2. La mediana la encontramos en la variable que corresponde a la frecuencia
acumulada inmediata a aquella que sobrepasa la mitad del nmero total de casos

EJEMPLO: Los datos de una encuesta, sobre el nmero de hermanos de cada uno de
encuestados, una vez tabulados quedan as:

X f
1
2
3
4
5
6
7
8
9
10
11
12
3
10
10
16
14
8
7
7
1
0
2
1
79


Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

72
Determinar la mediana

X f fa
1
2
3
4
3
10
10
16
3
13
23
39
5 14 53
6
7
8
9
10
11
12
7
8
7
1
0
2
1
61
68
75
76
76
78
79

Puesto que: n/2 = 79/2 = 39.5 entonces: Mdm = 5

4.2.2.2 MEDIANA DE UNA SERIE ESTADSTICA DE INTERVALOS

Para este clculo se sigue el siguiente proceso:

1. Determinar la columna de la frecuencia acumulada.
2. Dividimos (n/2), nos permite determinar la posicin de la mediana.
3. Encontramos el lmite real inferior del intervalo.
4. Obtenemos la frecuencia acumulada menor, que es la ubicacin de la mediana.
5. Encontramos el valor de la frecuencia.
6. Hallamos el ancho del intervalo.
Todo este proceso la sintetiza la frmula:
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

73
i
f
m fa 2 n
Li Mdm .
. ) / (
+ =

Siendo:
Mdm = mediana
Li = lmite real inferior
n/2 = nmero total de casos divido para dos
fa.m = frecuencia acumulada menor
i = ancho del intervalo
f = frecuencia

EJEMPLO: Si la edad de los profesores del Nivel Medio de la Ciudad de Riobamba,
Provincia de Chimborazo en el ao 2002 fue:

X f
21 25
26 30
31 35
36 40
41 45
46 50
51 55
56 60
61 - 65
83
191
99
67
41
27
16
7
4


535

Calcular la mediana
X f f.a
21 25
26 30
31 35
36 40
41 45
46 50
51 55
56 60
61 - 65
83
191
99
67
41
27
16
7
4
83
274
373
440
481
508
524
531
535


535
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

74
n/2 = 535/2 = 267.5
Li = 25 + 26 / 2 = 25.5
fa.m = 83
f = 191
i = 5
i
f
m fe 2 n
Li Mdm .
. ) / (
+ =





Reemplazando: 33 . 30 5 .
191
) 83 5 . 267 (
5 . 25 =

+ = Mdm

Se puede decir entonces que 30.33 es el valor central de la serie.

4.2.2.3 PROPIEDADES Y APLICACIONES
4.2.2.3.1 PROPIEDADES

1 La mediana no es como la media, un nmero que seale precisin en el clculo,
sino que es un promedio que ocupa el valor central de la serie, haciendo que la
mitad de la poblacin se ubique a su izquierda y, la otra mitad, a su derecha.
2 La mediana es un valor central y para su determinacin no es necesario conocer
todos los elementos de la serie
3 Los elementos de la variable demasiado grandes o demasiados pequeos, no
influyen en la determinacin de la mediana.
4 La frmula que hemos propuesto para el clculo de la mediana, en una serie de
intervalos, recoge un proceso que se utiliza para su clculo aproximado.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

75
4.2.2.3.2 APLICACIONES
Este promedio se utiliza para:
1 Encontrar el valor central de la serie
2 Dividir el rea del polgono de frecuencia en dos partes iguales.
3 Establecer la verificacin de la hiptesis, en los mtodos no paramtricos de la prueba
de la mediana.
4 Encontrar un promedio ms fiable en cierto tipo de variables como: salarios, estaturas,
pesos, etc. ya que no influyen en esta determinacin los valores extremos muy grandes
o muy pequeos.

4.2.3 LA MODA

Para obtener la moda de una serie estadstica no es necesario utilizar ninguna frmula, sino
que se lo hace tomando el valor que ms veces se repite.

4.2.3.1 LA MODA DE UNA SERIE ESTADSTICA DE FRECUENCIA

Para determinar la moda en una serie de frecuencias, se encuentra la variable que tiene
mayor frecuencia y dicha variable ser la moda de la serie.

EJEMPLO: La tabulacin de una encuesta en relacin con el nmero ideal de hijos que
debe tener una familia, nos da los siguientes datos:

X f
1 10
2 20
3 8
4 20
5 6
6 4
7 5


73
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

76
Observando el cuadro se puede apreciar que existen dos valores que coinciden y que poseen
la mayor frecuencia (20).

Por lo tanto las modas correspondientes sern 2 y 4, de donde se deduce que existen series
un modales, bimodales o multimodales.

4.2.3.2 LA MODA DE UNA SERIE ESTADSTICA DE INTERVALOS

Cuando los datos estn agrupados en una serie estadstica de intervalos, se localiza el
intervalo con mayor frecuencia, la cual se llama clase modal, en la cual necesariamente
estar localizada la moda que se pretende calcular, mediante la siguiente frmula.
i .
d d
d
Li Mo
2 1
1
+
+ =

Donde:
Li = limite real inferior
d1 = diferencia entre la frecuencia modal y la frecuencia del intervalo menor
d2 = diferencia entre la frecuencia modal y la frecuencia del intervalo mayor
i = ancho del intervalo

EJEMPLO: En la tabla que reflejan las edades de los profesores de la ciudad de Riobamba
calcular la moda:
X f
21 25
26 30
31 35
36 40
41 45
46 50
51 55
56 60
61 - 65
83
191
99
67
41
27
16
7
4


535

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

77
Li =
5 . 25
2
26 25
=
+

5 i
92 99 191 d
108 83 191 d
2
1
=
= =
= =


aplicando la formula tenemos:
5 .
92 108
108
5 . 25 Mo
+
+ =

2 . 28 Mo
7 . 2 5 . 25 Mo
200
540
5 . 25 Mo
=
+ =
+ =


El valor de 28. 2 realmente representa la edad ms comn de este grupo de profesores y el
grfico se puede apreciar que es el valor mas alto de la serie, debiendo coincidir como es
lgico con el punto ms alto de la serie.

4.2.3.3 PROPIEDADES Y APLICACIONES

4.2.3.3 1 PROPIEDADES

1 Es el valor de la variable que ms veces se repite en la serie, pues pertenece a la
mayor frecuencia.
2 El valor de la moda no se altera por los valores muy grandes o muy pequeos
que existan en la serie
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

78
3 La moda no tiene ninguna significacin en series compuestas de pocos
elementos y que no se repitan.
4 La determinacin de la moda es una serie de intervalos de clase, nos conduce a
un valor aproximado de la moda.

4.2.3.3 2 APLICACIONES

1 Es una medida muy fcil de calcular, pero resulta ser un valor aproximado.
2 La moda en una distribucin puede no existir, pero si existe, puede que no sea el
nico, as por ejemplo se puede dar el caso de distribuciones bimodales,
trimodales o multimodales
3 La moda se lo utiliza para detectar la estatura ms corriente, el salario ms
comn, la calificacin que ms se repite; en otros casos tiene muy poca
significacin.


4.3 MEDIDAS DE DISPERSIN

4.3.1 LA DESVIACIN MEDIA
4.3.1.1 LA DESVIACIN ABSOLUTA MEDIA PARA UNA SERIE ESTADSTICA
DE FRECUENCIA.

La desviacin absoluta media para este tipo de datos agrupados se la obtiene en base de la
siguiente frmula:
n
di fi
DAM
n
1 i

=
=
.

donde:

=
n
1 i
di fi.
es la sumatoria del valor absoluto, ( para asegurar que la sumatoria sea
positiva) del producto de las frecuencias por las desviaciones.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

79
d
i
:
X X
i

(diferencia entre el valor de cada observacin con respecto a la media).
n: nmero de casos
Esta frmula obedece a la misma definicin de desviacin absoluta media para el caso de
que las observaciones sean menores a 30, solamente se introduce un nuevo elemento que es
F, en razn de que se trata de una serie de frecuencia.

EJEMPLO.- Hallar la desviacin media para el peso (kg) registrado para un grupo de
seoritas, los cuales se detallan a continuacin:

X f
44 1
45 2
46 2
47 3
48 5
49 3
50 2
51 1

Para hallar la DAM se construye la siguiente tabla:

X f X.f
X X d
i
=

f.d
44 1 44 3.63 3.63
45 2 90 2.63 5.26
46 2 92 1.63 3.26
47 3 141 0.63 1.89
48 5 240 0.37 1.85
49 3 147 1.37 4.11
50 2 100 2.37 4.74
51 1 51 3.37 3.37


19 905 28.11

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

80
Donde
63 47 19 905 X . / = =
. Aplicando la relacin que sirve para obtener la desviacin se
tiene:
48 . 1
19
11 . 28
= = DAM
(kg) que es el valor con el cual cada valor de la variable difiere
con respecto a la media aritmtica .

4.3.1.2 LA DESVIACIN ABSOLUTA MEDIA PARA UNA SERIE ESTADSTICA
DE INTERVALOS.
La frmula que nos permite hacer los clculos correspondientes a la desviacin absoluta
media para una serie estadstica de intervalos es.
n
di fi
DAM
n
1 i

=
=
.

donde:

=
n
1 i
di fi.
es la sumatoria del valor absoluto, ( para asegurar que la sumatoria sea
positiva) del producto de las frecuencias por las desviaciones.
d
i
:
X Xm
i

(diferencia entre la marca de clase con respecto a la media).
n: nmero de casos

EJEMPLO.- Mediante la aplicacin de una encuesta se escogieron los siguientes datos,
que tienen relacin con la edad de un grupo de personas.
X f.
16-19 4
20-23 3
24-27 2
28-31 8
32-35 12
36-39 20
40-43 10
44-47 5
48-51 0
52-55 1


65

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

81
Hallar la desviacin absoluta media.

X f Xm
X Xm d
i
=

f.d
16-19 4 17.5 17.42 69.68
20-23 3 21.5 13.42 40.26
24-27 2 25.5 9.42 18.84
28-31 8 29.5 5.42 43.36
32-35 12 33.5 1.42 17.04
36-39 20 37.5 2.58 51.60
40-43 10 41.5 6.58 65.80
44-47 5 45.5 10.58 52.90
48-51 0 49.5 14.58 0
52-55 1 53.5 18.58 18.58


65 378.06
Donde:
aos 92 34 X , =
, luego la
82 5
65
06 378
DAM .
.
= =
aos, que es valor que indica con
cuanto se separan las edades de cada una de las personas con respecto a la edad media.

4.3.1.3. PROPIEDADES Y APLICACIONES
4.3.1.3.1 PROPIEDADES

1 La desviacin absoluta media constituye una buena medida de dispersin, porque el
nmero de casos no influye en el resultado
2 La desviacin absoluta media es la media aritmtica de las desviaciones.

4.3.1.3.2 APLICACIONES

1 Sirve cuando se requiere examinar la dispersin de la variable con respecto al
promedio
2 Cuando se requiere establecer con cuanto estn dispersos los valores de la variable
con respecto a otros valores muy grandes o muy pequeos.
3 El clculo de la DAM es muy utilizado en la determinacin de la desviacin
estndar, de las correlaciones y en las regresiones.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

82
4.3.2 LA VARIANZA

La varianza cuantifica el valor de la dispersin de la variable con respecto a la media. Por si
sola no brinda mucha ayuda al investigador pero es una herramienta muy importante para el
clculo de la desviacin estndar.

4.3.2.1 LA VARIANZA PARA UNA SERIE ESTADSTICA DE FRECUENCIA.
Cuando se considera una serie estadstica de frecuencia la varianza esta dada por la
siguiente frmula:
n
di fi
s
n
1 i
2
2
x

=
=
.

donde
2
di
:
( )
2
i
X X
(diferencia entre el valor de cada observacin con respecto a la
media, elevada al cuadrado).
n: nmero de casos

EJEMPLO.- Hallar la varianza el ejemplo utilizado en el clculo de la desviacin absoluta
media para una serie estadstica de frecuencias, que se refiere al peso de un grupo de
seoritas dados en Kg.
Construimos la tabla partiendo del ejemplo ya mencionado para no repetir los clculos.

X f X.f
X X d
i
=

d.
2
f.d
2
44 1 44 3.63 13.18 13.18
45 2 90 2.63 6.92 13.83
46 2 92 1.63 2.66 5.31
47 3 141 0.63 0.40 1.19
48 5 240 0.37 0.14 0.68
49 3 147 1.37 1.88 5.63
50 2 100 2.37 5.62 11.23
51 1 51 3.37 11.36 11.36


19 905 62.42

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

83
Luego la varianza ser
29 . 3
19
42 . 62
2
= =
x
s


4.3.2.2 LA VARIANZA PARA UNA SERIE ESTADSTICA DE INTERVALOS.
Cuando se considera una serie estadstica de intervalos la varianza esta dada por la
siguiente frmula:
n
di fi
s
n
1 i
2
2
x

=
=
.

donde
2
di
:
( )
2
i
X Xm
(diferencia entre el valor de la marca de clase o punto medio del
intervalo con respecto a la media, elevada al cuadrado).
n: nmero de casos

EJEMPLO.- Al igual que para el caso del clculo de la serie estadstica de frecuencia se
tomara el ejemplo que se empleo para la DAM para facilitar la determinacin de la
varianza y dar seguimiento al ejemplo planteado.

En la tabla se aumentaran los clculos necesarios para hallar la varianza quedando
establecida de la siguiente manera:

X f Xm
X Xm d
i
=

d.
2
f.d
2
16-19 4 17.5 17.42 303.46 1213.83
20-23 3 21.5 13.42 180.10 540.29
24-27 2 25.5 9.42 88.74 177.47
28-31 8 28.5 5.42 29.38 235.01
32-35 12 33.5 1.42 2.02 24.20
36-39 20 37.5 2.58 6.66 133.13
40-43 10 41.5 6.58 43.30 432.96
44-47 5 45.5 10.58 111.94 559.68
48-51 0 49.5 14.58 212.58 0
52-55 1 53.5 18.58 345.22 345.22


65 3661.79
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

84
Luego la varianza ser:
34 56
65
79 3661
s
2
x
.
.
= =
( en unidades al cuadrado lo que no ofrece
aplicabilidad alguna).

Esta medida no es muy aplicable como tal, sino que es de gran ayuda para el clculo de la
desviacin estndar.

4.3.2.3. PROPIEDADES Y APLICACIONES
4.3.2.3.1 PROPIEDADES

1 La varianza siempre es una cantidad positiva
2 La varianza siempre es mayor o igual que la desviacin absoluta media
3 Cuanto mayor es el grado de dispersin, mayor es el valor de las desviaciones de las
variables con respecto a la media aritmtica.

4.3.2.3.2 APLICACIONES
1 Su mayor utilidad se presenta en la estadstica inferencial
2 La varianza es una medida de dispersin que se utiliza con poca frecuencia ya que
ha sido sustituida con el uso de la desviacin estndar.

4.3.3 LA DESVIACIN ESTNDAR

Es la medida de dispersin ms fiable y se define como la raz cuadrada la media de los
cuadrados de las desviaciones , o lo que es mismo la raz cuadrada de la varianza .

4.3.3.1 LA DESVIACIN ESTNDAR PARA UNA SERIE ESTADSTICA DE
FRECUENCIA.
Para efecto del clculo de la desviacin estndar de una serie estadstica de frecuencia
haremos uso de la formula:
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

85
n
di fi
s
n
1 i
2
x

=
=
.

donde
2
di
:
( )
2
i
X X
(diferencia entre el valor de cada observacin con respecto a la
media, elevada al cuadrado), y ; n: nmero de casos.

EJEMPLO.- Hallar desviacin estndar para el ejemplo utilizado en el clculo de la
desviacin absoluta media para una serie estadstica de frecuencias, que se refiere al peso
de un grupo de seoritas dados en Kg.

Construimos la tabla partiendo del ejemplo ya mencionado para no repetir los clculos.

X f X.f
X X d
i
=

d.
2
f.d
2
44 1 44 3.63 13.18 13.18
45 2 90 2.63 6.92 13.83
46 2 92 1.63 2.66 5.31
47 3 141 0.63 0.40 1.19
48 5 240 0.37 0.14 0.68
49 3 147 1.37 1.88 5.63
50 2 100 2.37 5.62 11.23
51 1 51 3.37 11.36 11.36


19 905 62.42

Como varianza es
29 . 3
19
42 . 62
2
= =
x
s
(K.g
2
) para determinar la desviacin estndar bastar
con extraer la raz cuadrada de este valor en consecuencia se tiene
81 . 1 =
x
s
K.g

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

86
4.3.3.2 LA DESVIACIN ESTNDAR PARA UNA SERIE ESTADSTICA DE
INTERVALOS.
Para efecto del clculo de la desviacin estndar de una serie estadstica de intervalos
haremos uso de la formula:

n
di fi
s
n
1 i
2
x

=
=
.


donde
2
di
:
( )
2
i
X Xm
(diferencia entre la marca de clase con respecto a la media, elevada
al cuadrado), y ; n: nmero de casos.

EJEMPLO.- Al igual que para el caso del clculo de la serie estadstica de frecuencia se
tomara el ejemplo que se empleo para la DAM para facilitar la determinacin de la
desviacin estndar y dar seguimiento al ejemplo planteado.

X f Xm
X Xm d
i
=

d.
2
f.d
2
16-19 4 17.5 17.42 303.46 1213.83
20-23 3 21.5 13.42 180.10 540.29
24-27 2 25.5 9.42 88.74 177.47
28-31 8 28.5 5.42 29.38 235.01
32-35 12 33.5 1.42 2.02 24.20
36-39 20 37.5 2.58 6.66 133.13
40-43 10 41.5 6.58 43.30 432.96
44-47 5 45.5 10.58 111.94 559.68
48-51 0 49.5 14.58 212.58 0
52-55 1 53.5 18.58 345.22 345.22


65 3661.79
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

87
Como la varianza ser:
34 56
65
79 3661
s
2
x
.
.
= =
aos
2
( en unidades al cuadrado lo que no
ofrece aplicabilidad alguna).

Luego la desviacin estndar ser:
5 7 s
x
, =
aos

Nota.- Si las observaciones son tomadas de una muestra se deber sustituir n-1 por n

4.3.3.3. PROPIEDADES Y APLICACIONES

4.3.3.3.1 PROPIEDADES

4 El valor de la desviacin estndar esta dado en las mismas unidades que el conjunto
de datos de la variable.
5 El valor de la desviacin estndar se encuentra en relacin directa con la dispersin
de los datos.

4.3.3.3.2 APLICACIONES

1 La desviacin estndar es el promedio ms fiable y de uso ms frecuente en el
anlisis e interpretacin de una curva normal.
2 Es la medida de dispersin ms importante y tiene muchas aplicaciones en la
estadstica inductiva o inferencial.
3 La desviacin estndar, adems se utiliza en la determinacin de las irregularidades
de la curva normal asimetra y curtosis.

Dentro de las aplicaciones en casos prcticos de la desviacin estndar revisaremos dos de
ellas, que son consideradas de mucha utilidad en negocios y economa.


Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

88
4.3.3.3.2.1 TEOREMA DE CHEBYSHEV

El Teorema de Chebyshev fue formulado por el matemtico ruso P.L.Chebyshev (1821-
1894). Establece que para todo conjunto de datos, por lo menos (1 1/K
2
)% de las
observaciones estn dentro de K desviaciones estndar de la media, en donde K es
cualquier nmero mayor que 1.

As por ejemplo, si se forma un intervalo con K = 2 desviaciones estndar por encima de la
media, entonces por lo menos el
% * 75 100
2
1
1
2
= |
.
|

\
|

de todas las observaciones estarn
de dicho intervalo, de igual modo si se toma K = 3 desviaciones estndar por encima de la
media, entonces por lo menos el
% % . * 90 89 88 100
3
1
1
2
~ = |
.
|

\
|

de todas las
observaciones estarn de dicho intervalo.

Para aplicar este teorema tomaremos la informacin sobre el peso de un grupo de seoritas
y se desea saber en que rango de pesos estn el 75% ( K = 2) y el 90% ( K = 3) de todas las
informaciones se deber utilizar la desviacin estndar para encontrar tal detalle que lo
mostramos a continuacin.

Si K = 2 se obtiene que el 75% de las observaciones estarn en el intervalo formado de la
siguiente forma :
X
S 2 X
, luego si multiplicamos 2 por el valor de la desviacin estndar
calculado anteriormente se tiene 2*2.77= 5.54 resultando el intervalo :

( ) ( ) 77 53 09 42 54 5 63 47 54 5 63 47 . ; . . . ; . . = +
Kg. debido a que la media es 47.63 y la
desviacin estndar es 2.77.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

89
Si K = 3 se obtiene que el 90% de las observaciones estarn en el intervalo formado de la
siguiente forma :
X
S 3 X
, luego si multiplicamos 3 por el valor de la desviacin estndar
calculado anteriormente se tiene 3*2.77= 8.31 resultando el intervalo :
( ) ( ) 94 55 9.32 3 31 8 63 47 31 8 63 47 . ; . . ; . . = +
Kg. debido a que la media es 47.63 y la
desviacin estndar es 2.77.

4.3.3.3.2.2 LA DISTRIBUCIN NORMAL Y LA REGLA EMPRICA.

La desviacin estndar puede utilizarse para sacar ciertas conclusiones si el conjunto de
datos en cuestin est distribuido normalmente. El concepto de una distribucin normal se
encuentra usualmente en anlisis estadstico y es de importancia considerable. Una
discusin minuciosa de la distribucin normal se presenta en captulos posteriores. Sin
embargo, una introduccin a todo este concepto importante permitir demostrar un uso
prctico para la desviacin estndar, y establecer la base para una futura investigacin ms
completa. Una distribucin normal es una distribucin de datos continuos (no discretos)
que produce una curva simtrica en forma de campana, como la que muestra en la figura
4.1

Figura 4.1 Una distribucin normal



EJEMPLO.- Se asume que se tiene un nmero grande de observaciones para el tiempo, en
minutos, que le toma a los esquiadores terminar un trayecto en particular. Si los datos estn
distribuidos normalmente, una grfica de la frecuencia con la cual ocurre cada observacin
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

90
tomar la forma de la figura 4.1 Las observaciones en cada extremo ocurrirn relativamente
de forma poco frecuente, pero las observaciones que estn ms cerca de la mitad ocurrirn
con una frecuencia alta. por tanto se produce la curva simtrica en forma de campana. La
observacin modal, 10 en este caso es la que ocurre con la mayor frecuencia y por tanto
est en el pico de la distribucin. En una distribucin normal, la media, la mediana y la
moda son todas iguales.

Es de importancia que la mitad de las observaciones est por encima de la media y la mitad
est por debajo. Esto significa que la mitad del rea que est bajo la curva est a la
izquierda de la media y la otra mitad del rea que est debajo de la curva est a la derecha
de la media.
Para ilustrar cmo se aplica la desviacin estndar en la distribucin normal, se asume que
1.000 esquiadores de slalom bajan una pendiente empinada en Vail. Los tiempos para
todos los esquiadores parecen estar distribuidos normalmente, con una media de
10 X =
en
minutos y una desviacin estndar de
2 s
x
=
minutos. La regla emprica dice que si se
incluyen todas las observaciones que estn a una desviacin estndar de la media (una
desviacin estndar por encima de la media y una desviacin estndar por debajo de la
media) estas sern el 68.3% de todas las observaciones. Es decir, que no importa cul es la
media ni cul es la desviacin estndar, se puede citar seguro de que el 68.3% de las
observaciones quedan a una desviacin estndar de la media si las observaciones estn
distribuidas normalmente.

Debido a que el promedio de los esquiadores se toma 10 minutos para completar el
trayecto, mover una desviacin estndar (es decir. 2 minutos) por encima y por debajo de
esta media de 10 produce un rango de 8 a 12 minutos. As, de acuerdo con la regla
emprica, 683 (68.3% de 1,000) esquiadores se tomaron entre 8 y 12 minutos para bajar la
montaa.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

91
Claro que si se mueve ms de una desviacin estndar por encima y por debajo de la media,
se comprender un porcentaje ms grande de observaciones. La regla emprica especifica
que:
68.3% de las observaciones estn dentro de ms o menos una desviacin estndar de
la media
95.5% de las observaciones estn dentro de ms o menos dos desviaciones estndar
de la media,
99.7% de las observaciones estn dentro de ms o menos tres desviaciones estndar
de la media.

Dados los tiempos de los esquiadores, una desviacin estndar (2 minutos) por encima y
por debajo de la media de 10 da un rango de 8 a 12 minutos. Dos desviaciones estndar (4
minutos) por encima y por debajo de la media de 10 da un rango de 6 a 14 minutos. Tres
desviaciones estndar (6 minutos) da un rango de 4 a 16 minutos. Esto se muestra en la
figura 4.2


Figura 4.2 Tiempos distribuidos normalmente de los 1,000 esquiadores

De acuerdo con la regla emprica. 997 de los 1.000 esquiadores se tomaron entre 4 y 16
minutos para terminar el trayecto. As, slo 3 de los 1.000 esquiadores fueron o muy
buenos esquiadores y tomaron menos de 4 minutos o eran muy malos y se tomaron ms de
16 minutos. Una observacin de ms de tres desviaciones estndar de la media (por encima
o por debajo de sta) es raro que ocurra y se da menos de 1% del tiempo si los datos estn
distribuidos normalmente.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

92
Tambin es importante recordar que la regla emprica describe el rea total bajo la curva
normal que se encuentra dentro de un rango dado. No slo el 68.3% de todos los
esquiadores se loman entre 8 y 12 minutos para bajar de forma segura la montaa, sino que,
adems, el 68.3% de toda el rea que est bajo la curva normal est dentro del mismo rango
de 8 a 12 minutos.

Si las observaciones estn altamente dispersas, la curva en forma de campana se aplanar y
se esparcir. Se asume que un segundo grupo de esquiadores tambin hizo un promedio de
10 minutos, pero tuvo una desviacin estndar de 4 minutos. Los tiempos del segundo
grupo estn ms dispersos que los del primero. Los tiempos ms rpidos en esqu estaban
por debajo de 10, y los ms lentos estaban muy por encima de 10 comparados con los del
primer grupo. Esta dispersin mayor se reflejara en una curva de distribucin normal ms
extensa, tal y como se muestra en la figura 4.3

Figura 4.3 Dos distribuciones normales con medias iguales pero con desviaciones estndar
diferentes


Ambas distribuciones estn centradas en la media de
10 X =
minutos, pero la que tiene la
distribucin con mayor
4 s
x
=
minutos est ms dispersa que el conjunto de observaciones
con menos dispersin. Para abarcar el 68,3% de las observaciones en este grupo ms
disperso, es necesario incluir todas las que estn dentro del intervalo de 6 a 14.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

93
4.3.3.3.2.3. SESGO

No todas las distribuciones son normales. Algunas estn sesgadas a la izquierda o a la
derecha. En la figura 4.4 se encuentran las curvas de distribucin para el peso de las
personas. En la figura 4.4 a) se dice que la distribucin est sesgada a la derecha. Parecera
que las pocas personas ms pesadas que estn en el extremo superior en la escala de peso
(quiz algunos hombres ms grandes) halan la cola de la distribucin hacia la derecha. En
una segunda distribucin de pesos que se muestra en la figura 4.4 (b), unas cuantas mujeres
diminutas halan la distribucin haca el extremo interior, haciendo que se desve haca la
izquierda.




Figura 3.5 Distribucin sesgada del peso de las personas
(a) (b)
Moda Moda
En ambos casos, la moda es por definicin la observacin que ocurre con mayor frecuencia.
Por tanto, est en el pico de la distribucin. Sin embargo, como se dijo anteriormente, por
su sola naturaleza, la media se ve ms afectada por las observaciones extremas. Por tanto,
es halada en la direccin del sesgo, ms de lo que est la mediana, la cual est en algn sitio
entre la media y la moda.

El sesgo puede medirse mediante el coeficiente de sesgo de Pearson.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

94
Coeficiente de Pearson:
( )
x
s
mediana X 3
p

=

Si p < 0, los datos estn sesgados a la izquierda, si p > 0. entonces estn sesgados a la
derecha; si p = 0 estn distribuidos normalmente.
EJEMPLO.- Sesgo para los pasajeros de P&P

Utilizando los datos agrupados de la lista de pasajeros de P&P, se calcula
14 12 s 7 78 X
x
. , . = =
y la mediana = 78.33. Dada esta informacin, el director ejecutivo
de P&P puede ver claramente que los datos estn sesgados a la derecha, debido a que la
media excede a la mediana. Adems, tambin desea una medida del grado de sesgo.
Solucin: se tiene:
( )
03 0
14 12
33 78 7 78 3
p .
.
. .
=

=


Interpretacin:

Debido a que P > 0, los datos para P&P estn, como se presumi, sesgados a la derecha. El
grado hasta el cual estn sesgados se refleja en el valor del coeficiente de Pearson. Si se
fuera a hacer la grfica de los datos, apareceran como en la figura 4.4 (a).
4.3.3.3.2.4 COEFICIENTE DE VARIACIN

Como se ha enfatizado. un uso importante de la desviacin estndar es servir como medida
de dispersin. Sin embargo, se aplican ciertas limitaciones. Cuando se consideran dos o
ms distribuciones que tienen medias significativamente diferentes, o que estn medidas en
unidades distintas, es peligroso sacar conclusiones respecto a la dispersin slo con base en
la desviacin estndar. Es como violar el viejo adagio sobre la comparacin entre manzanas
y naranjas.
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

95

Por tanto, con frecuencia debemos considerar el Coeficiente de Variacin (CV), el cual
sirve como medida relativa de dispersin. El coeficiente de variacin determina el grado de
dispersin de un conjunto de datos relativo a su media. Se calcula dividiendo la desviacin
estndar de una distribucin por su media y multiplicando por 100.
Coeficiente de variacin:
) (100
X
s
CV
x
=


Los datos agrupados para P&P reportaron una media de 78.7 pasajeros por da, con una
desviacin estndar de 12.14 pasajeros. Se supone que P&P tambin recolecta datos sobre
el mismo periodo para el nmero de millas que la aerolnea vol y dicha media y
desviacin estndar ha probado ser de 1.267.5 y 152.7. respectivamente. La desviacin
estndar ms alta para las millas voladas puede sugerir que estos datos presentan una
variacin .mucho mayor.

Sin embargo, si se calcula el coeficiente de variacin para pasajeros, se encuentra que es
( ) 43 15 100
70 78
14 12
CV .
.
.
= =

mientras que para las millas es solamente
( ) 05 12 100
5 1267
7 152
CV .
.
.
= =

Es claro que al comparar la variacin en dos conjuntos de datos muy diferentes, es sabio
utilizar el coeficiente de variacin y no slo la desviacin estndar.

ACTIVIDADES RECOMENDADAS

1.- Los precios de las acciones estn cotizados en octavos de dlar de manera que por
ejemplo, 5 1/8 es $5.125; 5 es $5.25; 5 3/8 es $5.375 y as sucesivamente hasta 5 7/8
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

96
que es $ 5.875. a continuacin se da una muestra de siete precios de cierre de las acciones
tomadas de The Wall Street Journal de octubre 8 de 1997.

Walt Mart 27 3/8
Disney 42 5/8
Mobil 69 7/8
General Motors 29 1/2
General Mills 69 7/8
Toys R. Us 38 5/8
Dow Jones 29 1/4

a) Calcule la media, la mediana, y la moda. Interprete cada estadstico.
b) Qu le dice cada una? Por qu son diferentes si todas son promedios?
c) Calcule e interprete la varianza y la desviacin estndar.

2.- The Snowflake comercializa botas para esquiar en San Luis Obispo. California. De los
ltimos 100 pares vendidos 4 eran talla 9,33 talla 91/2, 26 talla 10, 29 talla 101/2 y 8 eran
talla 13. Haga comentarios sobre el uso de la media, la mediana y la moda como medidas
de tendencia central y el uso de cada una en la toma de decisiones sobre los tamaos que se
deben tener en inventario. Calcule cada medida.

3.- Debido a que las tasas de inters cayeron a comienzos de 1997, se encontr que una
muestra d-las tasas hipotecarias para hipotecas a 15 anos de las instituciones de crdito en
Peora. Illinois era
7.1%, 7.3%, 7.0%, 6.9%, 6.6%, 6.9%, 6.5%, 7.3%, 6.85%
a) Calcule e interprete la media, la mediana y la moda.
b) Estos datos estn sesgados a la izquierda, a la derecha, o estn distribuidos
normalmente? Calcule el coeficiente de Pearson como medida de sesgo.
c) Calcule e interprete la varianza y la desviacin estndar.

4.- Una encuesta de instituciones de crdito en un centro urbano cerca de Peora (ver
problema anterior) revel tasas de crdito hipotecario de
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

97
7.1%, 7.3%, 6.3%, 6.7%, 6.8%, 6.85%. 7.5%
a. Las tasas de crdito hipotecario son ms altas en Peora o en otros centros urbanos?
b. Cual ciudad parece tener las tasas de inters mas consistentes entre las instituciones?

5.- The Noah Fence Company vende cuatro tipos de cercas a los barrios residenciales de las
afueras de la ciudad. El grado A le cuesta a Noah $5.00 por pie lineal de instalacin, el
grado B cuesta $3.50, el grado C cuesta $2.50 y el grado D cuesta $2.00. Ayer Noah instal
100 yardas del grado A, 150 del grado B, 75 yardas del grado C y 200 yardas del grado D.
Cual fue el costo promedio de instalacin por pie lineal?
La campaa publicitaria logr su meta de suavizar las ventas semanales? .

6.- Bill Kari compr 20 acciones a $15 cada una, 50 acciones a $20 cada una, 100 acciones
a $30 cada una y 75 acciones a $35 cada una.
a) Cul es el monto tolal de su inversin?
b) Cual es el precio promedio por accin?

7.- . Las edades de cincuenta de los directores ejecutivos de las mejores corporaciones de la
nacin reportadas en la edicin de la revista Forbes de la edicin del 24 de mayo de 1997
aparecen en la siguiente tabla de frecuencias.
a) Calcule e interprete la media, la mediana y la moda.
b) Calcule e interprete la varianza y la desviacin estndar.

EDADES FRECUENCIA
50 - 55 8
55 60 13
60 - 65 15
65 - 70 10
70 - 75 3
75 - 80 1

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

98
8.- La misma edicin de la revista Forbes (que se vio en el problema anterior) tambin
proporcion datos sobre los salarios en miles de dlares. Result la siguiente tabla de
frecuencias:

SALARIO (en miles de dlares) FRECUENCIA
90 - 440 9
440 790 11
790 1140 10
1149 1490 8
1490 1840 4
1840-2190 3
2190 - 2540 5
a) Calcule la media, la mediana y la moda. Interprete sus respuestas.
b) Los salarios estn tan dispersos como las edades del problema anterior?

9.- Los siguientes datos de muestras se han obtenido para el nmero de clientes diarios en
Rosies Flower Shoppe:
34, 45, 23, 34, 26, 32, 31, 41
Calcule la varianza, la desviacin estndar.

10.- La siguiente es una muestra de las ganancias por accin en dlares, para las acciones
cotizadas en la Bolsa de Valores de Nueva York:
1.12, 1.43, 2.17, 1.19, 2.87 y 1.49
Calcule la varianza, la desviacin estndar
11.- Las horas trabajadas por Ronnie cada semana durante los ltimos dos meses son
52 48 37 54 48 15 42 12 Asumiendo que estos son datos mustrales, calcule:
a) La media
b) La mediana
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

99
c) La moda
d) Cul es probablemente una mejor medida para el punto central?
12.- Utilizando las horas de trabajo de Ronnie del problema anterior, calcule e interprete:
a) El rango
b) La varianza
c) La desviacin estndar

AUTOEVALUACION

1.- Quienes ponen los discos en KAYS claman que ponen ms canciones cada hora que sus
rivales de la KROC del otro pueblo. Durante las ltimas 24 horas se recolectaron y
tabularon los datos sobre el nmero de canciones puestas por ambas estaciones. Utilice los
datos para preparar un reporte que compare las dos estaciones. Su reporte terminado debe
presentarse a la Comisin Federal de Comunicaciones, y debe contener referencias respecto
a las medidas de tendencia central y de dispersin.

Nmero de canciones por hora KAYS KROC
5 - 11 2 4
11 17 4 5
17 23 6 7
23 29 8 5
29 35 2 2
35-41 2 1

2.-The Walt Sireet Joumal describi una disputa entre la gerencia y el sindicato de trabajo
local respecto a la eficiencia y productividad de los trabajadores. La gerencia argumentaba
que a los empleados les tomaba ms de 20 minutos terminar cieno trabajo. Si se mide el
tiempo de 85 empleados, arrojando los resultados tabulados, con base en esta muestra, la
gerencia est en lo correcto? Calcule las tres medidas de tendencia central.

Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

100
CLASE
(nmero de minutos)
FRECUENCIA
(nmero de empleados
5 7 2
7 9 8
9 - 11 10
11 - 13 15
13 15 17
15 17 14
17 19 7
19 21 9
21- 23 3

3.- En el ejercicio anterior, la gerencia tambin se encuentra preocupada porque el
desempeo de los empleados es demasiado errtico; no existe mucha variacin en la
cantidad de tiempo que toma a los trabajadores completar un trabajo. Identifique y calcule
el estadstico apropiado de acuerdo con la preocupacin de la gerencia.

4.- Dados los siguientes puntajes de 9 pruebas para la clase de economa del profesor
Pundit, calcule el coeficiente de sesgo de Pearson. Asuma que estos son datos mustrales.
80 83 87 85 90 86 84 82 88

5.- Aqu se muestran las relaciones precio-ganancia para 30 acciones diferentes transadas
en la Bolsa de Valores de Nueva York (New York Stock Exchange - NYSE)
4.8 5.2 7.6 5.7 6.2 6.6 7.5 8.0 9.0 7.7 3.7 7.3
6.7 7.7 8.2 9.2 8.3 7.3 8.2 6.5 5.4 9.1 10.0 7.3
8.2 9.7 8.4 4.7 7.4 8.3
a) Calcule la media y la desviacin estndar.
b) De acuerdo con el teorema de Chebyshev por lo menos cuantas relaciones precio-
ganancia estn dentro de dos desviaciones estndar de la media?
c) Cuntas estn realmente a dos desviaciones estndar de la media?
Estadstica Gerencial




T utor: D ra. Lourdes Ziga L.

101

6. La mecnica local en Vinneys Auto Shop y Chann School le dice que las reparaciones
de su carro le costarn $714.12. Los datos de la industria muestran que la cuenta promedio
por reparaciones parecidas a las suyas es de $615, con una desviacin estndar de $31.
Qu puede concluir sobre las tasas de Vinneys si usted asume que las reparaciones estn
distribuidas normalmente?