Documente Academic
Documente Profesional
Documente Cultură
ESTADISTICA
DEFINICIÓN.
Estadística es el arte o ciencia de coleccionar reunir y analizar información procedente de una
población para inferir a partir de ella en una serie de conclusiones, las cuales son válidas para la
población de la cual se extrajo la información..
Para su estudio la Estadística se divide en dos áreas:
• ESTADÍSTICA DESCRIPTIVA.
• ESTADÍSTICA INFERENCIAL.
ESTADÍSTICA DESCRIPTIVA:
Tiene como objetivo, el procesamiento de información obtenida de una muestra o de toda una
población con el objeto de definir características de los valores analizados (parámetros poblacionales
o muestrales), o representar la información contenida en esos datos a través de gráficos.
Para facilitar el procesamiento de la información contenida en un conjunto de datos es común
agruparlos en lo que se denomina Distribución de Frecuencias.
DISTRIBUCIÓN DE FRECUENCIAS.
Es una disposición de los datos que muestra cuántos elementos o que parte de los datos
entran en diferentes intervalos o categorías en los cuales son agrupados los datos.
Construcción:
1. La elección del número de clases o intervalos.
2. La identificación o ubicación del número de datos en cada clase o intervalo.
3. Cuantificar el número de datos en cada clase o intervalo.
4. La presentación de la información en una tabla o diagrama.
Reglas:
1. El número de intervalos en los que se dividen los datos, entonces es función del número de
datos que se van a agrupar.
2. Cada elemento (registro u observación) debe quedar en una y sola una clase.
3. Con el objeto de facilitar su posterior procesamiento es conveniente es necesario que las
clases cubran escalas o intervalos iguales de valores.
PROCESAMIENTO DE DATOS
Rango = valor máximo - valor mínimo.
Intervalos de clase: Consiste en agrupar los datos en rangos con un límite
inferior y un límite superior cada intervalo o clase.
Marca de clase ( mi ): Valor representativo de cada clase ó intervalo resulta
del promedio entre el límite inferior y superior de cada intervalo o clase.
_____ Cuaderno de trabajo de la materia de Estadística Aplicada 1
_____ Pag.
MAESTRIA EN INGENIERIA ADMINISTRATIVA
TEMA: MUESTREO
________________________________________Catedrático: Fernando Fernández Rodiles
Tamaño de clase ( W ): Diferencia entre el límite superior e inferior de cada
clase o intervalo.
REGLA DE STURGES:
Si k es el número de intervalos en los que se dividen los datos, entonces k es función de n el número
de intervalos:
Teniendo k una magnitud: ………….. 5 ≤ k ≤ 15.
Cumpliendo siguiente relación:
x x
1 2
2 ≤n≤ 2
donde:
x1: es la potencia a la cual elevado el # 2 se acerca en su mínima
diferencia pero sin sobrepasar el valor de n.
Problema 1.
El registro de la estatura expresada en metros de una muestra seleccionada aleatoriamente
de 154 estudiantes de una Institución Educativa se presenta en la siguiente tabla:
1 2 3 4 5 6 7 8 9 10
1 1.62 1.75 1.54 1.71 1.71 1.70 1.67 1.57 1.61 1.81
2 1.76 1.64 1.62 1.66 1.73 1.75 1.65 1.69 1.68 1.64
3 1.75 1.70 1.72 1.76 1.85 1.79 1.80 1.84 1.57 1.64
4 1.66 1.71 1.72 1.60 1.65 1.69 1.59 1.60 1.70 1.56
5 1.75 1.65 1.69 1.68 1.59 1.58 1.68 1.73 1.62 1.76
6 1.70 1.69 1.72 1.68 1.62 1.57 1.59 1.60 1.73 1.75
7 1.55 1.63 1.70 1.64 1.57 1.65 1.72 1.85 1.70 1.75
8 1.74 1.75 1.62 1.71 1.71 1.78 1.56 1.57 1.65 1.82
9 1.67 1.71 1.72 1.61 1.58 1.68 1.73 1.60 1.70 1.58
10 1.54 1.70 1.75 1.64 1.59 1.67 1.69 1.66 1.70 1.85
11 1.62 1.63 1.72 1.81 1.85 1.77 1.80 1.84 1.57 1.58
12 1.76 1.79 1.62 1.71 1.76 1.72 1.68 1.63 1.69 1.80
13 1.72 1.68 1.63 1.57 1.77 1.82 1.69 1.79 1.74 1.84
15 1.74 1.80 1.84 1.67 1.63 1.79 1.80 1.84 1.57 1.58
1. El cuadro de frecuencias
2. La media, mediana y moda (ó modo).
3. La varianza y desviación estándar.
4. Los fractiles: Q3, D4, P20 .
Problema 2.
Los datos presentados en la tabla, relacionan una muestra seleccionada
aleatoriamente del registro de ventas diarias expresadas en miles de litros de
gasolina en una estación de servicio ubicada en la ciudad de Orizaba, Veracruz:
Problema 3.
Con el objeto de estimar la capacidad de producción de una empresa textil fue
seleccionada aleatoriamente una muestra de los registros de producción por turno.
Los datos presentados en la tabla, relacionan el total de metros de tela producidos por
un turno de 8 horas.
_____ Cuaderno de trabajo de la materia de Estadística Aplicada 4
_____ Pag.
MAESTRIA EN INGENIERIA ADMINISTRATIVA
TEMA: MUESTREO
________________________________________Catedrático: Fernando Fernández Rodiles
Producción Número de
(miles de metros) turnos Determine:
1.61 - 53 1. La media, mediana y moda ( ó modo).
1.64 - 58 2. La varianza y desviación estándar.
1.67 - 80 3. Calcule e interprete los siguientes Fractiles: Q1,
1.70 - 42 D7, P40 .
1.73 - 34
1.76 - 23
1.79 - 7
1.82 - 3
Introducción.
Si la Estadística solo tuviera como objetivo la determinación y la representación gráfica de las
características de un conjunto de datos (describirlos); tal vez no tendría el carácter de ciencia. Este
hecho requiere; de la persona que realiza este análisis un mínimo nivel de conocimientos.
El principal objetivo de la Estadística con lo cual actualmente toma una importancia relevante,
es el de hacer inferencias acerca de una población a partir de una muestra; es decir hacer válido el
resultado del análisis de un conjunto de elementos extraídos de una población (denominado muestra)
para la población de la cual se obtuvo.
Entendiendo por población a la colección de toda la posible información que caracteriza un
fenómeno. Concibiendo por población, un concepto mucho más general del que tiene el significado
común esta palabra, no necesariamente implica que está constituida por personas. En este sentido
una población es cualquier colección ya sea de un número finito de mediciones o una colección
grande, virtualmente infinita de datos acerca de algo de interés.
Estadísticamente hablando de una población interesa conocer determinadas características
de ella, las cuales se presentan en diferentes magnitudes en forma de valores; dichas características
denominadas parámetros se pueden describir matemáticamente. Para llegar a conocer su valor, se
puede proceder de dos formas. Mediante: El Censo y El Muestreo.
• Si para definir al candidato ganador en unas elecciones para ocupar un puesto a nivel nacional, la
muestra se obtuviera de una determinada ciudad o estado del país.
• Si para obtener el índice de desempleo en un estado, la muestra se obtuviera de la población de
una ciudad industrial del mismo.
• Por último, si para aceptar o rechazar el embarque relacionado con un pedido de 200 rollos de tela
de 150 mts. c/u. El encargado o responsable tomará la decisión del resultado de la inspección
efectuada a los rollos de tela seleccionados de aquellos de más fácil accesibilidad.
La respuesta a cada uno de los ejemplos sería la misma:
¡ Ninguna validez…. Ninguna confianza ….. Ninguna certeza !
Pero, la pregunta o preguntas ahora serían………
¿Cuándo es o no válida una muestra?
¿Cuándo es o no confiable una muestra?
¿Cuándo es o no certera una muestra?
De igual manera, podría existir una sola respuesta a cualquiera de estos tres
_____ Cuaderno de trabajo de la materia de Estadística Aplicada 6
_____ Pag.
MAESTRIA EN INGENIERIA ADMINISTRATIVA
TEMA: MUESTREO
________________________________________Catedrático: Fernando Fernández Rodiles
cuestionamientos:
Tiene validez, es confiable o certero el resultado, cuando la muestra esta compuesta por
elementos que representen las características de la población.
TIPOS DE MUESTREO
Hay dos maneras de seleccionar elementos de una población para conformar una muestra:
• Muestreo no aleatorio o a juicio.
• Muestreo aleatorio o probabilístico.
MUESTREO NO ALEATORIO O A JUICIO.
Está basado en el siguiente criterio:
“No todas las muestras tienen un interés de generalización, pudiendo tener un interés de tipo
analítico"
Debido a ello, las muestras son seleccionadas de manera tal que contengan el tipo de
elementos sobre los cuales hacen referencia las proposiciones de la hipótesis que está siendo
sometida a prueba. El muestreo a juicio, también llamado no probabilístico o no aleatorio, se
realiza, teniendo conocimiento de las características de los elementos de la población; situación que
se toma en cuenta al momento de seleccionar los elementos que pasarán a formar parte de la
muestra en la realización del estudio. Ejemplo.
Una ama de casa que acude al súper a comprar manzanas; seleccionará para compra solo aquellas
manzanas que cubren las características para el fin que persigue en su utilización; aquellas que son
las “mejores”. Y puede ser, que para una ama de casa diferente, seleccionará manzanas con otras
características, pero para ella serán las “mejores”.
• El entrenador de la selección nacional de fútbol, seleccionará solo los “mejores” jugadores. Que
serán aquellos jugadores que piense les serán aptos para el sistema que desea implantar.
Por lo expuesto anteriormente, la selección de los elementos que constituyen la muestra se realiza
en base al criterio o juicio del investigador. Estos no se seleccionan por procedimientos al azar sino en
base al conocimiento o interés que el investigador muestre sobre un determinado elemento, lo que
genera que no todos los elementos que forman parte de la población que se está analizando tienen
probabilidad de ser seleccionados. En lo general estos métodos no probabilísticos carecen de validez
científica, además que no tienen una base teórica para calcular la escala de error ni la
representatividad de la muestra, dado que los elementos seleccionados solo representan las
características de la persona que los elige.
De lo visto, puede decirse que son dos las principales características de los elementos
seleccionados de esta manera.
1. Los elementos de la muestra obtenida no representan las características de los elementos
que componen la población.
2. No todos los elementos que componen la población tienen la misma oportunidad de ser
elegir a los elementos con los cuales formarán la muestra. En este tipo de muestreo, el elemento
seleccionado cubre determinadas características las cuales son definidas a juicio del entrevistador.
Este tipo de muestreo es empleado en las llamadas " encuestas de opinión ", donde las
personas que se toman en cuenta para la muestra deben de cubrir determinadas características con el
tema tratado.
MUESTREO DE CUOTA.
Se realiza una clasificación de la población en estudio en función al objetivo del estudio y se
utilizan estas categorías previamente fijadas para obtener un número predeterminado de elementos
de cada categoría. Son muestras casi estratificadas y so utilizadas por las agencias de investigación
de mercados. El procedimiento de esta técnica consiste en fijar un número de individuos por
entrevistar y dejar totalmente al entrevistador ( profesional o no ), su localización. El sesgo que
introduce el entrevistador, al seleccionar únicamente elementos que de acuerdo a su interés o
facilidad determine que serán parte de la muestra. Es una de las desventajas más importantes que
tiene este tipo de muestreo.
MUESTREO BASADO EN EXPERTOS.
Los elementos se eligen con base en la opinión de personas con autoridad y suficientemente
informadas acerca de la población bajo estudio. Los elementos que formarán la muestra serán
resultado de la de la experiencia o conocimiento del comportamiento de la población analizada.
Por ejemplo en una investigación sobre la problemática de la educación en el bachillerato. Al
entrevistar a los directores de escuelas de este nivel; la muestra estará formada por aquellos
dirigentes de las instituciones que se consideren más apropiadas al problema planteado.
MUESTRAS CASUALES.
Este método consiste en investigar a cualquier grupo de personas que son de fácil acceso o
que acuden a un lugar determinado. Son las muestras más utilizadas por los reporteros de los medios
de comunicación ( prensa, radio, televisión ), así como de algunas agencias que realizan estudios de
mercadeo de opinión. La técnica consiste en entrevistar a los individuos en forma casual, por ejemplo
a uno de cada cinco individuos que pasen por la calle.
MUESTREO ESTRATIFICADO.
Es empleado este tipo de muestreo cuando la naturaleza de la población y el objetivo del
estudio lo permiten. Consiste en formar grupos (estratos) con elementos que presentan pequeñas
diferencias entre sí; pero una diferencia significativa entre grupos o estratos.
Procedimiento
1. Definir de una manera clara y detallada la manera en que se formarán los estratos (elementos
MUESTREO SISTEMATICO.
En el muestreo sistemático, los elementos se seleccionan de la población a un intervalo
uniforme que es medido en tiempo, orden o espacio.
Procedimiento
1. Se define la magnitud "k de elementos" del intervalo, la cual se obtiene al dividir el total de
elementos de la población entre el número de elementos que constituirán la muestra.
2. Se elige aleatoriamente un elemento dentro de los primeros "k" elementos que constituyen el
primer intervalo formado dentro del marco muestral y posteriormente se selecciona en forma
sucesiva el "k-ésimo " elemento que sigue al último que se obtuvo.
Ventajas del muestreo sistemático.
Es especialmente útil en auditorias, cuando la información relevante se registra en forma
ordenada; por ejemplo en computadora o en un archivo de tarjetas. La selección de cuentas de
crédito, registro de mantenimiento de equipo o datos de ventas de los registros de la compañía.
Desventajas del muestreo sistemático.
Hay situaciones en las que no debe emplearse. Por ejemplo, cuando existe una periodicidad
en el comportamiento de la población; en este caso el muestreo sistemático puede causar un sesgo,
al introducir el error de muestreo que resulta de la influencia periódica.
Frecuentemente los registros de ventas y los datos financieros que se observan en el tiempo,
tienen un comportamiento cíclico: las ventas en los restaurantes son mayores durante el fin de
semana que durante el resto de los días, los niveles de dinero en efectivo son más altos alrededor de
los días 15 y 30 de cada mes, los prestamos personales son más frecuentes en los meses de invierno.
Problema 1.
La siguiente es una muestra del salario mensual obtenido por el personal de una empresa
ubicada en el norte del país. El monto del salario esta en función al puesto y funciones que
tiene el personal. Los valores están expresados en miles de pesos. Estime el salario
promedio de todo el personal. Seleccionando una muestra aleatoria de 20 elementos;
aplicando el muestreo:
1. ALEATORIO SIMPLE. 2. POR CONGLOMERADOS.
3. ESTRATIFICADO. 4. SISTEMATICO
1 2 3 4 5 6 7 8 9 10
NIVEL: GERENTES
1 32.6 31.8 29.7 26.8 26.9 32.8 31.9 29.5 29.5 33.1
2 33.0 31.7 33.5 28.5 29.8 29.9 27.8 32.6 31.6 29.7
NIVEL: JEFES DE DEPARTAMENTO
3 19.7 16.8 16.9 12.8 11.9 11.6 19.8 12.1 19.5 18.7
4 18.3 15.5 18.8 17.9 17.8 16.4 19.3 18.0 17.9 15.5
5 16.9 17.7 19.9 20.0 15.9 18.6 19.9 13.0 15.7 17.6
NIVEL: PERSONAL DE OFICINAS
6 1.3 1.5 1.9 2.0 1.9 1.8 1.4 1.8 1.4 2.0
7 1.8 1.9 2.0 1.9 2.0 2.3 2.5 1.9 2.0 1.9
8 1.6 1.9 2.0 1.9 1.8 2.4 1.9 2.0 2.3 2.5
NIVEL: SUPERVISORES
9 7.3 7.5 7.9 7.0 7.9 7.8 7.4 7.8 7.4 7.5
10 7.8 7.9 7.6 7.9 7.5 7.3 7.5 7.9 7.3 7.9
11 7.6 7.9 7.3 7.9 7.8 7.4 7.9 7.4 7.8 7.5
12 7.9 7.8 7.4 7.8 7.9 7.6 7.9 7.5 7.9 7.3
NIVEL: PERSONAL SINDICALIZADO
13 5.9 4.5 6.7 4.8 6.3 4.1 4.9 5.5 5.5 6.7
14 4.5 6.3 6.3 5.4 6.4 6.9 5.6 7.3 6.9 4.0
15 5.3 5.9 4.5 6.7 4.8 4.1 4.9 5.5 4.9 7.0
16 4.6 6.6 6.2 5.8 6.2 6.5 5.4 7.6 6.0 4.1
_____ Cuaderno de trabajo de la materia de Estadística Aplicada 12
_____ Pag.
MAESTRIA EN INGENIERIA ADMINISTRATIVA
TEMA: MUESTREO
________________________________________Catedrático: Fernando Fernández Rodiles
17 5.3 5.9 4.5 6.7 4.8 4.1 4.9 6.3 5.4 6.4
18 4.5 6.7 4.8 4.1 4.9 5.9 4.5 6.7 4.8 4.1
19 5.3 5.9 4.5 6.7 4.8 6.3 6.3 5.4 6.4 6.9
20 5.9 4.5 6.7 4.8 4.1 4.9 5.5 5.5 6.7 4.8
21 5.3 5.9 4.5 4.1 4.9 5.9 4.5 6.7 4.8 4.5
22 4.6 6.6 6.2 5.8 6.2 6.5 5.4 7.6 6.0 4.1
23 5.3 5.9 4.5 4.1 4.9 4.5 6.3 6.7 4.8 4.1
24 4.5 6.3 6.3 5.4 4.8 4.1 4.9 5.9 6.7 4.8
25 4.6 6.6 6.2 5.8 6.2 6.5 5.4 4.5 6.3 6.7
26 4.5 6.3 6.3 5.4 4.8 4.1 4.9 5.9 6.7 4.8
27 5.8 6.2 6.5 5.4 6.2 5.8 6.2 6.5 5.4 7.6
28 6.6 6.2 5.8 6.2 6.5 4.8 4.1 4.9 5.5 5.5
29 5.4 6.4 6.9 5.6 7.3 6.2 6.5 5.4 7.6 6.0
30 4.6 6.6 6.2 5.8 6.2 6.5 5.4 7.6 6.0 4.1
31 5.8 5.5 4.5 6.7 4.8 4.1 4.9 6.3 5.4 6.4
32 5.5 5.9 4.8 6.2 4.1 4.4 4.2 5.3 5.0 6.1
33 4.5 6.7 4.5 6.7 4.8 4.1 4.9 5.4 6.4 6.9
34 4.5 6.3 6.3 6.9 5.5
CUESTIONARIO
1. ¿ Cual es el objetivo del muestreo ?.
2. ¿ Cual es la relación del muestreo con la Estadística ?
3. ¿Cuándo es más conveniente el muestreo con respecto al censo ?
4. ¿ Que significado tiene denominar a una muestra como muestra aleatoria ?
5. ¿ Cuales de los siguientes ejemplos están relacionados con muestras aleatorias y cuales no ?.
Explique en cada caso.
a. Preguntas que de parte de la Gerencia de una tienda se aplican a cada décimo cliente
respecto a las ofertas que se realizan.
b. Selección de árboles de un aserradero para ser convertidos en madera.
c. Selección de “n” alumnos por el Director de una Escuela, para representar en un
concurso de conocimientos.
d. Integrar a la Selección de fútbol para representar a México en la próxima Copa del Mundo
2006 a celebrarse en Alemania.
e. Control del contenido en peso de las cajas de una fabrica de galletas.
Ejemplos:
Objetivo: Estimar el tiempo promedio en realizar el maquinado de una pieza.
FACTORES.
1. El número de operarios que realiza esta operación.
2. Las máquinas utilizadas para la realización de esta operación.
3. Los tipos de herramienta de corte empleados para el maquinado de esta pieza.
4. Las jornadas de trabajo.
5. El tiempo durante la jornada en que serán tomadas las lecturas.
DISTRIBUCIÓN NORMAL
Es la distribución de probabilidad más importante en Estadística. Denominada también Distribución
Gaussiana, en honor de Karl Friedrich Gauss quién derivó su ecuación. Su gráfica que es una curva en
forma de campana se, le denomina curva normal.
0.5 0.5
Media
Mediana
Su ecuación viene dada por: Moda
1 x −µ 2
−
1 2 σ Para - α < x < α
n ( x; µ; σ ) = e
2σ π
Características:
1. La curva es simétrica con respecto a su eje vertical el cual incide en la parte central.
2. La Media, Mediana y Moda inciden en un mismo punto. En la parte central de la curva donde
presenta su altura máxima.
3. La curva normal se acerca asintóticamente a su eje horizontal en ambos extremos a partir de la
media.
4. El área que se genera bajo la curva y sobre el eje horizontal es igual a 1.
Ejercicio I.
1. p ( z < 1.01 ) 6. p ( -1.04 < z < 0.09) 11. p ( - 0.50 > z > 0.50 )
2. p ( z > -1.23 ) 7. p (-0.82 < z < 1.87) 12. p ( - 1.66 > z > -0.05 )
3. p ( z > -2.10 ) 8. p (-2.19 < z < -0.07) 13. p ( - 0.30 > z > 0.30 )
4. p ( z < - 1.32 ) 9. p (- 1.45 < z < 1.05 ) 14. p ( 1. 00 > z > 1.00 )
5. p ( z > -3.59 ) 10. p (- 3.59 < z < 3.59) 15. p ( - 5.25 > z > 4.75 )
Ejercicio II.
Ejercicio III.
X1 X2
CONDICIONES
NO ESTANDARIZADAS Z1 ESTANDARIZADAS
Z2
µ ≠0 MEDIA µ =0
σ ≠1 DESV. EST. σ =1
X VARIABLE Z
CONVERSIÓN DE VALORES
Valores X a Valores Z
x −µ
Z =
σ
Valores Z Valores X
X=µ +σ Z
TEOREMA DE CHEYBSHEV
Proporciona la estimación de la probabilidad de que una variable aleatoria asuma un valor dentro
de k desviaciones estándar de su media para cualquier valor de k.
La probabilidad de que una variable aleatoria que cuyo valor se distribuye normalmente, asuma
un valor dentro de k desviaciones estándar de la media es al menos de: 1 – 1 / k2. Esto es:
Problema 1.
El tiempo utilizado en el ensamble de un dispositivo en una empresa electrónica se distribuye
normalmente con una media de 30.5 minutos y una desviación estándar de 9.3 minutos.
Tomando como referencia estos datos determine la probabilidad que el ensamble de un
dispositivo se realice en:
1. Al menos 28 minutos.
2. Máximo 35 minutos.
3. Entre 25 y 35 minutos.
4. Al menos 25 pero cuando más 33 minutos.
5. Mínimo 38 pero máximo 37.5 minutos.
6. Cuando más 32.5 pero al menos 35.3 minutos.
7. No más de 38.5 minutos pero al menos 40.5 minutos.
8. ¿ En mínimo que tiempo se ensamblará el 70% de los dispositivos ?.
9. ¿ En máximo que tiempo se ensamblará el 85% de los dispositivos ?.
10. Para determinar la capacidad de producción de la línea el tiempo estimado tomado en cuenta
para el ensamble del dispositivo es de 42 minutos. ¿ Que porcentaje de dispositivos
ensamblados quedará fuera de este tiempo ?.
11. De 500 dispositivos ensamblados ¿ Cuántos de ellos se ensamblarán en al menos 25.5 pero
cuando más 35.5 minutos ?.
Problema 2.
Uno de los controles realizados al final de la línea de envasado, de una fábrica embotelladora de
refresco está relacionado con su llenado. Un volumen de refresco que supere el límite superior del rango
establecido para las condiciones de operación de la máquina ( ± 10 mililitros ) representa perdidas para
la empresa, así mismo un volumen de refresco abajo del límite inferior podría propiciar multas a la
compañía. Si la máquina está regulada para verter un volumen de refresco que se distribuye
normalmente con una media de 250 mililitros y una desviación estándar de 11 mililitros. Determine:
1. El porcentaje de botellas con un contenido mínimo de 248 mililitros.
2. Que porcentaje de botellas serán llenadas con menor contenido al establecido por las condiciones de
operación de la máquina.
3. La fracción de botellas con un contenido máximo de 252 mililitros.
4. El porcentaje de botellas con un contenido máximo de 245 pero de al menos 265 mils.
5. Que cantidad de refresco tendrán como mínimo el 75% de las botellas ?.
6. Que cantidad de refresco tendrán cuando mas el 85% de las botellas ?.
7. Que porcentaje de botellas queda fuera del margen establecido ?.
8. De cada 1000 botellas llenadas, cuantas de ellas serán llenadas con mayor contenido al establecido
por las condiciones de operación de la máquina.
9. De cada 1500 botellas llenadas, cuantas de ellas serán llenadas dentro del rango establecido para
las condiciones de operación de la máquina.
10. La fracción de botellas con un contenido mínimo de 245 mililitros pero máximo de 260 mililitros de
refresco.
Problema 3.
El consumo promedio diario de combustible utilizado en una caldera que suministra vapor al
Departamento de Engomado de una empresa textil es de 1 975 lts. diarios con una desviación
estándar de 325 lts. En función a esta información determine. El porcentaje de días en que se
consumen:
1. Un mínimo de 1 500 lts.
2. Cunado más 1 650 lts.
3. Entre 1 800 y 2 000 lts diarios.
4. No más de 1550 pero al menos 1 850 lts.
5. Máximo 1 750 lts. pero mínimo 1 900 lts.
6. ¿ Cual será el consumo mínimo de combustible en el 65 % de los días ?.
7. ¿ Cando menos cuanto se consumirá en el 25% de los días ?.
8. ¿ Cual será el consumo máximo en el 80 % de los días ?.
9. ¿ No mas de cuanto combustible se consumirá en el 35% de los días ?.
10. Si al inicio de una jornada se cuenta con 1 700 lts. y el tanque de almacenamiento no es
abastecido hasta el día siguiente. ¿ Cual será la probabilidad que se quede sin vapor el Dpto. de
engomado ?.
Problema 4.
El fabricante de baterías (acumuladores) para automóvil marca “AMERICA” afirma que estos tienen
una vida útil que se distribuye normalmente con una media de 5.5 años y una desviación estándar de
1.15 años. Basados en estos datos determine:
1. ¿ Cuantos de los próximos 500 acumuladores fabricados tendrán una duración entre 5 y 6 años ?.
2. Máximo cuanto durarán el 35 % de los acumuladores de esta marca.
3. ¿ Cuantos de los próximos 450 fabricados tendrán una duración de cuando menos 3.5 pero a lo más
5.5 años ?.
4. Mínimo que duración tendrán el 35 % de los acumuladores de esta marca.
5. ¿ Cuantos de los próximos 300 acumuladores fabricados tendrán una duración entre 7 y 8 años ?.
6. ¿ Cuantos de los próximos 250 acumuladores fabricados tendrán una duración de no más de 5
años ?.
7. Una compañía de taxis con el objeto de evitar contratiempos al ofrecer servicio por política ha
definido que la probabilidad de que el acumulador le falle no debe sobrepasar el 15%. En que tiempo
deberá cambiar el acumulador de sus vehículos.
8. Al menos ¿Qué duración tendrán el 40 % de los acumuladores de esta marca ?
9. A lo sumo ¿Cuál será la duración del 90% de estos acumuladores?
10. El fabricante repone por un acumulador nuevo, cualquier acumulador defectuoso en su periodo de
garantía. ¿Qué garantía debe ofrecer el fabricante en tiempo si no quiere reponer más del
15% de los acumuladores vendidos ?.
_
- Los valores de las medias obtenidas de muestras de magnitud n ( n > 30) seleccionadas de una
x
población con media µ y desviación estándar σ tendrán aproximadamente una distribución normal.
_
- Los valores de las medias obtenidas de muestras seleccionadas de poblaciones que se distribuyen
x
normalmente tendrán una distribución normal sin importar la magnitud de n.
De donde se tiene que:
μ _
x
=µ
σ N −n
σ _
x
=
n N −1
Para poblaciones pequeñas ( 20 n ≥ N )
_ _
• Estandarización de los valores de x ( pasar de x az):
_
x −μ
z =
_
σx
_
• Desestandarización de los valores de z ( pasar de z a x )
_
x =µ + σx z
Problema 1.
La máquina empleada para el llenado de sacos de azúcar en un Ingenio Azucarero, está regulada
para efectuar dicha operación, despachando en promedio 50 Kgs. con una desviación estándar de 2.5
kgs. El control del peso vertido se verifica tomando periódicamente una muestra de 15 sacos, calculando
el contenido promedio. Si el valor promedio de estas muestras se distribuye normalmente. Determine la
probabilidad que el peso promedio de cualquiera de estas muestras sea de:
1. Al menos 49.5 kgs.
2. Máximo 51.5 kgs.
3. No menos de 49 pero a lo más 51 kgs.
4. Mínimo 47 pero máximo 50 kgs.
5. Más de 50.5 kgs. pero a lo sumo 53 kgs.
6. No más de 48 kgs. pero como mínimo 49.5 kgs.
7. Cuando más ¿Cuál será el valor del 83 % de las muestras de esta
magnitud ?.
8. Cuando menos ¿Cuál será el valor del 60 % de las muestras de
esta magnitud ?.
9. ¿ No mayor de que valor tendrá el 83 % de las muestras de esta
magnitud ?.
10. Cuando menos ¿Cuál será el valor del 60 % de las muestras de
esta magnitud ?.
Problema 2.
La máquina empleada para el llenado de las cajas de galletas de una determinada marca, está
regulada para efectuar dicha operación, despachando en promedio 1 000 grs. con una desviación
estándar de 95 grs. En base a esta información, determine la probabilidad que muestras seleccionadas
aleatoriamente de 65 cajas contengan en promedio:
1.¿ Al menos 985 grs. ?
2.Un mínimo de 975 grs. pero no más de 1 025 grs.
3. ¿ A lo más 985 grs. ?
4. La fracción de muestras de esta magnitud que pesen en promedio un máximo 980 grs. pero no
menos de 1 020 grs.
5. ¿Que proporción de muestras de esta magnitud pesaran en promedio al menos 975 grs. pero cuando
más 1 kg.?
6. ¿ Cuántas de 500 muestras de 25 cajas cada una; pesarán en promedio al menos 990 kg. pero
cuando más 1 025 grs. ?.
7. Al menos cuanto pesarán en promedio el 60% de las muestras.
8. Cuando más cuanto pesarán en promedio el 35% de las muestras.
9. Para verificar si se esta cumpliendo con el peso etiquetado en una inspección la PROFECO
selecciona aleatoriamente 20 cajas y aplica una sanción en caso que el peso promedio obtenido en la
muestra no contenga al menos el 95% del peso etiquetado. ¿Habría probabilidad de que esto
sucediera?.
10. Por otra parte la empresa para controlar contenido en peso de las cajas, selecciona aleatoriamente
15 cajas; y para el proceso para corregirlo, si el peso de la muestra no esta entre ± un 5% del peso
etiquetado. ¿En que porcentaje de las muestras el peso promedio se sale de este rango?.
Problema 3.
El consumo promedio diario de combustible utilizado en una caldera que suministra vapor al
Departamento de Engomado de una empresa textil es de 1 850 lts. diarios con una desviación
estándar de 325 lts. En función a esta información determine la probabilidad que el consumo
promedio de una muestra seleccionada aleatoriamente de 15 días en esta caldera sea de:
11. Al menos 1 700 lts.
12. Mínimo 1 900 lts. Pero máximo 2000 lts.
13. No más de 1 950 lts.
14. Entre 1 750 y 1 950 lts diarios.
15. No más de 1600 pero al menos 1 750 lts.
16. Mínimo 1 650 lts. pero máximo 1 750 lts.
17. ¿ Cual será el consumo promedio mínimo del 65 % de las muestras con esta cantidad de días ?.
18. Cuando menos, ¿Cual será el consumo promedio del 25 % de las muestras con esta cantidad de
días ?.
19. ¿ Cual será el consumo promedio máximo en el 80 % de las muestras conteniendo 20 días
seleccionados al azahar ?.
20. ¿ No mas de cuanto se consumirá en promedio en el 35% de las muestras conteniendo 25 días
seleccionados al azahar ?
DISTRIBUCION t de Student
Si el valor de la variable aleatoria continua t se distribuye como una distribución t
de Student.
I. Determinar la:
DISTRIBUCION Chi-Cuadrada χ2
Casos especiales
DEFINICIÓN.
Estadística es el arte o ciencia de coleccionar reunir y analizar información procedente de una
población para inferir a partir de ella en una serie de conclusiones, las cuales son válidas para la
población de la cual se extrajo la información..
ESTADÍSTICA DESCRIPTIVA:
Tiene como objetivo el procesamiento de información obtenida de una muestra o toda una población
con el objeto de definir valores o representarlos a través de gráficos de toda la información analizada.
ESTADÍSTICA INFERENCIAL:
Consiste en analizar el resultado del análisis hecho a una muestra seleccionada aleatoriamente de
una población, haciendo válido dicho resultado para toda la población de la cual se extrajo la muestra.
Se pueden hacer inferencias acerca de los parámetros de una población de dos formas:
ESTIMACIÓN DE PARÁMETROS
Estimar del valor del parámetro de una población, es definir a través de un proceso estadístico,
el valor aproximado del verdadero valor que tiene el parámetro de una población a partir del análisis de
una muestra de elementos extraídos de la población de la cual se extrajo.
La estimación del parámetro de una población puede realizarse de dos maneras:
a. Estimación puntual
Consistente en definir un único valor del parámetro que se está estimando.
Ejemplos:
1. “Se estima que el porcentaje de piezas defectuosas al final de una línea de producción
es del 8%“
3. “Se estima que la varianza con respecto al promedio de duración de una bombilla eléctrica de
la marca OSRAM en 800 horas ”.
Ejemplos:
_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ 25
Pag.
MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN
TEMA: ANALISIS DE REGRESIÓN LINEAL
_______________________________________Fernando Fernández Rodiles
1. “ Se estima que el porcentaje de piezas defectuosas al final de una línea de producción está
entre el 7 y el 9% “
3. “La desviación estándar con respecto al promedio de la duración de una bombilla eléctrica
de la marca OSRAM se estima entre 750 y 850 horas”.
a. Del grado de confianza con que se pretende estimar el parámetro. Ha mayor confianza deseada
mayor deberá ser el número de elementos que compondrán la muestra Este grado de confianza
se ve reflejado en el valor del estadístico z en la curva normal.
z σ
2 2
z α /2 σ
2
n=
α /2
2
n = 2
e e
LA MEDIA DE UNA POBLACIÓN
∆ ∆
2
n = zα / 2 2
pq
e
_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ 26
Pag.
MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN
TEMA: ANALISIS DE REGRESIÓN LINEAL
_______________________________________Fernando Fernández Rodiles
Problema 1
Problema 2.
procedimiento por una parte proporciona el número de ventas y por otra parte define las zonas donde se
tendrá mayor o menor demanda del producto.
Con el objeto de ejemplificar lo anterior, se considera el caso de una empresa fabricante de
implementos agrícolas, al cual esta interesada en introducir al mercado un nuevo “equipo para riego”.
Para probar su aceptación, se seleccionó utilizando para ello el muestreo aleatorio estratificado con
afijación proporcional una muestra de 45 tiendas distribuidoras, localizadas en tres zonas agrícolas y se
observó el número de equipos vendidos durante un periodo de un año. Los resultados se presentan en la
siguiente tabla:
ZONAS
DESCRIPCION A B C
número de tiendas 16 10 19
# de equipos vendidos en
31 28 47
promedio
varianza 30.5 15.3 47.9
En base a los resultados observados en la tabla. Y suponiendo que las ventas se distribuyen
normalmente en cada zona. Determine un intervalo de confianza del:
1. 95% para el número promedio de equipos vendidos en cada una de las tres zonas (A,
B y C).
2. 90% para la diferencia en el promedio de equipos vendidos entre las zonas (A y B), (A y C), (B y C).
3. 95% para la varianza y desviación estándar con respecto al numero promedio de equipos vendidos
en cada una de las tres zonas.
Problema 3.
Las mazas para molino azucarero (2.00 mts de largo por 1.75 mts. de diámetro) empleadas
para la extracción de las mieles contenidas en la caña de azúcar, son cilindros de hierro colado que
después de ser fundidas y ensambladas en su flecha de acero, son sometidas al maquinado con el
objeto de proporcionarles el diámetro y características requeridas para la función que desempeñarán
ya colocadas en el molino para su operación.
Con el objeto de mejorar el tiempo de maquinado, fueron propuestas por diferentes
proveedores tres herramientas de corte y utilizadas en operaciones seleccionadas aleatoriamente. Los
tiempos realizados expresados en minutos se presentan en la siguiente tabla:
HERRAMIENTA 1 2 3 4 5 6 7 8 9 10 11 12
A 243 255 239 248 245 241 249 247 240 242 244
B 231 230 229 232 230 235 236 235 233 234 231 229
C 254 250 259 263 250 257 259 260 269 267
Suponiendo que los tiempos empleados en el maquinado se distribuyen normalmente con cada una
de las tres herramientas y en base a esta información estime un intervalo de confianza del:
1. 90% para el tiempo promedio empleado por cada una de las herramientas propuestas.
2. 95% para la diferencia entre el tiempo promedio de corte entre las herramientas propuestas (A con B,
A con C y B con C).
3. 95% para la Varianza y Desviación Estándar con respecto al tiempo promedio empleado por cada
una de las herramientas propuestas.
Problema 4.
Teniendo como objetivo "mejora en el servicio", como una dentro de varias de las estrategias
de mercadotecnia para el incremento en sus ventas. Una gran cadena de supermercados
muestreó las opiniones de sus clientes respecto al servicio ofrecido antes y después que el
personal asistiera a cursos de capacitación que tenían como objeto mejorar la atención a los
clientes. Se pidió a cada una de las personas encuestadas que asignaran una calificación que
reflejara la calidad del servicio del personal en una escala de 0 ( malo) a 10 ( excelente ).
Los resultados obtenidos en cada una de estas etapas son presentados en la siguiente tabla:
DATOS ANTES DESPUES
# de clientes encuestados 71 81
calificación promedio 6.85 8.66
desviación estándar con respecto a la
0.95 0.46
calificación promedio
# de clientes que dieron una
47 28
calificación inferior a 5
1. 90% para la calificación promedio obtenida por el personal antes de la realización del curso.
2. 93% para la calificación promedio obtenida por el personal después del curso.
3. 98% para la proporción de clientes que calificó el servicio del personal antes de la realización del
curso, con una calificación inferior a 5 puntos.
_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ 29
Pag.
MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN
TEMA: ANALISIS DE REGRESIÓN LINEAL
_______________________________________Fernando Fernández Rodiles
4. 98% para la proporción de clientes que calificó el servicio del personal después de la realización del
curso, con una calificación inferior a 5 puntos.
5. 98% para la proporción de clientes que calificó el servicio del personal antes de la realización del
curso, con una calificación superior a 5 puntos.
6. 98% para la proporción de clientes que calificó el servicio del personal después de la realización del
curso, con una calificación superior a 5 puntos.
7. 95% para el incremento en la calificación promedio, respecto al servicio ofrecido por el personal,
otorgada por los clientes antes y después del curso.
8. 93% para la Varianza y Desviación Estándar con respecto a la calificación promedio del personal,
antes de la realización del curso.
9. 93% para la Varianza y Desviación Estándar con respecto a la calificación promedio del personal,
después de la realización del curso.
10. ¿Fue suficiente el número de clientes encuestados (muestra) para estimar la calificación promedio en
los incisos 1 y 2. ?. Si el error que se está dispuesto aceptar en la estimación de la calificación
otorgada por los clientes no debe ser mayor de: a. 0.05; b. 0.10; c. 0.20 y d. si no se acepta ningún
error en la estimación de la calificación.
11. ¿Fue suficiente el número de clientes encuestados (muestra) para estimar el porcentaje de clientes
que asignaron una calificación inferior a 5 puntos en los incisos 3, 4, 5, y 6 ?. Si el error que se está
dispuesto aceptar en la estimación del porcentaje no debe ser mayor del: a. 5%; b. 7%; c. 10%
y d. si no se acepta ningún error en la estimación del porcentaje.
c. Resultado: 53 caras.
d. Resultado: 55 caras.
e. Resultado: 60 caras.
f. Resultado: 65 caras. ¿ Y con estos ?
g. Resultado: 70 caras
O bien:
39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61
REGION REGION
DE DE
RECHAZO ( RR ) REGION DE ACEPTACION ( RA ) RECHAZO ( RR )
En prueba de hipótesis el principal objetivo es “Establecer el o los límites de aceptación hasta el cual se
consideraría que lo que se esta comprobando es cierto ó es falso”.
REGION DE ACEPTACION (RA): Zona de resultados en la cual se considera que no existe una
diferencia significativa entre el valor hipotético sometido a prueba y el valor del parámetro muestral.
REGIÓN DE RECHAZO (RR): Zona de resultados en la cual se considera que existe una diferencia
significativa entre el valor hipotético sometido a prueba y el valor del parámetro muestral.
TIPOS DE HIPOTESIS
El primer paso a dar al realizar una prueba de hipótesis es el de hacer el planteamiento de dos
proposiciones que están relacionadas con el valor supuesto del parámetro que se intenta someter a
prueba. Dichas proposiciones son denominadas: HIPOTESIS NULA e HIPOTESIS ALTERNATIVA.
HIPOTESIS NULA : ( Ho )
La proposición planteada en esta hipótesis deberá colocar a la persona que realiza la prueba en una
posición imparcial a lo que intenta probar. El objetivo final de toda prueba de hipótesis es el de aceptar o
rechazar la proposición planteada en la hipótesis nula; por esta razón algunos autores la denominan
hipótesis de trabajo.
HIPOTESIS ALTERNATIVA: ( H1 )
La proposición en esta hipótesis generalmente se plantea en función a lo que se intenta probar. Los
autores la denominan hipótesis de investigación. Esta hipótesis es aceptada cuando el resultado del
proceso estadístico no sostiene lo planteado en la hipótesis nula.
TIPOS DE PRUEBAS ( UNA Y DOS COLAS )
En función a lo que se intenta probar respecto al valor del parámetro.
Las pruebas de hipótesis se clasifican en dos tipos:
_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ 31
Pag.
MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN
TEMA: ANALISIS DE REGRESIÓN LINEAL
_______________________________________Fernando Fernández Rodiles
Sean:
PRUEBAS DE TIPO I: PRUEBAS DE UN EXTREMO ( UNA COLA )
a. EXTREMO IZQUIERDO O COLA IZQUIERDA:
Se genera cuando interesa que el valor del parámetro sometido a prueba alcance un mínimo valor para
aceptar lo planteado en la hipótesis nula.
HO : θ = θ0
H1 : θ < θ0
RR RA
b. EXTREMO DERECHO O COLA DERECHA:
Se genera cuando interesa que el valor del parámetro muestral sometido a prueba no sobrepase un
mínimo valor para aceptar lo planteado en la hipótesis nula.
HO : θ = θ0
H1 : θ > θ0
RA RR
PRUEBAS DE TIPO II: DOS EXTREMOS ( DOS COLAS )
Se genera cuando interesa por una parte que el valor del parámetro
sometido a prueba alcance un mínimo; pero por otra, que no sobrepase un máximo para aceptar lo
planteado en la hipótesis nula.
HO : θ = θ0
H1 : θ ≠ θ0
RR RA RR
Ejemplo:
Imagine las situaciones posibles que se pueden llegar a establecer en un juicio respecto a la decisión que
toma un juez al emitir su veredicto en relación al acusado.
INOCENTE CULPABLE
HIPOTESIS NULA
DECISION
CIERTA FALSA
ERROR
DECISION TIPO II
ACEPTAR Ho
CORRECTA
( β )
ERROR
DECISION
RECHAZAR Ho TIPO I
CORRECTA
(α )
Notas:
_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ 33
Pag.
MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN
TEMA: ANALISIS DE REGRESIÓN LINEAL
_______________________________________Fernando Fernández Rodiles
1. Toda prueba o verificación de hipótesis tiene como objetivo aceptar o rechazar lo planteado en la
hipótesis nula Ho. Por ello, a esta hipótesis se le denomina Hipótesis de trabajo
2. La proposición planteada en Ho, deberá colocar a la persona que realiza la prueba en una posición
imparcial a lo que se trata de probar con respecto al valor del parámetro.
3. El planteamiento hecho con respecto al valor del parámetro sometido a prueba en la hipótesis nula H 1
INSTRUCCIONES:
Los siguientes problemas tienen como objetivo que el alumno:
I. Identifique el parámetro ó parámetros que se someterán a prueba.
EJERCICIO 1.
En los años 90, el porcentaje de alumnos de nuevo ingreso en una institución de educación superior que
abandonaban sus estudios durante el primer semestre debido a que la carrera que habían elegido no
cubría sus expectativas, era del 25 %. Para los periodos transcurridos en este nuevo siglo fue analizada
una muestra de alumnos que abandonaron sus estudios por diferentes causas. En base al análisis de los
resultados obtenidos:
1. Se quiere probar si el porcentaje de deserción por esta causa es el mismo, es decir; si puede
considerarse que el porcentaje de deserción sigue siendo del 25 %.
2. Se quiere probar si se ha incrementado el porcentaje de deserción por esta causa, es decir; si puede
considerarse que actualmente es mayor del 25 %.
3. Se quiere probar si ha disminuido el porcentaje de deserción, es decir; si puede considerarse que
actualmente es menor al 25 %.
EJERCICIO 2.
El contenido en impreso en la etiqueta de una determinada marca de refresco es de 225 mililitros. Para
comprobar dicho contenido se seleccionaron aleatoriamente botellas conteniendo dicho refresco y el
volumen promedio obtenido fue utilizado para comprobación. En base al análisis de los resultados
obtenidos:
1. Se quiere comprobar si el contenido es el mismo que el que dice la etiqueta.
2. Se quiere probar si dicho volumen es de al menos 225 mililitros.
3. Se quiere probar si dicho volumen supera los 225 mililitros.
_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ 34
Pag.
MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN
TEMA: ANALISIS DE REGRESIÓN LINEAL
_______________________________________Fernando Fernández Rodiles
EJERCICIO 3.
Se trata de probar si el procedimiento propuesto para disminuir el tiempo empleado en la realización de
una operación, es mejor que el procedimiento actual. Para compararlos, se aplicó un procedimiento
específico a cada uno de dos grupos seleccionado aleatoriamente de alumnos y se compararon los
resultados obtenidos con uno y otro método. Basados en estos resultados, se quiere probar:
1. La calificación promedio obtenida por los alumnos con el método TRADICIONAL es mínimo 75.
2. La calificación promedio obtenida por los alumnos con el método basado en el APRENDIZAJE
SIGNIFICATIVO supera los 90 puntos.
3. Si no existe una diferencia en el nivel de aprovechamiento entre uno y otro método.
4. Si el método basado en el APRENDIZAJE SIGNIFICATIVO actual es mejor que el basado en el
método TRADICIONAL.
5. Si el método basado en el MÉTODO TRADICIONAL es mejor que el basado en el APRENDIZAJE
SIGNIFICATIVO.
6. Si la calificación promedio alcanzada con el método de APRENDIZAJE SIGNIFICATIVO supera en al
menos 5 puntos a la calificación promedio alcanzada con el método de MÉTODO TRADICIONAL.
7. Si el Porcentaje de alumnos reprobados empleando el MÉTODO TRADICIONAL es de cuando más
el 25%.
8. Si el Porcentaje de alumnos reprobados empleando el APRENDIZAJE SIGNIFICATIVO es máximo
del 15%.
9. Si es mayor el porcentaje de alumnos reprobados con el MÉTODO TRADICIONAL que empleando el
método de APRENDIZAJE SIGNIFICATIVO.
EJERCICIO 4.
Los folletos de publicidad de un automóvil compacto de conocida marca, manejan que el
promedio de rendimiento del mismo, en condiciones normales de operación es de 17.4
kilómetros / litro. Para someter a prueba esta afirmación se realizan pruebas en diferentes
autos de dicha marca.
1. Se quiere probar si el rendimiento difiere con lo que dice la publicidad.
2. Se quiere probar si dicho rendimiento es superior a lo que afirma la publicidad.
3. Se quiere probar si el rendimiento es inferior a lo que los folletos publicitarios afirman.
EJERCICIO 5.
El gerente de una línea de autobuses realiza la programación de sus corridas con base en que un
autobús requiere en promedio, un tiempo de cuando más 40 minutos en recorrer la distancia
Orizaba-Córdoba, Para corroborar esto fueron cronometradas una muestra seleccionada
aleatoriamente de corridas. Desarrolle el planteamiento de las hipótesis Nula y Alternativa
( expresando con palabras y posteriormente a través de símbolos ).
EJERCICIO 6.
El promotor de una dieta para reducir peso afirma que en promedio, la persona que se someta a ella
siguiendo las indicaciones, reducirá al menos 2 kgs. en una semana. Para probar esta afirmación fue
seleccionada aleatoriamente una muestra de personas sometidas a tal régimen.
Desarrolle el planteamiento de las hipótesis Nula y Alternativa
EJERCICIO 7.
Un estudio relacionado con el nivel de consumo diario y la preferencia de dos de las principales marcas
de refresco de cola ( marcas A y B para nuestro ejemplo ) en una amplia región del país, involucró la
aplicación de encuestas a una muestra de personas seleccionada aleatoriamente de la región; en base a
los resultados del análisis de la muestra. Se desean probar los siguientes supuestos:
II. Exprese con palabras y después con expresiones algebraicas el planteamiento de las hipótesis:
NULA ( Ho ) y ALTERNATIVA ( H1 ).
1. Si el consumo promedio del refresco de cola para las personas que demandan la marca A es de
cuando menos 200 mililitros diarios.
2. Si el consumo promedio del refresco de cola para las personas que demandan la marca A es mayor
a 200 mililitros diarios.
3. Si el consumo promedio de refresco de cola para las personas que demandan la marca B es de
cuando más 200 mililitros al día.
4. Si el consumo promedio de refresco de cola para las personas que demandan la marca B es menor
a 200 mililitros al día
5. Si se puede considerar que al menos el 60% de las personas que consumen refresco de cola,
prefieren la marca A.
6. Si se puede considerar que menos del 60% de las personas que consumen refresco de cola,
prefieren la marca A.
7. Si se puede considerar que máximo 35% de las personas que demandan para consumo refresco de
cola, prefieren la marca B.
8. Si se puede considerar que el consumo promedio de las personas que prefieren refresco de cola es
el mismo en las dos marcas.
9. Si es significativamente menor el consumo promedio de las personas que prefieren la marca B que
aquellos que se inclinan por la marca A.
10. Si los que prefieren la marca A consumen en promedio al menos 50 mlls. más de refresco al día que
los que prefieren la marca B.
11. Si es significativamente mayor la preferencia por parte de los consumidores de refresco de cola por la
marca A que por la marca B.
12. Si difiere significativamente la preferencia por parte de los consumidores de refresco de cola por la
marca A que por la marca B.
13. Si la varianza con respecto a las ventas promedio de la marca A es la misma que la varianza con
respecto a las ventas promedio de la marca B.
14. Si la varianza con respecto a las ventas promedio de la marca A es la mayor que la varianza con
respecto a las ventas promedio de la marca B.
Problema 1.
“La estabilidad de las mediciones de las características de un producto manufacturado es importante para
mantener su calidad. En realidad, es mejor tener, a veces una pequeña variación en el valor medido de
alguna de sus características importantes y tener una media del proceso dentro del “rango de acepta-
ción”, que tener una amplia variación con una media que supuestamente se ajusta a las necesidades,
dado que puede producir un porcentaje de productos defectuosos mayor que en el primer caso”.
LINEAS
DESCRIPCIÓN
A B
# de muestras. 86 91
promedio de duración 1 190 hrs. 1 062 hrs.
desviación estándar 303 hrs. 162 hrs.
# de lámparas que dilataron
20
menos de 1 200 hrs 34
Puede considerarse a un nivel de significancia del:
1. 5%, que el tiempo promedio de duración de los focos producidos por la LINEA A es de al
menos 1 200 horas.
2. 8%, que el tiempo promedio de duración de los focos producidos por la LINEA B no supera
las 1 000 horas.
3. 10%, que es significativamente mayor la duración de los focos producidos por la LINEA A
que los focos producidos por la LINEA B.
4. 6%, que la diferencia en el tiempo promedio de duración entre esta clase de focos es mayor
a las 120 horas.
5. 5%, que la desviación estándar con respecto al tiempo promedio de duración de los focos
producidos en la LINEA A supera significativamente el valor de 290.
6. 10%, que la desviación estándar con respecto al tiempo promedio de duración de los focos
producidos en la LINEA B es de cuando más 150.
7. 5% Si el porcentaje de focos con una duración menor a las 1 200 horas producidos por la
LINEA A es superior al 35%.
8. El porcentaje de focos con una duración menor a las 1 200 horas producidos por la LINEA
B es inferior al 25 %.
9. 8% Si la diferencia en el porcentaje de focos producidos por las dos clases de líneas con
una duración inferior a las 1 200 horas es de al menos el 15 %.
Problema 2.
CANTIDAD DE SOLVENTE
DESCRIPCIÓN
15 grs/lt 30 grs/lt
número de pruebas realizadas 21 20
tiempo promedio de secado (min.) 48 37
varianza 2.3 1.8
desviación estándar 1.52 1.67
5. 5% que la varianza con respecto al tiempo el tiempo promedio de secado de la pintura con
15 grs. de solvente es de cuando más 2 grs/lt.
6. 5% que la varianza con respecto al tiempo el tiempo promedio de secado de la pintura con
30 grs. de solvente es de cuando menos 2.0 grs/lt.
Problema 3.
METODO
DATOS ACTUAL PROPUESTO
número de piezas 79 85
tiempo promedio por pza. 35.9 min. 23.3 min.
desviación estándar 8.4 12.3
piezas defectuosas en la
8 17
muestra
Problema 4.
# de clientes encuestados 60 75
Problema 1.
El proceso de aseguramiento de la calidad en una empresa de la Industria Metal-Mecánica, ha
tenido avances significativos. Uno de los procesos que ha mejorado no tan solo en la calidad del producto
sino en la reducido de sus tiempos de operación; ha sido en el del maquinado del embrague para freno
de auto. Para tal fin fueron diseñados nuevos aditamentos y se emplearon nuevas herramientas de
corte, propuestas por los proveedores.
Con el objeto de evaluar los resultados obtenidos fueron comparados los tiempos realizados
ANTES Y DESPUES de la aplicación de las mejoras. La tabla siguiente presenta los resultados del
análisis de muestras seleccionadas aleatoriamente respecto al tiempo realizado al inicio del programa y
los que actualmente se presentan:
PROCESO
DESCRIPCIÓN
INICIAL MEJORADO
_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ 41
Pag.
MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN
TEMA: ANALISIS DE REGRESIÓN LINEAL
_______________________________________Fernando Fernández Rodiles
tamaño de la muestra 29 27
tiempo promedio (minutos) 79.8 57.3
desviación estándar 29.24 15.76
Suponiendo que los tiempos en realizar el maquinado de los embragues con cualquiera de los dos
procesos, se distribuye normalmente. En base a estos resultados ¿Se puede considerar a un nivel de
significancia del:
1. 5% que el tiempo promedio realizado en el maquinado del embrague ANTES de la implementación
de las mejoras era superior los 73 minutos.
2. 10% que el tiempo promedio realizado en el maquinado del embrague DESPUES de la
implementación de las mejoras es inferior a los 60 minutos.
3. 5% que el tiempo promedio realizado en el maquinado del embrague disminuyó significativamente
DESPUES de la implementación de las mejoras con relación al tiempo realizado en esta operación
ANTES de aplicarlas?.
4. 8% que el tiempo promedio realizado en el maquinado del embrague disminuyó significativamente
DESPUES de la implementación de las mejoras, en al menos 25 minutos, con relación al tiempo
realizado en esta operación ANTES de su aplicación?.
5. 5% si la desviación estándar con respecto al tiempo promedio realizado en el maquinado del
embrague ANTES de la implementación de las mejoras era superior 25 minutpos
6. 10% si la desviación estándar con respecto al tiempo promedio realizado en el maquinado del
embrague DESPUES de la implementación de las mejoras es inferior a los 20 minutos?.
7. 5% si la varianza con respecto al tiempo promedio realizado en el maquinado del embrague ANTES
de la implementación de las mejoras era superior a la de DESPUES de su aplicación?.
Prueba realizada para determinar si una población tiene una distribución teórica especificada. Está
basada en el grado de ajuste que existe entre la frecuencia de ocurrencias de las observaciones en una
muestra observada y las frecuencias esperadas que se obtienen de una distribución hipotética. Dichas
diferencias pueden ser debidas entre otras causas a:
a. Fluctuaciones propias de los elementos que participan en la muestra.
b. Que el fenómeno observado realmente no presenta el comportamiento que se trata de probar.
Donde:
χc2 : es un valor de la variable aleatoria χ2 cuya distribución muestral se asemeja
a la distribución Chi-Cuadrada.
Nota.
Entre mayor sea la diferencia entre las frecuencias observadas y las esperadas, mayor será el valor de
χc2 y por lo tanto mayor será la probabilidad de rechazar la hipótesis nula Ho. Este criterio de decisión
Problema 1.
ESTATURA
# alumnos
(metros)
1.54 – 1.57 13
1.58 – 1.61 16
1.62 – 1.65 23
1.66 – 1.69 25
1.70 – 1.73 32
1.74 – 1.77 21
1.78 – 1.81 13
1.82 – 1.85 11
260.47 0.8642
X = 1.691
S2= 0.00565
S = 0.075
FRECUENCIAS FRECUENCIAS
AREA O
LIMITES REALES OBSERVADAS ESPERADAS ( fe- fo ) 2
PROBABILIDAD
fo fe
1.535 – 1.575 13
1.575 – 1.615 16
1.615 - 1.655 23
1.655 - 1.695 25
1.695 - 1.735 32
1.735 - 1.775 21
1.775 - 1.815 13
1.815 – 1.855 11
Problema 2.
En base a las estadísticas de periodos anteriores de la Secretaría del Trabajo los accidentes de tipo
laboral, en la Industria Metal-Mecánica: el 45% de los mismos son debidos a la falta de capacitación del
trabajador, el 25% su origen se debe a equipo de protección inadecuado para la labor que realizan, el
20% a la falta de concentración o descuido del trabajador en la función realizada, y el 10% al cansancio o
fatiga del trabajador.
Para este periodo; de los 225 accidentes que ocurrieron en empresas de este giro, el origen de los
accidentes fueron debidos a:
ORIGEN DE LO S ACCIDENTES
falta de
falta de equipo de cansancio o
concentración
capacitación protección fatiga
o descuido
110 52 49 14
En base a estos resultados, ¿Se puede considerar que el origen de los accidentes fue diferente al de
periodos anteriores?. (Utilice un nivel de significancia del 10 %).
Problema 3.
En un proceso de producción se toma una muestra aleatoria de 150 artículos cada uno de los 5
días laborables de la semana y estos son inspeccionados para encontrar los artículos defectuosos. Para
una semana determinada el total de artículos defectuosos fueron 60, los cuales se presentaron de la
siguiente manera:
# de piezas
13 12 9 14 12 60
defectuosas
En base a estos resultados, ¿Se puede considerar que existe una diferencia significativa en el
porcentaje diario de artículos defectuosos? (Utilice un nivel de significancia del 8 %).
Problema 5.
En base a estos resultados ¿Se puede considerar que el dado está balanceado ?. Utilice un nivel de
significancia del 10 %.
Problema 6.
S E X O
masculino femenino
Estos datos apoyan la hipótesis que la proporción de hombres y mujeres es la misma. Utilice un
nivel de significancia del 10 %.
Realice las siguientes pruebas:
1. Bondad de ajuste.
2. De hipótesis para una proporción.
3. De una diferencia de proporciones
PRUEBA DE INDEPENDENCIA
Prueba realizada para determinar si existe o no relación entre dos variables.
Conceptos:
Tabla de contingencia: Formada por filas → y columnas↓. Y esta formada de tal manera que clasifica y
relaciona la información que se presenta entre filas columnas.
Dimensiones de una tabla de contingencia: Una tabla de contingencia se describe nombrando primero
el numero de filas y después el número de columnas ( # de filas x # de columnas), sin tomar en cuenta la
fila ni la columna de los totales.
Ejemplo: La información presentada en la tabla hace referencia al número de piezas vendidas de tres
diferentes prendas de vestir en los últimos años:
Donde:
χc2 : es un valor de la variable aleatoria χ2 cuya distribución muestral se aproxima
a la distribución Chi-Cuadrada.
χα : 2
es el valor de la variable aleatoria χ2 obtenido en tablas
fo : frecuencias observadas en la i - ésima celda.
fe : frecuencias esperadas en la i - ésima celda.
Nota: Entre mayor sea la diferencia entre las frecuencias observadas y las esperadas, mayor será el
valor de χc2 y por lo tanto mayor será la probabilidad de rechazar la hipótesis nula Ho. Este criterio de
decisión no debe usarse si las frecuencias observadas no son de al menos cinco.
Problema 1.
En base a estos resultados, se puede considerar que el número de hijos que tiene una familia depende
del nivel escolar alcanzado por el padre. Utilice un nivel de significancia del 10%.
Problema 2.
Al preparar una campaña promocional a nivel nacional para un producto alimenticio, una oficina
publicitaria desea determinar si la edad es un factor para la aceptación del producto. Por tanto la
firma ha encuestado cuatro grupos distintos de edad obteniéndose la siguiente información.
EXCELENTE 25 40 47 46 158
BUENO 69 51 74 57 251
REGULAR 36 29 19 37 121
MALO 25 24 30 21 100
TOTAL 155 144 170 161 630
En base a estos resultados, se puede considerar el grado de aceptación del producto depende de
la edad de la persona. Utilice un nivel de significancia del 10 %.
Al preparar una campaña promocional a nivel regional una empresa refresquera desea
determinar ¿Qué tanto influye en la demanda el punto o lugar de venta del producto?. Para
determinarlo, la firma ha colocado su producto en cuatro grupos distintos de edad obteniéndose la
siguiente información.
_____ Cuaderno de trabajo de la materia de Estadística Aplicada _____ 48
Pag.
MAESTRIA EN INGENIERIA EN ADMINISTRACIÓN
TEMA: ANALISIS DE REGRESIÓN LINEAL
_______________________________________Fernando Fernández Rodiles
EXCELENTE 25 40 47 46 158
BUENO 69 51 74 57 251
REGULAR 36 29 19 37 121
MALO 25 24 30 21 100
TOTAL 155 144 170 161 630
En base a estos resultados, se puede considerar el grado de aceptación del producto depende de
la edad de la persona. Utilice un nivel de significancia del 10 %.
Problema 3.
La gerencia de la Cia. "X" con el objeto de estimular a sus vendedores ha propuesto un nuevo método de
pago el cual consiste en comisiones sobre ventas realizadas en contra del actual; salario fijo más bono de
compensación al finalizar el año. Para ello puso a consideración su plan, muestreando aleatoriamente a
una muestra de vendedores en cada una de las zonas que tiene; obteniéndose los siguientes resultados:
número de Z O N A
vendedores que
prefieren NOROESTE SURESTE CENTRO COSTA TOTAL
METODO
32 31 49 55 167
ACTUAL
METODO
24 33 63 26 146
PROPUESTO
TOTAL 56 64 112 81 313
En base a estos resultados, se puede considerar el grado de aceptación del método de pago propuesto
es el mismo en cada una de las zonas consideradas.
Utilice un nivel de significancia del 10 %.
Problema 4.
Las compañías
aseguradoras están revisando su política de cobrar primas reducidas para los seguros de automóviles
pequeños, debido a que la proporción de accidentes fatales en este tipo de transporte es mayor al
compararlo con los autos grandes. Para investigar este problema se realizó un análisis sobre la
distribución de accidentes en los que al menos un pasajero resultó gravemente herido o falleció. Los
datos de 322 accidentes se muestran en la tabla.
¿ Indican los datos que la frecuencia de accidentes con heridos fatales o graves dependen del tamaño
del automóvil ?. Utilice un nivel de significancia del 10 %.
Problema 3.
LINEA
DÍA I II III IV
# de piezas
defectuosas
En base a estos resultados, ¿Se puede considerar que existe una diferencia significativa en el porcentaje
de artículos defectuosos en las diferentes líneas?
( Utilice un nivel de significancia del 8 % ).
CONCEPTOS
ANÁLISIS DE REGRESIÓN.
Análisis que tiene por objetivo estimar el valor de una variable a través de otra, mediante métodos
estadísticos, utilizando datos observados de eventos similares ya ocurridos.
El término regresión lineal implica que el valor medio que toma Y variable dependiente dado un valor x
variable independiente (µ y/x ), está linealmente relacionado por la ecuación de regresión lineal
poblacional:
µ y/x= α + β x
donde los coeficientes de regresión α y β son parámetros que deben estimarse a partir de los datos
muestrales. Si a y b representan estas estimaciones respectivamente, se puede entonces estimar µ y/x
∧
por de la regresión muestral o de la línea de regresión ajustada.
Y
∧
Y=a+bx
donde: a: el valor de la ordenada al origen.
b: el valor de la pendiente de la recta
ANÁLISIS DE CORRELACION.
Técnica que determina la fuerza con que las variables están relacionadas.
COEFICIENTE DE CORRELACION.
Determina el porcentaje de valores que toma la variable dependiente ( y ), que son explicados por la
línea estimada de regresión.
ECUACIÓN DE ESTIMACIÓN.
Formula matemática que relaciona la variable desconocida con la (s) variable (s) conocida (s) en el
análisis de regresión.
ERROR ESTÁNDAR DE LA ESTIMACIÓN
Medida de la confiabilidad de la ecuación de estimación, que indica la variabilidad de los puntos
observados alrededor de la línea de regresión, esto es; hasta que punto los valores observados difieren
de sus valores estimados obtenidos con la ecuación establecida.
LÍNEA DE REGRESIÓN
Línea ajustada a un grupo de puntos para estimar la relación entre dos variables.
MÉTODO DE MÍNIMOS CUADRADOS
Técnica para ajustar una línea recta a través de un conjunto de puntos, de tal manera que la suma entre
la diferencia de las distancias del valor observado y el valor estimado, elevadas al cuadrado, sea el
mínimo.
PENDIENTE
Constante ( b ) para cualquier línea recta dada, cuyo valor representa: Que tanto, el cambio del valor de
la variable independiente ( X ), modifica el valor de la variable dependiente ( Y ).
VARIABLE DEPENDIENTE
La variable ( Y ) que se intenta predecir en el análisis de regresión.
VARIABLE INDEPENDIENTE
Variable ( s ) conocida ( s ) en el análisis de regresión ( x1 , x2, .... ( xi ).
RELACIÓN LINEAL
Tipo particular de asociación entre dos variables que puede describirse matemáticamente mediante una
línea recta.
RELACION DIRECTA
Relación entre dos variables en las que al incrementarse el valor de la variable independiente, se
incrementa el valor de la variable dependiente.
RELACIÓN INVERSA
Relación entre dos variables en las que al incrementarse el valor de la variable independiente, decrece el
valor de la variable dependiente.
DIAGRAMA DE DISPERSION
Gráfico que se construye a partir de los valores observados de dos variables una denominada variable
independiente ( X ) y la otra variable dependiente ( Y ). Que tiene como función:
1. Conocer de forma gráfica si existe o no relación entre las dos variables.
2. Definir que tipo de relación se presenta en caso de existir.
DIAGRAMAS DE DISPERSION
y y
x x
ESTACIONARIA
NO EXISTE RELACION
Problema 1.
Con el objeto de establecer una ecuación que establezca los costos de producción (directos e
indirectos), basándose en el nivel de producción, una empresa recabó información sobre los gastos
generales expresados en miles de pesos y las unidades producidas, en diferentes plantas con las que
cuenta la Compañía, la cual se muestra en la siguiente tabla.
Problema 3.
Con el objeto de determinar el presupuesto de operación para el próximo año, se intenta definir una
ecuación para estimar los gastos de reparación de los camiones de una empresa, de auto transporte de
carga; con base en su antigüedad. Para ello se toma como base las erogaciones hechas por este
concepto en el último año en los diferentes camiones con que la empresa cuenta., lo cual se
muestra en la siguiente tabla:
2 5 13.0
3 5 13.6
4 3 13.2
5 3 12.8
6 1 10.8
7 1 11.0
8 6 15.8
Problema 2:
Si bien, no es la publicidad de un artículo ofertado el único factor que influye en su demanda, es
un hecho que a mayor y mejor publicidad, las ventas de un producto se incrementan. El gerente de
ventas de una empresa que confecciona ropa para dama está interesado en establecer una relación del
comportamiento de estas dos variables: (inversión en miles de pesos y monto de las ventas que se
observaron), para ello tomó los registros de ventas de los últimos diez años en los cuales fue
promocionada una línea de ropa en sus diferentes modelos. La siguiente tabla presenta los resultados
observados en los mismos:
2 006 54 1.24
2 007 58 1.39
2 008 49 1.35
Con base en esta información:
1. Determine la ecuación que mejor se ajuste a este conjunto de datos.
2. Empleando la ecuación desarrollada en el punto anterior, estime un intervalo de confianza del 90%
para las ventas anuales para una inversión en publicidad de:
a. $ 53 000.00 b. $ 38 000.00
3. Determine los coeficientes de Correlación y Determinación
Problema 3.
Con el objeto de estimar sus costos de producción para elaborar su Programa Operativo Mensual
el Gerente de Producción desea establecer la relación existente entre el número de piezas producidas y
el costo. Para ello tomó de los registros de producción de los últimos doce meses el comportamiento de
estas dos variables.
La siguiente tabla presenta los resultados observados:
Número de Costo
Año
piezas producidas (miles de pesos)
Diciembre 131 25.1
Enero 117 24.3
Febrero 149 25.3
Marzo 149 25.4
Abril 122 24.4
Mayo 145 25.7
Junio 154 30.1
Julio 153 30.0
Agosto 112 24.1
Septiembre 142 25.5
Octubre 128 24.7
Noviembre 163 33.1
Ejercicio 1.
Dado el siguiente conjunto de datos
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 8 4 15 10 12 7 18 5 13 10 25 22
Yi 25 15 37 29 23 23 45 16 35 30 72 62
Ejercicio 2.
Dado el siguiente conjunto de datos
i 1 2 3 4 5 6 7 8 9
xi 66 75 41 54 25 49 46 30 34
Yi 15 11 8 10 5 10 9 7 6