Documente Academic
Documente Profesional
Documente Cultură
Estadística
ISBN 970-92240-5-0
Los Autores
______________________________________________________________________________ Contenido
CONTENIDO
CAP. Pág.
I Distribuciones frecuencíales 1
1.1 Distribuciones frecuencia les de datos no agrupados 2
1.1.1 Medidas de tendencia central 2
1.1.2 Medidas de dispersión 4
1.2 Distribuciones frecuenciales de datos agrupados 5
1.2.1 Medidas de tendencia central 6
1.2.2 Medidas de dispersión 8
1.3 Gráficas 8
1.4 Ejemplos resueltos 9
1.5 Problemas propuestos 15
II Distribuciones muéstrales 27
11.1 Distribución muestral de medias 27
11.2 Teorema del limite central 28
11.3 Distribución muestral de diferencia de medias 29
11.4 Distribución muestral de proporciones 29
11.5 Ejemplos resueltos 31
11.6 Problemas propuestos 36
conocidos 46
III
Contenido
IV Pruebas de hipótesis 65
IV.1 Tipos de hipótesis 65
IV.2 Tabla de errores tipo I y II 66
IV.3 Hipótesis de una cola y de dos colas 66
IV.4 Procedimiento para resolver una prueba de hipótesis 67
IV.5 Pruebas relativas a medias
(grandes muestras y pequeñas muestras) 67
IV.6 Pruebas relativas a diferencia entre medias
(grandes muestras y pequeñas muestras) 69
1V.6.1 Teorema del limite central 70
IV.7 Pruebas para proporciones en la población 71
IV.8 Pruebas relativas a varianzas 72
IV.9 Hipótesis relativas a dos variancias 73
IV.10 Ejemplos resueltos 75
IV.11 Problemas propuestos 85
IV
Contenido
Bibliografía
V
____________________________________________________ DISTRIBUCIONES FRECUENCIALES
CAPITULO I
Distribuciones frecuenciaies
Los métodos estadísticos se utilizan como ayuda para describir y entender la variabilidad.
Por variabilidad se entiende a las observaciones sucesivas de un sistema o fenómeno que no
producen el mismo resultado.
]
CAPÍTULO I _____________________________________________________________________
Figura 1
Esta gráfica permite ver dos características de los datos; la localización o tendencia central y
la dispersión o variabilidad.
Cuando la población es finita y se consideran todos !os elementos de ella (a tratar, uno a uno),
se trabaja lo que se dice una distribución de datos no agrupados.
Son aquellas que determinan los valores centrales de los datos de un experimento. Existen
varios tipos de medidas de tendencia central, aquí estudiaremos la media, la mediana y la
moda.
2
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES
desde
Se tiene que:
La media es:
La mediana que previo orden, se define según el tamaño del experimento, sea par o
impar.
¡Previo ORDEN!
Si n es impar: Si n es par:
= elemento = media aritmética de
central los elementos
centrales
3
CAPÍTULO I ____________________________________________________________________
Son aquellas que indican el grado de dispersión o variabilidad de los datos con respecto a una
medida de tendencia central.
El rango R es la diferencia del valor máximo menos el mínimo de los datos. Esto es,
4
____________________________________________________ DISTRIBUCIONES FRECUENCIALES
Cuando se tiene una serie de datos de tal manera que se agrupa en clases, para resolver con
mayor facilidad de tiempo, espacio y/o dinero, se está trabajando con una distribución
frecuencial de datos agrupados.
Cada clase, estará formada por un limite inferior (U) y un límite superior (LS), ejemplo:
Intervalos de clase
Se hace necesario construir los límites reales. Es decir, límite real inferior (IR//) del intervalo /-
ésimo, es igual a:
5
CAPÍTULO I _____________________________________________________________________
LRI LI LS LRS
0.5 1 5 5.5
5.5 6 10 10.5
10.5 11 15 15.5
15.5 16 20 20.5
20.5 21 25 25.5
Sea x¡ que denota la marca de clase del intervalo /-ésimo, y que es el punto medio del
Media aritmética:
marca de clase del intervalo í - ésimo
frecuencia de clase del intervalo i - ésimo
6
___________________________________________________ DISTRIBUCIONES FRECUENCIALES
Para calcular la mediana, se hace necesario primero ordenar los datos, después calcular cuál
es ia posición n/2. Es necesario ubicar en qué intervalo se encuentra dicha posición para
saber cuál es el limite real inferior de la clase mediana Hay que calcular las
Mediana:
Para la moda se elige el intervalo de mayor frecuencia y se ubica cuál es el limite real inferior
diferencia de frecuencia de la clase modal con ei intervalo de clase anterior a la clase modal
la clase modal. Así como también calcular la longitud del intervalo de clase modal De tal
7
CAPÍTULO I________________________________________________________________________
Las medidas de dispersión para el caso de datos agrupados, quedan definidas de la manera
siguiente:
Varianza =
Desviación estándar
1.3 Gráficas
Histogramas. Es una representación gráfica. En el eje de las abscisas los limites reales, tal
que, tos puntos medios de cada intervalo serán las marcas de clase y en el eje de las
ordenadas, las frecuencias de clase; de tal manera que quedan rectángulos.
8
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES
Polígonos de frecuencia. Es la unión de las marcas de clase en los techos de los rectángulos
en el histograma. El polígono de frecuencia debe quedar cerrado al principio y al final de la
gráfica, a través del hecho de aumentar un intervalo de clase de la misma longitud y con
frecuencia cero (esto quedará sobre el eje de las abscisas, y se unirá en la marca de clase
respectiva.)
Ejemplo núm. 1
Solución
9
CAPÍTULO I _____________________________________________________________________
xt f(x¡)
5 1
6 1
7 2
8 1
9 1
11 1
12 .1
13 1
14 1
15 1
Justificación teórica
elemento central
Mediana = 9
c) Moda, elemento de mayor frecuencia.
Moda = 7
10
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES
e)
Gráfica
11
CAPÍTULO I _____________________________________________________________________
Ejemplo núm. 2
Solución
Mediana =
Ejemplo núm. 3
12
______________________________________________________DISTRIBUCIONES FRECUENCIALES
Solución
13
CAPÍTULO I _____________________________________________________________________
POLÍGONO DE FRECUENCIAS
14
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES
Datos no agrupados
15
CAPÍTULO I _____________________________________________________________________
5. Los siguientes datos son las calificaciones de un alumno que estudia en el nivel
superior y las frecuencias con que se presentan dichas calificaciones.
Calificaciones Frecuencia
16
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES
6. Encontrar las medidas de tendencia central y las medidas de dispersión, así como su
gráfica, del siguiente conjunto de datos:
b) 2.12,1,1
c) 4.582, 2.14
17
CAPÍTULO I______________________________________________________________________
9. En una empresa, durantelO días, se observaron, los minutos del personal que llegó
tarde. 10,12,21,8, 6, 15,2,17,30,13
a) Calcular el Rango.
b) Medidas de centralización.
c) Medidas de dispersión.
Resp. a) 28
b) 13.4,12.5, no existe moda
c) 7.59
Xi frecuencia
3 1
4 1
5 2
6 2
8 3
10 4
11 5
12 7
14 4
15 1
18
__________________________________________________DISTRIBUCIONESFRECUENCIALES
a) Graficar
b) Encontrar medidas de centralización.
c) Encontrar medidas de dispersión.
Resp. b) 7.125,6,6
c) 2.93
12. Sean los diferentes precios de unas camisas:
1000, 3000, 2500, 3500, 5000,
1500, 2700, 4500, 2700, 3500.
a) Graficar la distribución de frecuencias.
b) Calcular las medidas de tendencia central.
c) Calcular las medidas de dispersión.
Resp. b) media = 2990, mediana = 2850,
moda = bimodal = 2700 y 3500
c) 1158.83
10 2 50 5
20 3 60 7
30 7 70 3
40 3
19
CAPÍTULO I _____________________________________________________________________
a) Graficar.
b) Encontrar medidas de tendencia central.
c) Encontrar medidas de dispersión,
Resp, b) media = 43, mediana = 45, moda = 30,60
c ) s = 17.72
a) Graficar.
b) Calcular medidas de centralización
c) Calcular medidas de dispersión.
Resp. b) media = 6.052, mediana = moda = 3
c) s = 2.788
Datos agrupados
20
____________________________________________________ DISTRIBUCIONES FRECUENCIALES
= 116.935, s= 10.81
= 581.82,5 = 24.12
21
CAPÍTULO 1______________________________________________________________________
269.64, s = 16.42
22
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES
a) Graficar
b) Calcular medidas de centralización.
c) Calcular medidas de dispersión.
LRI LRS
23
CAPÍTULO I ______________________________________________________________________
a) Graficar
b) Calcular medidas de centralización.
c) Calcular medidas de dispersión.
a) Graficar.
b) Calcular medidas de tendencia central.
c) Calcular medidas de dispersión.
Resp. b) media = 15, mediana = 16, moda = 17.33,
c) s = 4.72
22. Sea la siguiente tabla de datos:
LI LS
24
____________________________________________________ DISTRIBUCIONES FRECUENCIALES
a) Graficar.
a) Calcular medidas de tendencia central.
b) Calcular medidas de dispersión.
Problemas varios
de los siguientes
Clase
Resp. a y b 141.84
25
CAPITULO I______________________________________________________________________
25. En una exhibición científica, se anotó la edad de cada uno de los 50 visitantes que
asistieron. Hallar la media de edad y la clase a la que pertenece la mediana.
Edad Frecuencia
De 0 a < 10 6
De 10 a < 20 18
De 20 a < 30 11
De 30 a < 40 3
De 40 a < 50 0
De 50 a < 60 8
De 60 a < 70 4
26
_______________________________________________________ DISTRIBUCIONES MUESTRALES
CAPÍTULO II
Distribuciones muestrales
Supónganse que una muestra aleatoria de n observaciones se toma de una población normal
aleatoria tiene entonces la misma distribución normal que la población que está siendo
muestreada. De aquí que, por la propiedad reproductiva:
27
CAPÍTULO II ______________________________________________________
media
y vañanza
es grande.
Éste es uno de los teoremas más útiles en la estadística, llamado Teorema del limite central y
dice:
28
________________________________________________________ DISTRIBUCIONES MUÉSTRALES
Es aproximadamente normal estándar, si se cumplen las condiciones del teorema del limite
central. Si las dos poblaciones son normales, entonces la distribución de muestreo de Z es
exactamente normal estándar.
Se consideran todas las posibles muestras de tamaño « extraídas de esta población y para
cada muestra se determina la proporción p de éxito.
29
CAPÍTULO II_____________________________________________________________________
30
________________________________________________________ DISTRIBUCIONES MUÉSTRALES
Una compañía fabrica focos que tienen un periodo de vida que está distribuido
aproximadamente en forma normal, con media igual a 1000 horas y una desviación estándar
de 50 horas. Encuentre la probabilidad de que una muestra aleatoria de 25 focos tenga una
vida promedio de menos de 975 horas.
Solución
Datos:
Justificación teórica
Sustituyendo:
31
CAPÍTULO II _____________________________________________________________________
Ejemplo núm. 2
muestral Encuentre
32
________________________________________________________ DISTRIBUCIONES MUÉSTRALES
Solución
Datos
Justificación teórica
Distribución muestral para diferencia de medias
Sustituyendo
33
CAPÍTULO II _____________________________________________________________________
Ejemplo núm. 3
Se ha encontrado que el 2% de las piezas producidas por cierta máquina está dañado. ¿Cuál
es la probabilidad de que en una remesa de 400 piezas, esté dañado 3% o más?
Solución
Datos
Justificación Teórica
Distribución muestral de proporciones
34
________________________________________________________ DISTRIBUCIONES MUÉSTRALES
Primer método
Segundo método
35
CAPITULO II______________________________________________________________________
1. Una población está formada por ios cuatro números 1, 3, 7, 9. Considerar todas las
posibles muestras de tamaño 2 que pueden extraerse de esta población con
reempíazamiento. Hallar:
a) la media poblacionai
b) la desviación típica poblacionai
c) la media de la distribución muesíral de medias
d) la desviación típica de la distribución muestra) de medias
Resp.
36
________________________________________________________DISTRIBUCIONES MUESTRALES
a) con reemplazamiento
b) sin reemplazamiento
Resp.
Resp. 0.0062
5. Ciertos ventiladores fabricados por una compañía tienen una duración media de 1 000
horas y una desviación típica de 75 horas. Hallar la probabilidad de que una muestra
tomada al azar de 25 ventiladores tenga una duración media entre 990 y 1 010 horas.
Resp. 0.4907
37
CAPÍTULO II ____________________________________________________________________
6. Ciertos tubos producidos por una compañía tienen una duración media de 900 horas y
una desviación típica de 80 horas. La compañía despacha 1 000 lotes de 100 tubos
cada uno. ¿En cuántos lotes cabe esperar que la media de las duraciones sobrepase
las 910 horas?
Resp. 106
7. Una población muy grande tiene una media de 20 y una desviación estándar de 1.4,
Si se toma una muestra de 49 observaciones, contestar:
38
________________________________________________________DISTRIBUCIONES MUESTRALES
10. El candidato del partido X¡, considera que puede ganar las próximas elecciones en la
ciudad de Guadalajara, si obtiene al menos 55% de los votos en el distrito i. Además
supone que alrededor del 50% de los votantes en Guadalajara están a su favor. Si
N = 100 votantes van a votar en el primer distrito, ¿cuál es la probabilidad de que el
candidato Xy reciba al menos 50% de los votos?
Resp. 0.1587
11. Se ha encontrado que el 2% de los tornillos producidos por cierta máquina son
defectuosos. ¿Cuál es la probabilidad de que en una partida de 400 piezas, sean
defectuosas 3% o más?
Resp. 0.1056
12. Los resultados de una elección demostraron que cierto candidato obtuvo el 46% de
los votos. Determinar la probabilidad de que de 200 individuos elegidos al azar de
entre la población votante se hubiese obtenido una mayoría de votos para dicho
candidato.
Resp. 0.1131
39
CAPÍTULO II _____________________________________________________________________
15. La vida promedio del motor de determinado automóvil es de 5 000 km, con una
desviación estándar de 40 km. La distribución es muy aproximada a una normal. El
fabricante introduce mejoras en el proceso de fabricación del motor para aumentar el
tiempo de vida promedio a 5 050 km y disminuye la desviación estándar a 30 km.
Supóngase que se toma una muestra de tamaño 16 del proceso antiguo y otra de
tamaño 25 para el proceso nuevo. ¿Cuál es la probabilidad de que la diferencia entre
las dos medias muéstrales Xx - X2, sea al menos de 25 km? {suponer poblaciones
independientes).
Resp. 0.9838
16. Las pilas eléctricas de un fabricante A tienen una duración media de 1 400 horas, con
una desviación típica de 200 horas, mientras que las de otro fabricante B tienen una
duración media de 1 200 horas con una desviación típica de 100 horas. Si se toman
muestras al azar de 125 pilas de cada fabricante, ¿cuál es la probabilidad de que las
pilas de A tengan una duración media que sea al menos 160 horas más, que las pilas
deB?
Resp. 0.9772
17. A y B fabrican dos tipos de cables, que tienen unas resistencias medias a la rotura de
4 000 y 4 500 kg, con desviaciones típicas de 300 y 200 kg, respectivamente. Si se
comprueban 100 cables de A y 50 cables de B, ¿cuál es la probabilidad de que la
media de resistencia a la rotura de B sea al menos 600 kg más que A?
Resp.; 0.0078
40
________________________________________________________DISTRIBUCIONES MUESTRALES
Resp. 0.0228
19. Cuando se prepara un lote de cierto producto químico, la cantidad de una impureza
del lote es una variable aleatoria, con valor medio de 4 gr, y desviación estándar de
15 gr. Si se preparan 50 lotes de manera independiente, ¿cuál es ia probabilidad
(aproximada) de que la cantidad promedio de la muestra de impureza X sea entre
3.5 y 3.8 gr?
Resp. 0.1642
20. Supóngase que una investigación efectuada recientemente revela que el 60% de los
adultos de una población no son fumadores. Si se toma una muestra aleatoria de 600
adultos, encuentre e interprete la media y la desviación estándar de la distribución de
muestreo.
Resp. 360,12
21. Una población está formada por los números 3, 7, 11, 15. Considerar todas las
posibles muestras de tamaño dos, que pueden encontrarse de esta población SIN
reemplazamtento. Hallar:
a) La media poblacional
b) La desviación típica poblaciona!
c) La media de la distribución muestral de medias
d) La desviación típica de la distribución muestral de medias
Resp. a) 9.0
b)4.47
c)9.0
d)2.58
41
CAPITULO II _____________________________________________________________________
22. Un proceso para llenar botellas de soda presenta una producción promedio en la que
el 10% de las botellas no están completamente llenas. Si mediante este proceso se
selecciona al azar una muestra de 225 botellas de un lote de 625 envases llenos,
¿cuál es la probabilidad de que la proporción muestral de botellas parcialmente llenas
se encuentre en el intervalo que va del 9 al 11%?
Resp. 0.4680
23. Calcular el valor del factor de corrección para una población finita cuando « = 10 y
N=1000.
24. Si un bote de un galón de cierta clase de pintura cubre en promedio 513.3 pies
cuadrados, con un desviación estándar de 31.5 píes cuadrados, ¿cuál es la
probabilidad de que el área media cubierta por una muestra de 40 de estos botes esté
entre 510 y 520 pies cuadrados?
Resp. 0.6553
25. Una máquina vendedora de refrescos está programada para que la cantidad de
refresco que se sirva sea una variable aleatoria, con una media de 200 mi y una
desviación estándar de 15 mi. ¿Cuál es la probabilidad de que la cantidad de refresco
promedio (media) servida en una muestra tomada al azar de 36, sea cuando menos
de 204 mi?
Resp. 0.0548
42
__________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA
CAPÍTULO III
111.1 Estimación
Puesto que las poblaciones se caracterizan por medidas descriptivas numéricas llamadas
parámetros, la inferencia se ocupa de hacer inferencias acerca de los parámetros de una
población.
La inferencia estadística consiste en aquellos métodos con 1os cuales se pueden realizar
generalizaciones acerca de una población.
El estadístico que se utiliza para obtener una estimación puntual recibe el nombre de
estimador.
parámetro si
43
CAPITULO III ____________________________________________________________________
a) insesgado
b) consistente
c) eficiente
d) suficiente
utiliza toda la información que posee una muestra sobre el parámetro que se estima.
44
__________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA
Como las estimaciones de punto rara vez serán iguales a los parámetros que se supone
estiman, por lo general es deseable damos alguna libertad de acción mediante el uso de
"estimaciones de intervalo".
45
CAPITULO III ____________________________________________________________________
46
___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA
Tal que:
donde:
47
CAPITULO III ____________________________________________________________________
donde
48
___________________________________________ESTIMACIÓN E INTERVALOS DE CONFIANZA
por lo tanto
49
CAPITULO III____________________________________________________________________
Ejemplo núm. 1
Solución
Datos
Justificación teórica
Intervalos de confianza para proporciones (grandes muestras)
50
___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA
Ejemplo núm. 2
Un estudio señala que 16 de 200 tractores producidos en una línea de ensamblado requieren
ajustes minuciosos antes de ser embarcados, y lo mismo sucede con 14 de 400 tractores
producidos en otra linea de ensamblado. Calcúlese el intervalo de confianza del 95% para
Solución
Datos
51
CAPITULO III _____________________________________________________________________
Justificación teórica
Intervalos de confianza para diferencia de proporciones para muestras grandes.
Ejemplo núm. 3
Solución
Datos
52
__________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA
Justificación teórica
Intervalos de confianza para con muestras pequeñas:
Quiere decir que el intervalo al 99% de confianza entre 2.92 gr. y 3.92 gr., contiene la pérdida
promedio del peso.
Ejemplo núm. 4
Los siguientes datos son las horas hombre que semanalmente se pierden en promedio pa
accidentes en 10 plantas industriales, antes y después de que se implante cierto programa d€
seguridad
53
CAPITULO III ______________________________________________________
Solución
Datos
Justificación teórica
Intervalo de confianza para pequeñas muestras:
54
___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA
Ejemplo núm. 5
Solución
Datos
Justificación teórica
Intervalo de confianza para la varianza:
55
CAPITULO III _____________________________________________________________________
Ejemplo núm. 6
99%, ¿qué se puede decir acerca del error máximo, si se emplea como una
Solución
Datos
56
___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA
Justificación teórica
Error:
1. La media y la desviación de las cargas máximas soportadas por 60 cables son dadas
por 11,09 ton y 0.73 ton respectivamente. Hallar los límites de confianza del 95% para
la media de las cargas máximas de todos las cables producidos por la compañía.
Resp.{10.9,11.27)
57
CAPITULO III ____________________________________________________________________
Resp.57.7
Resp.102.12 113.88
Tamaño de la muestra
Media muestral
Varianza de la población
Obténganse los límites inferior y superior del intervalo de confianza del 95% para la
verdadera diferencia entre el contenido promedio de alquitrán de los cigarrillos marca I
y de los cigarrillos marca II
Resp.
58
_________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA
Resp. [0.0735,0.1265]
10. De 270 consumidores encuestados 189 indicaron que estarían dispuestos a pagar
más por un empaque resistente al manejo indebido. Calcular un intervalo de confianza
del 95% para la proporción p. Resp. [64,5, 75.5]
59
CAPITULO III ___________________________________________________________________
12. Se toman 16 tazas de café de una máquina y se miden. Se determina que la media y
la desviación típica son 7.5 y 0.8 mi, respectivamente. Determine el intervalo de
confianza del 99% para
14. Construya un intervalo de confianza del 94% de la diferencia real entre las duraciones
en promedio de dos tipos de focos eléctricos, dado que una muestra tomada al azar
de 40 focos de un tipo duró en promedio 418 horas de uso continuo y 50 focos de otra
60
__________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA
clase duraron en promedio 402 horas. Las desviaciones estándar de las poblaciones,
16. Un educador desea determinar si dos distintos métodos de enseñanza tienen efectos
idénticos en el aprendizaje. Se seleccionan aleatoriamente dos clases de estudiantes
y se exponen a (os dos métodos diferentes; después se aplica a las dos clases un
examen estándar, que abarca los contenidos enseñados, para determinar la
efectividad de los métodos. A continuación se muestran los datos:
Clase I Clase II
Tamaño de la muestra
Puntuación promedio de la prueba
Varianza muestral
61
CAPITULO III ____________________________________________________________________
Determinar el intervalo de confianza del 95% para la verdadera diferencia entre las
dos medias poblacionales en base a la diferencia entre las dos medias muéstrales.
17, Si se tiene que 132 de 200 votantes del distrito A favorecen a un candidato dado para
la elección del senado y 90 de 150 votantes del distrito B se expresan a favor de este
diferencia entre las proporciones reales de votantes de los dos distritos favorables al
candidato,
Resp.
62
___________________________________________ESTIMACIÓN E INTERVALOS DE CONFIANZA
Marca A Marca B
21. A partir de una muestra de 200 observaciones se encontró que, en una remesa, había
20 acumuladores defectuosos. Utilizando un intervalo de confianza del 99%, calcule el
error de estimación.
Resp. c = 0.055
22. ¿Qué tamaño de muestra será necesario para producir un intervalo de confianza del
90%, en el caso de la media de la población verdadera, con un error de 1.0 en
cualquier sentido, si la desviación estándar de la población es 10.0?
Resp. 273
63
CAPITULO m _________________________________________________________
23. Determine un intervalo de confianza de 95% para los dos casos siguientes:
a) = 1000
b) = 200
Resp.
a) 15 ±
0.372
24. Una muestra al azar de 100 observaciones tiene una media de 30 y una desviación
estándar de 5.
a) Obtenga un valor con el cual usted tenga 95% de confianza de que no
excederá la media de la población
b) ¿Cuál es la probabilidad (riesgo) de que
Resp.
a) 30.825
b) 0.0228
64
_______________________________________________________________ PRUEBAS DE HIPÓTESIS
CAPÍTULO IV
Pruebas de hipótesis
Se definirán los dos tipos de hipótesis que se requiere formular. La que señala que la
segunda, que afirma que la proposición es falsa, se denomina hipótesis alterna y se designa
mediante el signo
Existen dos tipos de errores que son inherentes al proceso de la prueba de significación
65
CAPITULO IV ____________________________________________________________________
Si es:
Verdadera Falsa
Una prueba de hipótesis de una sola cola indica que la región de rechazo se localiza
únicamente en un extremo de la distribución muesíral del estadístico de prueba.
Para detectar que la región de rechazo debe situarse en la cola inferior derecha de
la distribución.
Para detectar que la región de rechazo debe situarse en la cola inferior izquierda de
la distribución.
66
________________________________________________________________ PRUEBAS DE HIPÓTESIS
Una prueba de hipótesis de dos cotas indica que la región de rechazo se localiza en los dos
región de rechazo debe situarse equitativamente en los extremos de las colas derecha e
izquierda.
1. Planteamiento de hipótesis
2. Graficar
6. Interpretaciones y conclusiones.
tamaño n, tomada de una población normal con la varianza conocida Y las regiones
críticas de fas alternativas respectivas son:
67
CAPITULO IV____________________________________________________________________
donde
son respectivamente:
68
________________________________________________________________ PRUEBAS DE HIPÓTESIS
Quizás se desea decidir, sobre la base de muestras adecuadas, si los hombres pueden
realizar cierta tarea a mayor velocidad que las mujeres, o bien quizás se desea decidir, sobre
la base de un estudio de muestra apropiado, si los gastos semanales promedio en
alimentación de las familias de una ciudad exceden los gastos de familias de otra ciudad en
menos de $5.
donde:
muestras sean lo suficientemente grandes para que se invoque el teorema del límite central.
69
CAPITULO IV ___________________________________________________________________
venido analizando no puede aplicarse. Sin embargo, en relación con muestras aleatorias
independientes tomadas de dos poblaciones normales con la misma varianza desconocida
La expresión anterior de í es un valor de una variable aleatoria que tiene la distribución / con
70
______________________________________________________________ PRUEBAS DE HIPÓTESIS
respectivamente,
71
CAPITULO IV____________________________________________________________________
Dada una muestra aleatoria de tamaño n , tomada de una población normal, desearemos
bien la técnica de la razón de verosimilitud nos lleva a obtener una prueba basada
1. son independientes
de libertad.
Podemos expresar las regiones críticas para probar la hipótesis nula, contra las dos
72
________________________________________________________________ PRUEBAS DE HIPÓTESIS
Donde
luego igual a
73
CAPITULO IV____________________________________________________________________
de libertad.
74
________________________________________________________________ PRUEBAS DE HIPÓTESIS
Ejemplo núm. 1
Sea un fabricante de neumáticos, que aseguraba que éstos tenían una vida útil de por lo
menos 40 000 km. Supóngase que los resultados de la prueba fueron los siguientes: una
muestra de n = 49 , con un valor medio muestral de 38 000 km. Si se sabe que el recorrido
de los neumáticos de la población tiene una desviación estándar de 3 500 km, comprobar
hipótesis del fabricante. Considerar = 0.05
Solución
Datos
Justificación teórica
1er. paso
75
CAPITULO IV ____________________________________________________________________
2do. paso
3er. paso
Se acepta
Se rechaza
5to. paso
6to. paso
Ejemplo núm. 2
Solución
Datos
Justificación teórica
Prueba de hipótesis para proporciones
1er. paso
77
CAPITULO IV ____________________________________________________________________
2do. paso
3er. paso
Se acepta
Se rechaza
5to. paso
6to. paso
Como se rechaza
78
________________________________________________________________ PRUEBAS DE HIPÓTESIS
Ejemplo núm. 3
En la comparación de dos tipos de pintura, una agencia de servicio ai consumidor decide que
cuatro latas de un galón de una marca cubre en promedio 512 pies cuadrados con una
desviación estándar de 31 pies cuadrados, mientras que cuatro latas de un galón de otra
marca, cubren en promedio 492 pies cuadrados con una desviación estándar de 26 pies
en el nivel de significancia
Supóngase que las dos poblaciones son normales y tienen varianzas iguales:
Solución
Datos
Probar
Justificación teórica
Prueba de hipótesis para diferencia de medias para pequeñas muestras
79
CAPITULO IV
1er. paso
2do. paso
3er paso
5to. paso
80
________________________________________________________________ PRUEBAS DE HIPÓTESIS
6to. paso
Quiere decir que la diferencia entre las dos medias de la muestra bien puede deberse
al azar.
Ejemplo núm. 4
alternativa con
Solución
Datos
81
CAPITULO IV ____________________________________________________________________
Justificación teórica
1er. paso
2do. paso
3er. paso
5to. paso
82
________________________________________________________________ PRUEBAS DE HIPÓTESIS
6to, paso
Como se rechaza
Ejemplo núm. 5
Solución
Datos
Justificación teórica
Prueba de hipótesis para dos variaciones
1er. paso
83
CAPITULO IV ____________________________________________________________________
2do. paso
3er. paso
Se acepta
Se rechaza
5to. paso
6to. paso
Como se acepta
84
_______________________________________________________________ PRUEBAS DE HIPÓTESIS
Resp. se rechaza Ho
2. Sea X el salario mensual inicial para alguien que acaba de graduarse de una
universidad. Se sospecha que el salario medio mensual es de $1 200 y no $1 200 o
menos, como alguien predijo. Considérese que se sabe que la varianza de X es $2
500, Se toma una muestra aleatoria de 100 graduados y se determina la media
Resp. Se acepta Ho
promedio de las puntuaciones de la prueba de los estudiantes de primer año del 2002, es
diferente de 500?
Resp. Se acepta Ho
5. Supóngase que las especificaciones de cierto tipo de cinta afirman que el producto
tiene una resistencia media a la ruptura de 185 Ib y que cinco piezas seleccionadas al
azar de diferentes rollos tienen una resistencia media a la ruptura de 183.1 Ib con una
desviación estándar de 8.2 Ib, Suponiendo que podemos considerar los datos como
una muestra tomada al azar de una población norma!, pruebe la hipótesis nula
contra la hipótesis alternativa
Resp. Se acepta Ho
6. Debido a las múltiples ventajas que cierto vendedor de automóviles ofrece a sus
clientes, se sospecha que su margen promedio de beneficio por automóvil vendido,
está por abajo del promedio nacional de $500. Se realiza un estudio para determinar
si realmente este es el caso. Una muestra aleatoria de 25 ventas muestra una media
muestral de $485 y una desviación típica (s) de $45. Considerando que el margen de
beneficio por cada automóvil vendido por este comisionista se distribuye
normalmente, ¿puede llegarse a ía conclusión de que su margen promedio de
86
________________________________________________________________ PRUEBAS DE HIPÓTESIS
Resp. se acepta Ho
8. Las especificaciones para cierta cíase de banda exigen una resistencia media a la
ruptura de 180 kg. Si cinco de las bandas (aleatoriamente seleccionadas en diferentes
cajas) tienen una resistencia media de 169.5 kg, con una desviación estándar de 5.7
Resp. Se rechaza Ho
Resp. Se rechaza Ho
87
CAPITULO IV ___________________________________________________________________
10. Un importante fabricante de dulces asegura que menos del 3% de las bolsas de
lunetas de chocolate están por debajo del nivel de llenado. Una comprobación
aleatoria revela que 4 de 50 bolsas se encuentra en esta situación. La muestra fue
tomada de una remesa de 400 bolsas de lunetas. ¿Refuta la evidencia muestral la
afirmación del fabricante (es decir, hay más del 3% de bolsas que no están
completamente llenas)? Considerar a = 0.05
Resp. Se rechaza Ho
11. Supóngase que cierto programa de noticias generalmente atrae el 50% de todos
aquellos que ven la televisión durante el periodo en que el programa sale al aire. El
conductor habitual ha renunciado y se ha contratado a una mujer para reemplazarlo.
La gerencia de la red televisiva desea determinar si con la nueva conductora ha
aumentado el porcentaje de personas que ven el programa. Si se realiza una
encuesta telefónica, se descubre que 55 de 100 personas que ven la televisión
mientras el programa de noticias está en el aire, ven este programa en particular.
Pruébese la hipótesis de que el porcentaje de aquellos que ven el programa
permaneció sin cambio, contra la alternativa de que ha aumentado, para 0.05.
Resp. Se acepta Ho
Resp. Se rechaza Ho
88
PRUEBAS DE HIPÓTESIS
en ?
Resp. Se rechaza Ho
89
CAPITULO IV ___________________________________________________________________
0.05?
Resp. Se rechaza Ho
17. Una compañía asegura que sus lámparas incandescentes son superiores a las de su
lámparas tienen una vida útil media de 647 horas, con una desviación estándar de 27
una vida útil media de 638 horas de uso continuo, con una desviación estándar de 31
horas, ¿se debe aceptar la afirmación con un nivel de significación de 0.05?
Resp. Se acepta Ho
18. A los votantes de dos ciudades se les pregunta si se pronuncian a favor o en contra
de una ley, actualmente en estudio en la legislatura del estado. Para determinar si los
votantes de las dos ciudades difieren en términos del porcentaje que votan a favor, se
toma una muestra de 100 votantes de cada ciudad. Treinta de los muestreados de
una ciudad están a favor, en tanto que, en la otra, lo están veinte.
Resp. Se acepta Ho
90
_______________________________________________________________ PRUEBAS DE HIPÓTESIS
19. Un educador desea determinar si dos distintos métodos de enseñanza tienen efectos
idénticos en el aprendizaje. Se seleccionan aleatoriamente dos clases de estudiantes
y se exponen a los dos métodos diferentes. Después se aplica a las clases un
examen estándar, que abarca los contenidos enseñados, para determinar la
efectividad de los dos métodos, Los datos son los siguientes:
Clase I Clase II
Tamaño de la muestra -
Puntuación y promedio de la prueba
Varianza muestral
Considerando que las puntuaciones de prueba para todos los posibles estudiantes a
los que se haya enseñado con cada método se distribuyen normalmente y tienen
varianza idéntica pruébese la hipótesis nula de que los dos métodos de enseñanza
son igualmente efectivos para (a)
91
CAPITULO IV ___________________________________________________________________
21. Se sabe que la varianza de la resistencia a la ruptura, en kg. de cierto tipo de cable
fabricado por una compañía es de cuando más 40 000. Sin embargo se sospecha que
después de empezar a utilizar un nuevo proceso de fabricación, la varianza de la
resistencia a la ruptura ha aumentado. Una muestra de diez cables seleccionados
aleatoriamente muestra que la varianza de la resistencia a la ruptura es 50 000.
Considerando que la resistencia a la ruptura se distribuye normalmente, ¿debería
llegarse a la conclusión de que existe un incremento significativo en la variabilidad, si
el nivel es
Resp, Se acepta Ho
22. El proceso que se usa para esmerilar ciertos discos de silicio al grueso apropiado es
Resp. Se acepta Ho
92
________________________________________________________________ PRUEBAS DE HIPÓTESIS
Problemas varios
23. La siguiente información sobre el máximo peso de levantamiento (MAWL en kg) para
una frecuencia de cinco levantamientos por minuto, se reportó en el artículo "The
effects of speed frequency and load on measured hand forces for a floor to knuckie
lifting task" (Ergonomics 1922 pp. 833-843); se seleccionaron personas al azar de una
población de hombres sanos entre 18 y 30 años de edad. Si se supone que el MAWL
está normalmente distribuido, ¿sugiere esta información que la media poblacional de
MAWL excede de 25? Realizar una prueba usando un nivel de significación de 0.05.
sean los datos 25.8, 36.6,26.3, 21.8 y 27.2
Resp. Ho no se puede rechazar
24. Se está considerando cierto tipo de ladrillo para usar en un proyecto de construcción
en particular. Se utilizará el ladrillo a menos que una evidencia muestral sugiera
fuertemente que el verdadero promedio de resistencia a la compresión se encuentra
por debajo de 3 200 Ib/pulg2. Se selecciona una muestra aleatoria de 36 ladrillos y
cada una se somete a una prueba de resistencia a la compresión. El promedio
muestral resultante de resistencia a la compresión y la desviación estándar muestral
de resistencia a la compresión son 3 109 y 156 Ib/pulg2 respectivamente. Establezca
las hipótesis pertinentes y realice una prueba para llegar a una decisión con un nivel
de significación de 0.05.
Resp. se rechaza Ho a nivel 0.05
25. Muchos consumidores están recurriendo a productos genéricos, como una forma de
reducir el costo de medicamentos por prescripción. El articulo "Commercial
Information on Drugs: Confusing to the Physician" (J. of Drug Issues, 1988, pp. 245-
257) da el resultado de un estudio de 102 médicos. Sólo 47 de estos médicos
entrevistados conocía el nombre genérico de la metadona. ¿Proporciona esto fuerte
evidencia para concluir que menos de la mitad de todos lo médicos conocen el
93
CAPITULO IV ___________________________________________________________________
94
ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
CAPÍTULO V
V.1 Introducción
El análisis de correlación produce un número que resume el grado de relación entre dos
variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha
relación.
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación
matemática lineal que describa la relación entre dos variables.
Una forma de emplear las ecuaciones de regresión es para explicar los valores de una
variable en términos de la otra. Es decir, se puede intuir una relación de causa y efecto entre
dos variables. Por ejemplo, un economista puede intentar explicar los cambios en la demanda
de automóviles usados, en términos del nivel de desempleo. Un agricultor puede creer que la
cantidad de fertilizantes que utilizó influyó en la cosecha lograda. La velocidad de un automóvil
podría ser un factor para determinar la distancia de frenado.
Otro uso de la ecuación de regresión es para predecir ios valores futuros de una variable.
95
CAPÍTULO V _____________________________________________________________________
La pendiente de la recta ub" indica la intensidad de cambio de "y" por unidad de cambio de Y
osea
Pendiente
96
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
Sea
donde
es mínimo
entonces:
Despejando:
97
CAPITULO V ____________________________________________________________________
Un estimador para
en donde:
La primera inferencia que se debe hacer cuando se estudia la relación entre"/' y "x" concierne a
la existencia misma de dicha relación. En otras palabras, se quiere contestar a las siguientes
preguntas: ¿Muestran los datos suficiente evidencia como para pensar que el conocimiento de
V contribuye para predecir y, en alguna región de observación?, ¿al contrario, se puede
considerar que es bastante probable que, aun sin estar"/ y "x" relacionadas, los puntos
observados formen un diagrama de dispersión?
98
_____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
Las preguntas desde el punto de vista práctico se refieren al valor de "b", e! cambio medio que
se experimenta en Y por unidad de cambio en "x". El decir que V no proporciona
información para predecir "y", es equivalente a decir b = 0 (si b = 0, se predice siempre el
mismo valor para */ sin importar cuál sea el valor de "x"). Así que lo primero que hay que
5to. paso
Encontrar
99
CAPÍTULO V_____________________________________________________________________
Una vez que se ha decidido que b es diferente de 0, resulta de interés examinar con mayor
detalle la relación entre "y" y "x". ¿Si x aumenta una unidad cuál será e! cambio estimado para
"/ y qué confianza se puede tener en dicha estimación?
El término "correlación" literalmente significa relación mutua, ya que indica el grado en el que
los valores de una variable se relacionan con los valores de otra.
Por ejemplo: los valores próximos a -1 o +1 indican que los valores están bastante cerca de la
recta o sobre ella, mientras que los valores próximos a 0 sugieren mayor dispersión.
100
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
Ninguna correlación
101
CAPÍTULO V______________________________________________________________________
Ejemplo núm.1
102
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
Solución
Justificación teórica
Sustituyendo:
103
CAPÍTULO V_____________________________________________________________________
diagrama de dispersión
curva de ajuste
104
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
Ejemplo núm. 2
Solución
Justificación teórica:
Sustituyendo:
105
CAPITULO V _____________________________________________________________________
Ejemplo núm.3
Utilice los datos del ejemplo 1 para determinar si existe evidencia que indique que "b" difiere
de 0 al utilizar una relación lineal entre el gasto publicitario V y el volumen mensual medio"/
de ventas con = 0.05.
Solución
1er paso
2o. paso
3er. paso
está en el intervalo
4o. paso
Regla de decisión
5o. paso
106
_____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
6° paso
se rechaza deque
7°. paso
Se concluye que hay evidencia que indica que los gastos publicitarios
proporcionan información para predicción de los volúmenes mensuales de
ventas.
Ejemplo núm. 4
Encontrar el intervalo de confianza del 95% para "b" basándose en los datos del ejemplo 1:
Solución
Justificación teórica:
107
CAPÍTULO V _____________________________________________________________________
Sustituyendo:
Lo anterior quiere decir que si se aumenta en una unidad la "x", esto es, si se aumenta
en $10,000 eí gasto publicitario, se estima que el aumento en los volúmenes
mensuales de venía correspondientes será entre 28.90 y 76.24 o en las unidades
originales para y será entre $289,000 y $762,400.
Ejemplo núm. 5
Solución
108
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
1 40 $1000
2 30 1500
3 30 1200
4 25 1800
5 50 800
6 60 1000
7 65 500
8 10 3000
9 15 2500
10 20 2000
11 55 800
12 40 1500
13 35 2000
14 30 2000
Resp. 2934-38.56x
109
CAPÍTULO V
1 3 5
2 2 4
3 4 4
4 12 9
5 11 8
6 8 9
7 9 7
8 7 8
9 6 5
10 5 6
11 4 8
12 8 4
13 3 7
14 12 6
15 9 8
16 8 5
17 11 10
18 7 7
19 8 6
20 10 5
110
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
1 1.5 4.8
2 1.8 5.7
3 2.4 7.0
4 3.0 8.3
5 3.5 10.9
6 3.9 12.4
7 4.4 13.1
8 4.8 13.6
9 5.0 15.3
Resp. = 0.292
7. Encuentre un intervalo de confianza del 95% para la pendiente, basado en los datos
del ejercicio 5.
Resp. (2.57722,3.28338)
111
CAPÍTULO V ____________________________________________________________________
Resp. Se acepta Ho
9. Los siguientes datos son las mediciones de la velocidad del aire y det coeficiente de
evaporación de las gotitas de combustible en un turbina de propulsión.
20 0.18
60 0.37
100 0.35
140 0.78
180 0.56
220 0.75
260 1.18
300 1.36
340 1.17
380 1.65
Ajústese a una línea recta a estos datos por el método de mínimos cuadrados y
utilícese para estimar el coeficiente de evaporación de una gotita, cuando la velocidad
del aire es de 190 cm/seg.
Resp. y = 0.069+ 0.0038x
y = 0.79
112
____________________________________________ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
10. Emplee los siguientes valores de resumen para determinar las ecuaciones de
regresión para determinar las ecuaciones de regresión:
a)
b)
c)
d)
Resp.
11. Determine una ecuación que describa la relación entre la frecuencia de accidentes y
el nivel de educación preventiva en lo referente a los siguientes datos:
113
CAPÍTULO V
114
_____________________________________________ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
13. Para el ejercicio 12, construya un intervalo de confianza del 95% para la pendiente.
Resp. [0.432,3.168]
115
CAPÍTULO V ____________________________________________________________________
b) y = 7.26
Resp.
18. Utilice los datos del ejercicio 16, para determinar si existe evidencia que indique que
difiere de al utilizar una relación lineal entre
Resp. Se rechaza Ho
19. Encontrar el intervalo de confianza del 95% para basándose en los datos del
ejercicio 16.
Resp. [0.6318,0.6882]
20. Calcular el coeficiente de correlación, para los datos del ejercicio 16.
Resp. r = 0.94
21. Se tiene un registro de los costos de mantenimiento para sus máquinas idénticas de
distintas edades. Por parte de la gerencia se desea determinar si existe una relación
funcional entre la edad de la máquina "x" y el costo de mantenimiento "y". Se obtienen
los siguientes datos:
116
______________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN
Máquina
$135
22. Calcular un estimador de para los datos del ejercicio 21.
Resp.
23. Utilice los datos del ejercicio 21 para determinar si existe evidencia que indique que
difiere de al utilizar una relación lineal entre
Resp, Se rechaza Ho
24. Encontrar el intervalo de confianza del 95% para "bn, basándose en los datos del
ejercicio 21.
Resp.
117
ESTADÍSTICA _______________________________________________________________ _ _ _
Bibliografía
CHRISTENSEIsl, Howard B. Estadística paso a paso. 2a Edición. Editorial Trillas. México, 1992.
118
________________________________________________________________________ BBLIOGRAFÍA
FRANCO ESPEJEL, Gilda Melva y otros. Probabilidad y Estadística. Editorial Spanta. México,
1998.
119
ESTADÍSTICA ___________________________________________________________________
120
BBLIOGRAFÍA
SPIEGEL, Murray. Estadística. 2da. ed.; México. Editorial Me Graw I—lili, 1991.
121
________________________________________________________________________ ÍNDIC
E
Índice alfabético
123
_________________________________________________________________________ ÍNDICE
124
Impreso en los Talleres Gráficos
de la Dirección de Publicaciones
del INSTITUTO POLITÉCNICO NACIONAL,
Tresguerras 27, 06040 México, DF
Noviembre 2006. Edición: 1 000 ejemplares.