Sunteți pe pagina 1din 138

ESTADÍSTICA

Estadística

Dra. Gilda Melva Franco Espejel * UPIICSA - IPN,


Academias de Matemáticas

Lie. Martha Leticia Hernández * UPIICSA- IPN,


Academias de Matemáticas

Lie. Ernesto García García *


UPIICSA- IPN, Academias de Matemáticas

Ing. Rodolfo Matus Quiroz *


UPIICSA - IPN, Academias de Matemáticas

* Becario del Sistema de Becas por exclusividad, COFAA - IPN


* Participantes del Programa de Estímulo al Desempeño Docente - IPN
ESTADÍSTICA
Primera edición: 2003
Primera reimpresión: 2006

© DR 2003. INSTITUTO POLITÉCNICO NACIONAL


Unidad Profesional ínterdisciplinaria de
Ciencias Sociales y Administrativas

Queda prohibida la reproducción total o parcial de esta obra


por cualquier medio o procedimiento, sin la autorización
escrita del editor

ISBN 970-92240-5-0

Impreso en México / Printed in México


PRÓLOGO

La Unidad Profesional Interdiscipiinaria de Ingeniería y Ciencias Sociales y Administrativas


(UPHCSA) del Instituto Politécnico Nacional promueve entre su personal académico el diseño
y la elaboración de material didáctico para ofrecer a los estudiantes de las diversas
licenciaturas que se imparten libros de texto acordes al contenido y enfoque de cada
asignatura a precios accesibles en comparación con los disponibles en el mercado.
Con base en lo anterior, y atendiendo a esta iniciativa, nos hemos sumado a este
esfuerzo dando como resultado esta obra denominada "Estadística11, producto derivado del
proyecto de investigación "Material Didáctico para la Enseñanza del Cálculo Integral y la
Estadística", con número de registro CGPI 20031888. Esta obra está dirigida a estudiantes de
nivel licenciatura de las ramas de ingeniería, ciencias médico-biológicas y ciencias sociales y
administrativas que desean una buena base de conceptos y técnicas estadísticas de manera
sencilla y accesible para su comprensión y dominio que les permita aplicarlos a problemas
propios de su actividad profesional para facilitarles la toma de decisiones
En términos generales, cuando se habla de estadística con el común de las personas,
de inmediato se relaciona con porcentajes, promedios y gráficas. Para los más estudiosos,
estadística es una disciplina basada en conceptos, reglas, técnicas y métodos para manejo de
información.
De igual manera, la información estadística que nos llega cotidianamente a través de
los medios masivos de comunicación (prensa, radio, televisión, etc.) influye en nuestra
comprensión de las cosas y, en consecuencia, en tomar decisiones que pudieran afectar
nuestra forma de vida. De manera similar ocurre con las empresas que, para subsistir,
continuamente toman decisiones con base en la información estadística disponible, tanto la
obtenida en un contexto político, económico y social nacional e internacional, como la que se
genera de manera interna por la propia empresa.
De aquí, la importancia de estudiar formalmente la estadística y sus técnicas para
entender y comprender mejor el mundo que nos rodea que nos permita la racional toma de
decisiones.
El contenido de este texto requiere, para su estudio, de un amplio conocimiento y
pleno dominio del Cálculo Diferencial e Integral y un curso introductorio de Probabilidad.
Esta obra está estructurada en dos grandes apartados: Estadística Descriptiva y
Estadística Inferencia!. El contenido temático comienza por las Distribuciones Frecuenciales y
las Distribuciones Muéstrales para continuar con los conceptos de Estimación de Intervalos de
Confianza; posteriormente, se plantean las Pruebas de Hipótesis y los Análisis de Regresión y
Correlación.
Los temas son presentados con la base teórica necesaria, sacrificando muchas veces
el rigor matemático en aras de una mejor comprensión y dominio operativo de las técnicas
estadísticas básicas, a través una serie de ejemplos ilustrativos resueltos.
Asimismo, con el propósito de evaluar el aprendizaje, se presenta al final de cada
capítulo una serie de ejercicios propuestos, con su correspondiente solución, para que el
estudiante resuelva y verifique los resultados obtenidos.
Se agradecerá al lector cualquier comentario o sugerencia que contribuya a mejorar el
contenido y alcances de esta obra.

Los Autores
______________________________________________________________________________ Contenido

CONTENIDO

CAP. Pág.

I Distribuciones frecuencíales 1
1.1 Distribuciones frecuencia les de datos no agrupados 2
1.1.1 Medidas de tendencia central 2
1.1.2 Medidas de dispersión 4
1.2 Distribuciones frecuenciales de datos agrupados 5
1.2.1 Medidas de tendencia central 6
1.2.2 Medidas de dispersión 8

1.3 Gráficas 8
1.4 Ejemplos resueltos 9
1.5 Problemas propuestos 15

II Distribuciones muéstrales 27
11.1 Distribución muestral de medias 27
11.2 Teorema del limite central 28
11.3 Distribución muestral de diferencia de medias 29
11.4 Distribución muestral de proporciones 29
11.5 Ejemplos resueltos 31
11.6 Problemas propuestos 36

III Estimación e intervalos de confianza 43


II 1.1 Estimación 43
III.2 Intervalos de confianza 45

111.2.1 Intervalos de confianza para conocida 45

III,2.2 Intervalos de confianza para desconocida 46

III.2.3 Intervalos de confianza para

conocidos 46
III
Contenido

111.2.4 Intervalos de confianza para


desconocidos 47
111.2.5 Intervalos de confianza de muestra grande para p 47
111.2.6 Intervalos de confianza para 48

111.2.7 Intervalos de confianza para 48

111.2.8 Intervalos de confianza para 49

111.3 Tamaño de muestra y error de estimación 49


111.4 Ejemplos resueltos 50
111.5 Problemas propuestos 57

IV Pruebas de hipótesis 65
IV.1 Tipos de hipótesis 65
IV.2 Tabla de errores tipo I y II 66
IV.3 Hipótesis de una cola y de dos colas 66
IV.4 Procedimiento para resolver una prueba de hipótesis 67
IV.5 Pruebas relativas a medias
(grandes muestras y pequeñas muestras) 67
IV.6 Pruebas relativas a diferencia entre medias
(grandes muestras y pequeñas muestras) 69
1V.6.1 Teorema del limite central 70
IV.7 Pruebas para proporciones en la población 71
IV.8 Pruebas relativas a varianzas 72
IV.9 Hipótesis relativas a dos variancias 73
IV.10 Ejemplos resueltos 75
IV.11 Problemas propuestos 85

IV
Contenido

V. Análisis de regresión y correlación 95


V.1 Introducción 95
V.2 Método de mínimos cuadrados 97
V.3 Calculo de un estimador de 98

V.4 Inferencias relativas a la pendiente ib de una recta. 98


V.4.1 Método para desarrollar una prueba de hipótesis 99
V.5 Intervalo de confianza par la pendiente b 100
V.6 Análisis de correlación 100
V.7 Ejemplos resueltos 102
V.8 Problemas propuestos 109

Bibliografía

V
____________________________________________________ DISTRIBUCIONES FRECUENCIALES

CAPITULO I

Distribuciones frecuenciaies

El campo de la estadística trata de la recolección, presentación, procesamiento, análisis y


uso de datos para tornar decisiones, solucionar problemas y diseñar productos y procesos.

La estadística se divide en dos grandes ramas: La estadística descriptiva y la estadística


inferencial.

La estadística descriptiva traía de la descripción de una serie de datos y la estadística


inferencial estudia el análisis e interpretación de los datos para obtener conclusiones (o
inferencias).

Los métodos estadísticos se utilizan como ayuda para describir y entender la variabilidad.
Por variabilidad se entiende a las observaciones sucesivas de un sistema o fenómeno que no
producen el mismo resultado.

Por ejemplo: considérese el rendimiento del tanque de gasolina de un automóvil: ¿se


recorrerá siempre el mismo kilometraje con cada tanque de combustible? Por supuesto que
no, en ocasiones el kilometraje variará considerablemente, ya que dependerá de muchos
factores, como son: los cambios en el estado del vehículo como la presión de las llantas, la
compresión del motor, el desgaste de las válvulas; las condiciones de manejo (si es en ciudad
o en carretera), el tipo de octanaje de la gasolina utilizada, de las condiciones meteorológicas,
etc. Estos factores representan fuentes de variabilidad. Considérese la siguiente figura:

]
CAPÍTULO I _____________________________________________________________________

Frecuencia Datos u observaciones

Figura 1

Esta gráfica permite ver dos características de los datos; la localización o tendencia central y
la dispersión o variabilidad.

La localización o tendencia central, puede caracterizarse con el promedio o media.

La variabilidad o dispersión de los datos, puede describirse con la varianza o la desviación


estándar.

1.1 Distribuciones frecuenciales de datos no agrupados

Cuando la población es finita y se consideran todos !os elementos de ella (a tratar, uno a uno),
se trabaja lo que se dice una distribución de datos no agrupados.

1.1.1 Medidas de tendencia central de datos no agrupados

Son aquellas que determinan los valores centrales de los datos de un experimento. Existen
varios tipos de medidas de tendencia central, aquí estudiaremos la media, la mediana y la
moda.

2
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES

Para una serie de datos, sean:


los elementos diferentes, desde

la frecuencia con que se presentan los elementos diferentes,

desde

Se tiene que:

La media es:

La mediana que previo orden, se define según el tamaño del experimento, sea par o
impar.

¡Previo ORDEN!

Si n es impar: Si n es par:
= elemento = media aritmética de
central los elementos
centrales

La moda que será el elemento de mayor frecuencia.

elemento de mayor frecuencia

3
CAPÍTULO I ____________________________________________________________________

1.1.2 Medidas de dispersión de datos no agrupados

Son aquellas que indican el grado de dispersión o variabilidad de los datos con respecto a una
medida de tendencia central.

Como medidas de dispersión, se tienen:

El rango R es la diferencia del valor máximo menos el mínimo de los datos. Esto es,

es una sucesión de n observaciones, entonces la


varianza, esta dada por:

Nota: Si se está trabajando con una muestra, el denominador será

En donde la desviación estándar, que es otra medida de dispersión, quedará representada


por:

4
____________________________________________________ DISTRIBUCIONES FRECUENCIALES

1.2 Distribuciones frecuenciales de datos agrupados

Cuando se tiene una serie de datos de tal manera que se agrupa en clases, para resolver con
mayor facilidad de tiempo, espacio y/o dinero, se está trabajando con una distribución
frecuencial de datos agrupados.

Para un experimento formado por un número finito n de elementos con k clases de la


misma longitud, donde es decir, número de clases menor o igual que tamaño del
experimento.

Cada clase, estará formada por un limite inferior (U) y un límite superior (LS), ejemplo:

Intervalos de clase

Se hace necesario construir los límites reales. Es decir, límite real inferior (IR//) del intervalo /-
ésimo, es igual a:

y el límite real superior (LRS¡) del intervalo /-ésimo, es igual a:

5
CAPÍTULO I _____________________________________________________________________

tal que, el ejemplo queda:

LRI LI LS LRS
0.5 1 5 5.5
5.5 6 10 10.5
10.5 11 15 15.5
15.5 16 20 20.5
20.5 21 25 25.5

Sea x¡ que denota la marca de clase del intervalo /-ésimo, y que es el punto medio del

intervalo de clase, de tal forma que se calcula de la siguiente manera:

1.2.1 Medidas de tendencia central para datos agrupados

Las medidas de tendencia central para el caso de datos agrupados, se calcularán de la


siguiente manera:

Media aritmética:
marca de clase del intervalo í - ésimo
frecuencia de clase del intervalo i - ésimo

6
___________________________________________________ DISTRIBUCIONES FRECUENCIALES

Para calcular la mediana, se hace necesario primero ordenar los datos, después calcular cuál
es ia posición n/2. Es necesario ubicar en qué intervalo se encuentra dicha posición para

saber cuál es el limite real inferior de la clase mediana Hay que calcular las

frecuencias acumuladas hasta el intervalo de clase anterior a la clase mediana

es igual a la suma de las frecuencias absolutas de los

intervalos de clase anteriores hasta el intervalo / - ésimo). Después ubicar la frecuencia de


clase mediana. y finalmente calcular la longitud del intervalo de la clase mediana

Mediana:

Para la moda se elige el intervalo de mayor frecuencia y se ubica cuál es el limite real inferior

de la clase modal Se hace necesario encontrar que está definido como: la

diferencia de frecuencia de la clase modal con ei intervalo de clase anterior a la clase modal

como la diferencia de frecuencia de la clase modal con el intervalo de clase posterior a

la clase modal. Así como también calcular la longitud del intervalo de clase modal De tal

forma que queda:

7
CAPÍTULO I________________________________________________________________________

1.2-2 Medidas dt dispersión para datos agrupados

Las medidas de dispersión para el caso de datos agrupados, quedan definidas de la manera
siguiente:

Varianza =

es la marca del intervalo i - ésimo


frecuencia de clase del intervalo i - ésimo
tamaño del experimento

La desviación estándar, que se calcula como la raíz cuadrada de la vananza, es decir

Desviación estándar

1.3 Gráficas

Histogramas. Es una representación gráfica. En el eje de las abscisas los limites reales, tal
que, tos puntos medios de cada intervalo serán las marcas de clase y en el eje de las
ordenadas, las frecuencias de clase; de tal manera que quedan rectángulos.

8
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES

Polígonos de frecuencia. Es la unión de las marcas de clase en los techos de los rectángulos
en el histograma. El polígono de frecuencia debe quedar cerrado al principio y al final de la
gráfica, a través del hecho de aumentar un intervalo de clase de la misma longitud y con
frecuencia cero (esto quedará sobre el eje de las abscisas, y se unirá en la marca de clase
respectiva.)

1.4 Ejemplos resueltos

Ejemplo núm. 1

Considerar la siguiente serie de datos: 8,7,6,5,9,15,14,13,11,7,12 calcular


a) la media aritmética,
b) la mediana,
c) la moda,
d) la varíanza y la desviación estándar
e) graficar.

Solución

a) Ordenando los datos:

9
CAPÍTULO I _____________________________________________________________________

xt f(x¡)

5 1
6 1
7 2
8 1
9 1
11 1
12 .1
13 1
14 1
15 1

Justificación teórica

b) Ordenando los datos

elemento central
Mediana = 9
c) Moda, elemento de mayor frecuencia.
Moda = 7

d) La varianza está dada por:

10
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES

e)

Gráfica

11
CAPÍTULO I _____________________________________________________________________

Ejemplo núm. 2

Calcular la mediana de la siguiente serie de datos;


2, 3, 9, 21, 18, 12, 4, 4, 15, 17

Solución

¡Ordenando los datos!


2, 3, 4, 4 F 9, 12, 15, 17, 18, 21

Los elementos centrales son el 9 y el 12, por lo que:

Mediana =

Ejemplo núm. 3

Sea la siguiente sene de datos agrupados:

a) Calcular la media aritmética


b) Calcular la mediana
c) Calcular la moda
d) Calcular la varíanza y la desviación estándar
e) Graficar histograma y polígono de frecuencia

12
______________________________________________________DISTRIBUCIONES FRECUENCIALES

Solución

a) Calculemos las marcas de clase:

13
CAPÍTULO I _____________________________________________________________________

POLÍGONO DE FRECUENCIAS

14
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES

1.5 Problemas propuestos

Datos no agrupados

1. Sea la siguiente serie de datos: 2,15, 9,16, 3,4,8,4, 5, 5, 5,8. Encontrar:


a) Medidas de tendencia central.
b) Medidas de dispersión.
c) Graficar.

Resp. media = 7, mediana = 5, moda = 5,

2. Considérese la siguiente serie de datos: 2, 3,4,4,4, 5, 7, 8, 8,9,15. Encontrar:


a) Medidas de tendencia central.
b) Medidas de dispersión.
c) Graficar.

Resp. media = 6.27, mediana = 5, moda = 4,

3. Sean los siguientes datos: 2,5,5, 5,7, 7,9,10, 15,17. Encontrar:


a) Medidas de tendencia central
b) Medidas de dispersión
c) Graficar.

Resp. media = 8.2, mediana = 7, moda = 5,

15
CAPÍTULO I _____________________________________________________________________

4. Sea la siguiente serie de datos: 2, 2,3,4, 4, 4, 5,6,7,10,10,12,13,15,2(


Encontrar:
a) Medidas de tendencia central.
b) Medidas de dispersión.
c) Gráficar.
Resp. media = 7.8, mediana = 6, moda = 4,

5. Los siguientes datos son las calificaciones de un alumno que estudia en el nivel
superior y las frecuencias con que se presentan dichas calificaciones.

Calificaciones Frecuencia

a) Encontrar las medidas de centralización.


b) Encontrar las medidas de dispersión.
c) G rafear.
Resp. a) 8.15, 8,8
b) 0.7778,0.8819

16
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES

6. Encontrar las medidas de tendencia central y las medidas de dispersión, así como su
gráfica, del siguiente conjunto de datos:

Resp. a) 2.56,2.5, 2.5


6)0.7773,0.8816

7. El número promedio de cursos aprobados de actualización, por cada profesor en una


universidad, en un periodo de un año, es como sigue: 3, 2, 0,1,1,1,1,0,1,1,1,1, 0,
1,2,2,8,5, 5, 7,4,3, 3,0 y 0. Se desea conocer:
a) Rango.
b) Medidas de centralización.
c) Medidas de dispersión.
d) Graficar. Resp. a) 8

b) 2.12,1,1
c) 4.582, 2.14

8. En una industria, se registró la siguiente producción mensual de archiveros: 1000,


1500,1800,1800,2150/2400. Calcular:
a) Medidas de centralización.
b) Medidas de dispersión,
c) Graficar polígono de frecuencias absolutas.
Resp. a) 1775,1800,1800
b) 448.84

17
CAPÍTULO I______________________________________________________________________

9. En una empresa, durantelO días, se observaron, los minutos del personal que llegó
tarde. 10,12,21,8, 6, 15,2,17,30,13
a) Calcular el Rango.
b) Medidas de centralización.
c) Medidas de dispersión.
Resp. a) 28
b) 13.4,12.5, no existe moda
c) 7.59

10. Considérese la siguiente serie de datos:

Xi frecuencia

3 1
4 1
5 2
6 2
8 3
10 4
11 5
12 7
14 4
15 1

a) Calcular las medidas de centralización


b) Calcular las medidas de dispersión.
c) Graficar.
Resp. a) 10.1,11,12
b) 9.476, 3.078

18
__________________________________________________DISTRIBUCIONESFRECUENCIALES

11. Sean los siguientes datos:


x¡ f(Xi) Xi f(Xi)
3 2 8 5
4 5 10 4
5 8 12 3
6 10 14 2
7 8 16 1

a) Graficar
b) Encontrar medidas de centralización.
c) Encontrar medidas de dispersión.
Resp. b) 7.125,6,6
c) 2.93
12. Sean los diferentes precios de unas camisas:
1000, 3000, 2500, 3500, 5000,
1500, 2700, 4500, 2700, 3500.
a) Graficar la distribución de frecuencias.
b) Calcular las medidas de tendencia central.
c) Calcular las medidas de dispersión.
Resp. b) media = 2990, mediana = 2850,
moda = bimodal = 2700 y 3500
c) 1158.83

13. Sean los siguientes datos:


Xi /(Xi) x¡ f(Xi)

10 2 50 5
20 3 60 7
30 7 70 3
40 3

19
CAPÍTULO I _____________________________________________________________________

a) Graficar.
b) Encontrar medidas de tendencia central.
c) Encontrar medidas de dispersión,
Resp, b) media = 43, mediana = 45, moda = 30,60
c ) s = 17.72

14. Sean los siguientes datos:

a) Graficar.
b) Calcular medidas de centralización
c) Calcular medidas de dispersión.
Resp. b) media = 6.052, mediana = moda = 3
c) s = 2.788
Datos agrupados

15. Sea la siguiente serie de datos agrupados:

Intervalos de clase f(xi)


1-10 2
11-20 8
21-30 10
31-40 15
41 - 50 5

20
____________________________________________________ DISTRIBUCIONES FRECUENCIALES

a) Calcular las medidas de centralización.


b) Calcular las medidas de dispersión.
c) Graficar.
Resp. a) media = 28.75, mediana = 30.5, moda = 3.83,

= 116.935, s= 10.81

16. Sea la siguiente tabla de datos:


Intervalos de clase

a) Calcular las medidas de centralización.


b) Calcular las medidas de dispersión.
c) Graficar.
Resp. a) media = 58.16, mediana = 59.59, moda = 62.8,

= 581.82,5 = 24.12

17. Sea la siguiente tabla de datos:


Intervalos de clase frecuencias

21
CAPÍTULO 1______________________________________________________________________

a) Graficar histograma y polígono de frecuencias absolutas,


b) Calcular medidas de tendencia central.
c) Calcular medidas de dispersión.

Resp. b) media = 44.9, mediana = 48.83, moda = 57.16

269.64, s = 16.42

18. Sea la siguiente tabla de datos:


LRI LRS f(Xi)
0 - 5 10
5 - 10 20
10 - 15 30
15 - 20 50
20 - 25 20
25 - 30 10

a) Graficar histograma y polígono de frecuencias absolutas.


b) Calcular medidas de tendencia central.
c) Calcular medidas de dispersión.

Resp. b) media = 15.35, mediana = 16, moda = 17,


c) s = 6.468

22
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES

19. Sean los siguientes datos:


LRI LRS

a) Graficar
b) Calcular medidas de centralización.
c) Calcular medidas de dispersión.

Resp. b) media = 21.95, mediana = 22.91, moda = 27.22,


c) s = 9.077

20. Sea la siguiente tabla de datos:

LRI LRS

23
CAPÍTULO I ______________________________________________________________________

a) Graficar
b) Calcular medidas de centralización.
c) Calcular medidas de dispersión.

Resp. b) media = 40.55, mediana = 40, moda = 56.66,


c) s = 18.019

21. Sea la siguiente tabla de datos:


U LS

a) Graficar.
b) Calcular medidas de tendencia central.
c) Calcular medidas de dispersión.
Resp. b) media = 15, mediana = 16, moda = 17.33,
c) s = 4.72
22. Sea la siguiente tabla de datos:
LI LS

24
____________________________________________________ DISTRIBUCIONES FRECUENCIALES

a) Graficar.
a) Calcular medidas de tendencia central.
b) Calcular medidas de dispersión.

Resp. b) media = 10.71, mediana = 9, moda = 7.22, c)s =


4.6

Problemas varios

23. Estimar la desviación estándar de la siguiente muestra de datos: 20,5,10,15 y 25.


Resp. 7.91

24. Obtener la variancia de ia siguiente distribución de frecuencias, mediante la fórmula:

de los siguientes
Clase

Resp. a y b 141.84

25
CAPITULO I______________________________________________________________________

25. En una exhibición científica, se anotó la edad de cada uno de los 50 visitantes que
asistieron. Hallar la media de edad y la clase a la que pertenece la mediana.

Edad Frecuencia
De 0 a < 10 6
De 10 a < 20 18
De 20 a < 30 11
De 30 a < 40 3
De 40 a < 50 0
De 50 a < 60 8
De 60 a < 70 4

Resp. media = 27.6


mediana está en la 3a clase: de 20 a < 30

26
_______________________________________________________ DISTRIBUCIONES MUESTRALES

CAPÍTULO II

Distribuciones muestrales

La distribución de probabilidad de un estadístico recibe el nombre de distribución muestral.

La distribución muestral de un estadístico depende:

• del tamaño de la población


• del tamaño de las muestras
• del método de selección de las muestras

11.1 Distribución muestral de medias

Supónganse que una muestra aleatoria de n observaciones se toma de una población normal

con media y varianza Cada observación de ía muestra

aleatoria tiene entonces la misma distribución normal que la población que está siendo
muestreada. De aquí que, por la propiedad reproductiva:

Además si: también son independientes con para

Se concluye que la media muestral:

27
CAPÍTULO II ______________________________________________________

tiene una distribución normal con

media

y vañanza

Si el muéstreo se hace en una población que tiene una distribución de probabilidad


desconocida, la distribución de muestreo de la media muestra! seguirá siendo

aproximadamente normal con media y varianza si el tamaño de la muestra

es grande.
Éste es uno de los teoremas más útiles en la estadística, llamado Teorema del limite central y
dice:

Si es la media de una muestra aleatoria de tamaño n que se toma de una población


con media y varianza finita entonces la forma límite de la distribución de:

28
________________________________________________________ DISTRIBUCIONES MUÉSTRALES

Conforme es la distribución normal estándar

11.3 Distribución muestral de diferencia de medias

Si se tienen dos poblaciones independientes, con media y varíanza


son las medias muéstrales de dos variables aleatorias
independientes de tamaños de estas poblaciones, entonces la distribución de
muestreo de:

Es aproximadamente normal estándar, si se cumplen las condiciones del teorema del limite
central. Si las dos poblaciones son normales, entonces la distribución de muestreo de Z es
exactamente normal estándar.

11.4 Distribución muestral de proporciones

Supónganse una población infinita o finita y que la probabilidad de ocurrencia de un suceso


{conocido como éxito) es p , mientras que la probabilidad de no ocurrencia del suceso es
q = l~p.

Se consideran todas las posibles muestras de tamaño « extraídas de esta población y para
cada muestra se determina la proporción p de éxito.
29
CAPÍTULO II_____________________________________________________________________

Se obtiene una distribución muestra! de proporciones cuya media y desviación típica


están dadas por:

Para grandes valores de n la distribución muestral se aproxima a una distribución


normal.

Nótese que la población se distribuye binomialmente.

Para las distribuciones muéstrales de diferencias de proporciones de dos poblaciones


distribuidas binomialmente con parámetros respectivamente:

Si son grandes las distribuciones muéstrales de diferencias de


medias o proporciones se distribuyen muy aproximadamente como una normal.

30
________________________________________________________ DISTRIBUCIONES MUÉSTRALES

11.5 Ejemplos resueltos


Ejemplo núm. 1

Una compañía fabrica focos que tienen un periodo de vida que está distribuido
aproximadamente en forma normal, con media igual a 1000 horas y una desviación estándar
de 50 horas. Encuentre la probabilidad de que una muestra aleatoria de 25 focos tenga una
vida promedio de menos de 975 horas.

Solución

Datos:

Justificación teórica

Distribución muestral de medias

Sustituyendo:

31
CAPÍTULO II _____________________________________________________________________

Ejemplo núm. 2

Una muestra de tamaño se saca aleatoriamente de una población que está

normalmente distribuida, con media y varianza y se registra la media

muestral Una segunda muestra aleatoria de tamaño se selecciona,

independientemente de la primera muestra, de una población diferente que también está

normalmente distribuida, con media y varianza y se registra la media

muestral Encuentre

32
________________________________________________________ DISTRIBUCIONES MUÉSTRALES

Solución

Datos

Justificación teórica
Distribución muestral para diferencia de medias

Sustituyendo

33
CAPÍTULO II _____________________________________________________________________

Ejemplo núm. 3

Se ha encontrado que el 2% de las piezas producidas por cierta máquina está dañado. ¿Cuál
es la probabilidad de que en una remesa de 400 piezas, esté dañado 3% o más?

Solución
Datos

Justificación Teórica
Distribución muestral de proporciones

34
________________________________________________________ DISTRIBUCIONES MUÉSTRALES

Primer método

Mediante la corrección para variables discretas.

Segundo método

3% de 400=12 piezas dañadas.


En concepto continuo, 12 o más significa 11.5 o más

35
CAPITULO II______________________________________________________________________

11.6 Problemas propuestos

1. Una población está formada por ios cuatro números 1, 3, 7, 9. Considerar todas las
posibles muestras de tamaño 2 que pueden extraerse de esta población con
reempíazamiento. Hallar:

a) la media poblacionai
b) la desviación típica poblacionai
c) la media de la distribución muesíral de medias
d) la desviación típica de la distribución muestra) de medias

Resp.

2. Los pesos de 3 000 balatas, se distribuyen normalmente, con media 22.4 kg y


desviación típica 0.048 kg Si se extraen 300 muestras de tamaño 25 de esta
población, determinar la medía esperada y la desviación típica de la distribución
muestral de medias, si el muestreo se hace;

36
________________________________________________________DISTRIBUCIONES MUESTRALES

a) con reemplazamiento
b) sin reemplazamiento

Resp.

3. Un grupo de jóvenes emprendedores de la UPIICSA, ha decidido promover un


producto de frutas, recubiertas de chocolate amargo, de manera que el recubrimiento
sea de 3 mm de espesor. Si funciona e! proceso que ellos han determinado (media de
3 mm y desviación estándar 1 mm), ¿cuál será la probabilidad de obtener una
muestra de 25 frutas cubiertas de chocolate amargo, de un total de 169? Encontrar
un promedio muestral de más de 3.4.
Resp. 0.0139

4. En !a nevería Tas Delicias" se ha observado que en la temporada primavera-verano,


el promedio de las ventas es de 100 It diarios, con una desviación estándar de 10 It.
La distribución de ventas es normal. Encuentre la probabilidad de que al tomar una
muestra de n - 25 consumidores, las ventas promedio a éstos, será menor a 95 It.

Resp. 0.0062

5. Ciertos ventiladores fabricados por una compañía tienen una duración media de 1 000
horas y una desviación típica de 75 horas. Hallar la probabilidad de que una muestra
tomada al azar de 25 ventiladores tenga una duración media entre 990 y 1 010 horas.

Resp. 0.4907

37
CAPÍTULO II ____________________________________________________________________

6. Ciertos tubos producidos por una compañía tienen una duración media de 900 horas y
una desviación típica de 80 horas. La compañía despacha 1 000 lotes de 100 tubos
cada uno. ¿En cuántos lotes cabe esperar que la media de las duraciones sobrepase
las 910 horas?
Resp. 106

7. Una población muy grande tiene una media de 20 y una desviación estándar de 1.4,
Si se toma una muestra de 49 observaciones, contestar:

a) ¿Cuál es la media de la distribución de maestreo?


b) ¿Cuál es la desviación estándar de la distribución de muesíreo?
c) ¿Qué porcentaje de posibles valores medios de la muestra diferirán de la
media de la población, por más de 0.2?
Resp. a) 20
b)0.2 c)
15.87%

8. Una investigación ha revelado que el 60% de los estudiantes universitarios no son


fumadores. Si se toma una muestra de 600 estudiantes, encuentre la media y la
desviación estándar de la distribución de muestreo.
Resp. 360,12

9. Debido a los altos índices de contaminación ambiental en la Ciudad de México, se


han tomado medidas más enérgicas. De 2 000 individuos muestreados, 1 600 están a
favor de las nuevas medidas. ¿Cuál es la proporción poblacional estimada?
Resp. 0.8

38
________________________________________________________DISTRIBUCIONES MUESTRALES

10. El candidato del partido X¡, considera que puede ganar las próximas elecciones en la
ciudad de Guadalajara, si obtiene al menos 55% de los votos en el distrito i. Además
supone que alrededor del 50% de los votantes en Guadalajara están a su favor. Si
N = 100 votantes van a votar en el primer distrito, ¿cuál es la probabilidad de que el
candidato Xy reciba al menos 50% de los votos?
Resp. 0.1587

11. Se ha encontrado que el 2% de los tornillos producidos por cierta máquina son
defectuosos. ¿Cuál es la probabilidad de que en una partida de 400 piezas, sean
defectuosas 3% o más?
Resp. 0.1056

12. Los resultados de una elección demostraron que cierto candidato obtuvo el 46% de
los votos. Determinar la probabilidad de que de 200 individuos elegidos al azar de
entre la población votante se hubiese obtenido una mayoría de votos para dicho
candidato.
Resp. 0.1131

13. Hallar la probabilidad de que en 120 lanzamientos de una moneda, el número de


soles esté comprendido entre el 40% y el 60%
Resp. 0.9887

14. Un detallista compra vasos de cristal en grandes cantidades directamente de la


fábrica. Tales vasos son envueltos uno por uno. Algunas veces el detallista
inspecciona las remesas para determinar la proporción de vasos rotos o defectuosos.
¿Cuál es la probabilidad de que el detallista obtenga una muestra aleatoria de 100
vasos que presenta el 17% o más de defectuosos?
Resp. 0.0154

39
CAPÍTULO II _____________________________________________________________________

15. La vida promedio del motor de determinado automóvil es de 5 000 km, con una
desviación estándar de 40 km. La distribución es muy aproximada a una normal. El
fabricante introduce mejoras en el proceso de fabricación del motor para aumentar el
tiempo de vida promedio a 5 050 km y disminuye la desviación estándar a 30 km.
Supóngase que se toma una muestra de tamaño 16 del proceso antiguo y otra de
tamaño 25 para el proceso nuevo. ¿Cuál es la probabilidad de que la diferencia entre
las dos medias muéstrales Xx - X2, sea al menos de 25 km? {suponer poblaciones
independientes).
Resp. 0.9838

16. Las pilas eléctricas de un fabricante A tienen una duración media de 1 400 horas, con
una desviación típica de 200 horas, mientras que las de otro fabricante B tienen una
duración media de 1 200 horas con una desviación típica de 100 horas. Si se toman
muestras al azar de 125 pilas de cada fabricante, ¿cuál es la probabilidad de que las
pilas de A tengan una duración media que sea al menos 160 horas más, que las pilas
deB?
Resp. 0.9772

17. A y B fabrican dos tipos de cables, que tienen unas resistencias medias a la rotura de
4 000 y 4 500 kg, con desviaciones típicas de 300 y 200 kg, respectivamente. Si se
comprueban 100 cables de A y 50 cables de B, ¿cuál es la probabilidad de que la
media de resistencia a la rotura de B sea al menos 600 kg más que A?
Resp.; 0.0078

18. El contenido de nicotina de un solo cigarrillo de una marca en particular, es una


variable aleatoria con media 0.8 mg y desviación estándar 0.1 mg. Si un individuo
fuma cinco cajetillas de estos cigarrillos por semana, ¿cuál es la probabilidad de que
la cantidad total de nicotina consumida en una semana sea por lo menos de 82 mg?
(suponga que cada cajetilla tiene 20 cigarrillos).

40
________________________________________________________DISTRIBUCIONES MUESTRALES

Resp. 0.0228

19. Cuando se prepara un lote de cierto producto químico, la cantidad de una impureza
del lote es una variable aleatoria, con valor medio de 4 gr, y desviación estándar de
15 gr. Si se preparan 50 lotes de manera independiente, ¿cuál es ia probabilidad
(aproximada) de que la cantidad promedio de la muestra de impureza X sea entre
3.5 y 3.8 gr?
Resp. 0.1642

20. Supóngase que una investigación efectuada recientemente revela que el 60% de los
adultos de una población no son fumadores. Si se toma una muestra aleatoria de 600
adultos, encuentre e interprete la media y la desviación estándar de la distribución de
muestreo.
Resp. 360,12

21. Una población está formada por los números 3, 7, 11, 15. Considerar todas las
posibles muestras de tamaño dos, que pueden encontrarse de esta población SIN
reemplazamtento. Hallar:
a) La media poblacional
b) La desviación típica poblaciona!
c) La media de la distribución muestral de medias
d) La desviación típica de la distribución muestral de medias
Resp. a) 9.0
b)4.47
c)9.0
d)2.58

41
CAPITULO II _____________________________________________________________________

22. Un proceso para llenar botellas de soda presenta una producción promedio en la que
el 10% de las botellas no están completamente llenas. Si mediante este proceso se
selecciona al azar una muestra de 225 botellas de un lote de 625 envases llenos,
¿cuál es la probabilidad de que la proporción muestral de botellas parcialmente llenas
se encuentre en el intervalo que va del 9 al 11%?

Resp. 0.4680

23. Calcular el valor del factor de corrección para una población finita cuando « = 10 y
N=1000.

Resp. FC= 0.9954

24. Si un bote de un galón de cierta clase de pintura cubre en promedio 513.3 pies
cuadrados, con un desviación estándar de 31.5 píes cuadrados, ¿cuál es la
probabilidad de que el área media cubierta por una muestra de 40 de estos botes esté
entre 510 y 520 pies cuadrados?

Resp. 0.6553

25. Una máquina vendedora de refrescos está programada para que la cantidad de
refresco que se sirva sea una variable aleatoria, con una media de 200 mi y una
desviación estándar de 15 mi. ¿Cuál es la probabilidad de que la cantidad de refresco
promedio (media) servida en una muestra tomada al azar de 36, sea cuando menos
de 204 mi?
Resp. 0.0548

42
__________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

CAPÍTULO III

Estimación e intervalos de confianza

111.1 Estimación

Puesto que las poblaciones se caracterizan por medidas descriptivas numéricas llamadas
parámetros, la inferencia se ocupa de hacer inferencias acerca de los parámetros de una
población.

La inferencia estadística consiste en aquellos métodos con 1os cuales se pueden realizar
generalizaciones acerca de una población.

Una estimación puntual de algún parámetro población al es un valor único del


estadístico

El estadístico que se utiliza para obtener una estimación puntual recibe el nombre de
estimador.

Se dice que un estadístico © es un estimador insesgado del

parámetro si

Si se consideran todos los estimadores insesgados,


posibles de algún parámetro aquel con la varianza más
pequeña recibe el nombre de estimador más eficiente de

43
CAPITULO III ____________________________________________________________________

Las características para un buen estimador son las siguientes:

a) insesgado
b) consistente
c) eficiente
d) suficiente

a) Estimador insesgado. Un estimador es insesgado cuando la media de la distribución


muestra! de medias es igual al correspondiente parámetro de la población.

b) Estimador consistente. Cuando un estimador (tal como se aproxima al

parámetro de la población que se va a estimar (tal como aumentando el tamaño


de la muestra, se dice que el estimador es consistente del parámetro.

c) Estimador eficiente. Si las distribuciones de dos estadísticos tienen la misma media,


el de menor varianza se llama un estimador eficiente.

d) Estimador suficiente. Un estadístico suficiente (tal como es un estimador que

utiliza toda la información que posee una muestra sobre el parámetro que se estima.

Una estimación por intervalo de un parámetro poblaciona! es un intervalo de la


forma dependen del valor del estadístico para una

muestra particular y también de ¡a distribución muestral de

Si por ejemplo, se encuentran tales que:

44
__________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Para entonces se tiene una probabilidad de de seleccionar una


muestra aleatoria que produzca un intervalo que contenga a

El intervalo que se calcula a partir de la muestra


seleccionada se llama intervalo de confianza de

se le llama nivel de confianza y a los puntos


extremos limites de confianza.

111.2 Intervalos de confianza

Como las estimaciones de punto rara vez serán iguales a los parámetros que se supone
estiman, por lo general es deseable damos alguna libertad de acción mediante el uso de
"estimaciones de intervalo".

111.2.1 Intervalos de confianza para conocida

Teorema 1: Intervalo de confianza para conocida

es el valor de la media de una muestra aleatoria de tamaño tomada de una

población normal, con la varianza conocida un intervalo de confianza del


para está dado por:

donde Zes la distribución normal estándar.

45
CAPITULO III ____________________________________________________________________

111.2.2 Intervalos de confianza para desconocida

Teorema 2: Intervalo de confianza para desconocida

son los valores de la media y la desviación estándar de una muestra aleatoria de

tamaño tomada de una población normal, con (a varianza desconocida un intervalo


de confianza del para está dado por:

donde r es la distribución t de student.

llf.2.3 Intervalos de confianza para conocidos

Teorema 3: Intervalo de confianza para conocidas

son los valores de las medias de muestras aleatorias independientes, de

tamaño tomadas de poblaciones normales, con las varianzas conocidas

un intervalo de confianza del para está dada por:

46
___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

111.2.4 Intervalos de confianza para desconocidos

Teorema 4: Intervalos de confianza para desconocidos

Si son valores de las medias de muestras aleatorias independientes, de

tamaño tomadas de poblaciones normales con varianzas desconocidas pero

iguales, un intervalo de confianza del para está dado por:

Tal que:

donde íes la distribución / de student.

111.2.5 Intervalos de confianza de muestra grande para/?

Teorema 5: Intervalos de confianza de muestra grande para/j

Un intervalo de confianza aproximado del para el parámetro binomial p ,


está dado por;

donde:

47
CAPITULO III ____________________________________________________________________

Hl.2.6 Intervalos de confianza de muestra grande para

Teorema 6: Intervalos de confianza de muestra grande para

Un intervalo de confianza aproximado del la diferencia entre

dos parámetros binomiales, está dada por:

donde

donde Z es la distribución normal estándar.

111.2.7 Intervalos de confianza para

Teorema 7: Intervalo de confianza para

Si es el valor de la varianza cíe una muestra aleatoria de tamaño tomada de una

población normal; un intervalo de confianza del para está dado por:

donde es la distribución Ji cuadrada.

48
___________________________________________ESTIMACIÓN E INTERVALOS DE CONFIANZA

111.2,8 Intervalos de confianza para

Teorema 8: Intervalos de confianza para

Si son los valores de la varianzas de muestras aleatorias independientes de

tamaño tomadas de dos poblaciones normales, un intervalo de confianza del

para está dado por;

por lo tanto

donde/es la distribución de Fisher : son los grados libertad.

111.3 Tamaño de muestra y error de estimación

Observar que la dispersión de las distribuciones decrece al aumentar el tamaño de la muestra,


luego entonces, se hace necesario conocer el procedimiento para seleccionar el tamaño
muestra!.

Si es el parámetro que se desea estimar es la desviación estándar de! estimador

puntual, entonces se aplica el siguiente procedimiento:

1, Elegir la cota para el error de estimación y un coeficiente de confianza

49
CAPITULO III____________________________________________________________________

2. Resolver la siguiente ecuación, para el tamaño de muestra

Para la mayoría de los estimadores es un función del tamaño muestra!.

111.4 Ejemplos resueltos

Ejemplo núm. 1

Si entrevistados, están familiarizados con los incentivos en los impuestos


que se ofrecen por instalar ciertos dispositivos para ahorrar energia, construyase un intervalo
con un nivel de confianza del 95% para la correspondiente proporción real.

Solución
Datos

Justificación teórica
Intervalos de confianza para proporciones (grandes muestras)

50
___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Ejemplo núm. 2

Un estudio señala que 16 de 200 tractores producidos en una línea de ensamblado requieren
ajustes minuciosos antes de ser embarcados, y lo mismo sucede con 14 de 400 tractores
producidos en otra linea de ensamblado. Calcúlese el intervalo de confianza del 95% para

Solución

Datos

51
CAPITULO III _____________________________________________________________________

Justificación teórica
Intervalos de confianza para diferencia de proporciones para muestras grandes.

Ejemplo núm. 3

La pérdida promedio en el peso de aspas , después de cierto intervalo de tiempo en


un molino de aspas es 3.42 gr, con una desviación estándar de 0.68 gr. Construir un intervalo
con un nivel de confianza del 99% para la pérdida promedio real de! peso de las aspas en las
condiciones establecidas.

Solución

Datos

52
__________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Justificación teórica
Intervalos de confianza para con muestras pequeñas:

Quiere decir que el intervalo al 99% de confianza entre 2.92 gr. y 3.92 gr., contiene la pérdida
promedio del peso.

Ejemplo núm. 4

Los siguientes datos son las horas hombre que semanalmente se pierden en promedio pa
accidentes en 10 plantas industriales, antes y después de que se implante cierto programa d€
seguridad

45 y 36, 73 y 60, 46 y 44,- 124 y 119, 33 y 35


57 y 51, 83 y 77, 34 y 29, 26 y 24, 17 y 11

53
CAPITULO III ______________________________________________________

Utilice un nivel de significancia de 0.10 para probar si el programa de segundad es eficaz.

Solución

Datos

Justificación teórica
Intervalo de confianza para pequeñas muestras:

54
___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Ejemplo núm. 5

Supóngase que los índices de refracción de 20 piezas de cristal (aleatoriamente


seleccionadas de un gran cargamento adquirido por la óptica) tienen una varianza de

Construyase un intervalo de confianza del 95% para o sea la desviación


estándar de la población muestreada.

Solución
Datos

Justificación teórica
Intervalo de confianza para la varianza:

55
CAPITULO III _____________________________________________________________________

Se tiene el 95% de confianza que el intervalo de 0.0083 hasta 0.016 contiene a la


desviación estándar verdadera del índice de refracción.

Ejemplo núm. 6

En una encuesta levantada en una ciudad, 136 de 400 personas respondieron


afirmativamente a la pregunta de si el transporte público es adecuado. Con una confianza del

99%, ¿qué se puede decir acerca del error máximo, si se emplea como una

estimación de la correspondiente proporción real?

Solución
Datos

56
___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Justificación teórica
Error:

111.5 Problemas propuestos

Intervalos de confianza para medias

1. La media y la desviación de las cargas máximas soportadas por 60 cables son dadas
por 11,09 ton y 0.73 ton respectivamente. Hallar los límites de confianza del 95% para
la media de las cargas máximas de todos las cables producidos por la compañía.
Resp.{10.9,11.27)

2. La media y la desviación típica de los diámetros de una muestra de 250 remaches


fabricados por una compañía son 0.72642 plg y 0.00058 plg, respectivamente. Hallar
los limites de confianza del 99% para el diámetro medio de todos los remaches
fabricados por la compañía.

Resp. 0.72642 ± 0.000095

57
CAPITULO III ____________________________________________________________________

3. Si una muestra aleatoria de tamaño tomada de una población normal con la

vananza tiene la media construya un intervalo de confianza


del 95% de la media de la población

Resp.57.7

4. Sea Xel Cl (Coeficiente Intelectual) de cualquier alumno de las escuelas primarias de


este país. Se sabe que la varianza de X es 225, Una muestra de los Cl de 25
alumnos proporciona una media de 108. Considerando que X se distribuye
normalmente, construyase un intervalo de confianza del 95% para la media
verdadera los Cl.

Resp.102.12 113.88

Intervalo de confianza para la diferencia de medias; conocidas

5. Se desea estimar la verdadera diferencia en contenido de alquitrán de dos marcas de


cigarrillos
marca 1 marca II

Tamaño de la muestra

Media muestral

Varianza de la población

Obténganse los límites inferior y superior del intervalo de confianza del 95% para la
verdadera diferencia entre el contenido promedio de alquitrán de los cigarrillos marca I
y de los cigarrillos marca II

Resp.

58
_________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Intervalos de confianza para proporciones

6. Encuentre un intervalo de confianza del 95% para el porcentaje de productos


defectuosos de la población, dada la siguiente información:

Resp. [0.0735,0.1265]

7. Determinar un intervalo de confianza del 98% para la proporción verdadera de la


población, si
Resp. [0.18,0.32]

8. Se hace un estudio para determinar la proporción de votantes de una comunidad


cuantificable, que favorecen la construcción de una planta generadora de energía
nuclear. Si se tiene que sólo 140 de 400 votantes seleccionados al azar favorecen el
proyecto; obtenga un intervalo de confianza del 95% de la proporción de todos los
votantes de esta comunidad que se expresan a favor del proyecto.
Resp. 0.303 0.397

9. Supóngase que un investigador de mercado desea estimar la verdadera proporción


de usuarios de detergente que prefieren una marca particular. Se selecciona una
muestra aleatoria de 100 usuarios y 64 de ellos indican que prefieren esa marca de
detergente. Obténgase el intervalo de confianza del 99% para p, verdadera
proporción de todos los usuarios que prefieren esa marca de detergente.
Resp. 0.50512 0.77488

10. De 270 consumidores encuestados 189 indicaron que estarían dispuestos a pagar
más por un empaque resistente al manejo indebido. Calcular un intervalo de confianza
del 95% para la proporción p. Resp. [64,5, 75.5]

59
CAPITULO III ___________________________________________________________________

Intervalo de confianza para con desconocida (pequeñas muestras)

11. Un fabricante de pinturas desea determinar el tiempo de secado en promedio de una


nueva pintura para interiores. Si en 12 áreas de prueba de igual tamaño él obtuvo un
tiempo de secado medio de 66.3 minutos y una desviación estándar de 8.4 minutos,
construya un intervalo de confianza del 95% para la media verdadera:
Resp. 61 71.6

12. Se toman 16 tazas de café de una máquina y se miden. Se determina que la media y
la desviación típica son 7.5 y 0.8 mi, respectivamente. Determine el intervalo de
confianza del 99% para

Resp. 6.9106 8.0894

13. Los resultados de una prueba de turbidez, efectuada en 15 muestras de arena de


prueba fueron (en micro amperes):

26.7, 25.8, 24.0, 24.9, 26.4, 25.9, 24.4, 21.7,


24.1, 25.9, 27.3, 26.9, 27.3, 24.8, 23.6

Obtener un intervalo de confianza del 95% para


Resp. [24.43,26.19]

Intervalo de confianza para con conocidas

14. Construya un intervalo de confianza del 94% de la diferencia real entre las duraciones
en promedio de dos tipos de focos eléctricos, dado que una muestra tomada al azar
de 40 focos de un tipo duró en promedio 418 horas de uso continuo y 50 focos de otra

60
__________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

clase duraron en promedio 402 horas. Las desviaciones estándar de las poblaciones,

según se sabe son:

Resp. 6.3 25.7

Intervalo de confianza para desconocidas (pequeñas muestras)

15. Se ha realizado un estudio para comparar el contenido de nicotina de dos marcas de


cigarrillos. Diez cigarrillos de la marca A tuvieron un contenido de nicotina en
promedio de 3.1 mg, con una desviación estándar de 0.5 mg, mientras que 8
cigarrillos de la marca B tuvieron un contenido de nicotina en promedio de 2,7 mg, con
una desviación estándar de 0.7 mg. Suponiendo que los dos conjuntos de datos son
muestras tomadas al azar de poblaciones normales con varianzas iguales, construya
un intervalo de confianza del 95% de la diferencia real en el contenido promedio de
nicotina de ías dos marcas de cigarrillos.
Resp. [-0.20,1]

16. Un educador desea determinar si dos distintos métodos de enseñanza tienen efectos
idénticos en el aprendizaje. Se seleccionan aleatoriamente dos clases de estudiantes
y se exponen a (os dos métodos diferentes; después se aplica a las dos clases un
examen estándar, que abarca los contenidos enseñados, para determinar la
efectividad de los métodos. A continuación se muestran los datos:

Clase I Clase II
Tamaño de la muestra
Puntuación promedio de la prueba

Varianza muestral

61
CAPITULO III ____________________________________________________________________

Determinar el intervalo de confianza del 95% para la verdadera diferencia entre las
dos medias poblacionales en base a la diferencia entre las dos medias muéstrales.

Resp. 0.47 9.53

Intervalo de confianza para muestra grande para

17, Si se tiene que 132 de 200 votantes del distrito A favorecen a un candidato dado para
la elección del senado y 90 de 150 votantes del distrito B se expresan a favor de este

mismo candidato, obtenga un intervalo de confianza del 99% para la

diferencia entre las proporciones reales de votantes de los dos distritos favorables al
candidato,
Resp.

Intervalo de confianza para varianzas

18. En 16 recorridos de prueba, el consumo de gasolina de un motor experimental, tuvo


una desviación estándar de 2,2 It. Construya un intervalo de confianza del 99% para

midiendo la variable real del consumo de gasolina de este motor.

Resp. 2.21 15.78

19. Sea un experimento de tamaño 51 con varianza muestral Calcular el


intervalo de confianza al 95% para la varianza.

Resp. 17.5 38.6

62
___________________________________________ESTIMACIÓN E INTERVALOS DE CONFIANZA

Intervalo de confianza para razones de dos varianzas

20. Considere la siguiente tabla:

Marca A Marca B

Obtener un intervalo de confianza del 98% de

Resp. 0.076 2.862

Tamaño de muestra y error

21. A partir de una muestra de 200 observaciones se encontró que, en una remesa, había
20 acumuladores defectuosos. Utilizando un intervalo de confianza del 99%, calcule el
error de estimación.
Resp. c = 0.055

22. ¿Qué tamaño de muestra será necesario para producir un intervalo de confianza del
90%, en el caso de la media de la población verdadera, con un error de 1.0 en
cualquier sentido, si la desviación estándar de la población es 10.0?

Resp. 273

63
CAPITULO m _________________________________________________________

23. Determine un intervalo de confianza de 95% para los dos casos siguientes:

a) = 1000

b) = 200

Resp.
a) 15 ±
0.372

24. Una muestra al azar de 100 observaciones tiene una media de 30 y una desviación
estándar de 5.
a) Obtenga un valor con el cual usted tenga 95% de confianza de que no
excederá la media de la población
b) ¿Cuál es la probabilidad (riesgo) de que
Resp.
a) 30.825
b) 0.0228

25. Determine el tamaño de muestra necesario para estimar el porcentaje verdadero de la


población en un 4%, utilizando un intervalo de confianza del 90%. Es razonable
suponer que el valor verdadero es 0.30 o menor.
Resp. 358

64
_______________________________________________________________ PRUEBAS DE HIPÓTESIS

CAPÍTULO IV

Pruebas de hipótesis

El objeto de la prueba de significación es evaluar proposiciones o afirmaciones acerca de los


valores de los parámetros de la población .

IV.1 Tipos de hipótesis

Se definirán los dos tipos de hipótesis que se requiere formular. La que señala que la

proposición es verdadera recibe el nombre de hipótesis nula y se representa por y la

segunda, que afirma que la proposición es falsa, se denomina hipótesis alterna y se designa

mediante el signo

La hipótesis nula, es un enunciado que expresa que el parámetro de la


población es como se especificó i que la proporción es verdadera). La
hipótesis alterna es un enunciado que ofrece una alternativa a la
proposición (por ejemplo el parámetro es mayor que el valor propuesto).

El nivel de significación de una prueba es la probabilidad de rechazar una


hipótesis nula que sea verdadera.

Existen dos tipos de errores que son inherentes al proceso de la prueba de significación

Se comete un error tipo si se rechaza cuando es verdadera. La


probabilidad de un error tipo es igual al nivel de significación de una
prueba de hipótesis.

65
CAPITULO IV ____________________________________________________________________

Se comete un error tipo si se acepta cuando no es verdadera.

IV.2 Tabla de errores tipo I y II

Si es:

Verdadera Falsa

Decisió Error tipo //


es aceptada n
Y se toma
esta acción:
es rechazada Error tipo /
Decisión correcta

IV.3 Hipótesis de una cola y de dos colas

Una prueba de hipótesis de una sola cola indica que la región de rechazo se localiza
únicamente en un extremo de la distribución muesíral del estadístico de prueba.

Para detectar que la región de rechazo debe situarse en la cola inferior derecha de

la distribución.

Para detectar que la región de rechazo debe situarse en la cola inferior izquierda de

la distribución.

66
________________________________________________________________ PRUEBAS DE HIPÓTESIS

Una prueba de hipótesis de dos cotas indica que la región de rechazo se localiza en los dos

extremos de la distribución muestral del estadístico de prueba. Para detectar que la

región de rechazo debe situarse equitativamente en los extremos de las colas derecha e
izquierda.

IV.4 Procedimiento para resolver una prueba de hipótesis

1. Planteamiento de hipótesis
2. Graficar

3. Buscar en tablas según sea el caso

4. Plantear regla de decisión

5. Encontrar: según corresponda

6. Interpretaciones y conclusiones.

IV.5 Pruebas relativas a "medias"

Analizaremos las pruebas más comúnmente usadas concernientes a la media de una


población. Todas las pruebas de esta sección están basadas en la teoría de la distribución
normal, suponiendo que las muestras provienen de poblaciones normales o bien que son lo
suficientemente grandes para justificar el uso de aproximaciones normales.

Supóngase que se desea probar la hipótesis nula contra la

alternativa sobre fa base de una muestra aleatoria de

tamaño n, tomada de una población normal con la varianza conocida Y las regiones
críticas de fas alternativas respectivas son:

67
CAPITULO IV____________________________________________________________________

donde

Los valores más frecuentemente utilizados de la probabilidad de cometer un error de tipo

son 0.05 y 0.01 ; los valores correspondientes de son:

Cuando y se desconoce la prueba que hemos estado analizando en esta


sección no puede utilizarse. La prueba correspondiente está basada en;

Es un valor de una variable aleatoria que tiene la distribución con grados de


libertad. Por lo tanto las regiones criticas de tamaño para probar la hipótesis nula

contra las alternativas

son respectivamente:

68
________________________________________________________________ PRUEBAS DE HIPÓTESIS

IV.6 Pruebas relativas a diferencias entre medias

Existen problemas concernientes a diferencias entre medias, como los siguientes:

Quizás se desea decidir, sobre la base de muestras adecuadas, si los hombres pueden
realizar cierta tarea a mayor velocidad que las mujeres, o bien quizás se desea decidir, sobre
la base de un estudio de muestra apropiado, si los gastos semanales promedio en
alimentación de las familias de una ciudad exceden los gastos de familias de otra ciudad en
menos de $5.

Supóngase que tenemos muestras aleatorias independientes de tamaño tomadas

de dos poblaciones normales con las medias y las varianzas conocidas

que deseamos probar la hipótesis nula donde es una constante dada,


contra Tenemos que las regiones críticas pueden expresarse como

donde:

Cuando manejamos variables aleatorias independientes de poblaciones con varianzas


desconocidas que quizás no sean normales, aún podemos utilizar la prueba que hemos
descrito con sustituida por sustituida por en tanto que ambas

muestras sean lo suficientemente grandes para que se invoque el teorema del límite central.

69
CAPITULO IV ___________________________________________________________________

IV.6.1 Teorema del límite central

Si constituyen una muestra aleatoria de una población infinita que tiene


la media la varianza y la función generatriz de momentos entonces
la distribución limitante es de:

cuando es la distribución normal estándar

Cuando son chicos y son desconocidas, la prueba que se ha

venido analizando no puede aplicarse. Sin embargo, en relación con muestras aleatorias
independientes tomadas de dos poblaciones normales con la misma varianza desconocida

la técnica de la razón de verosimilitud produce una prueba basada en:

La expresión anterior de í es un valor de una variable aleatoria que tiene la distribución / con

grados de libertad. Por lo tanto, la región crítica de tamaño para probar la

hipótesis nula contra las alternativas

70
______________________________________________________________ PRUEBAS DE HIPÓTESIS

bajo las suposiciones dadas son,

respectivamente,

1V.7 Pruebas para proporciones en la población

Existen situaciones en las cuales resulta necesario decidir si la proporción en la población,


generalmente denotada mediante el simbolo p , es igual a cierta fracción. En la mayor parte
de los casos, la proporción en la muestra o el número de éxitos en n ensayos , se utiliza
con fines de inferencia. Si un evento ha ocurrido X veces en n intentos, la proporción en la

muestra (por lo regular denotada mediante el símbolo Esta fracción puede

utilizarse para estimar la proporción de la población p, o la probabilidad de un éxito. Por


ejemplo, si 70 de 100 pacientes con cáncer muestran inmediata mejoría al recibir una nueva

vacuna, o 0.70, podría utilizarse como estimación de la verdadera proporción de

pacientes que mejoran con la nueva vacuna.

Para valores de n suficientemente grandes, la variable aleatoria binomial X se distribuye


casi en forma normal, con media y varianza

Tal que la variable aleatoria estandarizada queda

71
CAPITULO IV____________________________________________________________________

IV.8 Pruebas relativas a varianzas

Veamos algunas aplicaciones: un fabricante, obligado a cumplir rígidas especificaciones,


tendrá que realizar pruebas de la variabilidad de su producto; un profesor quizá desea saber si
son verdaderas ciertas afirmaciones acerca de la variabilidad que puede esperar observar en
el desempeño de un estudiante, y un químico farmacéutico probablemente tenga que
cerciorarse de si la variación en la efectividad de un medicamento está dentro de límites
permisibles.

Dada una muestra aleatoria de tamaño n , tomada de una población normal, desearemos

probar la hipótesis nula contra una de las alternativas

bien la técnica de la razón de verosimilitud nos lleva a obtener una prueba basada

en el valor de la varianza de la muestra. Con base en el siguiente:

Teorema. Si son la media y la varianza de una muestra aleatoria de


tamaño

tomada de una población normal, con la media y la varianza entonces:

1. son independientes

2. La variable aleatoria tiene una distribución cuadrada con grados

de libertad.

Podemos expresar las regiones críticas para probar la hipótesis nula, contra las dos

alternativas unilaterales como

72
________________________________________________________________ PRUEBAS DE HIPÓTESIS

Donde

Hasta donde concierne a la alternativa bilateral, rechazamos la hipótesis nula si


y el tamaño de todas estas regiones críticas es, desde

luego igual a

IV.9 Hipótesis relativas a dos varianzas

Si muestras aleatorias independientes de tamaño se extraen de poblaciones


normales que tienen la misma vananza, se sigue del teorema.

son las varianzas de muestras aleatorias independientes de tamaño


respectivamente tomadas de dos poblaciones normales que tienen la misma
vanancia, entonces:

Es un valor de una variable aleatoria que tiene distribución con parámetros

Que es un valor de una variable aleatoria que tiene la distribución con

grados de libertad, Por ello, si la hipótesis nula es válida, la razón de las


variancias muéstrales da un estadístico sobre el cual pueden fundamentarse las
pruebas de la hipótesis nula.

73
CAPITULO IV____________________________________________________________________

La región crítica para probar la hipótesis nula contra la hipótesis alternativa

donde se define como Asimismo, la región crítica

para probar la hipótesis nula contra la hipótesis alterna y esto

causa algunas dificultades, ya que la tabla de sólo contiene valores correspondientes a


las colas derechas de Por eso usamos el recíproco del
estadístico de la prueba original y haremos uso de la relación.

De ahí que fundamentemos la prueba en el estadístico y la región crítica para

probar la hipótesis nula contra la hipótesis alterna entonces

donde es el valor crítico apropiado de F con grados

de libertad.

Para la alternativa bilateral la región crítica es donde

y los grados de libertad son

74
________________________________________________________________ PRUEBAS DE HIPÓTESIS

IV.10 Ejemplos resueltos

Ejemplo núm. 1

Sea un fabricante de neumáticos, que aseguraba que éstos tenían una vida útil de por lo
menos 40 000 km. Supóngase que los resultados de la prueba fueron los siguientes: una
muestra de n = 49 , con un valor medio muestral de 38 000 km. Si se sabe que el recorrido
de los neumáticos de la población tiene una desviación estándar de 3 500 km, comprobar
hipótesis del fabricante. Considerar = 0.05

Solución

Datos

Justificación teórica

Prueba de hipótesis para medias, muestras grandes.

1er. paso

75
CAPITULO IV ____________________________________________________________________

2do. paso

3er. paso

4to. paso Reglas de decisión

Se acepta
Se rechaza

5to. paso

6to. paso

Como se rechaza lo que quiere decir que el promedio de


vida útil es menor que 40 000 km.
76
________________________________________________________________ PRUEBAS DE HIPÓTESIS

Ejemplo núm. 2

En un estudio se afirma que 9 de 10 médicos recomiendan la aspirina a


pacientes que tienen hijos. Pruebe esta aseveración a un nivel de significación de 0.05
respecto a la alternativa de que la proporción real de los médicos que hacen esto, es menor
del 90% si una muestra aleatoria de 100 médicos revela que 80 de ellos recomienda la
aspirina.

Solución

Datos

Justificación teórica
Prueba de hipótesis para proporciones

1er. paso

77
CAPITULO IV ____________________________________________________________________

2do. paso

3er. paso

4to. paso Reglas de decisión

Se acepta

Se rechaza

5to. paso

6to. paso

Como se rechaza

78
________________________________________________________________ PRUEBAS DE HIPÓTESIS

Ejemplo núm. 3

En la comparación de dos tipos de pintura, una agencia de servicio ai consumidor decide que
cuatro latas de un galón de una marca cubre en promedio 512 pies cuadrados con una
desviación estándar de 31 pies cuadrados, mientras que cuatro latas de un galón de otra
marca, cubren en promedio 492 pies cuadrados con una desviación estándar de 26 pies

cuadrados. Pruebe la hipótesis nula contra la hipótesis alternativa

en el nivel de significancia

Supóngase que las dos poblaciones son normales y tienen varianzas iguales:

Solución
Datos

Probar

Justificación teórica
Prueba de hipótesis para diferencia de medias para pequeñas muestras

79
CAPITULO IV

1er. paso

2do. paso

3er paso

4to. paso Regla de decisión

Se acepta está en eí intervalo

Se rechaza está en el intervalo

5to. paso

80
________________________________________________________________ PRUEBAS DE HIPÓTESIS

6to. paso

Como = 0.99está contenida en el intervalo [-2.447 , 2.447] se acepta

Quiere decir que la diferencia entre las dos medias de la muestra bien puede deberse
al azar.

Ejemplo núm. 4

Supóngase que el espesor de una parte utilizada en un semiconductor es su dimensión crítica


y que las mediciones realizadas del espesor de una muestra tomada al azar de 18 de estas

partes tienen la varianza donde las mediciones se expresan en milésimos de


pulgada. El proceso se considera bajo control si la variación del espesor está dada por una
variable no mayor que 0.36. Suponiendo que las mediciones constituyen una muestra tomada

al azar de una población normal, pruebe la hipótesis nula contra la hipótesis

alternativa con

Solución
Datos

quiere decir que está bajo control

81
CAPITULO IV ____________________________________________________________________

Justificación teórica

Prueba de hipótesis para varianzas

1er. paso

2do. paso

3er. paso

4to. paso Regla de decisión

5to. paso

82
________________________________________________________________ PRUEBAS DE HIPÓTESIS

6to, paso

Como se rechaza

Ejemplo núm. 5

Se requiere determinar si existe menos variabilidad en el plateado realizado por ía compañía 1


que en el efectuado por la compañía 2. Si muestras aleatorias independientes de tamaño 12

del trabajo desempeñado por las compañías producen

pruébese la hipótesis nula de que contra la hipótesis alterna de que

con un nivel de significancia de 0.05.

Solución
Datos

Justificación teórica
Prueba de hipótesis para dos variaciones

1er. paso

83
CAPITULO IV ____________________________________________________________________

2do. paso

3er. paso

4to. paso Regla de decisión

Se acepta

Se rechaza

5to. paso

6to. paso

Como se acepta

84
_______________________________________________________________ PRUEBAS DE HIPÓTESIS

IV.11 Problemas propuestos

Pruebas de hipótesis para medias

1. Supóngase que la desviación estándar del peso de paquetes de galletas de 8 onzas


hecha por cierta pastelería es de 0.16 onzas. Para cerciorase de que la producción
está bajo control en un día dado, es decir, para verificar si el peso promedio real de
los paquetes es de 8 onzas, se selecciona una muestra al azar de 25 paquetes y se

encuentra que su peso medio es onzas. Como la pastelería espera


dinero cuando y que el cliente pierda cuando probar la hipótesis nula

contra la alternativa mediante el uso de

Resp. se rechaza Ho

2. Sea X el salario mensual inicial para alguien que acaba de graduarse de una
universidad. Se sospecha que el salario medio mensual es de $1 200 y no $1 200 o
menos, como alguien predijo. Considérese que se sabe que la varianza de X es $2
500, Se toma una muestra aleatoria de 100 graduados y se determina la media

muestra! como $1 210, ¿deberá rechazarse la hipótesis nula en

Resp. Se acepta Ho

3. La Prueba de aptitudes escolares se ha aplicado a todos los estudiantes que desean


ingresar a cierta universidad. Se sabe que las puntuaciones de la prueba se
distribuyen normalmente con media de 500 y desviación típica de 100. En este caso
se sospecha que el promedio de las puntuaciones de la prueba de tos estudiantes
universitarios de primer año que ingresaron en 2002 es diferente de 500. Una muestra
seleccionada aleatoriamente de 64 universitarios de primer año en 2002 muestra una
media de 520. ¿Hay suficiente evidencia para apoyar la información de que el
85
CAPITULO IV ___________________________________________________________________

promedio de las puntuaciones de la prueba de los estudiantes de primer año del 2002, es
diferente de 500?
Resp. Se acepta Ho

4. Una empresa de transportes desconfia de la afirmación de que la vida útil promedio


de ciertos neumáticos es al menos de 28 000 km. Para verificar la afirmación, se
colocan 40 de estos neumáticos en sus camiones y obtienen una vida útil promedio
de 27 463 km. Con una desviación estándar de 1 348 km ¿qué se puede concluir de
ese dato, si ía probabilidad de un error tipo I es a (o sumo 0.01?
Resp. Se rechaza Ho

Pruebas de hipótesis para medias, pequeñas muestras

5. Supóngase que las especificaciones de cierto tipo de cinta afirman que el producto
tiene una resistencia media a la ruptura de 185 Ib y que cinco piezas seleccionadas al
azar de diferentes rollos tienen una resistencia media a la ruptura de 183.1 Ib con una
desviación estándar de 8.2 Ib, Suponiendo que podemos considerar los datos como
una muestra tomada al azar de una población norma!, pruebe la hipótesis nula
contra la hipótesis alternativa

Resp. Se acepta Ho

6. Debido a las múltiples ventajas que cierto vendedor de automóviles ofrece a sus
clientes, se sospecha que su margen promedio de beneficio por automóvil vendido,
está por abajo del promedio nacional de $500. Se realiza un estudio para determinar
si realmente este es el caso. Una muestra aleatoria de 25 ventas muestra una media
muestral de $485 y una desviación típica (s) de $45. Considerando que el margen de
beneficio por cada automóvil vendido por este comisionista se distribuye
normalmente, ¿puede llegarse a ía conclusión de que su margen promedio de

beneficio es en realidad significativamente menor de $500 para

86
________________________________________________________________ PRUEBAS DE HIPÓTESIS

Resp. se acepta Ho

7. Se supone que una máquina vendedora proporciona 8 onzas de café, si se insertan


las monedas adecuadas. Para probar s¡ la máquina está operando adecuadamente,
se toman 16 tazas de café de la máquina y se mide. Se determina que la media y la
desviación típica (s) de las 16 mediciones son 7.5 y 0.8 oz, respectivamente. Pruebe
la hipótesis nula de que ia máquina está operando adecuadamente

contra la hipótesis alternativa de que no lo esta haciendo, a dos niveles de


significación: 0.01 y 0.05
Resp. a) se acepta Hoat nivel de 0.01
b) se rechaza Ho al nive! de 0.05

8. Las especificaciones para cierta cíase de banda exigen una resistencia media a la
ruptura de 180 kg. Si cinco de las bandas (aleatoriamente seleccionadas en diferentes
cajas) tienen una resistencia media de 169.5 kg, con una desviación estándar de 5.7

kg, pruebe la hipótesis nula de que kg contra la hipótesis alterna de que

180 kg, con un nivel de significancia de 0.01

Resp. Se rechaza Ho

9. Los siguientes datos son las horas-hombre que semanalmente se pierden en


promedio por accidentes en 10 plantas industriales antes y después de que se
implantara cierto programa de seguridad
45y36, 73y60, 46y44, 124y 119, 33y35
57y51, 83y77, 34y29, 26y24, 17y 11

Utilícese un nivel de significación de 0.05 para probar si el programa de seguridad es


eficaz.

Resp. Se rechaza Ho

87
CAPITULO IV ___________________________________________________________________

Pruebas de hipótesis para proporciones

10. Un importante fabricante de dulces asegura que menos del 3% de las bolsas de
lunetas de chocolate están por debajo del nivel de llenado. Una comprobación
aleatoria revela que 4 de 50 bolsas se encuentra en esta situación. La muestra fue
tomada de una remesa de 400 bolsas de lunetas. ¿Refuta la evidencia muestral la
afirmación del fabricante (es decir, hay más del 3% de bolsas que no están
completamente llenas)? Considerar a = 0.05
Resp. Se rechaza Ho

11. Supóngase que cierto programa de noticias generalmente atrae el 50% de todos
aquellos que ven la televisión durante el periodo en que el programa sale al aire. El
conductor habitual ha renunciado y se ha contratado a una mujer para reemplazarlo.
La gerencia de la red televisiva desea determinar si con la nueva conductora ha
aumentado el porcentaje de personas que ven el programa. Si se realiza una
encuesta telefónica, se descubre que 55 de 100 personas que ven la televisión
mientras el programa de noticias está en el aire, ven este programa en particular.
Pruébese la hipótesis de que el porcentaje de aquellos que ven el programa
permaneció sin cambio, contra la alternativa de que ha aumentado, para 0.05.

Resp. Se acepta Ho

12. Un banco seleccionó aleatoriamente a 225 clientes con cuenta de cheques y


determinó que 90 de ellos también tenían una cuenta de ahorro en el banco. El
objetivo del banco es que al menos el 50% de sus clientes con cuenta de cheques
tengan una cuenta de ahorro simultáneamente. ¿Ha proporcionado la muestra
suficiente evidencia de que el banco ha logrado este objetivo para 0.01 ?

Resp. Se rechaza Ho

88
PRUEBAS DE HIPÓTESIS

13. En un estudio diseñado para investigar sí ciertos detonadores empleados con


explosivos en una mina de carbón cumplen con los requerimientos de que al menos
el 90% encenderá el explosivo al ser detonado, se encontró que 174 de 200
detonadores funcionaron adecuadamente. Pruébese la hipótesis nula de que
p > 0.9 contra la hipótesis alterna de que p < 0.9 con un nivel de significación
de 0.05.
Resp. Se acepta Ho

Prueba de hipótesis para diferencia de medias (grandes muestras)

14. Supóngase que se desea determinar si el contenido promedio de nicotina de los


cigarrillos marca I, es igual a los cigarrillos marca II. Con la finalidad de probar esta
hipótesis, se seleccionan aleatoriamente dos muestras de 25 cigarrillos cada una de

las dos marcas y se obtienen dos medias muéstrales:

mg. Se sabe que las varianzas de las dos marcas son

Determínese si las dos marcas de cigarrillos tienen la misma media en


Resp. Se acepta Ho

15. Se comparan dos modelos de automóvil para determinar la capacidad de frenado. Se


seleccionan dos muestras aleatorias de 16 automóviles cada una y se mide y registra
la distancia necesaria para que se detengan cuando el freno se aplica a 60 km/h.
Supóngase que se sabe que la varianza para el modelo y para el

modelo Las dos medias muéstrales son

¿Puede llegarse a la conclusión de que Xx es significativamente menor que X2

en ?

Resp. Se rechaza Ho

89
CAPITULO IV ___________________________________________________________________

16. Para probar la afirmación de que la resistencia de un alambre eléctrico puede


reducirse en más de 0.05 ohms mediante aleaciones, 32 valores obtenidos de

alambre ordinario produjeron ohms y ohms y 32 valores

obtenidos con el alambre fabricado a base de aleaciones produjeron

ohms y ohms. ¿Se apoya la afirmación con un nivel de significancia de

0.05?
Resp. Se rechaza Ho

17. Una compañía asegura que sus lámparas incandescentes son superiores a las de su

principal competidor. Si un estudio demostró que una muestra de 40 de esas

lámparas tienen una vida útil media de 647 horas, con una desviación estándar de 27

horas, mientras que una muestra de de su principal competidor tuvieron

una vida útil media de 638 horas de uso continuo, con una desviación estándar de 31
horas, ¿se debe aceptar la afirmación con un nivel de significación de 0.05?

Resp. Se acepta Ho

Prueba de hipótesis para la diferencia de proporciones

18. A los votantes de dos ciudades se les pregunta si se pronuncian a favor o en contra
de una ley, actualmente en estudio en la legislatura del estado. Para determinar si los
votantes de las dos ciudades difieren en términos del porcentaje que votan a favor, se
toma una muestra de 100 votantes de cada ciudad. Treinta de los muestreados de
una ciudad están a favor, en tanto que, en la otra, lo están veinte.

Resp. Se acepta Ho

90
_______________________________________________________________ PRUEBAS DE HIPÓTESIS

Prueba de hipótesis para la diferencia de medias. Pequeñas muestras

19. Un educador desea determinar si dos distintos métodos de enseñanza tienen efectos
idénticos en el aprendizaje. Se seleccionan aleatoriamente dos clases de estudiantes
y se exponen a los dos métodos diferentes. Después se aplica a las clases un
examen estándar, que abarca los contenidos enseñados, para determinar la
efectividad de los dos métodos, Los datos son los siguientes:

Clase I Clase II

Tamaño de la muestra -
Puntuación y promedio de la prueba
Varianza muestral

Considerando que las puntuaciones de prueba para todos los posibles estudiantes a
los que se haya enseñado con cada método se distribuyen normalmente y tienen
varianza idéntica pruébese la hipótesis nula de que los dos métodos de enseñanza
son igualmente efectivos para (a)

Resp. a) se acepta Ho al nivel de 0,01


b) se rechaza Ho al nivel de 0,05

20, Sean los siguientes datos:

91
CAPITULO IV ___________________________________________________________________

Utilizar ei nivel de significación para probar si la diferencia entre las

medias de las muestras, es significativa


Resp. Se rechaza Ho

21. Se sabe que la varianza de la resistencia a la ruptura, en kg. de cierto tipo de cable
fabricado por una compañía es de cuando más 40 000. Sin embargo se sospecha que
después de empezar a utilizar un nuevo proceso de fabricación, la varianza de la
resistencia a la ruptura ha aumentado. Una muestra de diez cables seleccionados
aleatoriamente muestra que la varianza de la resistencia a la ruptura es 50 000.
Considerando que la resistencia a la ruptura se distribuye normalmente, ¿debería
llegarse a la conclusión de que existe un incremento significativo en la variabilidad, si
el nivel es
Resp, Se acepta Ho

22. El proceso que se usa para esmerilar ciertos discos de silicio al grueso apropiado es

aceptable sólo si que es la desviación estándar de la población del grosor de los

retículos cortados de dichos discos, es a lo sumo 0.50 mi. Empléese el nivel de


significancia 0.05 para probar la hipótesis nula de que contra la hipótesis
alterna de que si el grueso de 15 retículos cortados de tales discos tienen
una desviación estándar de 0.64 mi.

Resp. Se acepta Ho

92
________________________________________________________________ PRUEBAS DE HIPÓTESIS

Problemas varios

23. La siguiente información sobre el máximo peso de levantamiento (MAWL en kg) para
una frecuencia de cinco levantamientos por minuto, se reportó en el artículo "The
effects of speed frequency and load on measured hand forces for a floor to knuckie
lifting task" (Ergonomics 1922 pp. 833-843); se seleccionaron personas al azar de una
población de hombres sanos entre 18 y 30 años de edad. Si se supone que el MAWL
está normalmente distribuido, ¿sugiere esta información que la media poblacional de
MAWL excede de 25? Realizar una prueba usando un nivel de significación de 0.05.
sean los datos 25.8, 36.6,26.3, 21.8 y 27.2
Resp. Ho no se puede rechazar

24. Se está considerando cierto tipo de ladrillo para usar en un proyecto de construcción
en particular. Se utilizará el ladrillo a menos que una evidencia muestral sugiera
fuertemente que el verdadero promedio de resistencia a la compresión se encuentra
por debajo de 3 200 Ib/pulg2. Se selecciona una muestra aleatoria de 36 ladrillos y
cada una se somete a una prueba de resistencia a la compresión. El promedio
muestral resultante de resistencia a la compresión y la desviación estándar muestral
de resistencia a la compresión son 3 109 y 156 Ib/pulg2 respectivamente. Establezca
las hipótesis pertinentes y realice una prueba para llegar a una decisión con un nivel
de significación de 0.05.
Resp. se rechaza Ho a nivel 0.05

25. Muchos consumidores están recurriendo a productos genéricos, como una forma de
reducir el costo de medicamentos por prescripción. El articulo "Commercial
Information on Drugs: Confusing to the Physician" (J. of Drug Issues, 1988, pp. 245-
257) da el resultado de un estudio de 102 médicos. Sólo 47 de estos médicos
entrevistados conocía el nombre genérico de la metadona. ¿Proporciona esto fuerte
evidencia para concluir que menos de la mitad de todos lo médicos conocen el

93
CAPITULO IV ___________________________________________________________________

nombre genérico de la metadona? Realizar una prueba de hipótesis usando un nivel


de significación de 0.01.
Resp. No se puede rechazar Ho al nivel 0.01

94
ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

CAPÍTULO V

Análisis de regresión y correlación

V.1 Introducción

El análisis de correlación y regresión comprende el análisis de los datos muéstrales para


saber cómo se relacionan entre sí dos o más variables en una población.

El análisis de correlación produce un número que resume el grado de relación entre dos
variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha
relación.

La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación
matemática lineal que describa la relación entre dos variables.

Una forma de emplear las ecuaciones de regresión es para explicar los valores de una
variable en términos de la otra. Es decir, se puede intuir una relación de causa y efecto entre
dos variables. Por ejemplo, un economista puede intentar explicar los cambios en la demanda
de automóviles usados, en términos del nivel de desempleo. Un agricultor puede creer que la
cantidad de fertilizantes que utilizó influyó en la cosecha lograda. La velocidad de un automóvil
podría ser un factor para determinar la distancia de frenado.

Otro uso de la ecuación de regresión es para predecir ios valores futuros de una variable.

Dos características importantes de una ecuación lineal son:

95
CAPÍTULO V _____________________________________________________________________

1.- la pendiente de la recta y


2.- la localización de la recta en algún punto

Una ecuación lineal tiene la forma:

En la que a y b son valores que se determinan a partir de los datos de la muestra


a indica la altura de la recta en x = 0
b señala su pendiente

La variable y es la que se habrá de predecir y Y la variable predictora.

La pendiente de la recta ub" indica la intensidad de cambio de "y" por unidad de cambio de Y

osea

Pendiente

En la regresión, los valores de y son predichos a partir de valores de Y dados o conocidos.

La variable y recibe el nombre de variable dependiente y la variable Y el de variable


independiente.

96
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

V.2 Método de mínimos cuadrados

Sea
donde

tal que la recta de mínimos cuadrados es:

es mínimo

entonces:

En donde, las ecuaciones normales son:

Despejando:

97
CAPITULO V ____________________________________________________________________

V.3 Cálculo de un estimador de

Si se requieren encontrar cotas para el error de predicción es estimar la varianza de "y"


para un valor dado de Y. Para esto, parece razonable el usar SCE (la suma de cuadrados de
los errores) respecto a la recta de predicción.

Un estimador para

en donde:

V.4 Inferencias relativas a la pendiente "6" de una recta

La primera inferencia que se debe hacer cuando se estudia la relación entre"/' y "x" concierne a
la existencia misma de dicha relación. En otras palabras, se quiere contestar a las siguientes
preguntas: ¿Muestran los datos suficiente evidencia como para pensar que el conocimiento de
V contribuye para predecir y, en alguna región de observación?, ¿al contrario, se puede
considerar que es bastante probable que, aun sin estar"/ y "x" relacionadas, los puntos
observados formen un diagrama de dispersión?

98
_____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

Las preguntas desde el punto de vista práctico se refieren al valor de "b", e! cambio medio que
se experimenta en Y por unidad de cambio en "x". El decir que V no proporciona
información para predecir "y", es equivalente a decir b = 0 (si b = 0, se predice siempre el
mismo valor para */ sin importar cuál sea el valor de "x"). Así que lo primero que hay que

hacer es probar la hipótesis de que b = 0 contra la alternativa

V.4.1 Método a seguir, para desarrollar una prueba de hipótesis acerca de


la pendiente de una recta

ler. paso Plantear hipótesis nula e


hipótesis alterna

2do. paso Granear

3 er. paso Buscar en tablas

4to. paso Plantear regla de decisión

5to. paso
Encontrar

6to. paso Comparación

99
CAPÍTULO V_____________________________________________________________________

V.5 Intervalo de confianza para la pendiente "b"

Una vez que se ha decidido que b es diferente de 0, resulta de interés examinar con mayor
detalle la relación entre "y" y "x". ¿Si x aumenta una unidad cuál será e! cambio estimado para
"/ y qué confianza se puede tener en dicha estimación?

V.6 Análisis de correlación

El término "correlación" literalmente significa relación mutua, ya que indica el grado en el que
los valores de una variable se relacionan con los valores de otra.

El coeficiente de correlación presenta dos propiedades que establecen la naturaleza de una


relación entre dos variables. Una es su signo (+ o -) y la otra, es su magnitud.

Por ejemplo: los valores próximos a -1 o +1 indican que los valores están bastante cerca de la
recta o sobre ella, mientras que los valores próximos a 0 sugieren mayor dispersión.

La medida de correlación lineal comúnmente usada en la estadística es el llamado Coeficiente


de correlación de Pearson entre y y Y. Esta cantidad, denotada por el símbolo Y se calcula
como sigue:

100
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

El coeficiente de correlación expresa numéricamente, tanto la fuerza, como la dirección de la


correlación lineal. Tal coeficiente se encuentra generalmente entre -1 y 1 considerándose el
siguiente criterio

Correlación negativa perfecta

Correlación negativa fuerte

Correlación negativa moderada

Correlación negativa débil

Ninguna correlación

Correlación positiva débil

Correlación positiva moderada

Correlación positiva fuerte

Correlación positiva perfecta

101
CAPÍTULO V______________________________________________________________________

Ejemplo núm.1

Sean los siguientes datos:

GASTOS PUBLICITARIOS VOLUMEN DE VENTAS

Obtener la recta de mínimos cuadrados

102
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

Solución

Justificación teórica

Sustituyendo:

103
CAPÍTULO V_____________________________________________________________________

Resolviendo el sistema de ecuaciones (1), se tiene:

diagrama de dispersión
curva de ajuste

104
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

Ejemplo núm. 2

Calcular un estimador de para los datos del ejemplo 1:

Solución

Justificación teórica:

Sustituyendo:

105
CAPITULO V _____________________________________________________________________

Ejemplo núm.3

Utilice los datos del ejemplo 1 para determinar si existe evidencia que indique que "b" difiere
de 0 al utilizar una relación lineal entre el gasto publicitario V y el volumen mensual medio"/
de ventas con = 0.05.

Solución

1er paso

2o. paso

3er. paso

está en el intervalo

4o. paso
Regla de decisión

Se acepta Ho si está en el intervalo [-2.306 , 2.3061


Se rechaza Ho si no está en el intervalo [-2.306 ,2.306]

5o. paso

106
_____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

6° paso

= 5.12 no está en el intervalo [-2.306, 2.306]

se rechaza deque

7°. paso

Se concluye que hay evidencia que indica que los gastos publicitarios
proporcionan información para predicción de los volúmenes mensuales de
ventas.

Ejemplo núm. 4

Encontrar el intervalo de confianza del 95% para "b" basándose en los datos del ejemplo 1:

Solución

Justificación teórica:

107
CAPÍTULO V _____________________________________________________________________

Sustituyendo:

Lo anterior quiere decir que si se aumenta en una unidad la "x", esto es, si se aumenta
en $10,000 eí gasto publicitario, se estima que el aumento en los volúmenes
mensuales de venía correspondientes será entre 28.90 y 76.24 o en las unidades
originales para y será entre $289,000 y $762,400.

Ejemplo núm. 5

Calcular el coeficiente de correlación para los datos de gastos publicitarios y volúmenes de


venta del ejemplo 1,

Solución

108
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

V.8 Problemas propuestos

1. Obtener la recta de mínimos cuadrados de los siguientes datos:

observación recorrido precio de venta


(en millas)

1 40 $1000

2 30 1500

3 30 1200

4 25 1800

5 50 800

6 60 1000

7 65 500

8 10 3000

9 15 2500

10 20 2000

11 55 800

12 40 1500

13 35 2000

14 30 2000

Resp. 2934-38.56x

109
CAPÍTULO V

2. Calcular el coeficiente de correlación, de los datos del ejercicio anterior:


Resp. r = -0.8992
3. Considere los promedios de puntos de calificación de bachillerato y universidad, para
20 estudiantes, de la tabla siguiente:

estudiante PPC de bachillerato PPC de universidad

1 3 5
2 2 4
3 4 4
4 12 9
5 11 8
6 8 9
7 9 7
8 7 8
9 6 5
10 5 6
11 4 8
12 8 4
13 3 7
14 12 6
15 9 8
16 8 5
17 11 10
18 7 7
19 8 6
20 10 5

Calcular la recta de regresión de minimos cuadrados:


Resp. 455 + 0.27x

110
____________________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

4. Utilice los datos del problema 3 y determine el grado de relación entre


calculando el coeficiente de correlación
Resp. r = 0.461
5. Sean los datos

1 1.5 4.8

2 1.8 5.7

3 2.4 7.0

4 3.0 8.3

5 3.5 10.9

6 3.9 12.4

7 4.4 13.1

8 4.8 13.6

9 5.0 15.3

Estimar la línea de regresión.


Resp. y = 0.2568 + 2.9303x

6. Calcular para los datos del problema anterior

Resp. = 0.292

7. Encuentre un intervalo de confianza del 95% para la pendiente, basado en los datos
del ejercicio 5.
Resp. (2.57722,3.28338)

111
CAPÍTULO V ____________________________________________________________________

8. Usando el valor estimado de b = 2.9303 del ejercicio 5, pruebe la hipótesis de que

al nivel de significancia de 0.01, contra la alternativa de que

Resp. Se acepta Ho

9. Los siguientes datos son las mediciones de la velocidad del aire y det coeficiente de
evaporación de las gotitas de combustible en un turbina de propulsión.

Velocidad del aire Coeficiente de evaporación


(cm / seg) (mm2/seg)

20 0.18

60 0.37

100 0.35

140 0.78

180 0.56

220 0.75

260 1.18

300 1.36

340 1.17

380 1.65

Ajústese a una línea recta a estos datos por el método de mínimos cuadrados y
utilícese para estimar el coeficiente de evaporación de una gotita, cuando la velocidad
del aire es de 190 cm/seg.
Resp. y = 0.069+ 0.0038x
y = 0.79

112
____________________________________________ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

10. Emplee los siguientes valores de resumen para determinar las ecuaciones de
regresión para determinar las ecuaciones de regresión:

a)

b)

c)

d)
Resp.

11. Determine una ecuación que describa la relación entre la frecuencia de accidentes y
el nivel de educación preventiva en lo referente a los siguientes datos:

Horas - hombre por mes Accidentes por millón de


de instrucción Horas- hombre
200 7
500 6.4
450 5.2
800 4.0
900 3.1
150 8
300 6.5
600 4.4

113
CAPÍTULO V

12. Se hizo un estudio sobre la cantidad de azúcar transformada en cierto proceso, a


varias temperaturas. Los datos se codificaran y registraron como sigue:

Temperatura Azúcar transformada

a) Estime la linea de regresión


b) Estime la cantidad de azúcar transformada, cuando la temperatura codificada es de
175

Resp. a) .y = 6.4136 + 1.8091x


b) 9.5795

114
_____________________________________________ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

13. Para el ejercicio 12, construya un intervalo de confianza del 95% para la pendiente.
Resp. [0.432,3.168]

14. En el ejercicio 12 probar la hipótesis de que b = 0, contra la hipótesis alterna de que


utilizando un nivel de significación de 0.05.
Resp. Rechazar Ho

15. Encontrar el coeficiente de correlación de los datos de ejercicio 12.


Resp. r = 0.7071

16. En una compañía de seguros se desea determinar la relación entre la experiencia en


ventas y el volumen de las mismas. Se selecciona una muestra aleatoria de nueve
vendedores. Se encuentra que sus años de experiencia V y ventas normales y son
los siguientes.

115
CAPÍTULO V ____________________________________________________________________

a) Construyase un diagrama de dispersión y trácese la recta de regresión de "/


sobre V en el diagrama.

b) Estímese el volumen de ventas anuales para un vendedor que tiene una


experiencia en ventas de diez años.

Resp. a) y - 0.66 + 0.66x

b) y = 7.26

17. Calcular un estimador de para los datos del ejercicio 16:

Resp.

18. Utilice los datos del ejercicio 16, para determinar si existe evidencia que indique que
difiere de al utilizar una relación lineal entre

Resp. Se rechaza Ho

19. Encontrar el intervalo de confianza del 95% para basándose en los datos del
ejercicio 16.
Resp. [0.6318,0.6882]

20. Calcular el coeficiente de correlación, para los datos del ejercicio 16.
Resp. r = 0.94

21. Se tiene un registro de los costos de mantenimiento para sus máquinas idénticas de
distintas edades. Por parte de la gerencia se desea determinar si existe una relación
funcional entre la edad de la máquina "x" y el costo de mantenimiento "y". Se obtienen
los siguientes datos:

116
______________________________________ ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

Máquina

Obténgase la ecuación de regresión con V como variable independiente y "y" como


variable dependiente. ¿Cuál sería el costo de mantenimiento para una máquina de
cuatro años?
Resp.

$135
22. Calcular un estimador de para los datos del ejercicio 21.

Resp.

23. Utilice los datos del ejercicio 21 para determinar si existe evidencia que indique que
difiere de al utilizar una relación lineal entre
Resp, Se rechaza Ho

24. Encontrar el intervalo de confianza del 95% para "bn, basándose en los datos del
ejercicio 21.

Resp.

117
ESTADÍSTICA _______________________________________________________________ _ _ _

Bibliografía

ARMITAGE G. Berry. Curso de Estadística. Madrid. 1992


www.bioestadistica.uma.es/libro/node159.htm

BARÓ LUNAS, J. Estadística Descriptiva circular. Introducción. Granada. Editorial


Parramón.1985. www.uiaen.es/dep/estinv/a5iqnatura/3102.rttm

BERRIOS, María de Jesús. Principios Estadísticos de Estadística Descriptiva.


www.coqui.metro.inter.edu/mdeiesus/6990DescriDtiva/tsld001.htm

BOWKER, Albert H. y LIEBERMAN, Gerald J. Estadística para Ingenieros. Prentice Hall


Hispanoamericana S.A, México, 1998.

CASTILLO PADILLA, Juan y GÓMEZ ARIAS, Jorge. Estadística tnferencial Básica.


www.enqrupo.corn.rox/gei/sec 66.htm

CHAO, Lincoln L. Introducción a ¡a Estadística. México, Compañía Editorial Continental, S.A., de


G.V., 1994.

CHRISTENSEIsl, Howard B. Estadística paso a paso. 2a Edición. Editorial Trillas. México, 1992.

DEGROOT, Morris H. Probabilidad y Estadística. Segunda Edición. Addison-Wesley-


Iberoamericana. México, 1996.

DIXON, Wilfred J. y MASSEY, Frank J. Jr. Introducción al Análisis Estadístico. Editorial


Mc.GrawHill. México, 1996.

........................................ Estadística Básica. Análisis Exploratorio de Datos y Análisis


Combinatorio.
Educación a distancia. Cursos de Extensión.

........................................ Estadística Descriptiva. Análisis Estadístico con SPSS.


www.nereida.deioc.ull.es/-pcguH/ihiu01/cdro.. .ido/node25.html

........................................ Estadística Descriptiva en dos Variables


www.cema.edu.ar/~rdp/MetodosCuantitat¡vo...ase/TabForrn.pdf

....................................... "Estadística inferencial. Tecnológico de Monterrey.


www.qda.itesm.mx/diplomados/dip cestal.html

118
________________________________________________________________________ BBLIOGRAFÍA

FRANCO ESPEJEL, Gilda Melva y otros. Probabilidad y Estadística. Editorial Spanta. México,
1998.

FRANK, N. Manual de Estadística Aplicada. Buenos Aires.


www.isi.frt.utn.edu.ar/sequndo/profa.htm

FRASER, D.A.S. Fundamentos y Técnicas de Inferencia Estadística. Editorial Limusa. México,


1996

FREUND, John E. Y WALPOLE, Ronald E. Estadística Matemática con Aplicaciones. México,


Prentice Hall Hispanoamericana, México, 2000.

GARCÍA, Roberto. Estadística Aplicada. Instituto Tecnológico de Buenos Aires.


www.itba.edu.ar/cargado/industri/estadapii.htm

GLASS, Gene V. y STANLEY, Julián C. Métodos estadísticos aplicados a tas ciencias


sociales. Prentice Hall Hispanoamericana, S.A., México, 1992.

HAROLD J., Larson. Introducción a la Teoría de Probabilidades e Inferencia Estadística.


Editorial Limusa. México, 1993.

HIÑES, Wilüam W. y MONTGOMERY, Douglas C. Probabilidad y Estadística para Ingeniería y


Administración. 3ra. ed., México, Compañía Editorial Continental. S.A. de
C.V., 1993.

HUNTSBERGER, David V. y BILLINGSLEY, Patrick. Estadística Inferencia!. México.


Compañía Editorial Continental S.A. de C.V., 1983.

INFANTE, Gil Said y ZARATE DE LARA, Guillermo, Métodos Estadísticos. Un enfoque


interdisciplinarío. Editorial Trillas. México, 1991.

JONSON, Robert, Estadística Elemental. Editorial Trillas. México, 1999.

KOOSIS, Donald J. Introducción a la Inferencia Estadística para Administración y Economía.


México: Editorial Limusa, 1980

KREYSZIG, Erwin. Introducción a la Estadística Matemática. Editorial Limusa, 1988

LEVIN, Richard I. Estadística para Administradores. 2a Edición.; México: Editorial


Prentice Hall, 1992.

MASÓN, Robert D. Y LIND, Douglas A. Estadística para Administración y Economía.


México, Editorial Alfaomega.

119
ESTADÍSTICA ___________________________________________________________________

MAYES, Anne C. y MAYES, David G. Fundamentos de Estadística para Economía.


Editorial Limusa. México, 2000.

MENDENHALL, Wiltiam y REINMUTH, James. "Estadística para Administradores y


Economía". México. Grupo Editorial Iberoamericana, 1989.

MENDENHALL, William. Estadística para administradores. México. Grupo Editorial


Iberoamericana^ 990.

MILLER, Irwin; FREUND, John E. y JOHNSON, Richard. Probabilidad y Estadística


para ingenieros. México, Prentice Hall Hispanoamericana, 1992.

MONTGOMERY, Douglas C. y RUNGER, George C. Probabiiidad y estadística


aplicadas a la Ingeniería. México, Editorial Limusa, S.A. de C.V.
Grupo Noriega Editores, 2002.

OSTLE, Bernard. Estadística aplicada. Técnicas déla Estadística moderna, cuándo y


dónde aplicarlas. México. Editorial Limusa, 1992.

PALMER, A.; RUB, A. y JIMÉNEZ, R. Libros Electrónicos de Estadística. Abril de 1999.


www. intersai ud.net/esatdistica/libros. html

PARZEN, Emmanuel. Teoría Moderna de Probabilidad y sus Aplicaciones. México.


Editorial Limusa, 1992

PARZEN, Emanuel. Teoría Moderna de Probabilidad. Editorial Limusa.


www.ur,mx/Pnncipal/fiya/acad/carreras/math/proqe2.htm

........................................... Probabilidad I. Escuela Superior de Física y Matemáticas del


IPN.
www.smf.mx/CataO1/MEXICQ/ESFMIPN/esfmipn.html

QUESADA V., Isidoro. Curso y Ejercicios de Estadística. Editorial Alhambra, 1989,


www.fie.us.es/~calvo/bib esydes.html

REMOTE, José Miguel. Estadística Inferencia!. Más páginas de Ibad-las palmas.com

RUNYON, Richard P. y HABER, Audrey. Estadística para las Ciencias Sociales.


México: Addison Wesley Iberoamericana, 1987.

120
BBLIOGRAFÍA

SPIEGEL, Murray. Estadística. 2da. ed.; México. Editorial Me Graw I—lili, 1991.

WALPOLE, Roland E, MYERS, Raymond H. y MYERS, Sharon LProbabitidad y


Estadística para Ingenieros. Prentice Hall. México, 2000,

WACKERLY, Dennis, SCHEAFFER, Richard L., y MENDENHALL, William. Estadística


Matemática con Aplicaciones. 2a Ed, México, Grupo Editorial
Iberoamericana, 1996.

YAMANE, Taro. Estadística, 3ra. ed. México. Editorial Haría, 1994.

121
________________________________________________________________________ ÍNDIC
E

Índice alfabético

análisis de correlación y regresión, hipótesis alterna, 72


95 hipótesis de una y dos colas, 73
hipótesis nula, 72
coeficiente de correlación de Pearson, histograma, 8
100
inferencia estadística, 43
desviación estándar, 4 inferencias relativas a la pendiente de
distribuciones frecuenciales: una recta, 98
datos no agrupados, 4 intervalo de confianza, 45
datos agrupados, 5 Intervalo de confianza para la diferencia
distribuciones muéstrales, 27 de medias, 46
distribuciones muéstrales de diferencia intervalo de confianza para la media, 47
de medias, 29 intervalo de confianza para la pendiente,
distribuciones muéstrales de media, 27 100
distribuciones muéstrales de intervalo de confianza para muestra
proporciones, 29 grande, 48
intervalo de confianza para la varianza,
error de estimación, 49 48
error de tipo I, 65 intervalo de confianza para dos
error de tipo II, 66 varianzas, 46
estadística, 1
estimación, 43 limites reales, 8
estimación puntual, 43
estimador, 43 marca de clase, 6
estimador consistente, 44 media, 2,9
estimador eficiente, 44 mediadas de dispersión:
estimador ¡nsesgado, 44 datos no agrupados, 4
estimador para la varianza, 98 datos agrupados, 2
estimador suficiente, 44 medidas de tendencia central:

123
_________________________________________________________________________ ÍNDICE

datos no agrupados, 2 pruebas relativas a diferencia entre


datos agrupados, 4 medias, 69
método de mínimos cuadrados, 97 pruebas relativas a dos varianzas, 73
método para prueba de hipótesis de la pruebas relativas a medias, 67
pendiente, 98 pruebas relativas a varianzas, 72
moda, 4,8
tamaño de muestra, 27
nivel de significación, 65 teorema del límite central, 28
tipos de hipótesis, 65
parámetros, 43
polígono de frecuencias, 9 variabilidad, 1
procedimiento para resolver una prueba varianza, 2
de hipótesis, 67
pruebas de hipótesis, 65
pruebas para proporciones en la
población 71

124
Impreso en los Talleres Gráficos
de la Dirección de Publicaciones
del INSTITUTO POLITÉCNICO NACIONAL,
Tresguerras 27, 06040 México, DF
Noviembre 2006. Edición: 1 000 ejemplares.

S-ar putea să vă placă și