Sunteți pe pagina 1din 253

MII. ING.

EDGAR JAVIER SILVA



Forma de calificar:


Examen. 70%
Practicas, tareas, avance proyecto final 30%


Para poder aprobar, necesariamente
debes pasar los tres parciales con
calificacin mnima de 70, en caso de
reprobar alguno se registra cero de
calificacin en el parcial
correspondiente.
Unidades aprobadas necesarias para presentar examen
de NIVELACION / REGULARIZACION
2
Unidades aprobadas necesarias para presentar examen
de EXTRAORDINARIO
4

Probabilidad y Estadstica Douglas C. Montgomery Mc Graw Hill

Probabilidad y Estadstica para Ingeniera y Ciencias Mendenhall
Prentice Hall

Estadstica para Administradores Levin Rubin Limusa

http://mathworld.wolfram.com/classroom/classes/Probabilityand
Statistics.html

Bibliografa
Haber aprobado, necesariamente las materias de :
Calculo Integral
Calculo diferencial
Probabilidad.
Distribuciones de probabilidad de una variable
aleatoria continua.
Media y varianza de una variable aleatoria
continua.
Distribucin de probabilidad t-student.
Distribucin de probabilidad tipo Gamma.
Distribucin de probabilidad tipo Beta.
Distribucin de probabilidad X
2
y F
Distribucin de probabilidad Weibull


Distinguir entre las variables aleatorias
continuas y discretas y sus respectivas
distribuciones de probabilidad; presentar
algunas distribuciones de probabilidad
continuas tiles y mostrar cmo se pueden
utilizar para resolver problemas prcticos.
azul
blanco
amarillo azul
blanco
amarillo
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0 1 2 3 4
Serie1
Serie2
Qu es una distribucin probabilstica?
Son aquellas en las que la variable puede
pude tomar un nmero determinado de
valores:
Ejemplo: si se lanza una moneda al aire
puede salir cara o cruz; si se tira un dado
puede salir un nmero de 1 al 6; en una
ruleta el nmero puede tomar un valor del 1
al 32.
Son aquellas que presentan un nmero
infinito de posibles soluciones:
Ejemplo: El peso medio de los alumnos de
una clase puede tomar infinitos valores
dentro de cierto intervalo (42,37 Kg.,
42,3764 Kg., 42, 376541kg, etc.); la
esperanza media de vida de una poblacin
(72,5 aos, 7,513 aos, 72, 51234 aos).
La distribucin de probabilidad de este tipo
de distribucin sigue el siguiente modelo:
Cul es la probabilidad de obtener 6 caras
al lanzar una moneda 10 veces?


" k " es el nmero de aciertos
" n" es el nmero de ensayos
" p " es la probabilidad de xito


" k " es el nmero de aciertos. En este
ejemplo " k " igual a 6 (en cada acierto
decamos que la variable toma el valor 1:
como son 6 aciertos, entonces k = 6)
" n" es el nmero de ensayos. En nuestro
ejemplo son 10
" p " es la probabilidad de xito, es decir,
que salga "cara" al lanzar la moneda. Por lo
tanto p = 0,5
La frmula quedara:

Solucin:
Cul es la probabilidad de obtener cuatro
veces el nmero 3 al lanzar un dado ocho
veces?
Solucin
n =
K =
p =
" k " (nmero de aciertos) toma el valor 4
" n" toma el valor 8
" p " (probabilidad de que salga un 3 al tirar
el dado) es 1 / 6 (= 0,1666)


P (x = 4) = 0,026



Las distribucin de Poisson parte de la
distribucin binomial:
Cuando en una distribucin binomial se
realiza el experimento un nmero "n" muy
elevado de veces y la probabilidad de xito
"p" en cada ensayo es reducida, entonces se
aplica el modelo de distribucin de Poisson:
Se tiene que cumplir que:
" p " < 0,10
" p * n " < 10
La distribucin de Poisson sigue el siguiente
modelo.
Percentil: por ejemplo, si su calificacin en un curso de
ingeniera industrial estuvo en el 84 percentil, entonces el 84%
de las calificaciones fueron inferiores a la suya y el 16% fueron
mayores.

Cuartil inferior: Ql, de un conjunto de datos es el 25 percentil.

Cuartil superior: Qu, de un conjunto de datos es el 75 percentil

Rango intercuartilico: es la distancia entre los cuartiles superior e
inferior. (IQR)

La funcin de densidad normal (o gausiana) fue propuesta
por C. F. Gauss (1777-1855) como modelo para la
distribucin de frecuencia relativa de errores, como los
errores de medicin. Resulta sorprendente que esta curva con
forma de campana sea un modelo adecuado para las
distribuciones de frecuencia relativa de datos recabados de
muchas reas cientficas diferentes.
Esta distribucin es frecuentemente utilizada en las
aplicaciones estadsticas. Su propio nombre indica
su extendida utilizacin, justificada por la
frecuencia o normalidad con la que ciertos
fenmenos tienden a parecerse en su
comportamiento a esta distribucin.
La nueva variable z se distribuye como una NORMAL con
media = 0 y desviacin tpica o = 1
-3 -2 -1 0 1 2 3
z
Una regla emprica indica que en cualquier distribucin normal
las probabilidades delimitadas entre :
1o = 68 %
2o = 95 %
3o = 99 %
68%
99%
95%
Caracteres morfolgicos de individuos (personas,
animales, plantas,...) de una especie, p.ejm. tallas,
pesos, envergaduras, dimetros, permetros,...
Caracteres fisiolgicos, por ejemplo: efecto de una
misma dosis de un frmaco, o de una misma cantidad
de abono.
Caracteres sociolgicos, por ejemplo: consumo de cierto
producto por un mismo grupo de individuos,
puntuaciones de examen.
Caracteres psicolgicos, por ejemplo: cociente
intelectual, grado de adaptacin a un medio,...

Distribucin de edades
1920
23
24
25
26
27
28
29
30
31
32
3336
41
45
47
0
2
4
6
8
10
12
14
Edades
F
r
e
c
u
e
n
c
i
a
19 20 23 24 25 26 27 28 29 30
31 32 33 36 41 45 47
En un saln de clases la media del grupo es de 29
aos y su desviacin estndar es de 4 aos Cul
es la probabilidad de encontrar alumnos de mas de
34 aos?
Primero entender que la distribucin normal se
asemeja a la distribucin de las edades.
Para esto hay que convertir los valores que te dan a
valores estndar.
Cmo hacemos esto?
Z = ( X - ) /

Z = ( X - ) /

19 20
23
24
25
26
27
28
29
30
31
32
33 36
41
45
47
0
2
4
6
8
10
12
14
Edades
X = valor dado a convertir
= media
= desviacin estndar
En un saln de clases la media del grupo es de 29
aos y su desviacin estndar es de 4 aos Cul
es la probabilidad de encontrar alumnos de mas de
34 aos?

X = valor dado a convertir =
= media =
= desviacin estndar =

29
Despus de cometido un delito la media en horas
de encontrar al responsable del delito es de 45 hrs.
Con un desviacin estndar de 10 hrs.Encontrar la
probabilidad de encontrar al responsable del delito
a mas tardar 24 hrs. despus de realizado este?
X = valor dado a convertir
= media
= desviacin estndar

45
El tiempo promedio que emplea un empleado para
atender una demanda es de 42 minutos, suponga
que la desviacin estndar es de 16 minutos, y que
los tiempos de atencin tienen una distribucin
normal.
Cul es la probabilidad de que una persona tarde
cuando menos 1 hora en poner su demanda?
Cul es la probabilidad de que una persona no
tarde mas de 30 minutos en poner su demanda?
Suponga que y es una variable aleatoria de
distribucin normal con media de 10 y
desviacin estndar de 2.1
Calcule P (y11)
Calcule P(7.6 y 12.2)
Un tubo fluorescente estndar tiene una duracin distribuida
normalmente con una media de 7,000 horas y una desviacin
estndar de 1,000 horas. Un competidor ha inventado un
sistema de iluminacin fluorescente compacto que se puede
insertar en los receptculos de lmparas incandescentes.
El competidor asegura que el nuevo tubo compacto tiene una
duracin distribuida normalmente con una media de 7500
horas y una desviacin estndar de 1200 horas.
Cul tubo fluorescente tiene mayor probabilidad de tener una duracin
mayor de 9000 horas?
Cul tubo tiene mayor probabilidad de tener una duracin de menos de
5000 horas?
Calcule el intervalo intercuartilico IQR y la desviacin
estndar, s, para la muestra, y luego calcule el cociente
IQR/s.
Si los datos son aproximadamente normales, IQR/s 1.3
Variable aleatoria discreta
Variable aleatoria continuo
Muchas variables aleatorias que se observan en la
vida real no son variables aleatorias discretas
porque la cantidad de valores que pueden asumir
no se puede contar.
Por ejemplo, el tiempo de espera y (en minutos)
para completar un trabajo de procesamiento de
datos 0 < y < infinito.
La funcin de densidad para una variable aleatoria
continua y , que modela alguna poblacin de
datos de la vida real, por lo regular es una curva
continua como lo que se muestra la siguiente
figura:

}

=
y
dt t f y F ) ( ) (
El rea acumulativa bajo la curva
entre menos infinito y un punto y
0

es igual a F(y
0
)
f(y) 0

}


= = 1 ) ( ) ( F dy y f
}
= < <
b
a
dy y f b y a P ) ( ) (
Donde a y b son constantes.
Ejemplo 1:
Sea c una constante y consideremos la funcin de densidad.


)
`

s s
=
caso otro cualquier en
y si cy
y f
_ _ _ ___ 0
1 0 _ _
) (
a.- Calcule el valor de c
b.- Calcule P (0.2 < y < 0.5
} }


= = = 1
2
) (
1
0
1
0
2
y
c cydy dy y f
}
= < <
5 . 0
2 . 0
) ( ) 5 . 0 2 . 0 ( dy y f y P
C=2
= 0.21
Ejemplo2: Obtenga la funcin de distribucin
acumulativa para la variable aleatoria y. Despus,
calcule F(0.2) y F(0.7)


} }

= = =
y y
y tdt dt t f y F
2
0
2 ) ( ) (
Entonces
F(0.2) = P(
la integral es de cero a y ,
porque el problema as lo
plantea y>0
Ejercicios 1:
1.- Sea c una constante y consideremos la funcin de densidad


)
`

s s
=
caso otro cualquier en
y si cy
y f
_ _ _ ___ 0
2 0 _ _
) (
2
a.- Calcule el valor de c.
b.- Obtenga la funcin de distribucin
acumulativa F(y)
c.- Calcule F(1)
d.- Calcule F(0.5)
e.- Calcule P (1 y 1.5)
Ejercicio2
Sea c una constante y consideremos la funcin de densidad

)
`

s s
=
caso otro cualquier en
y si y c
y f
_ _ _ ___ 0
1 0 _ _ ) 2 (
) (
a.-Calcule el valor de c
b.-Obtenga la funcin de distribucin acumulativa F(y)
c.-Calcule F(0.4)
d.-Calcule P (0.1 y 0.6)
Ejercicio3
Sea c una constante y consideremos la funcin de densidad

)
`

>
=

caso otro cualquier en
y si ce
y f
y
_ _ _ ___ 0
0 _ _
) (
a.-Calcule el valor de c
b.-Obtenga la funcin de distribucin acumulativa F(y)
c.-Calcule F(2.6) =
d.-Calcule P (1 y 5)
En estudios anteriores se inicio el estudio de las pruebas de
hiptesis. Se utilizo la distribucin normal estndar, la
distribucin z, como estadstico de prueba. Para emplear dicha
distribucin la poblacin debe ser normal y conocerse la
desviacin estndar poblacional. En muchas situaciones del
mundo real, la poblacin es aproximadamente normal, pero se
desconoce la desviacin estndar de la poblacin. En este caso
s se utiliza la desviacin estndar muestral en vez de .

Si el tamao de la muestra es de al menos de 30, los resultados
se consideran satisfactorios. (Tamao de muestra de menor o
igual a 30, n30)
Esta distribucin tiene la caracterstica de que puede ser
usada en aquellos casos en los que el tamao de muestra
esta limitado, debido a las caractersticas del experimento a
realizar.
Por ejemplo. En la industria es comn encontrarse con
productos que debido a los materiales y/o proceso son
sumamente caros y para realizar la prueba es necesario
destruirlos.
En estos casos el tamao de la muestra debe ser pequeo
cinco a ocho partes.
Una limitacin en la aplicacin de este estadstico es que la
poblacin de la que se toma la muestra tiene una distribucin
normal.

Para estos proyectos de investigacin , la distribucin z no es
el estadstico de prueba adecuado. La t de Student, o la
distribucin t, como se denomina comnmente se utiliza
como estadstico de prueba.
La siguiente figura presenta la grfica de varias distribuciones
t. La apariencia general de la distribucin t es similar a la de la
distribucin normal estndar: ambas son simtricas y
unimodales, y el valor mximo de la ordenada se alcanza en la
media = 0. Sin embargo, la distribucin t tiene colas ms
amplias que la normal; esto es, la probabilidad de las colas es
mayor que en la distribucin normal. A medida que el nmero
de grados de libertad tiende a infinito, la forma lmite de la
distribucin t es la distribucin normal estndar.

Probabilidad de una sola cola.
Valores t de Student y probabilidad P asociada
en funcin de los grados de libertad gl.
Si deseas, la
probabilidad de dos
colas, multiplica por
dos esta fila
1. Como la distribucin z, es una distribucin continua.
2. Como la distribucin z, es de forma de campana y
simtrica.
3. No hay una distribucin t, sino mas bien una familia de
distribuciones t, todas tienen la misma media igual a cero,
pero sus desviaciones estndares difieren de acuerdo con el
tamao de muestra (n). Hay una distribucin t para un
tamao de muestra 20, otra para un tamao de muestra 22,
y as sucesivamente.
4. La distribucin t es ms extendida y menos aguda en el
centro que la distribucin normal. Sin embargo, a medida
que aumenta el tamao de la muestra, la curva de la
distribucin t se aproxima a la distribucin normal
estndar.
La experiencia en la investigacin de demandas por accidente en una
institucin aseguradora revela que en promedio cuesta $60 dlares la
realizacin de todos los trmites. Este costo se considero exorbitante
comparado con el de otras compaas aseguradoras y se instauraron
medidas para abatir los costos. A fin de evaluar el impacto de estas nuevas
medidas se selecciono aleatoriamente una muestra de 26 demandas
recientes y se realiz un estudio de costos. Se encontr que la media
muestral de $57 y una desviacin estndar de la muestra de 10. En el nivel
de significacin 0.01, hay una reduccin en el costo promedio, o la
diferencia de $3 ($60 -$57) puede atribuirse al azar?
Paso 1: plantear la hiptesis nula y la hiptesis alternativa. .
hiptesis nula, Ho, es que la media poblacional es 60. La
hiptesis alternativa, H1 es que la media poblacional vale
menos de 60. Esto se expresa como sigue:
Ho: =60
H1: <60
La prueba es de una cola, ya que slo interesa si hay o no una
reduccin en el costo. Esta desigualdad en la hiptesis
alternativa seala hacia la regin de rechazo en la cola o
extremidad izquierda de la distribucin.
Paso 2: Seleccionar el nivel de significacin: se usar un nivel 0.01
Paso 3: Proporcionar el estadstico de prueba, tal estadstico es la
distribucin t de student, ya que 1) no se conoce la desviacin estndar
de la poblacin, y 2) el tamao de la muestra es pequeo (menos de 30)




Paso 4: Formular la regla de decisin, los valores crticos, de t se
encuentran en la tabla. La columna del lado izquierdo de la tabla se
titula grados de libertad. Para esta prueba hay n-1 grados de libertad
(26-1=25), una prueba de una cola y el nivel de 0.01 es de 2.485. La
regla de decisin para esta prueba de una cola es rechazar la hiptesis
nula si el valor calculado de t queda en cualquier parte de la extremidad,
a la izquierda de -2.485. De otra manera se acepta la hiptesis nula de
que la media poblacional es $60.
-2.485
Paso 5: Calcular t y tomar una decisin
Media muestral=57
Media poblacional hipottica=60
Desviacin estndar de la muestra=10
Numero de elementos de la muestra=26
t=(57-60)/10/26
t=-1.53
Zona de
aceptacin
Zona de rechazo
Un fabricante de motocicletas, anuncia que su vehculo
rendir en promedio 87 millas por galn en viajes largos. La
distancia recorrida (en millas) en ocho viajes largos fue 88,
82, 81, 87, 80, 78, 79 y 89. Pruebe al nivel 0.05 que el
recorrido medio es menor que el anunciado.
Ho: =87
H1: <87

Calcular t y tomar una decisin
Media muestral=
Media poblacional hipottica=87
Desviacin estndar de la muestra=
Numero de elementos de la muestra=


Se han propuesto dos procedimientos para armar un
componente pequeo. La pregunta es : qu mtodo es ms
eficaz, el desarrollado Ford (que se designa como el n1) o el
desarrollado por Nissan (que se designa como n2) Para
evaluar objetivamente los dos mtodos propuestos, se
decidi realizar estudios de movimientos y tiempos para
algunos componentes. El objetivo de estos estudios es
comparar los tiempos medios de ensamblado por unidad
para los dos procedimientos.
Usar un nivel de significancia de 0.10
La hiptesis nula plantea que no hay diferencia en el tiempo
medio de armado entre los procedimientos n1 y n2
Ho: 1=2
H1: 12
)
2
1
1
1
.(
2 2 1
) 1 2 ( ) 1 1 (
2 1
2
2
2
1
n n n n
s n s n
t
+
+
+

=

1= es el valor medio aritmtico del tiempo, con el
procedimiento 1
2= procedimiento 2
n1= es el nmero en la muestra 1
n2= es el nmero en la muestra 2
s
1
2
= es la variancia de la primera muestra.
s
2
2
= es la variancia de la segunda muestra

El objetivo es determinar si existe diferencia entre los dos mtodos de
armado. Por tanto se emplea una prueba de dos colas. Los grados de
libertad se obtienen
n1+n2-2 = 5 + 6 -2= 9
Procedimiento 1
Tiempos
Procedimiento2
Tiempos
2 3
4 7
9 5
3 8
2 4
3
-1.833
1.833
t= -0.662 minutos
Muchas variables aleatorias, como la duracin de la vida til
de una computadora, slo pueden asumir valores no
negativos. Las distribuciones de frecuencia relativa de datos
de este tipo a menudo se pueden modelar mediante
funciones de densidad tipo gamma.

I
=

punto otro cualquier en
e y
y f
y
_ _ _ ___ 0
) (
) (
/ 1
o |
o
| o
La funcin de densidad de probabilidad para
una variable aleatoria tipo gamma est dada
por:
Si 0y; >0; >0
Donde
}


= I
0
1
) ( dy e y
y o
o
La media y la varianza de una variable aleatoria tipo
gamma son, respectivamente:

=
2
=
2

Algunas propiedades
)! 1 ( ) (
) 1 ( ) 1 ( ) (
= I
I = I
o o
o o o
Cuando es un entero positivo
Ejercicio para laboratorio

Dibujar la funcin de distribucin Gamma, para para
valores enteros de
Considera los valores de y, a partir de 1 en adelante.

Realizarla con formula, para que cuando cambie el valor
de alfa o beta, cambie automticamente la grafica.
y f(y) =
=
=
Investigadores han descubierto que el nivel creciente mximo (en
millones de pies cbicos por segundo) durante un periodo de cuatro
aos para el Rio Susquehanna, Pennsylvania, sigue aproximadamente
una distribucin gamma con =3 y =0.07

Calcule la media y la varianza del nivel creciente mximo durante un
periodo de cuatro aos para el Rio Susquehanna.
Los investigadores llegaron a sus conclusiones acerca de la
distribucin de nivel creciente mximo observando los niveles de
creciente mximos durante 20 periodos de cuatro aos, desde 1890
hasta 1969. Suponga que durante el periodo de cuatro aos 1982-
1985 se observo que el nivel de creciente mximo fue de y=0.60
millones de pies cbicos por segundo. Esperara usted observar un nivel
tan alto en una distribucin gamma con =3 y =0.07 Qu puede
usted inferir acerca de la distribucin del nivel de creciente mximo para
el periodo de cuatro aos 1982-1985?
Aplicacin 1 (distribucin Gamma)
La media y la varianza de una variable aleatoria tipo
gamma son, respectivamente:

= =3(0.07)= 0.21

2
=
2
=3(0.07)
2
=0.0147
=0.1212
+ 3 =0.21 +3(0.1212)=0.57
Se puede inferir que 0.60 es un valor que se sale del
modelo matemtico.
Por experiencia anterior, un fabricante sabe que la
distribucin de frecuencia relativa del tiempo (en meses) que
transcurre entre dos quejas de clientes importantes
insatisfechos con sus productos se puede modelar mediante
una funcin de densidad gamma con =2 y =4. Quince
meses despus de que el fabricante hizo ms estrictos sus
requisitos de control de calidad, llego la primera queja.
sugiere esto que el tiempo medio entre quejas de clientes
importantes podra haber aumentado?
= = (2)(4)

2 =
2
=(2)(4)
2
=32
=5.7
Puesto que y =15 meses queda un poco ms de una
desviacin estndar de la media (8 + 5.7=13.7), no podemos
considerar a 15 meses como un valor desusadamente grande
de y.
Conclusin, no hay suficientes pruebas que
indiquen que el programa de control de
calidad de la compaa ha logrado
incrementar el tiempo medio entre quejas.
Una variable aleatoria tipo gamma que desempea un papel
importante en estadstica es la variable aleatoria ji cuadrada.
Una variable aleatoria ji cuadrada (X
2
) es una variable aleatoria tipo
gamma con =v/2 y =2



2
1
2
2 2
2
) ( ) (
_
_ _

= e c f
v
< s
2
0 _
)
2
( 2
1
2
v
c
v
I
=
La media y la varianza de una variable
aleatoria ji cuadrada son,
respectivamente.
=v
2
=2v

El parmetro v es el nmero de grados de
libertad de la distribucin ji cuadrada.
Aplicaciones:

Ji cuadrada como prueba de independencia.
Ji cuadrada como prueba de la bondad de ajuste:
prueba de lo apropiado de una distribucin.
Esta distribucin se aplica en los anlisis de fiabilidad, para establecer,
por ejemplo, el periodo de vida de un componente hasta que presenta
una falla. La ecuacin para la funcin de distribucin acumulada de
Weibull es:

La funcin de densidad de probabilidad es:
Cuando = 1 la distribucin de Weibull devuelve la distribucin
exponencial con:

La funcin de densidad Weibull contiene dos parmetros y .. es
parmetro de escala, , refleja el tamao de las unidades en que se mide
la variable aleatoria y el parmetro , es el parmetro de forma. Si se
cambia el valor del parmetro , es posible generar un conjunto con una
amplia variedad de curvas que modelan distribuciones de tiempo hasta
falla de la vida real.

A dems de proporcionar un buen modelo para las distribuciones del
tiempo hasta falla de muchos componentes fabricados, la distribucin
Weibull es fcil de usar.

0
) (
1 | o
o
|
o
y
e y
y f
Si 0y< ; >0 ; >0
En cualquier otro punto
|
.
|

\
|
+
I =
o
o
|
o
1
1
(

|
.
|

\
|
+
I
|
.
|

\
|
+
I =
o
o
o
o
| o
o
1 2
2
2
2
La funcin de densidad Weibull contiene dos parmetros, y , el
parmetro de escala , refleja el tamao de las unidades en que se
mide la variable aleatoria y.

El parmetro es el parmetro de forma. Si se cambia el valor del
parmetro de forma , es posible generar un conjunto con una amplia
variedad de curvas que modelan distribuciones de tiempo hasta falla
de vida real.
y es el tiempo
entre fallas,
cuanto tiempo
transcurre de una
falla a otra.
Tarea.

Dibujar en Excel

1.- La funcin de densidad Gamma
2.- La funcin de densidad Weibull
3.- La funcin de densidad Beta

Para entregar va mail la prxima clase.
La duracin (en horas) de una broca de taladro que se emplea en
una operacin de fabricacin tiene una distribucin de Weibull con
=2 y =100. Calcule la probabilidad de que una broca de taladro
fallar antes de 8 horas de uso.
dy e y dy y f y F
y y y
| o
o
|
o

} }
= =
1
0 0
0
0 0
) ( ) (
Integrar esta funcin haciendo el siguiente
cambio de variable z = y


Ya que la integras te debe quedar lo siguiente:
| |
o
0
1 1 ) (
0
y z
e e y F

= =
Resp: 0.473
Un fabricante de lavadoras garantiza sus productos contra cualquier defecto durante el
primer ao de uso normal. El fabricante ha estimado un costo por reparacin de 75$
durante el periodo de garanta.

Con base en la experiencia, se sabe que el tiempo en que ocurre la primera falla es una
variable aleatoria de Weibull con parmetros de forma y escala iguales a 2 y 40,
respectivamente. Si el fabricante espera vender 100 mil unidades y si para una misma
unidad, se descuenta el valor de las reparaciones, se determina el costo esperado de la
garanta para el fabricante.
Sea X la variable aleatoria que representa el tiempo que transcurre hasta que se
presenta la primera avera.




Aplicacin 2 (Weibull)
Por hiptesis, la funcin de densidad de probabilidad de X es:
La probabilidad de que la primera avera ocurra durante el
periodo de garanta es igual a la probabilidad de que X sea
menor o igual a 12. Mediante el empleo de la frmula cerrada
de distribucin:

Por lo tanto, si se supone que la operacin de las lavadoras es
independiente entre s, se pueden esperar
(100.000)(Probabilidad) = n fallas durante el perodo de
garanta con un costo total de n por el costo de reparacin

Para el problema anterior, calcule la vida media de las
brocas para el taladro y la varianza de la distribucin del
tiempo hasta falla.
Capsula cultural
Anteriormente dijimos que la funcin de densidad gamma
proporciona un modelo para la distribucin de frecuencia
relativa de una variable aleatoria que tiene un limite inferior
fijo pero que puede hacerse infinitamente grande.
La funcin de densidad beta, tambin caracterizada por dos
parmetros, tiene limites inferior y superior finitos (0 y 1)


=

punto otro cualquier en
B
y y
y f
_ _ _ __ 0
) , (
) 1 (
) (
1 1
| o
| o
Si 0y1; >0; >0
( ) ( )
( ) | o
| o
| o
| o
+ I
I I
= =

}
dy y y B
1
1
0
1
) 1 ( ) , (
La media y la varianza de una variable aleatoria beta son,
respectivamente:
| o
o

+
=
( ) ( ) 1
2
2
+ + +
=
| o | o
o|
o
Los sensores de infrarrojo de un sistema robtico computarizado envan
informacin a otros sensores en diferentes formatos. El porcentaje y de
las seales que se envan y que son directamente compatibles para
todos los sensores del sistema sigue una distribucin beta con ==2
a.- Calcule la probabilidad de que ms de 30% de las seales de
infrarrojo enviadas en el sistema sean directamente compatibles para
todos los sensores.
b.- Calcule la media y la varianza de y
Aplicacin 1 (Distribucin de probabilidad Beta)
)
`


=

) , (
) 1 (
) (
1 1
| o
| o
B
y y
y f
Aplica esta formula e intgrala de 0.30 a 1
}
= = >
1
30 . 0
514 . 0 ) 1 ( 6 ) 30 . 0 ( dy y y y P
Media =0.5

Varianza= 0.05
Aplicacin 2 (Distribucin de probabilidad beta)
Se determino que datos recabados a lo largo del tiempo sobre el
aprovechamiento de un ncleo de computadora (como una
proporcin de la capacidad total) tenan una distribucin de
frecuencia relativa que se poda aproximar mediante una funcin
de densidad beta con =2 y =4. Calcule la probabilidad de que
la proporcin del ncleo que se utiliza en un momento dado sea
menor que 0.20.

}

=
p
dy
B
y y
p F
0
1 1
) , (
) 1 (
) (
| o
| o
p=0.20
Nombre Funcin de
densidad
Media Varianza Caracterstica, o
cuando se aplica.
En que situaciones se
aplica.
Binomial
Normal
Poisson
Gamma
t student
Beta
Ji
cuadrada
Weibull
Cuadro comparativo de distribuciones de probabilidad, te
ayudar, a conocer los usos. (realiza esto como tarea)

Introduccin
Teorema de combinacin lineal de variables aleatorias y teorema del
limite central.
Muestreo: introduccin al muestreo y tipos de muestreo.
Teorema del limite central
Distribucin Muestral de la media.
Distribucin Muestral de la diferencia de medias.
Distribucin Muestral de la proporcin



Distribucin muestral de la diferencia de proporciones.
Distribucin muestral de la varianza.
Distribucin muestral de la relacin de varianzas.


En estudios pasados de Estadsticas centramos nuestra atencin en
tcnicas que describen los datos, tales como organizar datos en
distribuciones de frecuencias y calcular diferentes promedios y medidas
de variabilidad. Estbamos concentrados en describir algo que ya
ocurri. Tambin comenzamos a establecer los fundamentos de la
estadstica inferencial, con el estudio de los conceptos bsicos de la
probabilidad, las distribuciones de probabilidad discretas y continuas.
Distribuciones que son principalmente generadas para evaluar algo que
podra ocurrir. Ahora veremos otro tipo de distribucin de probabilidad,
que se llaman distribuciones muestrales.

Por qu muestrear? Muestrear es una forma de evaluar la calidad de un
producto, la opinin de los consumidores, la eficacia de un
medicamento o de un tratamiento. Muestra es una parte de la poblacin.
Poblacin es el total de resultados de un experimento. Hacer una
conclusin sobre el grupo entero (poblacin) basados en informacin
estadstica obtenida de un pequeo grupo (muestra) es hacer una
inferencia estadstica. A menudo no es factible estudiar la poblacin
entera.
Algunas de las razones por lo que es necesario muestrear son:


1. La naturaleza destructiva de algunas pruebas
2. La imposibilidad fsica de checar todos los elementos de la poblacin.
3. El costo de estudiar a toda la poblacin es muy alto.
4. El resultado de la muestra es muy similar al resultado de la poblacin.
5. El tiempo para contactar a toda la poblacin es inviable.



Distribucin Muestral de las Medias El ejemplo de los ratings de
eficiencia muestra como las medias de muestras de un tamao
especfico varan de muestra a muestra. La media de la primera muestra
fue 101 y la media de la segunda fue 99.5. En una tercera muestra
probablemente resultara una media diferente. Si organizamos las
medias de todas las posibles muestras de tamao 2 en una distribucin
de probabilidad, obtendremos la distribucin muestral de las medias.

Distribucin muestral de las medias. Es una distribucin de probabilidad
de todas las posibles medias muestrales, de un tamao de muestra
dado, seleccionadas de una poblacin.

Muestreo Aleatorio

Si se seleccionan n elementos de una poblacin de modo tal que
cada conjunto de n elementos de la poblacin tenga la misma
probabilidad de ser seleccionado, se dice que los n elementos
constituyen una muestra aleatoria.
Distribuciones de muestreo

La distribucin de muestreo de una estadstica es su
distribucin de probabilidad

El error estndar de una estadstica es la desviacin estndar
de sus distribucin de muestreo.

0
) (
|
|
y
e
y f
Aplicacin 1

Suponga que la variable aleatoria y tiene una funcin
de densidad
Si 0y<
En cualquier otro punto
Y sea w(y)=y
2
. Obtenga la funcin de densidad
para la variable aleatoria w.
}

= = =
0
) ( ) ( ) (
0 0
w
dy y f w F y F
Termnala de integrar, finalmente te va ha
quedar la funcin de distribucin
acumulativa para w:
) (
1 ) (
|
w
e w G

=
Dervala con respecto de w, y obtendrs la
funcin de densidad para w
Teorema del lmite central

Si se extrae una muestra aleatoria de n observaciones, y1,
y2,,yn, de una poblacin que tiene una media finita y una
varianza
2
, entonces si n es lo bastante grande, la distribucin
de muestreo de la media de la muestra se puede aproximar
con una funcin de densidad normal.
La distribucin de muestreo de la media de la muestra se
puede aproximar con una funcin de densidad normal.
Sea y1, y2, , yn una muestra aleatoria de n observaciones de
una poblacin con media finita y una desviacin estndar
finita . Entonces, la media y la desviacin estndar de la
distribucin de muestreo de , denotada por:
tan
y
y
mediamuestral
desviacines dar muestral

o
=
=
/
y
y
n

o o
=
=
La importancia del teorema del limite central y lo que acabamos
de escribir, es que podemos aproximar la distribucin de
muestreo de la media de la muestra , en tanto la poblacin
tenga una media y varianza finitas.
( )
1 2 1 2
2
, ,..., tan , ,..., var
, ( )
1, 2, 3, 4,...,
var
n n
i i i i
Seana a a cons tes y sean y y y n iables aleatorias normalmente
distribuidas con E y V y
i n
Entonces la distribucindemuestreodecombinacinlineal delas iables aleatorias
norma
o = =
=
1 1 2 2
.
...
n n
les
l a y a y a y = + + +
1 1 2 2
( ) ...
n n
Tieneuna funcinde densidad normal conmedia
E l a a a = = + + +
Aplicacin:
Los ingenieros encargados del diseo y mantenimiento de
pavimentos para aviones tradicionalmente utilizan concreto con
calidad de pavimento. Se realiz un estudio en el aeropuerto con el
fin de evaluar la idoneidad de bloques de concreto como superficie
para pavimento de aviones. El concreto original con calidad de
pavimento del extremo occidental de la pista se cubri con bloques
de concreto con un espesor de 80mm. Se realizo una serie de
pruebas de soporte de plancha para determinar el nmero de
clasificacin de carga (LCN)-una medida de resistencia a la
ruptura-de la superficie. Sea el LCN medio de una muestra de
25 secciones de bloques de concreto del extremo occidental de la
pista.
y
Antes del recubrimiento, se saba que el LCN medio del concreto
original con calidad de pavimento del extremo occidental de la
pista era =60 y la desviacin estndar era =10. Si la
resistencia media de al nueva superficie de bloques de concreto
no es diferente de aquella de la superficie original, describa la
distribucin de muestreo de (Encuentra la media y la
desviacin estndar de la muestra)

Si la resistencia media de la nueva superficie de bloques de
concreto no es diferente de aquella de la superficie original,
calcule la probabilidad de que , el LCN medio de la muestra de
25 secciones de bloques de concreto, sea mayor que 65.

Las pruebas de soporte de plancha realizadas con al nueva
superficie de bloques de concreto dieron como resultado =73.
Con base en este resultado, Qu puede usted inferir acerca del
verdadero LCN medio de la nueva superficie?

Y
Y
Y
Antes de ver la solucin, intntale
primero.
60
10
2
25
y
n

o
o
= =
= = =
65 60
2.5
2
Z

= =
Es poco probable que suceda
una media de 73
Reafirmando: Teora elemental del muestreo

La teora del muestreo estudia la relacin entre una poblacin
y las muestras tomadas de ella es de gran utilidad en muchos
campos. Por ejemplo, para estimar magnitudes desconocidas
de una poblacin, tales como media y varianza, llamadas a
menudo parmetros de la poblacin o simplemente
parmetros, a partir del conocimiento de esas magnitudes
sobre muestras, que se llaman estadsticos de la muestra
simplemente estadsticos.

Distribuciones de muestreo

Consideremos todas las posibles muestras de tamao N en una
poblacin dada (con o sin reposicin). Para cada muestra,
podemos calcular un estadstico (tal como la media o la
desviacin tpica) que variar de muestra a muestra.
De esta manera obtenemos una distribucin del estadstico que
se llama su distribucin de muestreo.
Si por ejemplo, el estadstico utilizado es la media muestral,
entonces la distribucin se llama la distribucin de muestreo
de medias.
Anlogamente podramos tener una distribucin de muestreo
de la desviacin tpica, de la varianza, de la mediana, de las
proporciones, etc.

Distribucin de Muestreo de Medias

Supongamos que se toman todas las posibles muestras de tamao N,
sin reposicin, de una poblacin finita de tamao N
p
>N, si
denotamos la media y la desviacin tpica de la distribucin de
muestreo de medias por
x
,
x
y las de la poblaciones por y





Si la poblacin es infinita o si el muestreo es con reposicin, los
resultados anteriores se reducen a:


x
=
x
=/N
Para valores grandes de N ( N 30) la distribucin de muestreo de medias es
aproximadamente normal con media
x
y la desviacin tpica
x
, independientemente de la
poblacin (en tanto en cuanto la media poblacional y la varianza sean finitas y el tamao de
la poblacin sea al menos el doble que el de la muestra)
x
=
1
p
x
p
N N
N
N
o
o

=

Distribucin de muestreo de medias (comprobacin)



Una poblacin consta de los nmeros 2,3, 6, 8 y 11.
Consideremos todas las posibles muestras de tamao 2 que
pueden tomarse con reposicin de esa poblacin. Hallar
La media de la poblacin.
La desviacin tpica de la poblacin
La media de la distribucin de muestreo de medias
La desviacin tpica de la distribucin de muestreo de media.
Antes de ver la respuesta intntalo.
1. Para el primer inciso , sumas los valores y los divides entre
el numero de datos que tienes.
2. Para la desviacin tpica

Para datos aislados
S = ( (x
j
x
-
)
2
/ N )
j = 1,2,N

X
j
= cada dato

x
-
= media
N = total de datos
Para N 30 se sustituye N por N-1

3. Para las muestras de tamao dos , toma todas la
combinaciones que puedas (2,2 ) (2,3) (2,6) (2,8) (2,11)
luego le siguen con el 3 y as sucesivamente, son 25
muestras en total, de estas 25 muestras obtn la media
4.
x
=/N



Aplicacin.
Estamos interesados en una poblacin de 20 compaas
textiles del mismo tamao, todas estas fbricas experimentan
una produccin excesiva de trabajo. Nuestro estudio indica que
la desviacin estndar de la distribucin de la produccin anual
es igual a 75 empleados. Si muestreamos cinco de estas
compaas textiles, sin reemplazo, y deseamos calcular el error
estndar de la media:
1
p
x
p
N N
N
N
o
o

=

Np tamao poblacin 20
N tamao de la muestra 5
desviacin estndar de la poblacin 75
Aplicacin 2

Las alturas de 3000 estudiantes varones de una Universidad
estn normalmente distribuidas con media de 68 in y
desviacin tpica 3 in. Si se toman 80 muestras de 25
estudiantes cada una, cules sern la media y la desviacin
tpica esperada de la resultante distribucin de muestreo de
medias, si el muestreo se hizo:
a.-) Con reposicin
b.-) Sin reposicin
No veas la respuesta hasta que le intentes
primero.
El nmero de muestras de tamao 25 que podran elegirse de
un grupo de 3000 estudiantes con y sin reposicin son 3000
25

Y la combinacin de 3000 tomados de 25 3000C25
68
3
0.6
25
3 3000 25
1 3000 1
25
x
x
p
x
p
N
N N
N
N

o
o
o
o
= =
= = =


= =

Aplicacin 3

500 bolas de cojinete tienen un peso medio de 5.02 gramos cada
una y una desviacin tpica de 0.30 g. Hallar la probabilidad de que
una muestra al azar de 100 bolas de este conjunto tengan un peso
total:

a.-) Menor a 5 gramos.
b.-) Menor a 4.96 gramos.
c.-) Ms de 5.10 gramos.
d.-)Entre 4.96 y 5 gramos.
e.-) Ms de 5.10 g.
0.3 500 100
1 500 1
100
p
x
p
N N
N
N
o
o


= =

4.96 en unidades estndar
z= (X )/

z=(4.96-5.02)/0.027 =-2.22


5.00 en unidades estndar z=


=0.027
Distribucin de muestreo de proporciones

Supongamos que una poblacin es infinita y que la probabilidad
de ocurrencia de un suceso, su xito es p, mientras que la
probabilidad de que no ocurra es q=1-p.
Por ejemplo, la poblacin puede ser la de todas las posibles
tiradas de una moneda, en la que la probabilidad del suceso cara
es p=1/2.
Consideremos todas las posibles muestras de tamao N de tal
poblacin, y para cada una de ellas determinemos la proporcin
de xitos P
Estas ecuaciones son validas, tambin
para una poblacin finita en la que se
hace un muestreo con reposicin.
N
pq
p
p
p
=
=
o

Aplicacin 1

En unas elecciones uno de los candidatos obtuvo el 46% de los
votos. Hallar la probabilidad de que en un muestreo de:
a. 200 votantes elegidos al azar, saliera la mayora a su favor.
b. 1000 votantes elegidos al azar, saliera mayora a su favor.
Utiliza, 4 decimales, para
este problema.
Nota: de una muestra de 200, la mayora sera, la mitad
mas 1 esto es la proporcin sera 101/200
p =p = 0.46

p = 0.46x0.54/200 = 0.0352

La mayora se obtiene cuando la proporcin es 101/200 =0.505

z= (0.505-0.46 )/0.0352 = 1.27
1.27
Probabilidad de que sea mayora,
el rea que esta a la derecha.
9.68%
Distribucin de muestreo de diferencias y sumas

Sean dadas dos poblaciones. Para cada muestra de tamao N1
de la primera, calculamos un estadstico S1; eso da una
distribucin de muestreo para S1, cuya media y desviacin
tpica denotaremos por s1 y s1.

Del mismo modo para cada muestra de tamao N2 de la
segunda poblacin, calculamos un estadstico S2; eso nos da
una distribucin de muestreo para S2, cuya media y
desviacin tpica denotaremos por s2 y s2.

De todas las posibles combinaciones de estas muestras de
estas dos poblaciones podemos obtener una distribucin de
las diferencias, S1-S2, que se llama distribucin de muestreo
de las diferencias de los estadsticos.
La media y la desviacin tpica de esta distribucin de
muestreo, denotadas respectivamente por:
1 2 1 2 s s s s

=
2 2
1 2 1 2 s s s s
o o o

= +
Damos por supuesto que las muestras escogidas no dependan
en absoluto una de otra(o sea que sean independientes)
1 2 1 2 1 2 x x x x

= =
2 2
2 2
1 2
1 2 1 2
1 2
x x x x
N N
o o
o o o

= + = +
Si S1 y S2 son las medias mustrales de ambas poblaciones,
cuyas medias denotamos por :

1 2
X y X
Respectivamente, entonces la distribucin de muestreo de las
diferencias de medias viene dada para poblaciones infinitas
con medias y desviaciones tpicas (1,1) y (2,2)
El resultado es valido tambin para poblaciones finitas si el
muestreo es con reposicin.
Anlogos resultados pueden alcanzarse para poblaciones
finitas en que el muestreo sea sin reposicin.
Aplicacin

Las lmparas de un fabricante A tienen vida media de 1400 h con
desviacin tpica de 200 h, mientras que las de otro fabricante B
tienen vida media de 1200 h con desviacin tpica de 100 h. Si se
toma una muestra de 125 lmparas de cada clase, cul es la
probabilidad de que las de A tengan una vida media que sea al
menos
a.- de 160 horas, ms que las de B?
b.- de 250 horas, ms que las de B?


1 2 1 2 1 2
1400 1200
x x x x

= = =
2 2 2 2
2 2
1 2
1 2 1 2
1 2
100 200
20
125 125
x x x x
N N
o o
o o o

= + = + = + =
( ) 200
20
A B
x x
z

=
a.- 160-200/20
b.- 250-200/20
Aplicacin:

Las bolas de rodamientos de cierto fabricante pesan 0.50 g de
media, con desviacin tpica de 0.02 g. Cul es la probabilidad de
que dos lotes de 1000 bolas cada uno difieran en peso en ms de
0.002 g?
1 2 1 2 1 2
0.50 0.50
x x x x

= = =
2 2 2 2
2 2
1 2
1 2 1 2
1 2
0.02 0.02
0.000895
1000 1000
x x x x
N N
o o
o o o

= + = + = + =
1 2
( ) 0
0.000895
X X
z

=
0.002 0 0.002 0
2.23 2.23
0.000895 0.000895
z z

> = s =

Introduccin
Caractersticas de un buen estimador.
Estimacin puntual
Mtodos
Mxima verosimilitud
Momentos.
Intervalo de confianza para la media.
Intervalo de confianza para la diferencia de medias.



Intervalo de confianza para la proporcin.
Intervalo de confianza para la diferencia de
proporciones.
Intervalo de confianza para la varianza.
Intervalo de confianza para la relacin de
varianzas.
Determinacin del tamao de muestra.
Basado en la media de la poblacin.
Basado en la proporcin de la poblacin.
Basado en la diferencia entre las medias de la poblacin.
Anteriormente vimos cmo se puede emplear la teora del muestreo
para recabar informacin acerca de muestras aleatorias tomadas de
una poblacin conocida. Desde un punto de vista practico, no
obstante , suele resultar ms importante ser capaz de inferir
informacin sobre la poblacin a partir de muestras suyas. Con tal
situacin trata la inferencia estadstica, que usa los principios de la
teora del muestreo.

Un problema importante de la inferencia estadstica es la estimacin
de parmetros de la poblacin, o brevemente parmetros (tales
como la media o la varianza de la poblacin) de los
correspondientes estadsticos mustrales, o simplemente
estadsticos (tales como la media y la varianza de la muestra)
Si la media de las distribuciones de muestreo de un estadstico es
igual que la del correspondiente parmetro de poblacin, el
estadstico se llama un estimador sin sesgo del parmetro, si no se
llama un estimador sesgado. Los correspondientes valores de tales
estadsticos se llaman estimaciones sin sesgo y sesgadas,
respectivamente.
Ejemplo: La media de las distribuciones de
muestreo de medias , la media de la
poblacin. Por tanto la media muestral es
una estimacin sin sesgo de la media de la
poblacin
x
=
x
Si las distribuciones de muestreo de dos estadsticos tienen la
misma media (o esperanza), el de menor varianza se llama un
estimador eficiente de la media, mientras que el otro se llama un
estimador ineficiente. Los valores correspondientes de los
estadsticos se llaman estimacin eficiente o estimacin ineficiente,
respectivamente.
Si consideramos todos los posibles estadsticos cuyas distribuciones
de muestreo tienen la misma media, aquel de varianza mnima se
llama a veces estimador de mxima eficiencia o sea el mejor
estimador.
Si el estadstico S es la media de la muestra, entonces los
limites de confianza.


x
x
+/- Zc * /N
Si el muestreo es de una poblacin infinita o de una finita con
reposicin.
Si el muestreo es sin reposicin de una poblacin finita de
tamao Np
x
+/- Zc* (/N)*((Np-N)/(Np-1)
A la segunda parte de la formula, despus
del +/- , se le llama error de la estimacin
Aplicacin:

Las medidas de los dimetros de una muestra aleatoria de 200
bolas de rodamientos producidas por una maquina en una
semana, dieron una media de 0.824 cm y una desviacin tpica de
0.042 cm. Hallar los limites de confianza.
a.- 95%
b.- 99% para el dimetro medio de todas las bolas.
los limites de confianza 95% son:

0.824 +/- 1.96* 0.042/200


el valor de 1.96 lo encuentras con la tabla de distribucin normal,
como es 95% y es de dos colas, entonces se busca un rea de
0.95 + 0.05/2=0.975, este valor lo buscas en la tabla y su
correspondiente valor de z es igual a 1.96

Por qu es dos colas?
Ya que es un intervalo de confianza, buscas el valor hacia arriba y
abajo.

LS = 0.8298 limite superior
LI =0.8181 limite inferior

Aplicacin

Al medir el tiempo de reaccin, un psiclogo estima que la
desviacin tpica es 0.05 segundos. De qu tamao ha de tomarse
una muestra de medidas para tener una confianza del :

a.- 95% y
b.- 99% de que el error de la estimacin no supera 0.01 segundos
(o sea que sea menor a 0.01 segundos).

+/- Zc * /N
Esto se considera como
error de estimacin

(1.96)(0.05)/N < 0.01

Mismo caso para el 99% donde z=2.58
Aplicacin:

Una muestra al azar de 50 calificaciones de matemticas de entre
un total de 200, revela una media de 75 y una desviacin tpica
de 10.
a.- Cules son los limites de confianza 95% para estimaciones de
la media de las 200 calificaciones?
b.- Con qu grado de confianza podramos decir que la media de
las 200 es 75+/-1?


Como la poblacin no es muy grande comparada con el tamao de
muestra, debemos tenerlo en cuenta.

75 +/- (1.64*(10)/50)((200-50)/(200-1)




75 +/- 1.23Zc

1.23Zc =1

Encuentra el Zc y luego encuentras el rea con la tabla de
distribucin normal
Si el estadstico S es la proporcin de xitos en una muestra de
tamao N sacada de una poblacin binomial en la que p es la
proporcin de xitos (o sea, la probabilidad de xitos), entonces los
limites de confianza para p vienen dados por:

p +/- Zc p , donde p es la proporcin de xitos en la muestra de
tamao N.
Si el muestreo es de una poblacin infinita o finita con reposicin
p +/- Zc (pq/N)

Si el muestreo es de una poblacin finita de tamao Np y sin
reposicin.
p +/- Zc (pq/N) * (Np-N)/(Np-1)

Aplicacin:

Un sondeo de 100 votantes elegidos al azar en un distrito indica
que el 55% de ellos estaban a favor de un cierto candidato. Hallar
los limites de confianza.
a.- 95%
b.- 99%
c.- 99.73% para la proporcin de todos los votantes favorables a
ese candidato.

0.55 +/- 1.96(0.55)(0.45)/100
Aplicacin:

En 40 lanzamientos de una moneda, han salido 24 caras. Hallar
los lmites de confianza.
a.- 95%
b.- 99.73% para la proporcin de caras que se obtendran en un
numero ilimitado de lanzamientos de esa moneda.

Si el muestreo es de una poblacin infinita o finita con reposicin
p +/- Zc (pq/N)

P=24/40
N=40
Zc buscar en la tabla.
Si S1 y S2 son dos estadsticos mustrales con distribuciones de
muestreo aproximadamente normales, los lmites de confianza para
la diferencia de los parmetros de poblacin correspondientes a S1 y
S2 vienen dados por:
2 2
1 2 1 2 1 2 1 2 c s s c s s
S S Z S S Z o o o

= +
Mientras que los limites de confianza para la suma de los
parmetros de poblacin vienen dados por
2 2
1 2 1 2 1 2 1 2 c s s c s s
S S Z S S Z o o o
+
+ = + +
Los limites de confianza para la diferencia de dos medias
poblacionales, en el caso de poblaciones infinitas, se calculan
como:
2 2
1 2
1 2 1 2 1 2
1 2
c x x c
X X Z X X Z
N N
o o
o

= +
Los limites de confianza para la diferencia de dos proporciones
poblacionales, con poblaciones infinitas, estn dados por:
1 2 1 2 1 2
1 2
1(1 1) 2(1 2)
c p p c
p p p p
P P Z P P Z
N N
o


= +
Tienda en el centro
de la ciudad
Tienda en el centro
comercial
Tamao de muestra N1=36 N2=49
Media muestral 40 aos 35 aos
Desviacin estndar
poblacional
9 aos 10 aos
2 2
1 2
1 2 1 2 1 2
1 2
c x x c
X X Z X X Z
N N
o o
o

= +
06 . 4 5
49
10
36
9
96 . 1 35 40
2 2

+
Aplicacin
El margen de error es de 4.06 aos y la estimacin
por intervalo de 95% de confianza de la diferencia
entre las medias poblacionales va de 5-4.06=0.94
aos a 5+4.06=9.06 aos.
En promedio los clientes
del centro de la ciudad
son 5 aos mayores que
los del centro comercial,
pero con un 95% de
confianza esta la
diferencia entre 0.94 y
9.06 aos.
Aplicacin:

Una muestra de 150 lmparas del tipo A ha dado una vida media de
1400 hrs. Y una desviacin tpica de 120 hrs. Una muestra de 200
lmparas del tipo B dan vida media de 1200 h y desviacin tpica
de 80 horas. Hallar los lmites de confianza:
a.- 95% y
b.- 99% para la diferencia de las vidas medias de las poblaciones
de ambos tipos.
1400-1200 +/- 1.96(120)
2
/150 + (80)
2
/100
Aplicacin:

En una muestra aleatoria de 400 adultos y 600 jvenes que vieron un
cierto programa de televisin, 100 adultos y 300 jvenes
reconocieron que les haba gustado. Determinar los limites de
confianza
a.- 95%
b.- 99% para la diferencia en proporciones de todos los adultos y
jvenes que vieron con agrado el programa.


P1=300/600 =0.50
P2=100/400=0.25

0.50-0.25 +/- 1.96(0.50)(0.50)/600 +(0.25)(0.75)/400

Intervalos de confianza para desviaciones tpicas

Los lmites de confianza para la desviacin tpica de una poblacin
normalmente distribuida, estimados con una muestra con desviacin
tpica s, vienen dados por:
2
c s c
s z s z
N
o
o =
Aplicacin

La desviacin tpica de las vidas medias de una muestra de
200 bombillas es de 100 horas. Hallar los lmites de
confianza.
a.- 95%
b.- 99% para la desviacin tpica de ese tipo de bombillas.
100 +/- 1.96(100)/400
Inferencias acerca de la diferencia entre medias poblacionales:1 y
2 desconocidas (desviaciones estndar poblacionales desconocidas)

La inferencia sobre la diferencia entre dos medias poblacionales se
extiende al caso en el que las dos desviaciones estndar
poblacionales, 1 y 2 no se conocen .
En este caso para estimar las desviaciones estndar poblacionales
desconocidas se emplean las desviaciones estndar mustrales, s1 y
s2. Cuando se usan las desviaciones estndar mustrales en las
estimaciones por intervalo y en las pruebas de hiptesis, se emplea
la distribucin t en lugar de la distribucin normal estndar.



2
2
2
1
2
1
2 / 2 1
n
s
n
s
t x x +
o
2 tan
1 tan
2
1
2
1
2 /
2
1
muestra la de dar es desviacin s
muestra la de dar es desviacin s
student t la de valor t
muestra media x
muestra media x
=
=
=
=
=
o
Ejemplo: Encontrar el valor de la t student, con un 95% de
confianza y 7 grados de libertad. (2 colas)

t=2.36
Ejemplo:

Bancomer, realiza un estudio para identificar diferencias entre las
cuentas de cheques de sus clientes en dos de sus sucursales; toma
una muestra aleatoria simple de 28 cuentas de la sucursal Sauz y otra
muestra aleatoria simple e independiente de 22 cuentas de cheques
de la sucursal Patria. A continuacin se presenta un resumen de los
saldos en esas cuentas.
Sauz Patria
Tamao de la
muestra
n1=28 n2=22
Media muestral x1=$1025 x2=$910
Desviacin
estndar muestral
s1=$150 s2=$125
El banco desea estimar la diferencia entre el saldo medio en las
cuentas de cheques de clientes del Sauz y el saldo medio en las
cuentas de cheques de la sucursal Patria.
2
2
2
2
2
2
1
1
2
1
2
2
2
2
1
2
1
1
1
1
1
|
|
.
|

\
|
|
|
.
|

\
|

+
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
+
=
n
s
n n
s
n
n
s
n
s
gl
Grados de libertad: distribucin t , con dos muestras aleatorias
independientes.
47.8 se redondea a 47

115 +/- 78
Estimacin por intervalo de la media poblacional:
Se puede
considerar que se
conoce la
desviacin
estndar
poblacional ?
n
Zc x
o

n
s
t x
SI NO
Use la desviacin
estndar muestral s
para estimar
Aplicacin:
Las primeras semanas del 2004 fueron buenas para el mercado
de acciones. En una muestra de 25 fondos abiertos se
encontraron las siguientes ganancias obtenidas desde el
principio del ao al 24 de enero del 2004.
7.0 3.2 1.4 5.4 8.5
2.5 2.5 1.9 5.4 1.6
1.0 2.1 8.5 4.3 6.2
1.5 1.2 2.7 3.8 2.0
1.2 2.6 4.0 2.6 0.6
a.-Cul es la estimacin puntual de la media poblacional de las
ganancias en fondos abiertos desde principio del ao hasta esa
fecha?

b.-Puesto que la poblacin tiene una distribucin normal, calcule
un intervalo de confianza de 95% para la media poblacional de las
ganancias en fondos abiertos desde el principio del ao hasta esa
fecha.
Probabilidad de una sola cola.
Valores t de Student y probabilidad P asociada
en funcin de los grados de libertad gl.
Si la prueba es de
dos colas, el valor
de lo divides
entre dos y lo
buscas en esta fila
Si deseas, buscar el valor de la t student en Excel, puedes usar
la funcin DISTR.T.INV, te pedir la probabilidad esto es el
nivel de significancia, tu se lo pones dependiendo si es una
cola o dos colas, acurdate que si es dos colas, divides el valor
de entre dos.
Repaso:

La media y desviacin tpica de las cargas mximas soportadas
por 60 cables, son 11.09 y 0.73 toneladas, respectivamente.
Hallar los limites de confianza.
a.-95%
b.-99% para la media de las cargas mximas soportadas por los
cables de este tipo.
Repaso:

Se espera que una eleccin entre dos candidatos sea muy reida.
Cual es el mnimo nmero de votantes a sondear si se quiere
tener un 95% de confianza sobre la decisin a favor uno de otro?

Introduccin
Errores tipo I y tipo II
Potencia de la prueba.
Formulacin de hiptesis estadsticas.
Prueba de hiptesis para la media.
Prueba de hiptesis para la diferencia de medias.
Prueba de hiptesis para la proporcin.
Prueba de hiptesis para la diferencia de
proporciones.
Prueba de hiptesis para la varianza.
Prueba de hiptesis para la relacin de varianzas.


La prueba de hiptesis comienza con una suposicin, llamada
hiptesis, que hacemos con respecto a un parmetro de
poblacin. Despus recolectamos datos de muestra, producimos
estadsticas de muestra y usamos esta informacin para decidir
qu tan probable es que sea correcto nuestro parmetro de
poblacin acerca del cual hicimos la hiptesis. Digamos que
suponemos cierto valor para una media de la poblacin.

Para probar la validez de nuestra suposicin recolectamos datos
de muestra y determinamos la diferencia entre el valor real de la
media de dicha muestra.

Despus juzgamos si la diferencia obtenida es significativa o no.
Mientras mas pequea sea la dicha diferencia, mayor ser la
probabilidad de que nuestro valor hipotetizado para la media sea
correcto. Mientras mayor sea la diferencia, ms pequea ser la
probabilidad.
Elaboracin de las hiptesis nula y alternativa

En algunas aplicaciones no parece obvio cmo formular la
hiptesis nula y la hiptesis alternativa. Se debe tener cuidado en
estructurar las hiptesis apropiadamente de manera que la
conclusin de la prueba de hiptesis proporcione la informacin
que el investigador o la persona encargada de tomar decisiones
desea.
Prueba de una hiptesis de investigacin

Considere un determinado modelo de automvil en el que el
rendimiento de la gasolina es 24 millas por galn. Un grupo de
investigacin elabora un nuevo sistema de inyeccin de combustible
diseado para dar un mejor rendimiento en millas por galn de
gasolina. Para evaluar el nuevo sistema se fabrican varios de stos, se
instalan en los automviles y se someten a pruebas controladas de
manejo. En este caso, el grupo de investigacin busca evidencias para
concluir que el nuevo sistema aumenta la media del rendimiento.

La hiptesis de investigacin es, entonces que el nuevo sistema de
inyeccin de combustible proporciona un rendimiento medio mayor a
24 millas por galn de combustible; es decir, >24. Como
lineamiento general, una hiptesis de investigacin se debe plantear
como hiptesis alternativa.

Ho: 24
Ha: >24 (la hiptesis que tu quieres probar la pones como
alternativa)
Prueba de la validez de una afirmacin:

A manera de ejemplo de la prueba de validez de una afirmacin,
considere una situacin en la que un fabricante de refrescos asegura
que los envases de dos litros de refresco contienen en promedio, por
lo menos 67.6 onzas de liquido. Se selecciona una muestra de
envases de dos litros y se mide su contenido para confirmar lo que
asegura el fabricante. En este tipo de situaciones de prueba de
hiptesis, se suele suponer que el dicho del fabricante es verdad a
menos que las evidencias mustrales indiquen lo contrario.

Ho: 67.6
Ha: <67.6
En toda situacin en la que se desee probar la validez de una
afirmacin, la hiptesis nula se suele basar en la suposicin de que la
afirmacin sea verdadera

Prueba en situaciones de toma de decisin:

Cuando se prueba una hiptesis de investigacin o la validez de
una afirmacin, se toman medidas si se rechaza Ho; sin embargo,
en algunas situaciones se toman tanto si no se puede rechazar Ho
como si se puede rechazar Ho. En general, este tipo de situaciones
se presentan cuando la persona debe tomar una decisin tiene que
elegir entre dos lneas de accin, una relacionada con la hiptesis
nula y otra con la hiptesis alternativa.

Por ejemplo, con base en una muestra de las piezas de un pedido
recibido, el inspector de control de calidad tiene que decidir si
acepta el pedido o si lo regresa al proveedor debido a que no
satisface las especificaciones. Suponga que una especificacin para
unas piezas determinadas sea que su longitud deba ser de 2
pulgadas. Si la longitud media es menor o mayor a dos pulgadas,
las piezas ocasionarn problemas de calidad en la operacin de
ensamblado.

Ho: =2
Ha: 2
Ejemplo:

Una lnea de operacin est diseada para llenar empaques de 32 onzas de
detergente para lavar. Con periodicidad se selecciona una muestra de los
empaques y se pesan para determinar si no se estn llenando con un peso
mayor o menor al indicado. Si los datos mustrales llevan a la conclusin de
que hay exceso o falta de llenado, se suspende la produccin y se ajusta al
llenado correcto.
a.-Formule las hiptesis nula y alternativa que ayudarn a determinar si se
debe detener la produccin y ajustar el peso. Comente.
Errores tipo I y II

Las hiptesis nula y alternativa son afirmaciones opuestas acerca de
la poblacin. Una de las dos, ya sea la hiptesis nula o la hiptesis
alternativa es verdadera, pero no ambas. Lo ideal es que la prueba de
hiptesis lleve a la aceptacin de Ho cuando Ho sea verdadera y al
rechazo de Ho cuando Ha sea verdadera.

Por desgracia, las conclusiones correctas no siempre son posibles.
Como la prueba de hiptesis se basa en una informacin muestral
debe tenerse en cuenta que existe la posibilidad de error.
Situacin en la poblacin
Ho es verdadera Ha es verdadera
Conclusin Se acepta Ho Conclusin
correcta
Error tipo II
Se rechaza Ho Error tipo I Conclusin
correcta
Prueba de la cola
inferior
Prueba de la cola
superior
Prueba de dos colas
Hiptesis Ho:o
Ha: <o
Ho:o
Ha: >o

Ho:=o
Ha: o

Estadstico de
prueba





Regla de rechazo:
mtodo del valor-p
Rechazar Ho si
valor-p
Rechazar Ho si
valor-p

Rechazar Ho si
valor-p

Regla de rechazo:
mtodo del valor
crtico
Rechazar Ho
si z-z
Rechazar Ho
si z-z

Rechazar Ho
si z-z/2
o si
z z/2

n
o x
z
o

=
n
o x
z
o

=
n
o x
z
o

=
Sntesis de las pruebas de hiptesis para la media poblacional
caso conocida.
Aplicacin 1

Un fabricante suministra los ejes traseros para los camiones correo del
Servicio Postal. Estos ejes deben soportar 80,000 lb por pulg
2
en
pruebas de carga, pero un eje excesivamente fuerte eleva los costos
de produccin de manera significativa. La larga experiencia indica que
la desviacin estndar de la fuerza de sus ejes es 4,000 lb por pulg
2
.
El fabricante selecciona una muestra de 100 ejes de la produccin, los
prueba y encuentra que la capacidad de carga media de la muestra es
79,600 lb por pulg
2

Media poblacin= 80,000
= desviacin estndar poblacin= 4,000
n= 100 tamao de muestra
Media de muestra= 79,600
Ho: =80,000 hiptesis nula: la media real es 80,000 lb por pulg
2

H1: 80,000 hiptesis alternativa: la media real no es 80,000

= 0.05 nivel de significancia para probar esta hiptesis.

x

= /raiz n
n
o x
z
o

=
Aplicacin 2
Una empresa de investigacin sobre bienes races, vigila los montos
de las rentas de departamentos en Estados Unidos. A mediados de
2002, la renta promedio de un departamento era $895, por mes.
Suponga que segn los estudios trimestrales anteriores, es razonable
suponer que la desviacin estndar poblacional es =$225. En un
estudio reciente, en una muestra de 180 departamentos en todo el
pas se obtuvo una media de 1025. Estos datos mustrales permiten
que se concluya que la media de la renta actual de departamentos es
superior a la media encontrada en 2002?
1. D la hiptesis nula y alternativa
2. Cul es el valor-p?
3. Con =0.01, cul es su conclusin?
Ho: 895
Ha: >895 (la hiptesis que tu quieres probar la pones como
alternativa)

n
o x
z
o

=
La diferencia en tamao entre muestras grandes y pequeas es importante cuando no
se conoce la desviacin estndar de la poblacin y se hace necesario estimarla a
partir de la desviacin estndar de la muestra. Si el tamao de la muestra n es de 30 o
menor y se desconoce, debemos utilizar la distribucin t. La distribucin t
apropiada tiene n-1 grados de libertad. Estas reglas tambin se aplican a la prueba de
hiptesis.
n
x
o
o =
Aplicacin 3

Una empresa sostiene que el salario medio por hora de sus
trabajadores es de 500 pesos. El sindicato sospecha que la empresa
exagera el valor del salario medio por hora. En una muestra de 400
trabajadores, el sindicato encuentra que el salario medio por hora es
de 490 pesos con una desviacin estndar de 60 pesos.
a. Plantear la hiptesis nula y alterna
b. Llegar a una conclusin respecto a la afirmacin de la empresa, con
un 5% de nivel de significacin.
n
o x
z
o

=
400
60
500 490
= z
Ho: media=
Ha: media < 500
Aplicacin 4 (Tarea)

El departamento de control de calidad de Tigre Toi especifica que el
peso promedio por paquete de cereal debe ser de 20 onzas.
Peridicamente se selecciona una muestra de cajas llenas, que se
pesan para determinar si estn faltas o sobradas de llenado. Si los
datos de la muestra llevan a la conclusin de que les falta o sobra
cereal, se debe parar la lnea de produccin y hacer los ajustes
necesarios para que el llenado sea correcto.
a) Formule las hiptesis nula y alternativa que ayuden a decidir si es
conveniente parar y ajustar la lnea de produccin o no.
b) Cul es el error de tipo I en este caso? Cules son las
consecuencias de cometerlo?

Aplicacin 5 (Tarea)

En una encuesta, un investigador obtuvo la estimacin de que la
media del nmero de horas de ver TV por familia es de 7.25 horas
diarias. Suponga que en esta encuesta participaron 200 familias y que
la desviacin estndar de la muestra fue de 2.5 horas diarias. Hace 10
aos, la media de la poblacin de horas de TV era de 6.70 por familia.
Si =la media de la poblacin del nmero de horas de ver TV por
familia hace 10 aos, pruebe la hiptesis


Use o=0.01.

Cul es el valor crtico del estadstico de prueba y cul es la regla de
rechazo?
Calcule el valor del estadstico de prueba.
cul es su conclusin?

70 . 6 : y 70 . 6 :
0
> s
a
H H
Pruebas de hiptesis para proporciones:

n
p p
p p
z
) 1 (
0 0
0

=
Ejemplo:
En aos anteriores 20% de los jugadores del campo eran mujeres. Para aumentar la
proporcin de mujeres se realiz una promocin especial. Un mes despus de realizada
la promocin, el administrador del campo solicita un estudio estadstico para
determinar si la proporcin de jugadoras ha aumentado.
muestra de tamao n
muestral proporcin p
hipotetica proporcin p
=
=
=
0
400
25 . 0
20 . 0
0
=
=
=
n
p
p
5 . 2
400
) 20 . 0 1 ( 20 . 0
20 . 0 25 . 0
=

= z
cola una prueba p Ha
p H
20 . 0
20 . 0
0
> =
s =
Ho la rechaza se to lo por
z
confianza un para
tan
64 . 1
% 95
=
Aplicacin 2

En un estudio acerca de la rotacin de puestos, un investigador
entrevista a una muestra aleatoria de 200 empleados de alto nivel
que cambiaron de trabajo el ao anterior. Treinta afirman haberlo
hecho a causa de la ausencia de perspectivas de ascenso en sus
anteriores trabajos.
a) Empleando un nivel de significancia de 0.05, ofrecen estos datos
suficiente evidencia que indique que menos del 20% de esos
empleados cambian de trabajo por ese motivo?
b) Cul es el valor p-value?

n
p p
p p
z
) 1 (
0 0
0

=
=

=
= =
= =
=
200
) 85 . 0 ( 15 . 0
20 . 0 15 . 0
85 . 0
20
17
15 . 0
200
30
200
0
z
p
p
n
El p-value, es el valor del
rea de la colita
Pruebas de hiptesis acerca 1 - 2

Estadstico de prueba para pruebas de hiptesis acerca de 1 y 2
1 y 2 desconocidas.
2
2
2
1
2
1
0 2 1
) (
n
s
n
s
D x x
t
+

=
2
2
2
2
2
2
1
1
2
1
2
2
2
2
1
2
1
1
1
1
1
|
|
.
|

\
|
|
|
.
|

\
|

+
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
+
=
n
s
n n
s
n
n
s
n
s
gl
Nota: considerar a Do=0, esto
quiere decir que no hay
diferencia entre las medias
poblacionales.
Tecnologa existente Software nuevo
300 274
280 220
344 308
385 336
372 198
360 300
288 315
321 258
376 318
290 310
301 332
283 263
Tamao de muestra n1=12 n2=12
Media Muestral X1=325 X2=286
Desviacin estndar muestral s1=40 s2=44
El investigador encargado de la evaluacin del nuevo software
espera poder demostrar que con el nuevo software se necesita
menos tiempo para el proyecto del sistema de informacin. De
manera que el investigador tratar de hallar evidencias que le
permitan concluir que 2 es menor que 1

Ho: 1-20
Ha: 1-2>0
Nivel de significancia =0.05

Probabilidad de una sola cola.
Valores t de Student y probabilidad P asociada
en funcin de los grados de libertad gl.

Nivel de
significancia
Inferencias acerca de la diferencia entre dos medias
poblacionales: muestras pareadas.
Trabajador Tiempo para
realizar la tarea
con el mtodo 1
(minutos)
Tiempo para
realizar la tarea
con el mtodo 2
(minutos)
Diferencia entre
los tiempos (di)
(di Media de las
diferencias)^2
1 6.0 5.4 0.6 (0.6-0.30)^2=
2 5.0 5.2 -0.2
3 7.0 6.5 0.5
4 6.2 5.9 0.3
5 6.0 6.0 0
6 6.4 5.8 0.6
Media de las
diferencias=0.30

dar es desviacin
n
d d
s
s dif erencia las de media
n
d
d
i
d
i
tan
1
) (
2

=
=

335 . 0
5
56 . 0
30 . 0
= =
=
d
s
d
Estadstico de prueba para pruebas de hiptesis con
muestras pareadas.
6
335 . 0
0
30 . 0
=
=
=
=

=
n
sd
d
d
n
s
d
t
d
d
calculada

t calculada=2.20
Para el problema anterior:

Ho: d=0
Ha: d0
=0.05
Para dos colas /2 = 0.025
n-1= grados de libertad=6-1



t= ?
t critica=2.571
Conclusin, se acepta Ho que no hay
diferencia entre las medias.
Regla de decisin, usando el mtodo de p-
value.

p-value nivel significacin, se rechaza
la hiptesis nula, caso contrario se acepta
la hiptesis nula.
Prueba de hiptesis acerca de p1-p2

Error estndar:
2
) 1 (
1
) 1 (
2 2 1 1
2 1
n
p p
n
p p
p p

+

o

Estadstico de prueba para pruebas de hiptesis acerca de p1-
p2
2 1
2 2 1 1
2 1
2 1
)
1 1
)( 1 (
) (
n n
p n p n
p
n n
p p
p p
z
+
+
=
+

=
Aplicacin:

Una empresa se dedica a elaborar declaraciones de impuestos,
suponga que la empresa desea realizar una prueba de hiptesis
para determinar si las proporciones de errores de las dos oficinas
son diferentes.
Ho: p1-p2=0
Ha: p1-p20
=0.10
p1=0.14
n1=250
p2=0.09
n2=300
Aplicacin:
Durante el partido Chivas, Atlas, un comercial de la cervecera,
conocido como las Chicas Sol, fue uno de los tres ms efectivos
televisados durante el evento. Una encuesta para ver la efectividad
de los comerciales, emple muestras por grupos de edades para ver
el efecto de la publicidad en el partido Chivas, Atlas sobre los
distintos grupos de edades. A continuacin se presentan los
resultados mustrales respecto del comercial de la marca cerveza.
Edad Tamao de muestra Le gust mucho el
comercial
Menos de 30 aos 100 49
De 30 a 49 aos 150 54
a.- Formule una prueba de hiptesis para determinar si las proporciones
poblacionales de los dos grupos de edades difieren.
b.-D la estimacin puntual de la diferencia entre las dos proporciones
poblacionales.
c.-Realice la prueba de hiptesis y d el valor-p. Con =0.05, cul es su
conclusin?
d.-Analice la forma en que el comercial llama la atencin del grupo de menor y
de mayor edad. Le parecer a la empresa cervecera que los resultados de esta
encuesta le son favorables?

Ho: p1-p2=0
Ha: p1-p20
=
p1=
n1=
p2=
n2=
Inferencias acerca de varianzas poblacionales

En los temas de los captulos anteriores se vieron mtodos de
inferencia estadstica para medias y proporciones poblacionales.
Ahora se extiende dicho estudio a las varianzas poblacionales. Un
ejemplo en que la varianza brinda una informacin importante para
tomar una decisin es el caso de un proceso en el que se llenan
recipientes con un detergente lquido. La maquina de llenado se
ajusta de manera que logre un llenado medio de 16 onzas por
envase. Aunque la media de llenado es importante, la varianza en los
pesos de llenado tambin es relevante.
Es decir, aun cuando la mquina de llenado tenga un ajuste adecuado
para una media de llenado de 16 onzas, no es de esperar que todos los
envases tengan exactamente 16 onzas.
Para calcular la varianza muestral de la cantidad de onzas en cada
envase se toma una muestra de envases llenos. El valor de la varianza
muestral sirve como una estimacin de la varianza en la poblacin de
envases que estn siendo llenados en el proceso de produccin.

Si la varianza muestral es moderada, el proceso continua. Pero si la
varianza muestral es grande, puede estar ocurriendo por exceso o
defecto de llenado, aunque la media sea correcta, en este caso habr
de reajustar la maquina.
Estimacin por intervalo para la varianza poblacional:
2
) 2 / 1 (
2
2
2
2 /
2
) 1 ( ) 1 (
o o
_
o
_

s s
s n s n
Donde los valores de X
2
estn basados en una distribucin
chi-cuadrada con n-1 grados de libertad y donde 1- es el
coeficiente de confianza.
Prueba de la cola
inferior
Prueba de la cola
superior
Prueba de dos colas
Hiptesis Ho:
2

2
o
Ho:
2
<
2
o


Ho:
2

2
o

Ho:
2
>
2
o


Ho:
2
=
2
o

Ho:
2

2
o


Estadstico de prueba X
2
=(n-1)s
2
/
2
o
X
2
=(n-1)s
2
/
2
o


X
2
=(n-1)s
2
/
2
o


Regla de rechazo:
mtodo del valor-p
Rechazar Ho si valor-
p
Rechazar Ho si valor-
p

Rechazar Ho si valor-
p

Regla de rechazo:
mtodo del valor
crtico
Rechazar Ho si

X
2
X
2

(1-)

Rechazar Ho si

X
2
X
2



Rechazar Ho si

X
2
X
2

(1-/2)

o si

X
2
X
2

/2



Pruebas de hiptesis para la varianza poblacional
Aplicacin:

En la industrial farmacutica la varianza en los pesos de los
medicamentos es trascendental. Considere un medicamento cuyo
peso est dado en gramos y una muestra de 18 unidades de este
medicamento, la varianza muestral es s
2
=0.36

a.- D un intervalo de 90% de confianza para estimar la varianza
poblacional de los pesos de este medicamento.
Aplicacin 2
Una pieza para automviles debe fabricarse con medidas de
tolerancia muy estrechas para que sea aceptada por el cliente. Las
especificaciones de produccin indican que la varianza mxima en la
longitud de la pieza debe ser 0.0004. Suponga que en 30 piezas la
varianza muestral encontrada es s
2
=0.0005. Use =0.05 para probar
si se est violando la especificacin para la varianza poblacional.
X
2
=(n-1)s
2
/
2
o
n= tamao de muestra
s2=varianza muestral=
2o= varianza de poblacin
gl=n-1=
X2calculada=
x2critica=



Prueba X
2

Prueba de Kolmogorov Sminov
Prueba de Anderson Daring


Distincin entre las pruebas paramtricas y
las no paramtricas
Cuando se analizan datos medidos por una variable cuantitativa
continua, las pruebas estadsticas de estimacin y contraste
frecuentemente empleadas se basan en suponer que se ha obtenido
una muestra aleatoria de una distribucin de probabilidad de tipo
normal o de Gauss.

Pero en muchas ocasiones esta suposicin no resulta vlida, y en
otras la sospecha de que no sea adecuada no resulta fcil de
comprobar, por tratarse de muestras pequeas. En estos casos
disponemos de dos posibles mecanismos: los datos se pueden
transformar de tal manera que sigan una distribucin normal, o bien
se puede acudir a pruebas estadsticas que no se basan en ninguna
suposicin en cuanto a la distribucin de probabilidad a partir de la
que fueron obtenidos los datos, y por ello se denominan pruebas no
paramtricas (distribution free), mientras que las pruebas que
suponen una distribucin de probabilidad determinada para los
datos se denominan pruebas paramtricas
Se denominan pruebas no paramtricas aquellas que no presuponen
una distribucin de probabilidad para los datos, por ello se conocen
tambin como de distribucin libre (distribution free). En la mayor
parte de ellas los resultados estadsticos se derivan nicamente a
partir de procedimientos de ordenacin y recuento, por lo que su
base lgica es de fcil comprensin. Cuando trabajamos con
muestras pequeas (n < 10) en las que se desconoce si es vlido
suponer la normalidad de los datos, conviene utilizar pruebas no
paramtricas, al menos para corroborar los resultados obtenidos a
partir de la utilizacin de la teora basada en la normal.
Las pruebas z y t son ejemplos de pruebas paramtricas. Por
ejemplo en la prueba z es necesario especificar la media y la
desviacin estndar de la poblacin de la hiptesis nula y, adems
los datos de la poblacin deben tener una distribucin normal (la
media y la desviacin estndar son parmetros).
Aunque todas las pruebas de inferencia dependen en cierta medida
de las caractersticas de la poblacin, los requisitos de las pruebas
no paramtricas son mnimas.

Como las pruebas de inferencia no paramtricas tienen menos
requisitos o supuestos relacionados con las caractersticas de
poblacin, surge la duda de si no deberamos utilizarlas todo el
tiempo, olvidndonos de las pruebas paramtricas.
Muchas de la pruebas paramtricas son robustas con respecto a la
violacin de los supuestos subyacentes.
JI-CUADRADA
EXPERIMENTOS CON UNA VARIABLE


Hasta este momento, hemos presentado pruebas de inferencia que
han sido utilizadas principalmente con datos ordinales, de intervalo
o razn.

La prueba de inferencia que se emplea ms a menudo con los datos
nominales es una prueba no paramtrica que se conoce como
ji-cuadrada


Aplicacin 1

Preferencia por las diversas marcas de cerveza ligera
Supongamos que usted quiere determinar si los consumidores de
cerveza que viven en Guadalajara difieren con respecto a sus
preferencias por las diferentes marcas de cerveza ligera. Para eso
decide realizar un experimento en el cual elige al azar a 150
consumidores de cerveza y los invita a probar las tres marcas
principales de esa bebida. Suponga que se han observado todas las
precauciones de un buen diseo experimental, como no mostrar los
nombres de las marcas a los sujetos del experimento y otros
cuidados similares. Los datos resultantes se presentan en la tabla.

Marca A Marca B Marca C Total
45 40 65 150
Los datos de cada celda son el nmero o la frecuencia de los sujetos
que corresponde a esa celda. As, 45 sujetos prefirieron la marca A,
40 prefirieron la marca B y 65 prefirieron la marca C. Podemos
concluir, a partir de estos datos, que existe alguna diferencia en las
preferencias de la poblacin?

Hiptesis nula: No existe diferencia alguna en la preferencia de la
poblacin por las diversas marcas de cerveza ligera.


=
e
e o
obt
f
f f
2
2
) (
_
Ecuacin para determinar la Ji cuadrada
fo= frecuencia observada en la celda
fe= frecuencia esperada en la celda

Marca A Marca B Marca C Total
45 40 65 150 frecuencia
observada
50 50 50 150 frecuencia
esperada
00 . 7 50 . 4 00 . 2 50 . 0
50
) 50 65 (
50
) 50 40 (
50
) 50 45 (
2 2 2
= + + =

=
t critica: 5.991
Buscar en la tabla con k-1 grados de
libertad, donde k es el numero de grupos o categoras,
para este caso k=3 y un nivel de significacin de 0.05
t
criti
ca
t obs= 7 Zona
aceptacin
zona de
rechazo
conclusin: se rechaza
nuestra hiptesis nula
Aplicacin 2:
Un investigador cree que la composicin tnica de la ciudad donde
l vive ha cambiado durante los ltimos aos. Las cifras ms
recientes (recopiladas hace unos cuantos aos) muestran que los
habitantes de dicha ciudad presentaban la siguiente composicin
tnica: 53% noruegos, 32% suecos, 8% irlandeses, 5% hispanos y 2%
italianos. Para poner a prueba su idea, el cientfico social obtiene
una muestra aleatoria de 750 habitantes. Los resultados que obtuvo
se presentan en la siguiente tabla:
Noruegos Suecos Irlandeses Hispanos Italianos Total
399 193 63 82 13 750
a.-Cul es la hiptesis nula?
b.-Cul es la conclusin de usted? Utilice =0.05

Hiptesis nula: La composicin tnica de la ciudad no ha cambiado,
Por lo tanto, la muestra de 750 individuos es una muestra aleatoria
extrada de una poblacin compuesta por 53% de noruegos, 32%
suecos, 8% de irlandeses, 5% de hispanos y 2% de italianos.
Completa la siguiente tabla:
fo Proporcin
esperada
fe (fo fe)
2
/ fe
399 399/750=0.53 0.53(750)=397.5 0.006
193 193/750= 9.204
63 0.150
82 52.807
13
Total 750 Total:
X
2
obt
=62.43
Los grados de libertad son 5-1=4
con un =0.05, buscas en la tabla y te debe dar un valor de 9.488
como X2
obt
=62.43 > 9.488 se rechaza

Pruebas de bondad del ajuste.

Antes de poder utilizar un generador de proceso en un estudio de
simulacin, debe mostrarse primero que es posible representar los
datos empricos a travs de una distribucin probabilstica terica
conocida.
Por ejemplo en los modelos de lneas de espera debe demostrarse
que la tasa de llegadas tiene una distribucin Poisson y el tiempo
de servicio una distribucin exponencial.

Es posible emplear diversas pruebas estadsticas para probar la
bondad del ajuste de una distribucin terica a conjunto
determinado de datos. Una de las que mas se usan con mayor
frecuencia es la prueba Ji cuadrada X
2

La prueba de X
2
pretende determinar si existe diferencia
significativa entre las frecuencias esperadas (las que se basan en la
distribucin terica) y las frecuencias reales (las de los datos). Los
pasos que se utilizan en el proceso de prueba son los siguientes:

1. Plantear la hiptesis de prueba, Ho, que seala que los datos
observados se extrajeron de una poblacin que puede
describirse a travs de una distribucin terica conocida.
2. Plantear la hiptesis alternativa, H1, que seala que los datos
observados no se extrajeron de la poblacin planteada en el
paso 1.
3. Identificar el nivel de significacin, , con el que se llevar a
cabo la prueba. (Recordar que 1- es el nivel de confianza de
una prueba estadstica.)
4. Utilizando la siguiente relacin matemtica.


=
fe
fe fo
cal
2
2
) (
_
en donde X
2
cal
= valor calculado de X
2

fo = frecuencias observadas
fe = frecuencias tericas o esperadas.

Si X
2
cal
> X
2
tablas
, entonces se rechaza Ho (se acepta H1)


Nota: La distribucin continua chi cuadrada puede aproximarse
razonablemente a la distribucin discreta


=
fe
fe fo
cal
2
2
) (
_
siempre y cuando todos los valores de fe sean de al menos 5.
(Hay formas para evitar el problema de una frecuencia que se
espera menor que 5, como combinar categoras de manera que
todas las frecuencias que se esperan sean al menos 5)
Ejemplo:

Suponga que los datos que aparecen en las dos primeras
columnas, corresponden al nmero de clientes que entran a un
banco cada hora. Estos datos se recolectaron al azar para 204
periodos de una hora. Con base en estos datos, plantearamos la
hiptesis (Ho) de que los datos pueden representarse por medio
de una distribucin de Poisson.
Nmero de llegadas por hora
(x)
Frecuencia observada (fo)
0 70
1 84
2 34
3 12
4 4
Nmero
de
llegadas
por hora
(x)
Frecuenc
ia
observad
a (fo)
Probabilidad esperada de
acuerdo a Poisson
Frecuencia esperada
(fe)
(fo-fe)
2
/ fe
0 70 p(x=0)=(1)(e
-
1
)/0!=0.36788
0.36788 x 204=
75.05
(70-75.05)
2
/75.05
=0.3398
1 84 p(x=1)=(1)(e
-
1
)/1!=0.36788

0.36788 x 204=
75.05
2 34 p(x=2)=(1)(e
-
1
)/2!=_______

3 12 p(x=3)=________________

=0.0088 (agrupando
3 y 4, porque la
frecuencia esperada de
4 debe ser al menos 5)
4 4 p(x4)=________________
ojo, probabilidad mayor o
igual a 4= 1- (suma de las
otras probabilidades)
Total=
204
X
2
cal
= 1.7461
s s =

x
x
e T
x p
T x
0 ,
!
) (
) (

en donde T= nmero promedio de llegadas por


periodo T
x = nmero de llegadas en el intervalo de
tiempo
Regin de rechazo Regin aceptacin
Chi-critica, que se busca con las tablas =
7.815
Grados de libertad= Numero de categoras 1= 4-1=3
= 0.05 95% de confianza
Si X
2
cal
> X
2
tablas
, entonces se rechaza Ho (se acepta
H1)


Llega Don Poisson
Lo atiende Doa
Exponencial
Many of the distributions discussed in this chapter are related to one
another in various ways. For example, the geometric distribution is
related to the binomial distribution.

The geometric distribution represents the number of trials until the
next
success while the binomial represents the number of successes in a
fixed number of trials.

Similarly, the Poisson distribution is related to the exponential
distribution.

The exponential distribution represents the amount of time until the
next occurrence of an event while the Poisson distribution represents
the number of times an event occurs within a given period of time.
Notas, tcnicas (respecto a la dualidad en las distribuciones de
probabilidad
http://www.elmundo.es/traductor/
In some situations, as when the number of trials for the binomial
distribution becomes very large, the normal and binomial
distributions become very similar. For these two distributions, as the
number of binomial trials approaches infinity, the probabilities
become identical for any given interval. For this reason, you can use
the normal distribution to approximate the binomial distribution
when the number of trials becomes too large for Crystal Ball to handle
(more than 1000 trials).

You also can use the Poisson distribution to approximate the
binomial distribution when the number of trials is large, but there is
little advantage to this since Crystal Ball takes a comparable amount
of time to compute both distributions.

Likewise, the normal and Students t distributions are related. With
Degrees of Freedom > 30, Students t closely approximates the
normal distribution.
Prueba de independencia entre dos variables:
Una de las principales aplicaciones de la Ji-cuadrada consiste en
determinar si dos variables categricas son independientes o estn
relacionadas entre s. Para ilustrar este punto veamos el siguiente
ejemplo:
Afiliacin poltica y actitud
Supongamos que en la legislatura local est en estudio un proyecto
de ley cuyo propsito es reducir la edad legal a fin de permitir el
consumo de bebidas alcohlicas a las personas de 18 aos. Un
diputado (que trabaja) que vive en esa ciudad quiere determinar si
existe alguna relacin entre la afiliacin poltica y la actitud frente
al proyecto de ley. Para averiguarlo, este diputado enva cartas a
dos muestras aleatorias, una de ellas formada por 200 miembros
del PRD y la otra por 200 miembros del PAN. En la carta el diputado
explica su inters por el proyecto de ley y pregunta a los
destinatarios si estn a favor, indecisos o en contra de esa iniciativa
de ley. Les asegura la plena confidencialidad de sus respuestas. En
la carta incluye un sobre con el porte pagado para facilitar la
respuesta.
El diputado investigador, recibe respuesta de los 400, los
resultados obtenidos se muestran en la tabla:
Actitud
A favor Indecisos En contra Total
por
regln
Afiliacin
poltica
PRD 68 22 110 200
PAN 92 18 90 200
Total por
columna
160 40 200 400
Este tipo de arreglo se conoce como tabla de contingencia.
Una tabla de contingencia se compone de dos vas o entradas y
muestra la relacin contingente entre dos variables, cuando stas
han sido clasificadas en categoras mutuamente excluyentes y
cuando los datos de cada celda son frecuencias.
Hiptesis nula: En la poblacin, la actitud hacia el proyecto y la
afiliacin poltica son independientes.
Si lo anterior es cierto, entonces los del PRD y PAN en la poblacin
debern tener la misma proporcin de personas a favor,
indecisas y en contra del proyecto.
Actitud
A favor Indecisos En contra Total
por
regln
Afiliacin
poltica
PRD 68 22 110 200
PAN 92 18 90 200
Total por
columna
160 40 200 400
fo Proporcin esperada de
la poblacin que esta
a..
fe (fo fe)
2
/ fe
PRD 68 a favor (68+92)/400=160/400
proporcin de personas en total
que estn a favor
(160/400)200=80 (68-80)
2
/80= 1.80
22 indecisos (22+18)/400= 40/400
110 en contra
PAN 92 a favor (68+92)/400=160/400

18 indecisos
90 en contra
Total 400 Total:
X
2
obt
=6.00
Hiptesis nula: En la poblacin, la actitud hacia el proyecto y la
afiliacin poltica son independientes.
grados de libertad=(r-1)(c-1)=(2-1)(3-1)=2 con un =0.05,
buscando en la tabla de la ji cuadrada encuentras:

X2
critica
= 5.991, como la observada es mayor que la critica se
rechaza la hiptesis nula.
Aplicacin 3:
En universidad estudia la posibilidad de implantar uno de los tres
sistemas de calificaciones. Se realiza una encuesta para determinar
si existe alguna relacin entre el rea de licenciatura que estudia
cada alumno y la preferencia que manifiesta por algn sistema de
calificacin en particular. Entonces se elige una muestra aleatoria
constituida por 200 estudiantes del rea de ingenieras, 200 de
artes y ciencias y 100 de bellas artes. Se pregunta a cada alumno
cul de los tres sistemas prefiere. Los resultados se presentan en la
siguiente tabla de contingencia.
a.-Cul es la hiptesis nula?
b.-Cul es tu conclusin?
Sistema de calificacin
Sistema 1 Sistema 2 Sistema 3 Total por
rengln
Bellas artes 26 55 19 100
Artes y
ciencias
24 118 58 200
Ingeniera 20 112 68 200
Total por
columna
70 285 145 500
Hiptesis nula: El rea de estudio de los estudiantes y su
preferencia por algn sistema de calificacin son independientes
entre s. La frecuencia obtenida en cada celda se debe al muestreo
aleatorio realizado en una poblacin donde las proporciones de
estudiantes de bellas artes, artes y ciencias, e ingeniera, que
prefieren cada sistema de calificacin son iguales.
Celda nmero fo fe (fo fe)
2
/fe
1 26 (70/500)x100=14 10.286
2 55 (285/500)x100
3 19
4
5
6
7
8
9
=18.56
Grados de libertad (r-1)(c-1)
Aplicacin 4
Un investigador esta interesado en determinar si existe alguna
relacin entre el nivel de educacin de los padres y el nmero de
hijos que tienen. Para averiguarlo, realiza una encuesta y as
obtiene los siguientes resultados.
Nmero de hijos
Dos o menos Ms de dos Suma por
rengln
Educacin
universitaria
53 22 75
Solamente
bachillerato
37 38 75
Suma por
columna
90 60 150
a.-Cul es la hiptesis nula?
b.-Cul es la conclusin? Utilice =0.05
Supuestos subyacentes a Ji cuadrada

Un supuesto bsico para utilizar Ji cuadrada consiste en que cada
una de las observaciones registradas en la tabla de contingencia es
independiente de las dems. Esto significa que cada sujeto puede
tener slo un dato en la tabla. No se permite realizar varias
mediciones con el mismo sujeto e introducirlas como frecuencia
separadas en la misma celda o en otra distinta. Este error
producira una N mayor que el nmero de observaciones
independientes realizadas.
Un segundo supuesto establece que el tamao de muestra deber
ser lo suficientemente grande para que la frecuencia esperada en
cada celda sea de 5, por lo menos, para las tablas en las que r o c
es mayor que 2.

Si la tabla es de 1x2 o de 2x2, entonces cada frecuencia esperada
tendr que ser de 10 cuando menos.
LA PRUEBA DE RANGOS CON SIGNO Y PARES IGUALADOS DE WILCOXON

La prueba de rangos con signo de Wilcoxon se utiliza en
combinacin con el diseo de grupos correlacionados, el cual debe
contener datos que tengan por lo menos una escala ordinal. Se
trata de una prueba relativamente potente que a veces se emplea
en lugar de la prueba t para grupos correlacionados, cuando hay
una violacin extrema del supuesto de normalidad o cuando los
datos no tienen la escala adecuada.
Aplicacin 1 (Ecologa)
Promocin de actitudes ms favorables hacia la conservacin de la
vida silvestre:
Un destacado grupo ecolgico planea realizar una campaa activa para fomentar la
conservacin de la flora y la fauna silvestres en su pas. Como parte de la campaa,
piensan exhibir una pelcula producida con el fin de promover actitudes ms favorables
hacia la conservacin de la vida silvestre. Antes de exhibirla a todo el pblico, los
promotores de la campaa desean evaluar los efectos de la pelcula. Para eso se elige al
azar a un grupo de 10 sujetos y se les proporciona un cuestionario que mide la actitud
individual hacia la conservacin de la vida silvestre. A continuacin, se les proyecta la
pelcula y despus de la exhibicin contestan de nuevo el cuestionario de actitudes.
Este tiene 50 puntos posibles y cuanto mas alta sea la puntuacin, tanto mas favorable
ser la actitud hacia la conservacin de la vida silvestre. Los resultados se presentan en
la tabla.
a.-Cul es la hiptesis nula?
b.-Cul es la conclusin? Utilice =0.05 (2 colas)
Hiptesis nula:

La hiptesis nula se enuncia sin especificar los parmetros de
poblacin. Para este ejemplo establece que la pelcula no influye en
las actitudes hacia la conservacin de la vida silvestre.

Voy ha comparar el despus con
el antes
Realizare la diferencia Despus -
Antes
Actitud A
Primer
paso
B
Segundo
paso
C
Tercer paso
D
Cuarto paso
E
Quinto paso
F
Sexto
paso
Sujeto Antes Despus Diferencia
(Despus
Antes)
Valor
absoluto de
la diferencia
Ordenar los valores
absolutos de los valores de
la diferencia de menor a
mayor.
(De la columna B al mas
chico le asignas el 1 y as te
vas al que sigue el 2 y as
sucesivamente)
Rango con signo de la
diferencia
Asignar a los rangos
resultantes el signo del
puntaje de diferencia cuyo
valor absoluto produjo ese
rango.
(En esta columna son los
nmeros de la columna C,
pero con los signos de la
columna A)
Suma de los
rangos positivos
(En esta columna
colocas los
nmeros de la
columna D que
sean positivos)
Suma de
los rangos
negativos
1 40 44 4 4 4 4 4
2 33 40 7 7 6 6 6
3 36 49 13 13 10 10 10
4 34 36 2 2 2 2 2
5 40 39 -1 1 1 -1 -1
6 31 40 9 9 8 8 8
7 30 27 -3 3 3 -3 -3
8 36 42 6 6 5 5 5
9 24 35 11 11 9 9 9
10 20 28 8 8 7 7 7
=55 =51

=4

Las tres primeras columnas son los datos del problema, las siguientes columnas son los pasos para llegar a la
solucin. Para llegar a la conclusin determinamos T
obt
calculando la suma de los rangos positivos y la suma de
los rangos negativos, T
obt
es la menor de esas sumas, para nuestro caso T
obt
=4.
Para N=10 y con =0.05 (2 colas) buscando en la tabla de Wilcoxon, vemos que T
crit
=8
Si T
obt
T
crit
deber rechazarse la hiptesis nula Ho

Aplicacin 2
Un investigador quiere determinar si la dificultad del material que han de aprender
afecta el nivel de ansiedad de los estudiantes universitarios. A cada uno de los
miembros de una muestra aleatoria de 12 alumnos se le asignan ciertas tareas de
aprendizaje que se clasifican como fciles o difciles. Antes de que los estudiantes
inicien cada tarea, se les presentan algunos ejemplos como muestra del material que
van ha aprender. A continuacin se mide el nivel de ansiedad que mostraron los
alumnos, mediante un cuestionario adecuado. De esta manera, se mide el nivel de
ansiedad antes de cada tarea de aprendizaje. Los datos se muestran en la tabla
siguiente. Mientras mas alta sea la calificacin, mayor ser el nivel de ansiedad. Cul
es la conclusin, utilizando la prueba de rangos de Wilcoxon y =0.05 (2 colas)

Hiptesis nula:
---- La dificultad del material no influye en el
nivel de ansiedad


Voy ha comparar la ansiedad cuando el material es
difcil con la ansiedad cuando el material es fcil

Difcil - Fcil
Ansiedad A B C D E F
Estudiant
e nmero
Tareas
difciles
Tareas
fciles
Diferencia
(Difciles
fciles)
Valor
absoluto
de la
diferencia
Ordenar los valores
absolutos de los valores
de la diferencia de
menor a mayor.
(De la columna B al mas
chico le asignas el 1 y
as te vas al que sigue el
2 y as sucesivamente)
Rango con signo de la
diferencia
Asignar a los rangos
resultantes el signo del
puntaje de diferencia cuyo
valor absoluto produjo ese
rango.
(En esta columna son los
nmeros de la columna C,
pero con los signos de la
columna A)
Suma de los
rangos
positivos
(En esta
columna
colocas los
nmeros de la
columna D
que sean
positivos)
Suma de los
rangos
negativos
1 48 40 8 8 7
2 33 27 6 6 5
3 46 34 12 12 11
4 42 28 14 14 12
5 40 30 10 10 9.5
6 27 24 3 3 Segundo y tercero
estn empatados
entonces se saca la
media (2+3)/2=2.5
y se asigna este valor
a los empates
7 31 33 -2 2 1
8 42 39 3 3 2.5
9 38 31 7 7 6
10 34 39 -5 5 4
11 38 29 9 9 8
12 44 34 10 10 Noveno y decimo
estn empatados
(9+10)/2=9.5
Aplicaciones de repaso1:

Una investigadora cree que la estatura de las mujeres ha aumentado en aos recientes.
Ella sabe que hace 10 aos, en la ciudad donde vive, el promedio de estatura de una
mujer adulta joven era de 63 pulgadas. No se conoce la desviacin estndar. La
investigadora toma una muestra aleatoria de 8 mujeres jvenes adultas que residen en
dicha ciudad y mide sus estaturas. As obtiene los siguientes datos:

Estatura en pulgadas
64 66 68 60 62 65 66 63
Encuentra lo siguiente:
Media de los datos de muestra
Desviacin estndar de los datos de muestra.
Plantear la hiptesis nula:
Aplicar la formula para la t student
Decidir si se acepta o se rechaza la hiptesis nula


Aplicaciones de repaso2 (Ji cuadrada):
Se llevo a cabo un estudio para determinar si los habitantes de las grandes ciudades y
de poblados pequeos difieren en su disposicin para ayudar a los desconocidos. En
este estudio, llamaban a la puerta de personas que vivan en Nueva York o en los
pequeos poblados cercanos. Los investigadores les explicaban que no encontraban la
direccin de un amigo que viva cerca de ah y les pedan permiso para utilizar el
telfono. Los siguientes datos muestran la cantidad de individuos que admitieron a los
desconocidos (los investigadores) en sus casas y los que no los admitieron:

Admitieron al
desconocido en su
casa
No admitieron al
desconocido en su
casa
Habitante de una gran
ciudad
60 90 150
Habitante de un
pequeo poblado
70 30 100
130 120 250
Contesta lo siguiente:
Difieren los habitantes de la gran ciudad y los habitantes de poblados pequeos en su
disposicin para ayudar a los desconocidos? Utilice un =0.05 para tomar su decisin.

S-ar putea să vă placă și