Documente Academic
Documente Profesional
Documente Cultură
, el estadstico:
para x>0
La tabla que se utilizar para estos apuntes es la del libro de probabilidad
y estadstica de Walpole, la cual da valores crticos
(gl) para veinte
valores especiales de
. Para denotar el valor crtico de una
2
distribucin X con gl grados de libertad se usa el smbolo
(gl); este
valor crtico determina a su derecha un rea de
bajo la curva X2 y
sobre el eje horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se
localiza 6 gl en el lado izquierdo y
a o largo del lado superior
de la misma tabla.
Clculo de Probabilidad
El clculo de probabilidad en una distribucin muestral de varianzas nos
sirve para saber como se va a comportar la varianza o desviacin
estndar en una muestra que proviene de una distribucin normal.
Ejemplos:
1. Suponga que los tiempos requeridos por un cierto autobs para
alcanzar un de sus destinos en una ciudad grande forman una
distribucin normal con una desviacin estndar =1 minuto. Si se
elige al azar una muestra de 17 tiempos, encuentre la probabilidad
de que la varianza muestral sea mayor que 2.
Solucin:
Primero se encontrar el valor de ji-cuadrada correspondiente a
s2=2 como sigue:
y
Aqu se tienen que buscar los dos valores en el rengln de 24 grados de
libertad. Al buscar el valor de 13.846 se encuentra un rea a la derecha
de 0.95. El valor de 42.98 da un rea a la derecha de 0.01. Como se est
pidiendo la probabilidad entre dos valores se resta el rea de 0.95 menos
0.01 quedando 0.94.
Por lo tanto la P(3.462
s2
10.745) = 0.94
Estimacin de la Varianza
Para poder estimar la varianza de una poblacin normal se utilizar la
distribucin ji-cuadrada.
Ejemplos:
1. Los siguientes son los pesos, en decagramos, de 10 paquetes de
semillas de pasto distribuidas por cierta compaa: 46.4, 46.1, 45.8,
Graficamente:
Ejemplos:
1. Una compaa que produce una parte maquinada para un motor,
afirma que tiene una varianza de dimetro no mayor a 0.0002
pulgadas. Una muestra aleatoria de 10 de dichas partes dio una
varianza de muestra s2 = 0.0003. Si se supone que las medidas del
dimetro se distribuyen en forma normal, hay evidencia para
refutar lo que afirma el proveedor? Use
= 0.05.
Solucin:
Como en todos los ensayos de hiptesis que se han realizado
anteriormente el procedimiento es el mismo. Despus de que se
identifican los datos, se plantea la hiptesis para determinar el tipo
de ensayo.
Datos:
= 0.0002
n = 10
s2 = 0.0003
= 0.05
Ensayo de hiptesis:
Ho;
= 0.0002
H1;
> 0.0002
Regla de decisin:
Si X2R 16.919 no se rechaza Ho.
Si X2R>16.919 se rechaza Ho.
Clculos:
Justificacin y decisin:
Como 13.5 no es mayor que 16.919 por lo tanto no se rechaza Ho y
se concluye con un nivel de significancia de 0.05 que no se puede
refutar la afirmacin del proveedor.
= 18
18
Regla de decisin:
Si 2.7
Justificacin y decisin:
Como 11.52 est entre 2.7 y 19.023, no se rechaza Ho, y se
concluye con un nivel de significancia de 0.05 que la varianza del
contenido de azcar del almbar no ha cambiado, esto es es de 18
mg2.
Si recordamos al principio de este tema se dijo que la media de la
distribucin ji-cuadrada es (n-1), por lo tanto la media de este
ejercicio es de 9. Como el valor real de X2R = 11.52 este nmero se
encuentra a la derecha de la media, lo cual quiere decir que el
valor de P/2 ser el rea a la derecha del valor de X2R. Al buscar el
valor de 11.52 en la tabla se obtiene un rea de 0.2423, por lo tanto
P/2 = 0.2423 y P= (2)(0.2423) = 0.4846
=6
H1;
<6
Clculos:
Error tipo II
El error tipo II se calcula de la misma forma en la que se calcul con la
distribucin z. Se realizarn algunos ejercicios en los cuales se
determinar la probabilidad de cometer el error tipo II, utilizando la tabla
de la distribucin Ji-cuadrada.
1. Se tiene un ensayo de hiptesis unilateral derecho, con n=20 y
= 0.05
Ho;
= 0.10
H1;
> 0.10
Solucin:
Para poder calcular el error tipo II, primero se debe encontrar el
valor de la varianza muestral lmite, esto es s2L, para poder calcular
los valores de X2 y posteriormente calcular el rea. Al buscar en la
tabla X2(0.05,19)=30.144, este valor se sustituir en la formula. Al
despejar de la frmula original de X2 se obtiene:
Solucin:
Como este es un ensayo bilateral se tendrn dos valores de s2L. Los
cuales se calcularn utilizando las ji-cuadradas lmites que eran de de 2.7
y 19.023.
Estos dos valores se utilizarn para calcular las nuevas ji-cuadradas para
calcular el valor de
y varianza
Si
estadstica si se reemplaza
respuesta a esta pregunta.
4. A medida que
, la secuencia de curvas t se aproxima a la
curva normal estndar, por lo que la curva z recibe a veces el
nombre de curva t con gl =
La distribucin de la variable aleatoria t est dada por:
grados de libertad.
en la cola
Para verificar esta afirmacin toma una muestra de 25 lotes cada mes. Si
el valor de t calculado cae entre t0.05 y t0.05, queda satisfecho con su
afirmacin. Qu conclusin extraera de una muestra que tiene una
media de 518 gramos por milmetro y una desviacin estndar de 40
gramos? Suponga que la distribucin de rendimientos es
aproximadamente normal.
Solucin:
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711.
Por tanto, el fabricante queda satisfecho con esta afirmacin si una
muestra de 25 lotes rinde un valor t entre 1.711 y 1.711.
Se procede a calcular el valor de t:
; CON
DESCONOCIDA
donde
rea de
/2
es el valor t con
/2 a la derecha.
, desconocida, un intervalo de
= 42 kilowatt-hora
n = 12
= 0.05
3. Ensayo de hiptesis
Ho;
= 46 kilowatt-hora
H1;
< 46 kilowatt-hora
4. Regla de decisin:
Si tR
-1.796 No se rechaza Ho
6. Justificacin y decisin:
Como 1.16 > -1.796, por lo tanto no se rechaza Ho y se concluye
con un nivel de significancia del 0.05 que el nmero promedio de
kilowwatt-hora que gastan al ao las aspiradoras no es
significativamente menor que 46.
Solucin por el otro mtodo:
Regla de decisin:
Si
Si
39.83 No se Rechaza Ho
< 39.83 Se rechaza Ho
19.8
18.5
17.6
16.7
15.8
15.4
14.1
13.6
11.9
11.4
11.4
8.8
7.5
15.4
15.4
19.5
14.9
12.7
11.9
11.4
10.1
7.9
= 10
H1;
> 10
4. Regla de decisin:
Si tR 1.721 no se rechaza Ho.
Si tR> 1.721 se rechaza Ho.
5. Clculos:
6. Justificacin y decisin.
Como 4.90 >1.721 se rechaza Ho y se concluye con un nivel de
significancia del 0.05 que la carga de falla promedio es mayor que
10Mpa.
Existe otra manera de resolver este ejercicio, tomando la decisin en
base al estadstico real, en este caso la media de la muestra. De la
frmula de la distribucin muestral de medias se despeja la media de la
muestra:
Regla de decisin:
Si
Si
11.30 No se rechaza Ho
= 14 libras
14 libras
3. Regla de Decisin:
Si 2.365
tR 2.365 No se rechaza Ho
5. Justificacin y decisin:
Como 2.365 0.7012 2.365 por lo tanto, no se rechaza Ho y se
concluye con un nivel de significancia del 0.05 que el peso
promedio de todos los bebs de seis meses es de 14 libras.
Solucin por el otro mtodo:
12.98 y 15.01
Regla de decisin:
Si 12.98
Si
15.01 No se rechaza Ho
< 12.98
Como la
Error tipo II
El error tipo II se calcula de la misma forma en la que se calcul con la
distribucin z. Se realizarn algunos ejercicios en los cuales se
determinar la probabilidad de cometer el error tipo II, utilizando la tabla
de la distribucin.
Existen curvas caractersticas de operacin en los libros con diferentes
grados de libertad para determinar los tamaos de muestra
= 1.5 volts
H1;
3. Regla de decisin:
Si tR
-2.624 No se rechaza Ho
6. Justificacin y decisin:
Como 1.84 > -2.624, por lo tanto no se rechaza Ho y se concluye
con un nivel de significancia del 0.01 que los voltajes de las pilas
tamao C no son menores a 1.5.
Para calcular el error tipo II se tiene que obtener el valor de
siguiente forma:
de la
grados de libertad en el
para
para
0.0005
0.001
0.005
1 2 3 . .. 500
0.9995
30.4
Como nos podemos imaginar existen varias curvas Fisher, ya que ahora
su forma depende de dos variables que son los grados de libertad.
Ejemplos :
1. Encontrar el valor de F, en cada uno de los siguientes casos:
a. El rea a la derecha de F, es de 0.25 con
=4 y
=9.
=15 y
=6 y
=10.
=8.
=24 y
=24
Solucin:
a. Como el rea que da la tabla es de cero a Fisher, se tiene que
localizar primero los grados de libertad dos que son 9, luego un
rea de 0.75 con 4 grados de libertad uno.
Area
0.90
2.09
0.95
2.59
Area
0.95
2.39
0.975
2.84
Area
15
0.933
20
0.9516
Solucin:
Calcular el valor de Fisher:
Mtodo 2
n1 = 31
n2 = 25
s12 = 50
s22 = 24
2
1
2
2
Solucin:
Por la recomendacin de que la varianza muestral mayor va en el
numerador se tiene la siguiente frmula:
al despejar:
y
Estos resultados los podemos interpretar de la siguiente manera:
Con un nivel de confianza del 90% se sabe que la relacin de
varianzas 12/ 22 esta entre 1.07 y 3.93. Esto supondra que la
varianza de la poblacin 1 es mayor a la varianza de la poblacin 2
entre 1.07 y 3.93.
2. Una compaa fabrica propulsores para uso en motores de turbina.
Al ingeniero de manufactura le gustara seleccionar el proceso que
tenga la menor variabilidad en la rugosidad de la superficie. Para
ello toma una muestra de n1=16 partes del primer proceso, la cual
tiene una desviacin estndar s1 = 4.7 micropulgadas, y una
muestra aleatoria de n2=12 partes del segundo proceso, la cual
tiene una desviacin estndar s2 = 5.1 micropulgadas. Se desea
encontrar un intervalo de confianza del 90% para el cociente de las
dos varianzas 12/
. Suponga que los dos procesos son independientes y que la rugosidad
de la superficie est distribuida de manera normal.
2
Solucin:
Por la recomendacin de que la varianza muestral mayor va en el
numerador se tiene la siguiente frmula:
al despejar:
En este caso los grados de libertad uno valen 11 y los grados de libertad
dos 15.
y
Estos resultados los podemos interpretar de la siguiente manera:
Puesto que este intervalo de confianza incluye a la unidad, no es posible
afirmar que las desviaciones estndar de la rugosidad de la superficie de
los dos procesos sean diferentes con un nivel de confianza del 90%.
Ensayo de Hiptesis
Supngase que se tiene inters en dos poblaciones normales
independientes, donde las medias y las varianzas de la poblacin son
desconocidas. Se desea probar la igualdad de las dos varianzas, ya que
para poder comparar las medias de estas dos poblaciones se utiliza la
distribucin t de Student, en la cual podemos tener varianzas iguales o
diferentes en la poblacin.
Para conocer esto ltimo se requiere de la distribucin Fisher, y despus
de utilizarla, se tomar la decisin de tener o no varianzas iguales en la
poblacin, dando pi a realizar la comparacin de las dos medias segn
estemos hablando. Primer caso en que las varianzas de la poblacin son
desconocidas pero iguales, o en el caso dos donde se tienen varianzas
desconocidas pero dismiles.
Solucin:
Datos:
Poblacin 1 Poblacin 2
n1 = 25 n2 = 20
= 0.05
Ensayo de hiptesis:
Estadstico de prueba:
Regla de decisin:
Si Fc 2.11 No se rechaza Ho,
Si la Fc > 2.11 se rechaza Ho.
Clculo:
Decisin y Justificacin:
Como 2.04 es menor que 2.11 no se rechaza Ho, y se concluye con
un
= 0.05 que no existe suficiente evidencia para decir que la
varianza del proceso 2 es menor que la del proceso 1.
Ensayo de hiptesis:
Estadstico de prueba:
Regla de decisin:
Si Fc 2.20 No se rechaza Ho,
Si la Fc > 2.20 se rechaza Ho.
Clculo:
Decisin y Justificacin:
Como 1.22 es menor que 2.20 no se rechaza Ho, y se concluye con
un
= 0.10 que la variacin de llenado de la mquina Robo-Fill no es
menor a la de Automat-Fill, por lo que se selecciona cualquier mquina.
Estadstico de prueba:
Regla de decisin:
Si 0.406
Fc
Decisin y Justificacin:
Como 0.85 esta entre los dos valores de Ho no se rechaza , y se concluye
con un
= 0.05 que existe suficiente evidencia para decir que las
varianza de las poblaciones son iguales.
Error Tipo II
1. Para el ejercicio anterior, encontrar la probabilidad de cometer error
tipo II si la verdadera relacin
Solucin:
1.5.
Solucin:
por lo tanto s12/s22 = 2.11 ya que esto fue lo que dio la tabla
y al despejar nos queda los mismo. Se calcula un nuevo valor de F con la
relacin de varianzas de 1.5.
Area
Valor de F
0.50
1.02
0.75
1.41
Valor de F
0.75
1.35
0.90
1.77
Area
15
0.7474
20
0.77
Ejemplo:
Una empresa elctrica fabrica focos que tienen una duracin que se
distribuye aproximadamente en forma normal, con media de 800 horas y
desviacin estndar de 40 horas. Encuentre la probabilidad de que una
muestra aleatoria de 16 focos tenga una vida promedio de menos de 775
horas.
Solucin:
a.
Artculos Malos
Proporcin de
artculos
defectuoso
Nmero de
maneras en las que
se puede obtener la
muestra
4/5=0.8
8C1*4C4=8
3/5=0.6
8C2*4C3=112
2/5=0.4
8C3*4C2=336
1/5=0.2
8C4*4C1=280
0/5=0
8C5*4C0=56
Total
792
=P
Ejemplo:
Se ha determinado que 60% de los estudiantes de una universidad
grande fuman cigarrillos. Se toma una muestra aleatoria de 800
estudiantes. Calcule la probabilidad de que la proporcin de la muestra
de la gente que fuma cigarrillos sea menor que 0.55.
Solucin:
Este ejercicio se puede solucionar por dos mtodos. El primero puede
ser con la aproximacin de la distribucin normal a la binomial y el
segundo utilizando la frmula de la distribucin maestral de proporciones.
Aproximacin de la distribucin normal a la binomial:
Datos:
n=800 estudiantes
p=0.60
x= (.55)(800) = 440 estudiantes
p(x 440) = ?
Media= np= (800)(0.60)= 480
p(x 440) = 0.0017. Este valor significa que existe una probabilidad del
0.17% de que al extraer una muestra de 800 estudiantes, menos de 440
fuman cigarrillos.
a. Datos:
n= 60 artculos
P=0.04
p= 0.03
p(p<0.03) = ?
b. Datos:
n= 60 artculos
P=0.04
p= 0.01 y 0.05
p(0.01<p<0.05) = ?
que
y que
Ejemplo:
En un estudio para comparar los pesos promedio de nios y nias de
sexto grado en una escuela primaria se usar una muestra aleatoria de
20 nios y otra de 25 nias. Se sabe que tanto para nios como para
nias los pesos siguen una distribucin normal. El promedio de los pesos
de todos los nios de sexto grado de esa escuela es de 100 libras y su
desviacin estndar es de 14.142, mientras que el promedio de los pesos
de todas las nias del sexto grado de esa escuela es de 85 libras y su
desviacin estndar es de 12.247 libras. Si representa el promedio de
los pesos de 20 nios y es el promedio de los pesos de una muestra
de 25 nias, encuentre la probabilidad de que el promedio de los pesos
de los 20 nios sea al menos 20 libras ms grande que el de las 25
nias.
Solucin:
Datos:
1
= 100 libras
= 85 libras
= 14.142 libras
= 12.247 libras
n1 = 20 nios
n2 = 25 nias
=?
Ejemplo:
Uno de los principales fabricantes de televisores compra los tubos de
rayos catdicos a dos compaas. Los tubos de la compaa A tienen una
vida media de 7.2 aos con una desviacin estndar de 0.8 aos,
mientras que los de la B tienen una vida media de 6.7 aos con una
desviacin estndar de 0.7. Determine la probabilidad de que una
muestra aleatoria de 34 tubos de la compaa A tenga una vida promedio
de al menos un ao ms que la de una muestra aleatoria de 40 tubos de
la compaa B.
Solucin:
Datos:
A
= 7.2 aos
= 6.7 aos
= 0.8 aos
= 0.7 aos
nA = 34 tubos
nB = 40 tubos
=?
Ejemplo:
Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrndose
una desviacin estndar de 1.23km/L para la primera gasolina y una
desviacin estndar de 1.37km/L para la segunda gasolina; se prueba la
primera gasolina en 35 autos y la segunda en 42 autos.
a. Cul es la probabilidad de que la primera gasolina de un
rendimiento promedio mayor de 0.45km/L que la segunda
gasolina?
b. Cul es la probabilidad de que la diferencia en rendimientos
promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina
1?.
Solucin:
= 1.23 Km/Lto
= 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
a.
b.
?
=?
(1)
Debido a que solo tenemos una media estimada, y no conocemos el verdaderos , solo podemos
estimar el error estndar como:
(2)
El error en un resultado informado se llama error de muestreo, y se mide como desviacin
absoluta del valor verdadero desconocido. Por lo tanto, para una media, el error muestral puede
considerarse como la desviacin | - | . Alrededor del 68% de las veces el error muestral
tendr como mximo el tamao de un error estndar, y en el 95% de los casos, el de 2 errores
estndar. Esto puede expresarse ms concisamente de la siguiente manera:
(3)
(4)
De este modo, el usuario de una estadstica obtiene una idea de la magnitud de la diferencia que
pudo haberse verificado en la prctica, la manera en que el tamao de la muestra afecta el
posible error de una estimacin y con qu probabilidad aproximada (confianza). En este caso,
estamos considerando un tamao de muestra de 20 o ms y estamos usando la teora de la
distribucin normal. Algunos lectores tambin reconocern en esto una cierta similitud con la
construccin de un intervalo de confianza para una media desconocida. En la norma E2586 de
ASTM se tratan los intervalos de confianza y se ha publicado un artculo de DataPoints sobre este
tema.1
Ejemplos
Consideremos que en una muestra de tamao n = 20 se determin que la media muestral y la
desviacin estndar eran 162 y 11,5 respectivamente. El error estndar estimado de la media
surge de la Ecuacin 2: 11,5/4,47 = 2,57. De este modo, el potencial de error en el resultado
informado no es superior a 2,57 (68% de confianza) o no ms de 2(2,57) = 5,14 (a 95% de
confianza).
Uno de los recursos estadsticos ms utilizados es una proporcin simple. Hay una muestra de
objetos de tamao n, y se observa cada objeto para identificar la ocurrencia de un atributo.
Cada objeto tiene o no tiene el atributo. Esta es la situacin, por ejemplo, en los muestreos de
control de calidad o en las encuestas de opinin pblica. La estadstica, indicada , es la
proporcin en la muestra que tiene ese atributo. La proporcin verdadera y desconocida de
todos los objetos es p. El error estndar terico de la estimacin es:
(5)
En la prctica no conocemos nunca el valor verdadero de p, de modo que reemplazamos la
estadstica y obtenemos una estimacin del error estndar. Utilizando la Ecuacin 5, el error
estndar estimado es:
(6)
Cuando esta tcnica se utiliza en una encuesta poltica o una investigacin de mercado, la
cantidad 2SE( )se menciona como margen de error de la encuesta. Supongamos que en una
muestra de n = 200 componentes de metal inspeccionados, se clasificaron 23 como defectuosos.
La estimacin de la proporcin defectuosa del proceso es
= 23/200 = 0,115 o 11,5%.
El error estndar de esta estimacin, usando la Ecuacin 6, es 0.0226 o 2,26%. En caso de
querer reclamar una confianza de aproximadamente 95% en el posible error en el resultado,
deberamos informarlo utilizando dos errores estndar o como 11,5% 4,52%. De todos modos,
debera informarse al menos el error estndar (2,26%) junto con la estimacin.
En la E2586 de ASTM estn disponibles las frmulas de error estndar para varios casos
comunes. En la bibliografa sobre ciencias estadsticas pueden consultarse otros casos y
mtodos.
Referencias
1. Stephen N. Luko y Dean V. Neubauer, Statistical Intervals, Part 1: The Confidence Interval,
ASTM Standardization News, Vol. 39, Nm. 4, julio/agosto 2011.
Stephen N. Luko, de Hamilton Sundstrand, Windsor Locks, Connecticut, es el anterior
presidente del Comit E11 sobre calidad y estadsticas y es miembro de ASTM International.
Dean V. Neubauer, de Corning Inc., Corning, Nueva York, es miembro de ASTM; se desempea
como vicepresidente del Comit E11 sobre calidad y estadsticas, es presidente del Subcomit
E11.30 sobre control estadstico de la calidad y del E11.90.03 sobre publicaciones, y tambin
coordina la columna DataPoints (Mediciones).