Sunteți pe pagina 1din 42

Universidad Central de Venezuela

Facultad de Ingeniera
Escuela de Ingeniera Mecnica
Departamento de Tecnologa de Produccin
Produccin 1

7-1 Inferencia estadstica
El campo de la inferencia estadstica
esta formado por los mtodos
utilizados para tomar
decisiones o para obtener concusiones
sobre una poblacin.

Estos mtodos utilizan la informacin
contenida en una muestra de la
poblacin para obtener conc1usiones.

La figura 6-1 indica la relacin que
existe entre una poblacin y una
muestra
La inferencia estadstica puede dividirse en dos
grandes areas:

Estimacin de parmetros

Prueba de hiptesis.

7-1 Inferencia estadstica
Estimacin de parmetros: Como ejemplo, supngase que
un ingeniero de estructuras analiza la resistencia a la tensin
de un componente empleado en la carrocera de un automvil.
Puesto que la variabilidad existe de manera natural en la
resistencia a la tensin entre distintos componentes, debido a
diferencias en los lotes de materia prima, en el proceso de
fabricacin y en los procedimientos de medicin (por
ejemplo), el ingeniero esta interesado en estimar la resistencia
a la tensin promedio de los componentes.

El conocimiento de las propiedades de muestreo estadsticas
del estimador utilizado, permite al ingeniero establecer la
precisin del valor estimado.
7-1 Inferencia estadstica
La prueba estadstica de hiptesis es un marco de referencia para
resolver problemas donde se establecen conjeturas sobre resultados
posibles cuando se analizan dos valores diferentes de la variable a
evaluar
Considrese una situacin donde pueden emplearse dos temperaturas
de reaccin diferentes en un proceso, qumico, t
1
y t
2
. El ingeniero
establece la conjetura de que la temperatura t
1
dar como resultado
rendimientos mayores que t
2
.
7-1 Inferencia estadstica
En este caso, la hiptesis es que el rendimiento promedio con la
temperatura t
1
es mayor que el que el rendimientos promedio con
la temperatura t
2

Ntese que no se hace hincapi en la estimacin de los rendimientos;
en su lugar, la atencin se centra en obtener conclusiones sobre la
hiptesis planteada.
En muchos problemas estadsticos, es necesario utilizar una
muestra de observaciones tomadas de la poblacin de inters
con objeto de obtener conclusiones sobre ella.
7-2 Muestreo Aleatorio
Una POBLACION est formada por la totalidad de las
observaciones en las cuales se tiene inters.
Una MUESTRA es un subconjunto de observaciones de una
poblacin.
En cualquier problema particular, la poblacin puede ser pequea,
grande pero finita o infinita. El nmero de observaciones en la
poblacin recibe el nombre de tamao de la poblacin. Por
ejemplo, el ingreso de los habitantes a un pas, y el nmero de
botellas con un contenido menor de bebida en un da de
produccin, son poblaciones de tamao finito. Las observaciones
obtenidas al medir todos los das el nivel de monxido de carbono,
es una poblacin de tamao infinito.
Por otra parte, un ingeniero de estructuras puede considerar que la
poblacin de resistencias a la tensin tiene una distribucin normal
con media y varianza
2
.Puede hacerse referencia a este hecho
diciendo que es una poblacin normal o que es una poblacin
normalmente distribuida
7-2 Muestreo Aleatorio
En muchos problemas de inferencia estadstica, es imposible o
poco practico observar toda la poblacin. Por ejemplo, no es
posible probar la resistencia a la tensin de todos los elementos
estructurales de las carroceras, ya que esto se lleva mucho tiempo
y tiene un costo alto. Por otra parte, algunos (quizs muchos) de
los elementos estructurales todava no existen en el momento en
que tiene que tomarse una decisin, as que, en gran medida,
la poblacin debe verse como algo conceptual. En consecuencia,
se depende de un subconjunto de las observaciones provenientes
de la poblacin que sean de ayuda para tomar decisiones sobre
esta.
7-2 Muestreo Aleatorio
Para que las inferencias sean validas, la muestra debe ser
representativa de la poblacin. A menudo resulta atractivo
seleccionar las observaciones mas convenientes como muestra o
ejercitar el juicio en la seleccin de la muestra. Es frecuente que
estos procedimientos introduzcan un sesgo en la muestra, lo que trae
como consecuencia que el parmetro de inters sea subestimado (o
sobrestimado) por la muestra. Por otra parte, no es posible describir
de manera estadstica el comportamiento de una muestra de este tipo.
Para evitar estas dificultades, es deseable seleccionar una muestra
aleatoria como el resultado de un mecanismo aleatorio.
En consecuencia, la seleccin de una muestra es un experimento
aleatorio, y cada observacin de la muestra es el valor observado de
una variable aleatoria. Las observaciones en la poblacin determinan
la distribucin de probabilidad de la variable aleatoria.
7-2 Muestreo Aleatorio
Para definir una muestra aleatoria, sea X la variable aleatoria que
representa el resultado de tomar una observacin de la poblacin.

Sea f(x) la funcin de densidad de probabilidad de X.

Supngase que cada observacin en la muestra se obtiene de
manera independiente, bajo las mismas condiciones. Esto es, las
observaciones de la muestra se obtienen al observar X de manera
independiente bajo condiciones que no cambian, digamos, n veces.

Sea X la variable aleatoria que representa la i-esima rplica.

Entonces X
1
,X
2
, , X
n
constituyen una muestra aleatoria, donde
los valores numricos obtenidos son x
1
,x
2
, , x
n .

7-2 Muestreo Aleatorio
Las variables aleatorias en una muestra aleatoria son independientes,
con la misma distribucin de probabilidad f(x) debido a que cada
observacin se obtiene bajo las mismas condiciones.

Esto es, las funciones de densidad de probabilidad marginal de X
1
,X
2
,
, X
n
son f(x
1),
f(x
2
), ,f{x
n
), respectivamente, y por
independencia, la funcin de densidad de probabilidad conjunta de la
muestra aleatoria es fx
1
x
2
X
n
(x
1
,x
2
, , x
n
) = f(x
1)
f(x
2
) f{x
n
)

7-2 Muestreo Aleatorio
Las variables aleatorias (X
1
,X
2
, , X
n
) constituyen una muestra
aleatoria de tamao n, si
a) las X; son variables aleatorias independientes, y
b) todas las X tienen la misma distribucin de probabilidad.
EI propsito principal de la toma de una muestra aleatoria es obtener
informacin sobre los parmetros no conocidos de la poblacin.

Supngase, por ejemplo, que se desea alcanzar una conclusin
acerca de la poblacin de habitantes de un Pas que prefieren
una marca particular de refresco.

Sea p el valor no conocido de esta proporcin. Resulta poco practico
interrogar a cada persona de la poblacin para determinar el
verdadero valor de p.

Para hacer una inferencia con respecto a la proporcin verdadera p,
un procedimiento mas razonable consiste en seleccionar una muestra
aleatoria (de un tamao apropiado) y utilizar la proporcin observada
de personas en la muestra que prefieren cierta marca de refresco.
7-2 Muestreo Aleatorio
La proporcin de la muestra, , se calcula dividiendo el nmero
de personas de la muestra que prefieren una marca particular de
refresco entre el temario total de la muestra, n. Por tanto, es una
funcin de los valores observados en la muestra aleatoria.
Puesto que es posible obtener muchas muestras aleatorias de una
poblacin, el valor de cambiara de una a otra. Esto es es una
variable aleatoria. Esta variable aleatoria se conoce como
estadstica.
7-2 Muestreo Aleatorio
Una estadstica es cualquier funcin de las observaciones
contenidas en una muestra aleatoria
Hasta el momento, se han considerado varias estadsticas. Por
ejemplo, si X
1
,X
2
, , X
n
, es una muestra aleatoria de tamao n,
entonces la media muestral X, la varianza muestral S
2
, y la
desviacin estndar muestral S, son estadsticas. El proceso de
obtener conclusiones sobre poblaciones con base en datos
contenidos en una muestra, hace un uso considerable de estas
estadsticas.

Puesto que una estadstica es una variable aleatoria, esta tiene una
distribucin de probabilidad.

Se conoce como distribucin de muestreo a la distribucin de
probabilidad de una estadstica.
7-2 Muestreo Aleatorio
Una aplicacin muy importante de la estadstica es obtener
estimaciones puntuales de parmetros tales como la media y la
varianza de la poblacin. Cuando se estudian problemas
de inferencia, es conveniente tener un smbolo general para
representar el parmetro de inters; para ello se har uso de la letra
griega (theta).

El objetivo de la estimacin puntual es seleccionar un nmero, con
base en los datos de la muestra, que sea el valor mas plausible de .

El valor numrico de alguna estadstica de la muestra es el que ser
utilizado como estimacin puntual.
7-2 Muestreo Aleatorio
En general, si X es una variable aleatoria con distribucin de
probabilidad f(x), caracterizada por el parmetro no conocido , y si
X
1
,X
2
, , X
n
, es una muestra aleatoria de X de tamao n, entonces
la estadstica =h(X
1
,X
2
, , X
n
) recibe el nombre de estimador
puntual de . Ntese que es una variable aleatoria, ya que es una
funcin de variables aleatorias. Despus de que se ha seleccionado
la muestra, toma un valor numrico particular denominado
estimacin puntual de .

7-2 Muestreo Aleatorio
7-2 Muestreo Aleatorio
7-2 Muestreo Aleatorio
7-2 Muestreo Aleatorio


La media muestral es una estadstica; esto es, una variable aleatoria
que depende de los resultados obtenidos en cada muestra particular.

Dado que una estadstica es una variable aleatoria, entonces tiene
una distribucin de probabilidad. Por ejemplo, la distribucin de
probabilidad de X se conoce como distribucin de muestreo de
la media.

La distribucin de muestreo de una estadstica depende de la
distribucin de la poblacin, del tamao de la muestra y del
mtodo utilizado para seleccionar esta.
7-4 Distribuciones de muestreo
7-4 Distribuciones de muestreo
7-2: Teorama de Lmite Central
Si X
1
,X
2
, , X
n
, es una muestra aleatoria de tamao n, tomada de una
poblacin (finita o infinita) con media y varianza finita y si X, es la
media muestral, entonces la forma lmite de la distribucin de
Cuando n es la distribucin normal estndar
7-4 Distribuciones de muestreo
7-2: Teorama de Lmite Central
Aunque en muchos casos, el teorema del lmite central funciona bien para
muestras pequeas (n=4, 5), en particular donde la poblacin es continua,
unimodal y simtrica, en otras situaciones se requieren muestras grandes,
dependiendo de la forma que tenga la poblacin. En muchos casos de inters
prctico, si n > 30, la aproximacin normal ser satisfactoria sin importar cual
sea la forma de la poblacin. Si n < 30, el teorema del lmite central funciona
si la distribucinde la poblacin no est alejada a una distribucin normal.
(D. Montgomery 1996)
7-4 Distribuciones de muestreo
7-4 Distribucin de muestreo de medias
Lanzamientos de un dado
Lanzamientos de dos dados
Lanzamientos de tres dados
Lanzamientos de cinco dados
Lanzamientos de diez dados
Figure 6-5 Distribucin de
puntajes promedio provenientes de
un experimento de lanzamiento de
dados [Adapted with permission from
Box, Hunter, and Hunter (1978).]


Ejemplo 7-13


Example 7-13
Por tanto
Error Estndar
El error estndar de una estadstica es la desviacin estndar de su
distribucin de muestreo. Si el error estndar involucra parmetros
desconocidos cuyos valores pueden estimarse, la sustitucin de
estas estimaciones en el error estndar da como resultado un error
estndar estimado.
El error estndar da alguna idea sobre la precisin de la estimacin.
Por ej. Si la media muestral X se utiliza como estimador puntual
de la media poblacional , el error estndar de X mide cuan
precisamente X estima a .
Error Estndar
Supngase que se muestrea una distribucin normal con media y
varianza
2
. Ahora la distribucin X es normal con media y
varianza
2
/n, de modo que el error estndar de X es

X


=
n
Si no se sabe el valor de pero se estima con la desviacin
muestral s , sustituyendo en la ecuacin tenemos

X

S
=
n

La distribucin ji-cuadrada Ji
2
es la distribucin muestral de la varianza muestral S
2
.
Es decir, que si se extraen todas las muestras posibles de una poblacin normal y a
cada muestra se le calcula su varianza, se obtendr la distribucin muestral de
varianzas.

Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el
estadstico X
2
.




7-6 DISTRIBUCION Ji CUADRADO

La distribucin Ji
2
est asociada a un parmetro conocido como grado de libertad. La
forma de la distribucin depende del valor de este parmetro. La media y la varianza
de la distribucin
k
son

= k y = 2k

7-6 DISTRIBUCION Ji CUADRADO
Teorema
7-6 DISTRIBUCION Ji CUADRADO
Funcines de densidad de
Probabilidad de
variasdistribuciones
2

Ntese que la variable
aleatoria ji-cuadrada es positiva, y
que la distribucin de probabilidad
tiene un sesgo
hacia la derecha. Sin embargo, a
medida que k aumenta, la
distribucin se vuelve mas
simtrica. Conforme k , la
forma lmite de la distribucin ji-
cuadrada es la distribucin normal
7-6 DISTRIBUCION Ji CUADRADO
Se define
k
como el punto o valor crtico de la variable
aleatoria Ji-cuadrada con k grados de libertad tal que la
probabilidad de que X sea mayor que este valor es . Esto es
Los puntos crticos de la distribucin
k
estn dados en la tabla III.
Ej., el valor de con 10 grados
de libertad que tiene un rea
(probabilidad) de 0.05 ala
derecha es:
0.05, 10
= 18.31.
Este valor recibe el nombre de punto crtico superior del 5% de la distribucin Ji-cuadrada con diez
grados de libertad. Todo esto puede escribirse como una proposicin de probabilidad, de la siguiente
manera:
P(X >
0.05, 10
) = P(X > 18.31 ) = 0.05
Ejemplo. La varianza muestral del peso en mg
2
. de un lote de 11 pernos es 0,286.
Encuentre un intervalo de confianza de 90% para la varianza de todos los pernos que
distribuye la compaa, suponga una poblacin normal.
Se observa que la varianza corre en sentido contrario, pero esto es slo en la
grfica. La interpretacin quedara: Con un nivel de confianza del 90% se sabe que
la varianza de la poblacin de los pesos de los pernos est entre 0.156 y 0.726 mg
2
.
= (n-1)S
2
/ X
2

1
= (10)* 0,286 / 3,94 = 0,726

2
= (10)* 0,286 / 18,31 = 0,156

7-7 DISTRIBUCION t
En probabilidad y estadstica, la distribucin t (de Student) es una distribucin
de probabilidad que surge del problema de estimar la media de una poblacin
normalmente distribuida cuando el tamao de la muestra es pequeo. Este
modelo terico se deriva del modelo de distribucin normal para muestras
pequeas (n < 30)

Supngase que se toma una muestra de una poblacin normal con media y
varianza . Si X es el promedio de las n observaciones que contiene la
muestra aleatoria, entonces la distribucin de Z= (X -)/ (/(n) es una
distribucin normal estndar.

Supngase que la varianza de la poblacin es desconocida. Que sucede con la
distribucin de esta estadstica si se remplaza por S? La distribucin t
proporciona la respuesta a esta pregunta.

7-7 DISTRIBUCION t
Teorema
7-7 DISTRIBUCION t
Sea t
k
el valor de la variable aleatoria T con k grados de libertad para el que se
tiene un rea (o probabilidad) . Por tanto, t
k
es un punto critico en la cola
superior de la distribucin t con k grados de libertad,
La tabla IV proporciona los puntos crticos de la distribucin t.
Para ilustrar el uso de la tabla, ntese que el valor t con 10 grados de
libertad que tiene un rea de 0,05 a la derecha es
0.05, 10
= 1.812.
Esto es:
P(T
10
> t
0.05, 10
) =
P(T
10
> 1.812 ) = 0.05
Puesto que la distribucin ( es simtrica con respecto a cero, se
tiene que t
1
= - t

; esto es, el valor t que corresponde a un rea
de 1- a la derecha (y, por tanto, un rea a la izquierda) es
igual al negativo del valor t que tiene el rea en la cola derecha
de la distribucin.

En consecuencia, t
0.95, 10
) = - t
0.05, 10
= -1.812.
Ejemplo: Al fabricante de un agente propulsor utilizado en
sistemas de escape de emergencia de aeronaves, le gustara
afirmar que su producto tiene una tasa promedio de combusti6n
de 40 in por minuto.

Para investigar esta afirmacin, el fabricante prueba 25 granos de
propulsor seleccionados al azar, y si el valor calculado de T a
partir de la ecuacin
cae entre -t
0.05,24
y t
005,24
, entonces queda satisfecho.

A que conclusin debe llegar el fabricante si tiene una muestra con
una media de x

= 42.5 in/min y una desviacin estndar s = 0.75


in/min?
Supngase que la tasa de combustin tiene una distribucin normal.

De la tabla IV, se tiene que t
0,05,24
= 1.711, de modo que si el valor t
cae entre -1.711 y 1.711, el fabricante quedara satisfecho con su
afirmacin. Para la muestra obtenida, si = 40, entonces
que es un valor que excede por mucho a 1.711. De hecho, si = 40,
entonces la probabilidad de obtener un valor de t mayor que ste es
considerablemente menor que 0.05. El valor de t obtenido es un
indicador de que la tasa promedio de combustin es mayor que 40
in/min. Este es un ejemplo del uso de la distribucin (para probar
una hiptesis (una afirmacin sobre el valor de la tasa promedio de
combustin).

Intervalo de Confianza
En muchas situaciones, una estimacin puntual no proporciona informacin
suficiente sobre un parmetro. Por ejemplo, si se tiene inters en estimar la
resistencia promedio a la tensin de los elementos estructurales empleados
en el ala de un aeroplano, entonces es probable que un solo numero no sea
tan significativo como un intervalo, dentro del cual se espera encontrar el
valor de este parmetro. El intervalo estimado recibe el nombre de intervalo
de confianza.

El inters recae ahora en encontrar soluciones mediante la estimacin
de intervalos de confianza. De manera especifica, se es posible encontrar
intervalos de confianza para medias, varianzas y proporciones.

Tambin se pueden encontrar intervalos que contengan una parte especifica
de las observaciones de una poblacin; estos tipos de intervalos se conocen
como intervalos de tolerancia.
ESTIMACION DE INTERVALOS

S-ar putea să vă placă și