Sunteți pe pagina 1din 14

Tema 5 - Inferencia Estadstica: ESTimacin

Tema 5 .rInferencia Estadstica: Estimacin


5.1 Introduccin
La construccin de los modelos probabilsticos, presentada en el ltimo tema, es un
ejemplo de razonamiento deductivo. Empezamos con varias hiptesis respecto a la
estructura de una variable aleatoria y a partir de ellas se deduce la distribucin de
probabilidad de los valores posibles. En la injerencia estadstica (o estadstica
inductiva) se realiza el proceso inverso. Dadas algunas obsenJaciones de una variable,
es decir algunos datos, se intenta injerir el I1lodelo probabilstico asociado con la
variable que ha generado estos datos.
La inferencia estadstica puede dividirse en dos reas principales: estinzacin y pruebas
de hiptesis. Consideramos los procedimientos asociados con estimacin en este tema y
los de pruebas de hiptesis en el tema siguiente.
5.2 Poblacin y muestreo
Llamaremos poblacin a un conjunto homogneo de e/elnentos en los que se estudia
una caracterstica de inters. En la mayora de los casos no es posible estudiar todos los
elementos de una poblacin, ya que:
El estudio puede necesitar la destruccin de los elementos. Por ejemplo, se puede
estudiar el tiempo de vida de un modelo de coches o la tensin de rotura de cables. Si
destruimos todos los elementos de la poblacin no se tendrn ms elementos que
vender, usar, etc.
Los elementos pueden existir slo conceptualmente y no en la realidad. Por ejemplo,
la poblacin de televisores que producir una empresa.
Puede ser inviable econnlica1nente estudiar toda la poblacin.
El estudio llevara lanto lienlpo que sera inlpracticable. Incluso, es Inuy probahle
que, las caractersticas de la poblacin hubieran variado en el tiempo.
Entonces, en lugar de realizar un censo (es decir, un estudio exhaustivo de todos los
elementos de una poblacin), se selecciona un conjunto representativo de elelnenTos,
que se llama nluestra. El proceso de escoger una muestra se conoce como 111uestreo. El
nnlero de elel11entos en la Inuestra recibe el nombre de lalnalio de la 1nuestra. Si la
muestra est bien escogida puede proporcionar una informacin muy precisa sobre la
caracterstica de inters, pero con lnayor rapidez y 1nenor coste que si se efectuara un
censo. Existen varios tipos de muestreo, y la cla\'e del nluestreo es garantizar que la
Inuestra sea represenTaTiva de la poblacin. A continuacin consideraremos mtodos de
estimacin que suponen que la muestra se selecciona con el denominado I1luestreo
aleaTorio sin1ple.
Tema 5 - Infercncia Estadstica: Estimacin
5.3 Muestreo aleatorio simple
Una muestra se conoce como 1nuestra aleatoria sbnple (171.a.s.) si:
l. Cada elenlento de la poblacin tiene la 171;SI11a probabilidad de ser elegido en cada
seleccin de uno de sus componentes.
2. Las selecciones se realizan con reel1lplazanliento, y entonces la probabilidad de
elegir cualquier elenlento de la poblacin es idntica en todas las selecciones.
La primera condicin a<;egura la representatividad de la muestra. La segunda condicin
se impone por sinlplicidad del anlisis.
Supongamos que la poblacin tiene un nnlero, N, de elementos Inuy grande y que el
tamao de la muestra, 11, es relativalnente pequelio. Si la fraccin n/N es 171a)'or que 0,1
(es decir que muestreamos ms del 10% de la poblacin) los mtodos que
presentaremos aqu son slo aproxil1laciones. (En estos casos, existen correcciones que
es preciso usar.)
Para seleccionar una m.a.s de una poblacin finita, hoy en da se utilizan dfgitos
aleatorios s ~ n l u l a d o s por ordenador. Si los mtodos de simulacin son correclOs. se
puede considerar los dgitos. resultantes como dgitos producidos por el siguiente
mtodo. Empezamos con 10 trozos de papel, cada trozo de11ni.nno tan1all0. En el primer
trozo escribimos el dgito O; en el segundo 1; ... y en el dcimo 9. Situamos los] Otrozos
de papel en un sOlnbrero de copa, sacudinl0s el sombrero para 111ezclar los trozos de
papel. De esta manera, cuando elegimos un trozo de papel al azar, cada dgito tiene la
nlisnla probabilidad de ocurrencia. Ahora, elegimos un trozo de papel al azar y
anotamos el dgito escrito en l. Despus, reemplazamos el trozo de papel y repetimos
este proceso para obtener una serie de dgitos aleatorios. Utilizando este procedimiento,
producimos una serie de dgitos como la que sigue (que ha sido simulada utilizando
Minitab).
1 487 7 5 8 974 862 5 997 8 043 895 4 5 7 097 1 O 5 79] 776
1 574 6 O9 6 946 149 9 9 268 267 O 2 9 O 9 3 2 8 O 5 261 833 1
5 9 6 848 847 241 165 5 054 3 8 871 1 443 1 1 2 883 7 8 1 9 7
797 O 3 5 O 2 3 4 6 6 3 061 220 O 7 1 9 2 3 069 9 1 7 594 3 560 7
0756129 1 3 1 763 8 1 542 5 6 2 670 7 3 268 7 5 3 4 8 2 655 2
4 895 9 O 9 O 2 9 8 925 1 829 9 265 6 9 O 4 8 6 4 9 4 124 2 7 197
323 5 075 7 9 6 3 044 3 2 6 8 3 6 1 8 7 042 3 144 5 224 6 5 558
631 1 423 5 4 3 666 077 867 2 1 919 1 4 3 O 4 4 2 8 O 7 4 1 479
3 066 3 5 647 886 944 1 553 3 225 6 7 2 4 7 4 9 4 098 7 O 7 5 6
4 5 2 5 6 7 4 4 2 2 7 6 3 O 4 O 9 6 2 3 149 7 6 3 5 294 644 7 1 J 320
4 4 999 1 9 9 045 1 9 5 9 3 1 9 O O 4 647 O 3 4 7 264 8 O 3 2 5 324
185 2 244 O 3 4 5 9 8 2 7 O 6 9 2 O O 3 6 4 6 028 5 4 7 5 1 8 1 3 359
2 3 3 846 1 095 3 5 5 O4 8 9 8 O O O 2 6 6 7 O 3 O 3 641 275 972 1
4 O 8 9 688 1 4 O 2 1 7 1 674 5 9 944 O 1 6 2 9 2 8 O O O 2 9 S 9 5 7 3
7 6 8 2 150 8 251 9 2 8 9 4 O 7 6 O 2 847 9 8 O 9 6 O 6 5 8 1 262 7 8
O 1 969 1 6 8 9 2 745 7 6 6 9 7 1 521 5 2 3 8 3 O 5 5 220 1 4 O 1 2 9
834 3 6 3 9 7 4 O O 5 8 O 9 3 5 6 8 5 6 8 3 6 8 145 225 5 849 091 2
325 765 5 3 1 8 1 3 4 7 6 O 2 1 094 640 821 5 2 9 695 5 843 9 9
089 8 593 5 923 7 O 9 O 3 824 3 7 8 ] 367 5 545 126 5 840 1 9
781 5 2 7 941 1 5 6 654 8 O 8 6 2 8 5 6 2 7 8 5 073 1 191 792 6 6
3 4 3 698 5 6 O 1 2 051 ] 9 O 3 5 3 O 3 3 8 O 9 6 O 1 S O O 5 2 5 637 1
5 O 4 6 O 1 833 125 6 1 1 569 5 2 OO 5 7 1 105 948 1 8 2 O 9 8 8 2
7 5 3 2 O5 7 6 1 785 7 384 O 3 5 860 9 9 8 379 ] 085 3 9 7 5 ] 1 5
5 7 1 5 535 100 9 6 178 163 171 135 9 1 5 8 9 8 9 6 4 8 4 749 3
1 1 3 849 3 254 1 3 8 327 074 144 6 4 6 8 100 6 8 8 7 4 O 7 645
5 1 9 6 697 6 3 3 O 246 895 1 3 2 O6 043
Con una lista de dgitos aleatorios de este tipo, se selecciona una m.a.s de la siguiente
manera. Se numeran los elementos de la poblacin (finita) de 1 a N y se toman nmeros
construidos por los dgitos aleatorios, de tantas cifras como tenga N. El valor del
nmero construido indicar el elemento a seleccionar. Si el nmero es ms grande que N
(lo que es posible si N 10,100,1 000, ...) ignoramos este nmero y seguimos con el
siguiente. Por ejemplo, supongamos que queremos una m.a.s. de 10 estudiantes en un
grupo de 253 estudiantes. Numerando los estudiantes de 1 a 253, y utilizando la serie de
dgitos aleatorios dada arriba, el nmero fonnado por los tres primeros dgitos es 148.
Este nmero corresponde a uno de los estudiantes. Los cinco nlneros prximos (775,
897, 486, 259, 978) no se encuentran dentro del intervalo 1 - 253. El siguiente nmero
es 043 que si est entre 1 y 253. Los dos nmeros prximos (895, 457) no corresponden
a ningn alumno. Los prximos dos nmeros (097 y 105) identifican dos miembros ms
de la muestra. Los dos nmeros siguientes (791 y 776) no sirven para identificar otros
miembros de la muestra. Siguiendo este procedimiento, obtenemos los nmeros 157,
052, 241, 165, 144 Y 197 para los ltimos 6 miembros de la muestra. Resumiendo, la
muestra consta de los 10 al Ulnnos con los nmeros de identificacin: 148, 043, 097,
105. 157, 052, 241, 165, 144 Y 197.
Una vez que helnos identificado los n elenlentos de la muestra, podemos medir el valor
de la variable de inters, X, para estos elementos. Antes de identificar los n elementos de
la muestra y medir sus valores de X, consideramos estas observaciones potenciales
como variables aleatorias denotadas por Xl' X2 , , Xn' donde X representa el i-simo
valor de la variable X que vamos a observar. Los valores numricos obtenidos despus
de la medicin los denotamos por xI' X
2
, , x
n
Debido a las condiciones idnticas bajo
las cuales se seleccionan los elementos de la muestra, es razonable suponer que las n
variables aleatorias Xl' X2' .. ' X11 son independientes y que cada una tiene la nlis171a
distribucin de probabilidad que la poblacin. Decimos que las n variables aleatorias
X ,X , ,X son independientes e idnticalnente distribuidas (f.i.d.). Si f() es la
I 2 n
funcin de densidad de la poblacin y f() es la funcin de densidad de X:
f
l
(.) =f
2
(.) =... =fn (.) =f()
Adems, las Xi son independientes y entonces la variable aleatoria n-dimensional
( Xl' X2' ... ' X11) tiene funcin de densidad conjunta:
f(x
I
,X
2
,,x
n
) =f(x
l
)f(x
2
)f(xn )
que es la condicin Inatel11tica del muestreo aleatorio simple.
5.4 Estimacin
5.4.1 Introduccin
El mtodo clsico de la inferencia estadstica es seleccionar la fornla de la distribucin
inicial a la vista de los datos)' el contexto del problel11a, y luego aplicar mtodos para
estilnar eficientemente sus par111etros desconocidos.
5.4.2 Identificacin del modelo
El enfoque para111trico supone que la forma del modelo es conocida. En realidad,
cuando realizamos un experimento aleatorio, los datos no vienen con el nombre de un
modelo pegado. En la prctica, tenemos una y cierta infonnacin sobre el
experi111ento realizado para conseguir los datos de eJIa. Adems, si con anterioridad se
han realizado experimentos silnilares, es posible que stos tambin proporcionen
infonnacin til. Resumiendo, al inicio del procedimiento de estimacin, tenemos que
seleccionar un l11odelo a partir de los datos Inuestrales, el contexto de) experimento
actual, la variable de inters y experinlentos silnilares.
En relacin con el uso de informacin sobre el contexto del experimento., supongamos
que estamos interesados en la proporcin de unidades defectuosas producidas por una
mquina. Si la probabilidad de producir una unidad defectuosa es constante y el estado
de cualquier unidad es independiente del de cualquier otra, podemos considerar el
estado de una unidad como una variable aleatoria de Bernoulli. Si utilizamos la
nlquina para producir una muestra de n unidades, entonces un modelo obvio para el
nmero de unidades defectuosas en la muestra es el binolnial. Despus de identificar
este modelo, el problema consiste en estimar el parnletro desconocido de) modelo, es
decir, p.
Si el contexto del experimento no sugiere un modelo especfico, pero ste es parecido a
otros experinlentos previos, es posible que las conclusiones de estos experimentos
indiquen un modelo apropiado. Por ejemplo, supongamos que la variable de inters en
un experimento es el tiempo de vida de un componente electrnico y que los
componentes en cuestin tienen caractersticas muy similares a componentes utilizados
en otros estudios. Si en estos otros estudios se dedujo que puede considerarse el tiempo
de vida de los componentes respectivos como una variable exponencial, entonces un
modelo exponencial es un candidato obvio para el tiempo de vida de los componentes
en el estudio nuevo. El problema se convierte en la estimacin de) parmetro
desconocido, A.
Por ltimo, si no es posible identificar un modelo apropiado a partir de la informacin
sobre el contexto del experimento o informacin adicional, podemos investigar si los
miSl110S datos indican la forma de un modelo especfico. Podemos producir grficos,
COlno diagralnas de barras o histogralnas, esperando que estos grficos sugieran la
forma de un modelo adecuado. Por ejemplo, es posible que el histograma de los datos de
una variable continua tenga una forma parecida a la funcin de densidad de una
distribucin nornlal. Esto indicar que un modelo nonnal ser apropiado para la variable
de inters. Luego, el problema ha reducido a la estimacin de los parmetros
desconocidos de la distribucin, Jl y 0'.
4
3
I t /lH.' - 11,.;' It l/l/U L.\lLH41.\/H '1. 1_.\i//lUH H'"
5.4.3 Estadsticos
5.4.3.1 Concepto de un estadstico
A continuacin supondremos que se observa una m.a.s. de una variable X, que sigue
una distribucin conocida (binomial, Poisson, exponencial, normal, ...) pero los
parmetros de la distribucin son desconocidos. El problema fundamental es como se
pueden estimar estos parmetros a partir de la informacin contenida en los datos
muestrales.
Repetimos que en una m.a.s. Xl'X
2
, ,X
tt
, las n variables .aleatorias son i.i.d..
Cualquier funcin de estas variables se llama un estadstico. Como un estadstico es una
funcin de variables aleatorias es tambin una variable aleatoria.
5.4.3.2 Algunos estadsticos importantes
5.4.3.2.1 Estadsticos de tendencia central de la muestra
Si Xl' X 2 , , XII representa una m.a.s. de tamao n, se define:
!X;
1. La 111edit1lnuestral, X, como X= .
n
2. La moda muestral como el valor nzs frecuente en la muestra.
3. Si X(J)' X(2)'.'" X(n) representan los valores muestrales en orden creciente, se
define la lnediana muestral, X,como:
si n es impar
X(tt+J)/2)
X =
{
X(n/2) + X((tt/2)+J}
si n es par
!X;
Es importante notar que, por ejemplo, X toma el valor x=J=.L- cuando X 1 tiene e]
n
valor xl' X 2 el valor x
2
' etctera. En la prctica, se utiliza el 11zisl110 nonzbre para
designar al estadstico y a su valor en una muestra concreta. Por ejemplo, el trmino
media 171uestral se aplica tanto al estadstico X como a su valor observado x.
5.4.3.2.2 Estadsticos de variabilidad de la muestra
Se definen:
1. El rango de la muestra comoX(II) - X(J)'
2. La varianza muestral corregida (o cuasivarianza) como:
,X;2 _
,(x; - Xr
5 2 =....:.;;;;.:;=1:..........-__ ;=1
n .
n-l 11-1
3. La desviacin tpica 171uestral como +..JS2.
I C/UO J . JlljeUlIllll L\It.JdJ.\!/( O. L.\!iU;dl/OI/
5.4.4 Estimacin puntual
5.4.4.1 Lgica bsica
Si queremos una estimacin nica del valor de un parmetro desconocido.. decimos
que realizamos estinzacin puntual. La lgica de este procedimiento es muy sencilla
utilizamos un estadstico (una funcin de las variables aleatorias de la muestra) como
estimador del parmetro desconocido. El valor observado del estimador recibe el
nombre de esti111acin puntual del parmetro desconocido.
5.4.4.2 Algunos estimadores importantes
5.4.4.2.1 Muestras de una distribucin de Bernoulli
Supongamos que tenemos una m.a.s. XI' X 2 , ... , XII de una distribucin de Bernoulli,
con probabilidad de "xito" p (desconocido). Un estimador natural de p es la frecuencia
relativa del suceso "xito", p, donde:
p=(Nmero de xitos en la muestra) / n
Si representamos u "xito" por el ntnero 1, Y un "fracaso" por el nmero 0, entonces,
X; slo toma los valores Oy 1, Y
p= XI + X
2
Ix +...+X
n ;=1
n = -n =X
Es decir, utilizamos la Inedia nZllestral (de los valores de Oy ]) como estiJnador de p.
5.4.4.2.2 Muestras de una distribucin de Poisson
Supongamos que tenemos una m.a.s. XI' X 2 , ... , X 11 de una distribucin de Poisson
con media Jl (desconocida). El estimador natural de Jl es la media de la muestra, X. Es
decir:
. _ Ix,
Jl = X = L
n
5.4.4.2.2 Muestras de una distribucin normal
Supongamos que tenemos una m.a.s. Xl' X2' ... , X11 de una distribucin nonnal con
media Jl y varianza (j 2 (los dos parmetros desconocidos). El estimador natural de Jl es,
otra vez, la media de la muestra, X. El estimador ms utilizado para la varianza, a 2 , es
la cuasivarianza (o varianza corregida) 52. Es decir:
p.=x y 6
2
=5
2
5.4.4.3 Propiedades de un buen estimador
5.4.4.3.1 Estimador insesgado
Sea un estimador cuyo valor observado, 8, es una estimacin puntual de algn
parmetro desconocido 8 . Es deseable que e tuviera la esperanza igual al parlnetro
es que E(e) =8. Se dice que un estimador e es un estimador
insesgado (o centrado) del parmetro 8 si, satisface ]a condicin E( e) =e . Cuando un
estimador no es centrado se dice que cs sesgado. El sesgo dcl estinlador se define C0T110:
--
scsgo(e) =E(e)-e.
Ejemplo 5.1
Demuestre que:
l. p=X de una m.a.s. de pruebas de BernoulJi, es un estimador insesgado del
parmetro p.
2. P. = X de una m.a.s. de una distribucin cualquiera, es un estimador insesgado
de la media, Jl, de la distribucin.
I(x; _X)2
3. La varianza muestral (no corregida), S2 = ;=1 , de una nl.a.s. de una
n
distribucin cualquiera, no es un estimador centrado de la varianza, 0
2
, de la
distribucin.
4. La varianza muestral (corregida), S2, de una m.a.s. de una distribucin
cualquiera es un estimador centrado de la varianza, 0
2
, de la distribucin.
Solucin
(Ix; 1IE(XJ I[()p+o(J- p)] Ip
E(p
"")- 1- ;=/ - ;=/ np - p
1
. - l 11 j- n-JI - JI - 11
(Ix; I IE(XJ n
') E(X)- El 1- ;=1 _EL-_L_ Jl
_. - l 11 J- 11 - JI - n
_ 2 l n
_, I - x) I 1 ["" _ 2l
3. E(SOo)=Ei 1-1 1=-E1L(X
i
-X) Jo Como:
l n J n L;=1
I(x - xf = I[(x; - - x)f
;=J i=1
= ![(X - - X)(X; - X)2]
;=1
= I(X; - J.l)2 + 2( Jl- X)!( Xi - Jl) +n( Jl- X)2
i=1 i=J
=I(Xi - J.l)2 + 2( Jl- X)I1( X- Jl)+ n( Jl - X)2
i=J
2
=! (Xi - - 211(X - Jl)
2
+n( Jl - X)
2
Jl )
i=1
=I(x - Jl)1 -n(X - J-l)2
i
i=1
7
Entonces,
(
-') 1 )2 (...,- )"l
E So. =;tttt X;-Jl -/l X-Jl OoJ
- -
Pero, E( X) =J.1 Yentonces:
(IX;I Iv(xJ 2 2
- 2 - . 1 . 1 no cr
E[(X-Jl)]=v(x)=vl-E-- 2 =-= 1=
2
l 11) 11 11 11
Tambin, para cualquier i, E[( Xi - Jl )2] = a 2, resultando que:
1r n
-1
{02
E(S2)=-lL0
2
-11
11 i=1 n U
1{ 2 2} 2 0
2
2( 1J
=- /la -(j =0 --=(j 1-
n n 11
=0 2(n-l J
n
Entonces, S2 no es un estimador insesgado - su valor medio es Inenor que a 2 El sesgo
del estimador es:
2
00 ,( 1} 2 -a
0 1-- (j =-
11 n
que tiende a cero al aumentar n.
4. ComoS
2
=_nS2,E(S2)=E(_11 S2J=(_1I1[;'(5
2
)=(_n
n-l /l-1 n-Ir 11-}-- n
Entonces, S2, es un estimador centrado de a 2
5.4.4.3.2 Estimador ms eficiente
Nornlahllente hay muchos estinladores insesgados posibles para cualquier parmetro.
Es natural elegir el estimador con Illellor varianza (es decir, con lnayor precisin). Por
ejemplo, si tenemos una m.a.s. XI' X2' " Xn y queremos estimar la media J.1 de la
poblacin correspondiente, los tres estilnadores:
A X + X
n
Jl=--2
A XI+X2+Xn_I+Xn
Jl.,=
o. 4
IXi
P. =X =..1::.L
. Il
8
sontodosinsesgados. Pero:
0'2 0
2
V( A O' 1 ) _
V( l.) =2' V(l2) =4 y Jl.\ -
n
Entonces, de los tres estimadores, il
J
es el de menor varianza (es decir, mayor
precisin).
Si se consideran todos Jos est;,nadores insesgados posibles de algn parlnetro e, aqul
con la varianza ms pequeiia recibe el nombre de estilnador nls eficiente (o lns
preciso) de 9.
Es posible demostrar que de todos los estimadores insesgados del parmetro p de una
distribucin de Berlloulli, p= X es el ms eficiente. Como la varianza de p viene dada
por:
(!X I !v(X.) !{[(J)2 p+(O)2(1_ p)]_ p2}
V(p)=V(X)=Vl-':I-J= ;xl 2 = ;.. 1 .,
n n 11
!(p_ p2)
npq pq
,=1
2 =-2-=
n n n
. d pq
entonces I
. ". dI'
ecua qUler estIma
d'
o
d
e p es -. a vananza l111llllna or ,,sesga
11
Tambin es posible demostrar que de todos los estimadores insesgados del parmetro Jl
de una distribucin de Poisson, Ji =X es el ms eficiente. Como la varianza de ft
viene dada por :
;V(X;)
n n2
,,- 11
2
--;;
entonces la varianza ,nnima de cualquier estimador insesgado de Jl es Observamos
11
que la varianza del estimador aumenta cuando crece Jl.
En eJ caso de una m.a.s. de una distribucin nOrlnn/ con media Jl y varianza a 2, se
puede demostrar que Jos estimadores ft =X y cr 2 =S2 son los nzs eficientes de todos
los estimadores insesgados. Entonces, )'1 varianza JJllliJno de cualquier estimador
inse.rgado de J.1 es:
2
_ '- &V(x.) = = = 0
2
V(X) =Vl-'-')- 11 11" ,," "
Observanlos que la varianza de este estimador de J.1 depende del valor de la varianu a:!.
Se puede demostrar tambin que. para una tll.a.S. de una distribucin nornla):
V(S2) = 20
(n-1)
y esta variunza es entonces la varianza nlnil11a de cualquier estilnador llsesgado de a 2.
5.4.5 Estimacin por intervalos
5.4.5.1 Problema bsico
En ]a prctica, es cierto que la precisin del estimador insesgado ms eficiente crece
con el tamao de la muestra. Desafortunadamente, es tanbin cierto que la estimacin
puntual de una muestra dada no sera exactal11ente igual al parnletro poblacional que se
supone estimar. Por esta razn, interesa no solamente dar una estinlacin puntual de un
sino, adems, un intervalo que permita expresar la incertidllnlbre existente
en la est/lIacin. Para introducir la construccin de este tipo de intervalo, primero
tenemos que consIderar la distribucin de un estilnador en el,l1uestreo.
5.4.5.2 Distribuciones de estimadores en el muestreo
Como sabemos ahora, un estin1ador es un estadstico y un estadstico es una funcin
de los variables aleatorias de una muestra. Entonces, como dijimos en la seccin 5.4.3.],
un estinlador es una variable aleatoria y por tanto tiene su propia distribucin de
probabi Idad.
5.4.5.2. t Distribucin en el ro uestro de una proporcin
Para c'oncretar esta idea, supongamos que tenemos una m.a.s. XI' X2 'oo., X" de una
poblacin de Bernoulli con parmetro p desconocido. Sabemos que p= X es el
estimador insesgado ms eficiente de p pero, Cul es la distribucin de p? Aqu,
" x.
j
" l
J
p
=!..)= Jtx=x]=(II\'(I-flf' = X =0.1.2..... 11
n l n 11 J rl"
,
x J
x
Es decir, la probabilidad de que la proporcin en la muestra, j, sea - es igual a la
11
probabilidad de obtener x "xitos" en una muestra de 11. Esta probahilidad viene
dada por la distribucin binomial con parmetros 11 y p. Para resumir esta hecho, se dice
que la distribucin en el 111uesrreo de j es binoloial (con parlnetros 11 y p).
5.4.5.2.2 Distribucin en el muestro de la media de una muestra normal
Henlos visto antes que, para una In.a.s. de una variable, X, con Inedia Jl, varianza a 2
y distribucin cualquicra, E( X) = l y V( X) =O" 2 No obstante, la distribucin en el
II
muestreo de X depende de la poblacin original. Si la distribucin es nOr/nal, entonces,
Ix;
COIno X=E.l.-- es una combinacin lineal de Xl' X2' , Xn' podemos utilizar un
n
resultado de la seccin 4.4.3.3.1 y escribir:
Ix ( a J
X - N l .,J;z
Es decir, la distribucin en el muestreo de X, de una m.a.s. de una poblacin l1or171al, es
120rnzal con Inedia Jl y varianza cr 2. Transformando a una variable. aleatoria normal
estndar, tenemos el siguiente resultado equivalente:
X-Jl
- N
aj';; - (0,1)
a
2
eSlinzarla utilizando el estimador S2. Se puede demostrar que:
Si no conocemos la varianza de la poblacin, , (un caso muy usual), podelnos
X-Jl
sl';; - 1n-J
5.4.5.2.3 Distribucin general de la media para muestras grandes no-normales
En la seccin 5.4.5.2.1 vimos que la distribucin en el muestreo de p=X es
binomial. En la seccin 5.4.5.2.2 obtuvimos resultados para el mismo estadstico, X,
para muestras normales. En general, la distribucin de X depende de la poblacin, pero,
cuando tenemos Inuestras grandes, podenl0s utilizar el teorel1za central del li11zite
(seccin 4.4.3.3.1) para obtener la siguiente aproxi111acin general de la distribucin en
el muestreo de X.
Para una m.a.s. XI' X2' ... ' Xn de una poblacin no-nor/naI cualesquiera con media Jl y
varianza O" 2, la distribucin en el muestreo de X es aproximadamente N( jl. :;;; J.
Aplicando la transformacin a una variable aleatoria normal estndar, tenemos:
X-Il
aj.J;; -N(O,l)
aproxilnadanzente.
Si no conocemos la varianza de la poblacin, a 2, (un caso muy usual), podemos
estimarla utilizando el estiJnador optinlo 6
2
Entonces, se puede demostrar que, para
Inuestras grandes, la distribucin en el 111Uestreo de X es aproxinlada/71ellle
N(l, 1). Transformando a una variablc alcatoria normal estndar, tenemos:
x- 11
-N(O,I)
aproxil11adal11ente.
La bondad de estas es generalmente buena si n 30. Si n < 30, la
aproximacin es buena slo para poblaciones parecidas a la nonnal.
Como un caso particular de este ltimo resultado, si la poblacin es de Bemoulli,
Jl =p y 0'2 =pq. Estimando p por p=X y (j 2 por 2 =pq , para muestras grandes
la distribucin en el muestreo de p es aproxinladanlellte:
N(P,f!J
Transformando a una variable aleatoria normal estndar, tenemos:
p-p
u;q- N(O,I)
V-;;
aproxil11adal11ente.
5.4.5.2.4 Distribucin en el muestro de la varianza de una muestra normal
Supongamos que tenemos una m.a.s. X JI X2 , , X" de una distribucin normal con
nledia Jl y varianza a 2; es decir
9
X - N(Jl ,a) (i = 1t 2, ... ,11)
y las Xi son independientes. Si estimamos la varianza a 2 de la poblacin por S2 t se
puede demostrar que: .
(ll-l)s2
0'2 - Xn-l
5.4.5.2.5 Distribucin en el nluestreo de la diferencia entre dos medias
Supongamos que tenemos dos nluestras aleatorias simples de dos poblaciones
cualesquiera y que los dos muestras son independientes entre s y de tamaos grandes.
Denotamos la primera como XII' X
I2
,., XlIII y la segunda conlO XlI' X
22
, , X
2
"2. En lo
que sigue, utilizamos X
J
para representar la media de la prilnera muestra, estimador de
la media Jll de la primera poblacin, y X
2
para representar la media de la segunda
muestra, estimador de la Inedia Jl
2
de la segunda. En muchas interesa la
diferencia entre las dos Inedias poblacionaJes, Jl
l
- 112. Se puede demostrar, a partir del
Icore111a central dellinlite, que, si las dos poblaciones son /lo-/lor/nales y los talnaos de
1]
12
2
las muestras. 11 1 y 11
2
, son grandes, la distribucin en el muestreo de (XI - es
aprOX;111adaI11ente:
0'2 0'2]
N(J.11 - J.1
2
), --.L+_
2
[
III 11
2
donde 0'1 Yai son las varianzas de las dos poblaciones. Aplicando la transformacin a
una variable aleatoria normal estndar:
(XI - X2)-(JlI- 1l 2 ) _ N(O, 1)
, 2 2
a2
ni 11
2
aprOX;111adanlellle.
Si estas varianzas son desconocidas (un caso muy usual) podemos estimarlas utilizando
los estimadores ptimos, y . En este caso se puede demostrar que, para nluestras
grandes de poblaciones nO-llonl1ales, la distribucin en el muestreo de (x)- Xl) es
aprox;, nadal11ente:
A2J
N (J.11 - J.12)'
(
ni 11
2
Aplicando la transformacin a una variable aleatoria normal estndar:
(XI - X2 )- (1.1, - 1.12) _ N(O,I)
2 2

ni 11
2
aproxil11adal11ente.
Como un caso particular de estos resultados, si las poblaciones son de Berlloul/i,
J.l, =P.. 112 = P2' 0'1
2
.= Plql Y0'; = P2q2 Estimando PI por p) =XI' P2 por P2 = X
2
'
0;1 por =Plq, Y 0'; por =P2Q2' la distribuci6n en el muestreo de (Ji - P2) es
aprox;'lIada117ellle:
N((PI - P2)' p/i) + P2Q2 )
n, "2
donde ql =(1- PI) Yq2 =(1- P2) Aplicando la transfonnaci6n a una variable aleatoria
nornlal estndar:
(p,- p)-(p,- P2) _N(O,I)
'Plq, + P2q
11) 11
2
aproxil11adolllCl1te.
11
Si las dos poblaciones originales son llorlnales. el primer resultado de esta seccin 110 es
una aprox;nlacill - es exacto para tll111aiios 111uestrales cualesquiera. Es decir.
2
(X - X) - N[( Il - Il ), cr1 + cri ]
I 2 ) 2 1,) 11
2
exactalnellte. Aplicando la transformacin a una variable aleatoria normal estndar:
(XI X2 )-( Il, - I.1J _N(O,ll
a)

a
2
2
+

n) 11
2
exaclanlenle.
El problema con este ltimo resultado es que depende del conocimiento de las varianzas
poblacionales. 0'1
2
y 0';. En nluchas aplicaciones no sabemos sus valores y entonces es
necesario estimarlos. Distinguimos dos casos; uno en que las dos varianzas son iguaJes
2
(es decir, 0'1 = 0'2
2
=0':2), Yel otro en que las dos varianzas no son iguales (es decir, 0')2 ;t.
0';). En el primer caso, estimamos la varianza comn, O' 2 , por:
S2 = (1/1 - I)S,2 +(1/
2
- I)S;
11) +1l
2
- 2
donde SI
2
y S: son las varianzas 1nuestrales (corregidas) de las dos muestras. Es posible
demostrar que,
(XI - X
2
) - (JlI - Jl2)
1 1 J
52 -+
(
"1 "2
2
En el segundo caso (el lJaJnado proble111a de Behrells-Fisher), 0'1 y (Ji son distintas y
2
estimamos 0'1 por S,2 y 0'; por S;. No hay una solucin nica para este problema pero
se puede demostrar que, aproxiI11adaI11en/c:
(XI - X2)- (1.1, - 1.12) _ I
'S'! 5;)
I + _
v
ni 12
2
donde, el nmero de grados de libertad, v, viene dado por:
14
Tema 5 - Inferencia Estadstica: Estimacill
Tema 5 - Inferencia Estadstica: E.Himacin
Si V lzO es entero, se redondea al entero 111s cercano.
5.4.5.2.6 Distribucin en el muestreo de la razn de dos "arianzas de poblaciones
normales
Dadas dos muestras aleatorias simples, independientes, de tamaos ni Y n
2
, de dos
poblaciones l1o/7nales, se verifica que:
S2/
a
2 S2 2
1 J J a.,
2
"
5
2/
S a
F 1-1."2-
1
a
2 2 2 J
Este resultado se aplica en la esti111acin por intervalos y contrastes de hiptesis en
relacin a la razn de las varianzas de dos poblaciones nornlales.
5.4.5.3 Intervalos de confianza
5.4.5.3.1 Introduccin
Una vez dados los resultados para las distribuciones nluestrales de estimadores de la
ltima seccin, podemos plantear ahora la construccin de los llamados intervalos de
confianza.
Llamaremos intervalo de confianza para el parmetro e con nivel, o coeficiente, de
confianza 1- a , a una expresin del tipo:

donde los lmites 8\ y e2 del intervalo dependen de la 171uestra y se calculan de manera
tal que, si construimos intervalos de este tipo para l1luchas nluestras distilltas,
1000- a )0/0 de ellos contendrn el verdadero valor del parmetro (y lOen % no
contendrn este valor). Por ejemplo, un intervalo de confianza para el parmetro econ
nivel 0,95 tiene la propiedad de que el 95% de los intervalos de este tipo contienen e)
verdadero valor de] parmetro (y el 50/0 no).
5.4.5.3.2 Intervalo de confianza para (muestra normal; cr conocida)
Para introducir la construccin de intervalos de confianza, consideramos la situacin
descrita anteriomlente en la seccin 5.4.5.2.2. En este caso, sabemos que:
!X;
X_.i.=L.-
- 12
( cr ')
N Jl, r I
Vil)
y entonces
z=X-Jl
crj';; -N(O,I)
Luego,
P[-z(a/2) Z z(a/2)) =l-a
donde :(a /2) es un valor de la distribucin norma) estndar tal que:
15
p[z z(a/2)] =l-c1>(z(a/2)]
Operando, obtenemos:
Z z(a/2)) =l-a
p[ :/:}f; z(a/2)] == )-a
X z(a/2}i]= )-a
p[ X X-z(a/2)-J:;] =)-a
p[ X- X+z(a/2)]== )-a
Finalmente, si seleccionamos una m.a.s. de tamao 12 de una poblacin nonnal con
varianza conocida, cr 2, Y calculamos su media x, el intervalo de confianza del
(1- a )100% para Jl viene dado por (e1,e 2) donde:
el =x- z(a/2) a, y e
2
= x+ z(a/2) a,
vil vil
es decir, los lbllites del intervalo vienen dados por:
cr
xz(a/2) .;;
Es importante notar que si tenemos una muestra de datos y construimos un intervalo de
confianza de este tipo, el valor verdadero de Jl est de12tro o fuera de, este intervalo.
Entonces, la uprobabilidad" de que el verdadero valor de Jl est dentro de este intervalo
es 1.
Ejemplo 5.2
Un fabricante produce focos cuyos tieInpos de vida siguen una distribucin normal
con desviacin tpica de 40 horas. Si una muestra de 30 focos tiene un tiempo de vida
media de 780, encuentre un estimacin puntual, y un intervalo de confianza del 96%,
para la media poblacional de todos los focos que produce esta empresa.
Solucin
Aqu, cr = 40, 12 = 30, x = 780. Una estimacin puntual de la media poblacional es
l =x=780. De la tabla de la distribucin normal estndar,z(0,02) == 2,05 y entonces
un intervalo de confianza de Jl del 96% es:
.x z(0,02) a, ::: 780 2,05 (765 ; 795)
v n ,,30
]6
Tema 5 - Inferencia Estadistica: Estimncin Tema 5 . Inferencia Estadstica: E.\"t;maci"
5.4.5.3.3 Otros inter\'alos de confianza importantes
Utilizando los resultados para las distribuciones muestrales de estimadores
introducidos en la sesin 5.4.5.2, y siguiendo un procedimiento anlogo a el de la
seccin antrior, podemos obtener los siguientes intervalos de confianza.
5.4.5.3.3.1 Intervalo de confianza para J.1 (poblacin normal; (j desconocido)
Si tenemos una m.a.s. de tamao n de una poblacin nonnal con varianza (j 2
desconocida, un intervalo de confianza para Jl, de nivel (I -(l )100% viene dado por:
xt._(a/Z)
donde t
n
_
J
(a/2) es el valor de la distribucin t de Student con n - 1 grados de libertad
que deja un rea de a /2 a la derecha.
Ejemplo 5.3
Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra de
piezas cuyos dimetros son 1,01, 0,97, 1,03, 1,04, 0,99, 0,98, 0,99, 1,01 Y l,03
centmetros. Encuentre una estimacin puntual y un intervalo de confianza del 99% para
el dimetro medio de piezas producidos por esta mquina, se supone una distribucin
nonnal.
Solucin
") 9,05 .
Aqu, 11 = 9, =9,05 y Entonces, x=-9-=1,005 y una
estimacin puntual de la media poblacional es il = x= 1,005. De la tabla de la
distribucin 1 de Student, 1
8
(0,005) = 3,36 Y
9 1)
(
2,x. J
(9,05):!

s= ti ;=1 n
9,1051- -9- =0,024551533
11-1 " S
Entonces un intervalo de confianza de Jl del 990/0 es:
s . 0,024551533 ( )
Xl
s
(0,005) .;;::: 1,0053,36 == 0,978 ; 1,033
5.4.5.3.3.2 Intervalo de confianza para J.1 (muestras grandes; poblacin no-normal)
Si tenemos una m.a.s. de tamao n grande (n 30) de una poblacin no-nornza/
cualquiera, con varianza (j:! conocida, un intervalo de confianza para Jl, de nivel
aproximadamente (I - (l )100% viene dado por:
Si la varianza no es conocida, podemos aproximar su valor por 6':! . En este caso, un
intervalo de confianza para Jl, de nivel aproxil11adamente (1 - a. )1000/0 , viene dado por:

-+ "7(a/2) I
x_"\: vn
Ejemplo 5.4
En una m.a.s. de tamao 53 de una poblacin de Poisson, x = 4,113. Encuentre una
estimacin puntual y un intervalo de confianza del 950/0 para la media poblacional.
Solucin
Una estimacin puntual de la media poblacional es Ct = x= 4,113. El tamao de la
muestra es grande y entonces podemos utilizar una aproximacin normal. Como, para la
distribucin de Poisson cr 2 = Jl, estimamos ]a varianza de la poblacin por
6" 2 = Ji = x= 4,113 . Luego, un intervalo de confianza para Jl de nivel aproximadamente
950/0 es:
xz(0,025) 4,113 1,96
3
'" (3,57 ; 4,66)
vn
5.4.5.3.3.3 Intervalo de confianza para una proporcin (muestras grandes)
Si tenemos una m.a.s. de tamao n grande (n 30) de una poblacin de Benl0ulli,
un intervalo de confianza para la proporcin p, de nivel aproxinzadalncnte (}- a )1000/0,
viene dado por:
pz(a/Z) (Pq

Ejemplo 5.5
Calcule una estimacin puntual, y un intervalo de confianza del 980/0, para la
proporcin de artculos defectuosos en un proceso, suponiendo que en una muestra de
tamao 100 se han encontrado ocho artculos con defecto.
Solucin
Una estimacin puntual de la media poblacional es p= 00 = 0,08. El tamao de la
muestra es grande y entonces podemos utilizar una aproximacin normal para calcular
el intervalo de confianza. De la tabla de la distribucin normal estndar, z( 0,01) 2,33 Y
entonces un intervalo de confianza para p de nivel aproximadamente 98% es:
" /(0 OS)(O 92)
pz(O,Ol)
f!
pq =0,OS2,33, , .,..,..' =(0,017; 0,143)
11
(j
x.:(a/2).;;
Tema 5 - Inferencia E.HadJTica: ESTimacin
5.4.5.3.3.4 Intervalo de confianza para cr (poblacin normal)
Si es la varian:a (corregida) 111ue5rra/ de una nl.a.s. de tamao 11 de una poblacin
/lor/nal, un intervalo de confianza para cr 2 de nivel (1- a)1 00%, viene dado por:
(12 - 1)s2 .. (12 - ])5
2

X:-I(CY;) Xn
2
_1(1-CY;)
donde X:-I(CY;) y xL( son valores de la distribucin chi-cuadrado con 12-1
grados de 1ibertad que dejan reas de a /2 y 1- 0./2, respectivamente, a la derecha.
Ejemplo 5.6
Se han nledido los siguientes valores (en miles de personas) de la audiencia de un
programa de TV en distintos das: 521, 742, 593, 635, 788, 717, 606, 639, 666, 624.
Encuentre, en la hiptesis de normalidad, estimaciones puntuales e intervalos de
confianza de nivel del 9590 de la audiencia media y la varianza.
Solucin
10 ro
Aqu, 1l = 10, LXi =6531 Y Lx;:! =4320401. Entonces, x=653,1 Y52 =6] 11,65.
i=1 i=1
Una estimacin puntual de la audiencia Inedia es f1 =x=653,] Yuna de la varianza es
6" 2 =52 =6111,65. Un intervalo de confianza del 950/0 para Jl es:
x1
9
(0,025)+ =653,1 (597 ; 709)
"Vil 10
Un intervalo de confianza del 95% para cr 2 es:
9(6111,65) ., 9(6111,65)

19,0 2,70
es decir, (2895 ; 20372).
5.4.5.3.3.5 Intervalo de confianza para J.l I - Jl2 (muestras grandes; poblaciones no
normales)
En la seccin 5.4.5.2.5 deducimos que, para 111ueslras grandes, independientes y de
poblaciones 12o-nornlales, la distribucin en el muestreo de (X, - X ) es
2
aprOXi/lladaUlenre:
al2 cr; J
N
(
(1l1 - 1l2)'
11
1
11
2
Utilizando este resultado, un intervalo de confianza para J.l, - J.l2' de nivel
aproxinladaJl1ellIe (] - a)1 000/0, viene dado por:
(XI - X1) -(a 11) ter," er;
... ... /- -+--=
) 11, n
2
TelJla 5 _inferC'ncia Estadstica: Est;macin
Si 110 conocemos las varianzas poblacionales, cr)2 y cr;, es necesario estinlarlas por a y
';, respectivamente. En este caso un intervalo de confianza para JlI - Jl2' de nivel
aproxi111adalnente (I - a )1000/0, viene dado por:
.... 2 .... 2
(
", n2
Ejemplo 5.7
Tomamos dos muestras aleatorias simples, independientes, de dos poblaciones de
Poisson: una de tamao 62 con media muestral 3,62 y otra de tamao 74 con media
muestral 3,84. Encuentre una estinlacin puntual, y un intervalo de confianza de nivel
del 920/0, para la diferencia entre las medias de las dos poblacionales.
Solucin
Una estimacin puntual de la diferencia entre las medias poblacionales, Jl
1
- Jl2 es
Ct, - Ct2 =X, -.x
2
=3,62 - 3,84 =-0,22.. Los tatnaos de lac; muestras son grandes y
entonces podemos utilizar la aproxiInacin normal para construir el intervalo de
confianza. Sabemos que, para una distribucin de Poisson, O' 2 =Jl Y entonces
2 2
estimamos cr
l
por 6; =Jl, =Xl = 3,62 Y cr
2
por =ft2 = x
2
=3,84. Luego, un
intervalo de confianza para la diferencia entre las medias poblacionales de nivel
aproximadamente 92% es:
(XI - x )Z(O,04)Jcr + cri -0,22 1,75 /3,62 + 3,84 =: (-0,80; 0,36)
2
11, n
2
V62 74
5.4.5.3.3.6 Intervalo de confianza para PI - P2 (nluestras grandes)
Con1o caso particular del ltimo resultado, si las dos poblaciones son de Bernoulli.
2
X, = PI' x
2
=P2 Y podemos estimar 0'1 por p,q, y (J; por P2q2' don..de q = (1- Pi)
Entonces, para 111ueslras grandes, un intervalo de confianza para Pl - P2' de nivel
aproxiJnadal11enle(I - a. )1000/0, viene dado por:
(PI - P2)z(a/2)
P,q, + P2Q2
1 " 11 2
Ejemplo 5.8
Se comparan las producciones de dos mquinas, A y B, que fabrican en serie. En una
muestra de 200 elenlentos de A, resultaron 16 defectuosas, mientras que en otra de 100
de B resultaron 12 defectuosas. Encuentre una estimacin puntual, y un intervalo de
confianza de nivel aproximadamente 95%, para la diferencia de las proporciones de
elCInentos defectuosos producidos por las dos mquinas.
Solucin
Una estimacin puntual de la diferencia entre las dos proporciones
PA - PB' es PA - 1)B =1 - 17{00 =0,08 - 0,12 =-0,04. Los tamaos de las muestras
Tema 5 . Inferencia Estadstica: Estimacin
Tema 5 . Inferencia EstadStica: Estimacin
son grandes y entonces podemos utilizar la aproximacin normal para construir el
siguiente intervalo de confianza:
(pA- ftB) z(0,025),1 pA A + PBqB= -0,04 1,96 J( 0,08)(0,92) +(0,12)(0,88)
nA n
s
V 200 100
== (-0,114 ; 0,034)
5.4.5.3.3.7 Intervalo de confianza para JlI - Jl2 (poblaciones normales)
Como vimos en la seccin 5.4.5.2.5, en el caso de dos muestras independientes de
poblaciones nonnales, la distribucin en el muestreo de (XI - X
2
) es exactamente:
crl2 cr;]
N (Jl - Jl ), -+--=
[ ) 2 n
2
Entonces, un iotervalo de confianza para JlI - de nivel exactamente 0-a)1 000/0,
viene dado por:
0
2
o;
(X
J
-x
2
)z(a/2) -l...+-=
nI n
2
Este ltimo resultado supone que sabemos los valores de los parmetros poblacionales
cr
l
2
Y cr;. Si no conocemos sus valores, es necesario estimarlos. Como vimos en la
seccin 5.4.5.2.5, si cr)'2 =cri = cr 2, estimamos la varianza cOll11n, cr 2, por:
(ni +(11
2

S2
ni +n
2
-2
En este caso un intervalo de confianza para JlI - Jl
2
, de nivel exactalnente 0- a)] 00%,
viene dado por:
(XI - x2 )t" +11
1 - n) n
2
donde tlll+1I2_2(a/2) es el valor de la distribucin t de Student con nI + n
2
- 2 grados de
libertad, que deja un rea de a /2 a la derecha.
Si cr
J
2
y cri son distintas, estimamos cr
l
2
por y cri por si. Luego, un intervalo de
confianza para Jl
I
- Jl
2
, de nivel aproximadamente (J -a )]00%, viene dado por:
2 2 J
(XI - x
2
)t (a/2),/
(
:1-+.:2
v
ni 11
2
donde t\, (a /2) es el valor de la distribucin t de Student
grados de libertad, que deja un rea de a /2 a la derecha. Si v no es entero, se redondea
al entero ms cercano.
Ejemplo 5.9
Se sabe que los nmeros diarios de piezas fabricados por dos mquinas, A y B, tienen
distribuciones nonnales. El nmero de piezas fabricadas por la mquina A en cinco das
ha sido: 50, 48, 53, 60 Y37. En esos mismos das, la mquina B ha hecho: 40, 51, 62, 55
Y64 piezas. Encuentre:
a) Una estimacin puntual para la diferencia entre las dos medias poblacionales.
b) Un intervalo de confianza del 950/0 para la diferencia entre las dos medias
poblacionales, suponiendo que:
i) (J)2 =8 ya; =9.
ii) Las varianzas poblacionales son desconocidas pero son iguales.
iii) Las varianzas poblacionales son desconocidas y no son iguales.
Solucin
A partir de los datos, se puede calcular: x
A
=49,6 ; x
B
= 54,4 ; SA = 8,38 YSB =9,61.
a) Estimamos JlA - Jl
B
por }lA -}lB =X
A
- X
B
=49,6- 54,4 = -4,8.
b) i) Un intervalo de confianza para la diferencia entre las medias poblacionales de
nivel 950/0, viene dado por:
2 2 2
cr cr 9
(x) -X
2
)z(0,025),/-l...+-l.. =-4,81,96 -+- =(-15,4; 5,8)
nI 11
2
5 5
ii) En este caso,
2 4(S,38f +4(9,61)2
s = =8129
8 '
Yt
8
(0,025) = 2,31. Entonces, el intervalo es:
(XI - -X-
2
)t
8
(0,025),/s- -+-] J=-4,82,31 81,2{1 .,( 1 -+-1J=(-18,0; 8,4)
nI n
2
5 5
iii) En este caso,
8,38
2
9,612 J
--+-
(
5 5
Tema 5 - Infcrcncia Esrad.Hica: Esti11lllcin
Tema 5 - Inferencia Estadstica: Estimacin
Redondcando al entcro ms cercano, v = 8. Entonces, el intervalo es:
_ _ SI s; 8,38 9,61
1(2"J=-4,82,31J(--+- 2 2J =(-18,0; 8,4) (xl -x:Jt8 (O,025),/-+
1Z1 11: 5 5
5.4.5.3.3.8 Intervalo de confianza para la razn de varianzas (poblaciones
normales)
Suponganl0s que tenemos dos nluestras aleatorias simples independientes de
tamaos 111 y 11 2 , respectivamente, de dos poblaciones nOr/na/es. Utilizando el resultado
de la seccin 5.4.5.2.6, un intervalo de confianza para cr
l
2
de nivel (I - a)l 00% ,
viene dado por:
s; 1 a
2
S2
S2 F ( 5: -l... 2 < ...L F ( )
2 .,-1.,-1 a. /2) a
2
- si .,-1.,-1 a. /2
donde es el valor de la distribucin F de Fisher-Snedecor con nI -1 y
112 - 1grados de libertad, que deja un rea de a/2 a la derecha. (u /2) es el valor
anlogo para 11
2
- 1 Y11
1
- 1 grados de libertad.
Ejenlplo 5.10
Dos muestras dc dos poblaciones normales han dado los siguientes resultados: 11 = 8,
1
IX;=12 y IX;"=46; /1
2
= 11, IY;=22 y Iy;2=80. Calcule una estimacin
1:1 1=) i=1 i=J
puntual. y un intervalo de confianza de nivel 90%, para 0'1
2
/ cr2
2

Solucin
Aqu:
46 _ (12)2 80- (22)2
Sl2 =
7
8
=4 Y
s; =
10
11
=3,6
4
Entonces, una estimacin puntual para ai la; es s Isi = 3.6 = 1,11 Y un intervalo de
confianza de nivel 90% para (51
2
/ a; es:
4] 4 J
( (3,6) (3,1355); (3,6) (3,6365) =(0,35 ; 4,04)
5.4.5.3.4 Determinacin del tamao nluestral
Hasta ahora supusimos que el tamao de una muestra era conocido. En la prctica.
cuando estamos diseando un experiJnento aleatorio, la determinacin del taInao de
una nluestra es crucial. No queremos un tamao ms grande que lo necesario, porque no
queremos gaslarnls Inedias (tiempo, dinero, etc.) que los absolutamente necesarios.
Por otro lado, si el tamao de la muestra es demasiado pequejio, no ser posible alcanzar
una precisin adecuada. Las frmulas obtenidas anteriormente para los intervalos de
confianza, nos penniten deducir el tamao muestral necesario para una precisin
especificada. A continuacin, consideramos dos casos particulares.
5.4.5.3.4.1 Estimacin de una media
Supongamos que utilizamos una m.a.s. para construir un intervalo de confianza de
nivel (I - a)1000/0 para la media, )1, de una poblacin. Segn se ha visto en las
secciones 5.4.5.3.2 y 5.4.5.3.3.2, el intervalo viene dado por:
O'
xz(a /2) .;;
(Este intervalo es exacto si la poblacin es nOr1nal y una aprox;l1lacin si la poblacin
es llo-nor1llal pero el tamao de la muestra es grande.) Entonces, la al1lp/itud del
intervalo es 2z(aj2) a,-.. Si queremos un intervalo de amplitud 2L, es decir xL,
vn
L= z(a./2)
y entonces,
z2(a/2}cr2
11
L
2
Obviamente, esta ltiJna frmula exige conocer O' 2. Cuando cr 2 sea desconocida
tendremos que tomar una 111ueslra pilolo pequea para conseguir una estimacin, 2 , de
0
2
y reemplazar cr
2
por a
2
para estimar Il.
Ejemplo 5.11
Los tiempos de vida de los focos producidos por un fabricante tienen una distribucin
normal con desviacin tpica de 40 horas. Qu tamao muestral se requiere, si se desea
tener una confianza del 960/0 de que la media muestral difiera en menos de 10 horas de
la media poblacional?
Solucin
Aqu, cr =40, L =]0 Yz(a/2) =z(0,02) = 2,05. Luego, Il
Entonces, hay que tomar una muestra de tanlao 68.
23
24
-- -- --
5
Tema 5 . Inferencia EstmJticu: Estimacin
5.4.5.3.4.2 Estimacin de una proporcin
Supongamos que utilizamos una m.a.s. de una poblacin de Bemolllli para construir
un intervalo, de nivel (J - a )100%, para la proporcin, p. Un intervalo de confianza de
nivel aproximadamente (J -a )100% viene dado por:
Pz(a/2)jP!
La amplitud de este intervalo es 2z(a/2)jP!. El problema con este fnnula es que no
conocemos el valor de p (obviamente!). Si consideramos el caso ms desfavorable, la
amplitud es mxima cuando p = 0,5. Entonces, en este caso. si queremos un intervalo de
amplitud 2L, es decir P L,
L = ){,
y entonces,
z2(a/2)
n=-

4L
2
Ejemplo 5.12
Calcular el tamao de muestra que se debe tomar para estimar una proporcin. si se
desea que el intervalo del 95% sea del tipo p L. para valores de L =0,1; 0.05; 0.01.
Solucin
(1,96)2
AqU!, z(O,025) =1,96. Entonces, n = Luego, cuando:
. (1,96)2 6
1) L=OI' n=--=9 04.
, , 4(0,1)2 '
ii) L = 0,05; n = (I,96Y, 384,16.
4(0,05)
iii) L = 0,01; n = (1,96)2 =9604 .
4(0,Q1Y
"
Q
- '"
Cl
,....
-";.

:: Iv,
ClCl-
+
::!v,
l ""' ....

,">1 '-----"
-,
:
.:

"",t.,NI_t.-,
,">1

::
,_
Q
-


.....
, 'J
"


Z
""
-
1=
1
1=
Q
-,
'<
Q

Q.
"
" n
o
::l
o
n
o:
"
'"
Q

1>
Q


:>':1
I
:>':1
1=
I
1=
.:o:
'<

Q.
en
"
n
o
::l
o
n
o:
'"
Q
- '"
11

11
Q
_:>':1
I
,:<1
-
1=
I
1=
'"
Q
- '"
'<
Q

n
o
::l
o
!:?
Q.


_:>':1
,
N:>':I
_:>':1 _:>.:/ _:>':1

-;'"
I
r'
.......... :: 1- -- -,"-
1
J-- J-.. + J
+
"",:::1-:- ",- ""''''''
I '-----" I 1
1= 1= 1=
.... ,... ,...
I
<


,

...-..
_>-el 1
Q
'"

1=
Q
Q.
en
"
n
o
::l
o
!:?
Q.
-e
:>':1
1=
Q
n
o
::l
o
n
e

:>':1
"tl
:::>
:l.
3"
:::
'"

l"

S"
..,
'"

:::>
.....

:::.
:;
"c'

'"

:::>
'"
""
01
U.
:;l:l
;r.
'"
:::
3
::s '"
Q.
!:;.
-l
,.,
3
'"
...-

::
Q I v, I:>':1 Q 1:>':1 [
1 ---- 1 ::l
., 1= ., 1= e.,

I I I $
2
3?
- o


S
g:
.
J :-:1 _"1
"<1 :::....- I :: ;:
:::....- 1+ "<1:::-" 1 "', :-:,;:;
1+ :::....- 1+ 1+::;
I+!::::-- "'," ,!:i.... 2.
Q , N ...-.. Q ::l
- ...-.. Q"
.e.
JJ IV -' <-/'" ::l N ..........
,..-----------........... :::-.. :: :: 1 '" ::
_:: 1-'" :: IQ - 1 .,/ '" -,
+ - - , .::=. ::
N:: I'';-'N "',. Q ;
'---' + ,.:: I
1 '----"
:;;
':
"
s,

::
;::
:S"
-- --
--
--
Tema 5 - /llfc'rcllcia Estadtica: Esril1Ulcll
.....,
-
J:

",,=>
;:P>

... 1
--
1
+
Ir"}:>
'"
1
1""
N
-J
-

I
,"3=>
--1""=> I
J- -
""=
1
3


.....-..
-5
a
)<
..:
-

l}=>
-
1+
N
Q

:::::
-
+
::: 1,"5= >
''''' ,,,
1
3

-5
o
;.<
",,=>
1""0
:::







2'"
""':











-

-

1=

..., I I

1= 1=
'=J
N N

...,
('") oS' Q
c'
o -N
O""
'<
S
t'.l n Q
----. o
NN
::J o
n
en :n
(J
t'.l c..
:::
::s
o

o
(J
o

..., a:
en p;
o

2.


_><1 _><1
I I
.... .... ><1
_><1
J I
I-ct
+ I + I +
::::: I><1 1?" ;: IQ> =' ,::: /,9
,... ,.... - "" ,... "" - .... ,...
I I
1= 1=

:F
1=
I
N
Q
-N
'<
Q
NN
(J
o
::s
O
(J

t.'
en
'-"

I
N><I
1= :: 1=
:::
"'t oS' Q Q
o-
o
(J
o-
t;;'" ti:
o

(J (J
o
o ('") o

o e:
::;,

c.. n
e

--o
o
e

CI'}
O
::;,

c..:
><1 .

o

...,
1
lIt,;' ";:' '2
3 <: <: -6 .
-. -. o ..., o

r
-
-. .....-.. -.
t.: t.:
"O "O -o
a a o
x x )<
..:-
_><1
I

I :::
?' 1 1 1
- o
13 =<:
1= o 'O
--- --- ::; s.


:::

t'.l



...


::

"'""



;:;
:s.

f.o)
B


r"')


5.
g'
5.6 Ejercicios
5.6.1 Los contenidos de 7 recipientes similares de cido sulfrico son: 9,8 , 10,2 , 10,4 ,
9,8 , 10,0 , 10,2 Y9,6 litros. Encuentre una estimacin puntual, y un intervalo de
confianza del 950/0, para la media de todos los recipientes de este tipo, suponiendo
que la poblacin es normal.
5.6.2 En una muestra aleatoria simple de 1000 casas de una ciudad, se encuentra que
228 de ellas tienen calefaccin de petrleo. Halle una estimacin puntual y un
intervalo de confianza del 99% para la proporcin de hogares en la ciudad que
tienen este tipo de calefaccin.
5.6.3 Una muestra de tamao 1Ode una distribucin resulta con Xl =170,2
Yotra de tamao 12 de N(Jl2,256) conduce a x
2
= 176,7. Encuentre una
estimacin puntual y un intervalo del 96% para Jl
1
- Jl2 .
5.6.4 Se est considerando cambiar el procediJniento de fabricacin de componentes. Se
toman muestras, tanto del procedimiento actual como del nuevo, para detenninar
si este ltimo resulta ser mejor. Si 75 de los 1500 componentes del procedimiento
actual presentaron defectos y lo mismo sucedi con 80 de 2000 componentes del
nuevo procedimiento, determine una estimacin puntual y un intervaJo de
confianza del 900/0 para la diferencia real de las proporciones de componentes
defectuosos entre los dos procesos.
5.6.5 Una compaa contrata diez tubos de filamentos de tipo A Ydiez de filamentos de
tipo B. Las duraciones de vida observadas han sido:
Tipo A: 1614 1094 1293 1643 1466 1270 1340 1380 1028 1497
Tipo B: 1383 1138 1092 1143 1017 1061 1627 1021 1711 1065
a) Suponiendo que las poblaciones son normales y las varianzas so iguales,
encuentre un intervalo de confianza del 950/0 para la diferencia de medias.
b) Resuelva el apartado a) suponiendo las varianzas desiguales.
5.6.6 Un fabricante de bateras para coches asegura que sus bateras duran, en promedio,

3 aos con una varianza de 1 ao. Si 5 de estas bateras tienen duraciones de 1,9,
1+
N
Q
i 2,4 , 3,0 , 3,5 Y4,2 aos, determine una estimacin puntual y un intervalo de

.-......
:;1
:;J
confianza del 95% para la varianza verdadera. Es creble la afirmacin del
18
I I I ::-- fabricante sobre el valor de la varianza? (Suponga que la poblacin de las

::1
'
duraciones de las bateras se distribuye en fonna normal.)

1+ 1+ ;.el 1+
1+ :: l:g: l'

__ 1+
N
1+ N N N N
N
Q'C
Q 'Q'
'Q'
5.6.7 En la comparacin de las economas de combustible para dos tipos de coches
_ l--.)


lV lV N -- diesel, se utilizaron 12 coches Volkswagen y 10 Toyota en pruebas a
fija de 90 km./h. Para los 12 Volkswagen se obtuvo una media de 16 kilmetros
_:::

TQ'
por litro y una desviacin tpica de 1.0 km.!l. Para los 10 Toyota la media fue de
+
"",:::
+
11 km.!l y la desviacin tpica de 1.8 km.!l. Suponiendo que las distancias por litro
,: - 1,,, Q> ....
,: I,-Av

para cada lnodelo de coche se distribuyen en forma normal, determine una
estimacin puntual y un intervalo de confianza del 980/0 para a /a; .
28

S-ar putea să vă placă și