Documente Academic
Documente Profesional
Documente Cultură
MUESTREO Y ESTIMACIN
MUESTREO
Muestra Aleatoria de tamao n es una coleccin de n variables aleatorias, todas con
la misma distribucin y todas independientes. La coleccin de donde extraemos la
muestra aleatoria, se denomina Poblacin. Nuestra intencin al tomar una muestra, es
la de hacer Inerencia. Este trmino lo usamos en estadstica para denotar al
procedimiento con el que hacemos afirmaciones acerca de valores enerales de la
poblacin mediante los n!meros que observamos en la muestra.
" un valor calculado con los datos de una muestra es el Esta!"stico. "l valor del
par#metro en la poblacin es el Esti#a!or. $ es Esti#a!or Puntual cuando se
estima el par#metro poblacional a partir de un valor !nico%.
Caracter"sticas $robabil"sticas !e un esti#a!or. &uando se tiene una frmula para
estimar y se aplica a una muestra aleatoria, el resultado es aleatorio, es decir los
estimadores son variables aleatorias. 'or e(emplo si se recibe un embarque de ob(etos
que pueden estar listos para usarse defectuosos. 'odemos seleccionar, al a)ar,
alunos de ellos para darnos una idea de la proporcin de defectuosos en el
embarque. El par#metro de inters es la proporcin de defectuosos en toda la
poblacin, pero lo que observamos es la proporcin de defectuosos en la muestra.
%alor es$era!o !e un esti#a!or & ses'o. El valor esperado de un estimador nos da
un valor alrededor del cual es muy probable que se encuentre el valor del estimador.
'ara poner un e(emplo, si supiramos que el valor esperado de un estadstico es *,
esto sinificara que al tomar una muestra+ No creemos que el valor de la estadstica
vaya a ser *, pero tampoco creemos que el valor de la estadstica vaya a estar le(os de
*.
$a que es muy probable que el valor del estimador est cerca de su valor esperado,
una propiedad muy deseable es que ese valor esperado del estimador coincida con el
del par#metro que se pretende estimar. "l menos, quisiramos que el valor esperado
no difiera mucho del par#metro estimado. 'or esa ra)n es importante la cantidad
que, tcnicamente llamamos seso.
&onvencin, para efectos del estudio de ahora en adelante se presentan la siuiente
convencin,
,
y
representan, el par#metro que estamos midiendo y el valor
obtenido en la medida o muestreado, respectivamente
-
El ses'o es la diferencia entre el valor esperado del estimador y el par#metro que
estima.
( ) x E
,
,
% . E /eso
/i el seso 0, se dice que el estimador es inses'a!o y sta es una caracterstica buena
para un estimador. 1n estimador que es insesado tiene una alta probabilidad de
tomar un valor cercano al valor del par#metro.
%arian(a !e un esti#a!or. 2tra propiedad importante de un estimador es su
varian)a. La importancia de la desviacin est#ndar es que nos permite darle un
sentido numrico a la cercana del valor del estimador a su valor esperado. Entre
menor sea la desviacin est#ndar de un estimador, ser# m#s probable que su valor en
una muestra especfica se encuentre mas cerca del valor esperado.
'ara aclarar esto, considere dos estimadores 3
-
y 3
4
, supona que ambos son
insesados y supona que la varian)a de 3
-
es menor que la de 3
4
, lo cual quiere decir
que los valores de 3
-
son m#s probables que los de 3
4
. 2 sea que vamos a encontrar a
3
-
m#s cerca del valor del par#metro que a 3
4
. Esto hace que nuestras preferencias
estn con 3
-
.
&uando un estimador tiene una varian)a menor que otro decimos que el estimador es
m#s eiciente.
)a !istribucin !e $robabili!a! !e un esta!"stico. 5ui)# el resultado m#s
importante para la estadstica es el 3eorema del Lmite &entral. Este resultado nos
indica que, para el estadstico promedio de la muestra
- el valor esperado es la media de la poblacin.
- la varian)a es iual a la de la poblacin dividida por el n!mero de elementos de la
muestra.
- la distribucin de probabilidad es la normal.
Este teorema es muy importante porque permite calcular probabilidades acerca de
dnde se encuentra el valor promedio muestra. Es slo cuestin de usar la tabla
normal teniendo cuidado al estandari)ar de usar la desviacin est#ndar adecuada que
es la de la poblacin dividida por la ra) cuadrada del n!mero de elementos de la
muestra.
Esti#acin !el error !e una #e!i!a !irecta. La estimacin del error de una
medida tiene siempre una componente sub(etiva. En efecto, nadie me(or que un
observador experimentado para saber con buena aproximacin cu#l es el rado de
confian)a que le merece la medida que acaba de tomar. No existe un con(unto de
4
relas bien fundadas e inalterables que permitan determinar el error de una medida en
todos los casos imainables.
6uchas veces es tan importante consinar cmo se ha obtenido un error como su
propio valor. /in embaro, la aplicacin de alunos mtodos estadsticos permite
ob(etivar en ran medida la estimacin de errores aleatorios. La estadstica permite
obtener los par#metros de una poblacin .en este caso el con(unto de todas las
medidas que es posible tomar de una manitud%, a partir de una muestra .el n!mero
limitado de medidas que podemos tomar%.
Me*or +alor !e un con*unto !e #e!i!as. /uponamos que medimos una manitud
un n!mero n de veces. 7ebido a la existencia de errores aleatorios, las n medidas
( )
n 2 1
x ,..., x , x ser#n en eneral diferentes. El mtodo m#s ra)onable para
determinar el me(or valor de estas medidas es tomar el valor medio. En efecto, si los
errores son debidos al a)ar, tan probable es que ocurran por defecto como por exceso,
y al hacer la media se compensar#n, por lo menos parcialmente, y este es el valor que
deber# darse como resultado de las medidas.
n
- i
i
x
n
-
x
Ti$os !e esti#acin esta!"stica. 1n problema importante de la inferencia estadstica
es la estimacin de par#metros de la poblacin, brevemente par#metros .tales como la
media y la variacin de la poblacin%, de los correspondientes estadsticos mustrales,
o simplemente estadsticos .tales como la media y la variacin de la muestra%.
Esti#aciones sin ses'o. /i la media de las dispersiones de muestreo con un
estadstico es iual que la del correspondiente par#metro de la poblacin, el
estadstico se llamara estimador sin seso o insesado del par#metro8 si no, si no se
llama estimador sesado. Los correspondientes valores de tal estadstico se llaman
estimacin sin seso, y estimacin con seso respectivamente.
E*e#$lo, la media de las distribuciones de muestreo de medias
x
o
, media de la
poblacin. 'or lo tanto, la media muestral es una estimacin sin seso de la media de
la poblacin.
E*e#$lo, las medias de las distribuciones de muestreo de las variables son
4
s
n
- n
4
En donde,
4
s sea una estimacin sin seso, sin embaro, s es una estimacin
sesada, pues, en trminos del valor esperado es insesado
4 4
% / . E % 9 . E
:
Esti#acin Eiciente. /i las distribuciones de muestreo de dos estadsticos tienen la
misma media .o esperan)a%, el de menor varian)a se llama un estimador eficiente de
la media, mientras que el otro se llama un estimador ineficiente, respectivamente. /i
consideramos todos los posibles estadsticos cuyas distribuciones de muestreo tiene la
misma media, aquel de varian)a mnima se llama a veces, el estimador de m#xima
eficiencia, sea el me(or estimador.
E*e#$lo, Las distribuciones de muestreo de media y mediana tienen ambas la misma
media, a saber, la media de la poblacin. /in embaro, la varian)a de la distribucin
de muestreo de medias es menor que la varian)a de la distribucin de muestreo de
medianas. 'or tanto, la media muestral da una estimacin eficiente de la media de la
poblacin, mientras la mediana de la muestra da una estimacin ineficiente de ella.
7e todos los estadsticos que estiman la media de la poblacin, la media muestral
proporciona la me(or .la m#s eficiente% estimacin. En la pr#ctica, estimaciones
ineficientes se usan con frecuencia a causa de la relativa sencille) con que se obtienen
alunas de ellas. Estimaciones de punto y estimaciones de intervalo, su iabili!a!,
una estimacin de un par#metro de la poblacin dada por un solo n!mero se llama
una estimacin de punto del par#metro. 1na estimacin de un par#metro de la
poblacin dada por dos puntos, entre los cuales se pueden considerar enca(ado al
par#metro, se llama una estimacin del intervalo del par#metro. Las estimaciones de
intervalo que indican la precisin de una estimacin y son por tanto preferibles a las
estimaciones de punto
La ;nferencia Estadstica comprende los mtodos que son usados para sacar
conclusiones de la poblacin en base a una muestra tomada de ella. ;ncluye los
mtodos de estimacin de par#metros y las pruebas de hiptesis.
La Esti#acin !e $ar-#etros comprende a su ve) la Estimacin 'untual, en donde
se estudian los diversos mtodos de encontrar estimadores y las propiedades ptimas
que deben tener stos, y la Esti#acin $or Inter+alos !e Conian(a, en donde se
estima un par#metro usando un intervalo centrado en un estimado del par#metro y de
lonitud iual a dos veces el error de estimacin. El Error de estimacin depende del
nivel de confian)a deseado, usualmente, <0, <= << por ciento.
En este texto solamente se tratar# el c#lculo de intervalos de confian)a. Los diversos
mtodos de encontrar estimadores y, las propiedades de estimadores ptimos son
discutidos en un curso de Estadstica 6atem#tica.
1na .i$tesis Esta!"stica es una afirmacin que se hace acerca de un par#metro
poblacional. La afirmacin que est# establecida y que se espera sea recha)ada
despus de aplicar una $rueba esta!"stica es llamada la /i$tesis nula y se
*
representa por >
o
. La afirmacin que se espera sea aceptada despus de aplicar una
$rueba esta!"stica es llamada la /i$tesis alterna y se representa por >
a
.
1na $rueba esta!"stica es una frmula, basada en la distribucin del estimador del
par#metro que aparece en la hiptesis y que va a permitir tomar una decisin acerca
de aceptar o recha)ar una hiptesis nula.
"l iual que una prueba de laboratorio para detectar cierta enfermedad, una prueba
estadstica no es ciento por ciento seura y puede llevar a una conclusin errnea.
>ay dos tipos de errores que pueden ocurrir. El error ti$o I, que se comete cuando se
recha)a una hiptesis nula que realmente es cierta y el error ti$o II que se comete
cuando se acepta una hiptesis nula que realmente es falsa.
El ni+el !e si'niicacin, representada por , es la probabilidad de cometer error tipo
;, y por lo eneral se asume que tiene un valor de 0.0= 0.0-.3ambin puede ser
interpretado como el #rea de la rein que contiene todos los valores posibles donde
la hiptesis nula es recha)ada.
La probabilidad de cometer error tipo ;;, se representa por y al valor -? se le llama
la $otencia !e la $rueba. 1na buena prueba estadstica es aquella que tiene una
potencia alta. En este captulo, primero se discutir# el c#lculo de intervalos de
confian)a y pruebas de hiptesis para la media poblacional, para una proporcin y
finalmente para la varian)a de una poblacin. Lueo se tratar# los intervalos de
confian)a y prueba de hiptesis para la ra)n de dos varian)as poblacionales, para la
diferencia de dos medias poblacionales y por !ltimo para la diferencia de dos
proporciones.
Esti#aciones !e Inter+alos !e Conian(a $ara $ar-#etros !e $oblacin. /ean
s y s
la media y la desviacin tpica .error tpico% de la distribucin de muestreo
de un estadstico /. Entonces, si la distribucin de muestreo de s es aproximadamente
normal .que como hemos visto es cierto para muchos estadsticos si el tamao de la
muestra es N 30), entonces, podemos esperar hallar un estadstico muestral real /
que est en el intervalo
( )
s s s
, +
,
( )
s s s
4 , 4 +
,
( )
s s s
: , : +
en un @A.4BC, <=.*=C y <<.B0 C, respectivamente.
En la tabla siuiente, se muestran los niveles de confian)a usados en la pr#ctica. 'ara
niveles de confian)a que no aparecen en la tabla, los valores D
c
se pueden encontrar
racias a las tablas de #reas ba(o la curva Normal.
Nivel de
confian)a
C
<<.B0 <<.00 <A.00 <@.00 <=.*= <=.00 <0.00
A0.00 @A.4B =0.00
=
D
c
:.00 4.=A 4.:: 4.0= 4.00 -.<@ -.@*= -.4A
-.00 0.@B*=
Inter+alos !e conian(a $ara la #e!ia. /i el estadstico es de la media de 9 de la
muestra, entonces los limites de confian)a
x x
=A . 4 y < . - t t ,
respectivamente. /i el muestreo de la poblacin es infinita por lo tanto viene dado por
N
D 9
t
E*e#$lo. >alar los lmites de confian)a de <AC y <0C. Lo anterior tiene la solucin,
sea D ED
tal que, al #rea ba(o la curva Normal a la derecha sea -C, entonces, por
simetra el #rea del lado i)quierdo de DE?D
o aplicar
( ) n H n -
n
n
B0@ . : - . 0 H @*A . < <@ . - n
4 4
&omprobamos que no se cumple, pues en este caso -0.000 K :.B0@ .:.B0@ ? -%8
-0.000 K -:.B:0.B:0, por tanto, usamos
B0* . 4 %% 000 . -0 H B0@ . : . - H. B0@ . : n +
7onde,
4 H
D
lo que corresponde en el sentido de la definicin de probabilidad de Laplace a un caso
posible entre las G
N,n
posibles n?uplas de N elementos de la poblacin. /i el or!en no
interviene, la probabilidad de que una muestra 6E.e
-
,W,e
n
% sea eleida es la suma de
las probabilidades de eleir una cualquiera de sus n?uplas, tantas veces como
permutaciones en el orden de sus elementos sea posible, es decir
'.6%E'.e
-
,W,e
n
%EnYX'.e
-
,...,e
n
%
n , N
&
-
Y N
%Y n N .
Y n % 6 . '
'
% x ,..., x H x . f x e
% x H x . f x e
% x . f x e
aleatorios erimentos exp n E
- n - n n n
- 4 4 4
- - -
,
_
+
,
_
+
000 . -00
@00 X t
-
-0
@00 X t
-
O
El proceso se repite tomando los siuientes n!meros de la tabla de n!meros
aleatorios, hasta obtener la muestra de -0 individuos. Las cantidades uEtH.-0
O
% pueden
ser consideradas como observaciones de una variable aleatoria 1, que siue una
distribucin uniforme en el intervalo Z0,-[
M:to!o !e Montecarlo. El mtodo de 6ontecarlo es una tcnica para obtener
muestras aleatorias simples de una variable aleatoria X, de la que conocemos
su ley de probabilidad .a partir de su funcin de distribucin Q%. &on este
mtodo, el modo de eleir aleatoriamente un valor de 9 siuiendo usando su
ley de probabilidad es+
-. 1sando una tabla de n!meros aleatorios se toma un valor u de una variable
aleatoria.
4. /i 9 es continua tomar como observacin de X, la cantidad xEQ
?-
.u%. En el caso en
que 9 sea discreta se toma x como el percentil -00?u de X, es decir el valor m#s
pequeo que verifica que Q.x%\u
Este proceso se debe repetir n veces para obtener una muestra de tamao n.
E*e#$lo, /i queremos extraer nE-0 muestras de una distribucin N.0,-% podemos
recurrir a una tabla de n!meros aleatorios de OE=cifras, en las que observamos
las cantidades, por e(emplo, B@.4<:, :-.BB@, =0.A0:, B-.-=:, 40.4B-, ::.B-B,
-B.<B<, =4.-4=, *-.::0, <=.-*-
" partir de ellas podemos obtener una muestra de 9]N.0,-% usando una tabla de la
distribucin normal+
N!meros aleatorios 6uestra 1.0,-% 6uestra N.0,-%
t
i
u
i
Et
i
H-0
=
x
i
E Q
?-
.u
i
%
B@.4<: 0.B@ 0.B-
:-.BB@ 0.:4
.E-?0^@A%
?0.*B
=0.A0: 0.=- 0.0:
B-.-=: 0.B- 0.==
40.4B- 0.40
.E-?0^A0%
?0.A*
-A
::.B-B 0.:*
.E-?0^@@%
?0.*-
-B.<B< 0.-A
.E-?0^A4%
?0.<4
=4.-4= 0.=4 0.0=
*-.::0 0.*-
.E-?0^=<%
?0.4:
<=.-*- 0.<= -.@=
2bsrvese que como era de esperar, las observaciones x
i
tienden a aruparse
alrededor de la esperan)a matem#tica de 9
i
]N.0,-%. 'or otra parte, esto no implica
que el valor medio de la muestra sea necesariamente cero. /in embaro como
sabemos por el teorema de Qisher que
-0
- i
i
% - . 0 , 0 . N
N
9
9
su dispersin con respecto al valor central es pequea, lo que implica que
probablemente el valor medio estar# muy prximo a 0, cuyo valor es 0.0-4
2bsrvese que si el problema fuese el inverso, donde !nicamente conocisemos las
observaciones x
i
y que el mecanismo que ener esos datos hubiese sido una
distribucin normal de par#metros desconocidos, con la media obtenida hubisemos
tenido una buena aproximacin del par#metro m desconocido.
Muestreo aleatorio estratiica!o. 1n muestreo aleatorio estratificado es aquel en el
que se divide la poblacin de N individuos, en O subpoblaciones o estratos,
atendiendo a criterios que puedan ser importantes en el estudio, de tamaos
respectivos N
-
, ..., N
O
, tal que NE N
-
L ...LN
O
y reali)ando en cada una de estas subpoblaciones muestreos aleatorios simples de
tamao n
i
, de donde iE-,W,O.
E*e#$lo, /uponamos que reali)amos un estudio sobre la poblacin de estudiantes
de una 1niversidad, en el que a travs de una muestra de -0 de ellos queremos
obtener informacin sobre el uso !e barras !e labios. En primera
aproximacin lo que procede es hacer un muestreo aleatorio simple, pero en
su luar podemos reflexionar sobre el hecho de que el comportamiento de la
poblacin con respecto a este car#cter no es homoneo, y atendiendo a l,
podemos dividir a la poblacin en dos estratos3
? Estudiantes masculinos .@0C del total%8
? Estudiantes femeninos .*0C restante%.
de modo que se repartan proporcionalmente ambos rupos el n!mero total de
muestras, en funcin de sus respectivos tamaos .@ varones y * mu(eres%. Esto es
lo que se denomina asinacin proporcional.
-<
/i observamos con m#s atencin, nos encontramos .salvo sorpresas de probabilidad
reducida% que el comportamiento de los varones con respecto al car#cter que se
estudia es muy homoneo y diferenciado del rupo de las mu(eres. 'or otra parte,
con toda seuridad la precisin sobre el car#cter que estudiamos, ser# muy alta en el
rupo de los varones aunque en la muestra haya muy pocos .pequea varian)a%,
mientras que en el rupo de las mu(eres habr# mayor dispersin. &uando las
varian)as poblacionales son pequeas, con pocos elementos de una muestra se
obtiene una informacin m#s precisa del total de la poblacin que cuando la varian)a
es rande. 'or tanto, si nuestros medios slo nos permiten tomar una muestra de -0
alumnos, ser# m#s conveniente dividir la muestra en dos estratos, y tomar mediante
muestreo aleatorio simple cierto n!mero de individuos de cada estrato, de modo que
se eleir#n m#s individuos en los rupos de mayor variabilidad. "s probablemente
obtendramos me(ores resultados estudiando una muestra de - varn y < hembras.
Esto es lo que se denomina asinacin ptima.
Asi'nacin $ro$orcional. /ea n el n!mero de individuos de la poblacin total que
forman parte de aluna muestra+ nEn
-
LWLn
O.
&uando la asinacin es
proporcional el tamao de la muestra de cada estrato es proporcional al
tamao del estrato correspondiente con respecto a la poblacin total+
n
i
EnXN
i
HN
Asi'nacin $ti#a. &uando se reali)a un muestreo estratificado, los tamaos
muestrales en cada uno de los estratos, n
i
, los elie quien hace el muestreo, y
para ello puede basarse en aluno de los siuientes criterios+
? Eleir los n
i
de tal modo que se minimice la varian)a del estimador, para un coste
especificado, o bien,
? habiendo fi(ado la varian)a que podemos admitir para el estimador, minimi)ar el
coste en la obtencin de las muestras.
"s en un estrato dado, se tiende a tomar una muestra m#s rande cuando+
? El estrato es m#s rande8
? El estrato posee mayor variabilidad interna .varian)a%8
? El muestreo es m#s barato en ese estrato.
'ara a(ustar el tamao de los estratos cuando conocemos la dispersin interna de cada
uno de los mismos, tenemos el siuiente resultado+
Teore#a !e Ne&#an. /ea E una poblacin con N elementos, dividida en O estratos,
con N
i
elementos cada uno de ellos, iE-,W,O
O 4 - O 4 -
N N N N E E E E + + +
/ea n el n!mero total de elementos al reali)ar el muestreo, y que se dividen en cada
estrato como nEn
-
LWLn
O
40
/ea 9 la variable aleatoria que representa el car#cter que intentamos estudiar. /obre
cada estrato puede definirse entonces la variable aleatoria
i
9 como el valor medio
de 9 obtenida en una muestra de tamao n
i
en el estrato E
i
. /ea % 9 . G
i
la varian)a
de dicha variable aleatoria8 Entonces
O
- i
i
% 9 . G
se minimi)a cuando
O
i (
( (
i i
i
s, N
s, N
n n
donde
( )
i
N
- (
4
i i( i
x x
- N
-
s,
es la cuasi?varian)a del estrato E
i
.
Muestreo siste#-tico. &uando los elementos de la poblacin est#n ordenados en
fichas o en una lista, una manera de #uestrear consiste en,
? /ea OENHn8
? Eleir aleatoriamente un n!mero m, entre - y O8
? 3omar como muestra los elementos de la lista+ .e
m
,e
mLO
,e
mL4O
,W,e
mL.n?-%O
%
Esto es lo que se denomina #uestreo siste#-tico. &uando el criterio de ordenacin
de los elementos en la lista es tal que los elementos m#s parecidos tienden a estar m#s
cercanos, el muestreo sistem#tico suele ser m#s preciso que el aleatorio simple, ya
que recorre la poblacin de un modo m#s uniforme. 'or otro lado, es a menudo m#s
f#cil no cometer errores con un muestreo sistem#tico que con este !ltimo.
El mtodo tal como se ha definido anteriormente es sesado si NHn no es entero, ya
que los !ltimos elementos de la lista nunca pueden ser escoidos. 1n modo de evitar
este problema consiste en considerar la lista como si fuese circular .el elemento NL-
coincide con el primero% y+
? /ea O el entero m#s cercano a NHn8
? /e selecciona un n!mero al a)ar m, entre - y N8
? /e toma como muestra los elementos de la lista que consisten en ir saltando de O
elementos en O, a partir de m, teniendo en cuenta que la lista es circular.
/e puede comprobar que con este mtodo todos los elementos de la lista tienen la
misma probabilidad de seleccin.
Muestreo $or con'lo#era!os. /i intentamos hacer un estudio sobre los habitantes
de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, ya que
estudiar una muestra de tamao n implica enviar a los encuestadores a n puntos
distintos de la misma, de modo que en cada uno de ellos slo se reali)a una
entrevista. En esta situacin es m#s econmico reali)ar el denominado
muestreo por conlomerados, que consiste en eleir aleatoriamente ciertos
4-
barrios dentro de la ciudad, para despus eleir calles y edificios. 1na ve)
eleido el edificio, se entrevista a todos los vecinos.
Pro$ie!a!es !eseables !e un esti#a!or. /ea 9 una variable aleatoria cuya funcin
de probabilidad .o densidad de probabilidad si es continua% depende de unos
par#metros
O -
,..., desconocidos. % ,..., , x . f
O -
. Mepresentamos
mediante 9
-
,W,9
n
una muestra aleatoria simple de la variable. 7enotamos
mediante f
c
a la funcin de densidad con(unta de la muestra, que por estar
formada por observaciones independientes, puede factori)arse del siuiente
modo+
% ,..., , x . f X X % ,..., , x . f X % ,..., , x . f % ,..., , x ,..., x . f
O - n O - 4 O - - O - n - c
/e denomina esti#a!or !e un $ar-#etro
i
, a cualquier variable aleatoria
i
,
que
se exprese en funcin de la muestra aleatoria y que tena por ob(etivo aproximar el
valor de q
i
, % 9 ,..., 9 .
,
n - i
,
_
+ +
:
, N
:
% 9 9 9 .
9 % 9 , 9 , 9 .
: 4 -
: 4 - -
Carencia !e ses'o. /e dice que un estimador
,
de un par#metro es insesado si
%
,
. E . La carencia de seso puede interpretarse del siuiente modo+
/uponamos que se tiene un n!mero indefinido de muestras de una poblacin,
todas ellas del mismo tamao n. /obre cada muestra el estimador nos ofrece
una estimacin concreta del par#metro que buscamos. 'ues bien, el estimador
es insesado, si sobre dicha cantidad indefinida de estimaciones, el valor medio
obtenido en las estimaciones es .el valor que se desea conocer%.
Consistencia. 7ecimos que
,
es un estimador consistente con el par#metro si
( ) ( ) -
,
' lim , 0 o 0
,
' lim , 0
n n
< > > >
Teore#a. &omo consecuencia de de la desiualdad de &hebyshev se puede
demostrar el siuiente resultado y condiciones,
0 %
,
. G lim y %
,
. E lim
n n
entonces
,
es consistente.
Eiciencia. 7ados dos estimadores
4 -
,
y
,
de un mismo par#metro
,
, diremos
que
-
,
es m#s eficiente que
4
,
si %
,
. G %
,
. G
4 -
<
Suiciencia. 7iremos que % 9 ,.., 9 .
, ,
n -
es un estimador suficiente del par#metro
,
si % x 9 ,..., x 9 . '
n n - -
no dependa de para todo posible valor de
.
Teore#a !e ;is/er1Ne&#an. /ea % , x ,..., x . f
n -
la distribucin con(unta para las
muestras de tamao n, 9
-
,W,9
n
. Entonces % 9 ,.., 9 .
, ,
n -
es un estimador
suficiente si y solo si se cumple,
( ) %, 9 ,..., 9 .
,
r X % x ,..., x . h % , x ,..., x . f
n - n - n -
, siendo h una funcin
no neativa que no depende de y r una funcin que slo depende del
par#metro y de la muestra a travs del estimador.
CUR%A CARACTER<STICA Y ;UNCIN 8E POTENCIA
4:
'ara calcular el error tipo ;; o se debe especificar la hiptesis alternativa como una
hiptesis simple. /in embaro, en la mayora de los casos, esta hiptesis se plantea
como compuesta. "l plantearse la hiptesis alternativa como compuesta, no se puede
calcular el error tipo ;; asociado con la prueba. /in embaro, para obviar esta
dificultad lo que se hace es asinarle varios valores a la hiptesis alternativa, calcular
el error tipo ;; y reali)ar una curva con estos valores. Esta curva recibe el nombre de
U&urva &aracterstica 2perativa o &urva 2&U, y es muy empleada principalmente en
estudios de control de calidad.
&onsidrese la hiptesis alternativa de la siuiente manera+
>o+ E
0
E -0 >
-
+ _
0
n E <, E 0.0=
La rein crtica de esta prueba est# en c E -0.=*A, es decir, se recha)a >
0
E -0 si la
media de la muestra es mayor de -0.=*A. 'ara construir la curva 2& se presentan en
la tabla siuiente diferentes valores de la hiptesis alternativa con sus respectivas
probabilidades de aceptacin.
<.@ <.A -0.0 -0.4 -0.* -0.@ -0.A --.0 --.4 --.* --.@
0.<<
A
0.<A
A
0.<=
0
0.A=
4
0.@B
4
0.*:
A
0.44
=
0.0A
A
0.04
=
0.00
=
0.00-
La siuiente es la &urva &aracterstica 2perativa . vs % de la prueba de hiptesis
planteada.
/i se tiene la hiptesis nula >
o
+ E
0
contra la hiptesis alternativa >
-
+ E
-
el valor
del error tipo ;; se obtiene como una funcin de los valores alternativos de ba(o >
-
,
es decir, para cada valor de
-
se calcula , valor que a veces denotamos por .%. La
r#fica vs .% recibe, como ya se di(o, el nombre de &urva &aracterstica
2perativa, &urva 2&, o curva &2.
4*
Mecordemos que .) es la probabilidad de aceptar la hiptesis nula >0 cuando la
verdadera es la hiptesis alternativa >
-
. 'or lo tanto, -?.% representa la probabilidad
de recha)ar la hiptesis nula cuando la verdadera es la hiptesis alternativa, es decir,
representa la probabilidad de recha)ar hiptesis falsas. /in embaro, en la mayora de
estudios diferentes a los de control de calidad, en ve) de la curva caracterstica
operativa se emplea la r#fica denominada UQuncin de 'otenciaU, donde se rafica
vs -?. %.
;uncin !e Potencia !e una $rueba. La funcin '.% E -?.% recibe el nombre de
funcin de potencia, y representa la probabilidad de recha)ar la hiptesis nula cuando
sta es falsa, es decir, mide la probabilidad de recha)ar hiptesis falsas.
El valor de la potencia es -? y puede interpretarse como la probabilidad de recha)ar
de manera correcta una hiptesis falsa. La potencia es una medida muy descriptiva y
concisa de la sensibilidad de una prueba estadstica, donde por sensibilidad se
entiende la capacidad de una prueba para detectar diferencia. &onsidere la siuiente
prueba de hiptesis+
>
o
+ E
0
E -0 >
-
+ _
0
n E <,` E 0.0=, S E -.
&onsidere tambin las siuientes reiones crticas+
"+ Mecha)ar >
o
si _ -0.@= a+ Mecha)ar >
o
si _ -0.*=
'ara calcular .% es necesario darle valores a , y de ah calcular la potencia -?
.%.'.% E '. _cH E
-
% E -?.%
Las tablas siuientes presentan los valores de los errores tipo ;; y de la potencia para
las pruebas planteadas.
'otencia de la prueba '.%
-0.0 -0.4 -0.* -0.@ -0.A --.0 --.4 --.* --.@ --.A
'rueba
"
0.04@ 0.0A< 0.44B 0.**0 0.@B* 0.A=: 0.<=- 0.<AA 0.<<A -.000
'rueba a 0.0A< 0.44B 0.**0 0.@B* 0.A=: 0.<=- 0.<AA 0.<<A -.000 -.000
Error tipo ;; .%
-0.0 -0.4 -0.* -0.@ -0.A --.0 --.4 --.* --.@ --.A
'rueba
"
0.<B* 0.<-- 0.BB: 0.=@0 0.:4@ 0.-*B 0.0*< 0.0-4 0.004 0.000
'rueba a 0.<-- 0.BB: 0.=@0 0.:4@ 0.-*B 0.0*< 0.0-4 0.004 0.000 0.000
ESTIMACIN CON;I8ENCIA)
4=
La esti#acin coni!encial consiste en determinar un posible rano de valores o
intervalo, en los que pueda precisarse ??con una determinada probabilidad?? que el
valor de un par#metro se encuentra dentro de esos lmites. Este par#metro ser#
habitualmente una proporcin en el caso de variables dicotmicas, y la media o la
varian)a para distribuciones aussianas.
)a t:cnica !e la esti#acin coni!encial consiste en asociar a cada muestra un
intervalo que se sospecha que debe contener al par#metro. " ste se le denomina
inter+alo !e conian(a. Evidentemente esta tcnica no tiene porqu dar siempre un
resultado correcto. " la probabilidad de que hayamos acertado al decir que el
par#metro estaba contenido en dicho intervalo se la denomina ni+el !e conian(a.
3ambin se denomina ni+el !e si'niicacin a la probabilidad de equivocarnos.
Esti#acin Puntual. La inferencia estadstica est# relacionada con los mtodos para
obtener conclusiones o enerali)aciones acerca de una poblacin. Estas conclusiones
sobre la poblacin pueden estar relacionadas con la forma de la distribucin de una
variable aleatoria, con los valores de uno o varios par#metros de la misma.
El campo de la inferencia estadstica se divide en dos+ 'or un lado tenemos el
problema de la estimacin de los par#metros de una distribucin, y por el otro, las
pruebas de hiptesis. En el problema de estimacin se trata de eleir el valor de un
par#metro de la poblacin, mientras que en las pruebas de hiptesis se trata de decidir
entre aceptar o recha)ar un valor especificado .por e(emplo, si la marca " es superior
a la marca a%.
" su ve) el problema de la estimacin se puede dividir en dos #reas+ La estimacin
puntual, y la estimacin por intervalos de confian)a. En forma similar, en el campo de
4@
las pruebas de hiptesis se pueden considerar dos #reas+ 'ruebas de hiptesis sobre
par#metros, para determinar si un par#metro de una distribucin toma o no un
determinado valor, y 'ruebas de aondad de "(uste, para definir si un con(unto de
datos se puede modelar mediante una determinada distribucin.
;nferencia Estadstica Estimacin 'untual
;ntervalos de &onfian)a
'ruebas de >iptesis /obre 'ar#metros
/obre 7istribuciones
En este captulo trataremos el problema de la estimacin .mediante un solo valor% de
los par#metros de una distribucin, y en el captulo siuiente la estimacin de
par#metros mediante un intervalo, denominado intervalo de confian)a.
Esti#acin. En el problema de estimacin se trata de eleir el valor de un par#metro
de la poblacin, se!n una estrateia de la naturale)a.
Esti#acin $untual. La estimacin puntual consiste en utili)ar el valor de una
estadstica o un valor estadstico para calcular el par#metro de una poblacin. 'or
e(emplo, cuando usamos la media muestral x para estimar la media de una
poblacin .%, o la proporcin de una muestra ' para estimar el par#metro de una
distribucin binomial .
1na esti#acin $untual de al!n par#metro de una poblacin es un solo valor
. Es decir,
E 3 E t.9
-
,9
4
,...,9
n
%
Los estimadores son variables aleatorias, y por lo tanto tienen una funcin de
densidad, correspondiente a las distribuciones mustrales. 'or lo tanto, no hay nin!n
estimador perfecto, ya que siempre habr# al!n error en el proceso de estimacin.
/e!n lo anterior, deben estudiarse distintas propiedades estadsticas de los
estimadores para decidir cual es el m#s apropiado. "lunas de las propiedades a
estudiar corresponden al seso, mnima varian)a, consistencia, eficiencia relativa y
suficiencia.
'ara tratar de responder intuitivamente qu es un buen estimador, considere tres
productos ", a y & para los cuales se hacen proyecciones de demanda. /upona que
4B
al anali)ar la informacin histrica de cada producto, se calcula la diferencia entre el
pronstico y el valor real para cada producto, y sus distribuciones resultantes son las
siuientes+
"+ El mtodo usado para pronosticar la demanda de " es el que me(or hace su
traba(o, ya que queda m#s cerca del valor real y tiene una menor varian)a.
a+ /u pronstico es aproximadamente iual al valor real, pero tiene una mayor
varian)a.
&+ 'eor proyeccin ya que sobrestima la demanda.
En conclusin, si se desea estimar una par#metro , entonces el estimador debe estar
distribuido alrededor de , y tener mnima varian)a. /ea 9
1
,9
2
,...,9
n
una muestra
aleatoria proveniente de una poblacin cuya funcin de densidad es f.x, %. /ea 3 E
t.9
1
,9
2
,...,9
n
% un estadstico usado para estimar el par#metro . Nuestro problema
consiste en encontrar la Ufuncin tU que proporcione la #e*or esti#acin del
par#metro .
PROPIE8A8ES 8E )OS ESTIMA8ORES
Esti#a!ores inses'a!os. &omo no hay nin!n estimador perfecto que de siempre la
respuesta correcta, debera hacerlo por lo menos en promedio. El valor esperado del
estimador debera ser iual al par#metro que trata de estimar. En caso de que lo sea,
se dice que el estimador es inses'a!o, en caso contrario se dira que es sesado.
8einicin. 1n estadstico 3 es un estimador insesado del par#metro si y solo si
E.3%E```` para todo . En caso contrario decimos que es un esti#a!or ses'a!o.
4A
Ses'o. /i 3 es un estimador sesado, la diferencia E.3% ? recibe el nombre de seso.
E*e#$lo. La media muestral es un estimador insesado de la media poblacional
ya que E. %E.
E*e#$lo. 3E9
-
es un estimador insesado de ya que E.9
-
%E
E*e#$lo. /i 9 es ainomial .n,%, demostrar que 9Hn es un estimador insesado del
par#metro .
/olucin. /ea
,
_
n
n
-
% 9 . E
n
-
n
9
% ' . E
n
9
'
por lo tanto es insesado
E*e#$lo. /ea 9
-
, 9
4
,..., 9
n
una muestra aleatoria con E.9
i
%E. 7emostrar que si
N
- i
i
- a entonces 3 E a
-
9
-
L a
4
9
4
L...La
n
9
n
es un estimador insesado de .
E(emplo+ /i /S es la varian)a de una muestra tomada al a)ar de una poblacin infinita,
entonces /S es un estimador insesado de S. 'reviamente habamos demostrado que
E./S% E S.
E*e#$lo. /i
( )
4
n
- i
i
4
9 9
n
-
G
, ser# un estimador insesado de SJ. /e puede
demostrar que
4 4
n
- n
% G . E
E*e#$lo. /ea
( )
4
n
- i
i
4
9
n
-
b
, ser# un estimador insesado de S si es un
par#metro conocidoJ.
E*e#$lo. /er#
( )
4
n
- i
i
4
9 9
- n
-
/
E 9
:
E -=.B.
Es 3
-
un estimador insesado de J. / puede demostrar que
- n
n
% 3 . E
-
El seso b est# dado por
- n +
. &onsidere
% 9 , , 9 . 6ax
n
- n
3
n - 4
+
. Es 3
4
un
estimador insesado de J /i se tienen varios estimadores insesados de un par#metro
por lo eneral se escoe el que tena la menor varian)a.
Esta!"sticos !e or!en. /ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de tamao n. Los
valores se presentan de acuerdo al orden en que son tomados. /upona que la muestra
se ordena de menor a mayor. /ea 9.-% el menor valor de la muestra, sea 9.4% es
seundo valor, 9.i% el valor que ocupa el puesto i al ordenar la muestra de menor a
mayor, y finalmente sea 9.n% el mayor valor de la muestra. Esta muestra ordenada,
9.-%, 9.4%,..., 9.i%,..., 9.n% recibe el nombre de Uestadsticos de ordenU. 7e acuerdo
con lo anterior, los estadsticos 3
-
y 3
4
formulados en el p#rrafo anterior se pueden
reformular como+
3
-
E 9.n%
n
1 n
T
2
+
Los estadsticos de orden son variables aleatorias, y como tales tienen una funcin de
densidad, y se pueden usar para estimar los par#metros de las distribuciones.
Esti#a!ores con #"ni#a +arian(a. /i 3
-
y 3
4
son dos estimadores insesados con
varian)as G.3
-
%y G.3
4
%, respectivamente, y G.3
-
% K G.3
4
%, se dice que 3
-
es m#s
eficiente que 3
4
.
/ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de tamao n. /abemos que tanto 9como 9-
son estimadores insesados de . /in embaro es m#s eficiente que 9
-
para estimar
ya que G. 9% E SHn K G.9-% E S.
Eiciencia Relati+a. Los estimadores insesados suelen compararse en trminos de
sus respectivas varian)as. /i 3
-
y 3
4
son dos estimadores insesados de un par#metro
y la varian)a de 3
-
es menor que la varian)a de 3
4
, se dice que 3
-
es m#s eficiente
que 3
4
. 3ambin se puede usar la siuiente relacin G.3
-
%HG.3
4
% para medir la
eficiencia relativa de 3
4
con respecto a 3
-
.
:0
E*e#$lo. "l calcular la media de una poblacin normal sobre la base de una muestra
de tamao 4nL-, Icu#l es la eficiencia de la mediana con relacin a la mediaJ
/e sabe que la varian)a de la media 9 est# dada por SH.4nL-%. 'ara una muestra
aleatoria de tamao 4nL- de una poblacin normal se sabe que el valor esperado y la
varian)a de la mediana est#n dados por+
n *
% 9
]
. G
]
% 9
]
. E
4
La eficiencia relativa est# dada por+
La eficiencia asinttica de la mediana con respecto a la media est# dada por+
la media muestral es un estimador m#s eficiente de la media poblacional que la
mediana muestral.
La media requiere slo el @*C de las observaciones que requiere la mediana para
estimar la media poblacional con la misma confiabilidad. Estimador insesado de
mnima varian)a. 'ara saber si un estimador insesado es de mnima varian)a o con
seso mnimo, se usa la desiualdad de &r#mer?Mao, dada en el siuiente teorema.
Teore#a. /i 3 es un estimador insesado de y
4
% , x . f ln
nE
-
% 3 . G
,
_
4
. &omo la varian)a del estimador no tiende a cero, entonces no es consistente, lo
cual se puede verificar al aplicar la desiualdad de &hebyshev, que expresa lo
siuiente+
la cual no tiende a cero cuando n , es decir, que 9
-
no tiende a cuando n es
rande.
'roblema. 7emostrar que la proporcin muestral ' E 9Hn es un estimador consistente
de la proporcin poblacional `.
E*e#$lo. 7emostrar que /S es un estimador consistente de S cuando se toman
muestras de una poblacin normal.
/olucin+ /abemos que+
E./S% E S
/e observa que G./S% 0 cuando n .
E*e#$lo. 7emuestre que es un estimador consistente de S.
Esti#a!ores suicientes. /e dice que un estimador 3 es suficiente si utili)a toda la
informacin relevante de la muestra para estimar el par#metro de la poblacin. Es
:*
decir, un estimador 3 es suficiente si todo el conocimiento que se obtiene acerca del
par#metro es mediante la especificacin real de todos los valores de la muestra.
E*e#$lo. /e tiene una muestra aleatoria .9
-
, 9
4
, ..., 9
n
% de tamao :0 tomada de una
poblacin exponencial f.x, %, donde es un par#metro desconocido. &onsidere las
dos estadsticos siuientes+
:0 : 4 -
4
4< = : -
-
9 9 9 9
-
3
9 9 9 9
-
3
+ + + +
+ + + +
El estadstico 3
-
no es un estimador suficiente del par#metro ` mientras que 3
4
s lo
es.
8einicin. /e dice que un estadstico 3 E t.9
-
, 9
4
, ..., 9
n
% es suiciente para un
par#metro si la distribucin con(unta de 9
-
, 9
4
, ..., 9
n
dado 3 se encuentra libre de
, es decir, si se afirma 3, entonces 9
-
, 9
4
, ..., 9
n
no tienen nada m#s que decir acerca
de .
Qormalmente esto puede expresarse en trminos de la distribucin condicional de los
valores de la muestra, dado que E 3. Esta cantidad est# dada por,
% t .
% x ,.., x . f
% t .
% t , x ,.., x . f
% t H n 9 ,..., 9 . f
n - n -
N -
donde la expresin final del numerador se siue de la condicin de suficiencia.
Utili!a!. /i un estimador insesado 3 de un par#metro es una funcin de un
estadstico suficiente, entonces tendr# la varian)a m#s pequea entre todos los
estimadores insesados de . "dem#s, si existe el estimador m#s eficiente de , ste
ser# un estadstico suficiente.
Teore#a de factori)acin de Ne&#an. /ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de
una distribucin con funcin de densidad f.x,%. /e dice que el estadstico 3 E t.9
-
,
9
4
, ..., 9
n
% es un estadstico suficiente para si y solo si la funcin de verosimilitud se
puede factori)ar de la siuiente manera+
L.9,% E h.t, % .x
-
, x
4
, ..., x
n
%
para cualquier valor t.x
-
, x
4
, ..., x
n
% de 3 y donde .x
-
, x
4
, ..., x
n
% no contiene el
par#metro .
E*e#$lo. /ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de tamao n de una distribucin
ama, cuya funcin de densidad est# dada por,
% O .
% t .
e % t . f
- O
t
, t\0
:=
La funcin de verosimilitud est# dada por+
% O .
t t e
% , 9 . L
n
- i
n
- i
i i
nO
E*e#$lo. /ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de tamao n de una distribucin de
'oisson con par#metro cuya funcin de densidad est# dada por,
Y x
e
% t . f
x
es el
estimador m#ximo verosmil de y %
,
. es una funcin biunvoca de ,
entonces
%
,
.
mv
es
funcin de la muestra a travs de
,
8
*. /on asintticamente normales8
=. /on asintticamente eficientes, es decir, entre todos los estimadores consistentes
de un par#metro , los de m#xima verosimilitud son los de varian)a mnima.
@. No siempre son insesados.
Al'unos esti#a!ores un!a#entales. Gamos a estudiar las propiedades de ciertos
estimadores que por su importancia en las aplicaciones resultan fundamentales+
:B
estimadores de la esperan)a matem#tica y varian)a de una distribucin de
probabilidad.
Esti#a!or !e la es$eran(a #ate#-tica. &onsideremos las muestras de tamao n,
9
-
,W,9
n
, de un car#cter sobre una poblacin que viene expresado a travs de
una variable aleatoria 9 que posee momentos de primer y seundo orden, es
decir, existen E.9% y G.9%+
E.9
i
%E G.9
i
%E
4
El estimador #e!ia #uestral que denotaremos normalmente como 9 .en luar de
,
es
% 9 9 .
n
-
9
n -
+ +
verifica+
n % 9 . G % 9 . E
4
'or tanto es un estimador insesado. /i adem#s sabemos que 9 se distribuye se!n
una ley aussiana, es sencillo comprobar que coincide con el estimador de m#xima
verosimilitud,
Pro$osicin. ( ) n H , N 9 % , . N 9
mv i
La demostracin es, La funcin de densidad de una observacin cualquiera de la
muestra es+ 9i]N.,% para todo x que pertene)ca al con(unto de los reales.
'or tanto la distribucin con(unta de la muestra es
% , , x . f % , , x . f % , , x . % , 8 x ,.., x . f
4
n
4
4
4
-
4
n - c
'ara unos valores x
-
,W,x
n
fi(ados, la funcin de verosimilitud es
( ) ( ) ( )
4
i
n
- i
4 4
n
4 4
4
4 4
-
x
4
- n
4 H x 4 H x 4 H x 4
4
n
4
4
4
-
4
e
4
-
e
4
-
X X e
4
-
X e
4
-
% , . G
% , , x . f % , , x . f % , , x . % , . G
,
_
,
_
,
_
:A
El m#ximo de la funcin de verosimilitud se alcan)a donde lo hace su loaritmo
.monotona%, por tanto derivando con respecto a
,
_
n
- i
n
- i
mv i
4
mv i
4
4
mv
n x
-
x
n
% , .
G lo
0
Es decir, el estimador m#ximo verosmil de la media poblacional, , coincide con la
media muestral
n
- i
i mv
x
n
-
como queramos demostrar
El estimador de m#xima verosimilitud de para una variable aussiana es la media
muestral.
La distribucin del estimador muestral 9 del par#metro poblacional , tiene por
valor esperado al mismo .insesado%, y su dispersin disminuye a medida que
aumenta el n!mero de observaciones
:<
Esti#a!or !e la +arian(a. " la hora de eleir un estimador de
4
EG.9%, podemos
comen)ar con el estimador m#s natural+
( )
n
- i
4
i
4
9 x
n
-
s
'odemos comprobar que cuando el car#cter que se estudia sobre la poblacin es
aussiano, en realidad este es el estimador m#ximo verosmil para la varian)a. /in
embaro se comprueba tambin su falta de seso, lo que hace mas adecuado que se
utilice como estimador de la varian)a al siuiente concepto+ cuasivarian)a muestral
Pro$osicin. >i?N@,A, entonces,
4
mv
4
, s
7emostracin+ Mecuperamos el loaritmo de la funcin de verosimilitud, donde en
esta ocasin el primer par#metro ya fue obtenido por el mtodo de m#xima
verosimilitud .y vimos que era la media muestral% y tratamos de maximi)arla con
respecto al seundo par#metro+
( ) ( )
4
n
- i
i
4
4 4
x x
4
-
lo % 4 lo.
4
n
% , x . G lo
+
7erivando con respecto a
4
e iualando a cero se obtiene el estimador m#ximo
verosmil+
( )
,
_
n
- i
4
i
4
4
mv
4
mv
4
mv
4
x x
,
-
4
-
4
n
% , , .
G lo
0
7espe(ando de esta ecuacin se obtiene que el estimador m#ximo verosmil coincida
con la varian)a muestral,
n
- i
4
i
4
mv
% x x .
4
-
,
Pro$osicin. El valor esperado del estimador
n
- i
4
i
4
% 9 9 .
n
-
s
no es
4
, y por tanto el estimador m#ximo verosmil para la varian)a no es insesado.
6#s a!n, E.
4
%E.n?-%
4
Hn
7emostracin. &omen)amos escribiendo los valores esperados
*0
,
_
,
_
n
- i
4 4
i
n
- i
4 4
i
n
- i
4
i
4
% 9 . E % 9 . E
n
-
9 9
n
-
E % 9 9 .
n
-
E % s . E
4
4
4
i
4
i
4
i
4 4 4
i
4
i
4
i i
n
% 9 . E % 9 . E % 9 . E % 9 . G
% 9 . E % 9 . E % 9 . E % 9 . G
+
+
Lueo
,
_
+
n
- i
4 4
4
4 4 4
n
- n
n
% .
n
-
% s . E
Cuasi+arian(a #uestral. 'ara tener un estimador insesado de la varian)a
introducimos la cuasivarian)a muestral
4
s, que se define como
n
- i
4
i
4 4
% 9 9 .
- n
-
s
- n
n
s,
Es inmediato comprobar que realmente este estimador es insesado
4 4 4 4
n
- n
- n
n
s
- n
n
E % s, . E
,
_
Esa esperan)a puede ser calculada de un modo m#s directo, ya que la distribucin del
estimador
4
es conocida usando el teorema de &ochran+
,
_
n
- i
4
- n
4
i
4
4
9 9 ns
lueo
*
4
4
4
4
4 4
4
4
n
% - n . 4
% s . G % - n . 4
ns
G
n
- n
% s . E - n
ns
E
,
_
,
_
Teore#a+ /ean 9
-
,...,9
:
variables aleatorias que tienen una distribucin con(unta
absolutamente continua, la condicin suficiente y necesaria qpara que sean
independientes es que la densidad con(unta de ellas sea,
f x x f x
X X n
j
n
X j
n j 1
1
1
,...,
( ,..., ) ( )
x
$ H 9 $ H 9
dt % y H t . f % y H x . Q
Teore#a+ /i 9 y $ son variables aleatorias que tiene una distribucin con(unta
absolutamente continua, entonces, en todo punto .x,y% en el que f
9,$
.x,y% sea continua
y, adem#s, sea f
$
.y%_0 continua, existe una densidad condicionada de 9 dada $,
% y . f
% y , x . f
% y H x . f
$
$ , 9
$ H 9
7ensidades de funciones de variables aleatorias. /ean las variables aleatorias 9
-
,...9
n
que tienen distribucin con(unta absolutamente continua, y es necesario calcular la
densidad de una variable aleatoria $ que es funcin de 9
-
,...,9
n
, siendo ella suma de
stas. /ea
S E
n
( )
un con(unto incluido en el espacio Euclideo E de dimensin n, el
cual se define como
*4
e a % x ,... x . u ,..., a % x ,..., x . u % x ,..., x d. /
n n - n - n - - n -
con a
i
constantes. Las probabilidades
/
n - n - x ,..., 9 n -
dx ... dx % x ,..., x . f ... [ / % 9 ,..., 9 Z. '
n -
$ sea que el determinante del gacobiano no sea nulo para (u ,..., )
1
u
n
, siendo
e n i - , b % u ,..., u . x a % u ,... u d.
i n - i i n -
n
n
4
n
-
n
n
4
4
4
-
4
n
-
4
-
-
-
n -
n -
u
x
...
u
x
u
x
... ... ... ...
u
x
...
u
x
u
x
u
x
...
u
x
u
x
% u ... u .
% x ,.., x .
cos r sen
rsen cos
% , r .
% y , x .
Er,
para nE4, u
-
Er, u
4
E , x
-
E9Ercos , x
4
EyErsen , y por consiuiente,
cos r
y
y sen
r
y
, rsen
x
, cos
r
x
y por tanto se tendr#
-
-
4
4
b
a
M
b
a
rdrd % rsen , cos r . > dxdy % y , x . >
de donde
{ }
4 4 - -
b rsen a , b cos r a % , r . M
Teore#a+ /ean 9
-
,...,9
n
variables aleatorias que tienen una distribucin con(unta
absolutamente continua, y sean u
-
.x
-
,...,x
n
%,...,u
n
.x
-
,...,x
n
% una aplicacin en el espacio
E
.n%
en s mismo que satisface a las condiciones exiidas en el teorema anterior con
cambio de variables en las interales m!ltiples. /ea 1
i
Eu
i
.9
-
,..,9
n
%, Entonces,
1
-
,...,1
n
tiene distribucin con(unta absolutamente continua y densidad,
*:
( )
% u ,..., u .
% x ,..., x .
% u ,.., u . x %,..., u ,.., u . x f % u ,.., u . f
n -
n -
n - n n - - 9 ,.., 9 n - 1 ,..., 1
n - n -
Teore#a+ /ean 9
-
,...,9
n
variables aleatorias independientes, cada una de ellas con
una distribucin absolutamente continua, y sean r
-
,...,r
O
, O enteros positivos, tales que,
r
-
L...Lr
O
En. Entonces, la O variables aleatorias
n - r n r r - r r -
9 ... 9 ,..., 9 ... 9 , 9 ... 9
O 4 - - -
+ + + + +
+ + +
son independientes.
ESTIMACIN PUNTUA)
/ea un con(unto fundamental de probabilidades asociado con una sima ? alebra
de sucesos w y probabilidad ', y se tendr# en 9 una variable aleatoria definida sobre
.
( ) n
est# constituido por todos los posibles .h
-
,...,h
n
% para todas las elecciones
posibles h
-
,...,h
4
en . /e traba(ar# con h
.n%
al elemento de
( ) n
El sima ? anillo
( ) n
, entonces para toda A A
n 1
,.., , se
define,
A A w w A w A
n
n n
n n 1 1 1
{ ,..., }
( ) ( )
que contienen a
% n .
, esto sinifica que
% n .
son
la interseccin de todos los sima anillos de subcon(untos de
% n .
que contienen a
% n .
. 'or lo anterior solo hay que demostrar,
? La interseccin de cualquier sima i anillo de
% n .
es un sima ? anillo
? El con(unto de sima i anillos que contienen a
% n .
no es vaco
Lema+ /ea d
( ) n
, entonces,
es un sima i anillo.
**
2tro problema importante, es definir la probabilidad '
.n%
sobre
( ) n
, y para cada
suceso rectanular en
( ) n
, A A
n 1
lo que se define como
n
- i
i n -
% n .
% " . ' % " " . '
"l tomar una muestra con restitucin, permite mane(ar elementos independientes,
entonces,
( ) % " . ' " '
i
% n .
i , i % n .
. Esto es,
n
- i
i n -
% n .
% " . ' % " " . '
Teore#a+ Las funciones 9
-
,..,9
n
definidas sobre
( ) n
como se ha explicado
anteriormente, son variables aleatorias independientes entre s y cada una con la
misma funcin que 9
Las variables aleatorias 9
-
,..,9
n
independientes e idnticamente distribuidas, indica
que en n observaciones de la variable 9 no uardan relacin entre s.
/i tomamos la muestra sin restitucin de elementos de , cada n?upla h
.n%
vendra
constituida por n elementos procedentes de la poblacin , entonces
( ) n
sera el
con(unto de estas n?uplas.
/ea la sucesin infinita 9
-
,..,9
n
de variables aleatorias, como observaciones
independientes,
% .
n -
% .
,...% h ,.., h . h
y se define
( ) % h . 9 h 9
n n
% .
n
( ) n
.
1na variable aleatoria 1 es una estimacin I#$arcial de , sui la esperan)a de 1
existe y es EZ1[E , cualquiera sea el valor de este par#metro+ EZ1H [E
1na sucesin d1
n
e es Consistente de estimaciones de la constante , si U
n
P
,
cualquiera sea . En otras palabras,
[ ] n para , 0 1 '
n
, con
> 0,
*=
Teore#a+ /ea una poblacin y 9 una variable aleatoria observada definida sobre
la misma poblacin, la cual tiene distribucin discreta o absolutamente continua y
donde existe el seundo momento de orden finito. /i 9
-
,..,9
n
son n observaciones
independientes de 9 y s 9E.9
-
L...L9
n
%Hn, entonces, 9
n
es una estimacin imparcial y
consistente de EZ9[
Teore#a+ 3anto
n
2
como s
n
2
son estimaciones consistentes de GarZ9[. 7emostrar
que s
n
2
es una estimacin imparcial de GarZ9[, pero no
n
2
, siendo GarZ9Z una
estimacin imparcial.
Teore#a+ /ea 1
n
una variable aleatoria definida sobre
( ) n
, y suponamos que ella
es una estimacin imparcial de y adem#s que EU
n
[
2
< . /i G
-
,G
4
,... es una
sucesin de observaciones independientes de 1
n
, y sea D
n
E.G
-
L...G
n
%Hn para todo n,
entonces la sucesin dD
n
e es una sucesin consistente de
/ea una poblacin y sean liadas a ella una serie de constantes
1
,...,
!
que est#n
por conocerse, y no se pueden medir directamente, entonces, sea 9 una variable
aleatoria definida sobre la poblacin de tamao n, y d9
n
e es una sucesin de
observaciones independientes de 9, y sobre la cual conocemos la distribucin
% H x . Q
i 9
. El problema consiste en hallar las estimaciones.
El ran problema reside, y para ello traba(emos con dos variables desconocidas
1 2
,
, en que se debe suponer que
< [ 9 Z E
*
y que se conocen los dos primeros
momentos m
-
y m
4
y que son funciones de
1 2
" . "dem#s hay que suponer que
n
- O
4
' 4
O n -
'
n
m 9
n
-
G y m 9
y por !ltimo, que las funciones
1 2
( , ) ( , ) x " " x " son tales que
% m , m . % G , 9 . y % m , m . % G , 9 .
4 - 4
'
n n 4 4 - -
'
n n -
,
con lo cual finalmente se demuestra que,
{ } { } % G , 9 . y % G , 9 .
n n 4 n n -
son
sucesiones consistentes de estimaciones de
1 2
" , respectivamente.
Teore#a+ /ea f.x,y% una funcin y sean d9
n
e y d$
n
e unas sucesiones de las variables
aleatorias tales que
b y$ a 9
'
n
'
n
, siendo a y b constantes, entonces, f es continua
en .a,b% y si f.9
n
,$
n
% es variable aleatoria para cualquier n, entonces,
*@
( ) % b , a . f $ , 9 f
'
n n
Esti#acin !e %arian(a M"ni#a. 3raba(ando con la distribucin de 'oisson como
e(emplo. /ea 9 una variable aleatoria definida sobre una poblacin , con
distribucin de 'oisson
... - , 0 x , Y x H e [ x 9 Z '
x
,
siendo > 0 la constante desconocida, entonces al reali)ar n pruebas independientes
de 9, sean 9
-
,...,9
n
y a partir de ellas hacer la estimacin de esta variable.
/e calcula EZ9[ y EZ9
4
[ y se tienen unos valores de y
4
L , de donde la varian)a
resulta ser , y por tanto, X
n
como s
n
2
son estimadores consistentes e imparciales
de
/ea 9 una variable aleatoria definida sobre la poblacin y sean 9
-
,...,9
n
sus n
observaciones independientes, y suponamos que la funcin de distribucin de 9 es
absolutamente continua .lo cual es v#lido para el caso discreto%, entonces la funcin
f
9
.x% es la densidad de 9 que es de una variable desconocida , f.xH %.
'ara traba(ar con un e(emplo, sea
X # ( , ) 01
, entonces la funcin de densidad puede
ser, < <
,
_
x ,
4
% x .
- exp
4
-
% H x . f
4
/ea
.9
-
,...,9
n
% una estimacin imparcial de . $ adem#s, para mnima varian)a
de lo anterior se debe cumplir+ El con(unto " de todos los valores posible de mes
un intervalo abierto, acotado o no8
f x ( / )
debe existir para todo < < x 8 las
expresiones
,
_
n -
n
- i
i
dx ... dx % H x . f ...
y
,
_
n -
n
- i
i n -
dx ... dx x . f % x ,..., x .
,
...
puedan derivarse ba(o el sino interal con respecto a 8 y finalmente,
<
,
_
4
% 9 . Lof
E
para todo A
Teore#a. .7esiualdad de &ramer i Mao%+ &on las hiptesis mencionadas
anteriormente, demostrar,
*B
( )
4
n -
"
% 9 . Lof
E
n
-
% 9 ,..., 9 .
,
Gar
,
_
,
teniendo en cuanta que el sino iual solo es v#lido cuando exista una constante O,
que depende de y n, tal que la probabilidad
4
n
- O
O
% 9 . Lof
E
n
-
% 9 . Lof
,
_
Princi$io !e M-2i#a Probabili!a!. /ea 9 una variable aleatoria definida sobre una
poblacin con una distribucin discreta o absolutamente continua. /ea f.xH % la
densidad dependiente de x y de desconocido. El problema es estimar . /ean
9
-
,...,9
n
observaciones de 9 con una densidad con(unta f.x
-
,...,x
n
H %
/e debe procurar siempre encontrar una estimacin .9
-
,...,9
n
% de para la cual
f.9
-
,...,9
n
H % sea m#ximo. En la pr#ctica es hallar como una funcin de x
-
,...,x
n
% 9 ,..., 9 .
,
n -
para qua la funcin f.x
-
,...,x
n
H % resulte maximi)ada y entonces se
sustituyen las observaciones.
Teore#a+ /upuestas las condiciones impuestas en al numeral anterior, relativo ala
estimacin de la varian)a, si % 9 ,..., 9 .
,
n -
es una estimacin imparcial de con
varian)a mnima en el sentido dela desiualdad de &ramer i Mao, entonces,
% 9 ,..., 9 .
,
n -
es una estimacin de % 9 ,..., 9 .
,
n -
con m#xima probabilidad.
/ea 9 una variable aleatoria discreta o continua cuya funcin de probabilidad f.x%
depende de un par#metro . /e efect!a n veces un experimento y se obtiene x
-
,...,x
n
resultados independientes
La probabilidad de que la muestra conste de n elementos es % x . f % x . f
n -
y en
el caso continuo de que la muestra conste de pequeos valores
,... x x x x , x x x x
4 4 - -
+ + es
n
4 -
% x . x % x . xf % x . f
/ est#n dados y son fi(os los x
-
,x
4
,... entonces es una funcin de y es la funcin
de verosimilitud
/e trata de escoer la aproximacin para , para que sea tan pequeo como sea
posible .el cual debe ser derivable%,
0
*A
Inter+alo !e Conian(a3 Es la estimacin por intervalos teniendo en cuenta el error
m#ximo, intervalo en le cual est# el valor exacto. /e escoe una probabilidad
% . '
4 -
y este es el intervalo de confian)a e d &onf
4 -
que son los limites de confian)a
E*e#$lo, para el valor medio de la distribucin normal con varian)a conocida y un
nivel de confian)a del <=C, tenemos,
<@ , - c , <= , 0 con
y calculamos el valor
medio de la muestra x
-
,...,x
n
de tamao n, y lueo,
n
c
O
, quedando el nivel de
confian)a
e O x O x d &onf +
/i
Teore#a3 /i
n
- i
i i n -
9 a % 9 ,..., 9 . $
, entonces,
1
]
1
n
- i
i i
n
- i
i i
[ 9 Z E a 9 a E [ $ Z E
y
+
+
n
- i
n
- i (
( i ( i
n
- i
i
4
i
[ $ , 9 Z &ov a a 4 [ 9 Z G a [ $ Z G
*<
Teore#a3 /ea DEa9Lb$, entonces se cumple que,
[ $ , 9 Z ab&ov 4 [ $ Z G b [ 9 Z G a [ D Z G
4 4
+ +
Teore#a3 /i DE9$, entonces,
[ $ Z E [ 9 Z E [ $ , 9 Z &ov [ D Z E +
,
y s 9 y $ est#n correlacionadas, entonces, EZD[EEZ9[EZ$[.
$ si 9 y $ son independientes, entonces,
4
y
4
x
4
x
4
y
4
y
4
x
m m [ 9$ Z E + +
La esperan)a condicional es !til para la prediccin. La medida es la prediccin de $
que tiene un error cuadr#tico esperado mnimo
[ % m $ Z. E
4
y
1
]
1
que es la
derivada de .x% con respecto a x calculada en m
x
.
/i el coeficiente de variacin es menos que el -0C, es claro que el error de esta
aproximacin es menor que el -C. /i el valor de G
x
es pequeo, 9 es probablemente
muy cercano a m
x
, entonces, es aplicable la serie de 3aylor,
+
+ +
4
4 4
x
m x x
dx
% x . d
4
% m 9 .
dx
% x . d
% m 9 . % m . % 9 .
x
para encontrar la distribucin aproximada de $, al menos en la rein media.
7esarrollando 3aylor de $E.9% de(ando los dos primeros trminos lineales de 9+
9
dx
% x . d
dx
% x . d
m % m . $
x x
m m x x
1
]
1
+
1
]
1
que es de la forma $EaLb9 y sabiendo que
f "
$
f
" %
$
" x
( )
_
,
1
, tenemos
entonces,
'
1
]
1
+
,
_
x
x
x
m
m x x
x
m
x y
dx
% x . d
dx
% x . d
m % m . y
f
dx
% x . d
-
b
a y
f
b
-
% y . f
1n estimador de m#xima verosimilitud de una muestra aleatoria 9
-
,...,9
n
es el
valor de que maximi)a a L.9
-
,...,9
n
8 % con L.9
-
,...,9
n
8 %Ef.9
-
8 %f.9
4
8
=0
%...f.9
n
8 % siendo f.x8 % la funcin de distribucin de probabilidad de 9 calculada
en x, como para 'Z9Ex[ si 9 es discreta
/ea 9
-
,..,9
n
la muestra aleatoria de la variable aleatoria 9 y x
-
,...,x
n
sus valores
mustrales, la funcin de probabilidad L, L.9
-
,...,9
n
8 %Ef.9
-
8 %...f.9
n
8 %
/i 9 es discreta L.x
-
,...,x
n
8 % representa 'Z9
-
Ex
-
,9
4
Ex
4
,...,9
n
Ex
n
[
/i 9 es continua L.x
-
,...,x
n
8 % representa la funcin de distribucin de probabilidad
con(unta de .9
-
,9
4
,...,9
n
%
Pro$ie!a!es3 El estimador puede ser sesado, el cual se puede evitar multiplicacin
por una constante apropiada. En condiciones enerales son converentes, esto es, si n
es muy rande, el estimador tiende al valor del par#metro.
/i
,
f es la funcin de probabilidad puntual o funcin de distribucin de probabilidad de 9
dependiendo de s 9 es discreta o continua y se supone que es un n!mero real.
=-