Sunteți pe pagina 1din 51

13.

MUESTREO Y ESTIMACIN
MUESTREO
Muestra Aleatoria de tamao n es una coleccin de n variables aleatorias, todas con
la misma distribucin y todas independientes. La coleccin de donde extraemos la
muestra aleatoria, se denomina Poblacin. Nuestra intencin al tomar una muestra, es
la de hacer Inerencia. Este trmino lo usamos en estadstica para denotar al
procedimiento con el que hacemos afirmaciones acerca de valores enerales de la
poblacin mediante los n!meros que observamos en la muestra.
" un valor calculado con los datos de una muestra es el Esta!"stico. "l valor del
par#metro en la poblacin es el Esti#a!or. $ es Esti#a!or Puntual cuando se
estima el par#metro poblacional a partir de un valor !nico%.
Caracter"sticas $robabil"sticas !e un esti#a!or. &uando se tiene una frmula para
estimar y se aplica a una muestra aleatoria, el resultado es aleatorio, es decir los
estimadores son variables aleatorias. 'or e(emplo si se recibe un embarque de ob(etos
que pueden estar listos para usarse defectuosos. 'odemos seleccionar, al a)ar,
alunos de ellos para darnos una idea de la proporcin de defectuosos en el
embarque. El par#metro de inters es la proporcin de defectuosos en toda la
poblacin, pero lo que observamos es la proporcin de defectuosos en la muestra.
%alor es$era!o !e un esti#a!or & ses'o. El valor esperado de un estimador nos da
un valor alrededor del cual es muy probable que se encuentre el valor del estimador.
'ara poner un e(emplo, si supiramos que el valor esperado de un estadstico es *,
esto sinificara que al tomar una muestra+ No creemos que el valor de la estadstica
vaya a ser *, pero tampoco creemos que el valor de la estadstica vaya a estar le(os de
*.
$a que es muy probable que el valor del estimador est cerca de su valor esperado,
una propiedad muy deseable es que ese valor esperado del estimador coincida con el
del par#metro que se pretende estimar. "l menos, quisiramos que el valor esperado
no difiera mucho del par#metro estimado. 'or esa ra)n es importante la cantidad
que, tcnicamente llamamos seso.
&onvencin, para efectos del estudio de ahora en adelante se presentan la siuiente
convencin,

,
y
representan, el par#metro que estamos midiendo y el valor
obtenido en la medida o muestreado, respectivamente
-
El ses'o es la diferencia entre el valor esperado del estimador y el par#metro que
estima.
( ) x E
,
,
% . E /eso
/i el seso 0, se dice que el estimador es inses'a!o y sta es una caracterstica buena
para un estimador. 1n estimador que es insesado tiene una alta probabilidad de
tomar un valor cercano al valor del par#metro.
%arian(a !e un esti#a!or. 2tra propiedad importante de un estimador es su
varian)a. La importancia de la desviacin est#ndar es que nos permite darle un
sentido numrico a la cercana del valor del estimador a su valor esperado. Entre
menor sea la desviacin est#ndar de un estimador, ser# m#s probable que su valor en
una muestra especfica se encuentre mas cerca del valor esperado.
'ara aclarar esto, considere dos estimadores 3
-
y 3
4
, supona que ambos son
insesados y supona que la varian)a de 3
-
es menor que la de 3
4
, lo cual quiere decir
que los valores de 3
-
son m#s probables que los de 3
4
. 2 sea que vamos a encontrar a
3
-
m#s cerca del valor del par#metro que a 3
4
. Esto hace que nuestras preferencias
estn con 3
-
.
&uando un estimador tiene una varian)a menor que otro decimos que el estimador es
m#s eiciente.
)a !istribucin !e $robabili!a! !e un esta!"stico. 5ui)# el resultado m#s
importante para la estadstica es el 3eorema del Lmite &entral. Este resultado nos
indica que, para el estadstico promedio de la muestra
- el valor esperado es la media de la poblacin.
- la varian)a es iual a la de la poblacin dividida por el n!mero de elementos de la
muestra.
- la distribucin de probabilidad es la normal.
Este teorema es muy importante porque permite calcular probabilidades acerca de
dnde se encuentra el valor promedio muestra. Es slo cuestin de usar la tabla
normal teniendo cuidado al estandari)ar de usar la desviacin est#ndar adecuada que
es la de la poblacin dividida por la ra) cuadrada del n!mero de elementos de la
muestra.
Esti#acin !el error !e una #e!i!a !irecta. La estimacin del error de una
medida tiene siempre una componente sub(etiva. En efecto, nadie me(or que un
observador experimentado para saber con buena aproximacin cu#l es el rado de
confian)a que le merece la medida que acaba de tomar. No existe un con(unto de
4
relas bien fundadas e inalterables que permitan determinar el error de una medida en
todos los casos imainables.
6uchas veces es tan importante consinar cmo se ha obtenido un error como su
propio valor. /in embaro, la aplicacin de alunos mtodos estadsticos permite
ob(etivar en ran medida la estimacin de errores aleatorios. La estadstica permite
obtener los par#metros de una poblacin .en este caso el con(unto de todas las
medidas que es posible tomar de una manitud%, a partir de una muestra .el n!mero
limitado de medidas que podemos tomar%.
Me*or +alor !e un con*unto !e #e!i!as. /uponamos que medimos una manitud
un n!mero n de veces. 7ebido a la existencia de errores aleatorios, las n medidas
( )
n 2 1
x ,..., x , x ser#n en eneral diferentes. El mtodo m#s ra)onable para
determinar el me(or valor de estas medidas es tomar el valor medio. En efecto, si los
errores son debidos al a)ar, tan probable es que ocurran por defecto como por exceso,
y al hacer la media se compensar#n, por lo menos parcialmente, y este es el valor que
deber# darse como resultado de las medidas.

n
- i
i
x
n
-
x
Ti$os !e esti#acin esta!"stica. 1n problema importante de la inferencia estadstica
es la estimacin de par#metros de la poblacin, brevemente par#metros .tales como la
media y la variacin de la poblacin%, de los correspondientes estadsticos mustrales,
o simplemente estadsticos .tales como la media y la variacin de la muestra%.
Esti#aciones sin ses'o. /i la media de las dispersiones de muestreo con un
estadstico es iual que la del correspondiente par#metro de la poblacin, el
estadstico se llamara estimador sin seso o insesado del par#metro8 si no, si no se
llama estimador sesado. Los correspondientes valores de tal estadstico se llaman
estimacin sin seso, y estimacin con seso respectivamente.
E*e#$lo, la media de las distribuciones de muestreo de medias
x
o

, media de la
poblacin. 'or lo tanto, la media muestral es una estimacin sin seso de la media de
la poblacin.
E*e#$lo, las medias de las distribuciones de muestreo de las variables son
4
s
n
- n
4


En donde,
4
s sea una estimacin sin seso, sin embaro, s es una estimacin
sesada, pues, en trminos del valor esperado es insesado
4 4
% / . E % 9 . E
:
Esti#acin Eiciente. /i las distribuciones de muestreo de dos estadsticos tienen la
misma media .o esperan)a%, el de menor varian)a se llama un estimador eficiente de
la media, mientras que el otro se llama un estimador ineficiente, respectivamente. /i
consideramos todos los posibles estadsticos cuyas distribuciones de muestreo tiene la
misma media, aquel de varian)a mnima se llama a veces, el estimador de m#xima
eficiencia, sea el me(or estimador.
E*e#$lo, Las distribuciones de muestreo de media y mediana tienen ambas la misma
media, a saber, la media de la poblacin. /in embaro, la varian)a de la distribucin
de muestreo de medias es menor que la varian)a de la distribucin de muestreo de
medianas. 'or tanto, la media muestral da una estimacin eficiente de la media de la
poblacin, mientras la mediana de la muestra da una estimacin ineficiente de ella.
7e todos los estadsticos que estiman la media de la poblacin, la media muestral
proporciona la me(or .la m#s eficiente% estimacin. En la pr#ctica, estimaciones
ineficientes se usan con frecuencia a causa de la relativa sencille) con que se obtienen
alunas de ellas. Estimaciones de punto y estimaciones de intervalo, su iabili!a!,
una estimacin de un par#metro de la poblacin dada por un solo n!mero se llama
una estimacin de punto del par#metro. 1na estimacin de un par#metro de la
poblacin dada por dos puntos, entre los cuales se pueden considerar enca(ado al
par#metro, se llama una estimacin del intervalo del par#metro. Las estimaciones de
intervalo que indican la precisin de una estimacin y son por tanto preferibles a las
estimaciones de punto
La ;nferencia Estadstica comprende los mtodos que son usados para sacar
conclusiones de la poblacin en base a una muestra tomada de ella. ;ncluye los
mtodos de estimacin de par#metros y las pruebas de hiptesis.
La Esti#acin !e $ar-#etros comprende a su ve) la Estimacin 'untual, en donde
se estudian los diversos mtodos de encontrar estimadores y las propiedades ptimas
que deben tener stos, y la Esti#acin $or Inter+alos !e Conian(a, en donde se
estima un par#metro usando un intervalo centrado en un estimado del par#metro y de
lonitud iual a dos veces el error de estimacin. El Error de estimacin depende del
nivel de confian)a deseado, usualmente, <0, <= << por ciento.
En este texto solamente se tratar# el c#lculo de intervalos de confian)a. Los diversos
mtodos de encontrar estimadores y, las propiedades de estimadores ptimos son
discutidos en un curso de Estadstica 6atem#tica.
1na .i$tesis Esta!"stica es una afirmacin que se hace acerca de un par#metro
poblacional. La afirmacin que est# establecida y que se espera sea recha)ada
despus de aplicar una $rueba esta!"stica es llamada la /i$tesis nula y se
*
representa por >
o
. La afirmacin que se espera sea aceptada despus de aplicar una
$rueba esta!"stica es llamada la /i$tesis alterna y se representa por >
a
.
1na $rueba esta!"stica es una frmula, basada en la distribucin del estimador del
par#metro que aparece en la hiptesis y que va a permitir tomar una decisin acerca
de aceptar o recha)ar una hiptesis nula.
"l iual que una prueba de laboratorio para detectar cierta enfermedad, una prueba
estadstica no es ciento por ciento seura y puede llevar a una conclusin errnea.
>ay dos tipos de errores que pueden ocurrir. El error ti$o I, que se comete cuando se
recha)a una hiptesis nula que realmente es cierta y el error ti$o II que se comete
cuando se acepta una hiptesis nula que realmente es falsa.
El ni+el !e si'niicacin, representada por , es la probabilidad de cometer error tipo
;, y por lo eneral se asume que tiene un valor de 0.0= 0.0-.3ambin puede ser
interpretado como el #rea de la rein que contiene todos los valores posibles donde
la hiptesis nula es recha)ada.
La probabilidad de cometer error tipo ;;, se representa por y al valor -? se le llama
la $otencia !e la $rueba. 1na buena prueba estadstica es aquella que tiene una
potencia alta. En este captulo, primero se discutir# el c#lculo de intervalos de
confian)a y pruebas de hiptesis para la media poblacional, para una proporcin y
finalmente para la varian)a de una poblacin. Lueo se tratar# los intervalos de
confian)a y prueba de hiptesis para la ra)n de dos varian)as poblacionales, para la
diferencia de dos medias poblacionales y por !ltimo para la diferencia de dos
proporciones.
Esti#aciones !e Inter+alos !e Conian(a $ara $ar-#etros !e $oblacin. /ean
s y s

la media y la desviacin tpica .error tpico% de la distribucin de muestreo
de un estadstico /. Entonces, si la distribucin de muestreo de s es aproximadamente
normal .que como hemos visto es cierto para muchos estadsticos si el tamao de la
muestra es N 30), entonces, podemos esperar hallar un estadstico muestral real /
que est en el intervalo
( )
s s s
, +
,
( )
s s s
4 , 4 +
,
( )
s s s
: , : +

en un @A.4BC, <=.*=C y <<.B0 C, respectivamente.
En la tabla siuiente, se muestran los niveles de confian)a usados en la pr#ctica. 'ara
niveles de confian)a que no aparecen en la tabla, los valores D
c
se pueden encontrar
racias a las tablas de #reas ba(o la curva Normal.
Nivel de
confian)a
C
<<.B0 <<.00 <A.00 <@.00 <=.*= <=.00 <0.00
A0.00 @A.4B =0.00
=
D
c
:.00 4.=A 4.:: 4.0= 4.00 -.<@ -.@*= -.4A
-.00 0.@B*=
Inter+alos !e conian(a $ara la #e!ia. /i el estadstico es de la media de 9 de la
muestra, entonces los limites de confian)a
x x
=A . 4 y < . - t t ,
respectivamente. /i el muestreo de la poblacin es infinita por lo tanto viene dado por
N
D 9

t

E*e#$lo. >alar los lmites de confian)a de <AC y <0C. Lo anterior tiene la solucin,
sea D ED

tal que, al #rea ba(o la curva Normal a la derecha sea -C, entonces, por
simetra el #rea del lado i)quierdo de DE?D

. como el #rea total ba(o la curva es -,


D

E0.*< por tanto, D

E4.::, lueo el limite de confian)a para el <AC es,


n
:: . 4

t
Feneralmente, la desviacin tpica de la poblacin no es conocida. "s pues, para
obtener los limites usamos la estimacin s o / es satisfactorio si N :0, si a
aproximacin es pobre y debe de empleare la teora de pequeas muestras.
C-lculo !el ta#a0o !e la #uestra. " la hora de determinar el tamao que debe
alcan)ar una muestra hay que tomar en cuenta varios factores, el tipo de muestreo, el
par#metro a estimar, el error muestral admisible, la varian)a poblacional y el nivel de
confian)a. 'or ello antes de presentar alunos casos sencillos de c#lculo del tamao
muestral delimitemos estos factores.
Par-#etro. /on las medidas o datos que se obtienen sobre la poblacin.
Esta!"stico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto
una estimacin de los par#metros.
Error Muestral. Es la diferencia entre un estadstico y su par#metro correspondiente.
Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al
valor de la poblacin, nos da una nocin clara de hasta dnde y con qu probabilidad
una estimacin basada en una muestra se ale(a del valor que se hubiera obtenido por
medio de un censo completo. /iempre se comete un error, pero la naturale)a de la
investiacin nos indicar# hasta qu medida podemos cometerlo .los resultados se
someten a error muestral e intervalos de confian)a que varan muestra a muestra%.
Gara se!n se calcule al principio o al final. 1n estadstico ser# m#s preciso en
cuanto y tanto su error es m#s pequeo. 'odramos decir que es la desviacin de la
distribucin muestral

de un estadstico y su fiabilidad.
@
Ni+el !e Conian(a. 'robabilidad de que la estimacin efectuada se a(uste a la
realidad. &ualquier informacin que queremos recoer est# distribuida se!n una ley
de probabilidad, as llamamos nivel de confian)a a la probabilidad de que el intervalo
construido en torno a un estadstico capte el verdadero valor del par#metro.
%arian(a Poblacional. &uando una poblacin es m#s homonea la varian)a es
menor y el n!mero de entrevistas necesarias para construir un modelo reducido del
universo, o de la poblacin, ser# m#s pequeo. Feneralmente es un valor desconocido
y hay que estimarlo a partir de datos de estudios previos.
Ta#a0o !e #uestra $ara esti#ar la #e!ia !e la $oblacin. Geamos los pasos
necesarios para determinar el tamao de una muestra empleando el muestreo aleatorio
simple. 'ara ello es necesario partir de dos supuestos+ en primer luar el nivel de
confian)a al que queremos traba(ar8 en seundo luar, cual es el error m#ximo que
estamos dispuestos a admitir en nuestra estimacin. "s pues los pasos a seuir son+
2btener el tamao muestral imainando que
n
, siendo 4 H
D
el D con el valor
del nivel de confian)a eleido,
4
varian)a poblacional y e el error m#ximo
4
4 4
4 H
e
D
n


o aplicar
( ) n H n -
n
n

'ara obtener el tamao de la muestra si hay randes diferencias en el tamao muestral


o hay escase) de informacin
E*e#$lo, 1na poblacin a encuestar tiene -0000 personas y una varian)a de <.@*A.
3raba(ando con un nivel de confian)a de 0.<= y estando dispuestos a admitir un error
m#ximo del -0C, Icu#l debe ser el tamao muestral para traba(arJ
En las tablas de la curva Normal el valor de 2 /
Z
que corresponde con el nivel de
confian)a eleido,
<@ . - D
4 H
t


B0@ . : - . 0 H @*A . < <@ . - n
4 4


&omprobamos que no se cumple, pues en este caso -0.000 K :.B0@ .:.B0@ ? -%8
-0.000 K -:.B:0.B:0, por tanto, usamos
B0* . 4 %% 000 . -0 H B0@ . : . - H. B0@ . : n +

Ta#a0o !e #uestra $ara esti#ar la $ro$orcin !e la $oblacin. 'ara calcular el


tamao de muestra para la estimacin de proporciones poblaciones hemos de tener en
cuenta los mismos factores que en el caso de la media. La frmula que nos permitir#
determinar el tamao muestral es la siuiente,
B
% ' - . ' D e % - N .
% ' - . ' D N
n
4
4 H
4
4
4 H
+

7onde,
4 H
D

correspondiente al D con el nivel de confian)a eleido, ' es la


proporcin de una cateora de la variable, e es el error m#ximo, y N es el tamao de
la poblacin.
1na parte fundamental para reali)ar un estudio estadstico de cualquier tipo es
obtener unos resultados confiables y que puedan ser aplicables. &omo ya se coment
anteriormente, resulta casi imposible o impr#ctico llevar a cabo alunos estudios
sobre toda una poblacin, por lo que la solucin es llevar a cabo el estudio bas#ndose
en un subcon(unto de sta denominada muestra. /in embaro, para que los estudios
tenan la valide) y confiabilidad buscada es necesario que tal subcon(unto de datos, o
muestra, posea alunas caractersticas especficas que permitan, al final, enerali)ar
los resultados hacia la poblacin en total.
Esas caractersticas tienen que ver principalmente con el tamao de la muestra y con
la manera de obtenerla. El muestro, implica alo de incertidumbre que debe ser
aceptada para poder reali)ar el traba(o, pues aparte de que estudiar una poblacin
resulta ser un traba(o en ocasiones demasiado rande, por tanto, se ofrecen las
siuientes ra)ones extras+
1 Recursos li#ita!os. Es decir, no existen los recursos humanos, materiales o
econmicos para reali)ar el estudio sobre el total de la poblacin. Es como cuando
se compra un aparato, un automvil usado .por e(emplo%, que se prueba unos
minutos .el encendido, una carrerita, etc.% para ver si funciona correctamente y
lueo se adquiere, pero no se espera a probarlo toda la vida .encendindolo y
apa#ndolo o, simplemente, de(#ndolo encendida% antes de reali)ar la adquisicin.
1 Escase(. Es el caso en que se dispone de una sola muestra. 'or e(emplo, para el
estudio paleontolico de los dinosaurios sera muy bueno contar con, al menos,
muchos restos fsiles y as reali)ar tales investiaciones8 sin embaro, se cuenta
slo con una docena de esqueletos fosili)ados .casi todos incompletos% de esas
criaturas en todo el mundo.
1 Pruebas !estructi+as. Es el caso en el que reali)ar el estudio sobre toda la
poblacin llevara a la destruccin misma de la poblacin.
1 El #uestreo $ue!e ser #-s e2acto. Esto es en el caso en el que el estudio sobre
la poblacin total puede causar errores por su tamao o, en el caso de los censos,
que sea necesario utili)ar personal no lo suficientemente capacitado8 mientras que,
A
por otro lado, el estudio sobre una muestra podra ser reali)ada con menos
personal pero m#s capacitado.
'ara calcular el tamao de una muestra hay que tomar en cuenta tres factores+
? El porcenta(e de confian)a con el cual se quiere enerali)ar los datos desde la
muestra hacia la poblacin total.
? El porcenta(e de error que se pretende aceptar al momento de hacer la
enerali)acin.
? El nivel de variabilidad que se calcula para comprobar la hiptesis.
La conian(a o el $orcenta*e !e conian(a es el porcenta(e de seuridad que existe
para enerali)ar los resultados obtenidos. Esto quiere decir que un porcenta(e del
-00C equivale a decir que no existe ninuna duda para enerali)ar tales resultados,
pero tambin implica estudiar a la totalidad de los casos de la poblacin. 'ara evitar
un costo muy alto para el estudio o debido a que en ocasiones llea a ser
pr#cticamente imposible el estudio de todos los casos, entonces se busca un
porcenta(e de confian)a menor. &om!nmente en las investiaciones sociales se busca
un <=C.
El error o $orcenta*e !e error equivale a eleir una probabilidad de aceptar una
hiptesis que sea falsa como si fuera verdadera, o la inversa+ recha)ar a hiptesis
verdadera por considerarla falsa. "l iual que en el caso de la confian)a, si se quiere
eliminar el rieso del error y considerarlo como 0C, entonces la muestra es del
mismo tamao que la poblacin, por lo que conviene correr un cierto rieso de
equivocarse. &om!nmente se aceptan entre el *C y el @C como error, tomando en
cuenta de que no son complementarios la confian)a y el error.
La +ariabili!a! es la probabilidad .o porcenta(e% con el que se acept y se recha) la
hiptesis que se quiere investiar en aluna investiacin anterior o en un ensayo
previo a la investiacin actual. El porcenta(e con que se acept tal hiptesis se
denomina +ariabili!a! $ositi+a y se denota por p, y el porcenta(e con el que se
recha) se la hiptesis es la +ariabili!a! ne'ati+a, denotada por q. >ay que
considerar que p y q son complementarios, es decir, que su suma es iual a la unidad+
pLqE-. "dem#s, cuando se habla de la m#xima variabilidad, en el caso de no existir
antecedentes sobre la investiacin .no hay otras o no se pudo aplicar una prueba
previa%, entonces los valores de variabilidad es pEqE0.=.
1na ve) que se han determinado estos tres factores, entonces se puede calcular el
tamao de la muestra como a continuacin se expone. >ablando de una poblacin de
alrededor de -0,000 casos, o mnimamente esa cantidad, podemos pensar en la
manera de calcular el tamao de la muestra a travs de las siuientes frmulas. >ay
que mencionar que estas frmulas se pueden aplicar de manera aceptable pensando en
<
instrumentos que no incluyan preuntas abiertas y que sean un total de alrededor de
:0.
Gamos a presentar dos frmulas, siendo la primera la que se aplica en el caso de que
no se cono(ca con $recisin el ta#a0o !e la $oblacin, y es+
4
4
e
pq )
n
7onde, n es el tamao de la muestra8 ) es el nivel de confian)a8 p es la variabilidad
positiva8 q es la variabilidad neativa8 y e es la precisin o error.
E*e#$lo3 /i se quiere un porcenta(e de confian)a del <=C, entonces hay que
considerar la proporcin correspondiente, que es 0.<=. Lo que se buscara en seuida
es el valor ) para la variable aleatoria z tal que el #rea simtrica ba(o la curva normal
desde -) hasta ) sea iual a 0.<=, es decir, '.?)KDK)%E0.<=.
1tili)ando las tablas de la funcin de distribucin Normal se puede calcular el valor
de ), que sera -.<@ .con una aproximacin a dos decimales%. Esto quiere decir que
'.?-.<@KDK-.<@%E0.<=.
En el caso de que s" se cono(ca el ta#a0o !e la $oblacin entonces se aplica
pq ) Ne
pqN )
n
4 4
4
+

7onde, n es el tamao de la muestra8 ) es el nivel de confian)a8 p es la variabilidad


positiva8 q es la variabilidad neativa8 y e es la precisin o error.
E*e#$lo3 1n &oleio desea reali)ar una investiacin sobre los alumnos inscritos en
primer y seundo aos, para lo cual se aplicar# un cuestionario de manera aleatoria a
una muestra, pues los recursos econmicos y el tiempo para procesar la informacin
resultara insuficiente en el caso de aplic#rsele a la poblacin estudiantil completa. En
primera instancia, suponiendo que no se conoce el tamao exacto de la poblacin,
pero con la seuridad de que sta se encuentra cerca a los die) millares, se aplicar# la
primera frmula.
/e considerar# una confian)a del <=C, un porcenta(e de error del =C y la m#xima
variabilidad por no existir antecedentes en la institucin sobre la investiacin y
porque no se puede aplicar una prueba previa. 'rimero habr# que obtener el valor de
Z de tal forma que la confian)a sea del <=C, es decir, buscar un valor de Z tal que '.?
)KDK)%E0.<=. Entonces, )E-.<@. Mesultando, nE:A*.-@
-0
Las tcnicas de #uestreo $robabil"stica son aquellas en las que se determina al a)ar
los individuos que constituir#n la muestra. Estas tcnicas nos sirven cuando se desean
enerali)ar los resultados que se obtienen a partir de la muestra hacia toda la
poblacin. Lo anterior se dice dado que se supone que el proceso aleatorio permitir#
la obtencin de una muestra re$resentati+a de la poblacin.
Los muestreos probabilsticas pueden ser con o sin reempla)o. Los #uestreos con
ree#$la(o son aquellos en los que una ve) que ha sido seleccionado un individuo .y
estudiado% se le toma en cuenta nuevamente al eleir el siuiente individuo a ser
estudiado. En este caso cada una de las observaciones permanece independiente de
las dem#s, pero con poblaciones pequeas tal procedimiento debe ser considerado
ante la posibilidad de repetir observaciones. En el caso de poblaciones randes no
importa tal proceder, pues no afecta sustancialmente una repeticin a las frecuencias
relativas.
Los #uestreos sin ree#$la(o son los que una ve) que se ha tomado en cuenta un
individuo para formar parte de la muestra, no se le vuelve a tomar en cuenta
nuevamente. En este caso, y hablando especficamente para el caso de poblaciones
pequeas, las observaciones son dependientes entre s, pues al no tomar en cuenta
nuevamente el individuo se altera la probabilidad para la seleccin de otro individuo
de la poblacin. 'ara el caso de las poblaciones randes .por e(emplo la poblacin de
un pas% dicha probabilidad para la seleccin de un individuo se mantiene
pr#cticamente iual, por lo que se puede decir que existe independencia en las
observaciones.
Las tcnicas de muestreo probabilstica que mencionaremos ser#n b#sicamente tres+
el aleatorio simple, el aleatorio estratificado y el sistem#tico.
1 Muestreo aleatorio si#$le. 'odemos aqu mencionar que para el caso de que se
estuviese estudiando un propocin dentro de la poblacin .una eleccin de
candidato, la aceptacin o recha)o de una propuesta en una comunidad, la
presencia o ausencia de una caracterstica hereditaria%, y el en caso de un muestreo
aleatorio simple, la estimacin que se puede hacer de la proporcin buscada a
partir de la proporcin hallada en la muestra se obtiene mediante la construccin
de un intervalo de confian)a+
E ' N tolerancia de la muestra
7onde es la proporcin buscada en la poblacin y ' es la proporcin presente en la
muestra. 'or otro lado, la tolerancia !e la #uestra est# relacionada directamente con
el nivel de confian)a y se obtiene a partir de la distribucin normal al iual que como
se obtuvo para el c#lculo del tamao de las muestras. La representaremos con ) para
obtener,
--
n
pq
) ' t
? Muestras aleatorias. 'ara que las conclusiones de la teora del muestreo y de la
inferencia estadstica sean validas, las muestras deben escoerse representativas de
la poblacin. El an#lisis de los mtodos de muestreo y problemas relacionados se
llaman el diseo del experimento.
1 Muestras no aleatorias. &uando el mtodo de extraccin de las muestras no
aseure a cada individuo de la poblacin o del estrato, iual probabilidad de ser
eleido, entonces la muestra obtenida no es aleatoria. " veces, esto se hace por
ra)ones de practicidad en el sentido del costo o del tiempo. /i se desea tomar una
muestra probabilstica de la poblacin arentina no parece ra)onable usar a cada
individuo como unidad de muestreo. Lo mismo cuando se desea hacer un
muestreo a los escolares de una provincia, es muy difcil empadronar a todos
primero para lueo sortear, y se tardara demasiado para ubicarlos uno por uno
hasta terminar el traba(o.
? En el #uestreo !e eta$as #4lti$les se utili)a para el caso de randes poblaciones
humanas. "c#, la unidad de muestreo en la primera etapa son los departamentos de
cada provincia. /e los lista y se hace un primer sorteo para la seleccin. En una
seunda etapa se distinue la poblacin rural de la urbana, subdividiendo en
fracciones .diferentes superficies con densidad de poblacin seme(ante%. 2tra ve)
se sortea para eleir, y se contin!a con otra divisin en radios dentro de las
fracciones, sementos dentro de radios, y as sucesivamente. La ra)n es repartir
equitativamente el traba(o del encuestador.
? En el #uestreo $or con'lo#era!os se elien con(untos donde naturalmente se
arupan los individuos. Es, por e(emplo, el caso de las escuelas para hacer un
muestreo alumnos en el sistema educativo, o las facultades para los universitarios.
/i se trata de estudiar las condiciones laborales de los empleados de comercio que
traba(an en supermercados, primero se empadronan a los luares naturales de
traba(o .supermercados%, y lueo se sortea entre estos conlomerados para eleir a
uno. Lueo se entrevista a todos los empleados del supermercado eleido, y se
acepta esto como una muestra representativa del sector.
? El #uestreo siste#-tico se usa para el caso de sucesiones de elementos. 'or
e(emplo, el caso de las historias clnicas de pacientes, certificados de nacimiento,
tar(etas de cat#loo en una biblioteca, etc. /on los casos donde la informacin est#
en archivos y hay que traba(ar con estos para obtenerlas. /e elie una cifra entera,
ra)onable, tomando en cuenta el tamao de la muestra y el de la poblacin. 'or
e(emplo, hay que tomar una muestra de tamao 4= de un archivo que contiene *AA
-4
fichas8 lueo, el cociente entre poblacin y muestra es *AA H4=, aproximadamente
-<. Notar que si se elie 40 el tamao muestral no llea a 4=. Entonces, se cuentan
las fichas y a llear a la dcimo novena se la extrae, se siue hasta la n!mero :A
que ser# la seunda escoida, y as sucesivamente hasta tener las 4= fichas
necesarias. Es tambin el caso de los soldados que se numeran de - en adelante y
cada = .u otro n!mero cualquiera% dan un paso al frente. Es un mtodo sencillo y
r#pido de seleccin.
a. N4#eros Aleatorios. 1na forma para obtener una muestra representativa es
mediante el muestreo aleatorio, de acuerdo con el cual, cada miembro de la
poblacin tiene la misma probabilidad de ser incluido en la muestra. 1n mtodo
para lorarlo es asinarle a cada uno un n!mero, escribir cada n!mero en una
papeleta, y reali)ar en una urna un soporte (usto en ella. 1n mtodo alternativo
consiste en recurrir una tabla de n!meros aleatorios.
b. Siste#-tico. Es an#loo al anterior, aunque resulta m#s cmoda la eleccin de los
elementos. /i hemos de eleir *0 elementos de un rupo de @00, se comien)a por
calcular el cociente @00H*0 que nos dice que existen *0 rupos de -= elementos
entre los @00. /e elie un elemento de salida entre los -= primeros, y suponiendo
que sea el O?simo, el resto de los elementos ser#n los O?simos de cada rupo. En
concreto, si el elemento de partida es el n!mero @, los restantes ser#n los que
tenan los n!meros+ -=L@ ,4x-=L@,......,:<x-=L@
Este procedimiento simplifica enormemente la eleccin de elementos, pero puede
dar al traste con la representatividad de la muestra, cuando los elementos se hayan
numerados por al!n criterio concreto, y los O?simos tienen todos una
determinada caracterstica, que haa conformarse una muestra no representativa.
c. Estratiica!o. " veces nos interesa, cuando las poblaciones son muy randes,
dividir stas en sub?poblaciones o estratos, sin elementos comunes, y que cubran
toda la poblacin. 1na ve) hecho esto podemos eleir, por muestreo aleatorio
simple, de cada estrato, un n!mero de elementos iual o proporcional al tamao
del estrato. Este procedimiento tiene la ran venta(a de que se puede obtener una
mayor precisin en poblaciones no homoneas .aunque en este curso no
estudiaremos los mtodos necesarios% /i decidiramos hacer una encuesta sobre la
incidencia del tabaco en nuestro centro, podramos ra)onar de la siuiente forma+
MUESTRA CON Y SIN REPOSICION
/i sacamos el n!mero de una urna, podemos volverlos en ella o no, antes de la
siuiente extraccin. En el primer caso, ese n!mero puede salir de nuevo m#s veces,
mientras que en el seundo pueda salir cada n!mero una ve). Estos dos tipos de
muestras se llaman, respectivamente, 6uestras con reposicin y muestra sin
-:
reposicin. Las poblaciones son finitas o infinitas. /i por e(emplo, sacamos -0 bolas
sucesivamente, sin reposicin, de una urna que contiene -00 bolas, estamos tomando
muestra de poblacin finita8 mientras que si lan)amos =0 veces una moneda contamos
el n!mero de caras, estamos ante una muestra poblacin infinita. 1na poblacin finita
en la que se efect!a muestra con reposicin, puede considerarse infinita tericamente,
ya que puede tomar cualquier n!mero de muestras sin aotarla. 'ara muchos efectos
pr#cticos, una poblacin muy rande se puede considerar como si fuera infinita.
PE5UE6AS MUESTRAS
En este captulo se presentan tres nuevos modelos estadsticos+ el llamado t?/tudent,
el modelo de la &hi?cuadrado P
4
y el modelo Q?Qisher. Los tres no requieren ya m#s
del supuesto de un tamao muestral rande. "hora con dos o m#s mediciones se
puede traba(ar8 por eso se usa la expresin 3eora de pequeas muestras para este
tema. El empleo de cualquiera de ellos es enteramente similar al visto en el captulo
anterior. &ambia la manera de calcular el estadrafo de comparacin y su respectiva
tabla de valores crticos de la distribucin muestral.
6ientras que el modelo de la t se aplica a medias y proporciones, los dos !ltimos se
usan para el estudio de las desviaciones o dispersiones. 3ambin se la llama
3eora Exacta del 6uestreo, pues ahora no hay que efectuar la aproximacin RS
ya que el valor muestral viene en la frmula de c#lculo del estadrafo de
comparacin, en luar del poblacional. Eso hace que no sea necesario efectuar
una estimacin y se tiene una mayor exactitud que con la aussiana. Es
importante destacar que los tres modelos son v#lidos tanto para pequeas como
para randes muestras. Esto ampla el campo de aplicacin del modelo de Fauss.
"dem#s, al no tener que hacer tantas pruebas disminuye el costo y se ana en
tiempo. 3odas estas venta(as tienen una contrapartida+ se pierde un poco de
precisin pues, como se ver#, el intervalo de confian)a se hace m#s rande para
un mismo caso.
El propsito de un estudio estadstico suele ser, como hemos venido citando, extraer
conclusiones acerca de la naturale)a de una poblacin. "l ser la poblacin rande y
no poder ser estudiada en su interidad en la mayora de los casos, las conclusiones
obtenidas deben basarse en el examen de solamente una parte de sta, lo que nos
lleva, en primer luar a la (ustificacin, necesidad y definicin de las diferentes
tcnicas de muestreo.
Los primeros trminos obliados a los que debemos hacer referencia, definidos en el
primer captulo, ser#n los de estadstico y estimador.
7entro de este contexto, ser# necesario asumir un estadstico o estimador como una
variable aleatoria con una determinada distribucin, y que ser# la pie)a clave en las
-*
dos amplias cateoras de la inferencia estadstica+ la estimacin y el contraste de
hiptesis.
El concepto de estimador, como herramienta fundamental, lo caracteri)amos
mediante una serie de propiedades que nos servir#n para eleir el TTme(orU para un
determinado par#metro de una poblacin, as como alunos mtodos para la
obtencin de ellos, tanto en la estimacin puntual como por intervalos.
I&mo deducir la ley de probabilidad sobre determinado car#cter de una poblacin
cuando slo conocemos una muestraJ
Este es un problema al que nos enfrentamos cuando por e(emplo tratamos de estudiar
la relacin entre el fumar y el c#ncer de pulmn e intentamos extender las
conclusiones obtenidas sobre una muestra al resto de individuos de la poblacin. La
tarea fundamental de la esta!"stica inerencial, es hacer inferencias acerca de la
poblacin a partir de una muestra extrada de la misma.
T7CNICAS 8E MUESTREO SO9RE UNA PO9)ACIN
La teora del muestreo tiene por ob(etivo, el estudio de las relaciones existentes entre
la distribucin de un car#cter en dicha poblacin y las distribuciones de dicho car#cter
en todas sus muestras. Las venta(as de estudiar una poblacin a partir de sus muestras
son principalmente+
Coste re!uci!o3 /i los datos que buscamos los podemos obtener a partir de una
pequea parte del total de la poblacin, los astos de recoida y tratamiento de los
datos ser#n menores. 'or e(emplo, cuando se reali)an encuestas previas a un
referndum, es m#s barato preuntar a *.000 personas su intencin de voto, que a
:0.000.0008
Ma&or ra$i!e(3 Estamos acostumbrados a ver cmo con los resultados del escrutinio
de las primeras mesas electorales, se obtiene una aproximacin bastante buena del
resultado final de unas elecciones, muchas horas antes de que el recuento final de
votos haya finali)ado8
M-s $osibili!a!es3 'ara hacer cierto tipo de estudios, por e(emplo el de duracin de
cierto tipo de bombillas, no es posible en la pr#ctica destruirlas todas para conocer su
vida media, ya que no quedara nada que vender. Es me(or destruir slo una pequea
parte de ellas y sacar conclusiones sobre las dem#s. 7e este modo se ve que al hacer
estadstica inferencial debemos enfrentarnos con dos problemas+
? Eleccin de la muestra .muestreo), que es a lo que nos dedicaremos en este
captulo.
? Extrapolacin de las conclusiones obtenidas sobre la muestra, al resto de la
poblacin .inferencia).
-=
El tipo de muestreo m#s importante es el muestreo aleatorio, en el que todos los
elementos de la poblacin tienen la misma probabilidad de ser extrados8 "unque
dependiendo del problema y con el ob(etivo de reducir los costes o aumentar la
precisin, otros tipos de muestreo pueden ser considerados como veremos m#s
adelante: muestreo sistem#tico, estratificado y por conlomerados.
Muestreo aleatorio. &onsideremos una poblacin finita, de la que deseamos extraer
una muestra. &uando el proceso de extraccin es tal que aranti)a a cada uno
de los elementos de la poblacin la misma oportunidad de ser incluidos en
dicha muestra, denominamos al proceso de seleccin muestreo aleatorio.
El muestreo aleatorio se puede plantear ba(o dos puntos de vista+
? /in reposicin de los elementos8
? &on reposicin.
Muestreo aleatorio sin re$osicin. &onsideremos una poblacin E formada por N
elementos. /i observamos un elemento particular, e pertenece a E, en un
muestreo aleatorio sin reposicin se da la siuiente circunstancia+
? La probabilidad de que e sea eleido en primer luar es -HN8
? /i no ha sido eleido en primer luar .lo que ocurre con una probabilidad de .N?
-%HN, la probabilidad de que sea eleido en el seundo intento es de -H.N?-%.
? en el .iL-%?simo intento, la poblacin consta de N?i elementos, con lo cual si e no
ha sido seleccionado previamente, la probabilidad de que lo sea en este momento
es de -H.N?i%.
/i consideramos una muestra de nVN elementos, donde el or!en en la eleccin de los
mismos tiene importancia, la probabilidad de eleccin de una muestra 6E.e
-
,W,e
n
%
cualquiera es
'.6%E'.e
-
,W,e
n
%E'.e
-
%X'.e
4
He
-
%XW'.e
n
He
-
,...,e
n?-
%
n , N
G
-
Y N
%Y n N .
% - n . N
-
- N
-
N
-
% 6 . '



lo que corresponde en el sentido de la definicin de probabilidad de Laplace a un caso
posible entre las G
N,n
posibles n?uplas de N elementos de la poblacin. /i el or!en no
interviene, la probabilidad de que una muestra 6E.e
-
,W,e
n
% sea eleida es la suma de
las probabilidades de eleir una cualquiera de sus n?uplas, tantas veces como
permutaciones en el orden de sus elementos sea posible, es decir
'.6%E'.e
-
,W,e
n
%EnYX'.e
-
,...,e
n
%
n , N
&
-
Y N
%Y n N .
Y n % 6 . '

Muestreo aleatorio con re$osicin. /obre una poblacin E de tamao N podemos


reali)ar extracciones de n elementos, pero de modo que cada ve) el elemento
-@
extrado es repuesto al total de la poblacin. 7e esta forma un elemento puede
ser extrado varias veces. /i el orden en la extraccin de la muestra interviene,
la probabilidad de una cualquiera de ellas, formada por n elementos es+
n
N
-
N
-
N
-

/i el orden no interviene, la probabilidad de una muestra cualquiera, ser# la suma de
la anterior, repitindola tantas veces como manera de combinar sus elementos sea
posible. Es decir,
? sea n
-
el n!mero de veces que se repite cierto elemento e
-
en la muestra8
? sea n
4
el n!mero de veces que se repite cierto elemento e
4
8
? sea n
O
el n!mero de veces que se repite cierto elemento e
O
,
de modo que nEn
-
L...Ln
O
. Entonces la probabilidad de obtener la muestra n
-
veces e
-
,
n
4
veces e
4
, y as sucesivamente hasta tener n
O
veces e
O
, es
Y n YX n YX O X
N
-
O -
n

El muestreo aleatorio con reposicin es tambin denominado #uestreo aleatorio
si#$le, que como hemos mencionado se caracteri)a por que
? cada elemento de la poblacin tiene la misma probabilidad de ser eleido, y
? las observaciones se reali)an con reempla)o. 7e este modo, cada observacin es
reali)ada sobre la misma poblacin .no disminuye con las extracciones sucesivas%.
/ea 9 una variable aleatoria definida sobre la poblacin E, y f.x% su ley de
probabilidad.

'

% x ,..., x H x . f x e
% x H x . f x e
% x . f x e
aleatorios erimentos exp n E
- n - n n n
- 4 4 4
- - -

En una muestra aleatoria simple, cada observacin tiene la distribucin de


probabilidad de la poblacin+ f.x
-
%Ef.x
4
%EWf.x
n
%Ef. "dem#s todos las observaciones
de la variable aleatoria son independientes, es decir, fEf.x
-
,Wx
n
%Ef.x
-
%XWf.x
n
%
Tablas !e n4#eros aleatorios. 1n e(emplo de una tabla de n!meros aleatorios
consiste en la lista de los n!meros de Lotera Nacional premiados a lo laro de
su historia, pues se caracteri)an por que cada dito tiene la misma
probabilidad de ser eleido, y su eleccin es independiente de las dem#s
extracciones. 1n modo de hacerlo es el siuiente. /uponamos que tenemos
-B
una lista de n!meros aleatorios de OE= cifras .00000?<<.<<<%, una poblacin
de NE@00individuos, y deseamos extraer una muestra de nE@ de ellos. En este
caso ordenamos a toda la poblacin .usando cualquier criterio% de modo que a
cada uno de sus elementos le corresponda un n!mero del - al @00. En seundo
luar nos diriimos a la tabla de n!meros aleatorios, y comen)ando en
cualquier punto extraemos un n!mero t, y tomamos como primer elemento de
la muestra al elemento de la poblacin+

,
_

+
,
_

+
000 . -00
@00 X t
-
-0
@00 X t
-
O
El proceso se repite tomando los siuientes n!meros de la tabla de n!meros
aleatorios, hasta obtener la muestra de -0 individuos. Las cantidades uEtH.-0
O
% pueden
ser consideradas como observaciones de una variable aleatoria 1, que siue una
distribucin uniforme en el intervalo Z0,-[
M:to!o !e Montecarlo. El mtodo de 6ontecarlo es una tcnica para obtener
muestras aleatorias simples de una variable aleatoria X, de la que conocemos
su ley de probabilidad .a partir de su funcin de distribucin Q%. &on este
mtodo, el modo de eleir aleatoriamente un valor de 9 siuiendo usando su
ley de probabilidad es+
-. 1sando una tabla de n!meros aleatorios se toma un valor u de una variable
aleatoria.
4. /i 9 es continua tomar como observacin de X, la cantidad xEQ
?-
.u%. En el caso en
que 9 sea discreta se toma x como el percentil -00?u de X, es decir el valor m#s
pequeo que verifica que Q.x%\u

Este proceso se debe repetir n veces para obtener una muestra de tamao n.
E*e#$lo, /i queremos extraer nE-0 muestras de una distribucin N.0,-% podemos
recurrir a una tabla de n!meros aleatorios de OE=cifras, en las que observamos
las cantidades, por e(emplo, B@.4<:, :-.BB@, =0.A0:, B-.-=:, 40.4B-, ::.B-B,
-B.<B<, =4.-4=, *-.::0, <=.-*-
" partir de ellas podemos obtener una muestra de 9]N.0,-% usando una tabla de la
distribucin normal+
N!meros aleatorios 6uestra 1.0,-% 6uestra N.0,-%
t
i
u
i
Et
i
H-0
=
x
i
E Q
?-
.u
i
%
B@.4<: 0.B@ 0.B-
:-.BB@ 0.:4
.E-?0^@A%
?0.*B
=0.A0: 0.=- 0.0:
B-.-=: 0.B- 0.==
40.4B- 0.40
.E-?0^A0%
?0.A*
-A
::.B-B 0.:*
.E-?0^@@%
?0.*-
-B.<B< 0.-A
.E-?0^A4%
?0.<4
=4.-4= 0.=4 0.0=
*-.::0 0.*-
.E-?0^=<%
?0.4:
<=.-*- 0.<= -.@=
2bsrvese que como era de esperar, las observaciones x
i
tienden a aruparse
alrededor de la esperan)a matem#tica de 9
i
]N.0,-%. 'or otra parte, esto no implica
que el valor medio de la muestra sea necesariamente cero. /in embaro como
sabemos por el teorema de Qisher que


-0
- i
i
% - . 0 , 0 . N
N
9
9
su dispersin con respecto al valor central es pequea, lo que implica que
probablemente el valor medio estar# muy prximo a 0, cuyo valor es 0.0-4
2bsrvese que si el problema fuese el inverso, donde !nicamente conocisemos las
observaciones x
i
y que el mecanismo que ener esos datos hubiese sido una
distribucin normal de par#metros desconocidos, con la media obtenida hubisemos
tenido una buena aproximacin del par#metro m desconocido.

Muestreo aleatorio estratiica!o. 1n muestreo aleatorio estratificado es aquel en el
que se divide la poblacin de N individuos, en O subpoblaciones o estratos,
atendiendo a criterios que puedan ser importantes en el estudio, de tamaos
respectivos N
-
, ..., N
O
, tal que NE N
-
L ...LN
O
y reali)ando en cada una de estas subpoblaciones muestreos aleatorios simples de
tamao n
i
, de donde iE-,W,O.
E*e#$lo, /uponamos que reali)amos un estudio sobre la poblacin de estudiantes
de una 1niversidad, en el que a travs de una muestra de -0 de ellos queremos
obtener informacin sobre el uso !e barras !e labios. En primera
aproximacin lo que procede es hacer un muestreo aleatorio simple, pero en
su luar podemos reflexionar sobre el hecho de que el comportamiento de la
poblacin con respecto a este car#cter no es homoneo, y atendiendo a l,
podemos dividir a la poblacin en dos estratos3
? Estudiantes masculinos .@0C del total%8
? Estudiantes femeninos .*0C restante%.
de modo que se repartan proporcionalmente ambos rupos el n!mero total de
muestras, en funcin de sus respectivos tamaos .@ varones y * mu(eres%. Esto es
lo que se denomina asinacin proporcional.
-<
/i observamos con m#s atencin, nos encontramos .salvo sorpresas de probabilidad
reducida% que el comportamiento de los varones con respecto al car#cter que se
estudia es muy homoneo y diferenciado del rupo de las mu(eres. 'or otra parte,
con toda seuridad la precisin sobre el car#cter que estudiamos, ser# muy alta en el
rupo de los varones aunque en la muestra haya muy pocos .pequea varian)a%,
mientras que en el rupo de las mu(eres habr# mayor dispersin. &uando las
varian)as poblacionales son pequeas, con pocos elementos de una muestra se
obtiene una informacin m#s precisa del total de la poblacin que cuando la varian)a
es rande. 'or tanto, si nuestros medios slo nos permiten tomar una muestra de -0
alumnos, ser# m#s conveniente dividir la muestra en dos estratos, y tomar mediante
muestreo aleatorio simple cierto n!mero de individuos de cada estrato, de modo que
se eleir#n m#s individuos en los rupos de mayor variabilidad. "s probablemente
obtendramos me(ores resultados estudiando una muestra de - varn y < hembras.
Esto es lo que se denomina asinacin ptima.
Asi'nacin $ro$orcional. /ea n el n!mero de individuos de la poblacin total que
forman parte de aluna muestra+ nEn
-
LWLn
O.
&uando la asinacin es
proporcional el tamao de la muestra de cada estrato es proporcional al
tamao del estrato correspondiente con respecto a la poblacin total+
n
i
EnXN
i
HN
Asi'nacin $ti#a. &uando se reali)a un muestreo estratificado, los tamaos
muestrales en cada uno de los estratos, n
i
, los elie quien hace el muestreo, y
para ello puede basarse en aluno de los siuientes criterios+
? Eleir los n
i
de tal modo que se minimice la varian)a del estimador, para un coste
especificado, o bien,
? habiendo fi(ado la varian)a que podemos admitir para el estimador, minimi)ar el
coste en la obtencin de las muestras.
"s en un estrato dado, se tiende a tomar una muestra m#s rande cuando+
? El estrato es m#s rande8
? El estrato posee mayor variabilidad interna .varian)a%8
? El muestreo es m#s barato en ese estrato.
'ara a(ustar el tamao de los estratos cuando conocemos la dispersin interna de cada
uno de los mismos, tenemos el siuiente resultado+
Teore#a !e Ne&#an. /ea E una poblacin con N elementos, dividida en O estratos,
con N
i
elementos cada uno de ellos, iE-,W,O
O 4 - O 4 -
N N N N E E E E + + +
/ea n el n!mero total de elementos al reali)ar el muestreo, y que se dividen en cada
estrato como nEn
-
LWLn
O
40
/ea 9 la variable aleatoria que representa el car#cter que intentamos estudiar. /obre
cada estrato puede definirse entonces la variable aleatoria
i
9 como el valor medio
de 9 obtenida en una muestra de tamao n
i
en el estrato E
i
. /ea % 9 . G
i
la varian)a
de dicha variable aleatoria8 Entonces

O
- i
i
% 9 . G
se minimi)a cuando

O
i (
( (
i i
i
s, N
s, N
n n
donde
( )

i
N
- (
4
i i( i
x x
- N
-
s,
es la cuasi?varian)a del estrato E
i
.
Muestreo siste#-tico. &uando los elementos de la poblacin est#n ordenados en
fichas o en una lista, una manera de #uestrear consiste en,
? /ea OENHn8
? Eleir aleatoriamente un n!mero m, entre - y O8
? 3omar como muestra los elementos de la lista+ .e
m
,e
mLO
,e
mL4O
,W,e
mL.n?-%O
%
Esto es lo que se denomina #uestreo siste#-tico. &uando el criterio de ordenacin
de los elementos en la lista es tal que los elementos m#s parecidos tienden a estar m#s
cercanos, el muestreo sistem#tico suele ser m#s preciso que el aleatorio simple, ya
que recorre la poblacin de un modo m#s uniforme. 'or otro lado, es a menudo m#s
f#cil no cometer errores con un muestreo sistem#tico que con este !ltimo.
El mtodo tal como se ha definido anteriormente es sesado si NHn no es entero, ya
que los !ltimos elementos de la lista nunca pueden ser escoidos. 1n modo de evitar
este problema consiste en considerar la lista como si fuese circular .el elemento NL-
coincide con el primero% y+
? /ea O el entero m#s cercano a NHn8
? /e selecciona un n!mero al a)ar m, entre - y N8
? /e toma como muestra los elementos de la lista que consisten en ir saltando de O
elementos en O, a partir de m, teniendo en cuenta que la lista es circular.
/e puede comprobar que con este mtodo todos los elementos de la lista tienen la
misma probabilidad de seleccin.
Muestreo $or con'lo#era!os. /i intentamos hacer un estudio sobre los habitantes
de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, ya que
estudiar una muestra de tamao n implica enviar a los encuestadores a n puntos
distintos de la misma, de modo que en cada uno de ellos slo se reali)a una
entrevista. En esta situacin es m#s econmico reali)ar el denominado
muestreo por conlomerados, que consiste en eleir aleatoriamente ciertos
4-
barrios dentro de la ciudad, para despus eleir calles y edificios. 1na ve)
eleido el edificio, se entrevista a todos los vecinos.
Pro$ie!a!es !eseables !e un esti#a!or. /ea 9 una variable aleatoria cuya funcin
de probabilidad .o densidad de probabilidad si es continua% depende de unos
par#metros
O -
,..., desconocidos. % ,..., , x . f
O -
. Mepresentamos
mediante 9
-
,W,9
n
una muestra aleatoria simple de la variable. 7enotamos
mediante f
c
a la funcin de densidad con(unta de la muestra, que por estar
formada por observaciones independientes, puede factori)arse del siuiente
modo+
% ,..., , x . f X X % ,..., , x . f X % ,..., , x . f % ,..., , x ,..., x . f
O - n O - 4 O - - O - n - c

/e denomina esti#a!or !e un $ar-#etro
i
, a cualquier variable aleatoria
i
,
que
se exprese en funcin de la muestra aleatoria y que tena por ob(etivo aproximar el
valor de q
i
, % 9 ,..., 9 .
,
n - i

2bsrvese que el estimador no es un +alor concreto sino una variable aleatoria, ya


que aunque depende unvocamente de los valores de la muestra observados .9
i
Ex
i
%, la
eleccin de la muestra es un proceso aleatorio. 1na ve) que la muestra ha sido
eleida, se denomina esti#acin el valor numrico que toma el estimador sobre esa
muestra.
;ntuitivamente, las caractersticas que seran deseables para esta nueva variable
aleatoria .que usaremos para estimar el par#metro desconocido% deben ser+
1 Consistencia. &uando el tamao de la muestra crece arbitrariamente, el valor
estimado se aproxima al par#metro desconocido.
1 Carencia !e ses'o. El valor medio que se obtiene de la estimacin para diferentes
muestras debe ser el valor del par#metro.
1 Eiciencia. "l estimador, al ser variable aleatoria, no puede exirsele que para
una muestra cualquiera se obtena como estimacin el valor exacto del par#metro.
/in embaro podemos pedirle que su dispersin con respecto al valor central
.varian)a% sea tan pequea como sea posible.
1 Suiciencia. El estimador debera aprovechar toda la informacin existente en la
muestra.
E*e#$lo, &onsideremos una variable aleatoria de la que slo conocemos que su ley
de distribucin es aussiana, 9]N.,%, con
-
E y
4
E
4
desconocidos
44
'ara muestras aleatorias de tamao nE:, 9
-
,9
4
,9
:
]N.,% un posible estimador del
par#metro es

,
_



+ +

:
, N
:
% 9 9 9 .
9 % 9 , 9 , 9 .
: 4 -
: 4 - -
Carencia !e ses'o. /e dice que un estimador
,
de un par#metro es insesado si
%
,
. E . La carencia de seso puede interpretarse del siuiente modo+
/uponamos que se tiene un n!mero indefinido de muestras de una poblacin,
todas ellas del mismo tamao n. /obre cada muestra el estimador nos ofrece
una estimacin concreta del par#metro que buscamos. 'ues bien, el estimador
es insesado, si sobre dicha cantidad indefinida de estimaciones, el valor medio
obtenido en las estimaciones es .el valor que se desea conocer%.
Consistencia. 7ecimos que
,
es un estimador consistente con el par#metro si
( ) ( ) -
,
' lim , 0 o 0
,
' lim , 0
n n
< > > >


Teore#a. &omo consecuencia de de la desiualdad de &hebyshev se puede
demostrar el siuiente resultado y condiciones,
0 %
,
. G lim y %
,
. E lim
n n


entonces
,
es consistente.
Eiciencia. 7ados dos estimadores
4 -
,
y
,

de un mismo par#metro
,
, diremos
que
-
,
es m#s eficiente que
4
,
si %
,
. G %
,
. G
4 -
<
Suiciencia. 7iremos que % 9 ,.., 9 .
, ,
n -
es un estimador suficiente del par#metro

,
si % x 9 ,..., x 9 . '
n n - -
no dependa de para todo posible valor de
.
Teore#a !e ;is/er1Ne&#an. /ea % , x ,..., x . f
n -
la distribucin con(unta para las
muestras de tamao n, 9
-
,W,9
n
. Entonces % 9 ,.., 9 .
, ,
n -
es un estimador
suficiente si y solo si se cumple,
( ) %, 9 ,..., 9 .
,
r X % x ,..., x . h % , x ,..., x . f
n - n - n -
, siendo h una funcin
no neativa que no depende de y r una funcin que slo depende del
par#metro y de la muestra a travs del estimador.
CUR%A CARACTER<STICA Y ;UNCIN 8E POTENCIA
4:
'ara calcular el error tipo ;; o se debe especificar la hiptesis alternativa como una
hiptesis simple. /in embaro, en la mayora de los casos, esta hiptesis se plantea
como compuesta. "l plantearse la hiptesis alternativa como compuesta, no se puede
calcular el error tipo ;; asociado con la prueba. /in embaro, para obviar esta
dificultad lo que se hace es asinarle varios valores a la hiptesis alternativa, calcular
el error tipo ;; y reali)ar una curva con estos valores. Esta curva recibe el nombre de
U&urva &aracterstica 2perativa o &urva 2&U, y es muy empleada principalmente en
estudios de control de calidad.
&onsidrese la hiptesis alternativa de la siuiente manera+
>o+ E
0
E -0 >
-
+ _
0
n E <, E 0.0=
La rein crtica de esta prueba est# en c E -0.=*A, es decir, se recha)a >
0
E -0 si la
media de la muestra es mayor de -0.=*A. 'ara construir la curva 2& se presentan en
la tabla siuiente diferentes valores de la hiptesis alternativa con sus respectivas
probabilidades de aceptacin.
<.@ <.A -0.0 -0.4 -0.* -0.@ -0.A --.0 --.4 --.* --.@
0.<<
A
0.<A
A
0.<=
0
0.A=
4
0.@B
4
0.*:
A
0.44
=
0.0A
A
0.04
=
0.00
=
0.00-
La siuiente es la &urva &aracterstica 2perativa . vs % de la prueba de hiptesis
planteada.
/i se tiene la hiptesis nula >
o
+ E
0
contra la hiptesis alternativa >
-
+ E
-
el valor
del error tipo ;; se obtiene como una funcin de los valores alternativos de ba(o >
-
,
es decir, para cada valor de
-
se calcula , valor que a veces denotamos por .%. La
r#fica vs .% recibe, como ya se di(o, el nombre de &urva &aracterstica
2perativa, &urva 2&, o curva &2.
4*
Mecordemos que .) es la probabilidad de aceptar la hiptesis nula >0 cuando la
verdadera es la hiptesis alternativa >
-
. 'or lo tanto, -?.% representa la probabilidad
de recha)ar la hiptesis nula cuando la verdadera es la hiptesis alternativa, es decir,
representa la probabilidad de recha)ar hiptesis falsas. /in embaro, en la mayora de
estudios diferentes a los de control de calidad, en ve) de la curva caracterstica
operativa se emplea la r#fica denominada UQuncin de 'otenciaU, donde se rafica
vs -?. %.
;uncin !e Potencia !e una $rueba. La funcin '.% E -?.% recibe el nombre de
funcin de potencia, y representa la probabilidad de recha)ar la hiptesis nula cuando
sta es falsa, es decir, mide la probabilidad de recha)ar hiptesis falsas.
El valor de la potencia es -? y puede interpretarse como la probabilidad de recha)ar
de manera correcta una hiptesis falsa. La potencia es una medida muy descriptiva y
concisa de la sensibilidad de una prueba estadstica, donde por sensibilidad se
entiende la capacidad de una prueba para detectar diferencia. &onsidere la siuiente
prueba de hiptesis+
>
o
+ E
0
E -0 >
-
+ _
0
n E <,` E 0.0=, S E -.
&onsidere tambin las siuientes reiones crticas+
"+ Mecha)ar >
o
si _ -0.@= a+ Mecha)ar >
o
si _ -0.*=
'ara calcular .% es necesario darle valores a , y de ah calcular la potencia -?
.%.'.% E '. _cH E
-
% E -?.%
Las tablas siuientes presentan los valores de los errores tipo ;; y de la potencia para
las pruebas planteadas.
'otencia de la prueba '.%
-0.0 -0.4 -0.* -0.@ -0.A --.0 --.4 --.* --.@ --.A
'rueba
"
0.04@ 0.0A< 0.44B 0.**0 0.@B* 0.A=: 0.<=- 0.<AA 0.<<A -.000
'rueba a 0.0A< 0.44B 0.**0 0.@B* 0.A=: 0.<=- 0.<AA 0.<<A -.000 -.000
Error tipo ;; .%
-0.0 -0.4 -0.* -0.@ -0.A --.0 --.4 --.* --.@ --.A
'rueba
"
0.<B* 0.<-- 0.BB: 0.=@0 0.:4@ 0.-*B 0.0*< 0.0-4 0.004 0.000
'rueba a 0.<-- 0.BB: 0.=@0 0.:4@ 0.-*B 0.0*< 0.0-4 0.004 0.000 0.000
ESTIMACIN CON;I8ENCIA)
4=
La esti#acin coni!encial consiste en determinar un posible rano de valores o
intervalo, en los que pueda precisarse ??con una determinada probabilidad?? que el
valor de un par#metro se encuentra dentro de esos lmites. Este par#metro ser#
habitualmente una proporcin en el caso de variables dicotmicas, y la media o la
varian)a para distribuciones aussianas.
)a t:cnica !e la esti#acin coni!encial consiste en asociar a cada muestra un
intervalo que se sospecha que debe contener al par#metro. " ste se le denomina
inter+alo !e conian(a. Evidentemente esta tcnica no tiene porqu dar siempre un
resultado correcto. " la probabilidad de que hayamos acertado al decir que el
par#metro estaba contenido en dicho intervalo se la denomina ni+el !e conian(a.
3ambin se denomina ni+el !e si'niicacin a la probabilidad de equivocarnos.
Esti#acin Puntual. La inferencia estadstica est# relacionada con los mtodos para
obtener conclusiones o enerali)aciones acerca de una poblacin. Estas conclusiones
sobre la poblacin pueden estar relacionadas con la forma de la distribucin de una
variable aleatoria, con los valores de uno o varios par#metros de la misma.
El campo de la inferencia estadstica se divide en dos+ 'or un lado tenemos el
problema de la estimacin de los par#metros de una distribucin, y por el otro, las
pruebas de hiptesis. En el problema de estimacin se trata de eleir el valor de un
par#metro de la poblacin, mientras que en las pruebas de hiptesis se trata de decidir
entre aceptar o recha)ar un valor especificado .por e(emplo, si la marca " es superior
a la marca a%.
" su ve) el problema de la estimacin se puede dividir en dos #reas+ La estimacin
puntual, y la estimacin por intervalos de confian)a. En forma similar, en el campo de
4@
las pruebas de hiptesis se pueden considerar dos #reas+ 'ruebas de hiptesis sobre
par#metros, para determinar si un par#metro de una distribucin toma o no un
determinado valor, y 'ruebas de aondad de "(uste, para definir si un con(unto de
datos se puede modelar mediante una determinada distribucin.
;nferencia Estadstica Estimacin 'untual
;ntervalos de &onfian)a
'ruebas de >iptesis /obre 'ar#metros
/obre 7istribuciones
En este captulo trataremos el problema de la estimacin .mediante un solo valor% de
los par#metros de una distribucin, y en el captulo siuiente la estimacin de
par#metros mediante un intervalo, denominado intervalo de confian)a.
Esti#acin. En el problema de estimacin se trata de eleir el valor de un par#metro
de la poblacin, se!n una estrateia de la naturale)a.
Esti#acin $untual. La estimacin puntual consiste en utili)ar el valor de una
estadstica o un valor estadstico para calcular el par#metro de una poblacin. 'or
e(emplo, cuando usamos la media muestral x para estimar la media de una
poblacin .%, o la proporcin de una muestra ' para estimar el par#metro de una
distribucin binomial .
1na esti#acin $untual de al!n par#metro de una poblacin es un solo valor

obtenido a partir de un estadstico.


Esti#a!or. /e denomina esti#a!or de un par#metro a un estadstico 3 E
t.9
1
,9
2
,..., 9
n
% que es usado para estimar el valor del par#metro de una poblacin.
"l valor observado del estadstico t E t.x
1
,x
2
,...,x
n
% se le denomina esti#ati+o de .
&uando hablamos del par#metro nos podemos estar refiriendo a un solo par#metro,
o a un con(unto de par#metros desconocidos. /i el par#metro es estimado, lo
representamos como

. Es decir,

E 3 E t.9
-
,9
4
,...,9
n
%
Los estimadores son variables aleatorias, y por lo tanto tienen una funcin de
densidad, correspondiente a las distribuciones mustrales. 'or lo tanto, no hay nin!n
estimador perfecto, ya que siempre habr# al!n error en el proceso de estimacin.
/e!n lo anterior, deben estudiarse distintas propiedades estadsticas de los
estimadores para decidir cual es el m#s apropiado. "lunas de las propiedades a
estudiar corresponden al seso, mnima varian)a, consistencia, eficiencia relativa y
suficiencia.
'ara tratar de responder intuitivamente qu es un buen estimador, considere tres
productos ", a y & para los cuales se hacen proyecciones de demanda. /upona que
4B
al anali)ar la informacin histrica de cada producto, se calcula la diferencia entre el
pronstico y el valor real para cada producto, y sus distribuciones resultantes son las
siuientes+
"+ El mtodo usado para pronosticar la demanda de " es el que me(or hace su
traba(o, ya que queda m#s cerca del valor real y tiene una menor varian)a.
a+ /u pronstico es aproximadamente iual al valor real, pero tiene una mayor
varian)a.
&+ 'eor proyeccin ya que sobrestima la demanda.
En conclusin, si se desea estimar una par#metro , entonces el estimador debe estar
distribuido alrededor de , y tener mnima varian)a. /ea 9
1
,9
2
,...,9
n
una muestra
aleatoria proveniente de una poblacin cuya funcin de densidad es f.x, %. /ea 3 E
t.9
1
,9
2
,...,9
n
% un estadstico usado para estimar el par#metro . Nuestro problema
consiste en encontrar la Ufuncin tU que proporcione la #e*or esti#acin del
par#metro .
PROPIE8A8ES 8E )OS ESTIMA8ORES
Esti#a!ores inses'a!os. &omo no hay nin!n estimador perfecto que de siempre la
respuesta correcta, debera hacerlo por lo menos en promedio. El valor esperado del
estimador debera ser iual al par#metro que trata de estimar. En caso de que lo sea,
se dice que el estimador es inses'a!o, en caso contrario se dira que es sesado.
8einicin. 1n estadstico 3 es un estimador insesado del par#metro si y solo si
E.3%E```` para todo . En caso contrario decimos que es un esti#a!or ses'a!o.
4A
Ses'o. /i 3 es un estimador sesado, la diferencia E.3% ? recibe el nombre de seso.
E*e#$lo. La media muestral es un estimador insesado de la media poblacional
ya que E. %E.
E*e#$lo. 3E9
-
es un estimador insesado de ya que E.9
-
%E
E*e#$lo. /i 9 es ainomial .n,%, demostrar que 9Hn es un estimador insesado del
par#metro .
/olucin. /ea

,
_

n
n
-
% 9 . E
n
-
n
9
% ' . E
n
9
'
por lo tanto es insesado
E*e#$lo. /ea 9
-
, 9
4
,..., 9
n
una muestra aleatoria con E.9
i
%E. 7emostrar que si


N
- i
i
- a entonces 3 E a
-
9
-
L a
4
9
4
L...La
n
9
n
es un estimador insesado de .
E(emplo+ /i /S es la varian)a de una muestra tomada al a)ar de una poblacin infinita,
entonces /S es un estimador insesado de S. 'reviamente habamos demostrado que
E./S% E S.
E*e#$lo. /i
( )
4
n
- i
i
4
9 9
n
-
G


, ser# un estimador insesado de SJ. /e puede
demostrar que
4 4
n
- n
% G . E


E*e#$lo. /ea
( )
4
n
- i
i
4
9
n
-
b


, ser# un estimador insesado de S si es un
par#metro conocidoJ.
E*e#$lo. /er#
( )
4
n
- i
i
4
9 9
- n
-
/

, un estimador insesado de la varian)a S


de una poblacin finitaJ. No, si la poblacin es finita de tamao N, se puede
demostrar que el estimador insesado de S "unque /S es un estimador insesado de
la varian)a de una poblacin infinita, no es un estimador insesado de la varian)a de
una poblacin finita. En nin!n caso / es un estimador insesado de c
E*e#$lo. /upona que 9, el tiempo de reaccin a cierto estmulo, tiene una
distribucin uniforme en el intervalo de 0 a un lmite superior .desconocido%. Es
decir,
4<
/e desea estimar el par#metro ` con base en una muestra aleatoria 9
-
, 9
4
, ..., 9
n
de
tiempos de reaccin. &omo es el tiempo m#ximo de reaccin, para toda la
poblacin, se cumple que .9
-
, 9
4
, ..., 9
n
%, por lo cual podemos considerar como
un primer estimador el siuiente estadstico+
3
-
E 6#ximo.9
-
, 9
4
, ..., 9
n
%.
'or e(emplo, si n E =, y 9 E .-4.*, -:.4, -=,B, @.*, -0.B%

E 9
:
E -=.B.
Es 3
-
un estimador insesado de J. / puede demostrar que

- n
n
% 3 . E
-
El seso b est# dado por
- n +

. &onsidere
% 9 , , 9 . 6ax
n
- n
3
n - 4

+

. Es 3
4
un
estimador insesado de J /i se tienen varios estimadores insesados de un par#metro
por lo eneral se escoe el que tena la menor varian)a.
Esta!"sticos !e or!en. /ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de tamao n. Los
valores se presentan de acuerdo al orden en que son tomados. /upona que la muestra
se ordena de menor a mayor. /ea 9.-% el menor valor de la muestra, sea 9.4% es
seundo valor, 9.i% el valor que ocupa el puesto i al ordenar la muestra de menor a
mayor, y finalmente sea 9.n% el mayor valor de la muestra. Esta muestra ordenada,
9.-%, 9.4%,..., 9.i%,..., 9.n% recibe el nombre de Uestadsticos de ordenU. 7e acuerdo
con lo anterior, los estadsticos 3
-
y 3
4
formulados en el p#rrafo anterior se pueden
reformular como+
3
-
E 9.n%
n
1 n
T
2
+

Los estadsticos de orden son variables aleatorias, y como tales tienen una funcin de
densidad, y se pueden usar para estimar los par#metros de las distribuciones.
Esti#a!ores con #"ni#a +arian(a. /i 3
-
y 3
4
son dos estimadores insesados con
varian)as G.3
-
%y G.3
4
%, respectivamente, y G.3
-
% K G.3
4
%, se dice que 3
-
es m#s
eficiente que 3
4
.
/ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de tamao n. /abemos que tanto 9como 9-
son estimadores insesados de . /in embaro es m#s eficiente que 9
-
para estimar
ya que G. 9% E SHn K G.9-% E S.
Eiciencia Relati+a. Los estimadores insesados suelen compararse en trminos de
sus respectivas varian)as. /i 3
-
y 3
4
son dos estimadores insesados de un par#metro
y la varian)a de 3
-
es menor que la varian)a de 3
4
, se dice que 3
-
es m#s eficiente
que 3
4
. 3ambin se puede usar la siuiente relacin G.3
-
%HG.3
4
% para medir la
eficiencia relativa de 3
4
con respecto a 3
-
.
:0
E*e#$lo. "l calcular la media de una poblacin normal sobre la base de una muestra
de tamao 4nL-, Icu#l es la eficiencia de la mediana con relacin a la mediaJ
/e sabe que la varian)a de la media 9 est# dada por SH.4nL-%. 'ara una muestra
aleatoria de tamao 4nL- de una poblacin normal se sabe que el valor esperado y la
varian)a de la mediana est#n dados por+
n *
% 9
]
. G
]
% 9
]
. E
4


La eficiencia relativa est# dada por+
La eficiencia asinttica de la mediana con respecto a la media est# dada por+
la media muestral es un estimador m#s eficiente de la media poblacional que la
mediana muestral.
La media requiere slo el @*C de las observaciones que requiere la mediana para
estimar la media poblacional con la misma confiabilidad. Estimador insesado de
mnima varian)a. 'ara saber si un estimador insesado es de mnima varian)a o con
seso mnimo, se usa la desiualdad de &r#mer?Mao, dada en el siuiente teorema.
Teore#a. /i 3 es un estimador insesado de y
4
% , x . f ln
nE
-
% 3 . G

,
_

entonces, 3 es el estimador insesado de mnima varian)a de . La cantidad en el


denominador se denomina la UinformacinU que da la muestra acerca del par#metro .
E*e#$lo. 7emuestre que 9es el estimador insesado de mnima varian)a de la
media de una poblacin normal.
:-

'or lo tanto se tiene que
&omo sabemos que 9es un estimador insesado y su varian)a es iual SHn
entonces 9es el estimador insesado de mnima varian)a de .
Teore#a. /ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de tamao n de una poblacin
normal con media y varian)a S. Entonces el estimador
9 3
es el Uestimador
insesado de mnima varian)aU de , tambin denominado 6inimum Gariance
1nbiased Estimator.
Error cua!r-tico #e!io. /i 3 es un estimador sesado de un par#metro es
preferible (u)ar sus mritos y reali)ar las comparaciones de eficiencia sobre la base
del Uerror cuadr#tico medioU.
7efinicin. /ea 3 cualquier estimador de un par#metro . /e define el error
cuadr#tico medio como el valor esperado del cuadrado de la diferencia entre el
estimador 3 y el par#metro que trata de estimar. E&6.3% E Ed.3 ? %
4
e
'ara saber por qu es tan importante el error cuadr#tico medio E&6, veamos cmo se
puede expresar+ E&6.3% E Ed.3 ? %Se E E.3S ? 43 L S% E E.3S% ? 4E.3% LS
/umando y restando ZE.3%[S a ambos lados de la ecuacin se tiene que+
E&6.3% E dE.3S% ? ZE.3%[SeL dZE.3%[S ? 4E.3% L Se
E&6.3% E G.3% L Z ? E.3%[S
7e lo anterior se concluye que el E&6 est# compuesto por dos cantidades no
neativas, que son+
? La varian)a del estimador 3.
1 El cuadrado del seso del estimador.
Es decir, el E&6 involucra las dos propiedades m#s importantes de un estimador
la varian)a del estimador debe ser lo m#s pequea posible, y la distribucin de
muestreo del estimador debe concentrarse alrededor del par#metro.
:4
Error est-n!ar. Es un indicador de la precisin de un estimador .reporte de una
estimacin puntual%.
7efinicin. El error est#ndar de un estimador 3 es su desviacin est#ndar
% 3 . G
3
. 'ara la media el error est#ndar sera n
3
.
"unque en el c#lculo del error est#ndar intervienen par#metros desconocidos cuyos
valores se pueden estimar, la sustitucin de estas estimaciones en el c#lculo
produce el Uerror est#ndar estimadoU del estimador. El error est#ndar estimado se
puede denotar por .
E*e#$lo. /i la duracin de un servicio se distribuye normalmente, entonces
9 ,
.
/i` E 4.= minutos, y se usan muestras de tamao -@, entonces
3
E 4.=H* E 0.@4=
minutos. /i es desconocido y usamos como estimador una desviacin est#ndar
muestral de 4.A, entonces el error est#ndar estimado estar# dado por 4.AH* E 0.B0
minutos.
/i estamos estimando una proporcin , entonces su me(or estimativo ser# la
proporcin muestral, es decir y el error est#ndar ser#
El error m#ximo ocurre cuando ` E 0.=, y ser#
.
/i n E =0 el error m#ximo ser#
Esti#a!ores consistentes. Es ra)onable esperar que un estimador me(ore a medida
que se aumenta el tamao de la muestra. &uando el tamao de la muestra es muy
rande los estimadores tomar#n, por lo eneral, valores muy prximos a los
par#metros respectivos. Este concepto de proximidad se enerali)ar# mediante la
siuiente definicin de consistencia.
7efinicin. El estadstico 3 es un Uestimador consistenteU del par#metro si y solo si
para cualquier constante positiva c se cumple que
en forma equivalente
::
E*e#$lo. La media muestral es un estimador consistente de , y la proporcin
muestral ' E 9Hn es a su ve) un estimador consistente de la proporcin poblacional .
.Ger Ley de los randes n!meros%.
La consistencia es una propiedad asinttica .propiedad lmite%.
Teore#a. El estadstico 3 es un Uesti#a!or consistenteU del par#metro si
-% 3 es un estimador insesado.
4% G.3% 0 cuando n .
Las dos condiciones anteriores son suficientes, pero no son necesarias. Es decir, si un
estimador cumple las dos condiciones, entonces ese estimador es consistente, pero el
hecho de no cumplirlas, no quiere decir que no lo sea. 1n estimador sesado puede
ser consistente solo si es asintticamente insesado, es decir, que se vuelve insesado
cuando n .
E*e#$lo. Es 3 E 9
-
un estimador consistente de la media poblacional J
/olucin. 3enemos que E.3% EE. 9-% E , es decir es insesado, y G.3% E G.9-% E

4
. &omo la varian)a del estimador no tiende a cero, entonces no es consistente, lo
cual se puede verificar al aplicar la desiualdad de &hebyshev, que expresa lo
siuiente+
la cual no tiende a cero cuando n , es decir, que 9
-
no tiende a cuando n es
rande.
'roblema. 7emostrar que la proporcin muestral ' E 9Hn es un estimador consistente
de la proporcin poblacional `.
E*e#$lo. 7emostrar que /S es un estimador consistente de S cuando se toman
muestras de una poblacin normal.
/olucin+ /abemos que+
E./S% E S
/e observa que G./S% 0 cuando n .
E*e#$lo. 7emuestre que es un estimador consistente de S.
Esti#a!ores suicientes. /e dice que un estimador 3 es suficiente si utili)a toda la
informacin relevante de la muestra para estimar el par#metro de la poblacin. Es
:*
decir, un estimador 3 es suficiente si todo el conocimiento que se obtiene acerca del
par#metro es mediante la especificacin real de todos los valores de la muestra.
E*e#$lo. /e tiene una muestra aleatoria .9
-
, 9
4
, ..., 9
n
% de tamao :0 tomada de una
poblacin exponencial f.x, %, donde es un par#metro desconocido. &onsidere las
dos estadsticos siuientes+
:0 : 4 -
4
4< = : -
-
9 9 9 9
-
3
9 9 9 9
-
3
+ + + +

+ + + +


El estadstico 3
-
no es un estimador suficiente del par#metro ` mientras que 3
4
s lo
es.
8einicin. /e dice que un estadstico 3 E t.9
-
, 9
4
, ..., 9
n
% es suiciente para un
par#metro si la distribucin con(unta de 9
-
, 9
4
, ..., 9
n
dado 3 se encuentra libre de
, es decir, si se afirma 3, entonces 9
-
, 9
4
, ..., 9
n
no tienen nada m#s que decir acerca
de .
Qormalmente esto puede expresarse en trminos de la distribucin condicional de los
valores de la muestra, dado que E 3. Esta cantidad est# dada por,
% t .
% x ,.., x . f
% t .
% t , x ,.., x . f
% t H n 9 ,..., 9 . f
n - n -
N -

donde la expresin final del numerador se siue de la condicin de suficiencia.
Utili!a!. /i un estimador insesado 3 de un par#metro es una funcin de un
estadstico suficiente, entonces tendr# la varian)a m#s pequea entre todos los
estimadores insesados de . "dem#s, si existe el estimador m#s eficiente de , ste
ser# un estadstico suficiente.
Teore#a de factori)acin de Ne&#an. /ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de
una distribucin con funcin de densidad f.x,%. /e dice que el estadstico 3 E t.9
-
,
9
4
, ..., 9
n
% es un estadstico suficiente para si y solo si la funcin de verosimilitud se
puede factori)ar de la siuiente manera+
L.9,% E h.t, % .x
-
, x
4
, ..., x
n
%
para cualquier valor t.x
-
, x
4
, ..., x
n
% de 3 y donde .x
-
, x
4
, ..., x
n
% no contiene el
par#metro .
E*e#$lo. /ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de tamao n de una distribucin
ama, cuya funcin de densidad est# dada por,
% O .
% t .
e % t . f
- O
t


, t\0
:=
La funcin de verosimilitud est# dada por+
% O .
t t e
% , 9 . L
n
- i
n
- i
i i
nO






E*e#$lo. /ea 9
-
, 9
4
, ..., 9
n
una muestra aleatoria de tamao n de una distribucin de
'oisson con par#metro cuya funcin de densidad est# dada por,
Y x
e
% t . f
x

7emostrar que el estimador eficiente para ` es a su ve) un estimador suficiente. La


funcin de verosimilitud est# dada por+
, donde

ESTIMA8ORES 8E M=>IMA %EROSIMI)ITU8
/ea 9 una variable aleatoria con funcin de probabilidad f.x,%. Las muestras
aleatorias simples de tamao n, 9
-
,..,9
n
tienen por distribucin de probabilidad
con(unta
% , x . f % , x . f % , x . f % 8 x ,..., x . f % 8 x ,.., x . f
n 4 - n - n - c

Esta funcin que depende de nL- cantidades podemos considerarla de dos maneras+
? Qi(ando , es una funcin de las n cantidades x
i
. Esto es la funcin de probabilidad
o densidad.
? Qi(ados los x
i
como consecuencia de los resultados de eleir una muestra mediante
un experimento aleatorio, es !nicamente funcin de . " esta funcin de la
denominamos ;uncin !e %erosi#ilitu!.
En este punto podemos plantearnos el que dado una muestra sobre la que se ha
observado los valores x
i
, una posible estimacin del par#metro es aquella que
#a2i#i(a la funcin de verosimilitud .cuidado no confundir G.% con la varian)a. En
alunos textos aparece la funcin de verosimilitud como L.%%
x
-
,W,x
n
fi(ados fGerosimilitud+ G.%Ef.x
-
,..,x
n
8%
:@
La funcin de verosimilitud se obtiene a partir de la funcin de densidad,
intercambiando los papeles entre par#metro y estimador. En una funcin de
verosimilitud consideramos que las observaciones x
-
, ..., x
n
, est#n fi(adas, y se
representa la r#fica con el valor de los valores que tomara la funcin de densidad
para todos los posibles valores del par#metro . El estimador m#ximo verosmil del
par#metro buscado,
mv
,

es aquel que maximi)a su funcin de verosimilitud, G.%.


&omo es lo mismo maximi)ar una funcin que su loaritmo .al ser este una funcin
estrictamente creciente%, este m#ximo puede calcularse derivando con respecto a la
funcin de verosimilitud .bien su loaritmo% y tomando como estimador m#ximo
verosmil al que haa la derivada nula+
0 % .
G lo
mv

7e modo m#s preciso, se define el esti#a!or #-2i#o +eros"#il como la variable


aleatoria
% 8 9 ,..., 9 . f max
,
n -
,
mv


. Los estimadores de m#xima verosimilitud
tienen ciertas propiedades en eneral que a continuacin enunciamos+
-. /on consistentes8
4. /on invariantes frente a transformaciones biunvocas, es decir, si
mv
,

es el
estimador m#ximo verosmil de y %
,
. es una funcin biunvoca de ,
entonces
%
,
.
mv

es el estimador m#ximo verosmil de .%.


:. /i
,
es un estimador suficiente de , su estimador m#ximo verosmil,
mv
,

es
funcin de la muestra a travs de
,
8
*. /on asintticamente normales8
=. /on asintticamente eficientes, es decir, entre todos los estimadores consistentes
de un par#metro , los de m#xima verosimilitud son los de varian)a mnima.
@. No siempre son insesados.
Al'unos esti#a!ores un!a#entales. Gamos a estudiar las propiedades de ciertos
estimadores que por su importancia en las aplicaciones resultan fundamentales+
:B
estimadores de la esperan)a matem#tica y varian)a de una distribucin de
probabilidad.
Esti#a!or !e la es$eran(a #ate#-tica. &onsideremos las muestras de tamao n,
9
-
,W,9
n
, de un car#cter sobre una poblacin que viene expresado a travs de
una variable aleatoria 9 que posee momentos de primer y seundo orden, es
decir, existen E.9% y G.9%+
E.9
i
%E G.9
i
%E
4
El estimador #e!ia #uestral que denotaremos normalmente como 9 .en luar de
,
es
% 9 9 .
n
-
9
n -
+ +
verifica+
n % 9 . G % 9 . E
4

'or tanto es un estimador insesado. /i adem#s sabemos que 9 se distribuye se!n
una ley aussiana, es sencillo comprobar que coincide con el estimador de m#xima
verosimilitud,
Pro$osicin. ( ) n H , N 9 % , . N 9
mv i

La demostracin es, La funcin de densidad de una observacin cualquiera de la
muestra es+ 9i]N.,% para todo x que pertene)ca al con(unto de los reales.
'or tanto la distribucin con(unta de la muestra es
% , , x . f % , , x . f % , , x . % , 8 x ,.., x . f
4
n
4
4
4
-
4
n - c

'ara unos valores x
-
,W,x
n
fi(ados, la funcin de verosimilitud es
( ) ( ) ( )
4
i
n
- i
4 4
n
4 4
4
4 4
-
x
4
- n
4 H x 4 H x 4 H x 4
4
n
4
4
4
-
4
e
4
-
e
4
-
X X e
4
-
X e
4
-
% , . G
% , , x . f % , , x . f % , , x . % , . G

,
_

,
_

.en principio escribimos tambin el otro par#metro desconocido,


4
, aunque no nos
interesamos en su estimacin por el momento%. La expresin de la funcin de
verosimilitud es alo enorrosa. 'or ello es preferible traba(ar con su loaritmo+
4
n
- i
i 4 4
x
4
-
% 4 lo.
4
n
% , . G lo

,
_



:A
El m#ximo de la funcin de verosimilitud se alcan)a donde lo hace su loaritmo
.monotona%, por tanto derivando con respecto a

e iualando a cero se llea a+



,
_

n
- i
n
- i
mv i
4
mv i
4
4
mv
n x
-
x
n
% , .
G lo
0
Es decir, el estimador m#ximo verosmil de la media poblacional, , coincide con la
media muestral


n
- i
i mv
x
n
-
como queramos demostrar
El estimador de m#xima verosimilitud de para una variable aussiana es la media
muestral.

La distribucin del estimador muestral 9 del par#metro poblacional , tiene por
valor esperado al mismo .insesado%, y su dispersin disminuye a medida que
aumenta el n!mero de observaciones
:<
Esti#a!or !e la +arian(a. " la hora de eleir un estimador de
4
EG.9%, podemos
comen)ar con el estimador m#s natural+
( )


n
- i
4
i
4
9 x
n
-
s
'odemos comprobar que cuando el car#cter que se estudia sobre la poblacin es
aussiano, en realidad este es el estimador m#ximo verosmil para la varian)a. /in
embaro se comprueba tambin su falta de seso, lo que hace mas adecuado que se
utilice como estimador de la varian)a al siuiente concepto+ cuasivarian)a muestral
Pro$osicin. >i?N@,A, entonces,
4
mv
4
, s
7emostracin+ Mecuperamos el loaritmo de la funcin de verosimilitud, donde en
esta ocasin el primer par#metro ya fue obtenido por el mtodo de m#xima
verosimilitud .y vimos que era la media muestral% y tratamos de maximi)arla con
respecto al seundo par#metro+
( ) ( )
4
n
- i
i
4
4 4
x x
4
-
lo % 4 lo.
4
n
% , x . G lo

+
7erivando con respecto a
4
e iualando a cero se obtiene el estimador m#ximo
verosmil+
( )

,
_

n
- i
4
i
4
4
mv
4
mv
4
mv
4
x x
,
-
4
-
4
n
% , , .
G lo
0
7espe(ando de esta ecuacin se obtiene que el estimador m#ximo verosmil coincida
con la varian)a muestral,


n
- i
4
i
4
mv
% x x .
4
-
,
Pro$osicin. El valor esperado del estimador


n
- i
4
i
4
% 9 9 .
n
-
s
no es
4
, y por tanto el estimador m#ximo verosmil para la varian)a no es insesado.
6#s a!n, E.
4
%E.n?-%
4
Hn
7emostracin. &omen)amos escribiendo los valores esperados
*0



,
_


,
_


n
- i
4 4
i
n
- i
4 4
i
n
- i
4
i
4
% 9 . E % 9 . E
n
-
9 9
n
-
E % 9 9 .
n
-
E % s . E
4
4
4
i
4
i
4
i
4 4 4
i
4
i
4
i i
n
% 9 . E % 9 . E % 9 . E % 9 . G
% 9 . E % 9 . E % 9 . E % 9 . G
+


+
Lueo

,
_

+
n
- i
4 4
4
4 4 4
n
- n
n
% .
n
-
% s . E
Cuasi+arian(a #uestral. 'ara tener un estimador insesado de la varian)a
introducimos la cuasivarian)a muestral
4
s, que se define como

n
- i
4
i
4 4
% 9 9 .
- n
-
s
- n
n
s,
Es inmediato comprobar que realmente este estimador es insesado
4 4 4 4
n
- n
- n
n
s
- n
n
E % s, . E


,
_

Esa esperan)a puede ser calculada de un modo m#s directo, ya que la distribucin del
estimador
4
es conocida usando el teorema de &ochran+

,
_

n
- i
4
- n
4
i
4
4
9 9 ns
lueo
*
4
4
4
4
4 4
4
4
n
% - n . 4
% s . G % - n . 4
ns
G
n
- n
% s . E - n
ns
E

,
_

,
_

La distribucin de la cuasivarian)a muestral es tal que


4
- n
4
4
s, % - n .

Quncin de densidad del estadstico que relaciona


4
s, ,
4
y los rados de libertad de
la muestra .n?-%. La falta de simetra del mismo hace que su valor esperado .n?-% se
desplace a la derecha de la moda .asimetra positiva%.
*-
Teore#a+ /ean 9
-
, 9
4
y 9
:
variables aleatorias que tienen una distribucin con(unta
absolutamente continua, tambin la tiene un pare de ellas 9
-
,9
:
y una funcin de
densidad de con(unta para estas dos puede escribirse,
f x x f x x x
X X X X X
1 3 1 2 3
1 3 1 2 3 2 ,
( , ) ( , , )dx

Teore#a+ /ean 9
-
,...,9
:
variables aleatorias que tienen una distribucin con(unta
absolutamente continua, la condicin suficiente y necesaria qpara que sean
independientes es que la densidad con(unta de ellas sea,
f x x f x
X X n
j
n
X j
n j 1
1
1
,...,
( ,..., ) ( )

La funcin de distribucin condicional de un variable aleatoria 9, con la condicin de


que otra variable aleatoria $ tome el valor de y, $Ey, es
[ ] [ ] ( ) + <
+
y $ y x 9 ' Lim % y H x . Q
0
$ H 9 siempre y cuando este lmite exista.
"dem#s se debe cumplir que,

x
$ H 9 $ H 9
dt % y H t . f % y H x . Q
Teore#a+ /i 9 y $ son variables aleatorias que tiene una distribucin con(unta
absolutamente continua, entonces, en todo punto .x,y% en el que f
9,$
.x,y% sea continua
y, adem#s, sea f
$
.y%_0 continua, existe una densidad condicionada de 9 dada $,
% y . f
% y , x . f
% y H x . f
$
$ , 9
$ H 9

7ensidades de funciones de variables aleatorias. /ean las variables aleatorias 9
-
,...9
n
que tienen distribucin con(unta absolutamente continua, y es necesario calcular la
densidad de una variable aleatoria $ que es funcin de 9
-
,...,9
n
, siendo ella suma de
stas. /ea
S E
n

( )
un con(unto incluido en el espacio Euclideo E de dimensin n, el
cual se define como
*4
e a % x ,... x . u ,..., a % x ,..., x . u % x ,..., x d. /
n n - n - n - - n -


con a
i
constantes. Las probabilidades
/
n - n - x ,..., 9 n -
dx ... dx % x ,..., x . f ... [ / % 9 ,..., 9 Z. '
n -

$ sea que el determinante del gacobiano no sea nulo para (u ,..., )
1
u
n
, siendo
e n i - , b % u ,..., u . x a % u ,... u d.
i n - i i n -

n
n
4
n
-
n
n
4
4
4
-
4
n
-
4
-
-
-
n -
n -
u
x
...
u
x
u
x
... ... ... ...
u
x
...
u
x
u
x
u
x
...
u
x
u
x
% u ... u .
% x ,.., x .

El cual se transforma mediante el cambio de variables en las interales m!ltiples para


la caso particular de coordenadas polares,

cos r sen
rsen cos
% , r .
% y , x .
Er,
para nE4, u
-
Er, u
4
E , x
-
E9Ercos , x
4
EyErsen , y por consiuiente,

cos r
y
y sen
r
y
, rsen
x
, cos
r
x
y por tanto se tendr#


-
-
4
4
b
a
M
b
a
rdrd % rsen , cos r . > dxdy % y , x . >
de donde
{ }
4 4 - -
b rsen a , b cos r a % , r . M
Teore#a+ /ean 9
-
,...,9
n
variables aleatorias que tienen una distribucin con(unta
absolutamente continua, y sean u
-
.x
-
,...,x
n
%,...,u
n
.x
-
,...,x
n
% una aplicacin en el espacio
E
.n%
en s mismo que satisface a las condiciones exiidas en el teorema anterior con
cambio de variables en las interales m!ltiples. /ea 1
i
Eu
i
.9
-
,..,9
n
%, Entonces,
1
-
,...,1
n
tiene distribucin con(unta absolutamente continua y densidad,
*:
( )
% u ,..., u .
% x ,..., x .
% u ,.., u . x %,..., u ,.., u . x f % u ,.., u . f
n -
n -
n - n n - - 9 ,.., 9 n - 1 ,..., 1
n - n -

Teore#a+ /ean 9
-
,...,9
n
variables aleatorias independientes, cada una de ellas con
una distribucin absolutamente continua, y sean r
-
,...,r
O
, O enteros positivos, tales que,
r
-
L...Lr
O
En. Entonces, la O variables aleatorias
n - r n r r - r r -
9 ... 9 ,..., 9 ... 9 , 9 ... 9
O 4 - - -
+ + + + +
+ + +
son independientes.
ESTIMACIN PUNTUA)
/ea un con(unto fundamental de probabilidades asociado con una sima ? alebra
de sucesos w y probabilidad ', y se tendr# en 9 una variable aleatoria definida sobre
.

( ) n
est# constituido por todos los posibles .h
-
,...,h
n
% para todas las elecciones
posibles h
-
,...,h
4
en . /e traba(ar# con h
.n%
al elemento de

( ) n
El sima ? anillo

de sucesos compuestos por los sucesos elementales de este


con(unto fundamental de probabilidad

( ) n
, entonces para toda A A
n 1
,.., , se
define,
A A w w A w A
n
n n
n n 1 1 1
{ ,..., }
( ) ( )

Este suceso es el suceso compuesto que siue+ "


-
ocurre en la primera prueba, "
4
en
la seunda, y as sucesivamente. " un suceso compuesto as, es lo llamado suceso
rectanular, y es necesario que la sima i alebra contena todos estos sucesos.
/ea
% n .
el con(unto de todos los sucesos rectanulares y sea
% n .
el mnimo sima
i anillo de subcon(untos de
% n .

que contienen a
% n .
, esto sinifica que
% n .
son
la interseccin de todos los sima anillos de subcon(untos de
% n .

que contienen a
% n .
. 'or lo anterior solo hay que demostrar,
? La interseccin de cualquier sima i anillo de
% n .

es un sima ? anillo
? El con(unto de sima i anillos que contienen a
% n .
no es vaco
Lema+ /ea d

, e el con(unto no vaco de sima ianillos de subcon(untos de

( ) n
, entonces,

es un sima i anillo.
**
2tro problema importante, es definir la probabilidad '
.n%
sobre
( ) n
, y para cada
suceso rectanular en
( ) n
, A A
n 1
lo que se define como

n
- i
i n -
% n .
% " . ' % " " . '


"l tomar una muestra con restitucin, permite mane(ar elementos independientes,
entonces,
( ) % " . ' " '
i
% n .
i , i % n .

. Esto es,

n
- i
i n -
% n .
% " . ' % " " . '


Teore#a+ Las funciones 9
-
,..,9
n
definidas sobre

( ) n
como se ha explicado
anteriormente, son variables aleatorias independientes entre s y cada una con la
misma funcin que 9
Las variables aleatorias 9
-
,..,9
n
independientes e idnticamente distribuidas, indica
que en n observaciones de la variable 9 no uardan relacin entre s.
/i tomamos la muestra sin restitucin de elementos de , cada n?upla h
.n%
vendra
constituida por n elementos procedentes de la poblacin , entonces

( ) n
sera el
con(unto de estas n?uplas.
/ea la sucesin infinita 9
-
,..,9
n
de variables aleatorias, como observaciones
independientes,
% .
n -
% .
,...% h ,.., h . h

y se define
( ) % h . 9 h 9
n n
% .
n

para todo n positivo y entero.


Esti#aciones I#$arciales & Consistentes. /ea una poblacin con una variable
aleatoria 9 definida sobre ella, y sea una constante asociada a ella, que se pretende
valorar. /ea la extensin de la muestra n, y considerando la variable aleatoria 1
definida sobre

( ) n
.
1na variable aleatoria 1 es una estimacin I#$arcial de , sui la esperan)a de 1
existe y es EZ1[E , cualquiera sea el valor de este par#metro+ EZ1H [E
1na sucesin d1
n
e es Consistente de estimaciones de la constante , si U
n
P
,
cualquiera sea . En otras palabras,
[ ] n para , 0 1 '
n
, con
> 0,
*=
Teore#a+ /ea una poblacin y 9 una variable aleatoria observada definida sobre
la misma poblacin, la cual tiene distribucin discreta o absolutamente continua y
donde existe el seundo momento de orden finito. /i 9
-
,..,9
n
son n observaciones
independientes de 9 y s 9E.9
-
L...L9
n
%Hn, entonces, 9
n
es una estimacin imparcial y
consistente de EZ9[
Teore#a+ 3anto

n
2
como s
n
2
son estimaciones consistentes de GarZ9[. 7emostrar
que s
n
2
es una estimacin imparcial de GarZ9[, pero no

n
2
, siendo GarZ9Z una
estimacin imparcial.
Teore#a+ /ea 1
n
una variable aleatoria definida sobre

( ) n
, y suponamos que ella
es una estimacin imparcial de y adem#s que EU
n
[
2
< . /i G
-
,G
4
,... es una
sucesin de observaciones independientes de 1
n
, y sea D
n
E.G
-
L...G
n
%Hn para todo n,
entonces la sucesin dD
n
e es una sucesin consistente de
/ea una poblacin y sean liadas a ella una serie de constantes
1
,...,
!
que est#n
por conocerse, y no se pueden medir directamente, entonces, sea 9 una variable
aleatoria definida sobre la poblacin de tamao n, y d9
n
e es una sucesin de
observaciones independientes de 9, y sobre la cual conocemos la distribucin
% H x . Q
i 9
. El problema consiste en hallar las estimaciones.
El ran problema reside, y para ello traba(emos con dos variables desconocidas
1 2
,
, en que se debe suponer que
< [ 9 Z E
*
y que se conocen los dos primeros
momentos m
-
y m
4
y que son funciones de
1 2
" . "dem#s hay que suponer que



n
- O
4
' 4
O n -
'
n
m 9
n
-
G y m 9
y por !ltimo, que las funciones
1 2
( , ) ( , ) x " " x " son tales que
% m , m . % G , 9 . y % m , m . % G , 9 .
4 - 4
'
n n 4 4 - -
'
n n -

,
con lo cual finalmente se demuestra que,
{ } { } % G , 9 . y % G , 9 .
n n 4 n n -

son
sucesiones consistentes de estimaciones de
1 2
" , respectivamente.
Teore#a+ /ea f.x,y% una funcin y sean d9
n
e y d$
n
e unas sucesiones de las variables
aleatorias tales que
b y$ a 9
'
n
'
n

, siendo a y b constantes, entonces, f es continua
en .a,b% y si f.9
n
,$
n
% es variable aleatoria para cualquier n, entonces,
*@
( ) % b , a . f $ , 9 f
'
n n

Esti#acin !e %arian(a M"ni#a. 3raba(ando con la distribucin de 'oisson como
e(emplo. /ea 9 una variable aleatoria definida sobre una poblacin , con
distribucin de 'oisson
... - , 0 x , Y x H e [ x 9 Z '
x


,
siendo > 0 la constante desconocida, entonces al reali)ar n pruebas independientes
de 9, sean 9
-
,...,9
n
y a partir de ellas hacer la estimacin de esta variable.
/e calcula EZ9[ y EZ9
4
[ y se tienen unos valores de y
4
L , de donde la varian)a
resulta ser , y por tanto, X
n
como s
n
2
son estimadores consistentes e imparciales
de
/ea 9 una variable aleatoria definida sobre la poblacin y sean 9
-
,...,9
n
sus n
observaciones independientes, y suponamos que la funcin de distribucin de 9 es
absolutamente continua .lo cual es v#lido para el caso discreto%, entonces la funcin
f
9
.x% es la densidad de 9 que es de una variable desconocida , f.xH %.
'ara traba(ar con un e(emplo, sea
X # ( , ) 01
, entonces la funcin de densidad puede
ser, < <

,
_

x ,
4
% x .
- exp
4
-
% H x . f
4
/ea

.9
-
,...,9
n
% una estimacin imparcial de . $ adem#s, para mnima varian)a
de lo anterior se debe cumplir+ El con(unto " de todos los valores posible de mes
un intervalo abierto, acotado o no8

f x ( / )
debe existir para todo < < x 8 las
expresiones

,
_

n -
n
- i
i
dx ... dx % H x . f ...

y

,
_


n -
n
- i
i n -
dx ... dx x . f % x ,..., x .
,
...

puedan derivarse ba(o el sino interal con respecto a 8 y finalmente,
<

,
_


4
% 9 . Lof
E
para todo A
Teore#a. .7esiualdad de &ramer i Mao%+ &on las hiptesis mencionadas
anteriormente, demostrar,
*B
( )
4
n -
"
% 9 . Lof
E
n
-
% 9 ,..., 9 .
,
Gar

,
_




,
teniendo en cuanta que el sino iual solo es v#lido cuando exista una constante O,
que depende de y n, tal que la probabilidad
4
n
- O
O
% 9 . Lof
E
n
-
% 9 . Lof

,
_

Princi$io !e M-2i#a Probabili!a!. /ea 9 una variable aleatoria definida sobre una
poblacin con una distribucin discreta o absolutamente continua. /ea f.xH % la
densidad dependiente de x y de desconocido. El problema es estimar . /ean
9
-
,...,9
n
observaciones de 9 con una densidad con(unta f.x
-
,...,x
n
H %
/e debe procurar siempre encontrar una estimacin .9
-
,...,9
n
% de para la cual
f.9
-
,...,9
n
H % sea m#ximo. En la pr#ctica es hallar como una funcin de x
-
,...,x
n
% 9 ,..., 9 .
,
n -
para qua la funcin f.x
-
,...,x
n
H % resulte maximi)ada y entonces se
sustituyen las observaciones.
Teore#a+ /upuestas las condiciones impuestas en al numeral anterior, relativo ala
estimacin de la varian)a, si % 9 ,..., 9 .
,
n -
es una estimacin imparcial de con
varian)a mnima en el sentido dela desiualdad de &ramer i Mao, entonces,
% 9 ,..., 9 .
,
n -
es una estimacin de % 9 ,..., 9 .
,
n -
con m#xima probabilidad.
/ea 9 una variable aleatoria discreta o continua cuya funcin de probabilidad f.x%
depende de un par#metro . /e efect!a n veces un experimento y se obtiene x
-
,...,x
n
resultados independientes
La probabilidad de que la muestra conste de n elementos es % x . f % x . f
n -
y en
el caso continuo de que la muestra conste de pequeos valores
,... x x x x , x x x x
4 4 - -
+ + es
n
4 -
% x . x % x . xf % x . f
/ est#n dados y son fi(os los x
-
,x
4
,... entonces es una funcin de y es la funcin
de verosimilitud
/e trata de escoer la aproximacin para , para que sea tan pequeo como sea
posible .el cual debe ser derivable%,
0

para que exista el m#ximo, lo cual


conduce a la solucin y es la estimacin de m#xima verosimilitud para +
0 , , 0
r -

*A
Inter+alo !e Conian(a3 Es la estimacin por intervalos teniendo en cuenta el error
m#ximo, intervalo en le cual est# el valor exacto. /e escoe una probabilidad

cercana a - y se determinan dos cantidades



1 2
"
, tal que, que la probabilidad
de que incluyan el valor exacto desconocido del par#metro sea iual a

% . '
4 -
y este es el intervalo de confian)a e d &onf
4 -
que son los limites de confian)a
E*e#$lo, para el valor medio de la distribucin normal con varian)a conocida y un
nivel de confian)a del <=C, tenemos,
<@ , - c , <= , 0 con
y calculamos el valor
medio de la muestra x
-
,...,x
n
de tamao n, y lueo,
n
c
O

, quedando el nivel de
confian)a
e O x O x d &onf +
/i

es rande, una observacin de 9 ser# !til para reducir la incertidumbre en la


prediccin de $
La independencia indica que las variables no est#n relacionadas, y por tanto, el
coeficiente de correlacin tiende a cero. Lo anterior es v#lido en este sentido, pero no
existe el reciproco.
El coeficiente de correlacin mide la dependencia lineal entre dos variables
aleatorias, y si y solo s, existe relacin funcional lineal entre las variables, de la
forma $EaLb9
'ropiedades
[ $ Z E [ 9 Z E [ 9$ Z E %[ m $ %. m 9 Z. E [ $ , 9 Z &ov
%[ $ , 9 . Z E %[ $ , 9 . Z E %[ $ , 9 . % $ , 9 . Z E
% y , x . p % y x . [ D Z E
y x
4 - 4 -
x y
9$

+ +
+

Teore#a3 /i


n
- i
i i n -
9 a % 9 ,..., 9 . $
, entonces,

1
]
1

n
- i
i i
n
- i
i i
[ 9 Z E a 9 a E [ $ Z E
y
+
+
n
- i
n
- i (
( i ( i
n
- i
i
4
i
[ $ , 9 Z &ov a a 4 [ 9 Z G a [ $ Z G
*<
Teore#a3 /ea DEa9Lb$, entonces se cumple que,
[ $ , 9 Z ab&ov 4 [ $ Z G b [ 9 Z G a [ D Z G
4 4
+ +
Teore#a3 /i DE9$, entonces,
[ $ Z E [ 9 Z E [ $ , 9 Z &ov [ D Z E +
,
y s 9 y $ est#n correlacionadas, entonces, EZD[EEZ9[EZ$[.
$ si 9 y $ son independientes, entonces,
4
y
4
x
4
x
4
y
4
y
4
x
m m [ 9$ Z E + +
La esperan)a condicional es !til para la prediccin. La medida es la prediccin de $
que tiene un error cuadr#tico esperado mnimo
[ % m $ Z. E
4
y

"proximaciones+ $E.9% si esta relacin se comporta bien y el coeficiente de


variacin de 9 no es muy rande, entonces son v#lidas las aproximaciones
4
m
x
dx
% x . d
[ 9 Z G GZ.9%[ E GZ$[
.EZ9[% EZ.9%[ E EZ$[
1
]
1

lo cual se puede expresar en otras palabras como,


x m y
x
dx
% x . d

1
]
1


que es la
derivada de .x% con respecto a x calculada en m
x
.
/i el coeficiente de variacin es menos que el -0C, es claro que el error de esta
aproximacin es menor que el -C. /i el valor de G
x
es pequeo, 9 es probablemente
muy cercano a m
x
, entonces, es aplicable la serie de 3aylor,
+

+ +
4
4 4
x
m x x
dx
% x . d
4
% m 9 .
dx
% x . d
% m 9 . % m . % 9 .
x
para encontrar la distribucin aproximada de $, al menos en la rein media.
7esarrollando 3aylor de $E.9% de(ando los dos primeros trminos lineales de 9+
9
dx
% x . d
dx
% x . d
m % m . $
x x
m m x x
1
]
1

+
1
]
1



que es de la forma $EaLb9 y sabiendo que
f "
$
f
" %
$
" x
( )

_
,

1
, tenemos
entonces,

'

1
]
1

+

,
_

x
x
x
m
m x x
x
m
x y
dx
% x . d
dx
% x . d
m % m . y
f
dx
% x . d
-
b
a y
f
b
-
% y . f
1n estimador de m#xima verosimilitud de una muestra aleatoria 9
-
,...,9
n
es el
valor de que maximi)a a L.9
-
,...,9
n
8 % con L.9
-
,...,9
n
8 %Ef.9
-
8 %f.9
4
8
=0
%...f.9
n
8 % siendo f.x8 % la funcin de distribucin de probabilidad de 9 calculada
en x, como para 'Z9Ex[ si 9 es discreta
/ea 9
-
,..,9
n
la muestra aleatoria de la variable aleatoria 9 y x
-
,...,x
n
sus valores
mustrales, la funcin de probabilidad L, L.9
-
,...,9
n
8 %Ef.9
-
8 %...f.9
n
8 %
/i 9 es discreta L.x
-
,...,x
n
8 % representa 'Z9
-
Ex
-
,9
4
Ex
4
,...,9
n
Ex
n
[
/i 9 es continua L.x
-
,...,x
n
8 % representa la funcin de distribucin de probabilidad
con(unta de .9
-
,9
4
,...,9
n
%
Pro$ie!a!es3 El estimador puede ser sesado, el cual se puede evitar multiplicacin
por una constante apropiada. En condiciones enerales son converentes, esto es, si n
es muy rande, el estimador tiende al valor del par#metro.
/i

es un estimador para definido sobre la muestra aleatoria 9


-
,...,9
n
de una
variable aleatoria 9, entonces, para n rande, la variable aleatoria

tiene
aproximadamente una distribucin
( ) a H - , N
siendo
4
% 8 9 . Lnf nE a
1
]
1

,
f es la funcin de probabilidad puntual o funcin de distribucin de probabilidad de 9
dependiendo de s 9 es discreta o continua y se supone que es un n!mero real.
=-

S-ar putea să vă placă și