Documente Academic
Documente Profesional
Documente Cultură
Tema:DistribucionesMuestralesPropiedadesEstimadores
Clase27agosto2014
Pequeorepaso:
Laestadsticaconstade2partes:
Estadsticadescriptiva:seocupadelarecoleccin,organizacinypresentacindelosdatos.
Inferencia estadstica: realiza generalizaciones, en base de una parte sobre el todo. La inferencia
estadstica se ocupa del desarrollo de sus mtodos (teora estadstica) y su utilizacin (aplicacin
delaestadstica)
Conceptosbsicosdelainferenciaestadstica
Variables: la estadstica se ocupa de fenmenos que pueden ser medidos o contados: cuando
estamos ante la presencia de un fenmeno que se puede medir, hablamos de una variable para
indicar una cantidad homognea que puede tomar valores distintos en distintas observaciones.
Cuando el fenmeno slo se puede contar, hablamos de atributo o variable ficticia. El atributo
representalapresenciaolaausenciadeunacaractersticadeterminada.
Clasificaciones:
Las variables aleatorias, son variables cuyos valores no se pueden determinar
antes de ser observados, ni se pueden controlar. La caracterstica de las variables
aleatorias es que toman distintos valores, con probabilidades distintas de la
unidad.
Las variables no aleatorias: son aquellas variables totalmente controlables o que,
almenos,sepuedepredecirporcompleto.
Las variables continuas: puede tomar cualquier valor sobre el eje numrico o una
partedel.
Las variables discretas: slo pueden tomar algunos valores determinados sobre la
escala numrica. Estos valores estn separados normalmente (aunque no
siempre)porintervalosdelamismalongitud.Ej:nrodehijos,variablesbinarias.
1
Materia:EstadsticaIIDistibucionesMuestralesyPropiedadesdelosEstimadores
Si las variables aleatorias X1, X2,...Xn tienen la misma funcin (densidad) de probabilidad que la de la
distribucin de la poblacin y su funcin (distribucin) conjunta de probabilidad es igual al producto de las
marginales, entonces X1, X2,...Xn forman un conjunto de n variables aleatorias independientes e
idnticamente distribuidas (IID) que constituyen una muestra aleatoria de la poblacin (Canavos 7.1, pag
217)
Un estadstico es cualquier funcin de las variables aleatorias que se observan en una muestra de manera
queestafuncinnocontienecantidadesdesconocidas(Canavos7.3,pag219)
Distribuciones:distribucindefrecuencias(relativayabsoluta).
Lanaturalezadelainferenciaestadstica
Utilizamos las muestras para establecer juicios respecto de las poblaciones de las que provienen las
muestras. Si la poblacin es infinita, no se podr observar nunca por completo, y los juicios respecto a ella
slo pueden proceder de una muestra. Asimismo, incluso en el caso de que la poblacin sea finita, puede
haber buenas razones para observar nicamente una muestra (ejemplo, predecir la duracin de una
bombita)
Nos interesa estudiar algunas caractersticas de las poblaciones (parmetros). El objetivo del muestreo y
delainferenciaesestablecerjuiciossobreestosparmetros,basadosenlosestadsticosdelamuestra.
Estosjuiciossonpronsticosdotadosdeungradodeconfianza.Estosjuiciospuedenserdedostipos:
Estimacindeunparmetroparaestoestudiaremoslaspropiedadesdelosestimadores
Contrastacin de alguna hiptesis respecto a un parmetro estudiaremos distribuciones
muestrales.
2
Materia:EstadsticaIIDistibucionesMuestralesyPropiedadesdelosEstimadores
Estimacin
Podemos dividir la teora de la estimacin en dos partes, la estimacin por puntos y la estimacin por
intervalos.
Estimacin por puntos, el objetivo consiste en calcular, utilizando informacin a priori y la
proporcionada por la muestra, un valor que sea, en algn sentido, el mejor pronstico acerca del
valorrealdelparmetroquenosinteresa.
Estimacin por intervalos: se utiliza la misma informacin con el fin de obtener un intervalo que
tenga un nivel determinado de probabilidad de abarcar el verdadero valor del parmetro (intervalos de
confianza)
El problema de la estimacin por puntos consiste en obtener una estimacin que represente nuestro mejor
pronsticodelvalordelparmetro.
Establecer nuestro mejor pronstico equivale a especificar las propiedades que se pueden considerar
deseables en un estimador. Como el estimador es una variable aleatoria cuyo valor vara de una muestra a
otra,suspropiedadessonenrealidadlasdesudistribucinmuestral.
Distribucionesmuestrales
Podemos imaginar que se van obteniendo muestras (todas del mismo tamao y con el mismo
procedimiento), una detrs de otra, y que para cada una de ellas se calcula, por ejemplo, la media muestral
(laestimacindelamediapoblacionalparmetro).
Cada una de las medias muestrales obtenidas se ordenan en forma de una distribucin. Si tuvisemos
infinitasmuestras,elresultadoesunadistribucinmuestral.
Propiedadesdelasdistribucionesmuestrales
Cuales son los rasgos especficos de una distribucin muestral que nos permitan juzgar un determinado
estimador:
Estimador perfecto: aquel sin posibilidad de error. Es decir, aquel cuya distribucin muestral est
concentrada totalmente en un solo punto, y este punto coincide con el valor real de parmetro que
sequiereestimar.
3
Materia:EstadsticaIIDistibucionesMuestralesyPropiedadesdelosEstimadores
Estimador insesgado: es aquel cuya distribucin muestral tiene una media igual al parmetro que
sepretendeestimar.
Estimador eficiente: hace referencia a la distancia entre los valores del estimador y el valor de
parmetro. Dentro de los estimadores insesgados, un estimador eficiente es aquel cuya
distribucinmuestraltienelavarianzamspequea.
Estimador consistente: hace referencia a los cambios que sufre la distribucin muestral a medida
que aumenta el tamao de la muestra. Se dice que un estimador es consistente si su distribucin
muestral tiende a concentrarse alrededor del verdadero valor del parmetro cuando el tamao de la
muestratiendeainfinito.
Cuando el tamao de la muestra aumenta: a) el sesgo se hace ms pequeo b) las estimaciones
estnmenosdispersas.
Propiedadesdelosestimadores(segntamaodelamuestra)
Llamaremos alestimadorde
*
esunafuncindex1,x2,xn(muestraaleatoria)unafrmula
*
Lascaractersticasbsicasson
E( )
*
Var( )
*
Errormuestral=
*
Sesgo=E( )
*
Mediadelerroralcuadrado=E( )^2
*
La diferencia entre la varianza de un estimador y la media del error al cuadrado es que la primera mide la
dispersin de la distribucin en torno a la media, mientras que la ltima mide la dispersin en torno al
verdadero valor del parmetro. Si la media de la distribucin coincide con el parmetro, entonces la varianza
ylamediadelerroralcuadradosoniguales.
E( )^2=Var( )+Sesgo^2
*
Lamediadelerroralcuadradoesmayoralavarianza.Solocoincidencuandoelsesgo=0
Podemosdividirlaspropiedadesendosgrupossegneltamaodelamuestra.
Muestrasfinitas(opequeas)
Insegadez:E( )=
*
esinsesgado
Var( )<=Var( )dnde escualquierotroestimadorinsesgadode .
*
**
**
Muetrasgrandes(oasintticas)
4
Materia:EstadsticaIIDistibucionesMuestralesyPropiedadesdelosEstimadores
Cuando la distribucin de un estimador tiende cada vez ms a tomar la forma de una determinada
distribucin al aumentar el tamao de la muestra, esta ltima distribucin recibe el nombre de distribucin
asintticadedichoestimador.
Insesgadezasinttica: E( )= lim
n>
*
Consistencia: ver definicion formal Kmenta pag 192. En la prctica, nos vamos a
concentrar en la siguiente definicin: si al aumentar el tamao de la muestra se produce
una disminucin del sesgo (en caso de que lo haya) y en la varianza, y si este proceso
sigue hasta que tanto el primero como el segundo tienden a cero cuando n , el
estimadoresconsistente.
Podemosdecirque esconsistentesi
*
E( )^2=0 lim
n>
*
Estacondicinessuficienteperononecesariaparalaconsistencia.
Eficiencia asinttica: slo esta definida para los estimadores cuya media y varianza
asintticas existen (son nmeros finitos). Esta propiedad nos proporciona un criterio de
eleccin dentro de la familia de estimadores que satisfacen la propiedad de consistencia y
asintticamente insesgados. Se va a comparar la varianza asinttica del estimador con la
CotadeCramerRao(estetemasecontinuarenlaclaseespecfica)
Clase28deagosto2014
Obtencindedistribucionesmuestrales
Forma experimental: Simulacin con la obtencin de un gran nmero de muestras para una
poblacinconcreta
Formaterica:utilizalateoradelaprobabilidad
Distribucindemuestreode (demostracionesenlaclasedeFGM) X
Sea X1, X2, Xn una muestra aleatoria que consiste en n variables aleatorias independientes
normalmente distribuidas con media E(Xi) = y varianza Var(Xi) = . i = 1, 2, ...n. Entonces la
distribucindelamedia esnormalconmedia yvarianza (CanavosTeorema7.3,pag225) X /n
Sean X1, X2, Xn n variables aleatorias IID con una distribucin de probabilidad no especificada y que
tienen media y una variaza finita. El promedio muestral tiene una distribucin con media y
X
varianza que tienden hacia una distribucin muestral conforme n tiende a . En otras palabras, la /n
variable aleatoria tiene como lmite una distribucin normal estndar (Canavos Teorema 7.4, pag
n
X ( )
230)
DistribucindeMuestreode (demostracinenclaseFGM) S
2
5
Materia:EstadsticaIIDistibucionesMuestralesyPropiedadesdelosEstimadores
(Xi ) /(n ) S
2
=
n
i=1
2
1
Sean X1, X2, Xn una muestra aleatoria de una distribucin normal con media y varianza . La
distribucindelavariablealeatoria.
(Xi ) / Y =
n
i=1
2 2
esdeltipochicuadradaconngradosdelibertad(CanavosTeorema7.5,pag231)
Si X1 y X2 son dos variables aleatorias independientes y cada una tiene una distribucin chicuadrada con
v1yv2gradosdelibertadrespectivamente,entonces
Y=X1+X2
tambintieneunadistribucinchicuadradaconv1+v2gradosdelibertad(CanavosTeorema7.6,pag233)
Apartirdeaqu,surgeque:
(Xi ) /(n ) S
2
=
n
i=1
X
2
1
n ) (Xi ) ( 1
*
S
2
=
n
i=1
X
2
n ) (Xi ) [(Xi ) X )] ( 1
*
S
2
=
n
i=1
+X
2
=
n
i=1
(
2
(deduccinCanavos,pag233)
n ) (X ) ( 1
*
S
2
=
n
i=1
(Xi )
2
n
2
n ) (X ) ( 1
*
S
2
=
n
i=1
(Xi )
2
n
2
n ) / / (X ) / ( 1
*
S
2 2
=
n
i=1
(Xi )
2 2
n
2
2
a) /
n
i=1
(Xi )
2 2
~
2
n
b) = (X ) / n
2
2
z
2
~
2
1
c)ab= =
2
n
2
1
2
n1
6
Materia:EstadsticaIIDistibucionesMuestralesyPropiedadesdelosEstimadores
d) n ) / ( 1
*
S
2 2
~
2
n1
Sededuce:
[(n ) / ] [ ] n E 1
*
S
2 2
= E
2
n1
= 1
n )E[S ]/ n ( 1
2 2
= 1
)* / = [S ] n E
2
= ( 1
2
n ) ( 1
2
Var[S ]/ 2(n ) (n ) 1
2 2 4
= 1
/ ar[S ] 2 (n ) V
2
=
4
1 (n ) 1
2
ar[S ] 2 /(n ) V
2
=
4
1
DistribucintdeStudent
Sea Z una variable aleatoria normal estndar y X una variable aleatoria chicuadrada con v grados de
libertad.SiZyXsonindependientes,entonceslavariablealeatoria:
T= / Z X/v
tieneunadistribucintdeStudentconvgradosdelibertad.(CanavosTeorema7.7,pag235)
Z= X )// (0, ) ( n ~ N 1
X= n ) / ( 1
*
S
2 2
~
2
n1
(deduccin)
T= = / / Z X/v X ) ( / S n T ~
n1
Ladistribucindeladiferenciaentredosmediasmuestrales
Enmuchasocasionessurgelanecesidaddecompararlasmediasdedistribucionesdistintas.
Poblacin1: N( ) X ~
x
x
2
Poblacin2: N( ) Y ~
Y
2
Y
Dospoblacionesnormalesindependientes
Losestimadoresdelamediapoblacionaldecadapoblacinson e respentivamente,dnde: X Y
N( /n ) X ~
x
x
2
x
7
Materia:EstadsticaIIDistibucionesMuestralesyPropiedadesdelosEstimadores
N( /n ) Y ~
Y
2
Y
y
e sonvariablesaleatoriasindependientesnormalmentedistribuidas. X Y
Unenfoqueviableparaesteproblemadecompararmediaseshacerladiferenciaentrelasdosmedias:
X Y
Enbaseaesto,hayquebuscarladistribucinmuestralde : X Y
1Cuandoposeenvarianzasigualesconocidas.
E( ) X Y =
x
y
como = =
x
2
2
Y
Var( )= + ) X Y (1/n
2
x /n 1 y
+ ) N( (1/n X Y ~
X
Y
2
x /n ) 1 y
2Cuandoposeenvarianzasigualesperodesconocidas.
Conocerlavarianzapoblacionalespocoprobable.Enestecaso,sedefineparacadamuestra:
yS S
2
x y
2
/ n 1)S ( x
2
x
2
~ 2
n 1 x
/ n 1)S ( y
y
2
2
~ 2
n 1 y
W= / n 1)S ( x
2
x
(n 1)S /
2
+ y
y
2
2
~ 2
n +n 2 x y
Habamosdefinido:
T= / Z W/v
tiene una distribucin t de Student con v grados de libertad. (Canavos Teorema 7.7, pag 235). En este
casoparticularlosgradosdelibertaddelaTdeStudentson . n 2 nx + y
dndeZseobtienedelpunto1)
Z =
(1/n +1/n )
2
x y
(XY )( )
X Y
verfrmulaestadsticoTenlapgina240(Canavoscaptulo7)
8
Materia:EstadsticaIIDistibucionesMuestralesyPropiedadesdelosEstimadores
3Cuandoposeenvarianzasdistintasperoconocidas.
+ ) N( /n X Y ~
X
Y
x
2
x /n )
y
2
y
4Cuandoposeenvarianzasdistintasydesconocidas
Elproblemaesmscomplicadoynoestdentrodelalcancedelamateria.
LadistribucinF.
Enestecasovamosaquerercompararlasvarianzasdedospoblacionesdistintas.
Poblacin1: N( ) X ~
x
x
2
Poblacin2: N( ) Y ~
Y
2
Y
Dospoblacionesnormalesindependientes
Losestimadoresdelavarianzapoblacionaldecadapoblacinson respentivamente,dnde: yS S
2
x y
2
/ n 1)S ( x
2
x
2
~ 2
n 1 x
/ n 1)S ( y
y
2
2
~ 2
n 1 y
Unenfoqueviableparaesteproblemadecompararvarianzaseshacerelcocienteentrelasdosvarianzas:
/S S
2
x y
2
Enbaseaesto,hayquebuscarladistribucinmuestralde : /S S
2
x y
2
ParaestovamosadefinirladistribucindeF:
(Teorema7.8,pag241) (v1, 2) F =
X/v1
Y /v2
~ F v
Construyendoelestadsticoparalacomparacindevarianzaspoblacionales:
/ ]/ / ]/ F = [(n 1)S { x
2
x
x
2
n 1)}/ ( x {[(n 1)S y
2
y
y
2
n 1)} ( ( y ~ F 1 n 1) nx y
Bibliografa
9
Materia:EstadsticaIIDistibucionesMuestralesyPropiedadesdelosEstimadores
Kmenta:captulo1
Canavos:captulo7
Canavos:captulo8.18.2
Kmenta:captulo6.1
10