Sunteți pe pagina 1din 30

GestinAeronutica:EstadsticaTerica

FacultadCienciasEconmicasyEmpresariales
DepartamentodeEconomaAplicada
Profesor:SantiagodelaFuenteFernndez

ESTIMADORES
Un estimador es un estadstico (una funcin de la muestra) utilizado para estimar un
parmetro desconocido de la poblacin.
Por ejemplo, si se desea conocer el precio medio poblacional de un artculo (parmetro
desconocido) se recogen observaciones del precio de dicho artculo en diversos
establecimientos (muestra) pudiendo utilizarse la media aritmtica de las observaciones
para estimar el precio medio poblacional.
Para cada parmetro pueden existir varios estimadores diferentes. En general, se elige
el estimador que posea mejores propiedades que los restantes, como insesgadez,
eficiencia, convergencia y robustez (consistencia).
El valor de un estimador proporciona una estimacin puntual del valor del parmetro en
estudio. En general, se realiza la estimacin mediante un intervalo, es decir, se obtiene
un intervalo parmetro muestral error muestral dentro del cual se espera se
encuentre el valor poblacional dentro de un cierto nivel de confianza. El nivel de
confianza es la probabilidad de que a priori el valor poblacional se encuentre contenido
en el intervalo.

PROPIEDADES DE LA ESPERANZA Y VARIANZA


a) E a X1 b X2 E a X1 E b X2 aE X1 bE X2
b) Var a X1 b X2 Var a X1 Var b X2 a2 Var X1 b2 Var X2
SESGO
Se denomina sesgo de un estimador a la diferencia entre la esperanza (valor esperado)
del estimador y el verdadero valor del parmetro a estimar. Es deseable que un
estimador sea insesgado o centrado, esto es, que el sesgo sea nulo para que la
esperanza del estimador sea igual al valor del parmetro que se desea estimar.
Por ejemplo, si se desea estimar la media de una poblacin, la media aritmtica de la
muestra es un estimador insesgado de la misma, ya que la esperanza (valor esperado)
es igual a la media poblacional.
Si una muestra X (x1, x 2 , , xn ) procede de una poblacin de media :
E x i para i (1, 2, n)

La media aritmtica muestral es un estimador insesgado de la media poblacional:

1
E x E
n

i 1

1
xi E
n

i 1

1
xi
n

E x n E x E x E x n n
1

i 1

La varianza de una muestra aleatoria simple es un estimador sesgado de la varianza


poblacional, siendo su esperanza:
n

(x x)

La varianza muestral 2x

i 1

Para calcular su esperanza matemtica se realizan previamente algunos clculos


sumando y restando la esperanza de la variable aleatoria poblacional.
n

(x x) (x x )
2

2x

i 1

i 1

1
n

(x ) (x )

i 1

Desarrollando el cuadrado:
2x

1
n

(x )

i 1

(x )2 2(xi )(x )

(xi ) n(x ) 2(x )


2

i 1

i 1

i 1

i 1

i 1

(xi )

(xi )2 n(x )2 2 (x ) (n x n )

(xi )2 n x 2 n 2 2n x 2n x 2 2n x 2n x 2n 2

(xi )2 n(x )2

Calculando la esperanza matemtica de la varianza muestral 2x :


1
E 2x E
n

i 1

1
(xi ) n(x )
E (xi )2 E (x )2

n i 1

var ianza media


2

varianza poblacional

muestral

En el segundo miembro aparecen dos esperanzas, la primera E (xi )2 coincide con la

varianza poblacional 2 al tratarse de una muestra aleatoria simple, la segunda


2
esperanza E (x )2 es la varianza de la media muestral
n
2 n 1 2
2
2

Por tanto, E x
n
n

La cuasivarianza de una muestra aleatoria simple es un estimador insesgado de la


varianza poblacional:
n

(x x)

s2x

i 1

n 1

La relacin entre varianza y cuasivarianza: n 2x (n 1) s2x

s2x

n
2x
n 1

La esperanza de la cuasivarianza s2x es igual a la varianza poblacional 2 :


n
n
n 1 2
n

E s2x E
2x
. E 2x
.
. 2
n 1 n
n 1 n 1
Un estimador es insesgado (centrado) cuando E ( )
Un estimador es sesgado cuando E ( ) b
( ) b ( ) E ( )
sesgo

Un estimador es asintticamente insesgado si su posible sesgo tiende a cero al


aumentar el tamao muestral que se calcula: lim b ( ) 0
n

1
Sea el estimador
n 1
1
E ( ) E
n 1

i 1

i 1

1
xi
E
n 1

i 1

1
xi
n 1

n
n n

b ( ) E ( )
n 1
n 1

E (x i )

i 1

n 1

1
n
(n )
n 1
n 1

sesgado
asintticamente

ERROR CUADRTICO MEDIO DE LOS ESTIMADORES (ECM)


La utilizacin de la estimacin puntual como si fuera el verdadero valor del parmetro
conduce a que se pueda cometer un error ms o menos grande.
El Error Cuadrtico Medio (ECM) de un estimador viene definido:

ECM( ) E ( ) V ( ) E ( )


sesgo

siendo el sesgo b ( ) E ( )

Cuando el estimador es centrado, el sesgo b ( ) 0

ECM( ) V ( )

Un error cuadrtico medio pequeo indicar que en media el estimador no se


encuentra lejos del parmetro .

CONSISTENCIA
Si no es posible emplear estimadores de mnima varianza, el requisito mnimo deseable
para un estimador es que a medida que el tamao de la muestra crece, el valor del
estimador tienda a ser el valor del parmetro poblacional, propiedad que se denomina
consistencia.
Un estimador consistente es un estimador asintticamente insesgado cuya varianza
tiende a cero al aumentar el tamao muestral.
El estimador es consistente cuando lim E ( ) y
n

lim V ( ) 0

EFICIENCIA
Un estimador es ms eficiente o ms preciso que otro estimador, si la varianza del
primero es menor que la del segundo.
Sean 1 y 2 dos estimadores insesgados, se dice que 1 es ms eficiente que 2 si
se verifica que Var ( 1 ) Var ( 2 )
La eficiencia relativa se mide por el ratio:

Var ( 1 )
Var ( )
2

La eficiencia de los estimadores est limitada por las caractersticas de la distribucin de


probabilidad de la muestra de la que proceden.
Es insesgado
Un estimador es eficiente cuando verifica:
Posee var ianza mnima
La cuestin de tener varianza mnima queda resuelta mediante la Cota de Cramr-Rao.
La varianza de un estimador verifica siempre la desigualdad:
V ( )

1
ln L (X, )
E

Cota de Cramr-Rao

El denominador de la Cota de Cramr-Rao es la cantidad de informacin de Fisher en


una muestra:
2

ln L (X, )
I() E
cantidad de Informacin de Fisher

A la funcin ln L (X, ) se llama soporte o log-verosimilitud


El denominador de la expresin, I() , puede simplificarse en una muestra aleatoria
simple (m.a.s.), segn sea el caso discreto o continuo, obteniendo la expresin:

2
2

ln P (x1, x 2 , , xn ; )
ln P (x ; )
Discreto : E
n.E

2
2
Continuo : E ln f (x1, x 2 , , xn ; ) n.E ln f (x ; )

MTODO DE MXIMA VEROSIMILITUD (EMV)


La estimacin por mxima verosimilitud es un mtodo de optimizacin que supone que la
distribucin de probabilidad de las observaciones es conocida.
Sea (x 1, , x n ) una muestra aleatoria (no necesariamente simple) de una poblacin X
con funcin de masa P (o funcin de densidad f ) donde ( 1, , n ).
El estimador de mxima verosimilitud (probabilidad conjunta) de es el formado por los
valores ( 1, , n ) que maximizan la funcin de verosimilitud de la muestra
(x 1, , x n ) obtenida:
P (x 1 , ) P (x n , ) caso discreto

L () L(X; ) L ( x 1, , x n ; )
f (x ) f (x ) caso continuo
n

1
En muchas ocasiones, es ms prctico encontrar el estimador de mxima verosimilitud
es considerar la funcin soporte o log-verosimilitud lnL () , en lugar de la funcin de
verosimilitud L () , ya que es ms fcil de manejar y presenta los mismos mximos y
mnimos.
lnL ()
Se despeja ( 1, , n ) de la ecuacin:
0 y se obtiene el estimador

de mxima verosimilitud E.M.V ( )

SUFICIENCIA
Un estimador es suficiente cuando no da lugar a una prdida de informacin. Es decir,
cuando la informacin basada en es tan buena como la que hiciera uso de toda la
muestra.
Para identificar estadsticos suficientes se utiliza el criterio de factorizacin de
Fisher-Neyman, que dice que dada una muestra aleatoria (x 1 , , x n ) de una poblacin
X con funcin de masa P (o funcin de densidad f ) un estadstico es suficiente para
si y slo s:

P (x , , x ) g (x , , x ), . h(x , , x )
n
1
n
1
n

f (x 1 , , x n ) g (x 1 , , x n ), . h(x 1 , , x n )

caso discreto
caso continuo

Para encontrar un estadstico suficiente hay que factorizar la funcin de verosimilitud


) . h(x , , x )
de la forma: L () g (,
1
n

MTODO DE LOS MOMENTOS


El procedimiento consiste en igualar momentos poblacionales respecto al origen ( r ) a
los correspondientes momentos muestrales respecto al origen (a r ) , formando as tantas
ecuaciones como parmetros poblacionales se pretenden estimar:

E (X)
1

2 E (X 2 )

E (X r )
r

1 a 1

i 1

n
n

2 a 2

x
i 1

2
i

r a r

x
i 1

r
i

GestinAeronutica:EstadsticaTerica
FacultadCienciasEconmicasyEmpresariales
DepartamentodeEconomaAplicada
Profesor:SantiagodelaFuenteFernndez

CLCULO DE LA INSESGADEZ y EFICIENCIA DE LOS ESTIMADORES


1.- La variable aleatoria poblacional "renta de las familias" del municipio de Madrid se
distribuye siguiendo un modelo N( , 2 ) . Se extraen muestras aleatorias simples de
tamao 4. Como estimadores del parmetro , se proponen los siguientes:

1
2

x1 2x 2 3 x3
6
x3 4x2
3

3 x
Se pide:
a) Comprobar si los estimadores son insesgados
b) Cul es el ms eficiente?
c) Si tuviera que escoger entre ellos, cul escogera?. Razone su respuesta a partir del
Error Cuadrtico Medio.
Solucin:
a) Un estimador es insesgado (o centrado) cuando se verifica

E( )

x 2x2 3x3
1
E ( 1 ) E 1
E x 1 2 x 2 3 x 3

6
6

1
1
E ( x 1 ) 2E ( x 2 ) 3E ( x 3 )

6
6
6
x 4x2
1
1
E ( 2 ) E 1
E x 1 4 x 2 E ( x 1 ) 4E ( x 2 )
3
3
3

1
3
3
x x2 x3 x4
1
E ( 3 ) E 1
E x 1 x 2 x 3 x 4

4
4

1
1
E ( x 1 ) E ( x 2 ) E ( x 3 ) E ( x 4 )

4
4
4
Los tres estimadores son insesgados o centrados.

b) El estimador ms EFICIENTE es el que tenga menor varianza.


x 2x2 3x3
1
V 1 V 1
V x 1 2 x 2 3 x 3

6
36

1
1
14 2
14 2
V ( x 1 ) 4 V ( x 2 ) 9 V ( x 3 )

0,39 2
36
36
36
x 4x2
1
1
V ( x 1 ) 16 V ( x 2 )
V 2 V 1
V x 1 4 x 2

9
9
3

1
17 2
17 2

1,89 2
9
9
x x2 x3 x4
1
V 3 V 1
V x 1 x 2 x 3 x 4

4
16

1
1
4 2
4 2
V ( x 1 ) V ( x 2 ) V ( x 3 ) V ( x 4 )

0,25 2
16
16
16
El estimador 3 es el ms eficiente.
c) Se elige el estimador que presente menor Error Cuadrtico Medio (ECM)

ECM( ) E ( ) 2 V ( ) E ( )


sesgo
Si E ( ) ECM( ) V ( )

sesgo b ( ) E ( )

insesgado

Al ser los tres estimadores insesgados (centrados), se elige al que menor


varianza presenta, que coincidir con el que menor ECM tiene, es decir, se opta
por el estimador 3
Advirtase que si el estimador es insesgado: ECM( ) V ( )

ESTIMADORES SESGADOS:
CLCULO DEL SESGO Y ESTIMACIN PUNTUAL
2.- La variable aleatoria X representa los gastos mensuales de una empresa, cuya
funcin de densidad es f (, x) x 1 con 0 y 0 x 1. Se realiza una m.a.s. de
tamao 3, y se proponen tres estimadores:

1 x
2
3
a) Calcule los sesgos

x 12 2 x 22 3 x 32
6
x 3 2x1 4 x 2
6

b) Si la muestra que se obtiene es (0,7 ; 0,1 ; 0,3), calcule las estimaciones puntuales
c) Cules son las funciones estimadas para las estimaciones anteriores?
Solucin:
Un estimador es insesgado (centrado) cuando E ( ) .
Un estimador es sesgado cuando E ( ) b
( ) b ( ) E ( )
sesgo

X = gastos mensuales de la empresa


f (, x) x 1 con 0 y 0 x 1 m.a.s. con n = 3

Sesgo del estimador 1 x

x1 x 2 x3
1
1
1 x E ( 1 ) E
E x 1 x 2 x 3
(3 ) (media poblacional)

3
3
3

donde

x f (x, ) dx

x f (x, ) dx x x

El sesgo: b ( 1 ) E ( 1 )

Sesgo del estimador 2

dx

1
0

x 1

x dx

1
1 0

1
1
x 12 2 x 22 3 x 32
6

x 12 2 x 22 3 x 32
1

E ( 2 ) E
E (x 12 ) 2E (x 22 ) 3E (x 32 )

6
6

2
2
2

1 (6 ) ()
2
2

donde 2 es el momento de orden 2 respecto al origen.

2 E(x 2 )

x 2 f (x, ) dx

x 2 f (x, ) dx

x 2 x 1 dx

x 1 dx

x 2



2
2 0
entonces,

x 12 2 x 22 3 x 32
1
E (x 2 ) 2E (x 2 ) 3E (x 2 )
E ( 2 ) E

1
2
3

6
6

2
2
2

El sesgo: b ( 2 ) E 2

Sesgo del estimador 3

2
2

x3 2x1 4 x 2
6

x3 2x1 4 x 2
1
1
1
E ( 3 ) E
E x 3 2 x 1 4 x 2
(3 )

6
6
6
2

x f (x, ) dx

x f (x, ) dx x x

dx

1
0

x 1

x dx

1
1 0

1
22

El sesgo: b (3 ) E (3 )
2 1
2( 1)
b) Si la muestra que se obtiene es (0,7 ; 0,1 ; 0,3), calcule las estimaciones puntuales.
0,7 0,1 0,3
1
0,367
3
0,7 2 2.0,12 3.0,3 2
2
0,13
6
0,3 2.0,7 4.0,1
3
0,117 no puede ser, puesto que 0
6
c) Cules son las funciones estimadas para las estimaciones anteriores?
1 f (0,367, x) 0,367 x 0,367 1 0,367 x 0,633
2 f (0,13, x) 0,13 x 0,13 1 0,367 x 0,87

10

CLCULO EFICIENCIA RELATIVA Y ERROR CUDRATICO MEDIO


3.- Sea una poblacin con media de la que se extraen m.a.s. de tamao n. Considere
los siguientes estimadores de la media:
n
1
xi
1 x
2
n 1 i 1

a) Estudie la insesgadez, la eficiencia relativa y la consistencia de ambos estimadores


b) Elija uno de los dos en trmino del error cuadrtico medio

Solucin:
a)

Insesgadez

Un estimador es insesgado (o centrado) cuando se verifica E ( )


( ) b
( ) E ( )
Un estimador es sesgado cuando E ( ) b
sesgo

sesgo

Un estimador es asintticamente insesgado si su posible sesgo tiende a cero al


aumentar el tamao muestral que se calcula: lim b ( ) 0
n

1
E ( 1 ) E (x) E (
n

i 1

1
x i)
E(
n

i 1

E (x )

1
x i)
n

i 1

1
(n )
n

b ( 1 ) E ( 1 ) 0
E ( 2 ) E (

1
n 1

x i)

i 1

1
E(
n 1

x i)

i 1

1
n 1

E (x i )

i 1

1
n
(n )
n 1
n 1

0 cuando ' n ' aumenta

n
n n
b ( 2 ) E ( 2 )

n 1
n 1

n
1

sesgado
asin toticamente

Eficiencia
Sean 1 y 2 dos estimadores insesgados de un parmetro desconocido .
Decimos que 1 es ms eficiente que 2 si se verifica que Var ( 1 ) Var ( 2 )
La eficiencia relativa se mide por el ratio:

Var ( 1 )
Var ( )
2

1
V ( 1 ) V (x) V (
n

i 1

1
x i) 2
n

V (x i )

i 1

11

1
2
2
(
n

n2
n

1
V ( 2 ) V (
n 1

i 1

eficiencia relativa

1
x i)
(n 1) 2
Var ( 1 )
Var ( 2 )

V (x )
i

i 1

2 n
n 2 (n 1) 2

1
n
(n2)
2
2
2
(n 1)
(n 1)

(n 1) 2
1 Var ( 1 ) Var ( 2 )
n2

El estimador 2 tiene menor varianza, por lo que es ms eficiente que 1

Consistencia

Un estimador consistente es un estimador asintticamente insesgado cuya varianza


tiende a cero al aumentar el tamao muestral.
El estimador es consistente cuando lim E ( ) y
n

lim E ( 1 ) lim E (x)


n
n
1
2
0
lim V ( 1 ) lim
n n
n

lim V ( ) 0

es consistente


E ( 2 ) lim
nlim
n
n 1

lim V ( ) lim n
2 0
2

2
n (n 1)
n

es consistente

b) Elegir uno de los dos en trmino del error cuadrtico medio.

El Error Cuadrtico Medio (ECM) de un estimador viene definido:

ECM( ) E ( ) 2 V ( ) E ( )


sesgo

sesgo b ( ) E ( )

Si E ( ) ECM( ) V ( )

insesgado

2
2
2

ECM( 1 ) V ( 1 ) b ( 1 )
0
n
n

n
n2 2
1

2
ECM( 2 ) V ( 2 ) b ( 2 )


(n 1) 2
(n 1) 2
n 1
2

El estimador 1 ser el que presenta menor ECM cuando ECM( 1 ) ECM( 2 )


En esta lnea,

12

2
n2 2
n2
2
2
n2
2

n
(n 1) 2
(n 1) 2
(n 1) 2
n
(n 1) 2
(n 1) 2

(n 1) 2 2 n 2 2
2
(n 1) 2 n 2 2

2
2
2
n(n 1)
(n 1)
n

2n 1 2
2n 1
2
2
2
n
n

2n 1
2
Si

n
2

2
Si 2n 1
n
2

1 se elige antes que 2

2 se elige antes que 1

CLCULO INSESGADEZ E EFICIENCIA


4.- El peso en kilos de los jamones vendidos por una empresa sigue una distribucin
normal con varianza 4 y peso medio desconocido. Se conoce que el peso medio de los
jamones vendidos es superior a 5 kg, y se toman m.a.s. de tamao 4 para estimar .
Cul de los dos estimadores sera el mejor respondiendo a la insesgadez y eficiencia?

X1 X 2 X 3

X1 X 2
2

Solucin:
Un estimador es insesgado (centrado) si E( )
) E( )
Un estimador es sesgado si E( ) b( ) b(

sesgo

La v.a X i 'peso en kg de los jamones ' sigue una distribucin normal de varianza 4
Para estudiar la insesgadez de los estimadores se calculan sus esperanzas:

X1 X 2 X 3
1
3
E (X 1 ) E (X 2 ) E (X 2 )
E ( 1 ) E

4
4
4

3
1
El sesgo del estimador 1 ser: b( 1 ) E( 1 )
4
4

X1 X 2
1
2
E (X 1 ) E (X 2 )
E ( 2 ) E

2
2
2

El estimador 2 es insesgado, b( 2 ) 0
Atendiendo al sesgo se elige 2
13

Para analizar la eficiencia relativa de los dos estimadores se calculan las respectivas
varianzas

X X2 X3
1
1 V (X 1 ) V (X 2 ) V (X 2 )
V ( 1 ) V 1

V
(X

X
)

1
2
3

4
16

16
las observaciones

son independientes

V (Xi ) 4

1
12
3

12
16
16
4

X1 X 2
1
1

V (X 1 ) V (X 2 )
V ( 2 ) V
V (X 1 X 2 )

2
4
4

las observaciones
son independientes

V (Xi ) 4

1
8 2
4

Respecto a la varianza se elige el estimador 1 por ser el de menor varianza.


Aparecen propiedades contrapuestas, de modo que el estimador insesgado 2 es el de
mayor varianza. Se elige el estimador en base al error cuadrtico medio (ECM):

3

ECM( 1 )
4 4

ECM Varianza (sesgo) 2

ECM( 2 ) 2 0

2 12

16

Se analiza cuando es mayor el ECM del primer estimador 1 : ECM( 1 ) ECM( 2 )


2 12
2
16

2 20

20 4, 47

Si es en valor absoluto mayor que 4,47, el error cuadrtico medio de 1 es mayor,


con lo que se elige el estimador 2 .
Se conoce que el peso medio de los jamones es superior a 5 kg, no queda duda que el
estimador a elegir (con menor error cuadrtico medio) es 2 .

14

5.- La distribucin del peso de las manzanas de una determinada cosecha sigue una
distribucin normal, cuyo peso medio es desconocido y cuya desviacin tpica es 7
gramos. Se pide:

a) Analizar cul de los estimadores 1 , 2 del peso medio es mejor respecto del sesgo
y de la eficiencia, para una muestra aleatoria simple de tamao cinco.
5

b) Si 1

y 2 X 1 2 X 2 3 X 3 4 X 4 X 5 , obtener los pesos medios


5
estimados a partir de la siguiente muestra (125, 135, 130, 137, 142).
i 1

Solucin:
a) El peso de las manzanas sigue una distribucin N(, 7)
Se calculan las esperanzas de los estimadores para analizar el sesgo de los estimadores

E ( 1 ) E

i 1

1
X i / 5
E
5

i 1

1
Xi
5

E(Xi )

i 1

E X i

1
(5 )
5

E ( 2 ) E (X 1 2 X 2 3 X 3 4 X 4 X 5 ) E (X 1 ) 2E (X 2 ) 3E (X 3 ) 4E (X 4 ) E (X 5 )
2 3 4
Los estimadores 1 , 2 son insesgados (centrados).
b) Para analizar la eficiencia de los estimadores se obtienen las varianzas:

V ( 1 ) V

i 1

1
X i / 5
V
25

i 1

1
Xi
25

V (Xi ) 72

V X
i

i 1

1
49
(5. 49)
25
5

V ( 2 ) V (X 1 2 X 2 3 X 3 4 X 4 X 5 ) V (X 1 ) 4 V ( X 2 ) 9 V ( X 3 ) 16 V ( X 4 ) V ( X 5 )

(49) 4 (49) 9 (49) 16 (49) (49) 31 (49) 1519


Como los dos estimadores son insesgados y V ( 1 ) V ( 2 ) se elige como mejor el
estimador 1 , el peso medio de la muestra de las cinco manzanas.

15

6.- Supongamos que la distribucin de ingresos de una cierta poblacin es una variable
aleatoria con media desconocida y varianza 2 tambin desconocida. Si queremos
estimar el ingreso medio de la poblacin mediante una m.a.s. de tamao n, respecto de
la insesgadez y de la eficiencia. Cul de los dos estimadores elegiramos?
n

Xi
2

i 1

n 1

i 1

Solucin:

Un estimador es insesgado (centrado) si E( )


) E( )
Un estimador es sesgado si E( ) b( ) b(

sesgo

La v.a X i 'ingresos de cierta poblacin ' sigue una distribucin normal N(, )
Para analizar el sesgo de los estimadores, hallamos la esperanza:

E ( 1 ) E

i 1

1
X i (n 1)
E
n 1

i 1

1
Xi
n 1

E (X ) n 1 (n ) n 1

i 1

1
X i n E
n

i 1

1
Xi
n

i 1

El sesgo del estimador 1 ser: b( 1 ) E( 1 )

E ( 2 ) E

n
1

n 1
n 1

E (X ) n (n )
1

i 1

El estimador 2 , que es la media muestral, es insesgado (centrado).

La eficiencia de los estimadores se analiza a travs de su varianza:

V ( 1 ) V

V ( 2 ) V

i 1

i 1

1
X i (n 1)
V
2
(n 1)

X i n 2 V

i 1

i 1

1
Xi
n

1
Xi
2
(n 1)
n

i 1

i 1

V (X i )

1
n2
2

(n
)
(n 1) 2
(n 1) 2

2
1
2
V (X i ) 2 (n )
n
n

El estimador ms eficiente ser el de menor varianza. Comparando las varianzas de los


estimadores:
V ( 2 )

2
n2

V ( 1 ) puesto que (n 1) 2 n 2
2
n
(n 1)

El estimador 2 , que es la media muestral, es el mejor tanto al sesgo como a la


eficiencia.

16

COMPRENSIN DE LA VEROSIMILITUD. CLCULO DE LOS


ESTIMADORES MXIMO VERSOSMILES. PROPIEDADES
7.- Una urna contiene bolas blancas y negras. Sea p la probabilidad de extraer una bola
blanca cuando se realiza una extraccin al azar. Asociado a este experimento aleatorio
tenemos la variable aleatoria X que puede tomar los valores:

X = 1 si la bola extrada es blanca


X = 0 si la bola extrada es negra
La distribucin de probabilidad ser una B(1; p): P(X x) p x (1 p) 1 x
Se selecciona una muestra aleatoria con reemplazamiento de tamao 3 (x 1, x 2 , x 3 ) ,
siendo x i la variable aleatoria a la extraccin i-sima, y suponemos que ha resultado la
siguiente relacin (B, N, B). Como el parmetro p es desconocido pretendemos saber,
entre los valores, p 0,65 y p 0,73 qu valor hace ms probable la aparicin de dicha
extraccin.
Solucin:
P(B) p
Si la muestra (B, N, B) es independiente, siendo
P(N) 1 p
P(B, N, B) P(B N B) P(B).P(N).P(B) p.(1 p).p p 2 . (1 p)
p 0,65 : P(B,N,B) 0,65 2 .0,35 0,1479

entonces
p 0,73 : P(B,N,B) 0,73 2 .0,27 0,1439

Resulta ms probable (p = 0,65), siendo ms verosmil.


FUNCIN DE VEROSIMILITUD DE LA MUESTRA (EMV).- Sea (x 1, , x n ) una muestra
aleatoria de una poblacin X con funcin de masa P (o funcin de densidad f ) donde
( 1, , n ).
El estimador de mxima verosimilitud de es el formado por los valores ( 1, , n ) que
maximizan lo que llamaremos funcin de verosimilitud de la muestra (x 1, , x n ) obtenida:
P (x 1 , ) P (x n , ) caso discreto
L () L(X; ) L ( x 1, , x n ; )
f (x 1 ) f (x n ) caso continuo
Si consideramos la m.a.s. (x 1, x 2 , x 3 ) , siendo las variables aleatorias x i independientes,
tomando los valores 0, 1, con distribucin B(1, p), la distribucin de probabilidad
asociada ser:

17

x
1 x
P ( x 2 , p) P ( X x 2 ) p 2 (1 p) 2 x i 1, 0 sea bola blanca o negra
x
1 x
P ( x 3 , p) P ( X x 3 ) p 3 (1 p) 3
x

P ( x 1 , p) P ( X x 1 ) p 1 (1 p)

1 x1

La funcin de verosimilitud ser:


3

L (p)

P (x , p) p
i

x1

(1 p)

1 x1

.p

x2

(1 p)

1 x2

.p

x3

(1 p)

1 x3

i 1

x1 x 2 x 3

(1 p)

3 ( x1 x 2 x 3 )

En la muestra (B, N, B) el valor que toma la funcin de verosimilitud ser:


L (p) p 1 0 1 (1 p) 3 (1 0 1) p 2 . (1 p)

8.- Un atleta olmpico de salto de altura se enfrenta a un listn de 2,3 metros. Su


entrenador desea estudiar el comportamiento del saltador. Sabe que el nmero de saltos
fallidos por hora es una variable aleatoria distribuida como una Poisson de parmetro .

a) Calcular el estimador mximo verosmil del parmetro .


b) Analizar sus propiedades.
Solucin:
a)
En muchas ocasiones, es ms prctico encontrar el estimador de mxima verosimilitud es
considerar la funcin soporte o log-verosimilitud lnL () , en lugar de la funcin de
verosimilitud L () , ya que es ms fcil de manejar y presenta los mismos mximos y
mnimos.
lnL ()
Se despeja ( 1, , n ) de la ecuacin:
0 y se obtiene el estimador de

mxima verosimilitud E.M.V ( )


Sea la v.a. X = 'nmero de saltos fallidos por hora'
x
e
En la distribucin de Poisson: P (X x)
x!

E (X)

V (X)

En una muestra aleatoria simple de tamao n, la funcin de verosimilitud L (X, ) :


n

L ( ) L (X, )

i 1

P (x i, )

x1

xn

e
e
x 1!
xn!

xi

i1
n

x!
i

i 1

18

e n

xi

L (X, )

i1
n

x!

e n

i 1

n
n
xi

xi
i1

e n ln( i1 ) ln(
lnL (X, ) ln n

xi!
i 1

x !) ln(e

i 1

x ln ln(x !) n
i

i 1

i 1

lnL (X, )

x ln ln(x !) n
i

i 1

i 1

Para obtener el estimador de mxima verosimilitud EMV ( ) , se deriva la expresin


anterior respecto del parmetro para obtener, sustituyendo por
n

lnL (X, )
0

i 1

1
xi
n

xi

i 1

El estimador de mxima verosimilitud viene dado por la media muestral: EMV ( ) x


b) Analizar las propiedades (Insesgadez, Consistencia, Eficiencia)

Insesgadez

El estimador sera insesgado (centrado) si E ( )


n

xi
n
1
1

i
1

E ( ) E
E ( x i )

n
n i 1
n

x
1
i 1 i

V ( ) V (x) V
2

n n

E (x i )

i 1

V (x )
i

i 1

1
(n )
n

(n )
2
n
n

Consistencia

Cuando no es posible emplear estimadores de mxima verosimilitud, el requisito mnimo


deseable para un estimador es que sea consistente.
Un estimador consistente es un estimador asintticamente insesgado cuya varianza
tiende a cero al aumentar el tamao muestral.
El estimador es consistente cuando lim E ( ) y lim V ( ) 0
n

19

lim E ( ) lim y

lim V ( ) lim 0
n
n n

El estimador es consistente

Eficiencia

Para que un estimador sea eficiente tiene que ser centrado y de varianza mnima.
La varianza mnima se analiza en virtud de la acotacin de Cramr-Rao:
V ( )

1
ln L (X, )
E

a cot acin de Cramr - Rao

En el caso discreto de una m.a.s, la expresin anterior se puede simplificar:


V ( )

Ahora bien, P (x , )

1
ln P (x ; )
n.E

a cot acin de Cramr - Rao

x
e
x!

x
lnP (x , ) ln
e x ln ln(x!)
x!

lnP (x , )

x
x
1

lnP (x, )
1
1
1

1
x
E
E
2 E (x ) 2 2 E (x x) 2 2 V (x) 2

En consecuencia, V ( )

1
n
n

El menor valor de la varianza del estimador ser

Se sabe que V ( ) V (x) , lo que muestra que el estimador empleado es eficiente.


n

20

9.- En una gran piscifactora hay una proporcin desconocida de peces de una especie
A. Para obtener informacin sobre esta proporcin, vamos a ir sacando peces al azar.

a) Si la proporcin de peces de la especie A es p., cul es la probabilidad de que el


primer pez de la especie A sea el dcimo que extraemos?.
b) Tres personas realizan, independientemente unas de otras, el proceso de sacar
peces al azar hasta encontrarse con el primero de tipo A:
- La primera persona obtiene el primer pez tipo A en la dcima extraccin
- La segunda persona obtiene el primer pez tipo A en la decimoquinta extraccin
- La tercera persona obtiene el primer pez tipo A en la decimoctava extraccin
Escribir la funcin de verosimilitud y obtener la estimacin de mxima verosimilitud de la
proporcin p.
Solucin:
El objetivo fundamental del ejercicio es estimar, por mxima verosimilitud, el parmetro
p = "proporcin de peces de la especie A".
a) P(primer pez tipo A en la dcima extraccin) = (1 p) 9 p
b) La funcin de verosimilitud L(p) = P(Resultados muestrales obtenidos)
L(p) = P(primer pez tipo A en la dcima extraccin y primer pez tipo A en la
decimoquinta extraccin y primer pez tipo A en la decimoctava extraccin)

L(p) (1 p) 9 p

(1 p)

14

log L(p) log (1 p) 40 p 3


log L(p)
dp

40 3
0
1 p p

(1 p)

log(1 p) 40 logp 3 40 log(1 p) 3 logp

17

p (1 p) 40 p 3

3
43

21

10.- Las personas de un pas se clasifican segn dos caractersticas: color de los ojos
(claros u oscuros) y sexo (hombre o mujer). Las dos caractersticas son independientes.

a) Obtenemos una muestra al azar de la poblacin con los siguientes resultados:


- 200 mujeres con ojos claros
- 150 hombres con ojos claros
- 350 mujeres con ojos oscuros
- 300 hombres con ojos oscuros
Obtener la estimacin de mxima verosimilitud de p = P(hombres) y q = P(ojos
oscuros)
b) Si tomamos 8 personas al azar de ese pas, cul es la probabilidad de encontrar
alguna mujer de ojos oscuros?. Y si la muestra que tomamos es de 200 personas,
cul es la probabilidad de que haya ms de 60 mujeres de ojos oscuros?
Solucin:
a) Las probabilidades de los cuatro posibles resultados muestrales son:
-

P(mujer con ojos claros) = (1 p) q


P(hombre con ojos claros) = p q
P(mujer con ojos oscuros) = (1 p)(1 q)
P(hombre con ojos oscuros) = p (1 q)

La funcin de verosimilitud L(p, q) = P(resultados muestrales obtenidos)


L(p, q) (1 p) q

200

p q (1 p)(1 q) (p (1 q)
150

350

300

p 450 1 p

550

q 350 1 q

650

log L(p, q) log p 450 (1 p) 550 q 350 (1 q) 650 450 logp 550 log(1 p) 350 log q 650 log(1 q)

log L(p, q) 450 550

0
p
1 p
p

p 0, 45

log L(p, q) 350 650

0
q
1 q
q

q 0,35

b) Se conoce que P(mujer con ojos oscuros) = (1 p)(1 q) 0,24


La variable aleatoria X = "nmero de mujeres con ojos oscuros, entre 8" sigue una
distribucin binomial B (n 8, p 0,24)
8
P(X 1) 1 P(X 0) 1 (0,24) 0 (0,76) 8 0,89
0
La variable Y = "nmero de mujeres con ojos oscuros, entre 200" , Y B (20, 0,24) , se
aproxima por la distribucin normal N( np 48 ,
Y 48 60 48
P(Y 60) P

P(z 1,99) 0,0233


6,04
6,04

22

np q 6,04)

11.- Calcular el estimador mximo verosmil del parmetro 'a' de las funciones:

a) f(x,a) a 2 e ax siendo x 0 en muestras aleatorias simples de tamao n


b) f(x,a) a e ax para x 0 , a 0 en muestras aleatorias simples de tamao 2
Solucin:
a)

f(x, a) a 2 e ax donde x 0 en m.a.s. de tamao n

La funcin de verosimilitud
L L (x 1, x 2 , , x n ; a) (a 2 e a x1 ).(a 2 e a x2 ) (a 2 e a xn ) a 2 n e

aplicando logaritmos neperianos: ln L log (a 2 n e

xi
i 1

xi
i 1

) 2n ln a a

i 1

derivando respecto de a e igualando a cero:


(ln L) 2n n
2n
2

x i 0 a n

a
a i 1
x
xi

2
x

i 1

b) Sea f(x, a) a e ax para x 0 , a 0 en m.a.s. de tamao 2


La funcin de verosimilitud
L L (x 1, x 2 ; a) (a e a x1 ).(a e a x2 ) a 2 e a ( x1 x2 )

aplicando logaritmos neperianos: ln L log (a 2 e a ( x1 x2 ) ) 2 ln a a (x1 x 2 )


derivando respecto de 'a' e igualando a cero:
(ln L) 2
2
1
(x1 x 2 ) 0 a

a
x1 x 2 x
a

23

12.- Sea la distribucin N( , ) , con media conocida y varianza desconocida.


Calcular la estimacin mximo-verosiml de la varianza en muestras aleatorias simples
de tamao n.

Solucin:
La funcin de verosimilitud es:
( x )

1 2
1
2
L (X; , )
e 2
22

( x )

2 2
1

e 2
2 2

( x n )

2
1


e 2
22

n
2

n
2 2

( xi ) 2
i1

2 2

(2 ) ( )

tomando logaritmos neperianos, se tiene:


n

( xi ) 2
(xi ) 2

i1
2
1
n
n
ln L (X; , 2 ) ln
e 2 ln(2 ) ln( 2 ) i 1
n
n
2
2
2 2

2 2
2

(2
)
(
)

y derivando respecto a e igualando a cero:


n

ln L (X; , 2 )

i 1

(xi )
2

(x i ) 0

i 1

x
i 1

El estimador de mxima verosimilitud de es la media muestral.


2 ln L (X; )
n
La condicin de mximo se verifica, pues:
2 0

24

13.- Sea la distribucin N(, ) , con la media y varianza desconocidas. Calcular los

estimadores mximo-verosmiles de y 2
Solucin:
La funcin de verosimilitud es:
( x )

1 2
1
2

L (X; , )
e 2
2
2

( x )

2 2
1

e 2
2
2

( x n )

2
1

e 2
2
2

n
2

n
2 2

( xi ) 2
i1

2 2

(2 ) ( )

tomando logaritmos neperianos, se tiene:


n

( xi ) 2
(xi ) 2

i1
2
1
n
n
ln L (X; , 2 ) ln
e 2 ln(2 ) ln( 2 ) i 1
n
n
2
2
2 2

2 2
2
(2 ) ( )

y derivando respecto de y 2 e igualando a cero:


n

ln L (X; , )

(x )
i

i 1

x
i 1

ln L (X; , 2 )
n

2 2

(xi ) 2
i 1

resolviendo el sistema resulta: x y


2

(x )

(xi x)

i 1

i 1

n
2

2x

Los estimadores mximo-verosmiles de y 2 son la media y la varianza muestrales.

25

CLCULO DE ESTIMADOR POR EL MTODO DE LOS MOMENTOS


14.- Sea una poblacin definida por: P (X 1)
P (X 1)

, P (X 0)
,
2
2

1
, donde 0 1 , 0 1
2

Estimar los parmetros y por el mtodo de los momentos, estudiando si son


insesgados.
Solucin:
MTODO DE LOS MOMENTOS.- El procedimiento consiste en igualar momentos
poblacionales respecto al origen ( r ) a los correspondientes momentos muestrales

respecto al origen (a r ) , formando as tantas ecuaciones como parmetros


poblacionales se pretenden estimar:
n

xi

i
1

1 E (X) 1 a 1
x
n

x i2

2
i 1
2 E (X ) 2 a 2
n

x ri

r
i 1
r E (X ) r a r

n
Puesto que hay que estimar dos parmetros hay que calcular los dos primeros
momentos.
momentos poblacionales

1
1 E(X)
x i P(X x i ) ( 1)
(0)
(1)

2
2
2
2
i

2 E(X 2 )

x
i

2
i

2
1

1
P(X x i ) ( 1) 2
(0) 2
(1) 2

2
2
2
2

momentos muestrales

xi
x i2

a1 x

a2

1 a1

x
2

2 a2

2
a2
2

2x

2 a 2 2
2a 2 2

2x

26

1 a 2 x

1 a 2 x

Un estimador es insesgado (o centrado) cuando se verifica E ( )

2
E ( ) E (1 a 2 x) 1 E (a 2 ) E (x) 1 2 1
2
2

2
E ( ) E (1 a 2 x) 1 E (a 2 ) E (x) 1 2 1
2
2

Los estimadores y son insesgados.

CLCULO DE ESTADSTICOS. FUNCIN DE DENSIDAD


15.- Una muestra aleatoria (X 1 , , X n ) de la poblacin tiene como funcin de

x 1 si x ( 0,1)
densidad f (x)
en el resto
0

>0

a) Hallar un estadstico suficiente


b) Estimador de mxima verosimilitud de
c) Estimador de por el mtodo de los momentos
Solucin:
a)
Un estimador es suficiente cuando no da lugar a una prdida de informacin. Es decir,
cuando la informacin basada en es tan buena como la que hiciera uso de toda la
muestra.
Para identificar estadsticos suficientes se utiliza el teorema de factorizacin, que dice
que dada una muestra aleatoria (x 1 , , x n ) de una poblacin X con funcin de masa
P (o funcin de densidad f ) un estadstico es suficiente para si y slo s:
P (x1 , , xn ) g (x1 , , xn ), . h(x1 , , xn )

f (x 1 , , x n ) g (x 1 , , xn ), . h(x1 , , xn )

caso discreto
caso continuo

Para encontrar un estadstico suficiente hay que factorizar la funcin de verosimilitud


de la forma: L () g( , ) . h(x 1 , , x n )
L () f (x ) f (x ) f (x ) ( x 1 )( x 1 ) ( x 1 ) n (x x ) 1

Por tanto, x , , x
1

es un estadstico suficiente.

27

b) L() n (x x ) 1
1

lnL() ln n (x x ) 1 ln n ln x 1 ln n ln( x 1 )

1
n
i
i
i 1
i 1
lnL () n ln 1

ln(xi )
i 1

lnL ()
n

ln(x )
i

i 1

n
n

ln(x )
i

i 1

c) Se plantea la ecuacin E X x
x E (X)

x f (x) dx x x

dx

x ( 1)

x 1

x dx

1
1 0

x
1 x

16.- Una muestra aleatoria (X 1 , , X n ) de la poblacin tiene como funcin de densidad


x
f (x) e
0

si x 0
en el resto

a) Hallar un estimador por el mtodo de los momentos de


b) Estudiar si el estimador encontrado en el apartado anterior es insesgado para
estimar el parmetro
Solucin:
a) Se plantea la ecuacin: E X x
integracin por

x E X

partes

x f (x) dx

x e x dx

x 1

b) Un estimador es insesgado o centrado cuando su valor probable coincide con el valor


del parmetro a estimar. Es decir, E
E E ( x 1) E ( x ) 1 ( 1) 1
Integracin por partes:

x edx
x

dv

x ( e x )

e dx
x
v

du

1 x
x e x e x (1 x) e x e x
e

28

xe

dx e

1 x
e x 1

17.- Una muestra aleatoria (X 1 , , X n ) de la poblacin tiene como funcin de


2 x e x
densidad f (x)
0

si x 0
en el resto

Hallar el estimador de mxima verosimilitud de


Solucin:
La funcin de verosimilitud L ( )
x

L () f (x ) f (x ) f (x ) 2 x e 1
1 2
n
1

x 2
x n
2
2
x 2 e
xn e

2 n (x x ) e
1

( x1 x 2 xn )

L () 2 n (x x ) e
1

i 1

lnL () (2n) ln ln

i 1

xi

lnL () (2n) ln

i 1

i 1

xi

i 1

lnL ()
2n

xi
2n

lnL ( ) ln (x x ) e i 1
1
n

xi

2 n (x x ) e

xi

i 1

2n
n

x
i 1

29

ln x i

x
i 1

18.- El coseno X del ngulo con el que se emiten los electrones en un proceso
radioactivo es una variable aleatoria con funcin de densidad

(1 x ) 2 1 x 1 , 1 1
f (x)
en el resto
0
Consideremos una muestra aleatoria (X1 , , Xn ) de esta variable aleatoria
a) Obtener el estimador por el mtodo de los momentos
b) Calcular la varianza de este estimador y demostrar que es consistente
Solucin:
a) Se plantea la ecuacin E X x
x E X

x2 x3
1 x

x
dx


2
6 1
3
2

3 x

V (X)
9

V (X)
b) V ( ) V (3 x) 9 V (x) 9
n
n

V (X) E (X ) E (X)
2

x3 x 4
1 x

x
dx


2
8 1 3
3
6
2

3 2

9
9 3 2 3 2
de donde, V ( ) V (X)

n
n 9
n

lim E ( )
n
Para probar que es consistente para estimar es suficiente probar
V ( ) 0
nlim

lim E ( ) lim E (3 x) lim 3E (x) 3E (X) 3


n
n
n
3
3 2
lim V ( ) lim V (3 x) lim
0
n
n
n
n
Por tanto, queda probado que es consistente para estimar

Portal Fuenterrebollo

30

S-ar putea să vă placă și