Documente Academic
Documente Profesional
Documente Cultură
La estimacin
Enrique Carreras
Pgina 1 de 25
ndice
Pgina 2 de 25
Estimacin puntual
Definicin de estimacin
La estimacin es el proceso de inferencia por el cual se busca obtener informacin de los parmetros
de una poblacin desconocida a partir de la informacin de los valores observados en una muestra
extrada al azar
El estimador es un estadstico, una funcin en los valores de una muestra (media, proporcin,
varianza, pendiente, ) usada para informar del valor de una parmetro poblacional desconocido.
x
n
i 1
n 1
(cuasivarianza)
Existen dos procedimientos para estimar las caractersticas poblacionales (parmetros) a partir de las
caractersticas de una muestra (estadsticos):
La estimacin puntual
Estimacin puntual Consiste en proponer como valor del parmetro, el valor del estadstico:
Es el valor ms probable, pero no puede determinarse el sesgo o distancia entre la estimacin y el valor
verdadero.
Por ejemplo,
1.
Se ha extrado al azar una muestra de una poblacin y se ha obtenido un valor medio de 20,3 aos. La
estimacin puntual del valor poblacional ser de 20,3 aos
2.
Se ha extrado al azar una muestra de una poblacin y se ha obtenido un porcentaje de varones de 34%. La
estimacin puntual del valor poblacional ser de 34% de varones
Pgina 3 de 25
El sesgo al
cuadrado
Lo que significa que el error cuadrtico medio de un estimador depende de dos componentes:
Escogeremos los estimadores que no tengan sesgo y cuya varianza sea menor.
.
como
2=
=0 la expresin queda
2=
Pgina 4 de 25
Las dos principales propiedades que deberan cumplir los estimadores son:
1.
Ausencia de sesgo
Un estimador insesgado es aquel clculo que no sobrestima ni subestima sistemticamente el
valor de la poblacin. La media de su distribucin muestral del estadstico coincide con la media
poblacional:
E .
2.
Eficiencia
Un estimador eficiente es aquel que produce distribuciones muestrales con una varianza del
estimador mnima, ante el mismo tamao de muestra. Los estimadores eficientes producirn
estimaciones ms precisas.
Como calcular todas las varianzas de todos los estimadores posibles para seleccionar aquel de
varianza mnima, cada estimador se calcula comparando su varianza con la Cota de Cramr-Rao,
2
para un tamao de muestra dado, la varianza del estimador no puede ser menor que dicha cota :
Cuando la cota de Cramr-Rao no es calculable, hay otros procedimientos para encontrar el ms eficiente,
como el mtodo de los estimadores insesgados uniformemente de varianza mnima
Pgina 5 de 25
Si un estimador alcanza la cota de Cramr-Rao, el resto tendrn mayores valores y sern menos
eficientes.
Un estimador es asintticamente eficiente si:
Eficiencia relativa: para comparar la eficiencia relativa entre dos estimadores
2
Si son insesgados:
3.
Consistencia
Conforme el tamao de las muestra n crezca, las estimaciones convergern en su parmetro:
prob
n
, se analiza el comportamiento
asinttico de la sucesin.
Un estimador es consistente si converge en probabilidad al parmetro:
Tomando lmites:
Pgina 6 de 25
Propiedades:
4.
Suficiencia.
Un estadstico debe ser suficiente para resumir la informacin de los elementos porque contiene la
informacin esencial del parmetro poblacional (no se requiere de otro estadstico).
Se determina por el criterio de factorizacin de Fisher- Neyman. Si la funcin de densidad conjunta sobre una
muestra cumple el criterio de Fisher-Neyman (se descompone en el producto de una funcin dependiendo del
parmetro por otra independiente) es suficiente.
La media muestral es suficiente.
5.
Invarianza
Se dice que un estimador es invariante cuando el estimador de la funcin del parmetro coincide con la funcin
del estimador del parmetro,
Los estimadores de funcin de un estimador iguala la funcin del estimador
Si para estimar la varianza poblacional utilizamos la cuasi-varianzamuestral, entonces para estimar la
desviacin tpica poblacional (funcin de la varianza poblacional) ser razonable utilizar la desviacin tpica
muestral
6.
Robustez
El estimador ser un estimador robusto del parmetro si la violacin de los supuestos de
partida en los que se basa la estimacin (por ejemplo, atribuir a la poblacin un determinado tipo
de funcin de distribucin que, en realidad, no es la correcta), no altera de manera significativa los
resultados que ste proporciona.
Pgina 7 de 25
Supongamos que un estadstico se comporta como una distribucin normal N(1,1), la probabilidad
de que el estadstico Y sea igual o mayor que 1
. Si en realidad se comporta como
una chi-cuadrado, la probabilidad de que Y sea 1 es diferente, para un grado de libertad:
y la t de Student
Caracterstica
poblacional
Caractersticas de
una sola variable
Caractersticas de
distribuciones
conjuntas de
variables
Formula
Clculo
Media muestral
Pp
proporcin muestral
cuasivarianza
muestral
S m2
rX ,Y
Correlacin muestral
rx , y
Pendiente muestral
bx
1 2
Diferencia de medias
muestrales
x1 x2
Media poblacional
Proporcin
poblacional
Varianza poblacional
Correlacin
poblacional
Pendiente de
regresin
Diferencia de medias
poblacional
Mejor estimador
n
xi x
n 1
xi
Zy
Una muestra aleatoria contiene n V.A.s independientes, con la misma distribucin de probabilidad
que la poblacin.
Cada uno de los elementos de la muestra presentar una distribucin de probabilidad, que depender
del verdadero valor del parmetro, (la aparicin de cada valormuestral est condicionada por el valor
del parmetro poblacional)
Material elaborado por Enrique Carreras
Pgina 8 de 25
Que dado que se ha realizado los valores de una muestra (que han salido stos y no otros)
lo ms verosmil es que haya procedido de un parmetro .
Es decir, a partir de la realizacin de una muestra podemos estimar el valor verdadero ms probable que ha
inducido la muestra concreta (lo sucedido es lo ms verosmil de lo que poda suceder).
Propiedades de los estimadores obtenidos por mxima verosimilitud:
Insesgados
Consistentes
Eficientes
Normalidad asinttica
Suficiencia
Invarianza
2.
Dado que los momentos poblacionales respecto del origen r son insesgados
Se plantean tantos momentos como parmetros a estimar:
1(1, 2, k) = a1
2(1, 2, k) = a2
..
n(1, 2, k) = an
Pgina 9 de 25
Trabaja a partir de los resultados de una muestra y pretende buscar una funcin que minimice los errores
cuadrticos medios entre los valores observados y los de la funcin ajustada.
Se estiman los valores de los parmetros que hagan mnimas esas diferencias.
Pgina 10 de 25
La estimacin puntual desconoce la distancia en que se encuentra respecto del valor verdadero
Intervalo de confianza es el rango de valores que contiene el valor poblacional, con un nivel de confianza
prefijado (probabilidad de acertar al afirmar el intervalo de confianza)
Lmite superior del intervalo (es una funcin muestral: gsup(X))
Lmite inferior del intervalo (es una funcin muestral: ginf(X))
Intervalo de
confianza
Nivel de
confianza
Construccin de Intervalos de confianza en poblaciones normales para poblaciones con distribucin normal
N(, )
Por TCL, cuando n> 30, el estadstico pivote sabemos que sigue una distribucin normal estndar
Recordemos que
Y la varianza
Pgina 11 de 25
despejando
N(0,1)
Estadstico Nivel de
muestral confianza
Error
Tpico
Z/2
- Z/2
-3
-2,5
-2
-1,5
-1
-0,5
0,5
1,5
2,5
Lmite superior
Lmite inferior
Pivote para calcular el intervalo de confianza:
Con un nivel de confianza del 1-, el parmetro poblacional se encuentra entre los lmites del
intervalo:
Lmite superior:
Lmite inferior:
Problema:
En una muestra de 89 casos, se ha calculado el tiempo medio en completar una tarea, que es de 23,4
minutos. Sabiendo que la norma es una desviacin tpica de 5,2 minutos, Cul es el tiempo medio en la
poblacin, con una confianza del 95%?
Sabemos que la desviacin tpica en la poblacin es de 5,2 minutos (parmetro poblacional)
0,250
0,200
1- = 0,95
0,150
0,100
0,025
0,025
0,050
0,000
-3
-2
-1
-Z/2= -1,96
Z/2= 1,96
Pgina 12 de 25
Lmite superior:
Lmite inferior:
Respuesta: Con un nivel de confianza del 95%, el parmetro tiempo medio no es mayor de 24.48, ni
menor de22,32
Estadstico
muestral
Lmite inferior
Nivel de
confianza
Error
Tpico
Lmite superior
0,45
t(g.l.=4)
0,4
t(g.l.=12)
0,35
t(g.l.=340)
0,3
0,25
1-
0,2
/2
0,15
/2
0,1
0,05
0
-3,00
-2,50
-2,00
-1,50
-1,00
-0,50
0,00
0,50
1,00
1,50
2,00
2,50
3,00
Pgina 13 de 25
Problema:
Una muestra aleatoria de 12 alumnos/as, ha obtenido una media de 6,35 y una desviacin de 2,2.
Calcula la nota media poblacional para este tipo de alumnado, con una confianza del 90%?
Desconocemos la varianza poblacional
Lmite superior:
Lmite inferior:
ATENCIN:
Cuando se desconoce la desviacin poblacional, se toma la cuasi-desviacin muestral y se aplica la t de
Student.
Ahora bien, si n > 30, la cuasi-desviacin tpica es un estimador suficientemente bueno (flucta poco sobre la
) y se puede aplicar la normal para resolver el problema:
Para 120 g.l. (121 casos) t120, 0,025 = 2,00 z0,025 = 1,96
Para muestras pequeas, n < 30, si proceden de una normal, siempre la t de Student, la fluctuacin de la
cuasi-varianza sobre la varianza poblacional es excesiva:
Pgina 14 de 25
distribucin asimtrica
n=4
gl = 4-1 = 3
0,2
0,15
0,1
1- = 0,90
/ 2 = 0,05
0,05
1- ( / 2) = 0,95
0
0
2 (4-1) = 0,352
2 (4-1) = 7,81
2
n-1:
Despejando:
Lmite
inferior
Lmite
superior
Problema:
En el mismo problema anterior: Un grupo de 12alumnos/as, ha obtenido una media de 6,35 y una
desviacin de 2,2. Cul sera el intervalo de confianza que contiene la desviacin tpica poblacional con
una confianza del 85%.
Pgina 15 de 25
10
11
2
2
0,25
El
El
2
(11)
2
(11)
n = 12
gl = 12-1 = 11
0,2
0,15
1- = 0,85
0,1
Lmite superior:
/ 2 = 0,075
0,05
1- ( / 2) = 0,925
0
0
Lmite inferior:
-0,05
2 (4-1) = 4,55
10
15
20
2 (4-1) = 18,44
cuando el tamao de
muestra es grande.
El estadstico pivote se distribuye como una normal,por tanto:
Estadstico Nivel de
muestral confianza
Error
Tpico
Lmite inferior
Material elaborado por Enrique Carreras
Lmite superior
Pgina 16 de 25
Problema:
En una encuesta a 85 personas, la intencin de votoa un partido ha sido del 34%. Cul sera el intervalo
de confianza que contiene la proporcin de voto poblacional, con una confianza del 90%.
Z = 1,645
Lmite superior:
Lmite inferior:
, despejamos y queda:
Lmite
inferior
1-
0,99
0,95
0,90
0,01
0,05
0,10
K
10
4,4721
3,1623
Lmite
superior
Pgina 17 de 25
Problema:
En una muestra aleatoria de 80 personas, se ha calculado que la altura media es de 1,74. Como sabemos
que en la poblacin la desviacin es de 0,34. Con una probabilidad del 90% cul es el intervalo de
confianza?
Siendo 1- = 0,90, despejando = 0,05 y K = 3,1623
Lmite Superior:
Lmite Inferior:
Es menos preciso que si aplicamos TCL
Asintticamente insesgado
Consistente
, es la funcin de probabilidad del elemento i-simo de la muestra. Por tanto, la funcin de probabilidad conjunta de
los valores de la muestra, tambin depender del valor del parmetro en la poblacin:
Pgina 18 de 25
Lmite inferior
Lmite superior
Estadstico Media
Estadstico Proporcin p
Para una poblacin normal
Varianza
conocida
Varianza
descono
-cida
Siendo K:
Varianza
descono
-cida
Siendo K:
Siendo K:
Estadstico varianza
Varianza
desconocida
Pgina 19 de 25
Problemas:
=5
2 = 4
n = 16
Por tanto:
Pgina 20 de 25
De una poblacin N(1 ; 3) se extraen muestras aleatorias simples de tamao 29. Obtener:
a)
Sabemos:
=1
= 3
0,5
n = 29
0,4
0,4
0,3
0,3
2 = 1,795
0,2
0,2
0,0363
0,1
0,1
0,0
-3,00
-2,00
-1,00
0,00
1,00
Determinar el nmero de motocicletas vendidas por una marca, sabiendo que en una muestra m.a.s. de 14
establecimientos, se vendieron un promedio de102motos con una cuasi-desviacinmuestral de 22 motos, se
pide:
a) Obtenga el intervalo de confianza para la media con un grado de confianza del 90%.
Para n < 30 casos, sabemos que el intervalo de confianza se distribuye como una t de Student con n-1 g.l.
Con un nivel de confianza del 90%, el autntico valor del promedio de motos vendidas est
comprendido entre el 91,2 y el 112,8.
b) Con el mismo nivel de confianza, del 90% obtenga el intervalo de confianza de la varianza poblacional
Para todo tamao de muestras sabemos que el estadstico varianza poblacional se distribuye como
una chi-cuadrado con n-1 grados de libertad.
Siendo = 0,10, entonces /2 = 0,05
Calculamos el lmite inferior de la chi-cuadrado (1-/2). En las tablas, para 13 g.l. 13, 0,95 = 5,89
Calculamos el lmite superior de la chi-cuadrado (/2). En las tablas, para 13 g.l. 13, 0,05 = 22,4
Pgina 21 de 25
2,00
3,00
Con una probabilidad del 90% la varianza poblacional se sita entre el 280,9 y el 1068,3, en trminos de
desviacin tpica (32,68 y 16,76)
Una determinada sucursal de un banco comienza cada da con una cierta cantidad de dinero en su caja.
Admitiendo que dicha cantidad es una variable aleatoria con distribucin normal, obtener el intervalo de
confianza del 95% de la cantidad media de dinero existente en la caja al comienzo de la jornada laboral en la
citada sucursal bancaria sabiendo que una m.a.s. de 9 das arroj las siguientes cantidades (en millones
euros): 15, 20, 22, 19, 17, 25, 21, 18 y 23
xi
15
20
22
19
17
25
21
18
23
Suma
180
Media
(xi-X)2
441
256
196
289
361
121
225
324
169
Suma
2382
cuasivarianza
36,0
297,8
Con un nivel de confianza del 95%, la cantidad media de dinero existente en la caja
al comienzo de la jornada laboralest comprendido entre el 22,7 y el 49,26.
Pgina 22 de 25
En una poblacin N(;) se estima por un intervalo de confianza a travs de una m.a.s de tamao 100,
con media muestral 175 y cuasi-desviacin tpica muestral2, Calcular:
a) El nivel de confianza preciso para que elegido como estimador de la media poblacional el estadstico
x , la semi-amplitud del intervalo de error sea como mximo 0,392.
*
2
Siendo el error, con un nivel de confianza del 95%, del 0,392, el intervalo de confianza estara entre:
17,5 0,392=17,11 y
15,5 + 0.392 = 17,89
Ambas seran posibles, la mejor se establecer por el lema de Neyman Pearson (la que con el mismo
nivel de significacin, obtenga un menor error tipo II, el mayor poder)
c)
Pgina 23 de 25
Una empresa desea estudiar la demanda futura de uno de sus productos, para lo cual selecciona, mediante
muestreo aleatorio simple, a diez de sus clientes, observando el nmero de unidades demandadas por
ellos:
Unidades
demandadas
Nmero de
clientes
1000
1002
1004
1006
1008
1010
1012
1
2
1
2
1
2
1
Nmero de
clientes
xini
xi2ni
1000
1000
1000000
1002
2004
2008008
1004
1004
1008016
1006
2012
2024072
1008
1008
1016064
1010
2020
2040200
1012
1012
1024144
casos
Suma
Suma
10
10060
10120504
Media
Varianza
Cuasi-varianza
1006
14,4
16,0
Cuasi-desviacin
4,0
Con un nivel de confianza del 95%, el autntico valor de la demanda media entre el 1003,1 y el 1008,9
Pgina 24 de 25
Con un nivel de confianza del 95%, el autntico valor de la varianza poblacional est comprendido entre
el 53,3 y el 7,6
Pgina 25 de 25