Sunteți pe pagina 1din 10

Captulo 6

Introduccin a la inferencia
estadstica. Estimacin

1. La inferencia estadstica. Poblacin y muestra.

2. Distribucin muestral de un estadstico.

3. Estimacin y estimadores.

4. El mtodo de los momentos.

5. Evaluacin de los estimadores.

6. La distribucin de la media muestral.

0 Apuntes realizados por Ismael Snchez. Todos los derechos reservados.


2 CAPTULO 6. INTRODUCCIN A LA INFERENCIA ESTADSTICA. ESTIMACIN

6.1. La inferencia estadstica. Poblacin y muestra


Como ya se ha dicho en anteriores temas, uno de los principales objetivos de la estadstica es
el aprendizaje a partir de la observacin. En particular, la estadstica proporciona el mtodo para
poder conocer cmo es el fenmeno real que ha generado los datos observados y que generar los
futuros. En estadstica, el inters nal no est tanto en los datos observados, sino en cmo sern los
prximos datos que se vayan a observar. Como ya se ha estudiado anteriormente, consideraremos
que la variable que nos interesa es una variable aleatoria X, y que los datos que observamos son
slo una muestra (conjunto de realizaciones) procedente de dicha variable aleatoria. La variable
aleatoria puede generar un nmero indenido de datos. Todos los datos posibles (posiblemente
innitos) sern la poblacin. Por eso, muchas veces nos referiremos de forma indistinta a la
poblacin o a la variable aleatoria que la genera.
Supongamos, por ejemplo, que queremos saber cmo son los artculos manufacturados por un
determinado proceso. Para ello nos concentraremos en algn conjunto de variables medibles que
sean representativas de las caractersticas de dicho artculo. Por ejemplo, la longitud de alguna de
sus dimensiones podra ser una variable que nos interese conocer. La longitud de los posibles artcu-
los manufacturados ser una variable aleatoria, pues todo proceso productivo tiene siempre
variabilidad, grande o pequea. Las longitudes de los distintos artculos sern, en general, dis-
tintas. Diremos entonces que X = longitud de un artculo genrico, es una variable aleatoria de
distribucin desconocida. Para poder saber cmo es esa variable aleatoria, produciremos una mues-
tra de artculos, y a partir de ella haremos un ejercicio de inducccin, para extrapolar las
caractersticas de la muestra a toda la poblacin.
En estadstica, al ejercicio de induccin, por el que a partir de la muestra intentamos predecir
cmo ser el resto de la poblacin que no se ha observado (la variable aleatoria) se le llama
inferencia estadstica, o simplemente inferencia. Supondremos que para realizar este ejercicio
de inferencia tenemos una conjunto de datos obtenidos al azar de entre la poblacin de posibles
datos. A una muestra de este tipo se le llamar muestra aleatoria simple. Por simplicidad, y
mientras no se diga lo contrario, supondremos que las muestras que obtengamos sern muestras
aleatorias simples, y por tanto nos referiremos a ellas simplemente como muestras. En una muestra
aleatoria simple se tienen dos caractersticas importantes:

1. Los elementos de la muestra son independientes entre s. Por tanto, el valor que tome uno de
ellos no condicionar al de los dems. Esta independencia se puede conseguir seleccionando
los elementos al azar.

2. Todos los elementos tienen las mismas caractersticas que la poblacin.

Sea X nuestra variable aleatoria de inters, y sean X1 ; X2 ; :::; Xn los elementos de una muestra
de tamao n de dicha variable aleatoria X: Entonces, antes de ver los valores concretos que tomar
la muestra formada por X1 ; X2 ; :::; Xn , tendremos que la muesta X1 ; X2 ; :::; Xn ser un conjunto
de variables aleatorias independientes e idnticas a X:
6.2. DISTRIBUCIN MUESTRAL DE UN ESTADSTICO 3

6.2. Distribucin muestral de un estadstico


Volvamos a nuestro ejemplo del proceso productivo, en el que estamos interesados en saber
cmo es la variable aleatoria X =longitud de un artculo genrico. Estamos interesados en las
caractersticas de la poblacin, es decir, en todas las longitudes posibles. Supongamos que tenemos
una muestra de n = 100 artculos y hemos medido sus longitudes. Supongamos que calculamos un
conjunto de medidas caractersticas de dicha muestra de 100 longitudes: la media, la varianza, etc.
Son dichos valores los de la poblacin? Est claro que no. La media de las n = 100 longitudes no
tiene por qu coincidir con la media de toda la poblacin. La media de la poblacin ser el promedio
de TODOS sus innitos datos, y slo por casualidad ser igual al promedio de los n = 100 datos
que hemos seleccionado al azar. El problema es que si no tenemos todos los innitos datos, no
podremos conocer las medidas caractersticas de la poblacin. Slo tendremos lo que podamos
obtener de la muestra. Por tanto, una primera conclusin que podemos extraer al intentar predecir
(inferir) las medidas caractersticas de una poblacin utilizando una muestra es la siguiente:

Conclusin 1: Los valores de las medidas caractersticas que se obtienen de una mues-
tra sern slo una aproximacin de los valores de las medidas caractersticas de
la poblacin.

Otra segunda limitacin de intentar averiguar cmo es una poblacin a partir de la informa-
cin de una muestra, es que nuestras conclusiones dependen de la muestra concreta que hayamos
obtenido. Con otras muestras tendramos otros valores en nuestras medidas caractersticas y po-
dramos sacar conclusiones diferentes sobre la poblacin. Supongamos que tomamos una muestra
de n = 100 artculos y medimos esas 100 longitudes obteniendo una longitud media de X = 23;5
cm Quiere esto decir que cada vez que tomemos una muestra al azar de 100 de dichos artculos
y los midamos, su media muestral ser siempre X = 23;5 cm? Pues obviamente no. Ser mucha
casualidad que dos muestras distintas nos den exctamente la misma media. Como son muestras
de una misma poblacin, las medias ser ms o menos similares, pero no tienen por qu coincidir.
Por tanto, se puede concluir los siguiente:

Conclusin 2: Los valores de las medidas caractersticas que se obtienen de una mues-
tra dependen de los elementos que la constituyen. Muestras diferentes darn por
tanto valores diferentes.

Como los elementos han sido seleccionados al azar, se dice que los valores de las medidas
caractersticas de una muestra dependen del azar del muestreo. En lugar de hablar de me-
didas caractersticas de una muestra, hablaremos de forma ms general de operaciones matemticas
realizadas con la muestra. Vamos a introducir entonces un nuevo concepto: llamaremos estadstico
a cualquier operacin realizada con una muestra. Por ejemplo, la media muestral es un estads-
tico, as como la varianza, el rango, o cualquier otra medida caracterstica. El estadstico es
la operacin matemtica, no el resultado obtenido. El estadstico tomar, de acuerdo a
4 CAPTULO 6. INTRODUCCIN A LA INFERENCIA ESTADSTICA. ESTIMACIN

la conclusin 2 anterior, un valor diferente en cada muestra. Un estadstico ser, por tanto,
una variable aleatoria pues el valor concreto que obtengamos depender del azar del muestreo.
El resultado obtenido con una muestra concreta ser una realizacin de dicha variable aleatoria.
Cada vez que realicemos el experimento de computar el valor de un estadstico en una
muestra diferente, obtendremos una realizacin diferente del estadstico. En la prctica,
tendremos una sola muestra, y por tanto una sola realizacin del estadstico.
Si queremos dar alguna interpretacin al valor de la realizacin de un estadstico en una muestra
concreta, necesitamos conocer cmo vara el valor que puede tomar el estadstico de unas muestras a
otras (ese ser uno de los objetivos de este tema). Por ejemplo, supongamos el caso de las longitudes
de los artculos antes mencionados. Supongamos tambin que sabemos por informacin histrica
que si el proceso productivo funciona adecuadamente, la longitud media ( ) de los artculos que
produce debe ser de =25 cm. Cmo podemos entonces interpretar que en una muestra de
tamao n = 100 se haya obtenido que X = 23;5 cm? Es esa diferencia (25-23.5) evidencia de
que la media se ha reducido y por eso la muestra tiene una media menor? O la media no ha
cambiado y esa discrepancia (25-23.5) puede atribuirse a la variabilidad debida al muestreo? Si no
conocemos la funcin de densidad de X no podremos valorar si 23.5 es un nmero muy alejado de
25, y por tanto sospechoso de que algo ha ocurrido en el proceso; o por el contrario que sea muy
frecuente que muestras de una poblacin de media = 25 den alejamientos tan grandes como 23.5.
Supongamos ahora que extraemos una segunda muestra de tamao n = 100 tras haber realizado
algunos ajustes a la mquina y que obtenemos que la nueva media muestral es X(2) = 24: Quiere
decir que los ajustes han provocado un aumento en la media (de 23.5 a 24)?o ese cambio (23.5-24)
puede explicarse simplemente por ser muestras diferentes de una misma poblacin de media 25?.
El tipo de preguntas que se plantean en el prrafo anterior son muy importantes en la prctica,
y sern las que querremos resolver con la estadstica. Para responder a este tipo de preguntas,
es necesario conocer las caractersticas del estadstico que nos interese (en el caso del ejemplo, la
media muestral). A la distribucin de un estadstico debido a la variabilidad de la muestra se le
denomina, distribucin del estadstico en el muestreo. Esta distribucin depender de cada
caso concreto.
Es importante darse cuenta de que estamos manejando dos niveles de variables aleatorias.
En un primer nivel, ms supercial, estara nuestra variable aleatoria de inters X. En nuestro
ejemplo sera X = longitud de un artculo genrico de nuestro proceso productivo. Para conocer
las propiedades de dicha variable aleatoria extraemos una muestra aleatoria simple de tamao n.
Las longitudes de esos n elementos sern X1 ; X2 ; :::; Xn : Como hemos dicho anteriormente, antes de
extraer la muestra, no sabremos qu valores tomarn X1 ; X2 ; :::; Xn : Y al tratarse de una muestra
aleatoria simple, estos n elementos pueden interpretarse como un conjunto de n variables aleatorias
independientes, e idnticas a nuestra variable de inters X: Nuestro objetivo es utilizar la muestra
para saber cmo es X: Para ello, computamos el valor de un conjunto de estadsticos de inters
con los datos de la muestra: X; Sx2 ; etc. Esos estadsticos constituirn, debido a la variabilidad del
muestreo, un segundo nivel de variables aleatorias con caractersticas diferentes a X: Para jar
6.3. ESTIMACIN Y ESTIMADORES 5

mejor estos conceptos, en la seccin siguiente veremos el caso de la media muestral.

6.3. Estimacin y estimadores


Lo que hemos hecho en la seccin anterior: utilizar la media muestral para asignar un valor
aproximado a la media poblacional se denomina estimacin. En general, la estimacin consiste
en asignar valores numricos a aquellos parmetros poblacionales que no conozcamos. Un ejemplo
de parmetros poblacionales desconocidos seran las medidas caractersticas de poblaciones de las
que slo observamos una muestra. La estimacin se realiza mediante la utilizacin de un estadstico,
que evaluamos con una muestra de datos. Llamaremos estimador al estadstico que se usa
para estimar un parmetro.
Por ejemplo, supongamos que despus de analizar una muestra de longitudes de n artculos
hemos concluido que la distribucin normal es un modelo de probabilidad adecuado para describir
las longitudes de las piezas que salgan de dicho proceso productivo, es decir X N ( ; 2 ). El
problema entonces estar en asignar valores a los parmetros desconocidos ; y 2 de dicha
distribucin. El problema de estimacin no solo aparece cuando buscamos un modelo de probabil-
idad. En algunos casos slo estamos interesados en algunas medidas caractersticas poblacionales:
media, varianza, etc. En ambos casos, tanto si estamos interesados en encontrar un modelo de
probabilidad o slo algunas medidas caractersticas, tenemos que utilizar una muestra de datos
para estimar un parmetro poblacional desconocido.
Un parmetro es siempre una propiedad de la poblacin, y por tanto ser una constante
de valor desconocido. El valor del parmetro de una Poisson o una exponencial, o el parmetro p
de una binomial, etc slo se podran conocer con exactitud si tuvisemos acceso a toda la poblacin;
es decir, si repitisemos el experimento aleatorio indenidamente, lo que en la prctica es imposible.
Para denotar a un estimador usaremos la misma letra que el parmetro pero con el acento
circunejo (^) encima. Para el caso de la media poblacional , un estimador ser denotado por ^ :
Si usamos la media muestral como estimador de la media tendremos entonces que

X1 + X2 + + Xn
^=X= :
n

6.4. El mtodo de los momentos


Existen varios mtodos para construir estimadores: mtodo de los momentos, mtodo de mxi-
ma verosimilutud, mnimos cuadrados, etc. Diferentes mtodos de estimacin pueden proporcionar,
no obstante, el mismo resultado. Por ejemplo, si nuestro inters es en buscar un estimador para
la media de una pobacin, muchos mtodos de estimacin darn como resultado usar la media
muestral para estimar la media poblacional.
El mtodo de estimacin ms sencillo tal vez sea el denominado mtodo plug-in(no se utiliza
su traduccin al espaol, pero sera algo as como el mtodo por analoga). El mtodo plug-in
6 CAPTULO 6. INTRODUCCIN A LA INFERENCIA ESTADSTICA. ESTIMACIN

consiste bsicamente en estimar una caracterstica de la poblacin con la respectiva caracterstica


muestral. As, para estimar la media poblacional ; el mtodo de los momentos consistira en
utilizar la media muestral X: De la misma forma, el estimador de la varianza poblacional 2 por
el mtodo de los momentos ser la varianza de la muestra s2 : Si lo que queremos es estimar una
probabilidad p de que se observe un suceso en una poblacin, usaremos la proporcin muestral, es
decir, la proporcin de veces que se ha observado el suceso en la muestra analizada.
Antes de introducir el mtodo de los momentos necesitamos denir el concepto estadstico de
momento. En estadstica se denomina momento de una poblacin de orden m a

Mm = E(X m ); (6.1)

mientras que momento muestral de orden m es


Pn
Xm
mm = i=1 i : (6.2)
n
Por tanto el primer momento poblacional es E(X) = y el primer momento muestral X: El
Pn
2
segundo momento poblacional ser E(X ) y el segundo momento muestral ser i=1 Xi2 n; y as
sucesivamente.
Asmismo, se denomina momento poblacional de orden m centrado, o especto a la
media a
c
Mm = E [(X )m ] (6.3)

y el momento muestral de orden m centrado o respecto a la media es


Pn m
Xi X
mcm = i=1 (6.4)
n
Por tanto la varianza poblacional 2 es el momento de segundo orden respecto a la media, y la
varianza muestral s2 es el segundo momento muestral respecto a la media.
El mtodo de los momentos consiste bsicamente en estimar un momento poblacional con el
respectivo momento muestral. Puede interprarse como un caso particular de estimacin plug-in.
Es decir, consiste en aplicar:

^m
M = mm ; (6.5)
^m
M c
= mcm : (6.6)

Una vez que tenemos los estimadores M ^m o M ^mc


podemos encontar los estimadors de los
parmetros del modelo, pues todo parmetro de un modelo poblacional puede escribirse en funcin
de los momentos poblacionales. Vemoslo con algunos ejemplos..

Ejemplo 1 Sean t1 ; t2 ; :::; tn el tiempo de atencin a n clientes en cierto puesto de servicio. Si el


tiempo de atencin es una variable aleatoria exponencial de parmetro ; estima este parmetro
por el mtodo de los momentos.
6.5. EVALUACIN DE LOS ESTIMADORES 7

SOLUCIN:
Como en una exponencial se tiene que
1 1
E(T ) = ) = ;
E(T )

Entonces, utilizando el mtodo de los momentos estimaremos el primer momento poblacional E(T )
con el primer momento muestral, que es la media muestral, es decir:
Pn
ti
T = i=1 ;
n
y por tanto el estimador de por el mtodo de los momentos ser:

^= 1 1
=
[)
E(T T

Ejemplo 2 Se desea estimar la proporcin de artculos defectuosos que produce una mquina.
Para ello se analizan n artculos, resultando que d son defectuosos. Estima p por el mtodo de los
momentos. Supondremos que la aparicin de artculos defectuosos sigue un proceso de Bernoulli.
SOLUCIN:
Si llamamos X a la variable de Bernoulli que vale 1 si el artculo es defectuoso y 0 si es
aceptable, entonces
E(X) = p

Estimaremos p mediante el promedio de las variables de Bernoullis de los n artculos analizados.


Por tanto, si Xi = 1 si el artculo i-simo es defectuosos y 0 si es aceptable,
Pn
i=1 Xi d
p^ = =
n n
nmero de artculos defectuosos
= ;
nmero de artculos analizados
por lo que el estimador de la proporcin poblacional es la proporcin muestral.

6.5. Evaluacin de los estimadores


El estimador ^ = X es, como cualquier otro estimador que hubisemos seleccionado, una
variable aleatoria, pues su valor cambia de unas muestras a otras. Vemos entonces que al querer
estimar el parmetro de una variable aleatoria X nos topamos con otra nueva variable aleatoria ^
, debido a la incertidumbre del muestreo, que ser necesario analizar. Si para estimar un parmetro
tuvisemos que elegir entre varios estimadores alternativos, elegiramos aqul que tuviese mejores
propiedades estadsticas. A continuacin vamos a enunciar qu propiedades estadsticas de un
estimador conviene tener en cuenta.
8 CAPTULO 6. INTRODUCCIN A LA INFERENCIA ESTADSTICA. ESTIMACIN

Supongamos que queremos estimar un parmetro y usamos un estimador ^ que consiste en


cierta operacin matemtica realizada con una muestra. Las caractersticas ms importantes de ^
son E(^) y Var(^). En general sern preferibles aquellos estimadores que cuya distribucin muestral
verique que E(^) = : A los estimadores que verican esta propiedad se les denomina insesgados
o centrados. Si un estimador verica que E(^) 6= se dice que el estimador es sesgado. El sesgo
de un estimador viene entonces denido por

sesgo(^) = E(^) :

Por ejemplo, vimos en (6.8) que la media muestral es una variable aleatoria de media : Por lo
tanto la media mestral es un estimador insesgado de la media poblacional. En lo que
respecta a la varianza de la variable aleatoria ^; diremos que, en general sern preferibles aquellos
estimadores que tengan menor varianza, pues ser, ms precisos en el sentido de que variarn poco
de unas muestras a otras.
A la desviacin tpica de un estimador se le suele denominar error estndar del estimador.
Por ejemplo, en el caso de la media muestral como estimador de la media poblacional, veamos en
p
la seccin anterior que Var(^ ) = 2 =n. Por tanto, el error estndar de ^ es = n:
Vemos entonces que es preferible un estimador insesgado a otro sesgado, y un estimador con
poco error estndar a otro con mayor error estndar. Y si dos estimador tiene menos sesgo que otro,
pero ms varianza?Cmo elegimos el mejor? Para estos casos, deniremos un criterio que tenga
en cuenta tanto el sesgo como la varianza. Deniremos error cuadrtico medio de un estimador
ECM(^) a
h i2
ECM(^) = sesgo(^) + Var ^ :

En general, entre un conjunto de estimadores alternativos para un mismo parmetro, elegiremos


aqul que tenga menor ECM. Al estimador que tiene menor ECM le diremos que es eciente.

Ejemplo 3 En muestras aleatorias simples de tamao n = 3 de una variable aleatoria normal de


media y varianza conocida 2 = 1; se consideran los siguientes estimadores de :

1 1 1
^1 = X1 + X2 + X3 ;
3 3 3
1 1 1
^ 2 = X1 + X2 + X3 ;
4 2 4
1 3 1
^ 3 = X1 + X2 + X3 ;
8 8 2

donde X1 ; X2 ; X3 son las observaciones. Comprobar que son estimadores insesgados y estudiar su
error cuadrtico medio.
SOLUCIN:
6.6. LA DISTRIBUCIN DE LA MEDIA MUESTRAL 9

1 1 1 1
E(^ 1 ) = E(X1 ) + E(X2 ) + E(X3 ) = 3 =
3 3 3 3
1 1 1 1 1 1
E(^ 2 ) = E(X1 ) + E(X2 ) + E(X3 ) = + + =
4 2 4 4 2 4
1 3 1 1 3 1
E(^ 3 ) = E(X1 ) + E(X2 ) + E(X3 ) = + + =
8 8 2 8 8 2
Al ser centrados, el ECM es la varianza.
1 1 1 1 1 1 1 2 1
V ar(^ 1 ) = V ar( X1 + X2 + X3 ) = V ar(X1 ) + V ar(X2 ) + V ar(X3 ) = = = 0;333
3 3 3 9 9 9 3 3
1 1 1 1 1 1 3 2 3
V ar(^ 2 ) = V ar( X1 + X2 + X3 ) = V ar(X1 ) + V ar(X2 ) + V ar(X3 ) = = = 0;375
4 2 4 16 4 16 8 8
1 3 1 1 9 1 26 2 13
V ar(^ 3 ) = V ar( X1 + X2 + X3 ) = V ar(X1 ) + V ar(X2 ) + V ar(X3 ) = = = 0;406
8 8 2 64 64 4 64 32
luego el ms eciente es ^ 1 :

6.6. La distribucin de la media muestral


Supongamos que tenemos una muestra de tamao n de una variable aleatoria X: Los elementos
de dicha muestra sern sern X1 ; X2 ; :::; Xn : La media muestral de esas n observaciones es el
siguiente estadstico:
X1 + X2 + + Xn
X= : (6.7)
n
Como cada Xi es una variable aleatoria (idntica a X) tendremos que X es tambin una variable
aleatoria. De esta manera, su valor ser, en general, diferente en cada muestra. El objetivo de esta
seccin es analizar cmo es la distribucin de X en el muestreo.
En primer lugar calcularemos la esperanza matemtica de X: Si llamamos E(X) = tendremos
que E(Xi ) = ; i = 1; 2; :::; n: Entonces

X1 + X2 + + Xn E(X1 ) + E(X2 ) + + E(Xn ) n


E(X) = E = = = : (6.8)
n n n

Por tanto, aunque X pueda variar de unas muestras a otras, por trmino medio proporciona el
valor de la media poblacional, que es al n y al cabo nuestro objetivo. Este resultado es muy
importante, pues nos dice que de los posibles valores que podamos obtener al cambiar la muestra,
el centro de gravedad de ellos es la media poblacional.
Para ver la dispersin de los distintos valores de medias muestrales alrededor de ; calcularemos
la varianza de X: Llamaremos Var(X) = 2 : Por tanto Var(Xi ) = 2 ; i = 1; 2; :::; n: Entonces,

X1 + X2 + + Xn Var (X1 + X2 + + Xn )
Var(X) = Var = :
n n2
10 CAPTULO 6. INTRODUCCIN A LA INFERENCIA ESTADSTICA. ESTIMACIN

Al ser una muestra aleatoria simple, los Xi sern variables aleatorias independientes, y por tanto
tendremos que

Var(X1 ) + Var(X2 ) + + Var(Xn ) n 2 2


Var(X) = = = : (6.9)
n2 n n
De este resultado se pueden sacar dos conclusiones que son tambin importantes:

1. La varianza disminuye con el tamao muestral. Por tanto cuantos ms datos se tengan ser
ms probable que la media muestral sea un valor prximoa .

2. La dispersin de X alrededor de depende de la dispersin de la variable original X: As,


si 2 es muy grande har falta un tamao muestral grande si queremos asegurarnos que la
media muestral est cerca de la poblacional.

Finalmente, vemos que la media muestral puede escribirse como suma de variables aleatorias.
Reescribiendo (6.7) tenemos que

X1 X2 Xn
X= + + + ;
n n n
y por tanto, por el Teorema Central del Lmite (ver tema anterior) tenemos que, indepen-
dientemente de cmo sea X; si el tamao muestral n es sucientemente grande X ser
aproximadamente una distribucin normal. Se tiene, por tanto, que si n es grande (en la
prctica, con ms de 30 datos)
2
X N ; : (6.10)
n
Por consiguiente, la media muestral realizada con un nmero suciente de datos es una variable
aleatoria simtrica y muy concentrada alrededor de la media poblacional, independientemente de
cmo sea la naturaleza de X. De esta forma, la media muestral con un tamao muestral sucien-
temente grande proporciona una forma bastante precisa de aproximar la media poblacional : No
olvidemos que en la prctica tendremos una sola muestra, y por tanto una sola realizacin de X:
Por esta razn, es muy til disponer de resultados tericos tan interesantes como (6.10), que nos
ayuden a valorar la abilidad de la media muestral. Ntese que el resultado (6.10) es independiente
de la distribucin que siga X si n es grande. En los prximos temas obtendremos ms conclusiones
y construiremos procedimientos estadsticos basados en este resultado.

S-ar putea să vă placă și