Sunteți pe pagina 1din 23

ESTIMACIN

Estimacin es el proceso de inferir los posibles valores de alguna


caracterstica de la poblacin en base a la informacin contenida en una muestra aleatoria La Estimacin Puntual trata de la construccin de estimadores y el estudio de sus propiedades Todas las propiedades de los estimadores estn orientadas a precisar el concepto de si el estimador funciona o no. Es decir, a caracterizar lo que se entiende por mejor estimador

Conceptos claves de muestra frente a poblacin Una muestra aleatoria es un subconjunto de la poblacin Las probabilidades Pr (X = xi ) se Las frecuencias relativas ni / n se utilizan para calcular: y S2 Que son ejemplos de estadsticas aleatorias o estimadores utilizan para calcular: y 2

Que son ejemplos de parmetros fijos, constantes u objetivos

Para un solo parmetro de la poblacin, hay muchos posibles estimadores. Por lo que hay que tener criterios expresados en trminos de propiedades deseables para decidir en cada situacin, cul estimador es el ms conveniente: el mejor

Por ejemplo.- Un estimador de la media poblacional puede ser la media de la muestra, la mediana o la moda Estimadores y sus parmetros poblacionales correspondiente.

Estimador S2 S P

Parmetro 2 P

La Estimacin por Intervalos (o intervalos de confianza como tambin se conocen) utiliza el estimador puntual para dar un intervalo con un lmite inferior y otro superior. Una estimacin por intervalos es mucho ms til que una estimacin puntual, ya que posee ms informacin: no slo da el valor estimado, sino tambin la precisin y el nivel de confianza con el cual se asegura que el parmetro por estimar est contenido en el intervalo. El trabajo fundamental consiste en la construccin de intervalos de confianza para los diferentes parmetros poblacionales y el estudio de las interrelaciones de los conceptos involucrados tales como precisin, confianza y tamao de muestra.

Gracias a la teora del muestro se sabe que, a menos de que seamos muy afortunados el valor del estimador no estar totalmente ajustado, sino que ms bien ser un poco alto o un poco bajo ( est distribuida en torno a )

Esto es lo que sabemos nosotros pero no el estadgrafo

xi
Su primer valor estimado de intervalo Su segundo Su tercero Y as sucesivamente (hasta aqu todos abarcan ) Su primer yerro Estos son los valores estimados de Intervalo del estadgrafo

Su vigsimo

Construccin de veinte valores calculados de intervalo: Resultados caractersticos

Determinacin del intervalo


Si se quiere tener confianza en la correccin de la inferencia, no se puede pretender que sea precisamente igual a observada: debemos hacer una concesin conocida como intervalo de confianza o valor estimado de intervalo- en la siguiente forma:

= error de muestreo
El problema fundamental es: Qu amplitud debe tener la tolerancia del error de muestreo? Primero hay que especificar el nivel de confianza que se deposita en la ecuacin anterior. Si fijamos este nivel en 95%, estamos indicando que a la larga se espera que se encuentre en el intervalo:

( - error de muestreo, + error de muestreo)


Considrese que el 95% indica que 95 de cada 100 veces que calculemos el estimador se estar en lo correcto, o lo que es lo mismo 19 de cada 20 Para conseguir este intervalo, obsrvese en la figura, que el intervalo de longitud menor bajo la distribucin de , que contiene 95% de la

probabilidad, es el intervalo central

La distribucin x

Pr = 2.5%

= / n
Pr = 2.5%

- 1.96 / n

+ 1.96 / n

La distribucin normal de la media muestral alrededor del parmetro (fijo pero desconocido) Aqu el factor 1.96 viene de las tablas de la distribucin normal, ya que hemos dejado 2.5% de probabilidad en cada cola de la figura, es decir que:

Pr ( - 1.96 / n

+ 1.96 / n ) = 0.95

Ahora se despeja la en las desigualdades para obtener la ecuacin equivalente Pr ( 0.95 - 1.96 / n + 1.96 / n ) =

Este es el intervalo de confianza (a 95%) buscado,


5

donde el factor 1.96 / n es el margen de error Seleccin del nivel de confianza


El nivel de confianza por usar se fija de acuerdo al problema, los recursos y la importancia del resultado. El factor 1.96 (que se denomina por Z0.025 ya que deja 2.5% de la poblacin en la cola superior de la distribucin normal estndar) Para el 99% de confianza se cambiar a 2.58 = Z0.005 Para el 90% de confianza se cambiar a 1.65 = Z0.05 O a cualquier otro nivel deseado. Debe notarse que: con el mismo tamao de muestra se puede aumentar la confianza, slo a costa de agrandar nuestro intervalo de confianza, es decir a costa de exactitud.

La determinacin del tamao de muestra n


Se acaba de ver que una vez tomada la muestra, cualquier aumento en la confianza del resultado se consigue a costa de una prdida de precisin. Entonces, sera til especificar el nivel de confianza deseado y la precisin requerida en el resultado antes de tomar la muestra; de esta manera se podr determinar y tomar el tamao de muestra n, necesaria para conseguir o asegurar dichos niveles de confianza y precisin.

La determinacin del tamao de muestra n es bastante sencilla usando

Error de muestreo (e) = Z0 x / n


Basta despejar n

Tamao de muestra n = Z02 x2 / e2


Donde:

Z0 es el valor de la distribucin normal que corresponde al nivel de confianza deseado


e es el error mximo permisible

x2 es la varianza de la poblacin
La varianza y el error mximo permisible dependen de cada problema en particular. Sin embargo, el parmetro x2 que es la varianza poblacional regularmente no se conoce, entonces existen dos opciones frente a esta falta de informacin. 1.- Basndose en experimentos previos con poblaciones similares, o en otros resultados de otros investigadores, o en consideraciones tericas, se pueden estimar 2 o por lo menos dar una cota superior para ella. 2.- Si no hay experiencias previas se puede efectuar un pequeo muestreo piloto y en base a este calcular S2 para sustituirlo por 2
7

Resumiendo: Se tienen dos formas equivalentes de expresar los intervalos de confianza Pr ( - Z0.025 x / n O ms brevemente como: Intervalo de confianza de 95% = Z0.025 x / n + Z0.025 x / n ) = 0.95

Hay que entender bien que lo que vara en las ecuaciones anteriores no es (que es un parmetro fijo aunque desconocido) sino el intervalo centrado en la variable aleatoria se puede ver geomtricamente que lo que vara es la posicin de los intervalos, no el parmetro . Pero una vez que se toma la muestra y se determina el valor de , y por lo tanto el intervalo, entonces est contenida o no lo est. Si el tamao de la muestra n es fijo, un aumento cualquiera en la confianza se consigue a costa de una disminucin en precisin y viceversa. Esto se interpreta en el sentido de que la cantidad de la informacin disponible (n) es fija y no se puede obtener ms confianza sin ceder en la precisin. Si se especifican los niveles de confianza y precisin deseados, stos sern alcanzables siempre y cuando la muestra sea suficientemente grande (es decir, que haya suficiente informacin). Considrese que el tamao necesario de la muestra est determinado por:

n = Z 0 2 x 2 / e2
Por ltimo se debe notar que desde la primera aplicacin de la frmula (la que expresa los intervalos de confianza), se ha sustituido la desviacin estndar de la muestra s en lugar del parmetro de poblacin correspondiente. Esto intuitivamente parece razonable ya que s es un
8

buen estimador de , solamente debe recordarse que acarrea muy poco error si el tamao de muestra n es del orden de 30 o ms INTERVALOS DE CONFIANZA PARA LA MEDIA (Muestras Pequeas) La estimacin de los intervalos de confianza donde se utilizan muestran grandes permiten hacer dos cosas 1. Suponer que la tena la distribucin normal sin importar la

poblacin original (en virtud del teorema de lmite central). 2. Sustituir s en el lugar de sin ninguna modificacin de la frmula para el intervalo de confianza (el error acarreado fue muy pequeo). Cuando se trabaja con muestras pequeas (del orden de 30 o menos), para seguir garantizando la normalidad de la distribucin de basta pedir que la distribucin de la poblacin se aproxime a la normal. As aunque n sea muy pequeo, ser normal. El nico problema que queda por resolver, en estos casos de muestras pequeas, es que el error cometido al aproximar por medio de s, ya no es necesariamente pequeo. Esto provoca que la expresin para calcular los intervalos de confianza se modifique. Para poder entender la modificacin, conviene recordar que el teorema de lmite central indica que la media de la muestra estandarizada se distribuye aproximadamente como una variable normal estndar, que se denota como Z: Z = - / ( /n )
9

(despejando se llega a la expresin para el calculo de los intervalos)

Ahora se requiere algo anlogo a la expresin anterior con s en lugar de . Esta variable se conoce como la variable t de Student t = - / ( s /n ) Si comparamos ambas expresiones notaremos que el nico cambio est en el denominar donde se sustituye sen lugar de . Sera natural que la distribucin t fuera parecida a la normal pero ms ancha que sta, ya que si s subestimara a , el cociente resultara grande. No hay una sola distribucin para la t de Student, sino una familia de distribuciones. Esto ocurre debido al efecto del tamao de muestra: si n es pequea, la t de Student correspondiente es muy ancha, pero si n es de 30 o ms, la distribucin t y la normal Z son casi indistinguibles (s y son casi iguales).

10

PROPIEDADES DE LOS ESTIMADORES Un estimador es el valor del estadgrafo de una muestra que permite inferir algo respecto del parmetro de la poblacin No tendenciosidad (estimador insesgado) Se dice de un estimador que no es tendencioso o insesgado si la media de la distribucin de medias muestras es igual al valor del parmetro estimado. Por ejemplo, independientemente de la naturaleza de la poblacin, la media X, es un estimador insesgado de TENDENCIOSIDAD Y NO TENDENCIOSIDAD DE DIVERSOS ESTIMADORES DE PARMETROS DE VARIAS POBLACIONES Parmetro 2 xy Naturaleza de la Poblacin Cualquier poblacin Simtrico Simtrico y unimodal Asimtrico Asimtrico Cualquier poblacin Normal Normal bivariado Estimador X Mediana Moda Mediana Moda S2x Sx rxy Evaluacin del estimador Insesgado Insesgado Insesgado Sesgado Sesgado Insesgado Negativamente asimtrico Negativamente asimtrico

11

Consistencia Aunque sesgado un estimador consistente tiende a aproximarse al valor del parmetro estimado a medida que la muestra aumenta de tamao, tal es el caso de la desviacin tpica de s en tanto estimacin de . Si se selecciona una muestra muy grande, ms cercanos sern ambos valores. Eficiencia Relativa La eficiencia se refiere la la precisin con la cual tales medidas pueden estimar un parmetro, es decir, la variabilidad que pueden tomar en muestras sucesivas. El error de la media expresado en trminos de varianza es una medida de eficiencia de X; como estimador de y del error de coeficiente de correlacin, expresado en trminos de varianza, es asimismo una media de la eficiencia de r, en tanto que medida de estimacin de El error de una medida de estimacin expresado en trminos de su varianza es una de las propiedades ms importantes de sta y se refiere a la varianza de las distribuciones de las muestras del estadgrafo.

12

DOS MUESTRAS: ESTIMACIN DE LA DIFERENCIA ENTRE DOS MEDIAS Intervalo de confianza para 1 - 2 con 12 y 22 conocidas Si X1 y X2 son las medias de muestras aleatorias independientes de tamao n1 y n2 de poblaciones con varianzas conocidas 12 y 22, respectivamente, un intervalo de confianza de (1 ) 100% para 1 - 2 est dado por:

(X1-X2)-Z/2 (12/n1)+(22/n2)<1-2<(X1X2)+Z/2 (12/n1)+(22/n2)

Donde Z /2 es el valor de Z que deja un rea de /2 a la derecha

13

Intervalo de confianza para 1 - 2 con 12 = 22 pero desconocidas Si X1 y X2 son las medias de muestras aleatorias independientes de tamao n1 y n2 respectivamente, de poblaciones aproximadamente normales con varianzas iguales pero desconocidas, un intervalo de confianza de (1-) 100% para 1 - 2 est dado por:

(X1-X2)-t/2Sp (1/n1)+(1/n2)<1-2<(X1-X2)+ t/2Sp (1/n1)+(1/n2)

Donde Sp es la estimacin de unin de la desviacin estndar poblacional y t/2 es el valor t con v = n1 + n2 - 2 grados de libertad, que deja un rea de /2 a la derecha. La varianza unida Sp2 se calcula de la forma:

Sp2 = [(n1 1) S12 + ( n2 1) S22] / (n1 + n2 - 2)

14

Intervalo de confianza para 1 - 2 con 12 22 y desconocidas Si X1 y S12 , y X2 y S22 son las medias y varianzas de muestras pequeas independientes de tamao n1 y n2 respectivamente, de distribuciones aproximadamente normales con varianzas desconocidas y diferentes, un intervalo de confianza del (1-) 100% para 1 - 2 est dado por:

(X1-X2)-t/2 (S12/n1)+(S22/n2)<1-2<(X1-X2)+t/2 (S12/n1)+

(S22/n2)

Donde t/2 es el valor t con

V =[(S12/n1 + S22/n2)2] / [[(S12/n1)2/(n1 1)]+[(S22/n2)2/(n2 1)]] grados de libertad, que deja un rea de /2 a la derecha

15

Intervalo de confianza para D = 116 1616 161616 16

16

171717171717171717

17

17

17

17171 7171 7171


7

171

717 17171717171717171717171717171717171717l1717 171717 171717 17 1 71717 171717 171717 17 1717171717 717171 171717 171717 17817 1717 17 17 717171 1717 171717 17"17 171717 171717 171717 171717 171717 171717 1717 171717 171717 171717 171717 171717 17$17 1717 1717 17171717171717171717 171717 1717171717171717171717 1717 171717 171717 171717 1717p n < D = 1 - 2 < d + t/2 Sp n

Donde t/2 es el valor t con v = n1 - 1 grados de libertad, que deja un rea de /2 a la derecha.

17

Estimacin de una proporcin


Una sola muestra Un estimador puntual de la proporcin p en un experimento binomial est dado por la estadstica P = X / n, donde X representa el nmero de xitos de n pruebas. Por tanto, la proporcin de la muestra p = x / n se utilizar como el estimador puntual del parmetro p. Si no se espera que la proporcin p desconocida est demasiado cerca de cero o de 1, podemos establecer un intervalo de confianza para p al considerar la distribucin muestral P. Al designar un fracaso en cada prueba binomial mediante el valor 0 y un xito con el valor 1, el nmero de xitos, x, se puede interpretar como la suma de n valores que consisten slo de ceros y unos, y p es slo la media muestral de estos n valores. Para n suficientemente grande, P est distribuida de forma

aproximadamente normal con media. p = E ( P ) = E [X/n] = np/n = P y varianza p2 = X/n2 = x2/n2 = npq/n2 = pq/n

18

Por tanto, podemos asegurar que Pr ( - Z /2 < Z < Z /2 ) = 1 - donde Z = P p / pq/n y Z /2 es el valor de la curva normal estndar sobre la cual encontramos un rea de /2

Para una muestra aleatoria particular de tamao n (grande), se calcula la proporcin muestral p = x/n y se obtiene el siguiente intervalo de confianza de (1- )100% aproximado para p. Si p es la proporcin de xitos en una muestra aleatoria de tamao n, y q = 1 p, un intervalo de confianza aproximado de (1- )100% para el parmetro binomial p est dado por:

P - Z /2 pq/n < P < P + Z /2 pq/n

Donde Z /2 el valor Z que deja un rea de /2 a la derecha Cuando n es pequea y la proporcin desconocida p se considera cercano a 0 o a 1, el procedimiento del intervalo de confianza que se establece aqu no es confiable y, por tanto, no se debe utilizar Si p se utiliza como una medida de estimacin de p, podemos tener una confianza de (1- )100% de que el error no exceder Z /2 pq/n
19

Si p se utiliza como una estimacin de p, podemos tener una confianza de (1- )100% de que el error ser menor que una cantidad especfica e cuando el tamao de muestra es aproximadamente n = Z2/2 pq/e2 Si p se utiliza como una estimacin de p, podemos tener una confianza de al menos (1- )100% de que el error no exceder una cantidad especfica e cuando el tamao de muestra sea n = Z2/2 /4e2

Estimacin de la diferencia entre dos proporcin


Dos muestras Considere el problema donde deseamos estimar la diferencia entre dos parmetros binomiales p1 y p2. Al elegir muestras independientes de las dos poblaciones, las variables P1 y P2 sern independientes y entonces podemos concluir que P1 P2 est distribuida de forma aproximadamente normal con media P1 - P2 = P1 - P2 y varianza n2 Por tanto, podemos asegurar que Pr ( - Z /2 < Z < Z /2 ) = 1 - donde Z = (P1 - P2)-(p1 - p2)/ P1 q1 / n1 + P2 q2 / n2 Intervalo de confianza para p1 - p2 de una muestra grande Si p1 y p2 son las proporciones de xitos en muestras aleatorias de tamao n1 y n2 respectivamente, q1 = 1 - P1 y q2 = 1 - P2 un P1 - P2 = P1 q1 / n1 + P2 q2 /

20

intervalo de confianza aproximado de (1- )100% para la diferencia de dos parmetros binomiales P1 - P2 est dado por:

(p1 - p2)-Z /2P1q1/n1 + P2 q2/n2 <P1-P2 <(p1 - p2)+Z /2P1q1/n1 + P2 q2/n2 Donde Z /2 el valor Z que deja un rea de /2 a la derecha Estimacin de la varianza Una sola muestra Si se extrae una muestra de tamao n de una poblacin normal con varianza 2 y se calcula s2 obtenemos un valor de la estadstica S2. Esta varianza muestral calculada se usar como estimacin puntual de 2. Por ello la estadstica S2 se llama estimador de 2 Se puede establecer una estimacin por intervalos de 2 mediante el uso de la estadstica X2 = (n-1) S2 / 2 La estadstica X2 tiene una distribucin ji cuadrada con n-1 grados de libertad. Cuando las muestras se eligen de una poblacin normal podemos escribir Pr ( - X21-/2 < Z < X2/2 ) = 1 - Donde X2 la derecha. Intervalo de confianza para 2
1-/2

y X2

/2

son valores de la distribucin ji cuadrada con n-1

grados de libertad, que dejarn reas de 1- /2 y /2 respectivamente, a

21

Si

s2 es la variable de una muestra aleatoria de tamao n de una

poblacin normal, un intervalo de confianza de (1- )100% para 2 es

(n-1)s2 / X2/2 < 2 < (n-1)s2 / X21-/2 Donde X2 y X2 son valores de X2 con v = n-1 grados de libertad,

1-/2

/2

que dejan reas de /2 y 1 - /2 respectivamente, a la derecha. Estimacin de la razn de dos varianzas Dos muestras Una estimacin puntual de la razn de dos varianzas poblacionales 12/22 est dada por la razn s12/s22 de las varianzas muestrales. De aqu que la estadstica s12/s22 se denomina estimador de 12/22 Si 12 y 22 son las varianzas de poblaciones normales, podemos establecer una estimacin por intervalos de 12/22 mediante el uso de la estadstica F = 22 s12/ 12 s22 La variable aleatoria F tiene una distribucin F con v1=n1-1 y

v2=n2-1
grados de libertad. Para cualesquiera dos muestras aleatorias independientes de tamao n1 y n2 que se selecciones de dos poblaciones normales, la razn de las varianzas muestrales s12/s22 se calcula y se obtiene el siguiente intervalo de confianza de (1- )100% para 12/22 Intervalos de confianza para 12/22

22

Si s12 y s22 son las varianzas de las muestras independientes de tamao n1 y n2 respectivamente, de poblaciones normales, entonces un intervalo de confianza de (1- )100% para 12/22 es (s12/s22)(1/f/2 (v1,v2)) < 12/22 < (s12/s22)( f/2 (v1,v2)) Donde f/2 (v1,v2) es un valor f con v1=n1-1 y v2=n2-1 grados de libertad que deja un rea de /2 a la derecha f/2 (v1,v2) es un valor f similar con v1=n1-1 y v2=n2-1 grados de libertad

23

S-ar putea să vă placă și