Sunteți pe pagina 1din 48

PROF: Ing. Rosa Quispe Solrzano.

La Inferencia Estadstica es el
proceso por el cual se obtiene
informacin sobre poblaciones en
base a muestras.
Hay dos tipos de Inferencia:
Estimacin
Pruebas de Hiptesis

El objetivo de la Estimacin es
determinar el valor de un parmetro
poblacional en base a un estadstico
muestral.
Hay dos tipos de Estimaciones:

Estimacin Puntual
Estimacin por Intervalos

Un estimador puntual permite hacer una


inferencia acerca de una poblacin, estimando
el valor de un parmetro desconocido de la
misma usando solamente un valor o un punto
obtenido de una muestra.

Una estimacin por Intervalo permite


hacer inferences acerca de un poblacin
estimando el valor de un parmetro
desconocido usando un intervalo.

Un intervalo de confianza , es un intervalo con limites finitos o infinitos, donde por lo


menos uno de los extremos es una variable aleatoria

ESTIMACIN POR INTERVALOS DE CONFIANZA

Se trata de asignar al parmetro poblacional


desconocido un rango de valores posibles, dentro de
los cuales se encuentra el verdadero valor del parmetro
con un determinado nivel de confianza fijada
de
antemano y que permite precisar la incertidumbre que
existe en la estimacin.

Si podemos encontrar dos variables aleatorias A y B, tales que:


P( AB) = 1- y representamos las realizaciones particulares de
A y B por ay b, entonces, el intervalo (a, b)se denomina intervalo de
confianza del 100(1-)% para .

La cantidad (1-) se denomina nivel de confianza del intervalo.

(a , b )
La confianza de un intervalo debe interpretarse en el sentido
siguiente:
Por cada 100 intervalos que construyamos para estimar un mismo
parmetro (a partir de otras tantas muestras aleatorias y para un
valor prefijado) el (1-)% de los intervalos obtenidos recogern en
su interior al verdadero valor del parmetro, mientras que el %
restante, por cosas del azar, pueden resultar equivocados.
Si elegimos el nivel de confianza (1-)% grande, por ejemplo del
95%, entonces nuestra esperanza al elaborar un intervalo a partir de
una muestra es que sea uno de los 95 de cada 100 intervalos
acertados

GENERALIZANDO:
Sea (X1, ..Xn) una m.a. extrada de una poblacin con funcin de
densidad f( x, ) y sean, A = a(X1,..., Xn) y B = b(X1,..., Xn) , dos
estadsticas tal que A B, para todo (X1,..., Xn) del espacio muestral
Se dice entonces que el intervalo aleatorio I = [ A , B ] es un intervalo de
confianza para con coeficiente de confianza = (1-) donde
(01) .
P (A B) = 1-
A = a(X1,..., Xn) Limite inferior del intervalo
B = b(X1,..., Xn) Limite superior del intervalo
Sus valores cambian de unas muestras a otras, el verdadero valor del
parmetro est en el intervalo el (1-)% de las veces.

El clculo de intervalos de confianza no es un proceso fcil cuando la


variable en estudio no sigue unas pautas de normalidad, por lo que
nosotros vamos a suponer siempre que la variable con la que vamos a
trabajar sigue una distribucin normal.

El proceso para obtener el intervalo es dar una v.a. donde intervenga

el parmetro a estimar y el correspondiente de la muestra. A esta variable


se le llama estadstico pivote y debe seguir una distribucin de
probabilidad conocida.
Definicin:

Sea (X1, ..Xn) una m.a. extrada de una poblacin con funcin de densidad f( x, )
y sean, Q = q(X1,..., Xn, ) una funcin de X1,..., Xn y , (, R )
Si la distribucin de Q no depende de , , entonces Q es definido como cantidad
pivotal.

Caso 1: Media poblacional (Varianza poblacional s2


conocida)

Situacin: Se tiene una poblacin con media desconocida m, pero


se supone conocida la varianza s2.
Se toma una muestra aleatoria (X1,X2,...,XN). Con esta muestra
se calcula el estadstico
el cual es un estimador puntual
insesgado para la media m desconocida. Se puede obtener un
intervalo de confianza del 100(1-a) % para m si consideramos
los siguientes hechos acerca de la distribucin de :

Caso 1: Media poblacional (Varianza poblacional s2


conocida)
1.

Si la poblacin es Normal, la distribucin de

2.

Si la poblacin no es Normal, el Teorema del lmite central nos


garantiza una distribucin de
aproximadamente normal
cuando N

3.

La media de

4.

La varianza de

es (

es Normal

es insesgado)

es s2 /N

Teorema del Lmite Central:


Afirma que la media muestral tiene una distribucin Normal aunque la
poblacin original no la tenga, siempre y cuando la muestra sea muy
grande (de manera prctica N>30)

Caso 1: Media poblacional (Varianza poblacional s2


conocida)
De acuerdo a lo anterior, podemos suponer que la variable
___

Z
Tiene una distribucin N(0,1)

X
/ N

a/2

a/2

-za/2

za/2

de la figura: P{-za/2 Z za/2 }=1-.

Con lo cual el intervalo de confianza del 100(1-)% para la media


es
__
__

xz

/2

N x z /2/

IC para una media poblacional (s2 conocida) : ejemplo


Ejemplo: Los siguientes son datos de conductividad trmica de cierto
tipo de hierro (en BTU/hr-ft- F):
41.60 41.48 42.34 41.95 41.86
42.18 41.72 42.26 41.81 42.04
Una estimacin puntual para la media, es = 41.924. Hallar un
intervalo de confianza del 95 % y uno del 99% para la media.
Se supone que la poblacin tiene una distribucin Normal con s=0.3
__

__

Usamos la expresin
x z /
encontrar el intervalo de confianza para la media:
x z /2/

/2

para

l = 41.924 - 1.96(0.3)/10 = 41.738, u = 41.924+1.96(0.3)/10 =


42.110
Entonces el intervalo de confianza del 95% es
41.738 42.11
Y la longitud de este intervalo es 3.92 s/ N

Deseamos estimar el promedio de edad de cierta poblacin.


Tomamos una muestra de tamao 100 en la cual se obtuvo
una media muestral de 35. La variable considerada tiene
distribucin normal con una varianza igual a 3. Calcular el
intervalo de confianza al 95 % e indicar la imprecisin.
Solucin: aplicando simplemente la frmula para calcular los
lmites del intervalo de confianza (IC), tenemos:
35 1.96
I 1.96

3
100
3
0.339
100

Caso 2: Media poblacional (Varianza poblacional s2 desconocida)


Si no se conoce la varianza 2 de la poblacin, una posibilidad es
utilizar la varianza muestral S2 en las ecuaciones obtenidas para
estimar intervalos en el caso de varianza conocida
Este procedimiento funciona para muestras grandes (N>30), por
ello los intervalos de confianza anteriores se les suele llamar
intervalos de confianza para muestras grandes.
Si las muestras son pequeas el enfoque anterior no
funciona y para lograr un procedimiento vlido se supondr
que la poblacin tiene una distribucin Normal

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL:


MUESTRAS GRANDES
Caso 2: Media poblacional (Varianza poblacional s2 desconocida)

En forma general si no se conoce s se sustituye por la


desviacin estndar de la muestra, es decir, por s, si
adems el tamao de la muestra es n>30.
El intervalo de confianza para un nivel de confianza
de 1-a, de la media poblacional es:

X Za

s
2

m X Za

s
2

Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de
depresin (mayor puntaje significa mayor depresin).
2
11
14
16
19

5
11
15
16
19

6
13
15
17
19

8
13
16
17
19

8
14
16
17
19

9
14
16
18
19

9
14
16
18
19

10
14
16
18
20

11
14
16
19
20

Para construir un intervalo de confianza para el puntaje promedio poblacional,


asumamos que los datos tienen distribucin normal, con varianza poblacional
desconocida. Como es desconocido, lo estimamos por s =18,7.

Luego, un intervalo de confianza aproximado es:

Luego, el intervalo de confianza para es (13,2 , 15,8).


Es decir, el puntaje promedio poblacional se encuentra
entre 13,2 y 15,8 con una confianza 95%.

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL:


MUESTRAS PEQUEAS ( n 30)

Se utiliza el estadstico pivote:

Que sigue una distribucin llamada t student con n-1 grados de libertad que
presenta una forma en la curva muy similar a la de la distribucin normal.

a/2

/2
-ta/2,N-1

ta/2,N-1

y toma como intervalo de confianza aquella regin en la que

Es decir, hemos obtenido el intervalo que contiene a


la media poblacional y que podemos expresar:
Factor relacionado
con la confianza

Estimo

Parmetro: Media Poblacional

sn1
IC 95% x t n1

Nivel de
confianza

Error Estndar

sn1
m x t n1

Lmites de confianza

Caso 1: Media poblacional (Varianza poblacional s2 desconocida)

X= pn

a/2

-za/2

a/2
za/2

p Z a ( p (1 p ) / n ) p p Z a ( p (1 p ) / n )
2

En un estudio de prevalencia de factores de riesgo en una cohorte de


412 mujeres mayores de 15 aos en la Regin Metropolitana, se
encontr que el 17.6% eran hipertensas. Un intervalo de 95% de
confianza para la proporcin de mujeres hipertensas en la Regin
Metropolitana est dado por:

0.176 1.96 0.176(1 0.176) / 412 p 0.176 1.96 0.176(1 0.176) / 412

Luego, la proporcin de hipertensas vara entre (0,139 , 0,212)


con una confianza de 95%.

Ejemplo: De 1000 casos de cncer pulmonar seleccionados


al azar, 823 son de pacientes que fallecieron. Construya
un intervalo de confianza del 95% para la tasa de
mortalidad del cncer pulmonar.
Solucin: La tasa de mortalidad es la proporcin de los que mueren a los que
^
contraen el cncer pulmonar, de la muestra tenemos que p = 0.823. Por otro
lado z0.025=1.96, entonces:

0.823 1.96

0.82310.823
1000

Es decir, 0.799 p 0.847

p
0.823
1.96

0.82310.823
1000

A partir de las frmulas que se utilizan para


construir los intervalos de confianza, podemos
calcular el tamao muestral necesario para
obtener una precisin determinada.

Llamamos error de estimacin(E) a la mxima


diferencia que nos permitimos admitir, con un
nivel de confianza 100(1-)%, entre el
parmetro desconocido y el estadstico que
usamos como estimador

DETERMINACIN DEL TAMAO PTIMO MUESTRAL

S-ar putea să vă placă și