Sunteți pe pagina 1din 13

Bioestadstica: Inferencia Estadstica.

Anlisis de Una Muestra


M. Gonzlez
Departamento de Matemticas. Universidad de Extremadura

M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Estimacin Puntual e Intervalos de Confianza


Planteamiento del Problema de Inferencia
X variable cuantitativa que define una poblacin. La distribucin de
probabilidad de X es desconocida en todo o en parte.
parmetro desconocido asociado a la distribucin de probabilidad de
X (por ejemplo, la media poblacional, , la varianza poblacional, 2 , la
proporcin asociada a una distribucin binomial, p etc.)
X1 , . . . , Xn Muestra Aleatoria Simple de la variable X. Nuestra
principal herramienta para obtener informacin sobre la distribucin de
probabilidad de X sobre cualquier parmetro .

Estimacin puntual
Un estimador puntual de es una funcin de X1 , . . . , Xn que aproxima el
valor de .
hay que dar tambin una estimacin
Cuando se da el valor del estimador ,

del error que se comete al aproximar el valor del parmetro mediante .


M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Estimacin Puntual e Intervalos de Confianza


Intervalos de Confianza
Si T1 y T2 son dos valores, obtenidos a partir de la muestra y tales que
P(T1 T2 ) = 1
entonces [T1 , T2 ] es un intervalo de confianza para con un nivel de
confianza de 1 .
Intuitivamente, T1 , T2 son dos valores tales que el 100(1 )%
de las veces que repitamos el experimento en esa poblacin, el
valor desconocido de estar entre estos dos valores.
El nivel de confianza 1 es un valor entre 0 y 1 que debe estar
prximo a 1( 0.90, 0.95, 0.99, . . . ). De ello resulta que el valor
de es prximo a 0 ( 0.1, 0.05, 0.01, . . . ).

M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Estimacin Puntual e Intervalos de Confianza


Estimacin de la Media, (RESUMEN II)
2
Sea X1 , . . . , X
aleatoria
Pn nuna muestra
Pn simple de 2una poblacin N(, ).
1
1
2
=

Sean X
i=1 Xi y S = n1
i=1 (Xi X)
n

Estimador Puntual de :

=X

S
Error estndar =
n

Intervalo de Confianza para al Nivel de Confianza 1 :


2 CONOCIDA

2 DESCONOCIDA

x z
n

x t (n 1) s
n

z en TABLA III-1 para la distribucin N(0, 1).


t (n 1) TABLA IV para distribuciones t-Student.
Si n 60 los intervalos anteriores son vlidos aunque no se verifique la
hiptesis de normalidad.
M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Estimacin Puntual e Intervalos de Confianza


5. Un dermatlogo investiga cierto tipo de afeccin de piel inducindolo en
una muestra aleatoria de 25 ratas y tratndolas luego con un nuevo frmaco.
Se cuenta el nmero de horas hasta que desaparece dicha afeccin, con los
resultados siguientes: x = 132 horas, s = 40 horas. Supondremos que el
nmero de horas hasta que desaparece la afeccin se distribuye
normalmente.
(a) Estima el nmero medio de horas que tarda en desaparecer la afeccin
dermatolgica con el nuevo frmaco. Cul es el error mximo de esta
estimacin? Utiliza un nivel de confianza del 95%.
X =nmero de horas hasta que aparece la afeccin N(, 2 )
n = 25

X1 , . . . , X25 v.a. i.i.d.

RESUMEN II

x1 , . . . , x25

x = 132h, s = 40h

s
x t (n 1)
n

TABLA IV t0.05 (24) = 2.064


1 = 0.95 = 0.05
40
132 2.064 = 132 16.512 = [115.49, 148.51]
25
con una confianza de un 95%.
M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Estimacin Puntual e Intervalos de Confianza


5. (b) Si repetimos este experimento exactamente en las mismas
condiciones, la longitud del intervalo que obtendramos, sera la misma?.
Razona la respuesta.
(c) Supongamos ahora que = 32 horas. Calcula un intervalo de confianza
al 90% para el nmero medio de horas que tarda en desaparecer la afeccin
dermatolgica. En estas condiciones, qu tamao de muestra se necesitara
para tener el 90% de confianza de que la media se estima dentro de 5
horas?
X =nmero de horas hasta que aparece la afeccin N(, 2 )
n = 25

X1 , . . . , X25 v.a. i.i.d.

= 32h

x1 , . . . , x25

x = 132h, s = 40h

132 10.496 con una confianza del 90%

n?
z PRECISIN
n

1 = 0.9 = 0.1
TABLA III-1 z0.1 = 1.645

2
32
32
= 110.166 = n = 111
n?
1.645 5 n 1.645
5
n
M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Test de Hiptesis
16. La ingestin media de caloras por persona y por da en una determinada
regin es de 2900 caloras. En una regin vecina, se efectu un muestreo
para estudiar el consumo medio de caloras. Se eligieron aleatoriamente 50
personas y los resultados fueron de un consumo medio de 3000 caloras por
persona y por da, con una desviacin tpica muestral de 100 caloras.
Suponiendo que la distribucin del consumo de caloras en esa regin es
normal, contesta las siguientes preguntas:
(a) Podemos admitir, con un nivel de significacin del 5%, que las dos
regiones tienen diferente consumo medio de caloras por persona y por da?
X =consumo de caloras por persona y por da N(, 2 )
n = 50

X1 , . . . , X50 v.a. i.i.d.


x1 , . . . , x50
s = 100cal.
= 2900 vs.

x = 3000cal.,

6= 2900

H0 : = 2900
H1 : 6= 2900
M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Test de Hiptesis
RESUMEN III: Sea X1 , . . . , Xn una muestra aleatoria simple
de una
P
= 1 n Xi y
poblacin N(, 2 ) y 0 un valor conocido. Sean X
i=1
n
Pn
1
2
S2 = n1
i=1 (Xi X)
R ECHAZAMOS H0 A UN NIVEL SI
2 CONOCIDA
2 DESCONOCIDA

H0

H1

I.

= 0

6= 0

|x 0 |
> z

|x 0 |
> t (n 1)
s

II.

> 0

x 0
> z2

x 0
> t2 (n 1)
s

III.

< 0

x 0
< z2

x 0
< t2 (n 1)
s

M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Test de Hiptesis
X =consumo de caloras por persona y por da N(, 2 )
n = 50

x = 3000cal., s = 100cal.
H0 : = 2900
H1 : 6= 2900

Rechazamos H0 al nivel de significacin si

|x 0 |
> t (n 1)
s/ n

x 0
3000 2900

=
= 7.07
s/ n
100/ 50
= 0.05 t0.05 (49) ' 2.009 |texp | > t0.05 (49)
texp =

Rechazamos H0 al nivel de significacin 0.05


= 0.01 t0.01 (49) ' 2.678 |texp | > t0.01 (49) H1
= 0.001 t0.001 (49) ' 3.497 |texp | > t0.001 (49) H1
p < 0.001
M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Test de Hiptesis
17. Un laboratorio ha obtenido una sustancia que en cierto modo alivia
determinadas afecciones cutneas. Dicho laboratorio afirma, segn sus
experiencias, que dicha sustancia causa alivio, en los pacientes tratados, por
espacio de 10 horas por trmino medio. Se ha elegido una muestra de 120
individuos afectados por esta dolencia, se les trat con dicha sustancia y se
contabiliz el tiempo de alivio en los pacientes. Los resultados fueron un
tiempo medio de 9.6 horas, con una desviacin tpica de 1.2 horas.
(a) Podemos desmentir la afirmacin del laboratorio con un nivel de
significacin del 5%? Calcula el valor de p.
X =nmero de horas durante las que causa alivio la sustancia del laboratorio
, 2
n = 120

X1 , . . . , X120 v.a. i.i.d.

x1 , . . . , x120

x = 9.6h, s = 1.2h

H0 : = 10
H1 : < 10
Rechazamos H0 al nivel de significacin si
M. Gonzlez

x 0
< z2
s/ n

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Test de Hiptesis
17.
X =nmero de horas durante las que causa alivio la sustancia del laboratorio
, 2
n = 120

x = 9.6h, s = 1.2h
H0 : = 10
H1 : < 10

Rechazamos H0 al nivel de significacin si

texp =

x 0
< z2
s/ n

x 0
9.6 10
=

= 3.65
s/ n
1.2/ 120

= 0.05 z0.1 = 1.645 texp < z0.1 H1


= 0.01 z0.02 = 2.326 texp < z0.02 H1
= 0.005 z0.01 = 2.576 texp < z0.01 H1
p < 0.005
M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Test de Hiptesis
17. (b) Como mximo, en cunto podemos estimar el tiempo medio de
alivio que produce esa sustancia?



2

X N ,
n

1=P


X
z2
s/ n

s2 2


+ z2 s
=P X
n

+ z2 s es un lmite superior de confianza para al nivel 1


X
n
1.2
1 = 0.95 9.6 + z0.1
= 9.78
120

M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

Test de Hiptesis
18. Se observaron 12 mujeres primparas y se obtuvieron los tiempos en
minutos de la duracin del parto:
353 496 568 422 410 380 463 430 310 518 446 368
(a) Es normal la variable?
H0
H1

: X sigue distribucin Normal


: X no sigue distribucin Normal

RESUMEN VI - TABLA VII: TEST DE DAGOSTINO


310
x(1)
Dexp =

353
x(2)

368
x(3)

380
x(4)

410
x(5)

422
x(6)

430
x(7)

446
x(8)

463
x(9)

496
x(10)

518
x(11)

568
x(12)

(1 310 + 2 353 + . . . + 12 568) 13 (310 + + 568)/2


p
= 0.2832
12 12 ((3102 + . . . + 5682 ) (310 + . . . + 568)2 /12)

M. Gonzlez

Bioestadstica: Inferencia Estadstica. Anlisis de Una Muestra

S-ar putea să vă placă și