Sunteți pe pagina 1din 49

Materia: Bioestadistica bsica

Tema: Estadstica Inferencial

Subtema: pruebas de hiptesis

1
objetivo

Comprender, aplicar e interpretar las


pruebas de hiptesis

2
Estimacin por intervalo (intervalos
de confianza)
Las estimaciones dadas por una muestra, son
interpretables slo acompaadas de indicadores
cuantificables, fijando un grado de confianza que se les
pueda otorgar.

Un intervalo de confianza indica la precisin de una


estimacin

La estimacin por intervalo se realiza cuando algn


parmetro de la poblacin se encuentra ubicado dentro de
un lmite inferior y un lmite superior, segn el nivel de
confiabilidad fijado, donde la poblacin que se analiza se
distribuye de acuerdo a una distribucin normal.

El resultado est expresado en trminos de la probabilidad


de que un parmetro determinado se ubique dentro de
cierto intervalo de valores, bajo un grado de confianza
definido. 3
Estimacin por intervalo para la
media poblacional

La estimacin por intervalo con = 0.05, para la


media se basa en la siguiente expresin:

para n < 30
para n > 30
El error tipo ser para ambas estimaciones:
para prueba de t y = n-1, solo en
SX
Sx casos particulares.
n 1

SX
Sx Para prueba de Z y t ( = n-
4
n 1)
Si se tiene conocimiento de la poblacin total SX N n
(poblaciones finitas) la ecuacin se modifica en: Sx
n N
donde, N es de la poblacin y n de la muestra

5
6
PRUEBAS DE HIPTESIS
Se basan en decisiones estadsticas

En la prctica el investigador debe de tomar ciertas decisiones


sobre la poblacin a partir de la informacin proporcionada por
una o muchas muestras.

Ejemplo el decidir sobre las hiptesis de:

Si un nuevo medicamento es efectivamente eficaz para curar


una enfermedad, o

Si la densidad de una especie animal es igual en dos medios de


cultivo, o

Si la concentracin de DDT en el tejido adiposo no aumenta con


la edad de los sujetos.

Tales decisiones se llaman decisiones estadsticas.

7
Para realizar inferencias acerca de una poblacin,
se debe realizar una comparacin de una o ms
muestras de la poblacin, para esto hay que
formularse hiptesis estadsticas.
La primera hiptesis se denomina hiptesis nula
(Fisher, 1935) abreviada H0 (Pearson, 1947) esta
supone igualdad o no diferencia.
Ejemplo, podramos tratar de probar la hiptesis:
H0: El poder aglutinante del suero es el
mismo en los cirrticos que en los sujetos
normales, o bien,
H0 : La densidad del pjaro X es la misma en
los bosques tropicales que el los bosques de
conferas.
8
Hiptesis alternativa o contraria (H1 o HA)
supone lo contrario de H0. Por ejemplo,
H1: El poder aglutinante del suero en los
cirrticos es diferente de la de sujetos
normales.
H1: La densidad del pjaro x es diferente en los
bosques tropicales que el los bosques de
conferas.

9
Una vez definidas las hiptesis estadsticas, estas
deben ser sometidas a una prueba de verdad, es decir
definir si los resultados obtenidos por la muestra son
conforme a los resultados supuestos, de esta manera
definir si las diferencias registradas entre las
observaciones y las hiptesis provienen del azar o
contrariamente de factores condicionantes.

10
Riesgos de error en un test estadstico

Cada test estadstico tiene dos riesgos de error:

A) Rechazar una hiptesis que debera ser aceptada,


se comete un error tipo , o de primera especie (Tipo I).

B) Aceptar una hiptesis que debera ser rechazada se


comete un error de tipo o de segunda especie (Tipo
II).

En el ejemplo de los cirrticos, representa el riesgo


de declarar diferente la media del poder aglutinante del
suero de los cirrticos y los sujetos normales, mientras
que son idnticas a nivel de poblaciones,

y es el riesgo de declarar idnticas las medias de


ambos grupos mientras que son diferentes.

11
Los riesgos de error en un test estadstico

H0 es verdad H1 es verdad
Hiptesis

H0 aceptada Buena decisin Error

H0 rechazada Error Buena decisin

12
Umbral de probabilidad o nivel de significatividad

Cuando se prueba una hiptesis se corre un error hasta un


cierto nivel, a este se le llama umbral de probabilidad o nivel de
significatividad.

Se reconoce como significativo al nivel de probabilidad igual al


0.05,

muy significativo en nivel 0.01 y

altamente significativo el nivel 0.001.

Ejemplo, si se escoge el nivel de 0.05 entonces se dice que hay 5


oportunidades sobre 100 de rechazar una hiptesis H 0 cuando
esta debe ser aceptada.

13
Pruebas de hiptesis de una cola o dos colas,
llamado tambin test unilateral o bilateral

Antes de aplicar todo test estadstico hay que


definir el problema propuesto, as segn las
hiptesis formuladas, se habla de un test bilateral
o unilateral.

El test bilateral se utiliza cuando se tiene que


definir entre dos estimaciones, o entre una
estimacin y un valor dado sin tener en cuenta el
signo o sentido de la diferencia, es decir si la H 1
seala la diferencia de valores.

El test unilateral se aplica cuando se necesita


saber si una estimacin H1 (hiptesis alternativa)
es superior o inferior a otra.

14
H1:
1 > 2

H1:
1 < 2

H1:
1 2

Regiones de aceptacin y rechazo de la hiptesis nula para test unilateral y 15


bilateral.
Dentro de las pruebas de hiptesis podemos
distinguir dos grupos principales:

1) Aquellas que trabajan con datos presentados


en escala cardinal, donde las muestras siguen
una distribucin normal, y las varianzas son
homogneas; denominadas pruebas
estadsticas paramtricas, ya que utilizan los
parmetros para hacer las inferencias
estadsticas.

2) Las pruebas estadsticas no paramtricas


que comnmente se basan en suma de rangos
para establecer diferencias entre dos o ms
muestras. As mismo las pruebas de hiptesis no
paramtricas son utilizadas mas como pruebas
alternativas debido a su bajo poder estadstico.
16
17
Ejemplo 7: Comparar la media muestral (10.43 mg/m3), con una media
poblacional hipottica (10.0 mg/m3), de 31 datos de concentraciones de
monxido de carbono en aire, con un error estndar de 0.24 mg/m3.

Se plantean las hiptesis estadsticas


H 0: =
H 1:

X
Test a utilizar:

X
de Z a un nivel de
Se busca 1.79 en la tabla deXvalores

Z
significatividad de = 0.05
x

10.43mg / m 3 10.00mg / m 3
Z 1 . 79 mg / m 3

0.24mg / m 3

18

P ( X 10.43mg / m 3 ) P ( Z 1.79) 0.0367
Entonces como:

como son dos colas en la distribucin


Z=0.0367+0.0367 = 0.0734
Z() a un nivel de significatividad de 0.05 es
1.96, este valor se compara al valor obtenido
anteriormente. Como P(Z>Z).
Como 1.79<1.96 se acepta la H0, por lo que el
promedio de la concentracin de monxido de
carbono obtenido en la muestra es igual a la
media de la poblacin registrada.
no se observan diferencias significativas entre
dichas medias (p>0.05. porque 0.0734>0.05).

19
-Z/2 Z/2

-1.96 -1.79 0 +1.79 1.96

aceptacin

rechazo rechazo

20
Ejemplo 8: Se compara una muestra de
veinticinco datos de temperatura corporal de
cangrejos (C), con respecto a la temperatura
ambiente promedio (24.3C) a un nivel de
error del 5%. Los datos son los siguientes:

25.8, 24.6, 26.1, 22.9, 25.1, 27.3, 24.0, 24.5,


23.9, 26.2, 24.3, 24.6, 23.3, 25.5, 28.1, 24.8,
23.5, 26.3, 25.4, 25.5, 23.9, 27.0, 24.8, 22.9,
25.4.

21
H0: La temperatura corporal promedio de la
muestra de cangrejos es igual a la
temperatura ambiente promedio.
H1: La temperatura corporal promedio de la
muestra de cangrejos es diferente a la
temperatura ambiente promedio.

Se plantean las hiptesis estadsticas

H0: =24.3 C
H1: 24.3 C esto implica un anlisis
bilateral

22
X
Test a utilizar: t
sx

error estndar:S S 2x

X n
S2 = 1.80 C 1.80C
S 0.27C
error estndar: X 25

23
Aplicacin del test:t 25.03C 24.3C 2.704
0.27C

Se busca en la tabla de valores de t a un


nivel de significatividad de =0.05 y a 24gl
(grados de libertad n-1 es decir 25-1). Si la
tabla utiliza una cola de distribucin buscar en
0.025, si dos colas en 0.05.
El valor obtenido es 2.064.

24
Como t(0.05,24) es 2.064<2.704 calculado,
se rechaza H0 y se acepta H1 por lo que la
muestra de la temperatura media de los
cangrejos es significativamente diferente de la
del ambiente.

25
-t/2 t/2

-2.70 -2.06 0 +2.06 2.704

aceptacin

rechazo rechazo

26
1.3.3.2. Pruebas de hiptesis con dos
muestras independientes

Dentro de los procedimientos estadsticos ms


empleados est la comparacin de dos
muestras, para inferir si existen diferencias
entre dos poblaciones muestreadas.

Como en el caso de una sola muestra las


pruebas de hiptesis para dos muestras
pueden ser utilizadas para comparar dos
medias, dos varianzas, dos proporciones, etc.

27
1.3.3.2.1.2. Comparacin entre dos
medias muestrales independientes, bajo
el supuesto de homogeneidad de
varianzas
grandes muestras independientes n>30 y
pequeas muestras independientes n<30

28
Grandes muestras

La H0 se somete a una prueba de verdad


despus de poner formular H1, la cual se
puede formular de tres formas:

H1 : 1 2 (test bilateral)

H1 : 1 > 2 (test unilateral)


H1 : 1 < 2 (test unilateral)

29
H1 : 1 2 (test bilateral)

Si Zc se encuentra entre los 2 valores crticos


-Z/2 y +Z/2. H0 es aceptada y se corre un
riesgo del cual no se conoce el nivel.

Si Zc se encuentra al exterior del intervalo


mencionado, H0 es rechazada y H1 aceptada
al nivel de significatividad , del cual se
conoce el nivel.

30
H1 : 1 > 2 (test unilateral)

Si Zc es inferior al valor crtico Z, H0 es


aceptada y se corre un riesgo del cual no se
conoce el nivel.

Si Zc es superior al valor crtico Z, H0 es


rechazada y H1 aceptada y se corre un riesgo
de error .

31
H1 : 1 < 2 (test unilateral)

Si Zc es superior al valor crtico -Z, H0 es


aceptada y se corre un riesgo del cual no se
conoce el nivel.

Si Zc es inferior al valor crtico -Z, H0 es


rechazada y H1 aceptada y se corre un
riesgo de error .

32
Ejemplo 11: Se estudia el dimorfismo sexual
del ave (Bonasa umbrella) a travs de
muestras obtenidas por caza. Los datos fueron
obtenidos al azar en Canada.
Se obtienen dos muestras:
la primera compuesta por machos juveniles y
la segunda por hembras juveniles,

Se tiene como variable la longitud de la cola


como medida para definir el dimorfismo
sexual.

Los resultados fueron los siguientes:

33
La pregunta impuesta es saber si las medias de las 2
muestras tomadas independientemente difieren una de
otra de manera altamente significativa (< 0.01)

34
H0: 1 = 2
H1: 1 2

X 1 X 2
Zc
Test estadstico: Sx 21 Sx 2 2

n1 n2

158.86mm 134.66mm
Aplicacin del test:Zc 22.9
37.18mm 25.92mm

50 67
35
Decisin estadstica: como Zc (22.9)> a 2.57, que es el
valor de a 0.01, se rechaza H0 y se acepta H1.
Interpretacin: La longitud de la cola de los machos
juveniles y hembras de B. umbrellus es diferente de la
de las hembras juveniles; por lo tanto hay dimorfismo
sexual en esta ave.

36
Pequeas muestras
X1 X 2
tc
1 1
Spd
n1 n2

para gl = n1+n2-2
Spd corresponde a la media ponderada de las
varianzas de 2 muestras, esta media es una estimacin
muy precisa de la varianza 2 y se expresa:

n1 1 S 2 x1 n2 1 S 2 x 2
S 2 pd
n1 n2 2

37
OJO ESTE ES EL EJERCICIO
DEL EXAMEN
X1 X 2 1.913 2.292
tc tc 3.82
1 1 1 1
Spd 0.271*
n1 n2 15 15
Ojo aunque el resultado es negativo, como la
distribucin normal es simtrica es lo mismo del lado

n1 1 S 2 x1 n2 1 S 2 x2 positivo que negativo por lo que al compararlo con el


1.70 que es el valor de la tabla para una cola de la
S 2
pd distribucin (porque la pregunta dice que si la
n1 n2 2 solucin BAP, incrementa significativamente la
concentracin de Chl) entonces significa que la Ho
nula es menor o igual y la alternativa que BAP

15 1 0.098 (15 1)0.048 0.0735


incrementa con Chl
Ho: X BAP Xc, HA: X BAP> Xc
S 2 pd Conclusin:
15 15 2
Rechazar Ho por lo que la concentracin de Chl en las
plantas con BAP es mayor (p<0.05) . Lo que indica
que la probabilidad de la diferencia es menor al nivel
HAY QUE SACAR RAIZ CUADRADA 0.05.
PORQUE ES Spd2 Y NECESITAMOS
OJO NUNCA SE DEBE EXPRESAR QUE HAY UNA
SOLO Spd =0.271 DIFERENCIA SIGNIFICATIVA Y PONER (P> 0.05)
38
Para aplicar este test, las 2 poblaciones deben
tener la misma varianza, si esta condicin no
se cumple se puede aplicar el test siempre y
cuando los valores de n1 y n2 no sean muy
diferentes.

39
Ejemplo 12: Probar si hay diferencias
significativas en los tiempos (minutos) de
saturacin en sangre de dos tipos de
medicamentos suministrados a dos grupos de
organismos (Un medicamento por grupo).

40
Hiptesis estadsticas:

H0: x1 x 2
H1: x1 x 2
X1 X 2
tc

1 1
Test estadstico:
Spd

n1 n2
para gl = n1+n2-2

41
n1 1 S x1 n2 1 S x 2
Clculo del test: 2 2
S 2
pd
n1 n2 2

S 2

6 1 (0.339 min) 7 1 (0.6695 min)
0.5193
pd
672

(8.75 min 9.74 min)


tc 2.475
1 1
0.7206 *
6 7

42
Decisin estadstica: como tc es superior a t/2
para 11 grados de libertad (2.201), se rechaza
H0 y se acepta H1, por tanto los tiempos de
saturacin en sangre de dos tipos de
medicamentos suministrados en el grupo A y B
son diferentes.

-t/2 t/2

-2.47 -2.20 0 +2.2 2.4


aceptaci 0 7
rechaz n rechaz
o o 43
Comparacin entre dos medias
muestrales independientes, con el
supuesto de varianzas diferentes
(pequeas muestras independientes
n<30)

Se utiliza el test de t, llamado test tcm


crtico modificado, en donde:
X1 X 2
tcm
S 2 x1 S 2 x2

n1 n2

44
los grados de libertad se calculan:

2
S x1 2
S x2 2


n1 n2
2 2
S x1
2
S 2 x2

n1 n2

n1 1 n2 1

45
Ejemplo 13: En un estudio inmunolgico,
Elie y Lamoreaux (1974) desgarraron la
piel de dos lotes de ratones.

El primer lote de 10 ratones no recibi


ningn tratamiento.
El segundo lote de 10 ratones, ha sido
tratado por un antgeno de transplante.

La sobrevivencia de ratones fue medida


en das y los resultados de esta
experiencia son los siguientes:

46
Condiciones de aplicacin: los datos provienen de muestras
independientes, n<30, varianzas diferentes por lo que siguen la ley
de t-student.
Hiptesis

H0: 1 = 2
H1: 1 < 2

47
Test estadstico:

X1 X 2 9.42 13.36
tcm tcm 7.33
S 2 x1 S 2 x 2 0.24 2.65

n1 n2 10 10

Calculo de grados de libertad:


2
S 2 x1 S 2 x2
2 0.24 2.65
10 10

n1 n2 2 2
10.66
S 2 x1
2
S 2 x2
2
0.24 2.65

n1 n2 10 10
n1 1 n2 1 9 9
48
Decisin estadstica: tcm <t para 11 gl (-7.33<-
3.10), se rechaza H0 a un nivel de
significatividad de 0.01, por lo que la
sobrevivencia de ratones es significativamente
mayor con el tratamiento de los antgenos.

-t

-7.33 -3.10 0
aceptaci
rechaz n
o

49

S-ar putea să vă placă și