Documente Academic
Documente Profesional
Documente Cultură
ESTADSTICA (Q)
157
23. TESTS E INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES Un test de hiptesis para dos muestras es similar en muchos aspectos al test para una muestra. Se especifica una hiptesis nula, en la mayora de los casos se propone que las medias de las dos poblaciones son iguales y se establece la hiptesis alternativa (uni o bilateral). Se especifica un nivel de significacin . Se calcula el p-valor: la probabilidad de obtener datos cuyas medias muestrales difieren tanto o ms que la diferencia observada cuando H0 es verdadera. Si esta probabilidad es pequea (menor que ) se rechaza H0 y se concluye que la diferencia observada no es atribuible al azar y las medias de las dos poblaciones son diferentes.
El estadstico del test depender de la estructura de los conjuntos de datos. En particular es importante establecer si los datos corresponden a muestras apareadas o independientes. 23.1 MUESTRAS APAREADAS La caracterstica distintiva de las muestras apareadas es que para cada observacin del primer grupo, hay una observacin relacionada en el segundo grupo. Este diseo es ms complejo que el de muestras independientes (seccin 23.2) pero lo presentamos en primer trmino porque se pueden aplicar, con slo tomar diferencias, todos los procedimientos que hemos visto para una muestra. Las muestras apareadas se obtienen cuando se realizan comparaciones sobre una misma unidad experimental: - se determina en la misma unidad la concentracin de una sustancia con dos mtodos diferentes. - se estudia un mismo individuo antes y despus de un tratamiento. Ejemplo 1: Interesa decidir si una dieta escasa en caloras produce un cambio en la tensin media de dixido de carbono arterial en pacientes con problemas respiratorios crnicos
Tensin de dixido de carbono arterial (mm Hg) en pacientes con problemas respiratorios PACIENTE ANTES DESPUS DIFRENCIA 1 49 45 4 2 68 54 14 3 65 60 5 4 57 60 -3
158
Qu se observa? Hay una gran superposicin, de ms del 50%, entre los dos conjuntos de datos. Parece haber una leve reduccin del dixido de carbono despus de la dieta. Los valores dixido de carbono de un mismo paciente estn relacionados.
Llamemos Xi = concentracin de CO2 del paciente i antes de realizar la dieta Yi = concentracin de CO2 del paciente i despus de realizar la dieta Definimos una nueva variable, la diferencia entre las concentraciones de un paciente. Di = Xi Yi . Di> 0 la concentracin de CO2 del paciente i se redujo al realizar la dieta. Di = 0 la concentracin de CO2 del paciente i se mantuvo igual. Di < 0 la concentracin de CO2 del paciente i aument al realizar la dieta.
Cuando graficamos el box-plot y el histograma de la variable diferencia observamos que en la mayora de los pacientes la concentracin de CO2 se redujo al realizar la dieta 23.1.1 Consideraciones generales bajo Normalidad de las diferencias
159
Sean (Xi, Yi) (1 i n) las observaciones realizadas sobre n unidades experimentales, para cada par (Xi, Yi); Di = Xi - Yi Modelo D1, ..., Dn v.a.i.i.d N(D, 2D) con D = X-Y No realizamos ningn supuesto sobre la distribucin de cada variable, solamente sobre la diferencia. Luego
D D SD
Di
n
~ t n 1
(X Y) ( X Y ) SD n
~ t n 1
donde D = i =1 n
= X Y
2 = i =1 SD
2 ( Di D )
n 1
Veremos a continuacin que si interesa realizar un test o construir un intervalo de confianza para diferencia de medias con muestras apareadas, hay que realizarlo con los mismos procedimientos desarrollados para una muestra tomando las diferencias. 23.1.2 Tests e intervalos de confianza para diferencias de medias con datos apareados. Un intervalo de confianza de nivel 1- para X - Y , IC(X - Y ) est dado por
X Y t n 1, / 2 SD n X - Y = (o equivalentemente
Un test para la hiptesis nula: estar basado en el siguiente Estadstico del test T =
H0:
H0: D
= )
(X Y ) SD n
~ t n -1 bajo
H0
Observacin: El test basado en el estadstico anterior se denomina test t apareado para diferencia de medias. Regin de rechazo de nivel para cada tipo de hiptesis alternativa y su p-valor Tipo de Regin de Rechazo p-valor Hiptesis alternativa de nivel p = 2 P(T |Tobs|) a) Ha: X - Y T t n 1, / 2 b) Ha: X - Y > c) Ha: X - Y <
T t n 1,
T t n 1,
160
Ejemplo 1: Se ha observado, para 8 pacientes con problemas respiratorios crnicos, una diferencia de 6.25 mm Hg en las medias muestrales de la tensin de dixido de carbono. Se quiere decidir si esta diferencia es estadsticamente distinta de cero a nivel = 0.05.
No se rechaza el supuesto de Normalidad de las diferencias (p-valor =0.6670) que requiere el test t. Hiptesis nula: H0: X - Y = 0 no hay diferencia entre la media de la concentracin de CO2 en la poblacin de todos los posibles pacientes con problemas respiratorios crnicos antes de realizar la dieta y despus de realizarla. El valor observado del estadstico del test es: t obs=
Para un test a dos colas, de la tabla de la distribucin t con 7 (n-1) grados de libertad, obtenemos que el valor - p se encuentra entre 0.02 y 0.05. Por lo tanto se rechaza la hiptesis de igualdad de medias a nivel 5% (p < 0.05). El cuadro siguiente muestra los resultados del test t anterior, dados por el Statistix: Statistics -> One, Two, Multi-sample Tests -> Paired T Test
PAIRED T TEST FOR ANTES - DESPUES NULL HYPOTHESIS: DIFFERENCE = 0 ALTERNATIVE HYP: DIFFERENCE <> 0 MEAN STD ERROR LO 95% CI UP 95% CI T DF 6.2500 2.3126 0.7815 11.718 2.70 7
161
Se obtiene, inmediatamente, un intervalo de 95% de confianza para la diferencia de medias de dixido de carbono, ANTES - DESPUS, en pacientes sometidos a una dieta escasa en caloras: ( 0.78 , 11.72 ). No contiene al cero. Por lo tanto se rechaza la hiptesis de igualdad de medias a nivel 5% (p < 0.05). Utilizando el p-valor = 0.0305 se llega a la misma conclusin, los datos proveen suficiente evidencia a nivel 0.05 para decidir que la tensin media de dixido de carbono arterial en pacientes con problemas respiratorios crnicos se modifica mediante una dieta escasa en caloras.
23.1.3 Test del signo y el Test de rangos signados de Wilcoxon para dos muestras apareadas El test del signo y el test de rangos signados de Wicoxon permiten decidir si la mediana poblacional de la variable diferencia es cero o es un valor especificado. Los procedimientos son idnticos a los presentados para una muestra, aplicados a las diferencias Di = Xi - Yi donde (Xi, Yi) (1 i n) son las observaciones realizadas sobre n unidades experimentales. Para el test del signo nicamente debe satisfacerse el supuesto de independencia de cada par de observaciones. Para el test de Wilcoxon deben agregarse los supuestos de continuidad simetra de la diferencia. Ejemplo 1 cont. Las tablas siguientes muestran los resultados de aplicar el test del signo y el test de rangos signados de Wilcoxon a los datos de pacientes con problemas respiratorios crnicos.
SIGN TEST FOR ANTES - DESPUES NUMBER OF NEGATIVE DIFFERENCES NUMBER OF POSITIVE DIFFERENCES NUMBER OF ZERO DIFFERENCES (IGNORED) PROBABILITY OF A RESULT AS OR MORE EXTREME THAN OBSERVED A VALUE IS COUNTED AS A ZERO IF ITS ABSOLUTE VALUE IS LESS THAN 0.00001 CASES INCLUDED 8 MISSING CASES 0 1 7 0 0.0352 - p-valor (una cola)
162
Observacin. Si los supuestos para realizar el test de t se satisfacen ste test es ms potente, para un nivel dado, que las correspondientes alternativas no paramtricas. Siendo el test de rangos signados de Wilcoxon ms potente que el test del signo.
23.2 TESTS E INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES: MUESTRAS INDEPENDIENTES - VARIANZAS IGUALES Ejemplo 2: Se utilizaron dos mtodos para determinar el calor latente de fusin del hielo. Interesa saber si los mtodos difieren. La tabla muestra el calor total absorbido por el hielo al pasar de una temperatura de -72 oC a agua 0 oC en caloras por gramo de masa.
163
Para los datos correspondientes al mtodo A podemos observar simetra dentro de la caja y la cola de los valores altos un poco corta. En los datos del mtodo B hay una leve asimetra hacia los valores mayores ms marcada dentro de la caja. Los dos conjuntos de datos presentan variabilidad similar. Vemos tambin que hay diferencias en la posicin relativa de los dos conjuntos de datos, el 75% de los datos mayores del mtodo A es mayor que el 75% de los datos menores del mtodo B. Vamos a evaluar ms formalmente esta diferencia mediante intervalos de confianza y tests de hiptesis. Planteo general Consideraremos el caso en que tenemos dos conjuntos de observaciones Normales independientes entre si y tambin entre los dos grupos, con igual varianza. Es decir que las observaciones satisfacen el siguiente modelo. Modelo:
X1 , L , X n Y1 , L , Ym i.i.d N ( X , 2 ) independientes 2 i.i.d N ( Y , )
Entonces
~ N ( X , 2 /n ) 1 2 1 X Y ~ N ( X y , ( + )) n m Y ~ N ( Y , 2 /m)
(X Y) ( X Y ) 1 1 + n m
~ N (0,1)
164
Un test para la hiptesis nula: H0: X - Y = estar basado en el siguiente Estadstico del test Z =
(X Y) 1 1 + n m
~ N (0,1) bajo
H0
Regin de rechazo de nivel para cada tipo de hiptesis alternativa Tipo de Hiptesis alternativa a) Ha: X - Y b) Ha: X - Y > c) Ha: X - Y < Regin de Rechazo de nivel p-valor
Z z /2
Z z
Z z
b) 2 desconocido, lo debemos estimar. Hemos supuesto que las varianzas de las dos poblaciones de inters son iguales. 2 2 2 Por lo tanto S X y S Y son dos estimadores de . Parece razonable obtener una nica estimacin tomando un promedio pesado de ambos estimadores. Le daremos ms peso al estimador que se obtuvo con la mayor cantidad de observaciones.
2 2 + (m 1) S Y (n 1) S X 2 2 ( X i X ) + (Yi Y ) i =1 n m
S2 p =
n+m2
= i =1
n+m2
(8)
entonces
165
Un test para la hiptesis nula: H0: X - Y = estar basado en el siguiente Estadstico del test T =
( X Y) 1 1 Sp + n m
~ t n + m -2
bajo
H0
Observacin: El test basado en el estadstico anterior se denomina test t para diferencia de medias
Regin de rechazo de nivel para cada tipo de hiptesis alternativa y su p-valor Tipo de Hiptesis alternativa a) Ha: X - Y b) Ha: X - Y > c) Ha: X - Y < Regin de Rechazo de nivel T t n + m-2, / 2
T t n + m - 2, T t n + m - 2,
p-valor
Observaciones
La hiptesis nula ms utilizada es H0: X - Y = 0. Cuando no se rechaza H0: X - Y = 0 decimos que no existe evidencia a nivel para decidir que las medias muestrales difieren significativamente. Cuando s se rechaza H0: X - Y = 0 a favor de a) Ha: X - Y 0 -> decimos que las medias muestrales difieren significativamente. b) Ha: X - Y > 0 -> decimos que las media muestral del grupo (X) es significativamente mayor que la del grupo (Y).
166
Volvamos al ejemplo 2 del calor de fusin del hielo. Sean Xi = calor total absorbido por el hielo en la repeticin i-sima cuando se utiliza el mtodo A Yi = calor total absorbido por el hielo en la repeticin i-sima cuando se utiliza el mtodo B Supongamos a dems que las repeticiones se realizan en condiciones indep. e idnticas. Supuesto de normalidad de los datos. Hemos visto que los datos del mtodo B tienen una leve asimetra hacia los valores mayores y los de A la asimetra es ms leve an y hacia los valores menores. Pueden estos alejamientos de la distribucin Normal deberse a variaciones aleatorias?
Los p-valores de los estadsticos de Shapiro-Wilk resultan mayores que 0.20 para los dos mtodos, no rechaza el supuesto de Normalidad de para cada conjunto de datos.
167
Supuesto de homogeneidad de varianzas. Los boxplots nos permiten suponer que los dos conjuntos de datos provienen de poblaciones con igual varianza. Evaluaremos posteriormente este supuesto mediante un test de hiptesis. Podemos realizar un test t para muestras independientes. Las hiptesis de inters en este problema son:
H0: X - Y = 0 Ha: X - Y
Con el Statistix (Statistics -> Summary Statistics -> Descriptive Statistics) obtenemos la media y el desvo de los datos correspondientes cada uno de los mtodos.
VARIABLE METODO_A METODO_B N 13 8 MEAN 80.018 79.979 SD 0.0245 0.0314
De la tabla anterior resulta: n=13 m=8 x = 80.018 , y = 79.979, sX=0.0245 sY= 0.0314 Por lo tanto
s2 p =
2 12 s 2 X + 7 sY
19
= 0.00074235
y sp = 0.02724617
168
Tobs =
(x y) 0 sp 1 1 + 13 8
Regla de decisin a nivel = 0.05: Rechace H0 si |T| t19,0.025 = 2.09 Conclusin: Las medias de las observaciones del mtodo A y del mtodo B difieren significativamente, es decir que la diferencia observada no es atribuible al azar. Podemos realizar el test t para diferencia de medias utilizando el Statistix para la hiptesis alternativa Ha: X - Y 0
Statistics -> One, Two, Multi-sample Tests -> Two Sample T-Test
TWO-SAMPLE T TESTS FOR METODO_A VS METODO_B VARIABLE --------METODO_A METODO_B DIFFERENCE MEAN --------80.018 79.979 0.0389 SAMPLE SIZE -----13 8 S.D. --------0.0245 0.0314 (B) P -----0.0049 0.0110 DEN DF -----12 95% CI FOR DIFFERENCE --------------------(0.0133, 0.0646) (D) (0.0107, 0.0672) P -----0.2173 S.E. --------6.81E-03 0.0111 (A)
NULL HYPOTHESIS: DIFFERENCE = 0 ALTERNATIVE HYP: DIFFERENCE <> 0 ASSUMPTION T ---------------------EQUAL VARIANCES (C) 3.18 UNEQUAL VARIANCES 2.99 TESTS FOR EQUALITY OF VARIANCES CASES INCLUDED 21 F ------1.63
MISSING CASES 5
(A) S.E. = S.D. / (Tamao de la muestra) = 0.0314 / 8 = 0.0111 (B) Hiptesis. (C) Valor observado del estadstico (T), grados de libertad (DF) y p-valor (P) del test que supone varianzas iguales para las hiptesis indicadas en (B). (D) Intervalo de confianza para XY, basado en el estadstico que supone igualdad de varianzas. Completaremos el anlisis de esta salida despus de abordar el tema de la homogeneidad de varianzas. Test F de homogeneidad de varianzas
169
Modelo: entonces
X1 , L , X n Y1 , L , Ym
i.i.d
2 2 SX / X F= ~ f n 1, m1 2 2 SY /Y
distribucin F de Fisher con n-1 grados de libertad del numerador y m-1 grados de libertad del denominador
Hiptesis:
2 2 H0: X = Y
2 2 versus Ha: X Y
2 SX 2 SY
F=
~ f n1, m1
2 SX F = S2 f Y
2 SX Regin de rechazo: F = S 2 f Y
n 1, m 1, / 2
n 1, m 1, 1 / 2
donde f n1, m1, / 2 es el valor crtico /2 (deja un rea /2 a derecha bajo la curva de densidad f n1, m1 ). Cuando H0 es verdadera el estadstico tiende a tomar valores muy cercanos a 1 mientras que si H0 es falsa, el estadstico tiende a tomar valores alejados de 1. Cuando H0 es verdadera el estadstico del test tiene una distribucin denominada F de Fisher que depende de dos parmetros: los grados de libertad del numerador (n1) y los grados de libertad del denominador (m1). Esta distribucin est tabulada. Statistix permite calcular probabilidades bajo la misma (Statistics -> Probability Functions) y provee el p-valor para el test de igualdad de varianzas en forma automtica. P-VALOR: el p-valor de este test generalmente se considera a dos colas porque estamos tratando de detectar apartamientos de H0 en cualquier direccin. 23.3 TESTS E INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES: MUESTRAS INDEPENDIENTES - VARIANZAS DESIGUALES
170
Modelo:
X1 , L , X n Y1 , L , Ym
X
i.i.d
2 N ( X , X ) independientes 2 i.i.d N ( Y , Y )
Entonces
2 2 ~ N ( X , 2 /n ) X Y X + )) X Y ~ N ( X y , ( n m 2 Y ~ N ( Y , Y /m)
(X Y) ( X Y )
2 X
2 Y
~ N (0,1)
2 Y
Un test para la hiptesis nula: H0: X - Y = estar basado en el siguiente Estadstico del test bajo
H0
Z= (X Y)
2 X
2 Y
~ N (0,1)
Regin de rechazo de nivel para cada tipo de hiptesis alternativa y su p-valor Tipo de Hiptesis alternativa a) Ha: X - Y b) Ha: X - Y > c) Ha: X - Y < Regin de Rechazo p-valor de nivel p = 2 P(Z |Zobs|) Z z /2
Z z Z z
171
2 b) 2 X y Y son desconocidos los estimamos. Un test para la hiptesis nula: H0: X - Y = estar basado en el siguiente Estadstico del test de Welch (X Y) T* = 2 SX S2 + Y n m
Este estadstico fue propuesto por WelchSatterthwaite quienes demostraron que tiene una distribucin t de Student con grados de libertad aprox. cuando H0. X - Y = es verdadera. El parmetro es siempre menor que n+m2 y se calcula como la parte entera de la siguiente expresin: 2 2 2 sX sY + n m = parte entera (9) 4 4 sX sY + n 2 (n 1) m 2 (m 1)
Regin de rechazo de nivel para cada tipo de hiptesis alternativa y su p-valor Tipo de Hiptesis alternativa a) Ha: X - Y b) Ha: X - Y > c) Ha: X - Y < Regin de Rechazo de nivel T * t , / 2
T * t , T * t ,
p-valor
El valor t,/2 es el percentil de la distribucin t con grados de libertad que deja a su derecha un rea /2. La nica diferencia que tiene un test basado en el estadstico T* con el test t para dos muestras independientes consiste en que su distribucin es t aproximada y los grados de libertad se obtienen mediante el clculo dado en (9).
172
Consideremos nuevamente la ltima porcin de la salida de Statistix para los datos de calor latente de fusin
TWO-SAMPLE T TESTS FOR METODO_A VS METODO_B NULL HYPOTHESIS: DIFFERENCE = 0 ALTERNATIVE HYP: DIFFERENCE <> 0 ASSUMPTION T ---------------------EQUAL VARIANCES (C) 3.18 UNEQUAL VARIANCES(E) 2.99 F TESTS FOR EQUALITY ------OF VARIANCES (G) 1.63 CASES INCLUDED 21 (B) P -----0.0049 0.0110 DEN DF -----12 95% CI FOR DIFFERENCE --------------------(0.0133, 0.0646) (D) (0.0107, 0.0672) (F) P -----0.2173 (H)
MISSING CASES 5
(E) Valor observado del estadstico del test de Welch que no supone igualdad de varianzas, grados de libertad y p-valor, para las hiptesis indicadas en (B). (F) Intervalo de confianza para XY, basado en el estadstico que no supone igualdad de varianzas.
2 2 2 2 (G) Valor del estadstico del test para H0: X = Y versus Ha: X Y (H) No se rechaza H0 (p=0.2173) por lo tanto, es correcto haber considerado el test para varianzas iguales cuyos resultados se muestran en (C) y (D).