Sunteți pe pagina 1din 22

4

INFERENCIA, ESTIMACIN Y CONTRASTE DE HIPTESIS

1.- INTRODUCCIN
La Estadstica descriptiva y la teora de la Probabilidad van a ser los pilares de un nuevo procedimiento (Estadstica Inferencial) con los que se va a estudiar el comportamiento global de un fenmeno. La probabilidad y los modelos de distribucin junto con las tcnicas descriptivas, constituyen la base de una nueva forma de interpretar la informacin suministrada por una parcela de la realidad que interesa investigar. En el siguiente esquema representa el tema a tratar y que ser desarrollado a continuacin.

Puntual Estadstica Descriptiva INFERENCIA Probabilidad y modelos Contraste Estimacin Intervalos

Los mtodos bsicos de la estadstica inferencial son la estimacin y el contraste de hiptesis, que juegan un papel fundamental en la investigacin. Por tanto, algunos de los objetivos que se persiguen en este tema son:

Inferencia, estimacin y contraste de hiptesis


46

Calcular los parmetros de la distribucin de medias o proporciones muestrales de tamao n, extradas de una poblacin de media y varianza conocidas. Estimar la media o la proporcin de una poblacin a partir de la media o proporcin muestral. Utilizar distintos tamaos muestrales para controlar la confianza y el error admitido. Contrastar los resultados obtenidos a partir de muestras. Visualizar grficamente, mediante las respectivas curvas normales, las estimaciones realizadas.

En la mayora de las investigaciones resulta imposible estudiar a todos y cada uno de los individuos de la poblacin ya sea por el coste que supondra, o por la imposibilidad de acceder a ello. Mediante la tcnica inferencial obtendremos conclusiones para una poblacin no observada en su totalidad, a partir de estimaciones o resmenes numricos efectuados sobre la base informativa extrada de una muestra de dicha poblacin. Por tanto, el esquema que se sigue es,

En definitiva, la idea es, a partir de una poblacin se extrae una muestra por algunos de los mtodos existentes, con la que se generan datos numricos que se van a utilizar para generar estadsticos con los que realizar estimaciones o contrastes poblacionales. Existen dos formas de estimar parmetros: la estimacin puntual y la estimacin por intervalo de confianza. En la primera se busca, con base en los datos muestrales, un nico valor estimado para el parmetro. Para la segunda, se determina un intervalo dentro del cual se encuentra el valor del parmetro, con una probabilidad determinada. Si el objetivo del tratamiento estadstico inferencial, es efectuar generalizaciones acerca de la estructura, composicin o comportamiento de las poblaciones no observadas, a partir de una parte de la poblacin, ser necesario que la parcela de poblacin examinada sea representativa del total. Por ello, la seleccin de la muestra requiere unos requisitos que lo garanticen, debe ser representativa y aleatoria.

Apuntes de Estadstica II

47

Adems, la cantidad de elementos que integran la muestra (el tamao de la muestra) depende de mltiples factores, como el dinero y el tiempo disponibles para el estudio, la importancia del tema analizado, la confiabilidad que se espera de los resultados, las caractersticas propias del fenmeno analizado, etctera. As, a partir de la muestra seleccionada se realizan algunos clculos y se estima el valor de los parmetros de la poblacin tales como la media, la varianza, la desviacin estndar, o la forma de la distribucin, etc. El estudio muestral no es un tema que entre a formar parte de este tema, pero si necesitaremos una serie de conceptos necesarios para el desarrollo del tema, y que se detallan a continuacin.

1.1.- Conceptos bsicos


POBLACIN: Conjunto de elementos sobre los que se observa un carcter comn. Se representa con la letra N. MUESTRA: Conjunto de unidades de una poblacin. Cuanto ms significativa sea, mejor ser la muestra. Se representa con la letra n. UNIDAD DE MUESTREO: Est formada por uno o ms elementos de la poblacin. El total de unidades de muestreo constituyen la poblacin. Estas unidades son disjuntas entre s y cada elemento de la poblacin pertenece a una unidad de muestreo. PARMETRO: Es un resumen numrico de alguna variable observada de la poblacin. Los parmetros normales que se estudian son: La media poblacional: X Total poblacional: X Proporcin: P

ESTIMADOR: Un estimador * de un parmetro , es un estadstico que se emplea para conocer el parmetro desconocido. ESTADSTICO: Es una funcin de los valores de la muestra. Es una variable aleatoria, cuyos valores dependen de la muestra seleccionada. Su distribucin de probabilidad, se conoce como Distribucin muestral del estadstico. ESTIMACIN: Este trmino indica que a partir de lo observado en una muestra (un resumen estadstico con las medidas que conocemos de Descriptiva) se extrapola o generaliza dicho resultado muestral a la poblacin total, de modo que lo estimado es el valor generalizado a la poblacin. Consiste en la bsqueda del valor de los parmetros poblacionales objeto de estudio. Puede ser puntual o por intervalo de confianza: Puntual: cuando buscamos un valor concreto.

Inferencia, estimacin y contraste de hiptesis -

48

Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se supone que va a estar el valor del parmetro que se busca con una cierta probabilidad.

CONTRATE DE HIPTESIS: Consiste en determinar si es aceptable, partiendo de datos muestrales, que la caracterstica o el parmetro poblacional estudiado tome un determinado valor o est dentro de unos determinados valores. NIVEL DE CONFIANZA: Indica la proporcin de veces que acertaramos al afirmar que el parmetro est dentro del intervalo al seleccionar muchas muestras.

2.- EL CONCEPTO DE ESTADSTICO Y DISTRIBUCIN MUESTRAL


El objetivo de la inferencia es efectuar una generalizacin de los resultados de la muestra de la poblacin. La tarea que nos ocupa ahora es conocer las distribuciones de la probabilidad de ciertas funciones de la muestra, es decir, variables aleatorias asociadas al muestreo o estadsticos muestrales. stos sern tiles para hacer inferencia respecto a los parmetros desconocidos de una poblacin. Por ello se habla de distribuciones muestrales, ya que estn basados en el comportamiento de las muestras. El primer objetivo es conocer el concepto de distribucin muestral de un estadstico; su comportamiento probabilstico depender del que tenga la variable X y del tamao de las muestras. Sea x1.......xn, una muestra 1 aleatoria simple (m.a.s) de la variable aleatoria X, con funcin de distribucin F0 , se define el estadstico T como cualquier funcin de la muestra que no contiene ninguna cantidad desconocida. Sea una poblacin donde se observa la variable aleatoria X. Esta variable X, tendr una distribucin de probabilidad, que puede ser conocida o desconocida, y ciertas caractersticas o parmetros poblacionales. El problema ser encontrar una funcin que proporcione el mejor estimador de . El estimador, T, del parmetro debe tener una distribucin concentrada alrededor de y la varianza debe ser lo menor posible. Los estadsticos ms usuales en inferencia y su distribucin asociada considerando una poblacin P sobre la que se estudia un carcter cuantitativo son: o Media muestral: x = o Cuasivarianza: s 2 =
1 n x n i =1 i

1 n (x x)2 i =1 i n 1

Todas las variables aleatorias que forman la muestra verifican que son independientes entre s, que

E[ X i ] = y que su V [ X i ] = 2 .

Apuntes de Estadstica II o Total: t = n xi . i =1

49

2.1.- Distribuciones muestrales


Consideremos todas las posibles muestras de tamao n en una poblacin, entonces, como se deca anteriormente, para cada muestra podemos calcular un estadstico (media, desviacin tpica, proporcin,...) que variar de una a otra. As obtenemos una distribucin de ese estadstico que se llamar distribucin muestral. Las medidas fundamentales de esta distribucin son la media, la desviacin tpica, tambin denominada error tpico, y el total poblacional, y sus distribuciones muestrales son las siguientes. MEDIA MUESTRAL: Sea X1.....Xn, una m.a.s. con media o con E(x)= y con varianza muestral V [ X ] = normal de parmetros: X N ( ,

2
n

, entonces la media muestra se distribuye como una

).

VARIANZA MUESTRAL: Sea X1.....Xn, una m.a.s. independientes e idnticamente distribuidas, definimos el estadstico muestral para la varianza como la cuasivarianza 2 1 n muestral s 2 = 1=1 x1 x , entonces se verifica que: n 1

(n 1)s 2

2 n 1

TOTAL MUESTRAL: Sea X1......Xn, una m.a.s. con E(t)= n y con V(t)= n 2 , entonces se distribuye como una normal: t N n ; n 2 .

3.- ESTIMACIN PUNTUAL


Un estimador de un parmetro poblacional es una funcin de los datos muestrales. En pocas palabras, es una frmula que depende de los valores obtenidos de una muestra, para realizar estimaciones. Lo que se pretende obtener es el valor exacto de un parmetro. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la talla media de los individuos de la muestra.

Inferencia, estimacin y contraste de hiptesis

50

La media de la muestra puede ser un estimador de la media de la poblacin, la cuasivarianza muestral es un buen estimador de la varianza poblacional y el total muestral es un buen estimador del total poblacional. Por tanto, una definicin ms matemtica de un estimador y las propiedades que debe de cumplir un estimador para ser bueno. Sea X1......Xn, una m.a.s. de tamao n, decimos que es un estimador * de un parmetro si el estadstico que se emplea para conocer dicho parmetro desconocido es este.

3.1.- Propiedades deseables de un estimador


Las propiedades o criterios para seleccionar un buen estimador son los siguientes: A) Insesgadez: Diremos que un estimador * de un parmetro es insesgado si su esperanza coincide con el verdadero valor del parmetro. E[*] = . En el caso de que no coincidan, diremos que el estimador es sesgado. B) Eficiencia: Dados dos estimadores 1* y 2* para un mismo parmetro , se dice que 1* es ms eficiente que 2* si: V[1*] < V[2*]. C) Suficiencia: Se dice que un estimador de un parmetro es suficiente cuando para su clculo utiliza toda la informacin de la muestra. D) Consistencia: Decimos que un estimador * de un parmetro es consistente si la distribucin del estimador tiende a concentrarse en un cierto punto cuando el tamao de la muestra tiende a infinito.

Lim n = {P[ + ]}.

3.2.- Mtodos para obtener estimadores


El demostrar que un cierto estimador cumple estas propiedades puede ser complicado en determinadas ocasiones. Existen varios mtodos que nos van a permitir obtener los estimadores puntuales. Los ms importantes son: MTODO DE LOS MOMENTOS: se basa en que los momentos poblacionales y se estiman mediante los momentos muestrales. Suelen dar estimadores consistentes. MTODO DE MNIMOS CUADRADOS: consiste en obtener un estimador que hace mnima una determinada funcin. MTODO DE MXIMA VEROSIMILITUD: consiste en tomar como parmetro poblacional el valor de la muestra que sea ms probable, es decir, que tenga mayor probabilidad. Se suelen obtener estimadores consistentes y eficientes. Es el ms utilizado.

Apuntes de Estadstica II

51

La probabilidad de que la media muestral sea igual a la media poblacional es cero, P[x = ] = 0 , es decir, que ser bastante complicado obtener un estimador puntual, por ello se utiliza ms el Intervalo de Confianza y el Contraste de Hiptesis.

4.- ESTIMACIN POR INTERVALOS DE CONFIANZA


El intervalo de confianza est determinado por dos valores dentro de los cuales afirmamos que est el verdadero parmetro con cierta probabilidad. Son unos lmites o margen de variabilidad que damos al valor estimado, para poder afirmar, bajo un criterio de probabilidad, que el verdadero valor no los rebasar. Es una expresin del tipo [1, 2] 1 2, donde es el parmetro a estimar. Este intervalo contiene al parmetro estimado con una determinada certeza o nivel de confianza. En la estimacin por intervalos se usan los siguientes conceptos:
Variabilidad del parmetro: Si no se conoce, puede obtenerse una aproximacin en los datos o en un estudio piloto. Tambin hay mtodos para calcular el tamao de la muestra que prescinden de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviacin tpica poblacional y se denota . Error de la estimacin: Es una medida de su precisin que se corresponde con la amplitud del intervalo de confianza. Cuanta ms precisin se desee en la estimacin de un parmetro, ms estrecho deber ser el intervalo de confianza y, por tanto, menor el error, y ms sujetos debern incluirse en la muestra estudiada. Llamaremos a esta precisin E, segn la frmula E = 2 - 1. Nivel de confianza: Es la probabilidad de que el verdadero valor del parmetro estimado en la poblacin se site en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-), aunque habitualmente suele expresarse con un porcentaje ((1-)100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores de 0,05 y 0,01, respectivamente. Valor : Tambin llamado nivel de significacin. Es la probabilidad (en tanto por uno) de fallar en nuestra estimacin, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-). Por ejemplo, en una estimacin con un nivel de confianza del 95%, el valor es (100-95)/100 = 0,05. Valor crtico: Se representa por Z/2. Es el valor de la abscisa en una determinada distribucin que deja a su derecha un rea igual a /2, siendo 1- el nivel de confianza. Normalmente los valores crticos estn tabulados o pueden calcularse en funcin de la distribucin de la poblacin. Por ejemplo, para una distribucin normal, de media 0 y desviacin tpica 1, el valor crtico para = 0,05 se calculara del siguiente modo: se busca en la tabla de la distribucin ese valor (o el ms aproximado), bajo la columna "rea"; se observa que se corresponde con -0,64. Entonces Z/2 = 0,64. Si la media o desviacin tpica de la distribucin normal no coinciden con las de la tabla, se puede realizar el cambio de variable t=(X-)/ para su clculo.

Inferencia, estimacin y contraste de hiptesis

52

Con estas definiciones, si tras la extraccin de una muestra se dice que "3 es una estimacin de la media con un margen de error de 0,6 y un nivel de confianza del 99%", podemos interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando, respectivamente, la mitad del error, para obtener el intervalo de confianza segn las definiciones dadas. Para un tamao fijo de la muestra, los conceptos de error y nivel de confianza van relacionados. Si admitimos un error mayor, esto es, aumentamos el tamao del intervalo de confianza, tenemos tambin una mayor probabilidad de xito en nuestra estimacin, es decir, un mayor nivel de confianza. Por tanto, un aspecto que debe de tenerse en cuenta es el tamao muestral, ya que para disminuir el error que se comente habr que aumentar el tamao muestral. Esto se resolver, para un intervalo de confianza cualquiera, despejando el tamao de la muestra en cualquiera de las formulas de los intervalos de confianza que veremos a continuacin, a partir del error mximo permitido. Los intervalos de confianza pueden ser unilaterales o bilaterales: UNILATERAL: P[ X < z ] = 1 P[ X > z ] = 1 . BILATERAL: P z < X < z . 2 2

4.1.- Intervalo de confianza para la media con varianza conocida


Sea X una variable aleatoria que se distribuye como X la media muestral ( X ) como estimador, entonces X N ( ,

N( , ), si utilizamos ).

Tipificando, centramos el estimador, cambiando de origen y de escala obteniendo: Z= x

/ n

N (0;1).

Entonces, el intervalo de confianza o la probabilidad para el estimador media con la varianza conocida viene dado por los siguientes parmetros: x P z < < z = P z . < x < z = n 2 / n 2 n 2 2

Apuntes de Estadstica II
P x z . < < x + z . n n 2 2

53

Cambiamos todos los signos, para conseguir la media () positiva: P [ x + z /2

> > x - z /2

] = (1- ).

Ordenando la informacin: P [ x - z /2

< < x + z /2

] = (1- ).

Por tanto, el intervalo es,


; x + z x z . n n 2 2

4.2.- Intervalo de confianza para la media con varianza desconocida y n>30


Sabemos que para cualquier distribucin, por el Teorema Central del Lmite, si tiene un tamao de muestra grande, se puede aproximar o se distribuye como una Normal de parmetros: X N ( , s n ),

siendo s la cuasidesviacin tpica muestral. En consecuencia, Z= x s/ n N (0;1) ,

y procediendo de forma anloga a la anterior llegamos a que el intervalo de confianza que buscamos es
s s ; x + z x z . n n 2 2

4.3.- Intervalo de confianza para la media con varianza desconocida y n<30


Partiendo de una poblacin Normal, en estas condiciones la variable aleatoria se distribuye como una t-Student con n-1 grados de libertad de la forma,

Inferencia, estimacin y contraste de hiptesis

54

x s/ n

t n 1 .

Construimos entonces el intervalo de confianza a un nivel (1- )% de la forma:


x s s P t < < t = P t . < x <t = 1 . , n 1; n 1; n 2 2 n 1; 2 s / n n 1; 2 n

de manera que si continuamos despejando de forma anloga a los caso anteriores se obtiene un intervalo de confianza: s s I .C . x t ;x + t . n 1; n 1; n n 2 2

4.4.- Intervalo de confianza para la proporcin


Basndonos en una variable aleatoria que se distribuye como una Binomial, X B (n; p ); y la aproximacin de una distribucin Binomial por una Normal cuando el tamao de la muestra es muy grande, se ha visto que se puede expresar como X N n p; npq . Segn esto, la variable aleatoria definida como Y=X/n se

distribuye como Y N p; pq / n . Al tipificar, nos queda

Z=

pP pq n

N (0;1) .

Entonces, el intervalo de confianza o la probabilidad para el estimador proporcin viene dado por los siguientes parmetros:
p z 2 pq ; p + z n 2 pq ; . n

Apuntes de Estadstica II

55

4.5.- Intervalo de confianza para la varianza


En poblaciones Normales ya hemos visto que la variables aleatoria (n 1)s 2 2 . Para un nivel de confianza de (1- )% viene dado por, n 1 2

(n 1)s 2 < 2 = 1 . P 2 < n 1; 2 n 1;1 2 2 Si invertimos y despejamos, nos queda,


2 1 1 > > 2 P 2 2 (n 1)s n 1; n 1;1 2 2 = (n 1)s 2 = 1 . (n 1)s 2 2 > > P 2 2 n 1;1 n 1; 2 2

Y por tanto, el intervalo de confianza para la varianza es:


(n 1)s 2 (n 1)s 2 ; 2 2 . n 1; n 1;1 2 2

5.- CONTRASTE DE HIPTESIS


El problema central de la inferencia estadstica es un problema de toma de decisiones, del cual la estimacin y el contraste de hiptesis son aspectos importantes, diferenciados entre s, pero complementarios. Un contraste de hiptesis o Test de hiptesis estadstico es una prueba de significacin o una prueba estadstica, que indican el proceso mediante el cual decidimos si una proposicin respecto de la poblacin, debe ser aceptada o no. Esta proposicin es lo que se denomina hiptesis estadstica. Es una regla de decisin que nos dice cuando aceptar y rechazar las hiptesis, con esto vemos si los datos de una muestra son compatibles o no con los de la poblacin. Una hiptesis estadstica, por tanto, es una proposicin acerca de la funcin de probabilidad o de la funcin de densidad de probabilidad de una variable aleatoria o de varias variables aleatorias. Tal proposicin debe referirse bien a la forma de la

Inferencia, estimacin y contraste de hiptesis

56

distribucin de probabilidad, bien al valor o valores de los parmetros que lo definan o bien a ambos. Hiptesis estadstica es, una afirmacin acerca de la distribucin de la poblacin. Puede haber hiptesis estadsticas en contextos paramtricos y no paramtricos. El contraste de hiptesis estadstico se basar en la informacin proporcionada por la muestra. De modo, que si rechazamos la hiptesis, queremos indicar que los datos de la muestra ofrecen cierta evidencia sobre su falsedad. Si la aceptamos simplemente queremos significar que no se rechaza. Un contraste de hiptesis consiste, por tanto, en estudiar dos hiptesis: H0 (hiptesis nula), H1 (hiptesis alternativa), de manera que el investigador divide los resultados muestrales en dos zonas; una zona de rechazo y otra de aceptacin, de manera que segn como obtengamos el resultado, aceptaremos o rechazaremos la hiptesis.

Al aplicar un contraste de hiptesis, clasificamos los puntos del espacio muestral en dos regiones excluyentes y complementarias:
Regin de Rechazo o Regin Crtica: La formada por el conjunto de los valores del estadstico de contraste que nos llevan a rechazar la hiptesis nula H0, se llama regin crtica (los puntos que delimitan la regin crtica se llaman puntos crticos). Regin de Aceptacin o Regin de No Rechazo: Es la formada por el conjunto de los valores del estadstico de contraste que nos lleva a aceptar la hiptesis nula H0.

5.1.- Planteamiento de la hiptesis estadstica


Aquella hiptesis que se desea contrastar se llama hiptesis nula (Ho), por tanto, la que se acepta o rechaza como conclusin del contraste. La hiptesis nula suele ser una estrategia o medio del que se sirve el investigador para probar la alternativa. Suele ir acompaada por la hiptesis alternativa o hiptesis experimental, simbolizada por H1.

Apuntes de Estadstica II

57

La hiptesis alternativa es la que se verifica cuando no se verifica la hiptesis nula. El planteamiento de Ho permite elaborar un modelo Probabilstico a partir del cual podemos llegar a la decisin final. A su vez, al plantear una hiptesis, esta puede ser simple o compuesta. Una hiptesis es simple si se especifica exactamente el valor del parmetro. Una hiptesis es compuesta, si contiene dos ms valores del parmetro. La hiptesis nula (Ho) por ser ms concreta suele ser simple y la alternativa, compuesta. Es frecuente plantearlas como complementarias.

5.2.- Supuestos
Las suposiciones que podemos hacer dependiendo del tipo de contraste que necesitemos son: a) Supuestos acerca de las caractersticas de los datos que se van a manipular, como puede ser la independencia de la observaciones, nivel de medida utilizada, etc. b) Supuestos acerca de la forma de distribucin de partida: Normal, Binomial, etc. La violacin de los supuestos podr invalidar ms o menos el modelo probabilstico y llevarnos a decisiones errneas. Concierne al investigador conocer las consecuencias que se derivan de la violacin de tales supuestos sobre el modelo. Por este motivo, si se plantean los supuestos deben ser mnimos y no demasiado exigentes. Por ejemplo, se puede plantear de partida: Poblaciones de partida: normales. Muestras independientes. Observaciones de las muestras: independiente.

5.3.- Estadstico de Contraste


Estadstico de Contraste es, aquel estadstico (T) que utilizamos para tomar una decisin en un contraste de hiptesis. Este estadstico es una variable aleatoria, con una distribucin muestral determinada, que nos dar las probabilidades asociadas a un valor o un determinado intervalo de valores del estadstico de contraste. Este deber cumplir todas las caractersticas que se mencionaron anteriormente cuando se habl de los estadsticos.

5.4.- Reglas de decisin


Una regla de decisin es el criterio utilizado para decidir si aceptamos o rechazamos la hiptesis nula, a partir del espacio muestral de valores del estadstico de contraste y probabilidades asociadas.

Inferencia, estimacin y contraste de hiptesis

58

Este criterio consiste en dividir tal espacio en dos zonas mutuamente excluyentes y exhaustivas: la zona de rechazo o regin crtica y la zona de aceptacin. La zona de rechazo est constituida por aquellos valores del estadstico de contraste que se alejan mucho de Ho, por lo tanto es muy poco probable que ocurran si Ho es verdadera. Por ejemplo, a continuacin se pueden ver dos ejemplos de contrastes, uno unilateral y otro bilateral, aunque se pueden crear muchos ms. Un contraste de hiptesis unilateral es de la forma (hay ms formas): Ho: = o H1: >o Un contraste de hiptesis bilateral es de la forma: Ho: = o H1: o Decidimos que un contraste es unilateral o direccional, si para tomar la decisin de rechazar Ho nos servimos exclusivamente de los valores muy grandes o exclusivamente de los valores muy pequeos del estadstico de contraste.

Decidimos que un contraste es bilateral o no direccional, si utilizamos los valores muy grandes y muy pequeos de los posibles valores del estadstico de contraste.

Si la distribucin, bajo la H1, slo puede estar a la derecha ser ms potente si colocamos a la derecha toda la regin crtica.

Apuntes de Estadstica II

59

Si la distribucin, bajo la H1, puede estar a la derecha o la izquierda sera un test ms potente el que pone parte de la regin crtica a la derecha y parte a la izquierda. El valor se llama nivel de significacin o nivel de riesgo y representa a la probabilidad de que un nivel concreto del estadstico de contraste, caiga en la zona de rechazo o crtica, es decir, es el conjunto de valores del estadstico de contraste que nos lleva a la decisin de rechazar la hiptesis nula. El valor (1-) se llama nivel de confianza, es el conjunto de valores del estadstico de contraste que nos lleva a la decisin de aceptar la hiptesis nula. En los contrates unilaterales est concentrada en uno de los dos extremos de la distribucin, en una nica cola. En los contrastes bilaterales se reparte entre los dos extremos de la distribucin, en las dos colas. Los contrastes unilaterales suelen ser mejores que los contrates bilaterales. La eleccin de uno u otro, est condicionada al planteamiento de la hiptesis alternativa. Ejemplo: Si Ho 0.50 H1 > 0.50 Si Ho = 0.50 H1 0.50 Es unilateral. Es bilateral.

5.5.- Clculo del estadstico y toma de decisin


Antes de poder tomar una decisin se debe recopilar los datos con los que se van a trabajar, es decir, se obtienen los datos de una varias muestras y los estimadores del parmetro (proporcin, media, etc.) correspondiente, calculamos el valor concreto del estadstico de contraste y fijado el nivel de significacin con la zona crtica, si el valor de tal estadstico cae en la zona crtica, rechazamos las hiptesis nula y por tanto, aceptamos la hiptesis alternativa. En este caso debemos interpretar que no hay evidencia suficiente para decidir que es falsa. En caso contrario se aceptar la hiptesis nula.

5.6.- Errores en los contrates de hiptesis


Cuando se realiza un contraste de hiptesis, siempre debemos tener en cuenta que cuando aceptamos o rechazamos una hiptesis puede que estemos cometiendo un cierto error. Cuando Rechazamos Ho, significa que Ho es falsa y cuando aceptamos Ho, significa que Ho es verdadera. Por tanto, se pueden considerar, dos tipos de errores que se pueden cometer cuando se realiza un contraste: - Error tipo I ( ): Es el error que se comete en la decisin del contraste cuando se rechaza la hiptesis nula (Ho), siendo correcta (cierta). - Error tipo II (): Es el error que se comete en la decisin del contraste cuando se acepta la hiptesis nula (Ho), siendo falsa.

Inferencia, estimacin y contraste de hiptesis

60

En la siguiente tabla se puede ver de forma ms concreta:


Verdadera (1- ) Acertar Rechazar Falsa

Decisin correcta Error tipo I

Error tipo II (1-) Decisin Correcta

De aqu se pueden obtener las siguientes conclusiones que deben de tenerse en cuenta: El ERROR II es el ms grave, al que tambin se le conoce como potencia del contraste, y se representa con la letra .

es el valor de significacin, nos dice a partir de qu valor estamos


cometiendo un error tipo I.

As, las probabilidades asociadas a los tipos dos tipos de Error vienen dadas por las siguientes expresiones:
1.- Nivel de significacin o tamao del contraste ( ):

=P(error tipo I}=P{rechazar Ho / Ho cierta}


2.- Potencia del contraste ( ):

= P{rechazar Ho / Ho falsa}=1-P{ Aceptar Ho / Ho falsa}= 1-P{error tipo II}

5.7.- Potencia de un contrate


Se llama potencia de un contraste a la probabilidad de rechazar Ho, cuando es falsa. Su probabilidad es 1-. Ms estrictamente debera llamarse potencia de regin crtica. No es ms que la probabilidad de que sta detecte una Ho falsa dado un valor para H1. Los valores de y no tienen la misma importancia psicolgica. Es el investigador el que en cada caso deber saber que error tiene ms importancia para tratar de disminuirlo. Para disminuir el valor de es necesario aumentar el tamao de la muestra.

5.8.- Curvas de potencia de un contrate


Fijado un nivel de significacin ( ), una hiptesis nula y una hiptesis alternativa, tendremos una potencia para cada valor que tome la hiptesis alternativa (H1). La curva

Apuntes de Estadstica II

61

que se obtiene al relacionar los posibles valores de H1 con los correspondientes (1-), se llama curva de potencia o funcin de potencia. Cuanto mayor es el nivel de significacin (probabilidad Error Tipo I) mayor es la potencia.

5.9.- Efecto del tamao de la muestra en la potencia


Se trata de poner de manifiesto cmo, manteniendo constante , al aumentar el tamao de la muestra decrece el valor de , y por tanto, se incrementa la potencia, la capacidad del contraste para distinguir H0 y H1. Al igual que ocurra en los intervalos de confianza, el tamao de la muestra ser importante para determinar el error que se comete o cual es el tamao de la muestra necesario para mantener un determinado error mnimo.

5.10.- Nivel de significacin y nivel critico


Se puede definir el nivel de significacin () como la mxima probabilidad de rechazar la Ho cuando es cierta. El nivel de significacin lo elige el investigador antes de realizar el contrate, para que no influya en su decisin. Por lo tanto el nivel de significacin representa el riesgo mximo admisible al rechazar Ho. El nivel crtico se calcula despus de obtener el valor del estadstico de contraste y representa el riesgo mnimo con el que se rechaza Ho.

5.11.- Violacin de los supuestos en los contrastes de hiptesis


A continuacin, se detalla de forma esquemtica en que situaciones se deben utilizar otras distribuciones asociadas a la normal.
5.11.1.- Utilizacin de la distribucin T-Student, en el contraste de

a) Independencia: m.a.s. y poblacin pequea b) Normalidad: Si la muestra es grande no presenta serios problemas. Si la muestra es pequea los contrastes unilaterales aumentan el error. Por lo tanto, si la muestra es grande haremos un contraste unilateral, si utilizamos la distribucin t-student y no se puede asumir que la poblacin es normal.
5.11.2.- Utilizacin de la distribucin T-Student, en el contraste de 1 - 2

a) Independencia: Muy importante. b) Normalidad.

Inferencia, estimacin y contraste de hiptesis

62

c) Igualdad de varianzas.
5.11.3.- Utilizacin de la distribucin Chi-Cuadrado ( 2 ), en el contraste 2

El supuesto de normalidad lleva consigo un error, que no podemos corregir aumentando el tamao muestral.
5.11.4.- Utilizacin de la distribucin F-Snedecor en el contraste de 2 1/ 22

No se puede usar si las poblaciones no son normales o los tamaos de las muestras no son grandes. Tampoco debe utilizarse si la independencia no es segura.

5.12.- Propiedades deseables en los contrastes de hiptesis


El investigador debe seleccionar aquella prueba que le sirve para contrastar su hiptesis y procurar que se cumplan los supuestos que la sustentan, adems deben de reunir estas propiedades:
Carencia de Sesgo:

Un Contraste de Hiptesis es una prueba insesgada de Ho, si la probabilidad de rechazar Ho cuando es falsa, es igual o mayor que la probabilidad de rechazar Ho cuando es cierta. Es decir, si su potencia es mayor igual que su nivel de significacin.
Consistencia:

Una secuencia de contrastes es consistente frente a todas las alternativas Hi, si su funcin de potencia se aproxima a 1, a medida que n tiende al infinito. Se supone >0 y constante.

5.13.- El concepto de p-valor


Cuando se realiza un contraste de hiptesis sabemos que a partir del nivel de significacin delimitamos la zona de aceptacin y de rechazo. En ocasiones es muy interesante calcular el nivel de significacin a partir del cual la hiptesis nula, H0, se va a rechazar. Esta es la idea o concepto del p-valor, es decir,

p = P Z > z exp .
El p-valor puede considerarse como el valor lmite para que un contraste sea significativo, es decir, elegido un nivel de significacin , se rechazar H0 si p .

Apuntes de Estadstica II

63

5.14.- Contraste de hiptesis para la media con varianza conocida


Supongamos una poblacin Normal. Para realizar este contraste el estadstico mejor conocido es la media muestral, X N ( ,

).

Como ya se conoce su distribucin, el estadstico de contraste ser: x

/ n

N (0;1) .

Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es cierta, y se rechaza cuando: A)

H 0 : = 0 H1 : 0

RECHAZO H0 si

x 0 > z / n 2

Inferencia, estimacin y contraste de hiptesis

64

B)

H 0 : 0 H1 : > 0 H 0 : 0 H1 : < 0

RECHAZO H0 si

x 0 > z / n x 0 < z / n

C)

RECHAZO H0 si

En caso contrario se acepta la hiptesis nula.

5.15.- Contraste de hiptesis para la media con varianza desconocida y n>30


Supongamos una poblacin Normal. Para realizar este contraste el estadstico s mejor conocido es la media muestral, X N ( , ). n Como ya se conoce su distribucin, el estadstico de contraste ser: x s/ n N (0;1) .

Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es cierta, y se rechaza cuando: A)

H 0 : = 0 H1 : 0 H 0 : 0 H1 : > 0 H 0 : 0 H1 : < 0

RECHAZO H0 si

x 0 > z s/ n 2
x 0 > z s/ n

B)

RECHAZO H0 si

C)

RECHAZO H0 si

x 0 s/ n

< z

En caso contrario se acepta la hiptesis nula.

5.16.- Contraste de hiptesis para la media con varianza desconocida y n<30


Supongamos una poblacin Normal. Para realizar este contraste el estadstico . mejor conocido es la media muestral, X t n 1 Como ya se conoce su distribucin, el estadstico de contraste ser:

Apuntes de Estadstica II

65

x s/ n

n 1

Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es cierta, y se rechaza cuando:

A)

H 0 : = 0 H1 : 0 H 0 : 0 H1 : > 0 H 0 : 0 H1 : < 0

RECHAZO H0 si

x 0 >t n 1; s/ n 2
x 0 > t n 1; s/ n x 0 < t n1; s/ n

B)

RECHAZO H0 si

C)

RECHAZO H0 si

En caso contrario se acepta la hiptesis nula.

5.17.- Contraste de hiptesis para la proporcin


Supongamos una poblacin Normal. Para realizar este contraste el estadstico pq . mejor conocido es la proporcin muestral, P N p; n Como ya se conoce su distribucin, el estadstico de contraste ser:
p P0 p0 q0 n N (0;1) .

Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es cierta, y se rechaza cuando:

A)

H 0 : P = P0 H 1 : P P0

RECHAZO H0 si

p P0 p0 q0 n

> z
2

Inferencia, estimacin y contraste de hiptesis

66

B)

H 0 : P P0 H 1 : P > P0

RECHAZO H0 si

p P0 > z p0 q0 n p P0 < z p0 q0 n

C)

H 0 : P P0 H 1 : P < P0

RECHAZO H0 si

En caso contrario se acepta la hiptesis nula.

5.18.- Contraste de hiptesis para la varianza


Supongamos una poblacin Normal. Para realizar este contraste el estadstico mejor conocido es la varianza muestral. Como ya se conoce su distribucin, el estadstico de contraste ser:

(n 1)s 2

2 n 1 .

Como en este caso, la distribucin del estadstico no es simtrica, podremos hacer tres mismos tipos de contraste, pero en este caso habr que tener en cuenta esa no simetra. Se presupone que la hiptesis nula es cierta, y se rechaza cuando:

A)

H 0 : 2 = 02
2 H1 : 2 0

RECHAZO H0 si

(n 1)s 2 2 ; 2

2 0

B)

2 H 0 : 2 0

H1 : >
2

2 0

RECHAZO H0

si

(n 1)s 2

2 0

2 >

C)

2 H 0 : 2 0 2 H1 : 2 < 0

RECHAZO H0

si

(n 1)s 2 < 2 1 2
0

En caso contrario se acepta la hiptesis nula.

S-ar putea să vă placă și