Sunteți pe pagina 1din 14

Inferencia Estadstica

1. 2. 3. 4. . ". #. $. '. 1(. 11. 12. 13. 14. 1 . 1". Introduccin al muestreo. Parmetros y estimadores. Muestreo aleatorio. Base de la inferencia estadstica: muestreo aleatorio simple. Introduccin a las distri!uciones de muestreo. Base conceptual para muestrear distri!uciones. El teorema del lmite central. %elacin entre el tama&o de la muestra y el error estndar. Estimacin. Estimaciones puntuales. Estimaciones de inter)alo. *lculo de estimaciones de inter)alo de la media a partir de muestras +randes. ,eterminacin del tama&o de la muestra. Prue!as de -iptesis. Introduccin a la estadstica no param.trica. Prue!a de /olmo+oro).0mirno).

Introduccin al muestreo. Algunas veces es posible y prctico examinar a cada persona o elemento de la poblacin que deseamos describir. A esto lo llamamos enumeracin completa o censo. Utilizamos el muestreo cuando no es posible contar o medir todos los elementos de la poblacin. Los estadsticos usan la palabra po!lacin para referirse no slo a personas sino a todos los elementos que han sido elegidos para un estudio y emplean la palabra muestra para describir una porcin elegida de la poblacin. !ondiciones que debe reunir una muestra" #omogeneidad" debe ser extrada de la misma poblacin. $ndependencia" las observaciones no deben estar mutuamente condicionadas entre s. %epresentatividad" la muestra debe ser el me&or refle&o posible del con&unto del cual proviene. Estadsticas y parmetros. 'atemticamente podemos describir muestras y poblaciones al emplear mediciones como la media la mediana la oda y la desviacin estndar. !uando estos t(rminos describen las caractersticas de una poblacin se llaman parmetros. !uando describen las caractersticas de la muestra se llaman estadsticos. Una estadstica es una caracterstica de una muestra y un parmetro es una caracterstica de la poblacin. )e emplean letras latinas min*sculas para denotar estadsticas de muestra y letras griegas o latinas may*sculas para representar parmetros de poblacin. Po!lacin +efinicin !oleccin de elementos considerados Muestra ,arte o porcin de la poblacin seleccionada para su estudio -stadsticas .ama/o de la muestra" n 'edia de la muestra" x +esviacin estndar" s

!aractersticas ,armetros )mbolos .ama/o de la poblacin" 0 'edia de la poblacin" +esviacin estndar"

Parmetros y estimadores. Una poblacin queda caracterizada a trav(s de ciertos valores denominados parmetros que describen las principales propiedades del con&unto.

Un parmetro es un valor fi&o 1no aleatorio2 que caracteriza a una poblacin en particular. -n general una parmetro es una cantidad desconocida y rara vez se puede determinar exactamente su valor por la dificultad prctica de observar todas las unidades de una poblacin. ,or este motivo tratamos de estimar el valor de los parmetros desconocidos a trav(s del empleo de muestras. Las cantidades usadas para describir una muestra se denominan estimadores o estadsticos muestrales. Ahora bien es razonable pensar que si tomamos diferentes muestras de la misma poblacin y calculamos los diferentes estadsticos de cada una esos valores van a diferir de muestra a muestra. ,or lo tanto un estadstico no es un valor fi&o sino que presenta las siguientes caractersticas" ,uede tener varios resultados posibles. 0o se puede predecir de antemano su valor. -stas son las condiciones que definen a una variable aleatoria. Un estadstico entonces es una variable aleatoria funcin de las observaciones muestrales. A los estadsticos muestrales se los designa con las letras latinas 1x s 32 o letras griegas 4con sombrero4 1 5 532. )i un estadstico es una variable aleatoria entonces es posible determinar su distribucin de probabilidades y calcular sus principales propiedades. Muestreo aleatorio. Muestreo aleatorio simple. )elecciona muestras mediante m(todos que permiten que cada posible muestra tenga igual probabilidad de ser seleccionada y que cada elemento de la poblacin total tenga una oportunidad igual de ser incluido en la muestra. Una poblacin infinita es aquella en la que es tericamente imposible observar todos los elementos. Aunque muchas poblaciones parecen ser excesivamente grandes no existe una poblacin realmente infinita de ob&etos fsicos. !on recursos y tiempo ilimitados podramos enumerar cualquier poblacin finita. !omo cuestin prctica entonces utilizamos el t(rmino poblacin infinita cuando hablamos acerca de una poblacin que no podra enumerarse en un intervalo razonable. !mo hacer un muestreo aleatorio. La forma ms fcil de seleccionar una muestra de manera aleatoria es mediante el uso de n*meros aleatorios. -stos n*meros pueden generarse ya sea con una computadora programada para resolver n*meros o mediante una tabla de n*meros aleatorios 1tabla de dgitos aleatorios2. Muestreo sistemtico. -n el muestreo sistemtico los elementos son seleccionados de la poblacin dentro de un intervalo uniforme que se mide con respecto al tiempo al orden o al espacio. -l muestreo sistemtico difiere del aleatorio simple en que cada elemento tiene igual probabilidad de ser seleccionado pero cada muestra no tiene una posibilidad igual de ser seleccionada 1,or e&emplo" tomar cada elemento de 67 en 67" el 08 6 66 36...2 -n este tipo de muestreo existe el problema de introducir un error en el proceso de muestreo. A*n cuando este tipo de muestreo puede ser inapropiado cuando los elementos entran en un patrn secuencial este m(todo puede requerir menos tiempo y algunas veces tiene como resultado un costo menor que el m(todo aleatorio simple. Muestreo estratificado. +ividimos la poblacin en grupos relativamente homog(neos llamados estratos. +espu(s se utiliza uno de estos planteamientos" )eleccionamos aleatoriamente de cada estrato un n*mero especfico de elementos correspondientes a la fraccin de ese estrato en la poblacin como un todo. -xtraemos un n*mero igual de elementos de cada estrato y damos peso a los resultados de acuerdo con la porcin del estrato con respecto a la poblacin total. !on cualquiera de estos planteamientos el muestreo estratificado garantiza que cada elemento de la poblacin tenga posibilidad de ser seleccionado. -ste m(todo resulta apropiado cuando la poblacin ya est dividida en grupos de diferentes tama/os y deseamos tomar en cuenta este hecho 1por e&emplo" categoras profesionales de la poblacin2. La venta&a de las muestras estratificadas es que cuando se dise/an adecuadamente refle&an de manera ms precisa las caractersticas de la poblacin de la cual fueron elegidas. Muestreo de racimo.

+ividimos la poblacin en grupos o racimos y luego seleccionamos una muestra aleatoria de estos racimos. )uponemos que estos racimos individualmente son representativos de la poblacin como un todo 1,or e&emplo" las cuadras o barrios de un pueblo2. Un procedimiento de racimo bien dise/ado puede producir una muestra ms precisa a un costo considerablemente menor que el de un muestreo aleatorio simple. .anto en el muestreo estratificado como en el de racimo la poblacin se divide en grupos bien definidos. Usamos el muestreo estratificado cuando cada grupo tiene una peque/a variacin dentro de s mismo pero hay una amplia variacin dentro de los grupos. Usamos el muestreo de racimo en el caso opuesto cuando hay una variacin considerable dentro de cada grupo pero los grupos son esencialmente similares entre s. Base de la inferencia estadstica: muestreo aleatorio simple. -l muestreo sistemtico estratificado y el de racimo intentan aproximarse al muestreo aleatorio simple. .odos son m(todos que han sido desarrollados por su precisin economa o facilidad fsica. Los principios del muestreo aleatorio simple son la base de la inferencia estadstica el proceso de hacer inferencias acerca de poblaciones a partir de informacin contenida en muestras. SUGERENCIAS: -l uso de muestras en un estudio estadstico permite ahorrar mucho esfuerzo y dinero y generalmente proporciona informacin muy precisa sobre las principales propiedades de la poblacin. ,ara seleccionar una muestra usar t(cnicas que permitan garantizar que se cumplan las propiedades de homogeneidad independencia y representatividad. La t(cnica de muestreo utilizada depende de los ob&etivos del estudio de las caractersticas de la poblacin y de las disponibilidades de materiales. !ada dato cuesta dinero as que para elegir el tama/o de la muestra hay que compatibilizar la precisin requerida con la variabilidad de los datos y los recursos disponibles. Introduccin a las distri!uciones de muestreo. )i tomamos varias muestras de una poblacin las estadsticas que calcularamos para cada muestra no necesariamente seran iguales y lo ms probable es que variaran de una muestra a otra. Una distribucin de probabilidad de todas las medias posibles de las muestras es una distribucin de las medias de las muestras. Los estadsticos la conocen como distribucin de muestreo de la media. .ambi(n podramos tener una distribucin de muestreo de una porcin. )i trazamos una distribucin de probabilidad de porciones posibles de un evento en todas las muestras obtendramos una distribucin de las porciones de las muestras. A esto se lo conoce como distribucin de la porcin. ,escripcin de las distri!uciones de muestreo. !ualquier distribucin de probabilidad 1y por tanto cualquier distribucin de muestreo2 puede ser descripta parcialmente por su media y su desviacin estndar. *oncepto de error estndar. -n vez de decir 4la desviacin estndar de la distribucin de las medias de la muestra4 para describir una distribucin de medias de la muestra los estadsticos se refieren al error estndar de la media . +e manera similar la 4desviacin estndar de la distribucin de las proporciones de la muestra4 se abrevia como error estndar de la proporcin . -l t(rmino error estndar se utiliza porque da a entender un significado especfico. La variabilidad en las estadsticas de muestras proviene de un error de muestreo debido al azar9 es decir hay diferencias entre cada muestra y la poblacin y entre las diversas muestras debido *nicamente a los elementos que decidimos escoger para las muestras. La desviacin estndar de la distribucin de las medias de las muestras mide el grado hasta el que esperamos que varen las medias de las diferentes muestras debido a este error fortuito cometido en el proceso de muestreo. ,or tanto la desviacin estndar de la distribucin de una estadstica de muestra se conoce como el error estndar de la estadstica. -l error estndar indica no slo el tama/o del error de azar que se ha cometido sino tambi(n la probable precisin que obtendremos si utilizamos una estadstica de muestra para estimar un parmetro de poblacin. Una distribucin de medias de muestra que est menos extendida 1y que tiene un error estndar peque/o2 es un me&or estimador de la media de la poblacin que una

distribucin de medias de muestra que est ampliamente dispersa y que tiene un error estndar ms grande. 1so del error estndar. )iempre que usamos pruebas tenemos que tratar con el error estndar. -specficamente necesitamos cierta medicin de la precisin del instrumento de prueba generalmente representado por el error estndar. SUGERENCIA: -l conocimiento de la distribucin de muestreo permite a los estadsticos planear muestras de tal forma que los resultados sean significativos. +ebido a que resulta caro recabar y analizar muestras grandes los administradores siempre procuran obtener la muestra ms peque/a que proporcione un resultado confiable. Base conceptual para muestrear distri!uciones. -n la terminologa estadstica la distribucin de muestreo que obtendramos al tomar todas las muestras de un tama/o dado constituye una distribucin terica de muestreo . -n casi todos los casos los responsables de las decisiones slo toman una muestra de la poblacin calculan estadsticas para esa muestra y de esas estadsticas infieren algo sobre los parmetros de toda la poblacin. Muestreo de po!laciones normales. )i extraemos muestras de una poblacin normalmente distribuida y calculamos sus medias debido a que estamos promediando para obtener cada media de muestra se promediaran hacia aba&o valores muy grandes de la muestra y hacia arriba valores muy peque/os. -l razonamiento consistira en que nos estaramos extendiendo menos entre las medias de muestra que entre los elementos individuales de la poblacin original. -sto es lo mismo que afirmar que error estndar de la media o la desviacin estndar de la distribucin de muestreo sera menor que la desviacin estndar de los elementos individuales en la poblacin. -l error estndar de la media obtenido para situaciones en las que la poblacin es infinita es" x : ;< n ,ara convertir cualquier variable aleatoria normal en una variable aleatoria normal estndar debemos sustraer la media de la variable que se est estandarizando y dividir el resultado entre el error estndar 1la desviacin estndar de dicha variable2. -n este caso particular"

Muestreo de po!laciones no normales. !uando una poblacin est distribuida normalmente la distribucin de muestreo de la media tambi(n es normal. $ncluso en el caso en el que una poblacin no est normalmente distribuida x la media de la distribucin de muestreo sigue siendo igual a la media de la poblacin . -s decir la distribucin de muestreo de la media se acerca a la normalidad sin importar la forma de la distribucin de la poblacin. El teorema del lmite central. La media de la distribucin de muestreo de la media ser igual a la media de la poblacin. Al incrementarse el tama/o de la muestra la distribucin de muestreo de la media se acercar a la normalidad sin importar la forma de la distribucin de la poblacin. -sta relacin entre la forma de la distribucin de la poblacin y la forma de la distribucin de muestreo se denomina teorema del lmite central que es tal vez el ms importante de toda la inferencia estadstica. 0os asegura que la distribucin de muestreo de la media se aproxima a la normal al incrementarse el tama/o de la muestra.

#ay situaciones tericas en las que el teorema del lmite central no se cumple pero casi nunca se encuentran en la toma de decisiones prctica. Una muestra no tiene que ser muy grande para que la distribucin de muestreo de la media se acerque a la normal. Los estadsticos utilizan la distribucin normal como una aproximacin a la distribucin de muestreo siempre que el tama/o de la muestra sea al menos de =7 pero la distribucin de muestreo de la media puede ser casi normal con muestras incluso de la mitad de ese tama/o. La importancia del teorema del lmite central es que nos permite usar estadsticas de muestra para hacer inferencias con respecto a los parmetros de poblacin sin saber nada sobre la forma de la distribucin de frecuencias de esa poblacin ms que lo que podamos obtener de la muestra. SUGERENCIA: -l teorema del lmite central nos permite utilizar las propiedades de la distribucin normal en muchos casos en los que los datos subyacentes no estn normalmente distribuidos. -l hecho de que la distribucin de muestreo sea aproximadamente normal es la base de una amplia variedad de pruebas estadsticas diferentes. %elacin entre el tama&o de la muestra y el error estndar. -l error estndar es una medicin de la dispersin de las medias de muestras alrededor de la media de la poblacin. )i la dispersin disminuye 1si x se hace ms peque/a2 entonces los valores tomados por la media de la muestra tienden a agruparse ms cercanamente alrededor de . > a la inversa si la dispersin se incrementa 1si x se agranda2 los valores tomados por la media de la muestra tienden a agruparse menos cercanamente alrededor de . Al disminuir el error estndar el valor de cualquier media de muestra probablemente se acercar al valor de la media de la poblacin. Los estadsticos describen este fenmeno diciendo" al disminuir el error estndar se incrementa la precisin con que se puede usar la media de muestra para estimar la media de poblacin. +ebido al hecho de que x vara inversamente con la raz cuadrada de n hay una utilidad decreciente en el muestreo. -s cierto que al muestrear ms elementos disminuye el error estndar pero este beneficio puede no valer el costo. -l aumento de precisin puede no valer el costo del muestreo adicional. )ea ? una variable aleatoria con distribucin normal con parmetros 3. )i sacamos muestras de tama/o n y calculamos la media aritm(tica se demuestra que ba&o ciertas condiciones ? tambi(n es una variable aleatoria con distribucin normal con parmetros 3;n. -s decir" )i ? @ 0 1 32 entonces ? @ 0 1 3;n2 Las dos distribuciones tienen la misma media pero la dispersin de la media aritm(tica es menor tanto ms peque/a cuando mayor sea el tama/o de la muestra. !omo en un proceso de inferencia es un parmetro desconocido al extraer una muestra en particular y calcular x no podemos determinar exactamente qu( tan cerca estuvo esa estimacin del valor verdadero del parmetro. +e lo *nico que podemos estar seguros es que al aumentar el tama/o de la muestra la distribucin de la media aritm(tica tiende a concentrarse ms y ms alrededor de la media poblacional y por tanto las estimaciones van a estar ms prximas al valor del parmetro 1desconocido2. Lo ms relevante de la media aritm(tica es que a*n cuando la variable en estudio no tenga distribucin normal o su distribucin sea desconocida si el n*mero de elementos de la muestra es suficientemente grande por aplicacin del .eorema del Lmite !entral la media aritm(tica igualmente va a tener aproximadamente distribucin normal. ,or *ltimo es interesante remarcar la idea de que la media aritm(tica es conceptualmente una variable aleatoria hasta el instante previo a calcular efectivamente su valor. +espu(s de efectuar ese clculo tenemos un valor fi&o 1no aleatorio2 y por lo tanto de&a de tener sentido hablar de la 4probabilidad de la media aritm(tica4. -l clculo de probabilidades con la media aritm(tica tiene entonces validez en t(rminos tericos es decir representa 4lo que se espera4 que ocurra con dicha variable antes de tomar una muestra y calcular efectivamente su valor. El multiplicador de la po!lacin finita. ,ara calcular el error estndar de la media utilizamos la ecuacin" x : ;< n esta ecuacin est dise/ada para situaciones en las que la poblacin es infinita o en las que tomamos muestras de una poblacin infinita con reemplazo.

La frmula dise/ada para encontrar el error estndar de la media cuando la poblacin es finita y el muestreo se hace sin reemplazo es" x : ;< n x < 10 @ n2 ; 10 @ 62 donde" 0 : tama/o de la poblacin n : tama/o de la muestra -ste nuevo factor que aparece en la ecuacin y se multiplica al error estndar original se conoce como multiplicador de la poblacin finita. !uando muestreamos una peque/a fraccin de la poblacin entera 1es decir cuando el tama/o de la poblacin 0 es muy grande en relacin con el tama/o de la muestra n2 el multiplicador de la poblacin finita toma un valor cercano a 6. Los estadsticos se refieren a la fraccin n;0 como la fraccin de muestreo porque es la fraccin de la poblacin 0 contenida en la muestra. !uando la fraccin de muestreo es peque/a el error estndar de la media para poblaciones finitas es tan cercano a la media para poblaciones infinitas que bien podramos utilizar la misma frmula para ambas desviaciones. La regla generalmente aceptada es" si la fraccin de muestreo es menor a 7 7A no se necesita usar el multiplicar para la poblacin finita. !uando utilizamos la ecuacin para poblaciones infinitas es constante y por tanto la medida de la precisin de muestreo x depende solamente del tama/o de la muestra n y no de la fraccin de poblacin muestreada. -s decir para hacer x ms peque/a slo es necesario agrandar n. -n consecuencia resulta que el tama/o absoluto de la muestra es el que determina la precisin del muestreo no la fraccin de la poblacin muestreada. SUGERENCIAS: !uando desee calcular probabilidades con la media aritm(tica no olvide que al calcular la variable estandarizada debe dividir por el desvo o error estndar de la media. Los resultados sern inexactos si omite este punto. ,ara verificar el funcionamiento de un proceso medir el rendimiento de un m(todo etc. necesitamos conocer su valor medio. )i debemos estimar ese valor a trav(s de la muestra recuerde que la precisin de la estimacin aumenta con el incremento del tama/o muestral. -vite realizar inferencias utilizando una sola observacin. La aplicacin del .eorema del Lmite !entral hace de la media aritm(tica una herramienta *til a*n en aquellos casos en que la distribucin de la variable en estudio no es conocida o no es normal. La disminucin del error estndar no es directamente proporcional al tama/o de la muestra as que es conveniente compatibilizar precisin con costos. *onceptos. *enso: medicin o examen de cada elemento de la poblacin. ,istri!ucin de muestreo de la media: una distribucin de probabilidad de todas las medias posibles de muestras de un tama/o dado n de una poblacin. ,istri!ucin de muestreo de una estadstica: para una poblacin dada distribucin de probabilidad de todos los valores posibles que puede tomar una estadstica dado un tama/o de la muestra. Error de muestreo: error o variacin entre estadsticas de muestra debido al azar es decir diferencias entre cada muestra y la poblacin y entre varias muestras que se deben *nicamente a los elementos que elegimos para la muestra. Error estndar: la desviacin estndar de la distribucin de muestreo de una estadstica. Error estndar de la media: la desviacin estndar de la distribucin de muestreo de la media una medida del grado en que se espera que varen las medias de las diferentes muestras de la media de la poblacin debido al error aleatorio en el proceso de muestreo. Estadsticas: mediciones que describen las caractersticas de una muestra. Estimador o estadstico: cantidad que caracteriza a una muestra y que sirve para aproximar el valor de un parmetro desconocido. Bariable aleatoria funcin de las observaciones muestrales a trav(s de la cual tratamos de inferir el valor de un parmetro poblacional. Estimacin: valor particular de un estimador que caracteriza a una muestra especfica.

Estratos: grupos dentro de una poblacin formados de tal manera que cada grupo es relativamente homog(neo aunque existe una variabilidad ms amplia entre los diferentes grupos. 2raccin de muestreo: la fraccin o porcin de la poblacin contenida en una muestra. Inferencia estadstica: proceso de anlisis que consiste en inferir las propiedades de una poblacin en base a la caracterizacin de la muestra. Muestra: subcon&unto de la poblacin seleccionado mediante alg*n criterio particular. ,orcin de elementos de una poblacin elegidos para su examen o medicin directa. Muestreo no aleatorio: conformacin de la muestra en base al conocimiento o experiencia del observador. Muestreo aleatorio: conformacin de la muestra usando m(todos al azar. Muestreo aleatorio simple: m(todos de seleccin de muestras que permiten a cada muestra posible una probabilidad igual de ser elegida y a cada elemento de la poblacin completa una oportunidad igual de ser incluido en la muestra. Muestreo con reempla3o: procedimiento de muestreo en el que los elementos se regresan a la poblacin despu(s de ser elegidos de tal forma que algunos elementos de la poblacin pueden aparecer en la muestra ms de una vez. Muestreo de 4uicio: m(todo para seleccionar una muestra de una poblacin en el que se usa el conocimiento o la experiencia personal para identificar aquellos elementos de la poblacin que deben incluirse en la muestra. Muestreo de pro!a!ilidad o aleatorio: m(todo para seleccionar una muestra de una poblacin en el que todos los elementos de la poblacin tienen igual oportunidad de ser elegidos en la muestra. Muestreo estratificado: la poblacin se divide en estratos y luego se muestra en forma proporcional en cada estrato. '(todo de muestreo aleatorio en el que la poblacin se divide en grupos homog(neos o estratos y los elementos dentro de cada estrato se seleccionan al azar de acuerdo con una de dos reglas" 62 un n*mero especfico de elementos se extrae de cada estrato correspondiente a la porcin de ese estrato en la poblacin9 32 igual n*mero de elementos se extraen de cada estrato y los resultados son valorados de acuerdo con la porcin del estrato de la poblacin total. Muestreo de racimo 5o por con+lomerados6: la poblacin se divide en racimos y luego se elige aleatoriamente una muestra de racimos. '(todo de muestreo aleatorio en el que la poblacin se divide en grupos o racimos de elementos y luego se selecciona una muestra aleatoria de estos racimos. Muestreo sin reempla3o: procedimiento de muestreo en el que los elementos no se regresan a la poblacin despu(s de ser elegidos de tal forma que ning*n elemento de la poblacin puede aparecer en la muestra ms de una vez. Muestreo sistemtico: los elementos de la muestra son elegidos a intervalos fi&os. '(todo de muestreo aleatorio usado en estadstica en el que los elementos que se muestrearn se seleccionan de la poblacin en un intervalo uniforme que se mide con respecto al tiempo al orden o al espacio. Multiplicador de la po!lacin finita: factor que se utiliza para corregir el error estndar de la media en el estudio de una poblacin de tama/o finito peque/o con respecto al tama/o de la muestra. Parmetro: valor fi&o que caracteriza a una poblacin. Balores que describen las caractersticas de una poblacin. Po!lacin: con&unto de elementos que son ob&eto de un estudio estadstico. Po!lacin finita: poblacin que tiene un tama/o establecido o limitado. Precisin: el grado de exactitud con el que la media de la muestra puede estimar la media de la poblacin seg*n revela el error estndar de la media. %acimos: grupos dentro de una poblacin que son esencialmente similares entre s aunque los grupos mismos tengan amplia variacin interna. 7eorema del lmite central: resultado que asegura que la distribucin de muestreo de la media se acerca a la normalidad cuando el tama/o de la muestra se incrementa sin importar la forma de la distribucin de la poblacin de la que se selecciona la muestra. E07IM8*I9:.

-l material sobre teora de la probabilidad constituye la base de la inferencia estadstica rama de la estadstica que tiene que ver con el uso de los conceptos de la probabilidad para tratar con la toma de decisiones en condiciones de incertidumbre. La inferencia estadstica est basada en la estimacin y en la prueba de hiptesis. 7ipos de estimacin. ,odemos hacer dos tipos de estimaciones concernientes a una poblacin" Una estimacin puntual" es slo u n*mero que se utiliza para estimar un parmetro de poblacin desconocido. Una estimacin puntual a menudo resulta insuficiente debido a que slo tiene dos opciones" es correcta o est equivocada. Una estimacin puntual es mucho ms *til si viene acompa/ada por una estimacin del error que podra estar implicado. Una estimacin de intervalo" es un intervalo de valores que se utiliza para estimar un parmetro de poblacin. -sta estimacin indica el error de dos maneras" por la extensin del intervalo y por la probabilidad de obtener el verdadero parmetro de la poblacin que se encuentra dentro del intervalo. Estimador y estimaciones. Un estimador es una estadstica de muestra utilizada para estimar un parmetro de poblacin. La media de la muestra puede ser un estimador de la media de la poblacin y la porcin de la muestra se puede utilizar como estimador de la porcin de la poblacin. .ambi(n podemos utilizar el alcance de la muestra como un estimador del alcance de la poblacin. !uando hemos observado un valor num(rico especfico de nuestro estimador nos referimos a ese valor como una estimacin. Una estimacin es un valor especfico observado de una estadstica. #acemos una estimacin si tomamos una muestra y calculamos el valor que toma nuestro estimador en esa muestra. *riterios para seleccionar un !uen estimador. 6. Imparcialidad. )e refiere al hecho de que una media de muestra es un estimador no sesgado de una media de poblacin porque la media de distribucin de muestreo de las medias de muestras tomadas de la misma poblacin es igual a la media de la poblacin misma. ,odemos decir que una estadstica es un estimador imparcial 1o no sesgado2 si en promedio tiende a tomar valores que estn por encima del parmetro de la poblacin y la misma extensin con la que tiende a asumir valores por deba&o del parmetro de poblacin que se est estimando. 3. Eficiencia. )e refiere al tama/o del error estndar de la estadstica. )i comparamos dos estadsticas de una muestra del mismo tama/o y tratamos de decidir cul de ellas es un estimador ms eficiente escogeramos la estadstica que tuviera el menor error estndar o la menor desviacin estndar de la distribucin de muestreo. .iene sentido pensar que un estimador con un error estndar menor 1con menos desviacin2 tendr una mayor oportunidad de producir una estimacin ms cercana al parmetro de poblacin que se est considerando. =. *o-erencia. Una estadstica es un estimador coherente de un parmetro de poblacin si al aumentar el tama/o de la muestra se tiene casi la certeza de que el valor de la estadstica se aproxima bastante al valor del parmetro de la poblacin. )i un estimador es coherente se vuelve ms confiable si tenemos tama/os de muestras ms grandes. C. 0uficiencia. Un estimador es suficiente si utiliza una cantidad de la informacin contenida en la muestra que ning*n otro estimador podra extraer informacin adicional de la muestra sobre el parmetro de la poblacin. Una estadstica de muestra dada no siempre es el me&or estimador de su parmetro de poblacin correspondiente. !onsidere una poblacin distribuida sim(tricamente en la que los valores de la mediana y de la media coinciden. -n este caso la media de la muestra sera un estimador imparcial de la mediana de la poblacin debido a que asumira valores que en promedio seran iguales a la mediana de la poblacin. .ambi(n la media de la muestra sera un estimador consistente de la mediana de la poblacin puesto que conforme aumenta el tama/o de la muestra el valor de la media de la muestra tender a acercarse bastante a la mediana de la poblacin. > la media de la muestra sera un estimador ms eficiente de la mediana de la poblacin que la mediana misma ya que en muestras grandes la media de la muestra tiene una desviacin estndar menor que la mediana de la muestra. Al mismo tiempo la mediana de la muestra de una distribucin distribuida sim(tricamente sera un estimador imparcial y consistente de la media de la poblacin pero no el ms eficiente estimador porque en muestras grandes su error estndar es mayor que el de la media de la muestra.

Estimaciones puntuales. La media de la muestra es el me&or estimador de la media de la poblacin. -s imparcial coherente el estimador ms eficiente y siempre y cuando la muestra sea la suficientemente grande su distribucin de muestreo puede ser aproximada por la distribucin normal. )i conocemos la distribucin de muestreo de la media podemos llegar a conclusiones con respecto a cualquier estimacin que podamos hacer a partir de la informacin de muestreo. Estimacin puntual de la )arian3a y de la des)iacin estndar de la po!lacin. -l estimador utilizado con ms frecuencia para hacer la estimacin de la desviacin estndar de la poblacin es la desviacin estndar de la muestra" s3 : < 1x @ x23 ; 1n @ 62 Al utilizar un divisor n @ 6 nos da un estimador imparcial de 3. Estimacin puntual de la porcin de la po!lacin. La porcin de unidades de una poblacin dada que posee una caracterstica particular se representa mediante el smbolo p. )i conocemos la porcin de unidades de una muestra que tiene la misma caracterstica podemos utilizar esa p como estimador de p. )e puede mostrar que p tiene todas las caractersticas deseables" es imparcial 1no sesgado2 coherente eficiente y suficiente. SUGERENCIA: $ncluso cuando estamos utilizando el me&or estimador de un parmetro de poblacin aceptamos que puede estar implicado algo de error. Afirmamos que la estimacin puntual y la medida de la varianza proporcionan informacin *til para las decisiones. Estimaciones de inter)alo. -l propsito de tomar muestras es para conocer ms acerca de una poblacin. ,odemos calcular esa informacin a partir de las muestras como estimaciones puntuales o como estimaciones de intervalo. Una estimacin de intervalo describe un intervalo de valores dentro del cual es posible que est( un parmetro de poblacin. )i seleccionamos y representamos grficamente un gran n*mero de medias de muestras de una poblacin la distribucin de tales medias se aproximar a la curva normal. Adems la media de las medias de muestra ser la misma media de la poblacin. Pro!a!ilidad de ;ue el )erdadero parmetro de la po!lacin est. dentro de la estimacin de inter)alo. -n lo que concierne a cualquier intervalo particular (ste contiene a la media de la poblacin o no la contiene pues la media de la poblacin es un parmetro fi&o y no vara. !uando las organizaciones informan la precisin de encuestas de opinin como 4estos resultados son precisos en ms menos tres puntos4 por lo general no establecen el nivel de confianza que estn utilizando para hacer la estimacin de intervalo. Una afirmacin ms completa tendra la forma. 4existe un DAE de probabilidad de que la verdadera opinin de la poblacin caiga dentro del intervalo comprendido entre ..... y ........4 Estimaciones de inter)alo e inter)alos de confian3a. La probabilidad que asociamos con una estimacin de intervalo se conoce como nivel de confianza. -sta probabilidad indica qu( tanta confianza tenemos de que la estimacin de intervalo incluya al parmetro de poblacin. Una probabilidad ms alta indica ms confianza. -l intervalo de confianza es el alcance de la estimacin que estamos haciendo. -xpresaremos el intervalo de confianza en t(rminos de errores estndar ms que con valores num(ricos. Los lmites de confianza son los lmites superior e inferior del intervalo de confianza %elacin entre el ni)el de confian3a e inter)alo de confian3a. ,odra pensarse que deberamos utilizar un nivel alto de confianza en todos los problemas sobre estimaciones. -n la prctica sin embargo altos niveles de confianza producen intervalos de confianza grandes y (stos no son precisos dan estimaciones bastante imprecisas. 1so del muestreo y de la estimacin de inter)alos de confian3a. A menudo resulta difcil o caro tomar ms de una muestra de una poblacin. Fasados en solamente una muestra estimamos el parmetro de poblacin. -l intervalo de confianza quiere decir que si seleccionamos muchas muestras aleatorias del mismo tama/o y si calculamos un intervalo de confianza para cada una de las muestras tendremos un

porcenta&e de confianza determino de que en todos los casos la media de la poblacin caer dentro del intervalo. ,or otro lado existe un cierto equilibrio entre la certidumbre de la estimacin y el ancho de un intervalo de confianza. *lculo de estimaciones de inter)alo de la media a partir de muestras +randes. )e calcula el error estndar de la media para una poblacin infinita" x : ;< n ,osteriormente se establecen los lmites de confianza superior e inferior considerando el porcenta&e de confianza requerido. *uando no se conoce la des)iacin estndar. !uando no se conoce la desviacin estndar de la poblacin utilizamos la desviacin estndar de la muestra para estimar la desviacin estndar de la poblacin" s3 : < < G1x @ x23 ; 1n @ 62H La frmula para derivar el error estndar de la media de poblaciones finitas es" x : I ;< nJ x < 10 @ n2 ; 0 @ 62 A partir de esto podemos calcular el error estndar de la media mediante la desviacin estndar de la poblacin" Kx : I Kx;< nJ x < 10 @ n2 ; 0 @ 62 SUGERENCIA: !uando tenemos muestras grandes utilizamos el .eorema del Lmite !entral nuestro conocimiento de la curva normal y nuestra habilidad para hacer correcciones para poblaciones finitas. ,eterminacin del tama&o de la muestra. )iempre que tomamos una muestra perdemos algo de informacin *til con respecto a la poblacin. -l error de muestre se puede controlar si seleccionamos una muestra cuyo tama/o sea el adecuado. -n general cuanta ms precisin se quiera ms grande ser el tama/o de la muestra necesaria. ,ara calcular el tama/o de muestra podemos utilizar la frmula del error estndar de la media" x : ;< n )i no conocemos la desviacin estndar de la poblacin podemos utilizar el alcance de la poblacin para obtener una estimacin burda pero mane&able de la desviacin estndar. )abemos que ms menos tres desviaciones estndar incluyen DD LE del rea total ba&o la curva normal esto es ms tres desviaciones estndar y menos tres desviaciones estndar de la media incluyen casi toda el rea de la distribucin. SUGERENCIAS: Un estimador es una variable aleatoria y por lo tanto es posible asociarle probabilidades lo que resulta de suma utilidad como herramienta auxiliar para la toma de decisiones ba&o condiciones de incertidumbre. Una estimacin en cambio es un valor particular del estimador calculado en base a una muestra dada. ,or tanto constituye un valor fi&o 1no aleatorio2 que caracteriza a esa muestra en particular pero que se usa para inferir el valor de un parmetro desconocido. -ntre un estimador puntual y uno por intervalos es preferible usar este *ltimo porque tiene asociado una probabilidad que contempla el error que se puede cometer en la aproximacin. *onceptos. Estimacin: valor especfico de un estimador calculado en base a una muestra dada. Estimacin de inter)alo: intervalo de valores utilizado para estimar un parmetro de poblacin desconocido. Estimacin de parmetros: Aproximacin del valor de parmetros poblacionales desconocidos mediante el empleo de estadsticos muestrales. Estimacin puntual: un solo n*mero que se utiliza para estimar un parmetro de poblacin desconocido. Estimador: estadstica de muestra utilizada para estimar un parmetro de poblacin. !onceptualmente es una variable aleatoria. Estimador co-erente: estimador que produce valores que se acercan ms al parmetro de la poblacin conforme aumenta el tama/o de la muestra.

10

Estimador eficiente: estimador con un menor error estndar que alg*n otro estimador del parmetro de la poblacin esto es cuanto ms peque/o sea el error estndar de un estimador ms eficiente ser ese estimador. Estimador imparcial: estimador de un parmetro de poblacin que en promedio asume valores por encima del parmetro de la poblacin con la misma frecuencia y al mismo grado con que tiende a tomarlos por deba&o del parmetro de la poblacin. Estimador suficiente: estimador que utiliza toda la informacin disponible en los datos correspondientes a un parmetro. Inter)alo de confian3a: intervalo de valores que tiene designada una probabilidad de que incluya el valor real del parmetro de la poblacin. <mites de confian3a: lmites inferior y superior de un intervalo de confianza. :i)el de confian3a: probabilidad que los estadsticos asocian con una estimacin de intervalo de un parmetro de poblacin (sta indica qu( tan seguros estn de que la estimacin de intervalo incluir el parmetro de la poblacin. ,robabilidad designada de antemano de que un intervalo de confianza incluya al valor del parmetro desconocido. Propiedades de un !uen estimador: caractersticas deseables de un estimador para lograr la me&or aproximacin posible de un parmetro poblacional. P%1EB80 ,E =IP97E0I0. Una hiptesis es una afirmacin acerca de algo. -n estadstica puede ser una suposicin acerca del valor de un parmetro desconocido. ,asos en la prueba de hiptesis" 6. +efinir la hiptesis nula" suponer una hiptesis acerca de una poblacin. 3. Mormular una hiptesis alternativa" es una contra@hiptesis. =. +efinir un criterio de decisin para rechazar o no la hiptesis nula. C. %ecabar datos de la muestra. A. !alcular una estadstica de muestra. N. Utilizar la estadstica de muestra para evaluar la hiptesis. Oeneralmente se habla de 4no rechazar4 una hiptesis en lugar de 4aceptar4 ya que las pruebas no son concluyentes. Introduccin. La prueba de hiptesis comienza con una suposicin llamada hiptesis que hacemos con respecto a un parmetro de poblacin. +espu(s recolectamos datos de muestra producimos estadsticas de muestra y usamos esta informacin para decidir qu( tan probable es que sea correcto nuestro parmetro de poblacin acerca del cual hicimos la hiptesis. +ebemos establecer el valor supuesto o hipotetizado del parmetro de poblacin antes de comenzar a tomar la muestra. La suposicin que deseamos probar se conoce como hiptesis nula y se simboliza #7. )iempre que rechazamos la hiptesis la conclusin que s aceptamos se llama hiptesis alternativa y se simboliza #6. Interpretacin del ni)el de si+nificancia. -l propsito de la prueba de hiptesis no es cuestionar el valor calculado de la estadstica de muestra sino hacer un &uicio respecto a la diferencia entre esa estadstica de muestra y un parmetro de poblacin hipotetizado. -l siguiente paso despu(s de establecer la hiptesis nula alternativa consiste en decidir qu( criterio utilizar para decidir si aceptar o rechazar la hiptesis nula. )i suponemos que la hiptesis es correcta entonces el nivel de significancia indicar el porcenta&e de medias de muestra que est fuera de ciertos lmites. )iempre que afirmemos que aceptamos la hiptesis nula en realidad lo que queremos decir es que no hay suficiente evidencia estadstica para rechazarla. -l empleo del t(rmino aceptar en lugar de rechazar se ha vuelto de uso com*n. )ignifica simplemente que cuando los datos de la muestra n hacen que rechacemos una hiptesis nula nos comportamos como si fuera cierta. 0eleccin del ni)el de si+nificancia. 0uestra eleccin del estndar mnimo para una probabilidad aceptable o el nivel de significancia es tambi(n el riesgo que asumimos al rechazar una hiptesis nula cuando es cierta. 'ientras ms alto sea el nivel de significancia que utilizamos para probar una hiptesis mayor ser la probabilidad de rechazar una hiptesis nula cuando es cierta.

11

Errores tipo I y tipo II. -l rechazo de una hiptesis nula cuando es cierta se denomina error de tipo $ y su probabilidad 1que es tambi(n el nivel de significancia2 se simboliza como . -l hecho de aceptar una hiptesis nula cuando es falsa se denomina error de tipo $$ y su probabilidad se simboliza como . La probabilidad de cometer un tipo de error puede reducirse slo si deseamos incrementar la probabilidad de cometer el otro tipo de error. !on el propsito de obtener una ba&a tendremos que tolerar una alta. Los responsables de la toma de decisiones deciden el nivel de significancia adecuado al examinar los costos o desventa&as vinculadas con ambos tipos de errores. Prue!as de -iptesis de dos e>tremos y de un e>tremo. Una prueba de dos extremos de una hiptesis rechazar la hiptesis nula si la media de muestra es significativamente mayor o menor que la media de la poblacin hipotetizada. -xisten dos regiones de rechazo. #ay situaciones en las que no es apropiada una prueba de dos extremos por lo que debemos usar una prueba de un extremo que pueden ser de extremo izquierdo 1o inferior2 o extremo derecho 1o superior2. La *nica forma de probar una hiptesis nula es conociendo el parmetro de poblacin y eso no es posible al tomar una muestra. ,or consiguiente aceptamos la hiptesis nula y nos comportamos como si fuera cierta simplemente porque no podemos encontrar evidencia para rechazarla. Medicin de la potencia de una prue!a de -iptesis. $dealmente tanto como 1las probabilidades de los errores tipo $ y $$ deben ser peque/as. Una vez que decidimos el nivel de significancia no hay nada que podamos hacer con respecto a . !uando la hiptesis nula es falsa 1la media de la poblacin cierta2 no es igual a la media hipotetizada. ,uesto que rechazar una hiptesis nula cuando es falsa es exactamente lo que debe hacer una buena prueba un valor alto de 6 @ significa que la prueba est traba&ando bastante bien 1est rechazando la hiptesis nula cuando es falsa. ,uesto que 6 @ es la medida de qu( tan bien traba&a la prueba se la conoce como la potencia de la prueba. )i representamos grficamente los valores 6 @ por cada valor de para el que la hiptesis alternativa es cierta la curva resultante se conoce como curva de potencia. SUGERENCIAS: !onviene plantear la hiptesis nula siempre por la igualdad. Adapte la contrahiptesis de acuerdo con el ob&etivo del problema. Mormule la hiptesis en base a los ob&etivos del estudio pero siempre antes de extraer la muestra y calcular el estimador puntual del parmetro desconocido para no verse influenciado por este resultado. .enga en cuenta que si bien la hiptesis nula es la que se pone ba&o prueba eso no significa que deba ser siempre la suposicin que el experimentador desea que se compruebe. !omo en todo proceso de inferencia existe alg*n grado de sub&etividad en la realizacin de una prueba particularmente en la eleccin del nivel de significancia y del tama/o de la muestra. .rate de que la eleccin de estos valores responda a un anlisis cuidadoso del problema en cuestin. Una vez fi&adas las condiciones de la prueba el resultado de la misma es totalmente ob&etivo. ,ara fi&ar el nivel de significancia de la prueba hay que tener en cuenta que cuando la probabilidad del error tipo $ aumenta la del error tipo $$ disminuye. La forma de minimizar el error tipo $$ independientemente del nivel de significancia es aumentando el tama/o de la muestra. !omo las probabilidades de los errores tipo $ y $$ estn relacionadas entre Ksi pero el experimentador puede fi&ar la primera antes de elegir el nivel de significancia hay que ver cul de los dos tipos de errores resulta ms crtico. Conceptos: 8lfa: probabilidad de cometer un error de tipo $. Beta: probabilidad de cometer un error de tipo $$. *ur)a de potencia: grfica de los valores de la potencia de una prueba por cada valor de u otro parmetro de poblacin para el que la hiptesis alternativa es cierta. Error de tipo I: rechazo de una hiptesis nula cuando es cierta. Error de tipo II: aceptacin de una hiptesis nula cuando es falsa. Escala estandari3ada: medicin en desviaciones estndar a partir de la media de la variable.

12

Escala sin procesar: medicin en las unidades originales de la variable. =iptesis: suposicin o especulacin que hacemos con respecto a un parmetro de poblacin. =iptesis alternati)a: conclusin que aceptamos cuando los datos no respaldan la hiptesis nula. =iptesis estadstica: afirmacin acerca del valor de un parmetro desconocido o sobre la distribucin de una variable. =iptesis nula: hiptesis o suposicin con respecto a un parmetro de poblacin que deseamos probar. :i)el de si+nificancia: valor que indica el porcenta&e de valores de muestra que estn fuera de ciertos lmites suponiendo que la hiptesis nula es correcta es decir se trata de la probabilidad de rechazar la hiptesis nula cuando es cierta. Potencia de prue!a de -iptesis: probabilidad de rechazar la hiptesis nula cuando es falsa es decir una medida de qu( tan bien funciona la prueba de hiptesis. Prue!a de -iptesis: experimento que pone ba&o prueba una hiptesis estadstica para decidir si es verdadera o falsa. Prue!a de dos e>tremos: prueba de hiptesis en la que la hiptesis nula se rechaza si el valor de muestra es significativamente menor o mayor que el valor hipotetizado del parmetro de poblacin prueba que involucra dos regiones de rechazo. Prue!a de e>tremo inferior: prueba de hiptesis de un extremo en la que un valor de la muestra que se encuentra significativamente por deba&o del valor de la poblacin hipotetizada nos llevar a rechazar la hiptesis nula. Prue!a de e>tremo superior: prueba de hiptesis de un extremo en la que un valor de muestra significativamente superior al valor de poblacin hipotetizado nos llevar a rechazar la hiptesis nula. Prue!a de un e>tremo: prueba de hiptesis en la que slo hay una regin de rechazo es decir slo nos interesa si el valor observado se desva del valor hipotetizado en una direccin. ?alor crtico: valor de la estadstica estndar 1z2 ms all del cual rechazamos la hiptesis nula9 el lmite entre las regiones de aceptacin y rechazo.

I:7%@,1**I9: 8 <8 E078,A07I*8 :@ P8%8MB7%I*8. Las pruebas de hiptesis hacen inferencias respecto a los parmetros de la poblacin como la media. -stas pruebas param(tricas utilizan la estadstica param(trica de muestras que provinieron de la poblacin que se est probando. ,ara formular estas pruebas hicimos suposiciones restrictivas sobre las poblaciones de las que extraamos las muestras. ,or e&emplo" suponamos que las muestras eran grandes o que provenan de poblaciones normalmente distribuidas. ,ero las poblaciones no siempre son normales. Los estadsticos han desarrollado t(cnicas *tiles que no hacen suposiciones restrictivas respecto a la forma de las distribuciones de las poblaciones. Pstas se conocen como pruebas sin distribucin o pruebas no param(tricas. Las hiptesis de una probabilidad no param(trica se refieren a algo distinto del valor de un parmetro de poblacin ?enta4as de los m.todos no param.tricos. 6. 0o requieren que hagamos la suposicin de que una poblacin est distribuida en forma de curva normal u otra forma especfica. 3. Oeneralmente son ms fciles de efectuar y comprender. =. Algunas veces ni siquiera se requiere el ordenamiento o clasificacin formal. ,es)enta4as de los m.todos no param.tricos. 6. $gnoran una cierta cantidad de informacin 3. A menudo no son tan eficientes como las pruebas param(tricas. !uando usamos pruebas no param(tricas efectuamos un trueque" perdemos agudeza al estimar intervalos pero ganamos la habilidad de usar menos informacin y calcular ms rpidamente. P%1EB8 ,E /@<M@C@%@?.0MI%:@?. )e trata de un m(todo no param(trico sencillo para probar si existe una diferencia significativa entre una distribucin de frecuencia observada y otra frecuencia terica. -s otra medida de la bondad de a&uste de una distribucin de frecuencia terica. )e basa en la comparacin de distribuciones acumuladas" la distribucin acumulada de los datos observados y la distribucin acumulada terica correspondiente al modelo elegido.

13

.iene varias venta&as" es una prueba poderosa y fcil de utilizar puesto que no requiere que los datos se agrupen de determinada manera. -s particularmente *til para &uzgar qu( tan cerca est la distribucin de frecuencias observada de la distribucin de frecuencias esperada porque la distribucin de probabilidad +n depende del tama/o de muestra n pero es independiente de la distribucin de frecuencia esperada 1+n es una estadstica de distribucin libre2. ,ara calcular la estadstica Q@) simplemente se elige +n 1la desviacin absoluta mxima entre las frecuencias observadas y tericas2. Una prueba Q@) siempre debe ser una prueba de un extremo. Luego se busca el valor crtico en la tabla para las n observaciones considerando el nivel de significancia adoptado. )i el valor de la tabla es mayor que el valor de +n entonces aceptaremos la hiptesis nula. SUGERENCIAS: La prueba de Qolmogorov puede usarse con muestras muy peque/as en donde no se pueden aplicar otras pruebas param(tricas. ,odemos usar la prueba de Qolmogorov para verificar la suposicin de normalidad subyacente en todo anlisis de inferencia. )i bien constituye una prueba de implementacin sencilla tenga en cuenta que carga con las desventa&as de los m(todos no param(tricos en general en el sentido de producir resultados menos precisos que los procedimientos convencionales. !uando traba&e con muestras peque/as recuerde usar la frecuencia cumulada experimental. Conceptos: Prue!as de !ondad de a4uste: pruebas de hiptesis que ponen ba&o prueba una afirmacin acerca de la distribucin de una variable aleatoria. Prue!a de /olmo+orro)D0mirno): prueba no param(trica que no requiere que los datos se agrupen de ninguna manera para determinar si existe diferencia significativa entre la distribucin de frecuencia observada y la distribucin de frecuencia terica. Prue!as no param.tricas: t(cnicas estadsticas que no hacen suposiciones restrictivas respecto a la forma de la distribucin de poblacin al realizar una prueba de hiptesis.

14

S-ar putea să vă placă și