Inter Va

Intervalos de confianza Estadstica aplicada a la empresa II Prof. D.
Juan Jos Prez Castejn
INTERVALOS DE CONFIANZA.
La tcnica estadstica de estimacin por intervalos de confianza surge frente a la de estimacin puntual. Esta ltima no puede ser considerada un tcnica inductiva en el sentido pleno de ese trmino pues sus resultados no son acompaados de medidas que cuantifiquen su grado de fiabilidad. En cualquier ciencia, cuando se estima que una magnitud vale co con un error mximo de eo unidades, una forma de indicar tal cosa es sealar que esa magnitud se encuentra en el intervalo (c0 e0 , c0+e0). La Estadstica adopta ese mismo formato pero al error mximo e0 solo est en condiciones de asegurarle un cierto grado de fiabilidad, por lo que el intervalo anterior debe ir acompaado de una medida de ella. La combinacin de los dos elementos sealados en el prrafo anterior es lo que se conoce como una estimacin estadstica por intervalo de confianza. Definicin de intervalo de confianza y de otros elementos relacionados. Examinemos el siguiente ejemplo:
Ejemplo 1: La compaa Manufacturas Textiles quiere disminuir el tiempo que sus obreros tardan en confeccionar una pieza. Con ese fin decide probar una nueva maquinaria con 18 de ellos seleccionados aleatoriamente. Tras aleccionarlos convenientemente en su uso, les hace a cada uno emplearla para elaborar una pieza. El tiempo que en ello consumen se muestra en la tabla. Se admite que la dispersin de lo que tarda cada trabajador en la tarea no es alterada por la nueva maquinaria. En particular, la desviacin tpica de esa variable se mantiene en el nivel de 5.5 minutos en el que se encontraba establecida. Se pretende realizar una estimacin por intervalo, del tiempo medio que consumen los trabajadores con la nueva maquinaria. La variable se puede considerar distribuida normalmente.
Minutos consumidos por cada trabajador 81.2 74.4 79.5 75.7 71.9 81.6 72.1 74.1 73.5 74.4 69.9 77.4 63.6 66.8 65.4 70.4 74.6 69.3
Prof. D. Juan Jos Prez Castejn
En la situacin que acabamos de describir, la caracterstica de inters X en la poblacin analizada el tiempo que un obrero tarda en confeccionar una pieza empleando la nueva maquinaria sigue una distribucin N(,2=5.52). La atencin se centra en el nico parmetro desconocido =E(X). Para aumentar inductivamente la informacin que se dispone sobre l, se ha decidido realizar su estimacin por intervalo. Para ello, se dispone de una m.a.s. X1,...,Xn con n=18 y los Xi~N(,5.52) independientes entre s. El nico resultado inductivo que hasta ahora sabemos obtener acerca del parmetro es su estimacin puntual, estimacin que por la razn comentada en la introduccin no nos satisface plenamente. Para poblaciones normales, el estimador eficiente de es la media muestral
X
X=
i=1
18
18
= 73.1
Olvidndonos de su realizacin concreta en esta muestra, ese estadstico tiene un comportamiento estocstico conocido sobre el que podemos realizar la siguientes afirmaciones: 2 5 .5 2 X X ~ N(, = = 1.296 2 ) Z ~ N(0,1) 1.296 n 18 P( 1.96 < Z = X < 1.96) = 0.95 1.296
Si consideremos las desigualdades que definen ese suceso y la siguiente transformacin algebraica de equivalencia de ellas: 1.96 < X < 1.96 X 2.54 < < X + 2.54 1.296
tendremos que se cumple la igualdad: P ( X 2.54 < < X + 2.54) = P( 1.96 < Z < 1.96) = 95%
Como consecuencia de ( X 2.54 , X + 2.54) cumplir:
todo
lo
anterior,
el
intervalo
que es un intervalo aleatorio de la recta real. que tiene una probabilidad del 95% de contener a . Por otro lado, (73.12.54,73.1+2.54)=(70.56,75.64) realizacin muestral y cumple: no sabemos si contiene a . podemos cifrar en un 95% la confianza en que sea una de las realizaciones del intervalo aleatorio que s la contienen. Es por ello la estimacin en forma de intervalo de confianza para buscada. Este ejemplo nos sugiere ya los dos conceptos bsicos asociados con la tcnica de estimacin por intervalo de confianza. Para definirlos formalmente, establezcamos las HIPTESIS GENERALES bajo las que realizaremos este tipo de induccin: La distribucin de la variable X estudiada en la poblacin de inters ha sido especificada a excepcin de unos determinados parmetros desconocidos , X~f(x). Se desea realizar induccin sobre , en particular, se pretende realizar una estimacin por intervalo de confianza de cierta funcin suya h(). Se dispone de una muestra X1,...,Xn (no necesariamente aleatoria) de la poblacin, Xi~f(x). En esas circunstancias estamos en condiciones de efectuar las dos definiciones siguientes: Definicin: Dados dos estadsticos muestrales S(X1,...,Xn) y T(X1,...,Xn), diremos que el intervalo aleatorio (S,T) es un intervalo aleatorio para h() de probabilidad c si P(S<h()<T)=c para todo valor de posible. Definicin: Sea un intervalo (S,T) como el de la definicin anterior. Sea x1,...,xn una realizacin de la muestra. Denominaremos intervalo de confianza de nivel c a su realizacin muestral correspondiente, (S(x1,...,xn)=s,T(x1,...,xn)=t). es su
El intervalo de confianza definido en ltimo lugar, ser la estimacin buscada para h(). PRECISIONES. Es necesario resaltar algunos hechos explcita o implcitamente sealados en las definiciones anteriores: h() es una cantidad unidimensional. La estimacin conjunta de confianza de varias cantidades exige definiciones especficas de las que vamos a comentar algo pero muy por encima. Por otro lado, el requerimiento no afecta al parmetro poblacional , que s que puede estar compuesto de ms de una componente. Si la cantidad a estimar h()=(h1(),...hr()) tiene dimensin r>1, entonces, la definicin anterior debera ser extendida para permitir la posibilidad de que el conjunto donde confiemos que est la cantidad desconocida sea una regin de Rj que contenga de manera conjunta a los j valores desconocidos. Slo indicaremos que lo que se hace en ese caso es hablar de regiones aleatorias S(X1,...,Xn)Rr. De una regin aleatoria como esa se dice que es de probabilidad c para h() si P(h()S)=c para todo valor de . Una realizacin muestral suya S(x1,...,xn) se conoce como una regin de confianza c para h(). Para que la realizacin del intervalo aleatorio (S,T) de lugar a un intervalo de confianza que podamos situar con exactitud en la recta real, es necesario que las expresiones de S y T no vengan dadas en funcin de ninguna cantidad desconocida, en particular, han de ser independientes de . La igualdad P(S<h()<T)=c debe cumplirse para todo valor de posible pues esta es la nica forma de que despus, una vez obtenida la estimacin por intervalo de confianza, en ella podamos depositar la confianza c que se ha sealado. Dos criterios se oponen a la hora de seleccionar c. Por un lado el deseo de poder depositar la mayor fiabilidad posible en la estimacin. Por el otro, el deseo de obtener una estimacin lo ms precisa posible, precisin que viene dada por la longitud del intervalo T-S y que disminuye al aumentar c. Es posible hallar otros tipos de conjuntos de confianza en la recta real, diferentes de los intervalos, para una cantidad
Prof. D. Juan Jos Prez Castejn 5
unidimensional. Mtodos de construccin de intervalos de confianza. El mtodo pivotal. El mtodo prctico ms til para construir intervalos de confianza es el mtodo pivotal o mtodo del pivote. Su aplicacin procede en cuatro etapas que coinciden con las que se han seguido al resolver el Ejemplo 1. Etapa 1: Hallar el estadstico pivotal o estadstico pivote, V(X1,...,Xn). Este estadstico se debe caracterizar por el hecho de que su distribucin de probabilidad est libre de parmetros desconocidos, en particular, no puede depender de . Etapa 2: Seleccionar dos percentiles de V, q1 y q2, tales que P(q1<V<q2)=c. La propiedad que caracteriza a V asegura que esos percentiles tambin sern constantes conocidas independientes de . Etapa 3: Pivotar sobre las desigualdades q1<V<q2 para llegar a otras equivalentes S(X1,...,Xn)<h()<T(X1,...,Xn) que tengan la forma de intervalo aleatorio para h(). El proceso debe ser tal que S y T no dependan de y que las desigualdades finales sean equivalentes a las iniciales. En ese caso, se tendr que P(S<h()<T)=P(q1<V<q2)=c por lo que el intervalo (S,T) ser un intervalo aleatorio de probabilidad c para h(). Etapa 4: Una vez observada la muestra, X1=x1,...,Xn=xn, el intervalo (s,t) donde S(x1,...,xn)=s y T(x1,...,xn)=t es un intervalo de confianza de nivel c para h(). A lo largo de las etapas que componen el mtodo pivotal, la aplicacin de algunos pasos hace surgir algunas dudas cuya aclaracin requiere ampliar los comentarios que se han hecho. Vemoslas. Es siempre posible hallar un estadstico pivotal?. Y en todo caso, cmo proceder a su bsqueda?.
Para proceder a buscar el estadstico pivote se puede tomar como punto de partida, un estimador de , por ejemplo, el estimador mximoverosmil. Por supuesto, en ese estadstico sern necesarias las transformaciones pertinentes que lo conviertan en un estadstico pivotal vlido con distribucin independiente de . Incluso como inicio de esa misma bsqueda se puede escoger un estadstico suficiente para . Si ya se dispone de un estadstico pivotal, el proceso de pivotar es siempre factible? Se puede demostrar que si V(x1,...,xn) la funcin determinista a partir de la que se define el estadstico pivotal y la cantidad que se desea estimar h() tienen ambas un comportamiento monnotono como funciones de que aqu supondremos unidimensional, el proceso de pivotar est, tericamente al menos, asegurado. De no cumplirse ea condicin, tal vez se pueda an pivotar aunque quiz ocurra que no se llegue a un conjunto aleatorio de R que tenga forma de intervalo. Es posible siempre usar el nivel de confianza c deseado?. La clave para poder hacerlo radica en encontrar los percentiles qi adecuados. Obviamente ello va ser siempre posible si la distribucin de V es de tipo continuo, aunque no est asegurado que existan en el caso discreto. Caso de no poder hallar los percentiles que precisemos, tomaremos como norma de conducta escoger aquellos que den el nivel de confianza superior ms cercano posible al inicialmente buscado. Caso de existir los qi para un valor de c determinado, son siempre nicos?. Si no lo son hay algn criterio para seleccionar los ms adecuados?. Es obvio que de existir, los qi no tiene porqu ser nicos. De hecho, en el caso de estadsticos pivotales de tipo continuo, la no unicidad est asegurada. De no ser nicos, s que existe un criterio vlido para seleccionarlos. Tal criterio requiere volver a considerar el aspecto de la precisin en la estimacin, precisin que viene dada por TS. Parece adecuado que empleemos aquellos qi que provoquen la menor imprecisin en la estimacin. Se tratara de escoger los que
resuelvan el siguiente problema: Min: T(X1,...,Xn)S(X1,...,Xn) s.a.: P(q1<V<q2) = c En el caso del Ejemplo 1, la forma de S y T para los distintos qi posibles sera S = X 1.296q 2 y T = X 1.296q1, por lo que el problema de minimizacin anterior quedara convenientemente expresado de la forma siguiente: Min: T S = 1.296 (q2q1) s.a.: P(q1<N(0,1)<q2) = 0.95 Su resolucin mediante su correspondiente funcin lagrangiana q 1 1 x2 2 2 L(q1, q 2 , ) = 1.296(q 2 q1 ) q e dx 0.95 1 2 es bastante sencilla y lleva a los dos percentiles simtricos que ya se comentaron: z(1-0.95)/2 y z(1+0.95)/2=z(1-0.95)/2. La notacin que se ha utilizado para esos percentiles es la habitual en inferencia. Con la letra z se denotan los percentiles de una N(0,1) y con el subndice, se hace referencia a la probabilidad que dejan a su derecha, esto es, zk indica un nmero tal que P(N(0,1)zk)=1k. Hay que advertir que el problema anterior no siempre encuentra una solucin tan sencilla, y que, a veces, tal solucin ni siquiera existe. Por ello, con frecuencia se trabaja con valores de los percentiles que nicamente son aproximaciones de los verdaderos valores ptimos. Conviene cerrar las referencias al mtodo pivotal con un nuevo ejemplo de cmo se aplica. Su examen nos servir incluso para insistir en algunos aspectos comentados en relacin a las definiciones fundamentales de este tema. El nuevo ejemplo consiste en una revisin del anlisis dado al Ejemplo 1 anterior.
Ejemplo 1 (continuacin): Como resulta difcilmente creble, eliminemos la hiptesis de que la dispersin en el tiempo consumido por los trabajadores empleando la nueva maquinaria, no se modifica. Cmo obtener en ese caso una estimacin por intervalo de ?
Ahora la variable X sigue una distribucin N(,2). El parmetro desconocido es =(,) y la cantidad a estimar es h()=.
Aunque el resultado Z X ( n ) ~ N(0,1) sigue siendo vlido, deja de ser til para realizar induccin pues la cantidad desconocida que aparece en su denominador genera intervalos inadecuados en los que sus extremos S y T dependen de esa cantidad no conocida. De temas anteriores, sabemos que el estadstico que se obtiene sustituyendo en la expresin de Z por su estimador muestral SX cumple que: X SX n 1 ~ t n1
Su posible papel como nuevo estadstico pivotal se ve confirmado por el hecho de que resulta inmediato pivotar con l, generando el siguiente intervalo aleatorio: SX SX , X q1 X q2 n 1 n 1 En esa expresin, an queda pendiente la seleccin de los qi. Segn lo ya comentado, esos dos percentiles se pueden escoger iguales a los que resuelvan el siguiente problema de minimizacin: SX Min: (q2 q1 ) n 1 s.a.: P(q1 < t n1 < q 2 ) = c Su resolucin es anloga a la del problema de minimizacin ya examinado en el anlisis inicial del Ejemplo 1, dando lugar a los valores q2 = tn-1,(1-c)/2 y q1= tn1,(1+c)/2 = tn-1,(1-c)/2= q2. En esas dos igualdades, hemos usado el convenio notacional por el que tn,k representara la cantidad tal que P(tn tn,k)=1k. Finalmente, emplearemos los datos muestrales para sustituirlos en las frmulas obtenidas. Seleccionando dos niveles de confianza adecuados, c=95% y c=99%, se obtiene las siguientes estimaciones en minutos para . Con una confianza del 95%, est entre 70.51 m. y 75.69 m. Con una confianza del 99%, est entre 69.54 m. y 76.66 m. Comparando los resultados conseguidos bajo uno y otro planteamiento del Ejemplo 1, an es posible derivar interesantes
conclusiones adicionales. Las expresiones de los intervalos a las que se ha llegado, segn que se suponga conocida o no, son: , X + z (1c ) 2 X z (1c ) 2 n n SX SX , X + t n1,(1c ) 2 desconocida: X t n1,(1c ) 2 n 1 n 1 conocida: De su examen y comparacin se deduce que: La forma general estimacin puntual error mximo, anunciada para los intervalos, se confirma como la que normalmente estos adoptan. Siempre se debe tener presente que el nivel de confianza seala la fiabilidad que se puede depositar en que realmente ese sea el error mximo cometido. El error mximo que se confa haber cometido aumenta con la fiabilidad que queramos darle y con la varianza de la estimacin puntual. La necesidad de estimar el error debido a la presencia de parmetros molestos desconocidos provoca menor precisin. Como intuitivamente se puede prever, mayor tamao muestral y el consiguiente aumento en la cantidad de informacin disponible, provoca estimaciones estadsticas mas precisas. Intervalos de confianza asintticos. Usando combinadamente el mtodo pivotal y resultados asintticos, se obtienen intervalos que son asintticamente vlidos. Esto significa que su nivel de confianza es solo aproximado y que tal aproximacin es aceptable nicamente si la muestra es lo bastante grande. Por ello siempre es preferible usar un resultado en muestra finita si es posible. Revisaremos dos casos concretos donde se presenta la posibilidad de usar combinadamente los dos elementos citados. Por supuesto, existen otras situaciones en las que un desarrollo anlogo puede ser aplicado: Estimacin por intervalo de E(X) mediante X dada una especificacin paramtrica cualquiera de la distribucin de la poblacin, e incluso, sin ninguna especificacin concreta para ella. Estimacin por intervalo de unidimensional mediante su
estimacin mximoverosmil . Los resultados asintticos a usar en cada una de esas dos opciones son, respectivamente: X N( , var ( X)) . N( , cotaCR( )) De ellos se derivan los siguientes estadsticos pivotales de validez asinttica: Z Z X var ( X) N(0,1)
d d d
d N(0,1) cotaCR( )
En principio, el mtodo pivotal debe utilizarse con esos estadsticos, de la forma como se emple con el estadstico Z del Ejemplo 1. Sin embargo, la dependencia respecto de que presentan los denominadores de ambos estadsticos puede complicar el proceso de pivotar. Si as ocurriera, las propiedades de la convergencia en ley permiten sustituir ambos denominadores por una estimacin consistente suya. A su vez, las propiedades de la convergencia en probabilidad permiten que tal estimacin se pueda hallar sustituyendo en las expresiones funcin de de ambas cantidades, ese parmetro desconocido por alguna de sus estimaciones que sea consistente, por ejemplo, la propia estimacin mximo verosmil. Todo ello, dara lugar a los siguientes estadsticos pivotes asintticos alternativos: Z Z X r ( X ) va = X var ( X) N(0,1)
d
d = N(0,1) cot aCR( ) co t aCR( )
Emplendolos, se obtienen los siguientes intervalos aleatorios para E(X) y respectivamente:

(X z
( z
(1c ) 2
r ( X) , X + z (1c ) 2 va r ( X ) va
(1c ) 2
co t aCR( ) , t aCR( ) + z (1c ) 2 co
11
Una ltima dificultad puede surgir al aplicar todo lo comentado. Se presentara en el caso de que expresiones analticas como funciones de de la varianza de la media muestral o de la cota CR no fueran factibles. Pero tampoco en esas circunstancias se cierra la posibilidad de disponer de estimadores asintticos adecuados para esas dos cantidades. Por ser el caso de ms sencilla resolucin y uno de los que ms frecuente se presentan, citaremos lo que se hace en la primera de esas dos situaciones, la de la estimacin de E(X). Ah, la falta de la expresin analtica se puede dar, por ejemplo, si se pretende una estimacin de esa media sin ninguna hiptesis paramtrica previa acerca de la distribucin de X. Es por tanto una situacin de inferencia de tipo no paramtrico, la nica de ese tipo que citaremos dentro del mbito de la estimacin por intervalo. Para resolverla, se usa una estimacin consistente de la varianza de la media muestral que no est basada en la expresin analtica de la que se carece. Tal estimacin, por lo que sabemos de temas anteriores, se puede conseguir en este caso a travs de la varianza muestral si la muestra es aleatoria simple: r ( X ) = S 2 va X n Finalicemos este apartado aplicando el mtodo revisado a un ejemplo:
Ejemplo 2: La compaa NPC ha decidido mejorar la calidad de fabricacin de uno de sus principales productos, un componente electrnico. Quiere empezar por estudiar la fiabilidad de los que fabrica actualmente. Con ese fin, selecciona aleatoriamente 60 de ellos y mide el tiempo de funcionamiento continuo que cada uno soporta. Esa variable, medida en das, arroja los resultados indicados en la tabla. Su comportamiento aleatorio sigue una distribucin e(1/). Se pretende una estimacin por intervalo para la esperanza de vida de los componentes.
Tiempo de vida de los componentes (medido en das) 339.0 68.1 21.6 386.7 319.6 224.2 283.6 557.1 800.0 86.3 329.3 534.2 142.6 221.4 162.0 826.5 275.2 211.5 101.6 168.0 69.2 446.3 611.7 8.6 20.6 72.5 23.0 125.2 59.5 330.7 182.2 244.4 12.8 204.8 60.7 62.5 136.8 147.1 75.6 44.8 459.9 121.6 223.5 122.8 36.2 24.6 22.5 56.7 19.7 152.1 511.6 227.6 34.6 3.1 30.6 91.8 935.4 402.6 65.0 12.6
En la nueva situacin planteada, X~e(1/), poblacin que cumple que =E(X). En consecuencia, con el fin de la estimacin que se persigue, cualquiera de los dos mtodos asintticos comentados es adecuado. An ms, como
y var ( X) = 2 n = cotaCR( ), resulta que ambos mtodos son X= equivalentes pues los estadsticos pivotales correspondientes coinciden: X X d Z = = N(0,1) cota CR ( ) n var ( X) La dependencia respecto de que el denominador de ese estadstico presenta, aconseja su sustitucin en este caso, simplemente para poder pivotar mejor por su estimacin mximo verosmil: X d X = = N(0,1) Z X n var cotaCR( ) ( X) El intervalo aleatorio de probabilidad c para que se obtiene a partir de l, tiene la siguiente expresin: X X X z (1c ) 2 n , X + z (1c ) 2 n Finalmente, los resultados muestrales nos permiten hacer las siguientes estimaciones a tres niveles de confianza diferentes, para la esperanza de vida de los componentes estudiados: Con una confianza del 90%, est entre 164.9 y 253.5 das. Con una confianza del 95%, est entre 156.3 y 262.1 das. Con una confianza del 99%, est entre 139.5 y 278.9 das. Intervalos de confianza en poblaciones normales. Vamos a revisar ahora la expresin y obtencin, de los principales intervalos de confianza para poblaciones normales. Supondremos pues, a partir de ahora, que la v.a. X analizada es normal. Para simplificar, aadiremos la hiptesis de que la muestra obtenida de ella, es una m.a.s. Los distintos intervalos que iremos presentando se organizarn segn las diferentes situaciones inferenciales que se pueden presentar en este tipo de poblaciones, que coinciden con las que se distinguan cuando analizbamos los ms importantes resultados muestrales para poblaciones normales en el tema dedicado a inferencia y estadsticos. De hecho, bajo cada uno de los diferentes epgrafes iremos haciendo uso de los correspondientes resultados que all se expusieron.
INTERVALO PARA SIENDO CONOCIDA. Cuando se desea hace la estimacin por intervalo de , y es una cantidad conocida, a partir del siguiente resultado, Z = ( X ) /( / n ) ~ N(0,1) , se puede deducir que Z quiz haga el papel de estadstico pivote. Efectivamente, pivotar con l es sencillo y los qi que llevan al intervalo de longitud mnima para un determinado nivel de confianza c son z(1-c)/2 y z(1+c)/2=z(1-c)/2. De hecho esta situacin fue la que se abord con el primer enfoque que se dio al Ejemplo 1. Recurdese que el intervalo de confianza final obtenido fue X z (1c ) 2 , X + z (1c ) 2 . n n INTERVALO PARA SIENDO DESCONOCIDA. X ~ t n 1 y de ah S / n 1 podemos derivar el estadstico pivote T. Como esta situacin es a la que nos enfrentamos en el segundo enfoque que dimos al Ejemplo 1, no hace falta repetir todo el desarrollo que lleva a la siguiente expresin final para el correspondiente intervalo de amplitud mnima S S , X + t n 1,(1 c ) 2 para y de nivel c: X t n 1,(1 c ) 2 . n 1 n 1 En este caso, sabemos que T = INTERVALO PARA SIENDO CONOCIDA. Cuando se desea hace la estimacin por intervalo de o 2 siendo la media una cantidad conocida, el siguiente resultado, T=(Xi)2/2~2n, aporta un estadstico pivote adecuado. Efectivamente, encontrados los qi tales que P(q1<T~2n<q2)=c, pivotar sobre las desigualdades en q1<T<q2 es muy sencillo y lleva al intervalo aleatorio ((Xi)2/q2)<2<((Xi)2/q1) para 2, y a este otro, ((Xi)2/q2)<<((Xi)2/q1), para . Escoger dos valores para los qi vlidos es bastante sencillo pues la distribucin 2n est tabulada. Ms difcil resulta escogerlos de manera ptima, esto es, que minimicen la longitud del intervalo aleatorio final. De hecho, ese problema tiene una solucin que vara con n y tambin precisa una tabla propia de tabulacin. Por todo ello, y para simplificar, lo que habitualmente se hace es tomar la
siguiente aproximacin a sus valores ptimos: q2=2n,(1c)/2 y q1=2n,(1+c)/2. Siguiendo con el convenio notacional antes acordado, 2n,k representa la cantidad tal que que P(2n2n,k)=1k. Ntese que mientras que en los dos casos anteriores, los percentiles escogidos eran percentiles simtricos y a dos colas iguales (la cola de probabilidad de la izquierda del menor y la de la derecha del mayor valan lo mismo), ahora, sin embargo, aunque las colas siguen siendo iguales, la simetra desaparece. INTERVALO PARA SIENDO DESCONOCIDA. Ya se coment en el tema anterior que, en esta situacin, el resultado que afirma que nS2/2~2n1, sera el empleado para hacer inferencia. Efectivamente, en relacin con los intervalos de confianza para o 2, es el que aporta el estadstico pivote. Procediendo como en al apartado anterior, se llega al siguiente intervalo aleatorio de nivel c para 2: (nS2/q2)<2<(nS2/q1), donde q2=2n1,(1c)/2 y q1=2n1,(1+c)/2. El intervalo para es muy fcil de obtener a partir de ese otro. Hay que sealar tambin que tampoco en este caso la seleccin de los qi es la ptima, sino solo una aproximacin a ella. INTERVALO PARA LA DIFERENCIA DE MEDIAS SIENDO LAS VARIANZAS CONOCIDAS. Al comparar las medias X y Y entre dos poblaciones normales, lo que se precisa a veces es la estimacin por intervalo de XY. Obtener ese intervalo cuando las varianzas 2X y 2Y son conocidas es bastante sencillo, a partir del resultado que en su
2 momento se razon: ( X Y ( X Y )) / ( 2 X / n) + ( Y / m) ~ N(0,1). La analoga se da hasta en la obtencin de los valores ptimos de los qi. El intervalo sera el que se formara con los siguientes 2 extremos: X Y z (1 c ) / 2 ( 2 X / n) + ( Y / m) ~ N(0,1).
INTERVALO PARA LA DIFERENCIA DE MEDIAS SIENDO LAS VARIANZAS DESCONOCIDAS. Distinguiremos los dos casos siguientes:
15
1. Varianzas desconocidas de las que se sabe que son iguales. n + m 2 ( X Y ) ( X Y ) ~ t , n+m2 2 2 n+m nS X + mS Y el estadstico que aparece en esa expresin es el usado como pivote aqu. El intervalo aleatorio final que queda tendra los Al cumplirse que nm siguientes extremos: X Y t n + m 2,(1 c ) / 2
2 n + m nS 2 X + mS Y . nm n+m2
2. Varianzas desconocidas sin ninguna otra informacin. En este caso, como ( X Y ) ( X Y )

2 2 Sc , X / n + S c, Y / m 2 c, X 2 n + Sc ,Y m 2 2 Sc ,Y
t donde es el
entero ms cercano a
(S
2 Sc ,X
n 1 con los extremos
) +(
, entonces el intervalo
m 1
2 Sc ,X 2 Sc ,Y
+ es un intervalo n m vlido, al menos, aproximadamente. Cuando n y m son ambas grandes, esa t de Student y sus percentiles se pueden sustituir por una N(0,1). INTERVALO PARA EL COCIENTE DE VARIANZAS SIENDO LAS MEDIAS CONOCIDAS. Como
X Y t ,(1c ) / 2
intervalo de confianza para 2X/2Y: 1 1 ( X i X )2 / n < 2 X < Fn,m,(1+ c ) / 2 Fn,m,(1 c ) / 2 ( Yi Y )2 / m 2 Y
( Xi X )2 /(n 2 X) ~ Fn,m , ) ( Yi Y )2 /(m 2 Y
se obtiene el siguiente
( Xi X )2 / n ( Yi Y )2 / m
Sobre la seleccin de los percentiles de la distribucin F habra que sealar lo mismo que se dijo al estimar por intervalo de confianza la varianza en el caso de una sola poblacin normal.
16
INTERVALO PARA EL COCIENTE DE VARIANZAS SIENDO LAS MEDIAS DESCONOCIDAS. En este caso, de
2 nS 2 X /((n 1) X ) 2 mS 2 Y /((m 1) Y )
2 2 Sc ,X / X 2 2 Sc ,Y / Y
~ Fn 1,m 1 se
obtiene el siguiente intervalo de confianza para 2X/2Y: 2 2 Sc Sc 2 1 1 ,X ,X X < 2 < 2 2 Fn 1,m 1,(1 c ) / 2 S c, Y Y Fn 1,m 1,(1+ c ) / 2 S c, Y Aunque hay que tener en cuenta que ese intervalo tampoco es el de longitud mnima.
17

Inter Va

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Inter Va

Încărcat de

Drepturi de autor:

Formate disponibile

Intervalos de confianza Estadstica aplicada a la empresa II Prof. D.

Juan Jos Prez Castejn

Prof. D. Juan Jos Prez Castejn

Prof. D. Juan Jos Prez Castejn

Como consecuencia de ( X 2.54 , X + 2.54) cumplir:

Prof. D. Juan Jos Prez Castejn

d = N(0,1) cot aCR( ) co t aCR( )

Emplendolos, se obtienen los siguientes intervalos aleatorios para E(X) y respectivamente:

co t aCR( ) , t aCR( ) + z (1c ) 2 co

Prof. D. Juan Jos Prez Castejn

Prof. D. Juan Jos Prez Castejn

2. Varianzas desconocidas sin ninguna otra informacin. En este caso, como ( X Y ) ( X Y )

n 1 con los extremos

intervalo de confianza para 2X/2Y: 1 1 ( X i X )2 / n < 2 X < Fn,m,(1+ c ) / 2 Fn,m,(1 c ) / 2 ( Yi Y )2 / m 2 Y

( Xi X )2 /(n 2 X) ~ Fn,m , ) ( Yi Y )2 /(m 2 Y

Prof. D. Juan Jos Prez Castejn

Prof. D. Juan Jos Prez Castejn

S-ar putea să vă placă și