Documente Academic
Documente Profesional
Documente Cultură
CAPITULO 5
Esta es una de las primera secciones metodologicas de esta asignatura. Utilizaremos los
conceptos de las secciones anteriores, desarrollando técnicas para el análisis de datos.
La mayor parte de algún análisis esta centrado con la inferencia, esto es, se llegan a
conclusiones validas sobre la base de una información muestral.
para la media poblacional , este problema puede ser formulado como una prueba de
hipótesis de la forma:
H o : μ μ o contra H1 : μ μ o
Si X1, X2, ...., Xn es una muestra aleatoria de una población normal, el estadístico de
prueba ( para n < 30) es:
n n
(X μ o )
Xj
j1
( X
j1
j X )2
t ~ t ( n1) , donde X y s2
s/ n n n 1
( X μo )2
t
2
2
n( X μ o )( s 2 ) 1 ( X μ o ) es grande. (1)
s /n
x μo
No rechazar H o : μ μ o al nivel de significancia α, o t (1 α/2, n 1) es
s/ n
equivalente a que o debe hallarse en el intervalo de confianza del (1- α)x100%
s s
x t (1 / 2,n1) o x t (1 / 2,n1) (3)
n n
1
S
T 2 (X μ o ) (X μ o ) n(X μ o ) S 1 (X μ o ) (4)
n
Cap. 5. Inferencias acerca de un vector de medias. 3
n
μ 10
X j
1 n
μ
(X j X)(X j X) μo
j1
X S
20
donde: , y
(p x 1) n (p x p) n 1 j1 (p x 1)
μ p0
El estadístico
(n p) 2
·T ~ F(p,n p) (5)
(n 1)p
donde Fp, n – p denota una variable aleatoria con una distribución F con p y n-p grados de
libertad.
El estadístico T2 dado en la expresión (4) puede es usado para hacer inferencias acerca
del vector de medias. Es decir, es el estadístico de prueba de H o : μ μ o contra
H1 : μ μ o .
(n 1)p
T 2 n(X μ o ) S 1 (X μ o ) ·F( α ; p, n p) (6)
(n p)
Ejemplo 1. Sea la matriz de datos para una muestra aleatoria de tamaño n = 3 de una
población normal bivariante,
6 10 8
X
9 6 3
9
Evalué la observación T2 para μ o . Cuál es la distribución muestral de T2 en este
5
caso ?-
Cap. 5. Inferencias acerca de un vector de medias. 4
Solución.-
6 10 8
x1 3 8
De la muestra se obtiene, x y s11 4 s12 3 s11 9
x 2 9 6 3 6
3
4 3 1/3 1/ 9
De esta manera, S y por lo tanto S -1
3 9 1 / 9 4/27
De la expresión (19),
1/3 1/9 8 9 2 / 9 7
T 2 3 8 9, 6 5 1/27 9
4/27 6 5
3 1 , 1
1/9
Ejemplo 2.- La transpiración de 20 mujeres sanas fue analizada, mediante una nueva técnica
de diagnostico en la facultad de medicina de la universidad de Wisconsin –USA. Tres
componentes fueron medidos: X1 = velocidad de transpiración, X2 = contenido de sodio, y
X3 = contenido de potasio. Los resultados que llamaremos datos de transpiración, son
presentados a continuación:
Individuo X1 X2 X3
(Velocidad de transpiración ) Sodio potasio
La prueba de hipótesis es: H o : μ 4, 50, 10 contra H1 : μ 4, 50, 10 al nivel
de significancia del 10%.
Solución.
Se supone que los datos de transpiración están distribuidos como una normal
multivariante.
4 4
1) Las hipótesis son H o : μ 50 contra H1 : μ 50
10 10
T 2 n(X μ o ) S 1 (X μ o )
4) Región critica:
(20 - 1)3
T2 ·F( 0.10; 3,17) (3.353)(2.437) 8.17 ,
(20 3)
entonces
0.586 0.022 0.258 4.640 4
T 2 20 4.640 4, 45.400 50, 9.965 10 0.022 0.006 0.002 45.400 50
0.258 0.002 0.402 9.965 10
0.640
20 0.640 , - 4.600 , - 0.035 4.600 9.74
0.035
Cap. 5. Inferencias acerca de un vector de medias. 6
6) Decisión. Se observa que T2 = 9.74 > 8.17 y por tanto se rechaza Ho al nivel de
significancia del 10%.
Supongamos que se tiene una muestra x1, x2,..., xn (n > p) La función de verosimilitud
es dado por
n
1 ( x j μ) 1 ( x j μ ) / 2
L(μ, ) e j 1
(2 ) np/2
n /2
n /2
max L(μ o , )
ˆ
Razón de verosimilit ud λ
(7)
max L(μ, ) ˆ
μ, o
n n
ˆ 1 ( x j x )( x j x ) y
donde ˆ o 1 ( x j μ o )( x j μ o )
n j1 n j1
ˆ
Nota. El estadístico equivalente λ 2 / n es llamado Lamdda de Wilks.
ˆo
n
n 2
ˆ
n /2
( x j x )( x j x )
λ j1
α (8)
ˆ
n
o
(x j μ o )(x j μ o )
j1
donde λα es escogido tal que la probabilidad de (8) cuando la hipótesis nula es verdadera
es igual a su nivel de significancia.
Teorema 1.- Sea X1, X2, ...., Xn es una muestra aleatoria de una población N p (μ, ) .
(n 1)p
α P T 2 ·F( ; p, n p) .
(n p)
De la relación (9) se muestra que T2 puede ser calculado de dos determinantes, así se
evita el calculo de S-1. Resolviendo para T2 , tenemos:
ˆo
(n 1)
(n - 1) (x
j1
j μ o )(x j μ o )
T
2
(n 1) - (n - 1) (10)
ˆ
n
(x
j1
j x)(x j x)
Cap. 5. Inferencias acerca de un vector de medias. 8
Una región de confianza del (1-α )x100% para la media μ de una distribución normal p-
dimensional es el conjunto determinado para todos los μ , tal que:
p(n 1)
n(X μ) S 1 (X μ) ·F( ; p, n p) (11)
(n p)
1 n 1 n
donde x xj , S (x j x)(x j x) y x1, x2, ..., xn son las
n j1 (n - 1) j1
observaciones muestrales.
Para determinar si algún μ o cae en la región confidencial (es un valor posible para μ ),
(n 1)p
comparar esto con ·F( α ; p, n p) . Si la distancia cuadrada es más grande que
(n p)
(n 1)p
·F( α ; p, n p) , μ o no esta en la región confidencial.
(n p)
región confidencial dada en (11) consiste de todos los vectores μ o para el cual la prueba
T2 puede no rechazar Ho a favor de H1 al nivel de significancia α.
p(n 1)
n(X μ) S 1 (X μ) c 2 ·F( ; p, n p)
(n p)
son determinados por:
c i p(n 1)
i F( , p,n p )
n n(n p)
unidades a lo largo de los eigenvectores ei. Empezando en el centro x , los ejes de la
elipsoide confidencial son
Cap. 5. Inferencias acerca de un vector de medias. 9
p(n 1)
λi F( , p ,n p ) e i donde S ei = λi ei , i= 1, 2, …, p. (12)
n( n p )
Ejemplo 1. Un periódico matutino lista los siguientes precios de carros usados de una
determinada marca, con edad de antigüedad (X1) en años y precio de venta (X2 ) en
miles de dólares.
x1 3 5 5 7 7 7 8 9 10 11
x2 2.30 1.90 1.00 0.70 0.30 1.00 1.05 0.45 0.70 0.30
La elipse confidencial del 95% para μ consiste de todos los valores (μ 1 , μ 2 ) que
satisfacen:
7
Ahora, supongamos que el vector μ . Para ver si μ esta en la región confidencial,
1
calcularemos
8
Esto es equivalente, a probar si H o : μ puede ser rechazada a favor de
1
8
H1 : μ .
1
0.976
λ1 = 6.247 e1
0.218
0.218
λ2 = 0.149 e2
0.976
p(n 1) 2(9)
λ1 F( , p ,n p ) 6.247 (4.459) 2.503
n( n p ) 10(8)
y
p(n 1) 2(9)
λ2 F( , p ,n p ) 0.149 (4.459) 0.387
n( n p ) 10(8)
respectivamente.
x2 1
1 2 3 4 5 6 7 x1 1
0.976 0.218
Los ejes se extienden a lo largo de e1 y e2 cuando estos vectores
0.218 0.976
son representados con x como el origen.
p(n 1)
2 1 F( , p ,n p )
n(n p) 1 6.247
6.474
p(n 1) 2 0.149
2 2 F( , p,n p )
n(n p)
La longitud del eje mayor es 6.48 veces la longitud del eje menor.
Teorema 2. Sea X1, X2, ...., Xn es una muestra aleatoria de una población N p (μ, ) con
p(n 1) p(n 1)
X F( , p, n p)S , X F( α , p, n p)S (13)
n(n p) n(n p)
p(n 1) p(n 1)
x1 F( , p, n p) ·s11 μ 1 x 1 F( , p, n p) ·s11
n(n p) n(n p)
p(n 1) p(n 1)
x2 F( , p, n p) ·s22 μ 2 x 2 F( , p, n p) ·s22
n(n p) n(n p)
p(n 1) p(n 1)
xp F( , p, n p) ·spp μ p x p F( , p, n p) ·spp
n(n p) n(n p)
(14)
todos permanecen simultáneamente con coeficiente confidenciales 1 – α.
Ejemplo 2. Consideremos nuevamente los datos del ejemplo 2 (ver sección 2.3), con
respecto a la transpiración examinada a 20 mujeres sanas. Se pide obtener los intervalos
confidenciales simultáneos del 95% para μ 1 , μ 2 y μ 3 .
Aquí,
p(n 1) 3(20 1) 3(19)
·F( α ; p, n p) F( 0.05, 3, 8) (4.066) 13.633
(n p) (20 3) 17
Luego:
4.640 13.633 2.879 μ1 4.640 13.633 2.879
o
- 1.625 μ1 10.905
s11 s
x1 t ( 1 / 2 p , n1) μ1 x1 t ( 1 / 2 p , n1) 11
n n
s 22 s
x 2 t ( 1 / 2 p , n1) μ 2 x 2 t ( 1 / 2 p , n1) 22
n n
s pp s pp
x p t ( 1 / 2 p , n1) μ p x p t ( 1 / 2 p , n1)
n n
(15)
Ejemplo 3. Consideremos otra vez los datos del ejemplo 2. Se pide obtener los
intervalos confidenciales Bonferroni simultáneos del 95% para μ 1 , μ 2 y μ 3
Solución .
Para n = 20 y t ( 1 0.05 / 2(3) , 19) t ( 0.99167,19) 2.625 , obtenemos:
s11 2.879
x1 t ( 0.99167,19) 4.64 2.625 o 3.64 μ1 5.64
n 20
s 22 199.798
x 2 t ( 0.99167,19) 45.4 2.625 o 37.10 μ 2 53.70
n 20
s 33 3.628
x 3 t ( 0.99167,19) 9.965 2.625 o 8.85 μ 3 11.08
n 20
los intervalos de Bonferroni para combinaciones lineales μ y los análogos intervalos
T2 , tienen la misma forma general:
S
X (valor critico)
n
P n(X μ) S 1 (X μ) 2p,1 1 (16)
Teorema 3. Sea X1, X2, ...., Xn una muestra aleatoria de una población con media μ y
matriz de covarianza definida positiva Σ. Cuando n.-.p es grande, la hipótesis
H o : μ μ o es rechazada a favor de H1 : μ μ o , al nivel de significancia α, si
libertad..
Teorema 4. Sea X1, X2,...., Xn una muestra aleatoria de una población con media μ y
matriz de covarianza definida positiva Σ. Si n.-.p es grande,
S
X χ (12 - , p)
n
s11
x1 χ (12 - , p) · contiene a μ 1
n
s 22
x2 χ (12 - , p) · contiene a μ 2
n
s pp
xp χ (12 - , p) · contiene a μ p
n
Cap. 5. Inferencias acerca de un vector de medias. 16
Las ideas desarrolladas sobre inferencias acercas de un vector de medias, pueden ser
extendidos para manejar problemas que implican la comparación de varios vectores de
medias. La teoría se basa en la suposición de la distribución normal multivariante o
tamaños de muestras grandes. Para evitar aquellos problemas sobre la notación que
llega a ser un poco incomodo, se revisara los procedimientos univariantes para la
comparación de varias medias y entonces se generalizara a los correspondientes casos
multivariantes. Se presentaran ejemplos que nos permitirán reforzar los conceptos.
Muestra Estadísticas
(Población 1)
n1 n1
x1j
j1
(x
j1
1j x1 )(x1j x1 )
x11 , x12 , . . . , x1n1 x1 S1
n1 n1 1
(Población 2)
n2 n2
x 2j
j1
(x
j1
2j x 2 )(x 2j x 2 )
x 21 , x 22 , . . . , x 2n2 x2 S2
n2 n 2 1
Cap. 5. Inferencias acerca de un vector de medias. 17
1.- La muestra aleatoria X11 , X12 , . . . , X1n1 es una muestra aleatoria de tamaño n1 de una
Como veremos posteriormente, para muestras grandes, esta estructura es suficiente para
hacer inferencias acerca del vector μ1 μ 2 de orden p x 1. Sin embargo, cuando las
muestras n1 y n2 son pequeñas, más de una suposición es necesaria.
n1 n2
(20)
distancia cuadrada de x1 x 2 a δ 0 .
Cap. 5. Inferencias acerca de un vector de medias. 18
1 1 1 1
Var( X1 X 2 ) Var( X1 ) Var( X 2 ) (21)
n1 n2 1
n n 2
1 1
Debido a que Scombinada es un estimador de Σ, vemos que S combinada es un
n1 n 2
estimador de Var( X1 X 2 ) .
Esta basado sobre el estadístico de distancia cuadrada, T2, y es dado por: Rechazar Ho si
1
1 1 (n 1 n 2 2)p
T ( x1 x 2 δ 0 ) S combinada ( x1 x 2 δ 0 )
2
F(1 α , p , n1 n 2 p 1)
n 1 n 2 (n 1 n 2 p 1)
(22)
Teorema 5. Considerando que X11 , X12 , . . . , X1n1 es una muestra aleatoria de tamaño n1
1
1 1
T x1 x 2 (μ1 - μ 2 ) S combinada
2
x 1 x 2 (μ1 - μ 2 )
n 1 n 2
(n 1 n 2 2)p
esta distribuido como F( p , n1 n 2 p 1) .
(n 1 n 2 p 1)
Por consiguiente,
Cap. 5. Inferencias acerca de un vector de medias. 19
1 1
1
P x1 x 2 (μ1 - μ 2 ) S combinada x1 x 2 (μ1 - μ 2 ) c 2 1 -
n 1 n 2
(23)
donde
(n 1 n 2 2)p
c2 F(1 α , p , n1 n 2 p 1)
(n 1 n 2 p 1)
Ejemplo 4.- 50 barras de jabón son fabricados por cada uno de los dos métodos
empleados en la producción. Dos características de calidad son medidas, X1.= espuma y
X2 = suavidad.
Los datos resumidos de las barras de jabón por los métodos 1 y 2 son:
8.3 2 1
x1 S1
4.1 1 6
10.2 2 1
x2 S1
3.9 1 4
Solución.
μ11 μ 21 μ11 μ 21
1) Hipótesis: H o : contra H1 :
μ12 μ 22 μ12 μ 22
2) Nivel de significancia: α=0.05
1
1 1
T x1 x 2 S combinada x x2 ~
2 106
1 F( 2 , 97)
n 1 n 2 97
1
1 1 (50 50 2) 2
T x1 x 2 S combinada
2
x 1 x2 F(0.95, 2, 97) 6.243
n 1 n 2 (50 50 2 1)
(n 1 1)S1 (n 2 1)S 2 49 S1 49 S 2 1 4 2 2 1
S combinada
n1 n 2 2 98 2 2 10 1 5
También:
8.3 10.2 1.9
x1 x 2
4.1 3.9 0.2
Luego,
1
1 1 2 1 - 1.9
T - 1.9 0.2
2
52.472
50 50 1 5 0.2
6.- Decisión. Como el valor de T2=52.472 > 6.243, se rechaza Ho y se concluye que los
dos métodos de fabricación de producen diferentes resultados.
1.697
eigenvals ( S)
0.957 0.29
eigenvecs (S)
5.303 y 0.29 0.957
Es decir, aquí λ1= 5.303 y λ2= 1.697 , y los correspondientes eigenvectores e1 y e2 son:
0.290 0.957
e1 y e2
0.957 0.290
1 1 p(n1 n2 2) 2 2(98)
λ i F( , p ,n p ) λ i F(0.95, 2,97) λ i 0.5
n1 n2 (n1 n2 p 1) 50 97
μ12 – μ22
2.0
1.0
-1.0
Es posible derivar intervalos confidenciales para los componentes del vector μ1 – μ2. Se
supone que las poblaciones multivariantes son normales con matriz de covarianzas
común Σ.
(n 1 n 2 2)p
Teorema 6.- Sea c 2 F(1 α , p, n1 n 2 p 1) . Con probabilidad 1 – α ,
(n 1 n 2 p 1)
1 1 1 1
( X1 X 2 ) - c S combinado ( X1 X 2 ) ( X1 X 2 ) - c S combinado
n 1 n2 n 1 n2
1 1
X1i X 2i c Sii,combinado para i= 1, 2, . . . , p.
n1 n 2
(24)
Ejemplo 5.- Considerando otra vez los datos del ejemplo 1, tenemos los siguientes
estadísticos de resumen:
8.3 2 1
x1 , S1
6
, n1 =50
4.1 1
10.2 2 1
x2 , S1
4
, n2 =50
3.9 1
Se pide encontrar intervalos de confianza simultáneos del 95% para la diferencia en los
componentes de la media.
Cap. 5. Inferencias acerca de un vector de medias. 23
Solución.
2 1
La matriz de covarianza muestral combinada es : S combinada
1 5
y
(n1 n 2 2)p 98(2)
c2 F(1 α , p, n1 n 2 p 1) F(0.95, 2,97) 6.243
(n1 n 2 p 1) 97
μ μ 21
Con μ1 μ 2 11 , los intervalos confidenciales simultáneos del 95% para la
μ12 μ 22
diferencia población son:
11 21 :
1 1 1 1
8.3 10.2 6.243 2 11 21 8.3 10.2 6.243 2
50 50 50 50
o
1.193 11 21 2.607
12 22 :
1 1 1 1
4.1 3.9 6.243 5 12 22 4.1 3.9 6.243 5
50 50 50 50
o
0.917 12 22 1.317
De acuerdo a los intervalos resultantes, se nota que ambos procesos producen barras de
jabón con la misma suavidad (X2), puesto que el valor cero esta contenido en dicho
intervalo, es decir, 12 22 . Pero aquellas barras de jabón del segundo proceso tienen
más espuma (X1), es decir, 21 11 (debido a los valores positivos de ambos limites).
Cap. 5. Inferencias acerca de un vector de medias. 24
Observación .
1 1
X1i X 2i t ( 1 / 2 p, n n2 2 )
Sii,combinado (25)
n1 n 2
1
libertad, tal que P T t ( 1 α / 2 p, n1 n 2 2) 1 - α /2p .
Sea los tamaños muestrales tal que, n1 p y n2 p son grandes. Una elipsoide
confidencial del 100(1-α)% para vector μ1 – μ2 es dado por todos los μ1 – μ2 que
satisfacen:
1
grados de libertad.
1 1
(μ1 μ 2 ) pertenece a (μ1 μ 2 ) χ (12 α , p) S1 S 2 (27)
n1 n1
Cap. 5. Inferencias acerca de un vector de medias. 25
μ 11 μ 21
μ μ
(μ1 μ 2 ) 1 , 0, 0, ..., 0
22
12
μ 11 μ 21 ,
μ 1p μ 2p
X12 X 22 χ (12 α , p) S 22
X1 p X 2 p χ (12 α , p) S pp
donde las varianzas S11, S22, .., Spp son los elementos de la diagonal de la matriz
1 1
S1 S2 .
n1 n2