Documente Academic
Documente Profesional
Documente Cultură
Pgina 1 de 32
Pgina 2 de 32
Media Muestral
X=
1 n
Xi
n i=1
1 n
xi
n i 1
cuando:
X1 = x1, X2 =x2,, Xn = xn
En la prctica el trmino media muestral se aplica tanto al estadstico
S2
1 n
( X i X )2
n 1 i 1
La razn para dividir por n-1 es que de esta forma, como veremos ms adelante (cuando
se estudien los procedimientos de estimacin), la medida de variabilidad resultante es el
mejor estimador de la varianza poblacional (desconocida).
Desviacin Estndar
S
1 n
( X i X )2
n 1 i 1
Observar que la varianza muestral S2 se mide en trmino del cuadrado de las unidades
originales de las mediciones.
As, si la varianza muestral se expresa en kilogramos al cuadrado para datos originales
en kilogramos, al extraer la raz cuadrada positiva de S2, obtenemos la desviacin
estndar muestral, que regresa la medida de variabilidad a las unidades originales de las
mediciones.
Mnimo Muestral
X ( m ) mn( X 1 , X 2 ,..., X n )
Mximo Muestral
X ( M ) mx( X 1 , X 2 ,..., X n )
Rango Muestral
R X ( M ) X ( m)
3.3 Distribucin Muestral de Estadsticos
3.3.1 Introduccin
Usaremos los estadsticos para estimar los parmetros de una distribucin. Dado que un
estadstico es una variable aleatoria por ser una funcin de n variables aleatorias, tiene
sentido hallar su distribucin.
Como ya sabemos uno de los principales objetivos de la Estadstica es el aprendizaje a
partir de las observaciones. La Estadstica proporciona el mtodo para poder conocer
como es el fenmeno real que ha generado los datos observados y que generar los
futuros.
Pgina 4 de 32
Supongamos por ejemplo que queremos saber cmo son los artculos fabricados
mediante un determinado proceso. Para ello tendremos en cuenta un conjunto de
variables medibles que sean representativas de las caractersticas de dicho artculo, por
ejemplo la longitud de alguna de sus dimensiones.
La longitud de los posibles artculos fabricados ser una variable aleatoria, dado que
todo proceso productivo siempre tiene variabilidad, ya sea grande o pequea.
Las longitudes de los distintos artculos sern, en general, distintas.
Llamaremos X = longitud de un artculo genrico.
X es una variable aleatoria cuya distribucin desconocemos.
Para poder conocer algo sobre la distribucin de X tomaremos una muestra aleatoria
simple de los artculos, y a partir de ella haremos un ejercicio de induccin, para
extrapolar las caractersticas de la muestra a toda la poblacin.
En Estadstica, este ejercicio de induccin por el cual a partir de la muestra intentamos
predecir o pronosticar cmo ser el resto de la poblacin que no se ha observado se
llama Inferencia estadstica.
Supongamos que tenemos una muestra de n = 100 artculos y hemos medido sus
longitudes. Supongamos tambin que calculamos un conjunto de medidas
caractersticas de dicha muestra: la media, la varianza, etc.
Los valores de la media muestral, la varianza muestra, etc. calculados a partir de los
datos de la muestra, coinciden con la media poblacional, la varianza poblacional, etc.
es decir con los parmetros que caracterizan la distribucin?
Para que coincidan necesitamos los datos necesarios (en este caso longitudes) de
TODOS los elementos de la poblacin. Por tanto no tienen que coincidir.
Conclusin 1. Los valores de las medidas caractersticas que se obtienen de una
muestra sern slo una aproximacin de los valores de las medidas
caractersticas de la poblacin.
Nos preguntamos ahora: los valores de la media muestral, la varianza muestral, etc.
dependen de la muestra aleatoria utilizada?
Pgina 5 de 32
X 1 X 2 ... X n
n
Queremos saber cual es la distribucin de X , dado que se trata de una variable aleatoria
y podemos hallar su distribucin.
1. Calcularemos primero la esperanza matemtica de X . Si llamamos E(X) =
tendremos que E(Xi) = , i = 1, 2,, n; dado que cada Xi (i = 1, 2,, n) es una
v.a. idntica a X (por definicin de muestra aleatoria). Entonces:
E( X ) E
(X
X 2 ... X n
E ( X 1 ) E ( X 2 ) ... E ( X n ) n
n
n
n
Pgina 6 de 32
(X
X 2 ... X n
n
Var ( X 1 ) Var ( X 2 ) ... Var ( X n ) n 2 2
2
n2
n
n
Var ( X ) Var
Entonces:
n
i 1
i 1
i 1
i 1
c X c
Z
i 1
i 1
2
i
c
i 1
2
i
Podemos escribir Z
N (0,1)
n
Consideraremos como grande a n cuando n 30.
Observacin 1. Si consideramos:
todas las constantes ci = 1(i = 1, 2,, n)
Pgina 7 de 32
X X i variable aleatoria
i 1
Entonces:
n
i 1
i 1
N (n , n 2 )
O bien:
n
X i n
Z
i 1
n 2
i 1
Podemos escribir: Z
n
1 n
Xi
n i 1
tiene aproximadamente una distribucin normal con:
X
media X
desviacin estndar X
Equivalentemente:
Z
X
tiene distribucin aproximadamente N(0,1)
Pgina 8 de 32
X
Z
Z
( 1n )( X i )
i 1
i 1
Pgina 9 de 32
Fig.1
Pgina 10 de 32
hecho lgico que la desviacin estndar de X debe tender a cero a medida que
el tamao muestral n se aproxima al tamao poblacional N. En este caso el
error estndar (o tpico) de la media es X
N n
. Al factor
N 1
N n
se
N 1
Pgina 11 de 32
desviacin estndar= X
Luego la v.a. Z
16
2
n
64
X
tiene distribucin aproximadamente N(0,1).
P(172,5 X 175,8)
X 174,5
172,5 174,5
175,8 174,5
)
6,9 1000 25
6, 9 1000 25
6,9 1000 25
25 1000 1
25 1000 1
25 1000 1
P(1, 47 Z 0,96) 0, 7607
a) P(
Grficamente:
Pgina 12 de 32
y de X - X
X X
1
1 2 y
X X
1
1 2
X X
1
X X
1
1 2
n
n
( X 1 X 2 ) ( 1 2 )
12
n1
y Z
n2
( X 1 X 2 ) ( 1 2 )
12
n1
n2
< 8,2).
Solucin
P ( X 1 X 2 8,2) P(
( X 1 X 2 ) ( 1 2 ) 8,2 10
)
2
2
9
4
1 2
5 4
n
n
1
P(
X 2 10
2,8
1.08) 0,1401
3.3.5 Problemas
Problema 1
Una empresa fabrica elementos con una duracin que se distribuye aproximadamente en
forma normal, con media de 800 horas y desviacin estndar de 40 horas. Encuentre la
probabilidad de que una muestra aleatoria de 16 de tales elementos tenga una vida
promedio de por lo menos de 775 horas.
Solucin
P ( X 775) P(
) P ( Z 2,75) 0,0062
40
40
16
16
Pgina 14 de 32
P ( X A X B 1) P[
( X A X B ) ( A B )
2
A
B2
n A nB
1 (7,2 6,7)
2
0,8
0,7
34
40
X Z12 Z 22 ... Z n2
Tiene una distribucin Chi Cuadrado con n grados de libertad.
Notacin. Si X es una variable aleatoria continua con distribucin Chi-Cuadrado y
2
grados de libertad, lo indicaremos X~ .
El subndice de la v.a.
independientes de las que
v.a.
2 .
2 = 2 + 2
1
2
tambin tiene una distribucin chi-cuadrado con = 1+2 grados de libertad.
Grados de libertad
Pgina 16 de 32
Qu son los grados de libertad? Podemos definirlos como el nmero de valores que
podemos elegir libremente.
Por ejemplo, supongamos que estamos tratando con una muestra de tamao 2, los
valores de muestra son a y b, y sabemos que tienen una media de 18. Simblicamente la
situacin es:
ab
18
2
Cmo podemos encontrar los valores que a y b pueden tomar en esta situacin? La
respuesta es que a y b pueden ser cualquier valor cuya suma entre los dos sea 36, ya que
36 dividido 2 es 18.
Suponga que sabemos que a tiene el valor 10. Ahora b ya no es libre de tomar cualquier
valor, sino que debe de tomar el valor 26, ya que:
si a = 10
entonces
10 b
18
2
2. Puesto que
2.
Pgina 17 de 32
E( 2 )
y Var( 2 ) 2
1
1
(2)/2 x/2
e
(/2) x
2
f ( x) (x) 2 2
si x 0
en caso contrario
x
x u ( 2) / 2 e u / 2
2
2
F ( x ) P( x) du
du
/2
2
/
2
)
0
0
Esta integral no tiene primitiva, se resuelve por mtodos numricos. Igualmente en este
curso nos manejaremos con tablas de probabilidad.
Uso de la tabla de la distribucin Chi-Cuadrado. Ejemplos
Veamos como usar una tabla de probabilidad acumulada para esta distribucin.
La tabla que puede verse en el Anexo presenta la densidad de probabilidad de una v.a.
Chi Cuadrado para distintos grados de libertad (=1,2,,10) y distintos valores de x (de
0 a 20 con incremento 0,2). En la fila superior estn los valores de y en la columna de
la izquierda los de x; donde se cruzan la columna de la buscada y la fila de la x, se
encuentra el valor de la probabilidad a cumulada desde 0 a la x buscada.
Pgina 18 de 32
Veamos algunos ejemplos que muestran como debe usarse la tabla Chi Cuadrado que
aparece en el Anexo.
Ejemplos. Hallar:
1. P( 42 1,2)
P( 42 1, 2) 0,121901
2. P( 62 3,4)
P ( 62 3,4) 1 P ( 62 3,4) 1 0,242777 0,757223
3. P(3,4 82 5,6)
P(3, 4 82 5,6) P( 82 5,6) P( 82 3, 4) 0,308063 0,093189)
0,214874
Interpolacin lineal. La funcin chi cuadrado es continua para x>0, pero en la tabla
solo se recogen algunos de sus valores (el nmero de valores existentes en la tabla
siempre es finito), para calcular los valores no encontrados en la tabla podemos usar
interpolacin lineal.
La interpolacin lineal parte de dos puntos conocidos e la funcin, y los valores
intermedios los determina por la recta que une estos dos puntos. Este mtodo siempre
Pgina 19 de 32
aade un cierto error al sustituir la funcin y=f(x) por la recta r(x) que une los dos
puntos en cuestin.
La expresin:
x x1
( y 2 y1 ) y1
x2 x1
determina la ecuacin de la recta y=r(x) que pasa por los puntos (x1,y1) y (x2,y2) siendo
x1<x< x2.
Ejemplo. Hallar: P( 52 1,75)
El valor 1,75 no est en la tabla, pero si encontramos los ms prximos: 1,6<1,75<1,8 y
se observa:
P ( 52 1,6) 0,098751
P ( 52 1,8) 0,123932
sustituyendo en la expresin: y
x x1
x 2 x1
( y 2 y1 ) y
1
se obtiene:
1,75 1,6
(0,123932 0,098751) 0,098751 0,117637
1,8 1,6
x x1
( y2 y1 ) y1
x2 x1
1,2 1,064
(0,2 0,1) 0,1 0,1232
1,649 1,064
(n) (1)
n 1
(n 1) n (n)
(1) 1
(1 / 2)
S2
1 n
2
(Xi X )
n 1 i 1
es natural esperar que se use esta v.a. como un estimador de la varianza poblacional 2,
de una distribucin normal, cuando no se conoce 2.
El proceso de estimacin puede considerarse como sigue:
la varianza de una distribucin normal se desconoce, entonces se toma una muestra
aleatoria de n observaciones, se calcula la v.a. S2 y se usa este valor como un estimador
de 2.
Se encuentra 2 bien estimado por S2?
Una medida de la aproximacin de S2 a 2 est dada por:
P(a
S2
b) sindo a y b nmeros reales positivos.
2
Se usa S2/2 como una medida de aproximacin, en vez de S2-2, porque la distribucin
de S2/2 se obtiene fcilmente, mientras la distribucin de S2-2 es difcil de obtener.
Pgina 22 de 32
As como en el caso de una v.a. X con distribucin N(,2) usamos una transformacin
para obtener otra v.a. Z con distribucin N(0,1), cuyos valores de probabilidad se
encuentran tabulados; en el caso de la v.a. S2 hacemos algo similar.
La transformacin, en este caso, se hace pasando a la variable:
(n 1)S2
(chi - cuadrado) (1)
2
2n 1
(n 1).S2
(2)
2
(n 1).S2
2
distribucin N(, ) entonces la v.a. n 1
tiene una distribucin chi
2
2
Pgina 23 de 32
2
2
(n 1) S 2
]
P(a n21 b) P[a
b] P[a
S2 b
(n 1)
(n 1)
2
Como vemos una afirmacin de tipo probabilstico respecto a 2 se puede transformar
fcilmente en otra equivalente a S2.
Ejemplo. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones
de una poblacin con varianza 2=6, tenga una varianza muestral:
1. mayor que 9,1.
2. entre 3,462 y 10,745.
Solucin
36,4
2
6
2
]
6
6
6
42,98) P( 224 42,98) P( 224 13,462)
P(3,462 S2 10,745) P[
P(13,847 224
3.5
Pgina 24 de 32
desviacin estndar
o lo que es lo mismo: Z
X
N (0,1)
Para calcular Z se requiere que sea conocida. Si no se conoce y tratamos con una
muestra pequea se requiere un estadstico distinto de Z.
Es as que definimos:
T
X
S
n
( )
2
para 2
2
Z
(1)
2
donde:
(n 1) S 2
X
2
y
Z
2
n
Al sustituir en la frmula (1):
X
X
n
n
S
(n 1)S 2
S2
2
2
n(X )
n ( X ) X
S
S
n
n 1
Por tanto:
T
X
con = n-1 grados de libertad.
S
n
Pgina 26 de 32
buscar su
probabilidad acumulada p.
Uso de tablas de la distribucin t. Ejemplos
En la tabla, que se encuentra en el Anexo, hay dos entradas, en la fila superior estn los
valores de y en la columna de la izquierda los de x, para x0, con incrementos de
0,05. Para cada valor de y de x correspondiente se obtiene la probabilidad acumulada
expresada con 3 cifras decimales.
Observacin. Se acostumbra representar con t el valor t por arriba del cual se encuentra
un rea igual a
derecha de la distribucin.
Esto es: t 0,95 t 0,05 ; t 0,99 t 0,01; etc.
Ejemplos.
1. Calcular: P(t9 0,25)
Solucin
Buscando en la tabla en la columna del 9, y la fila de 0,25 se obtiene:
Pgina 27 de 32
1 0,901 0,099
Debemos tener en cuenta aqu que: para conocer P(t n x) siendo x>0, teniendo
en cuenta los dos principios:
La suma de probabilidades acumuladas menor y mayor que x es 1
La simetra de la distribucin t de Student.
Por tanto: P(t n x) P(t n x) 1
despejando: P(t n x) 1 P(t n x )
Pgina 28 de 32
Pgina 29 de 32
0,87 0,85
(0,805 0,792) 0,792 0,7972
0,90 0,85
a esta estandarizacin es
Pgina 30 de 32
X
S
n
X 518 500
2,25
S
40
n
25
Pgina 31 de 32
Este es un valor muy por encima de 1,711. Si se desea obtener un valor de t con 24
grados de libertad igual o mayor a 2,25 e busca en la tabla y es aproximadamente igual a
0,02. Por tanto es probable que el fabricante concluya que el proceso produce un mejor
producto del que piensa.
3.6
3.6.1 Teorema 1
Sean:
X una v.a. con f.d.p. f(x) y F.d.a. F(x).
(X1, X2,, Xn) muestra aleatoria de tamao n de la v.a. X.
X(m)=mn(X1, X2,, Xn) el mnimo muestral.
Pgina 32 de 32