Sunteți pe pagina 1din 11

Estadstica Inferencial.

En diversas investigaciones estadsticas el principal objetivo puede ser el estudio de


algn parmetro de una poblacin, por ejemplo el Gasto medio diario en pasajes de
todos los alumnos de la UNMSM, o la Proporcin de alumnos sanmarquinos que
estudiaron en un colegio particular.
La Estadstica Inferencial proporciona los mtodos para que a travs de la informacin
muestral se pueda obtener informacin respecto a los Parmetros Poblacionales.
Estos mtodos son:
a. Estimacin de Parmetros.
b. Prueba de Hiptesis respecto a los Parmetros.
c. Prueba de hiptesis respecto al comportamiento de la variable.
Para aplicar los mtodos antes mencionados es necesario considerar un modelo
probabilstico que se ajuste lo mejor posible a los datos de la variable poblacional de
inters.
Ejemplo.
Consideremos la variable, X, Gasto diario en pasaje de un alumno sanmarquino.
Dado que el total de alumnos sanmarquinos es de N = 30000, si se lleva a cabo un censo
se obtendrn 30000 datos.
Se construye el histograma o polgono de frecuencias. Supongamos que la grfica tiene
la forma siguiente:
90
80

Frequency

70
60
50
40
30
20
10
0
0

10

15

C1

Se halla el gasto diario medio, UX, y la variabilidad del gasto diario en pasajes, X .
Con la grfica y los valores de X , X se tiene toda la informacin necesaria
correspondiente a la variable X.
Si tratamos de encontrar el modelo probabilstico que se ajuste a los datos de la variable,
X , por la forma del histograma, podemos decir que el modelo normal es el que mejor
se ajusta, y por lo tanto decimos que: X tiene distribucin N( X , X2 ).
Observemos que el valor de X y X son conocidos porque, como se llev a
cabo el censo, se cuenta con todos los datos poblacionales, pero en situaciones reales no
se conocen estos valores y precisamente para obtener informacin de estos valores o
parmetros, necesitamos contar con la informacin de una muestra.

Muestra Aleatoria
Antes de dar la definicin de muestra aleatoria, definiremos algunos conceptos:
X: Variable de inters o poblacional.
Poblacin de individuos: Conjunto de individuos, pueden ser personas, objetos o
animales, en cada uno de los cuales se mide u observa la variable de inters, X.

N: Nmero de elementos de la poblacin o tamao de la poblacin.


Muestra de Individuos: Parte de la poblacin de individuos.
Previamente a la seleccin de individuos integrantes de la muestra se debe:
Determinar el nmero de individuos que se va a seleccionar, es decir n. Este
nmero n se determina a travs de un mtodo estadstico.
Determinar la forma en que se va a seleccionar a cada uno de los individuos.

Forma de seleccionar a los individuos integrantes de


la Muestra.
Bajo el supuesto que ya se determino el tamao de muestra.
Forma 1.
1. Se enumeran a los individuos integrantes de la poblacin, 1,2,... , N.
2. Se elaboran fichas del mismo tamao y del mismo material y en estas se registran
los nmeros del 1 al N, y se depositan en una urna.
3. Se seleccionan n fichas, la seleccin puede ser:
a. Con reposicin.
Se selecciona una ficha, se devuelve esta ficha a la urna de donde se est
seleccionando y as sucesivamente hasta obtener las n fichas.
Cada ficha representa a un individuo, esta forma de seleccin, hace que cada
individuo tenga la misma probabilidad de seleccin, es decir 1/N. A la muestra
de individuos as obtenida se le llama, Muestra Aleatoria.
Como en cada individuo seleccionado para ser integrante de la muestra, se va
observar o medir la variable X, entonces cada individuo puede ser representado
por las variables, es decir:
X1: representa al individuo 1.
X2: representa al individuo 2.
.
.
.
.
.
.
Xn: representa al individuo n
Entonces al conjunto de variables (X1, X2, , Xn) se le llama muestra
aleatoria de la variable X.
b. Sin reposicin.
Cada ficha se selecciona una despus de otra, hasta obtener n fichas, pero con
esta forma de seleccin cada individuo no tiene la misma probabilidad de ser
seleccionado, por lo tanto la muestra de n individuos as seleccionada, no
constituye una muestra aleatoria, pero si N es muy grande en relacin a n, es
decir n/N <= 0.05, entonces la muestra de n individuos obtenida sin reposicin
se considera Muestra Aleatoria.
Forma 2.
1. Se enumeran a los individuos integrantes de la poblacin, 1,2,... , N.
2. Se selecciona al azar un nmero de la tabla de nmeros aleatorios, ste nmero
sirve de partida, porque a partir de l se sigue una direccin predeterminada, por

ejemplo hasta el final de la columna, para luego tomar la columna siguiente a la


derecha.
3. Los nmeros que se leen en la tabla deben tener tantas cifras como tenga N
4. Se leen los nmeros aleatorios hasta completar los n elementos integrantes de la
muestra.
Ejemplo.
De los alumnos matriculados en el curso de Estadstica II, seleccione una muestra de
tamao 8.
Esta muestra de individuos es una muestra aleatoria?
Solucin.
1. Los alumnos matriculados son 42.( se cuenta con el listado)
2. Se selecciona al azar el nmero aleatorio de partida y resulta ser el de la dcima
fila y cuarta columna., Este nmero es 34
3. A partir de este nmero se leen nmeros de 2 cifras hasta completar los 8
elementos de la muestra, siendo estos:
Si se selecciona con reposicin: 34, 42 ,06, 13, 42, 39, 33, 08. Esta muestra es
una muestra aleatoria.
Si se selecciona sin reposicin: 34, 42, 06, 13, 39, 33, 08, 01. Esta muestra no es
una muestra aleatoria porque la fraccin de muestreo n/N = 0.1904 > 0.05

Distribuciones Muestrales.
A partir de una muestra de una variable aleatoria X se pueden formar otras variables
aleatorias algunas de las cuales juegan un papel muy importante en la inferencia
estadstica. Las principales variables que se pueden obtener son, por ejemplo:
La media Muestral, la Varianza Muestral y la Proporcin Muestral, etc. A la
Distribucin de Probabilidades de cada una estas de estas variables se llama
Distribucin muestral.
Distribucin muestral de la media muestral.
Ejemplo
Consideremos una poblacin constituida por las secretarias, a, b, c y d a quienes se les
pidi que digiten una carta y se observ el nmero de palabras mal digitadas y los
resultados fueron 2, 3, 3, 4 respectivamente.
Conceptos bsicos:
UO: La secretaria
Conjunto de unidades de observacin: las 4 secretarias, constituyen la poblacin de
individuos.
Variable (X): Nmero de palabras mal digitadas. (A esta se le considera la variable
poblacional)
Cuyo recorrido es: RX : 2, 3, 4
La distribucin de frecuencias relativas es:
xi
2
3
4

h(xi)
1/4
2/4
1/4

El nmero medio de palabras mal y la varianza de palabras mal digitadas, es decir:


X 12 4 3 palabras mal digitadas.

X2 38 4 9 0.5 palabras mal digitadas 2


Dado que ya tenemos esta informacin poblacional respecto a la distribucin de de loa
datos, es decir el nmero de palabras mal digitadas esta en torno al valor 3, tambin nos
dice que el nmero medio de palabras mal digitadas es 3, con una dispersin de 1.71
palabras mal digitadas.
Hasta aqu no hay nada de aleatorio.
Sin embargo, si llevamos a cabo el siguiente experimento: Seleccionar una de las cartas
digitadas y observar el nmero de palabras mal digitadas.
Exp. Aleatorio.
Accin: seleccionar una carta.
Interesa: Observar el nmero de palabras mal digitadas. (X) luego
= RX = { 1, 2, 3 }.
Y su distribucin de probabilidades es:
x p(x)
2 1/4
3 2/4
4 1/4
Asimismo su media y varianza son:
E(X) = X 12 4 3 palabras mal digitadas.
2
2
V(X) = X 38 4 9 0.5 palabras mal digitadas
A partir de esto, podemos hablar de la variable aleatoria poblacional es decir Nmero
de palabras mal digitadas, con su correspondiente funcin de cuanta igual a la
distribucin de frecuencias relativas, esperanza y varianza iguales a la media y varianza
poblacional obtenidas a partir de los datos poblacionales. En situaciones reales la
informacin poblacional no se conoce.
Veamos que ocurre, en cuanto al valor de la media muestral, cuando se selecciona
una muestra de tamao 2.
A partir de esta poblacin de secretarias seleccionemos todas las posibles muestras de
tamao 2, en las siguientes formas:
a. Con reposicin.
El procedimiento a seguir es, en fichas iguales se registra el nombre de cada una de las
secretarias, se depositan las fichas en una caja, se mezclan las fichas y se selecciona una
ficha, se repone la ficha a la caja, se mezclan las fichas y se selecciona otra ficha.
Exp. Aleat.
Accin: seleccionar dos fichas con reposicin. (se genera las posibles muestras de
tamao 2)

Interesa observar: el nmero de errores que cometi cada secretaria integrante de la


muestra. Genera pares de datos.
= { (a,a), (a,b), .., (d,d)} = {(2,2), (2,3), (2,3),..,(4,4)}
Sea la variable:
: Nmero medio de palabras mal digitadas en la muestra,

.
.
.
.
Este procedimiento resumido en la siguiente tabla

Nmero de Elementos o individuos


integrantes de la muestra
posibles
Muestras
(espacio muestral )

Media
Muestral
Datos
muestrales (X)

2,5

2,5

2,5

3,5

2,5

10

11

12

3,5

13

14

3,5

15

3,5

16

Finalmente tenemos que los posibles valores de

: 2, 2.5, 3, 3.5, 4
Y su distribucin de probabilidades es:

son:

"1/16
"4/16
"6/16
"4/16
"1/16

2,5
3
3,5
4

Esta tabla muestra el comportamiento probabilstico del nmero medio de


palabras mal digitadas, es decir, est indicando que es poco probable que el
nmero medio de palabras mal digitadas sea 2 o 4, es ms probable que el
nmero medio de palabras mal digitadas este en torno a 3 o tome el valor 3.
Previo a estos clculos, habamos obtenido, que el nmero medio de
palabras mal digitadas a partir de los datos poblacionales era 3, ahora la
distribucin muestral del nmero medio de palabras mal digitadas
,
indica qu, cuando se seleccion una sola muestra es ms probable que el
valor medio de esa muestra de datos este cerca de 3, esa probabilidad nos
da una garanta de que el valor de la media muestral, estar muy cerca del
valor del parmetro.

Estos resultados quedan expresados en la siguiente teora.

Distribucin
muestral
o
Distribucin
probabilidades de la Media Muestral

de

Sea X una variable aleatoria con media X y varianza X , y sea X1, X2, , Xn una
n

muestra aleatoria de X. Sea la variable

X
i 1

cuyas propiedades son:

a. E X X , (la esperanza de la media muestral es igual a la media


poblacional).
X2
b. V X
,(la varianza de la media muestral es igual a la varianza
n
poblacional dividida entre el tamao de la muestra)

c. Para n suficientemente grande, la Variable

X X
n

tiene aproximadamente la

distribucin N(0,1). Se considera una buena aproximacin si n 30


Demostracin de las propiedades.
n
X i 1 n
n

a. E X E i 1 E X i
n
n n i 1

b. V X V

1
2
n n

i 1

n X2 X2

V
X

n2
n
i 1

Observacin
X2 es la varianza de la variable poblacional X.

V X tambin se denota por X2 , esta es la varianza de la variable X .


A X que es la desviacin estndar de X .se le da el nombre de error
estndar.

Distribucin muestral de la Varianza Muestral


Sea X una variable aleatoria con media X y varianza X , y sea X1, X2, , Xn una

X
n

muestra aleatoria de X. Sea la variable

S2

i 1

que cumple las siguientes

n 1
propiedades:
2
a. E(S2) = X .(La esperanza de la varianza muestral es igual a la varianza
Poblacional)
2
2
b. Si X tiene distribucin normal, la variable n 1 S es una variable
aleatoria con distribucin Ji-cuadrado con n-1 grados de libertad

Distribucin nuestral de la Proporcin Muestral.


Sea la variable

y sea X1, X2, , Xn una muestra aleatoria de X.

Consideremos la variable
llamada proporcin muestral, cuyas
propiedades son:
a.
(La esperanza de la proporcin muestral es igual a la proporcin
poblacional)

b. Si n suficientemente grande
n 30.

. (Se obtiene buena aproximacin si

Ejemplo
Construccin de la distribucin muestral de X : Nmero Medio muestral de palabras
mal digitadas
considerando n = 3.
Posibles
Muestras
1
2
3
4

Elementos o individuos
de la muestra
a
a
a
a
a
b
a
a
c
a
a
d

2
2
2
2

datos
muestrales
2
2
2
2

2
3
3
4

Media
muestral
2
2,33
2,33
2,67

5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58

a
a
a
a
a
a
a
a
a
a
a
a
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
d
d
d
d
d
d
d
d
d
d

b
b
b
b
c
c
c
c
d
d
d
d
a
a
a
a
b
b
b
b
c
c
c
c
d
d
d
d
a
a
a
a
b
b
b
b
c
c
c
c
d
d
d
d
a
a
a
a
b
b
b
b
c
c

a
b
c
d
a
b
c
d
a
b
c
d
a
b
c
d
a
b
c
d
a
b
c
d
a
b
c
d
a
b
c
d
a
b
c
d
a
b
c
d
a
b
c
d
a
b
c
d
a
b
c
d
a
b

2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4

3
3
3
3
3
3
3
3
4
4
4
4
2
2
2
2
3
3
3
3
3
3
3
3
4
4
4
4
2
2
2
2
3
3
3
3
3
3
3
3
4
4
4
4
2
2
2
2
3
3
3
3
3
3

2
3
3
4
2
3
3
4
2
3
3
4
2
3
3
4
2
3
3
4
2
3
3
4
2
3
3
4
2
3
3
4
2
3
3
4
2
3
3
4
2
3
3
4
2
3
3
4
2
3
3
4
2
3

2,33
2,67
2,67
3
2,33
2,67
2,67
3
2,67
3
3
3,33
2,33
2,67
2,67
3
2,67
3
3
3,33
2,67
3
3
3,33
3
3,33
3,33
3,67
2,33
2,67
2,67
3
2,67
3
3
3,33
2,67
3
3
3,33
3
3,33
3,33
3,67
2,67
3
3
3,33
3
3,33
3,33
3,67
3
3,33

59
60
61
62
63
64

d
d
d
d
d
d

c
c
d
d
d
d

c
d
a
b
c
d

4
4
4
4
4
4

3
3
4
4
4
4

3
4
2
3
3
4

3,33
3,67
3,33
3,67
3,67
4

Cuyo recorrido es: RX : 2, 2.33, 2.67, 3, 3.33, 3.67, 4


Y su funcin de cuanta es:
x
2
2.33
2.67
3
3.33
3.67
4

P( X x )
1/64
6/64
15/64
20/64
15/64
6/64
1/64

E ( X ) = 3 y V ( X ) = 0.16667
Cuadro resumen.
Esperanza y varianza de
n
2
3

E(X )
3
3

V(X )
0,25
0,16667

A partir de este cuadro observamos que cuando el tamao de muestra crece, los valores
de X estn menos dispersos, y segn la distribucin de probabilidades vemos que hay
ms datos de que estn mucho ms cerca del valor 3 y 3 precisamente es el valor de la
media poblacional que es desconocida. Tambin podemos observar que el
comportamiento probabilistico de X es simtrico, por lo que podemos decir que su
comportamiento se ajusta al modelo probabilistico Normal.
Teorema del Lmite Central.
Por propiedades de la Distribucin Normal, s, X 1 , X 2 ,..., X n son variables aleatorias
normales e independientes, la suma X 1 X 2 ... X n tambin tiene distribucin
normal. Ahora la pregunta es Cul es la distribucin de esta suma cuando las variables
X i no son normales? La respuesta es, no siempre es normal.
Sin embargo, si n es suficientemente grande, la suma tiene distribucin
aproximadamente normal. Este resultado constituye lo que se llama el Teorema del
Lmite central.
Enunciado del teorema del Lmite Central.

Sea

X 1 , X 2 ,..., X n ,... una sucesin de variables aleatorias independientes con media

X 1 X 2 ... X n X X

X n
X n
La distribucin de su datos tiende a la distribucin normal estndar cuando n crece hacia
el infinito.
En la prctica, s n > 30 se tiene una buena aproximacin.
Este teorema da lugar a lo que consideramos muestra pequea y muestra grande, as:
S n <= 30 muestra pequea
S N > 30 muestra grande.
X y varianza X2 . Se cumple que la variable aleatoria:

Observacin.
S X 1 , X 2 ,..., X n es una m.a de X, donde X tiene cualquier funcin de distribucin,
2
con media X y varianza X , entonces por el teorema del lmite central,
X N ( X , X2 / n) cuando n grande.
En la prctica s n > 30 se tiene una buena aproximacin.
Ejemplo 8.
La distribucin de los pesos, X, de cada una de las cartas que se enviaron por correo
tiene media y desviacin estndar igual a 20 gr. Y 5 gr. Respectivamente. Se selecciona
una m.a de 50 cartas.
a. Cul es la fdp de la variable poblacional?
b. Halle, la media y desviacin estndar del Peso medio muestral.
c. P( P ( X X 2)
d. P (25 X 31)
La teora dad respecto de la distribucin muestral hasta esta parte,
corresponde a lo que se llama, para poblaciones finitas grandes o
poblaciones infinitas.
Hemos visto a travs de los ejemplos que la distribucin muestral de la Media
Muestral, no depende de la distribucin de la variable aleatoria poblacional, X, es decir
puede proceder de un variable poblacional, X, con distribucin normal, Poisson.
Binomial, Hipergeomtrica o Bernoulli, trataremos la distribucin de la media muestral,
X , cuando la muestra proviene de una variable aleatoria poblacional Normal y de una
Bernoulli.
Distribucin Muestral de la media Muestral en una poblacin Normal con
Varianza conocida.
2
1. Si X 1 , X 2 ,... X n es una m.a seleccionada de una poblacin N( X , X ), entonces:

X : N ( X , X2 / n) cualquiera sea el tamao de muestra.


2
2. Si X 1 , X 2 ,... X n es una m.a seleccionada sin reposicin de una poblacin N( X , X

), finita de tamao N, entonces: X

X2 N n
N ( X ,

)
n N 1

Ejemplo.
Una variable aleatoria X tiene distribucin Normal con media 10 y desviacin estndar
4. A los participantes de un juego se les permite observar una muestra de cualquier
tamao y calcular la media muestral, gana un premio aquel cuya media muestral fuere
mayor que 12.
a. Si un participante selecciona una m.a. de tamao 16. Cul es la probabilidad
que gane el premio?
b. Escoja usted un tamao de muestra diferente de 16, para participar en el juego.
Cul es la probabilidad de que usted gane el premio?
c. Basndose en los resultados anteriores. Cul es el mejor tamao de la muestra
para participar en el juego?

S-ar putea să vă placă și