Documente Academic
Documente Profesional
Documente Cultură
ESTADSTICA
INTRODUCCIN A LA INFERENCIA
INTRODUCCIN
A
LA
INFERENCIA
Cuando en estadstica se puede observar todos los elementos de un
colectivo (observacin exhaustiva) entonces la tarea de la estadstica se
reduce a describir las caractersticas y regularidades: Estadstica
Descriptiva.
Pero frecuentemente, NO podemos conocer TODOS los elementos
El estudio de los elementos del colectivo puede implicar la
destruccin del propio elemento:
Estudiar la vida media de una partida de bombillas
La tensin de rotura de un cable
Los elementos pueden existir conceptualmente, pero No en la realidad
Poblacin de piezas defectuosas que producir una mquina
Puede ser inviable econmicamente (coste) estudiar todos los
elementos del colectivo
INTRODUCCIN A LA INFERENCIA
INTRODUCCIN
A
LA
INFERENCIA
La poblacin o colectivo estudiado, es el conjunto de personas u
objetos que se desea investigar.
La muestra, es un subconjunto representativo de la poblacin.
Dependiendo del tamao de la poblacin y del tipo de estudio
se trabajar con una muestra o con toda la poblacin.
INTRODUCCIN
A
LA
INFERENCIA
Esquema de cmo se lleva a cabo un estudio estadstico
INTRODUCCIN
A
LA
INFERENCIA
Se denomina muestreo al procedimiento mediante el cual se elige
una muestra.
La muestra debe ser representativa de la poblacin que se desea
estudiar y reflejar las caractersticas de los elementos que la
componen.
Existen muchos tipos de muestreo que se pueden resumir en dos
grandes grupos: muestreo probabilstico y no probabilstico.
Muestreo
no
probabils0co
La
seleccin
de
la
muestra
no
es
aleatoria,
sino
que
se
basa,
en
parte,
en
el
juicio
del
responsable
de
la
invesEgacin.
Muestreo
probabils0co
Se
eligen
las
unidades
muestrales
a
travs
de
un
proceso
aleatorio.
Cada
elemento
de
la
poblacin
Eene
una
probabilidad
conocida
de
ser
elegido
INTRODUCCIN
A
LA
INFERENCIA
Se denomina muestreo al procedimiento mediante el cual se elige
una muestra.
La muestra debe ser representativa de la poblacin que se desea
estudiar y reflejar las caractersticas de los elementos que la
componen.
Existen muchos tipos de muestreo que se pueden resumir en dos
grandes grupos: muestreo probabilstico y no probabilstico.
Muestreo
no
probabils0co
La
seleccin
de
la
muestra
no
es
aleatoria,
sino
que
se
basa,
en
parte,
en
el
juicio
del
responsable
de
la
invesEgacin.
Muestreo
probabils0co
Se
eligen
las
unidades
muestrales
a
travs
de
un
proceso
aleatorio.
Cada
elemento
de
la
poblacin
Eene
una
probabilidad
conocida
de
ser
elegido
INTRODUCCIN
A
LA
INFERENCIA
Muestreo probabilstico
Este tipo de muestreo se base en la estadstica terica, lo que
permite acotar los errores cometidos o evaluar la precisin.
Es el nico mtodo que puede evaluar la representatividad de la
muestra.
Existen diversos procedimientos, pero todos ellos se basan en un
proceso de azar.
INTRODUCCIN
A
LA
INFERENCIA
Procedimientos de muestreo probabilstico
Muestreo aleatorio.
Sistemtico.
Estratificado.
Conglomerados.
INTRODUCCIN
A
LA
INFERENCIA
Muestreo Aleatorio Simple - M.A.S
Es un muestreo sin reemplazamiento
Todas las unidades que componen la poblacin tienen la misma
probabilidad de ser elegidas
Para realizar un M.A.S se necesita la enumeracin de las N unidades
que componen la poblacin para obtener aleatoriamente una muestra
de nmeros comprendidos entre 1 y N hasta formar una muestra de n
unidades.
La dificultad consiste en la localizacin previa de todos los elementos
de la poblacin, lo cual suele resultar muy difcil en la prctica. Por eso
se acude a procedimientos pseudoaleatorios, intentando que todas las
unidades de la poblacin tengan la misma probabilidad de ser elegidas.
En lo que sigue trabajaremos con m.a.s.
INFERENCIA
INTRODUCCIN A LA INFERENCIA
INTRODUCCIN
A
LA
INFERENCIA
La Inferencia es el Proceso mediante el cual se utiliza la
informacin de una muestra para extraer conclusiones de la
poblacin:
1. Utilizar la Muestra para estimar las caractersticas de la
Poblacin (Teora de la Estimacin)
2. Emitir Hiptesis sobre las caractersticas tomando como base la
experiencia, otras informaciones o incluso el presentimiento o
la corazonada (Contrastacin de Hiptesis)
INTRODUCCIN A LA INFERENCIA
Qu conozco?
DISTRIBUCIN
(NORMAL,
POISSON)
Estimar parmetros
de la distribucin
INFERENCIA
PARAMTRICA
NO
SABEMOS
NADA
DE
LA
DISTRIBUCIN
INFERENCIA NO
PARAMTRICA
INTRODUCCIN A LA INFERENCIA
Qu conozco?
DISTRIBUCIN
(NORMAL,
POISSON)
Estimar parmetros
de la distribucin
INFERENCIA
PARAMTRICA
NO
SABEMOS
NADA
DE
LA
DISTRIBUCIN
INFERENCIA NO
PARAMTRICA
INTRODUCCIN
A
LA
INFERENCIA
Un ingeniero est interesado en conocer la velocidad media de
transmisin de datos a travs de un nuevo sistema ptico.
Mide la tasa de transferencia de datos en 20 ocasiones, obteniendo una
tasa media de 148 Mbps.
148 Mbps es un estimador puntual de la verdadera tasa
de transmisin.
IC95%=[145,150]: tenemos una confianza del 95 % de
que el verdadero valor de la velocidad media est entre 145
y 150 Mbps.
La tasa media de transmisin es como mucho 150 Mbps?
INTRODUCCIN
A
LA
INFERENCIA
Un ingeniero est interesado en conocer la velocidad media de
transmisin de datos a travs de un nuevo sistema ptico.
Mide la tasa de transferencia de datos en 20 ocasiones, obteniendo una
tasa media de 148 Mbps.
ESTIMACIN
PUNTUAL
ESTIMACIN
POR
INTERVALOS
CONTRASTE DE La
HIPTESIS
ESTIMACIN
PUNTUAL
Y
POR
INTERVALOS
ESTIMACIN
El objetivo de la estimacin de parmetros es proveer de
mtodos que permitan determinar, con cierta precisin, el valor de
los parmetros de un modelo a partir de una muestra extrada de la
poblacin.
En la muestra
En la poblacin
Su equivalente
Media poblacional:
2
Varianza poblacional:
Proporcin poblacional:
Media muestral: x
2
Varianza muestral: S
Proporcin muestral: p
ESTIMACIN
PUNTUAL
Muestra de tamao n
Cada X i es una variable aleatoria
- Son independientes
Muestra
concreta (x1 , x2 , , xn )
- Todas tienen la misma distribucin
Un estadstico es cualquier funcin de las observaciones en una
n
muestra aleatoria
X
(X1 , X 2 ,, X n )
f ( X 1 , X 2 ,..., X n ) = X i ;
f ( X 1 , X 2 ,..., X n ) =
i =1
i =1
X
i =1
= X =
ESTIMACIN
PUNTUAL
Ejemplos
de
esEmadores
T = X = i=1
n
2
Estimadores de la varianza poblacional
Estimador de la media poblacional
T1 =
(X
i =1
X)
= S ; T2 =
(X
i =1
X)
n 1
=S
Cuasivarianza
2
c
ESTIMACIN
PUNTUAL
Los estadsticos y estimadores son variables aleatorias que tendrn una
distribucin de probabilidad con una media y una desviacin tpica.
Ejemplo
Sea X= n de hermanos. Tomamos muestras de tamao 3 y calculamos su media.
Muestra 1:
Muestra 2:
Muestra 3:
x=3
x=2
x = 2.33
Muestra k:
x = 1.66
ESTIMACIN
PUNTUAL
Propiedades de los estimadores
significa ...
ESTIMACIN
PUNTUAL
Propiedades de los estimadores
Un estimador debera estar cerca, en algn sentido, del verdadero
valor del parmetro: INSESGADEZ.
Un estimador es insesgado o centrado si su media coincide con el
verdadero valor del parmetro (para cualquier tamao muestral)
T es un estimador insesgado del parmetro si E[T ] =
Llamamos Sesgo a la diferencia:
E[T ]
ESTIMACIN
PUNTUAL
Propiedades de los estimadores
Otra propiedad deseable es que la varianza de un estimador sea lo
ms pequea posible: EFICIENCIA.
La eficiencia o precisin de un estimador T es la inversa de su
varianza:
1
Efic[T ] =
Var[T ]
ESTIMACIN
PUNTUAL
Propiedades de los estimadores
Y si tenemos dos estimadores, T1 y T2, del mismo parmetro, ,
siendo T1 insesgado pero T2 ms eficiente que T1, cul escogemos?
Preciso y centrado
(insesgado y eficiente)
Caso ideal
ESTIMACIN
PUNTUAL
Propiedades de los estimadores
Y si tenemos dos estimadores, T1 y T2, del mismo parmetro, ,
siendo T1 insesgado pero T2 ms eficiente que T1, cul escogemos?
El que tenga un menor ERROR CUADRTICO MEDIO.
Medio
ESTIMACIN
PUNTUAL
Propiedades de los estimadores
Y si tenemos dos estimadores, T1 y T2, del mismo parmetro, ,
siendo T1 insesgado pero T2 ms eficiente que T1, cul escogemos?
El que tenga un menor ERROR CUADRTICO MEDIO.
ESTIMACIN
PUNTUAL
Propiedades de los estimadores
Y si el estimador no es insesgado, qu es lo mnimo que le
podemos exigir? La CONSISTENCIA.
Diremos que un estimador es consistente cuando se aproxima al
valor del parmetro al crecer el tamao muestral. Describe el
comportamiento del estimador cuando el tamao de la muestra
crece.
Se puede considerar como el requisito mnimo que se exige a un
estimador
lim E[Tn ] =
n
lim Var[Tn ] = 0
n
ESTIMACIN
PUNTUAL
Propiedades de los estimadores
Cmo se puede medir la fiabilidad de un estimador? Con el ERROR
ESTNDAR del estimador.
Este error trata de captar la variabilidad que tienen los valores del
estimador en todas las posibles muestras de un tamao
determinado.
El error estndar de un estimador es la desviacin tpica de dicho
estimador. Si la desviacin tpica depende del parmetro, la
sustitucin del parmetro por su estimacin da lugar al error
estndar estimado.
ESTIMACIN
PUNTUAL
Estimadores para la media y la varianza
MEDIA
Dadas X1,,Xn variables independientes con media y desviacin tpica .
n
i =1
E [X ] =
Var [ X ] =
EE(X) =
2
n
ES CONSISTENTE
s
Error estndar de la media
n
ESTIMACIN
PUNTUAL
Estimadores para la media y la varianza
VARIANZA
Dadas X1,,Xn variables independientes con media y desviacin tpica .
Para estimar consideramos dos estimadores:
n
T1 =
SESGADO
INSESGADO
(X
i =1
X)
= S 2 ; T2 =
n 1 2
E [T1 ] = E S =
n
E [T2 ] = E S c2 = 2
[ ]
[ ]
2
(X
i =1
X)
n 1
= Sc2
2(n 1) 4
Var[T1 ] = Var S =
2
n
2
Var[T2 ] = Var Sc2 =
4
n 1
[ ]
2
[ ]
ESTIMACIN
PUNTUAL
Algunas distribucin en el muestreo.
Si tenemos X 1 ,...X n variables aleatorias normales, entonces
X
X=
n
~ N ,
Equivalentemente:
Z=
X-
~ N (0,1)
ESTIMACIN
PUNTUAL
Algunas distribucin en el muestreo.
Y si no son normales?
X=
n
" %
~ N $ ,
'
#
n&
Equivalentemente:
Z=
X-
~ N (0,1)
ESTIMACIN
PUNTUAL
Algunas distribucin en el muestreo.
Si las X i no son normales pero n es suficientemente grande, por el
Teorema Central del Lmite tambin sera aproximadamente cierto:
X N ,
o Z=
N (0,1)
ESTIMACIN
PUNTUAL
Algunas distribucin en el muestreo.
Si tenemos X 1 ,...X n variables aleatorias normales, entonces
(n 1)Sc2
2
2
Donde S c
(
X
~ n21
i X)
es la cuasivarianza muestral.
n 1
2
n1
ESTIMACIN
PUNTUAL
Distribucin Chi-Cuadrado con n grados de libertad.
Funcin densidad de distribuciones Chi-cuadrado
0,1
E [ n ] = n
0,08
0,06
Var[ n ] = 2n
0,04
0,02
0
0
20
40
60
80
Si tenemos X 1 ,...X n
entonces
2
2
X
~
i n
i =1
(n 1)S
2
2
c
X X
= i
~ n21
ESTIMACIN
PUNTUAL
Algunas distribucin en el muestreo.
Si tenemos X 1 ,...X n variables aleatorias normales, entonces
T=
Donde
t n 1
X-
~ t n 1
Sc
n
Z
~ tn
X
n
ESTIMACIN
PUNTUAL
Distribucin t-Student con n grados de libertad
Es simtrica, con mayor dispersin que la normal estndar y
tiende a sta al aumentar el valor de n
(prcticamente coinciden si n > 100).
Para valores de n > 30 se puede considerar que la normal estndar da una buena
aproximacin de la t de Student.
E[t n ] = 0
Var[t n ] = n
(n 2)
ESTIMADOR
INTERVALO
IC1 ( ) = [a, b]
P(a b) = 1
Ya veremos
cmo se
obtienen.
Ya veremos
cmo se
obtienen.
IC1 ( ) = [a, b]
P(a b) = 1
Cmo calcular a y b?
Para poblaciones Normales, vamos a ver cmo calcular:
IC para la media
IC para la varianza 2
IC para la proporcin p
IC1 ( ) = [a, b]
Cunto vale a y b?
P ( a b) = 1
1 n
Un estimador de la media poblacional es la media muestral, x = xi
n i =1
y sabemos que tiene la siguiente distribucin
o equivalentemente, z =
x
~ N (0,1)
/ n
x ~ N ,
IC1 ( ) = [a, b]
P ( a b) = 1
N (0,1)
z=
/2
/2
P( z1 / 2 Z z1 / 2 ) = 1
1-
-z1-/2
x
~ N (0,1)
/ n
z1-/2
P( z1 / 2 Z z1 / 2 ) = 1
Despejando
P z1 / 2
z1 / 2 = 1
/ n
P x
z1 / 2 x +
z1 / 2 = 1
n
n
IC1 ( ) = x
z1 / 2 , x +
z1 / 2
n
n
IC1 ( ) = x
z1 /2
n
Precisin
IC1 ( ) = x
z1 / 2 , x +
z1 / 2
n
n
1-=095;
=005;
/2=0025;
IC0.95 ( ) = x
z0'975 , x +
z0'975
n
n
N (0,1)
0025
0025
095
-z0975
z0975
z0.975 = +1.96
IC0.95 ( ) = x
z0'975 , x +
z0'975
n
n
x
x+
z1 / 2
z1 / 2
5
= 20
1.96 = 19.56
100
5
= 20 +
1.96 = 20.44
100
[19'56, 20'44]
x
z1 / 2 x +
z1 / 2
n
n
x
z1 /2
n
x+
z1 /2
n
n=
2
E
z1 / 2 = E
Despejando n
2
1 / 2
n=
2
1 / 2
=2
E = 0'25
z1 / 2 = z0'975 = 1'96
n=24586~246 bateras
x
~ tn1
Sc n
Sc
Sc
IC1 ( ) = x
t n 1,1 / 2 , x +
tn 1,1 / 2
n
n
Sc2 2
n = 2 t n 1,1 / 2
E
Sc
Sc
IC1 ( ) = x
t n 1,1 / 2 , x +
tn 1,1 / 2
n
n
/2=001;
1-/2=099;
n 2
n = 25; x = 151'3; S = 16; S =
S = 16'67; Sc = 4'08
n 1
2
2
c
Sc
Sc
IC1 ( ) = x
t n 1,1 / 2 , x +
tn 1,1 / 2
n
n
t 24
001
001
098
-t099
t099
Ejemplo
Sc
x
t 24, 0 '99 = 151'3
n
Sc
x+
t 24, 0 '99 = 151'3 +
n
4'08
2'492 = 149'27
25
4'08
2'492 = 153'33
25
[149'27,153'33]
Con una confianza del 98%
(n 1)Sc2
2
~ n21
/2
2 / 2
( )
IC1 2
1-
1-/2
12 / 2
(n 1)Sc2 (n 1)Sc2
= 2
, 2
n 1, / 2
n1,1 / 2
( )
IC0.90
15 3645'94 15 3645'94
=
,
2
2
15
,
0
'
95
15
,
0
'
05
2
15,0'05
= 7'26
2
15,0'95
= 25
095
02'95
( )
IC0.90
15 3645'94 15 3645'94
=
,
= [2187'56,7532'93]
25
7'26
2 [2187'56,7532'93]
Con una confianza del 90%
#
p(1 p) &
p N % p,
(;
n '
$
z=
p p
N (0,1)
p (1 p)
n
p (1 p )
p (1 p )
IC1 ( p ) = p z1 / 2
, p + z1 / 2
n
n
p p z1 / 2
p (1 p )
=E
n
n=z
2
1 / 2
p (1 p )
E2
p z1 /2
p + z1 /2
p = 0'36;
z1 / 2 = z0'975 = 1'96
p(1
p)
0'36 0'64
= 0'36 1'96
= 0'266
n
100
p [0'266, 0' 454]
p(1
p)
0'36 0'64
= 0'36 +1'96
= 0' 454 Con una confianza del 95%
n
100