Documente Academic
Documente Profesional
Documente Cultură
UNED
TEMA 8
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN
TEMA 8
ESTIMACIN
Especificacin de la poblacin
Medicin de la variable
CONCEPTOS PREVIOS:
2010
Carmen Voces
UNED
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN: MUESTREO
TEMA 8
2010
UNED
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN: MUESTREO PROBABIL
PROBABILSTICO
TEMA 8
Tamao de las muestras: Hay que tener en cuenta que una muestra debe ser lo
suficientemente amplia para representar adecuadamente las propiedades de la
poblacin y lo suficientemente reducida para que pueda ser examinada en la prctica.
Por lo tanto, el tamao es una caracterstica esencial de una muestra
Los elementos se seleccionan uno a uno, y con reposicin, por lo que la poblacin
permanece idntica en todas las extracciones. No obstante, cuado el tamao de la
poblacin (N) es grande es indiferente que el muestreo sea con o sin reposicin.
Muestreo aleatorio simple. Decimos que hemos extrado una muestra aleatoria simple
cuando:
Tipos de muestreos:
Probabilstico: se conoce, o puede calcularse, la probabilidad asociada a una
determinada muestra y cada elemento de la poblacin tiene una probabilidad
conocida, o calculable, de pertenecer a la muestra.
No probabilstico: Se desconoce, o no se tiene en cuenta, la probabilidad asociada
a cada una de las muestras posibles y se selecciona la muestra que ms
representativa le parece al investigador o aquella que pueda obtenerse ms
fcilmente (voluntarios, alumnos de una determinada clase ...)
2010
UNED
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN: MUESTREO PROBABIL
PROBABILSTICO
TEMA 8
UNED
Introducci
Introduccin al an
anlisis de datos
INFERENCIA ESTAD
ESTADSTICA
TEMA 8
UNED
Introducci
TEMA 8
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN: MUESTREO NO PROBABIL
PROBABILSTICO
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA
ni
f(X)
f(X)
0,2
0,2
Parmetro
Parmetro
0,2
0,2
Media:
0,2
Varianza:
S x2
0,25
0,20
=3
0,15
2 = 2
0,10
= 1,41
0,05
0,00
1
=
7
TEMA 8
La media muestral es una variable aleatoria que toma un valor u otro segn la
muestra concreta a partir de la que se obtenga. En realidad, tendremos tantas
medias como posibles muestras del mismo tamao podamos extraer de la
poblacin. Se denomina distribucin muestral de la media a su funcin de
probabilidad.
Estadstico
Estadstico
Proporcin:
2010
UNED
1+ 2 + 3 + 4 + 5
=3
5
2010
2 =
(1 3) 2
+ ( 2 3) 2
+ (3 3) 2
5
+ (4 3) 2
+ (5 3) 2
=2
= 2 = 1,41
8
UNED
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA
TEMA 8
UNED
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA
Para cada muestra obtenemos diferentes medias, que pueden ser iguales o
distintas, porque su valor depende de los elementos que forman la muestra. Se
comprueba, entonces, que la media de la muestra (media muestral) se comporta
como una variable aleatoria.
ni
f( X )
1/25 = 0,04
1,1
2,1
3,1
4,1
5,1
1,5
2,5
1,5
2/25 = 0,08
0,25
1,2
2,2
3,2
4,2
5,2
1,5
2,5
3,5
3/25 = 0,12
0,20
1,3
2,3
3,3
4,3
5,3
2,5
3,5
2,5
4/25 = 0,16
1,4
2,4
3,4
4,4
5,4
2,5
3,5
4,5
5/25 = 0,20
1,5
2,5
3,5
4,5
5,5
3,5
4,5
3,5
4/25 = 0,16
3/25 = 0,12
4,5
2/25 = 0,08
1/25 = 0,04
UNED
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA
2010
TEMA 8
UNED
ni
f( X )
X f (X )
1/25 = 0,04
0,04
0,04
1,5
2/25 = 0,08
0,12
0,18
3/25 = 0,12
0,24
0,48
2,5
4/25 = 0,16
0,40
1,00
5/25= 0,20
0,60
1,80
2 = 10 32
f (X )
3,5
4/25= 0,16
0,56
1,96
3/25 = 0,12
0,48
1,92
4,5
2/25 = 0,08
0,36
1,62
1/25 = 0,04
0,20
0,10
0,05
0,00
1
Distribucin poblacional de X
N=5
n=2
2 = 1
X
1,00
=1
X
11
2010
1,5
2,5
3,5
4,5
ni
f(X)
f(X)
0,2
0,2
0,2
0,2
0,2
V ( X ) = 2 = E ( X 2 ) [ E ( X )]2
0,15
Introducci
Introduccin al an
anlisis de datos
DISTRIBUCI
DISTRIBUCIN MUESTRAL DE LA MEDIA
X = 3
2010
f (X )
10
X f ( x)
X2
TEMA 8
ni
f( X )
0,04
1,5
0,08
0,12
2,5
0,16
0,20
3,5
0,16
0,12
4,5
0,08
0,04
TEMA 8
Parmetros poblacionales de X
Media poblacional: = 3
Varianza poblacional: 2 = 2
Desv. tpica poblacional: = 1,41
=
Momentos de la dM de la media de X
Media de la dM de la media:
X = 3
Varianza de la dM de la media:
2 = 1
X
12
UNED
Introducci
Introduccin al an
anlisis de datos
DISTRIBUCI
DISTRIBUCIN MUESTRAL DE LA MEDIA
TEMA 8
2
n
1=
2
2
=
X
=
n
n
1=
1,41
2
UNED
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA
Media
X
N
Varianza
2 =
( X )2
N
Desviaci
Desviacin
tpica
( X )2
N
2010
Muestra
X=
Sn21 =
Sn 1 =
X
n
( X X )2
n1
( X X )2
n1
TEMA 8
En la prctica las poblaciones son mucho ms grandes y las muestras tambin son ms
grandes, por lo que no es posible (ni necesario) obtener la distribucin muestral como
en el ejemplo expuesto. De hecho, podemos conocer las caractersticas de la
distribucin muestral de la media a partir de ciertos teoremas. Estos teoremas son el
teorema central del lmite y la ley de los grandes nmeros.
Dado el muestreo aleatorio simple:
Si la distribucin de X en la poblacin es normal con media y desviacin tpica
entonces la distribucin muestral de la media es normal
,
n
2010
TEMA 8
UNED
Distribuci
Distribucin
muestral de la
media
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA MEDIA
13
Poblaci
Poblacin
UNED
14
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
TEMA 8
X =
2X =
X =
2
n
2
n
15
2010
16
UNED
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
TEMA 8
X =
2
n
X =
9
3
= = 0, 6
25 5
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA PROPORCI
PROPORCIN
17
2010
TEMA 8
UNED
=
P
Media
(1 )
n
20
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA PROPORCI
PROPORCIN
Poblaci
Poblacin
19
TEMA 8
Cuanto ms alejado est de 0,5, ms elementos debe tener la muestra para realizar
la aproximacin a la normal. En la prctica, se suele aplicar el criterio siguiente: n(1- )
5, por lo que el tamao muestral mnimo requerido se obtiene a partir de:
5
n
(1 )
2010
UNED
TEMA 8
2 = 9
2
=
n
Introducci
Introduccin al an
anlisis de datos
ESTIMACI
ESTIMACIN DE LA PROPORCI
PROPORCIN
Datos:
n = 25
UNED
X
N
Muestra
P=
X
n
Varianza
2 = (1 )
S 2 = P (1 P )
Desviaci
Desviacin
tpica
= (1 )
S = P (1 P )
2010
Distribuci
Distribucin
muestral de la
media
P =
2P =
P =
(1 )
n
(1 )
n
21
UNED
UNED
TEMA 8
Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA
TEMA 8
INTERVALOS DE CONFIANZA
| X |
Desconocemos ese error dado que no conocemos , que es lo que queremos
estimar.
La estimacin por intervalo consiste en acotar el error de estimacin con una alta
probabilidad 1 (llamada nivel de confianza) de tal manera que el error de
estimacin no sea superior a un error de estimacin mximo (Emx) fijado por el
investigador:
| X | Emx
2010
UNED
Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA
Carmen Voces
TEMA 8
2010
UNED
23
Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA
TEMA 8
Emx = z1 2
Emx = z1 2
Donde:
Z1-/2 es funcin del n.c. = 1 - y se obtiene en la tabla de la distribucin
normal tipificada (tabla IV). Los valores ms comunes del n.c. son: 0,95, 0,99 y
0,999
24
n=
2
2
E mx
z12
Z 0,975 = 1,96
n=
2
2
E mx
z12
1,96 2 3 2
= 34 ,57 35
12
25
UNED
Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA
TEMA 8
UNED
Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA
TEMA 8
Los lmites inferior (Li) y superior (Ls) del intervalo de confianza se obtienen a partir
del error de estimacin mximo (Emx).
Li = X Emx = X z1 2
Ls = X + Emx = X + z1 2
Ls = X + Emx = 4 + 1 = 5
Interpretacin: con una probabilidad del 95% (n.c. = 0,95) la media poblacional estar
comprendida entre los valores 3 y 5.
2010
UNED
Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA
1,96 X
TEMA 8
UNED
XB
27
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
TEMA 8
/2= 0,025
1,96 X
n.c. =
0,95
1,96 X
X z1 2 = 1
P X + z1 2
n
n
26
/2= 0,025
1,96 X
1,96 X
1,96 X
XA
28
2010
29
UNED
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
TEMA 8
UNED
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
TEMA 8
= 1
X z1 2
P X + z1 2
n
n
a) 8,968 y 11,032
b) 9,216 y 10,784
c) 8 y 12
a) 16
b) 4
c) 2
Datos:
X = 10 n = 100 = 4 = 0,05
P(Z z) = 1 /2 = 1 0,05/2 = 0,975 Tabla IV z0,975 = 1,96
Li = X z1 2
Ls = X + z1 2
= 10 1,96
= 9,216
100
= 10 + 1,96
= 10,784
100
2010
UNED
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
30
2010
TEMA 8
UNED
31
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
TEMA 8
a) 16
b) 4
c) 2
Li = X Emx
Ls = X + Emx
9,216=10 Emx
10,784=10+ Emx
Emx = 0,784
Emx = z1 2
0,784=1,96
a) 24
b) 34
c) 42
100
0,784=1,96
7,84
7,84=1,96 =
1,96
10
=4
2010
32
2010
33
UNED
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
TEMA 8
n=
z12
n=
Emx = z1 2
n=
2
2
E mx
z12
2
E mx
z12 2
2
E mx
UNED
Introducci
TEMA 8
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: TAMA
TAMAO DE LA MUESTRA
2,58 2 5 2
= 41,6025 42
22
2010
UNED
Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA
34
2010
TEMA 8
UNED
Los pasos a seguir para aplicar un intervalo de confianza son los siguientes:
37
Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: MEDIA
Supuestos
Calcular el estadstico (el estimador del parmetro) con las medidas obtenidas
2010
TEMA 8
Distribuci
Distribucin Normal
Distribuci
Distribucin t de
Student
Distribuci
Distribucin normal
39
2010
Ls = X + z1 2 X
Donde: z1 /2 Tabla IV
Li = X t n 1;1 2 S X
Ls = X + t n 1,1 2 S X
Li = X z1 2 S X
X =
S
S X = n1
n
Ls = X + z1 2 S X
Donde: z1 /2 Tabla IV
S
S X = n1
n
40
UNED
Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: PROPORCI
PROPORCIN
TEMA 8
UNED
Introducci
Introduccin al an
anlisis de datos
INTERVALOS DE CONFIANZA: PROPORCI
PROPORCIN
TEMA 8
Los lmites inferior (Li) y superior (Ls) del intervalo de confianza se obtienen a partir
del error de estimacin mximo (Emx).
(1 )
n
Donde:
Z1-/2 es funcin del nivel de confianza 1 - y se obtiene en la tabla de la
distribucin normal tipificada (tabla IV).
Li = P Emx = P z1 2
P(1 P)
n
Ls = P + Emx = P + z1 2
P(1 P)
n
P = 13/24 = 0,54
Interpretacin: con una probabilidad del 95% (n.c. = 0,95) la proporcin poblacional de
pacientes curados estar comprendida entre los valores 0,34 y 0,74.
2010
UNED
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
41
2010
TEMA 8
UNED
42
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
TEMA 8
Emx = z1
P = 63/300 = 0,21
P (1 P )
0,21(1 0,21)
= 2,58
= 2,58 0,024 = 0,062
n
10
Interpretacin: con una probabilidad del 99% (n.c. = 0,99) la proporcin poblacional de
pacientes curados estar comprendida entre los valores 0,148 y 0,272.
2010
43
2010
44
UNED
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
TEMA 8
UNED
Introducci
Introduccin al An
Anlisis de Datos
EJEMPLO
TEMA 8
25. Se sospecha que los padres con hijos que padecen el trastorno por dficit
atencional con hiperactividad (TDAH) pueden manifestar tambin dicho
trastorno. Para estudiar este aspecto se ha extrado una muestra de 200
padres y se ha obtenido que el 30% padecen el TDAH. Para un nivel de
confianza del 95%, la amplitud del intervalo de confianza de la proporcin de
padres con TDAH es:
a) 0,064
b) 0,127
c) 0,032
25. Se sospecha que los padres con hijos que padecen el trastorno por dficit
atencional con hiperactividad (TDAH) pueden manifestar tambin dicho
trastorno. Para estudiar este aspecto se ha extrado una muestra de 200
padres y se ha obtenido que el 30% padecen el TDAH. Para un nivel de
confianza del 95%, la amplitud del intervalo de confianza de la proporcin de
padres con TDAH es:
a) 0,064
P(1 P)
P(1 P)
b) 0,127
Li = P Emx = P z1 2
Ls = P + Emx = P + z1 2
n
n
c) 0,032
= 0,05 (n.c. = 95%) Z1-/2 = Z0,975 = 1,96
Emx = z1
P = 0,30
P (1 P )
0,30(1 0,30)
= 1,96
= 1,96 0,0324 = 0,0635
n
200
45
2010
46