Documente Academic
Documente Profesional
Documente Cultură
Tema 1.
CONTRASTES DE BONDAD DE AJUSTE A UNA
DISTRIBUCIÓN
Bloque I:
INFERENCIA NO PARAMÉTRICA
Análisis Bioestadístico
3er curso de Biología
2010-2011
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Contenido
Contenido
1 Inferencia no paramétrica
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Inferencia no paramétrica
Introducción
Contrastes de bondad de ajuste
Motivación
En la inferencia paramétrica es habitual comenzar con el
postulado:
Su independencia.
Su homogeneidad (mismo patrón generador para todos
los datos).
Su adecuado ajuste a la distribución especificada.
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Inferencia no paramétrica
Introducción
Contrastes de bondad de ajuste
Objetivos
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Ejemplos:
H0 : F = N(3, 1) H0 : F es normal
H1 : F 6= N(3, 1) H1 : F no es normal
H0 simple H0 compuesta
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
n=30
2.0
estándar
contaminada
1.5
1.0
0.5
0.0
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Métodos Gráficos
Histograma
Densidad suavizada
Gráfico P-P
Gráfico Q-Q
Diagrama de caja
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Métodos Analíticos
χ2 de Pearson Kolmogorov-Smirnov-Lilliefors
Kolmogorov-Smirnov Shapiro-Wilks
D’Agostino
Crámer-von Mises
Asimetría y apuntamiento
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Ejemplo
Considérese la siguiente muestra aleatoria simple:
35 45 47 50 31
30 25 33 35 40
45 47 49 42 40
50 46 55 42 46
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Histograma
Histograma con origen en a y clases de igual amplitud h
1 Dividir la recta real en intervalos
Ik = [a + kh, a + (k + 1)h), con k entero.
2 A todo x ∈ Ik se le asigna un valor igual al cociente entre
la frecuencia relativa de observaciones en ese intervalo y
la longitud de dicho intervalo
Pn
1I (Xi )
f̂H (x) = i=1 k , si x ∈ Ik .
nh
6
6
5
5
4
4
3
3
2
2
1
1
0
0
20 25 30 35 40 45 50 55 25 30 35 40 45 50 55
7
10
6
8
5
4
6
3
4
2
2
1
0
20 30 40 50 60 25 30 35 40 45 50 55
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0.0
−3 −2 −1 0 1 2 3 4 0.0 −2 0 2
Densidad Suavizada
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
0.05
0.04
0.06
0.03
0.04
0.02
0.02
0.01
0.00
0.00
25 30 35 40 45 50 55 20 30 40 50 60
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
“Número de observaciones Xi ≤ x”
Fn (x) =
n
n
1X
= 1(−∞,x] (Xi )
n
i=1
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
1.0
(−∞, 25) 0
[25, 30) 0.05
0.8
[30, 31) 0.10
[31, 33) 0.15
[33, 35) 0.20
0.6
[35, 40) 0.30
[40, 42) 0.40 Fn(x)
[55, ∞) 1.00
25 30 35 40 45 50 55
x
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
-16.0 7.0 12.0 -1.6 -11.0 3.2 12.0 -3.9 12.0 3.8
-4.5 -9.1 7.2 15.7 -3.3 -16.6 5.8 -15.4 16.6 -7.6
-16.6 -16.0 -15.4 -11.0 -9.1 -7.6 -4.5 -3.9 -3.3 -1.6
3.2 3.8 5.8 7.0 7.2 12.0 12.0 12.0 15.7 16.6
2. Asignar frecuencias relativas acumuladas
1 2 3 4 5 6 7 8 9 10
20 20 20 20 20 20 20 20 20 20
11 12 13 14 15 18 18 18 19
20 20 20 20 20 20 20 20 20
1
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
ecdf(new.dat)
1.0
0.8
0.6
Fn(x)
0.4
0.2
0.0
−20 −10 0 10 20
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Gráfico P − P
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Gráfico P − P
1,0
,8
Prob acum esperada
,5
,3
0,0
0,0 ,3 ,5 ,8 1,0
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Gráfico Q − Q
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Gráfico Q − Q
3.0
2
2.5
Cuantiles muestrales
Cuantiles muestrales
1
2.0
0
1.5
−1
1.0
−2
0.5
−3
−2 −1 0 1 2 0.0 −2 −1 0 1 2
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
1 Tiene forma de una caja que, en posición vertical, está delimitada por
el primer (Q̂1 ) y tercer (Q̂3 ) cuartiles muestrales y está atravesada por
una línea representando la mediana o segundo cuartil (Q̂2 ).
Por tanto, la altura de la caja es el rango intercuartílico muestral dado
por IQR = Q̂3 − Q̂1 .
2 Las líneas verticales que salen de la caja se denominan bigotes y van:
desde Q̂1 (base de la caja) hasta un límite inferior (LI), dado por
el menor dato mayor o igual que Q̂1 − 1.5 × IQR,
desde Q̂3 (altura de la caja) hasta un límite superior (LS), dado
por el mayor dato menor o igual que Q̂3 + 1.5 × IQR.
3 Los puntos por encima de LS y por debajo de LI se representan
aislados. Son valores extremos respecto al resto, se denominan
atípicos o anómalos y son candidatos a ser erróneamente registrados.
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
4
2
0
−2
−4
1 2 3 4 5
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
1 2|5
4 3|013
6 3|55
10 4|0022
10 4|5566779
3 5|00
1 5|5
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Métodos Analíticos
χ2 de Pearson Kolmogorov-Smirnov-Lilliefors
Kolmogorov-Smirnov Shapiro-Wilks
D’Agostino
Crámer-von Mises
Asimetría y apuntamiento
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
La prueba de Kolmogorov-Smirnov
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
La prueba de Kolmogorov-Smirnov
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
La prueba de Kolmogorov-Smirnov
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
H0 : F ∼ N(40, 3)
H1 : F 6∼ N(40, 3)
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Kolmogorov-Smirnov-Lilliefors: Ejemplo
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
1 X
n
3 p
G1 = Xi − X ≈ N 0, 6/n
nS 3
i=1
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
1 X
n
4 p
G2 = Xi − X ≈ N 3, 24/n
nS 4
i=1
χ > χ22,α
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
X X log(X)
30
30
40
25
25
30
20
20
15
15
20
10
10
10
5
0
0
0 2 4 6 8 10 0.5 1.0 1.5 2.0 2.5 3.0 −3 −2 −1 0 1 2
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución
Problemática
Inferencia no paramétrica Procedimientos de contraste
Contrastes de bondad de ajuste Métodos gráficos
Métodos analíticos
Análisis Bioestadístico, 3er curso de Biología, 2010-2011 Contrastes de bondad de ajuste a una distribución