Sunteți pe pagina 1din 63

ESTADÍSTICA INFERENCIAL

TABLAS DE CONTINGENCIA
Profesora: Eva María Mera Intriago

Escuela Superior Politécnica del Litoral


“Impulsando la sociedad del conocimiento”
Facultad de Ciencias Naturales y Matemáticas Guayaquil, diciembre de 2018
Tablas de Contingencia

• Es un arreglo rectangular que contiene r filas por


c columnas, el cual trata de determinar si dos
variables generalmente categóricas A y B son
estocásticamente independientes. Donde la
variable A se denomina Factor A y toma o tiene r
niveles y la variable B se denomina Factor B y
toma o tiene c niveles.
Factor B
Factor A
Nivel 1 Nivel 2 ... Nivel c
Nivel 1 n11 n12 ... n1c
Nivel 2 n21 n22 ... n2c
. .
. .
. .
Estadística Inferencial 12/12/2018 2
Nivel r nr1 nr2 ... nrc
Tablas de Contingencia

Clasificación de dos Factores: Colegio y Nivel


El factor A tiene tres niveles, el Factor B tiene dos
Clasificación que obtiene
Tipo de Colegio
al tomar el examen
del que proceden
Nivel (Factor B)
los Bachilleres de
la ESPOL
Cero No clasifica
(Factor A)
Fiscal n11 n12
Confesional n21 n22
Laico n31 n32
Si en total n bachilleres son considerados en el estudio, tendríamos que:
n = n11 + n12 + n21 + n22 + n31 + n32
Estadística Inferencial 12/12/2018 3
Factor B
Factor A Nivel Nivel
... Nivel c
Tablas de Contingencia Nivel 1
1
n11
2
n12 ... n1c
Nivel 2 n21 n22 ... n2c
. .
. .
. .
Nivel r nr1 nr2 ... nrc

• Y podríamos decir que pij puede ser estimada


por
n ij
p̂ij 
n
• donde pij representa la probabilidad de que un
bachiller se encuentre en el nivel i del Factor A y
al mismo tiempo en el nivel j del Factor B.

Estadística Inferencial 12/12/2018 4


Cabe preguntarse

• Si el tipo de colegio del que proceden los bachilleres que


ingresan a la ESPOL y la clasificación que obtienen al
tomar el examen, son Estocásticamente Independientes

Estadística Inferencial 12/12/2018 5


Tablas de Contingencia

• Podríamos construir una estimación de la


Distribución Conjunta de A y B

• El Factor A que tiene tres niveles


• El Factor B que tiene dos niveles

• Se presenta la estimación de la Distribución


Conjunta de A y B, así como las Marginales de A
y de B.

Estadística Inferencial 12/12/2018 6


Tablas de Contingencia

Estimación de la Distribución Conjunta


y Marginales de dos Factores
Factor B Marginal
Factor A del Factor A
Cero No Clasifica
Fiscal p̂11 p̂12 p̂11 + p̂12
Confesional p̂ 21 p̂ 22 p̂ 21 + p̂ 22
Laico p̂ 31 p̂ 32 p̂ 31 + p̂ 32

Marginal
p̂11 + p̂ 21 + p̂ 31 p̂12 + p̂ 22 + p̂ 32 1
del Factor B

Estadística Inferencial 12/12/2018 7


Tablas de Contingencia

c
n i . =  n ij
Tabla de Contingencia para dos Factores j=1

Factor B
Factor A ni.
Nivel 1 Nivel 2 ... j
Nivel Nivel c
Nivel 1 n11 n12 ... n1c n1.
Nivel 2 n21 n22 ... n2c n2.
. . .
Nivel
. i n. i.
n.ij
. . .
Nivel r nr1 nr2 ... nrc nr.
n.j n.1 n.2 .n. .j. n.c n
r
n. j =  nij Donde nij i = 1; 2 , …; r ; y, para j = 1; 2; … ; c
i =1
r c r c
Estadística Inferencial
n es el número de observaciones en la muestra
n  ni. =  n. j   n ij
12/12/2018 8
i =1 i =1 i 1 j1
Tablas de Contingencia

• Bajo este esquema teórico, se plantea el


siguiente Contraste de Hipótesis:

H0: El Factor A es Estocásticamente


Independiente del Factor B
vs.
H1: Los Factores A y B no son estocásticamente
independientes

Estadística Inferencial 12/12/2018 9


Factor Factor B
ni.
A Nivel 1 Nivel 2 ... Nivel c
Tablas de Contingencia Nivel 1
Nivel 2
n11
n21
n12
n22
...
...
n1c
n2c
n1.
n2.
. . .
. . .
. . .
Nivel r nr1 nr2 ... nrc nr.
n.j n.1 n.2 ... n.c n

• Si la Hipótesis Nula fuese verdadera, debería


cumplirse que:
• pij =?
pij = pi ∙ pj ;
para i = 1; 2 , …; r ; y, para j = 1; 2; … ; c
• Donde:
pi = ni. / n ; y ,
pj = n.j / n
Estadística Inferencial 12/12/2018 10
Factor Factor B
ni.

Tablas de Contingencia
A Nivel 1 Nivel 2 ... Nivel c
Nivel 1 n11 n12 ... n1c n1.
Nivel 2 n21 n22 ... n2c n2.
. . .
. . .
. . .
Nivel r nr1 nr2 ... nrc nr.
• Consecuentemente n.j n.1 n.2 ... n.c n

nij = npij

• Bajo el supuesto de que H0 es verdadera la


Variable Aleatoria nij se espera tenga:

Eij = E(nij) = n∙pij


 n i.   n . j  n i.n . j
E ij = n  pi  p j  n     
 n  n  n
Este supuesto es importante al momento de Obtener el valor Esperado de nij

Estadística Inferencial 12/12/2018 11


Tablas de Contingencia

• El estadístico 2 n i.n . j
r c E ij 
χ   (n ij  E ij ) / E ij
2 2 n
i 1 j1

• Puede ser aproximado como una Variable


Aleatoria Ji-cuadrado con (r - 1)(c - 1) grados de
libertad.

Estadística Inferencial 12/12/2018 12


Tablas de Contingencia

• Con (1 – a)100% de confianza, H0 debe ser


rechazada en favor de H1 si el Estadístico de
Prueba r c
χ 2   (n ij  E ij ) 2 / E ij   (α,(r
2
-1)(c-1))
i 1 j1

• es mayor que el percentil (1 – a)100 de la


Distribución 2 que tiene (r - 1)(c - 1) grados de
libertad; este percentil es denotado por:
 (α,
2
(r -1)(c -1))

Estadística Inferencial 12/12/2018 13


¡ Alerta !

• Para aplicar esta Prueba de Independencia es


necesario que en cada celda de una Tabla de
Contingencia existan observaciones y es más, se
sugiere que exista un mínimo de estas, que se
recomienda sea cinco.

Estadística Inferencial 12/12/2018 14


Tablas de Contingencia

• Ejercicio
• Determinar si existe algún tipo de relación, esto es, si
son independientes la calidad del trabajo en una
compañía y el programa de entrenamiento que se
da a los empleados previo a su ingreso. Para el
caso de 400 empleados se tiene la siguiente
información:
Nota en el Programa de Entrenamiento
Calidad Bajo el Sobre el
Promedio Totales
promedio promedio
Pobre 23 60 29 112
Promedio 28 79 60 167
Muy buena calidad 9 49 63 121
Totales
Estadística Inferencial 60 188 15212/12/2018 400 15
Tablas de Contingencia

• Desarrollo.

H0: La Calidad del Trabajo y la Nota en el Programa de


Entrenamiento son independientes

vs.

H1: La Calidad del Trabajo y la Nota en el Programa de


Entrenamiento no son independientes
Bajo el supuesto de que H0 es verdadera la Variable Aleatoria nij se espera
tenga: Eij = E(nij) = n∙pij
 n   n . j  n i.n . j
E ij = n  pi  p j  n  i.    
 n  n  n
Estadística Inferencial 12/12/2018 16
Nota en el Programa de Entrenamiento
Tablas de Calidad Bajo el
promedio
Promedio
Sobre el
promedio
Totales

Contingencia Pobre
Promedio
23
28
60
79
29
60
112
167
Muy buena calidad 9 49 63 121
Totales 60 188 152 400
r c
χ 2
  (n ij  E ij ) 2 / E ij
• El valor del Estadístico de Prueba i 1 j1
debe
ahora ser calculado, teniendo los siguientes datos:

• Número de niveles del Factor A (calidad del trabajo) = r = 3

• Número de niveles del Factor B (nota en el programa de


entrenamiento) = c = 3

n11 = 23 ; n12 = 60 ; n13 = 29 ;


n21 = 28; n22 = 79 ; n23 = 60 ;
n31 = 9 ; n32 = 49; n33 = 63

Estadística Inferencial 12/12/2018 17


Nota en el Programa de Entrenamiento
Tablas de Calidad Bajo el Sobre el
Contingencia
Promedio Total
promedio promedio

Pobre 23 60 29 112
r c Promedio 28 79 60 167
χ 2
  (n ij  E ij ) / E ij 2
Muy buena
i 1 j1 n i.n . j 9 49 63 121
Además E ij  calidad
Total 60 188 152 400
n
E11 = 112(60) / 400 = 16.80
E12 = 112(188) / 400 = 52.64
E13 = 112(152) / 400 = 42.56
E21 = 167(60) / 400 = 25.05
E22 = 167(188) / 400 = 78.49
E23 = 167(152) / 400 = 63.46
E31 = 121(60) / 400 = 18.15
E32 = 121(188) / 400 = 56.87
E33 = 121(152) / 400 = 45.98
Estadística Inferencial 12/12/2018 18
Nota en el Programa de Entrenamiento
Tablas de Calidad Bajo el
promedio
Promedio
Sobre el
promedio
Totales

Contingencia Pobre 23 60 29 112


Promedio 28 79 60 167
Muy buena
9 49 63 121
• Con toda esta Información calidad
Totales 60 188 152 400
el Estadístico: r c
χ 2 =  (n ij  E ij ) 2 /E ij
i=1 j=1

(23  16.80) 2 (60  52.64) 2 (29  42.56) 2 (28  25.05) 2 (79  78.49)2 (60  63.46) 2
     
16.80 52.64 42.56 25.05 78.49 63.46
(9  18.15) 2 (49  56.87) 2 (63  45.98) 2
  
18.15 56.87 45.98
 2.288  1.029  4.320  0.347  0.003  0.189
 4.613  1.089  6.300
 20.179
• En situación Pre-Experimental
• Con (1 - a)100% de confianza, Rechazar H0 en favor de H1 si el
Estadístico de Prueba:
r c
χ 2
=  (n ij  E ij ) 2 /E ij > χ (α,(r
2
-1)(c-1)) χ 2 = 20.179  χ (α,(3-1)(3-1))
2

i=1 j=1
Estadística Inferencial 12/12/2018 19
Calculamos el valor p

• Buscamos en la Tabla Ji- Cuadrado el valor del percentil


en 2 grados de libertad
• P(24>20.179)≈0,000

Estadística Inferencial 12/12/2018 20


Como condición de este curso
siempre vamos a decidir en
situación Post-Experimental, por lo Aproximamos el valor p
tanto utilizaremos el Valor p para
tomar una decisión

Siendo: a = 0.10
a = 0.05
χ 0.10;4
2
 7.78 a = 0.01 Valor p

χ 0.05;4
2
 9.49 χ 0.10;4
2
χ 0.05;4
2
χ 0.01;4
2
*
0 2 4 6 8 10 12 14 16 18 20 22

χ 2
0.01;4  13.30 χ 2
r c
=  (n ij  E ij ) 2 /E ij = 20.179
i=1 j=1
0,20

Este Valor p proporciona Esto nos lleva a un


evidencia estadística para 0,15
Valor p << 0.05
rechazar la Hipótesis Nula, esto p aproximadamente 0.00
0,10

es, No existe independencia entre


La Calidad del Trabajo y la Nota en 0,05
0,10

el Programa de Entrenamiento 0,05

0,01 Valor p
0,00
0 7,78 9,49 13,3 20.1
Estadística Inferencial 12/12/2018 21
Usando Software Estadístico

• Minitab: Estadísticas>Tablas>Tabulación cruzada y Chi-


cuadrado cuadrado

Estadística Inferencial 12/12/2018 22


Aparece este menú

• En este recuadro

Estadística Inferencial 12/12/2018 23


• Seleccionar la tres casillas en la Imagen>Aceptar

• En la pantalla a la que se regresa>aceptar


Estadística Inferencial 12/12/2018 24
Estadística Inferencial 12/12/2018 25
En SPSS

• Analizar>Estadísticos Descriptivos>Tablas de Contingencia

Estadística Inferencial 12/12/2018 26


En SPSS

• Agregar las variables a cruzar>Seleccionar>Estadísticos

Estadística Inferencial 12/12/2018 27


• Seleccionar Chi-Cuadrado>Continuar

Estadística Inferencial 12/12/2018 28


• Seleccionar>Casillas

Estadística Inferencial 12/12/2018 29


• Marcar> Observado y Esperado>Continuar

Estadística Inferencial 12/12/2018 30


Estadística Inferencial 12/12/2018 31
ESTADÍSTICA INFERENCIAL

BONDAD DE AJUSTE

Escuela Superior Politécnica del Litoral


“Impulsando la sociedad del conocimiento”
Facultad de Ciencias Naturales y Matemáticas Guayaquil, julio 26 de 2018
Bondad de Ajuste

• Objetivo:
• Determinar el Tipo de Población del que se ha
tomado la muestra.
• El procedimiento de Bondad de Ajuste
“permite determinar, con cierto nivel de
confianza, si es que la muestra con la que
trabajamos permite afirmar, que ha sido tomada
de una u otra población específica”.

Estadística Inferencial 12/12/2018 35


Bondad de Ajuste

Método Ji-Cuadrado de Pearson


El Método Ji-Cuadrado de Pearson
para Bondad de Ajuste

• Con el respaldo teórico anteriormente presentado


para la prueba que permite verificar independencia
de Variables Categóricas, utilizando Tablas de
Contingencia, el Método Ji-Cuadrado de Pearson
para Bondad de Ajuste supone:
• En una Muestra Aleatoria XT = (X1 X2 … Xn) que
cada resultado Xi puede ser clasificado en una de las
k Categorías o Regiones en las que se particiona
el Soporte S de la Población X de la que se toma la
Muestra Aleatoria X

Estadística Inferencial 12/12/2018 37


El Método Ji-Cuadrado de Pearson
para Bondad de Ajuste

• A estas Regiones o Categorías las llamaremos A1,


A2, … , Ak, donde la probabilidad de que XiAj,
, i = 1, 2, … , n ; j = 1, 2, … , k viene determinada
por un modelo probabilístico que se postula en la
Hipótesis Nula del Contraste relativo a Bondad de
Ajuste.
• La aplicación de esta aproximación requiere que n
sea grande.

Estadística Inferencial 12/12/2018 38


Bondad de Ajuste: Contraste de
Hipótesis Método Ji-Cuadrado

• El Contraste de Hipótesis para Bondad de Ajuste lucirá


como se presenta a continuación:

H0: La Muestra X ha sido tomada de una Población X


que tiene distribución F0

vs.

H1: No es verdad que la Distribución de la Población X


de la que se ha tomado la Muestra es F0

Estadística Inferencial 12/12/2018 39


Con (1 - a)100% de confianza, la Hipótesis
Nula H0 debe ser rechazada si:
k (n j  E j ) 2
χ 
Cuando el número de regiones k,
2
 χ 2
(α; k - p - 1) (k  6), la variable aleatoria Ji-
j1 Ej Cuadrado es aproximada por una
Ji-Cuadrado con (k – 1) grados de
• Donde: libertad.
• n: es el tamaño de la muestra
• k: número de regiones en que se particiona el Soporte
de X
• p el número de parámetros que se estén estimando bajo
el modelo dado (Hipótesis Nula)
• nj : número de valores observados en la región j-ésima
(valor observado)
• Ej = npi (valor calculado)
• Pj = P(XAj) bajo el supuesto que H0 es verdadera

Estadística Inferencial 12/12/2018 40


El Método Ji-Cuadrado de Pearson
para Bondad de Ajuste

• Si por ejemplo, la Hipótesis Nula sostiene que la


Población “madre” es Poisson, p = 1 pues solo
un parámetro - l - debe ser estimado; en el
caso Normal serán dos, m y s2; para una
población que es Beta, p es igual dos, por los
dos parámetros, a y b que la caracterizan; y,
así sucesivamente.

Estadística Inferencial 12/12/2018 41


El Método Ji-Cuadrado de Pearson para Bondad de Ajuste
Sobre las regiones

• El número mínimo de Regiones en que se puede


particionar el Soporte del Modelo Estocástico
propuesto es tres.
• Asegúrese de que toda Región contenga
observaciones y que, el número de ellas por
celda, no sea menor a cinco.

Estadística Inferencial 12/12/2018 42


El Método Ji-Cuadrado de Pearson para Bondad de Ajuste
Ejercicio

H0: El dado es legal


vs.
H1: No es cierto H0

Ó
 1 ; x = 1, 2, 3, 4, 5, 6
H0: P(X = x) =  6
0 ; resto de x
vs.
H1: No es cierto H0

Estadística Inferencial 12/12/2018 43


El Método Ji-Cuadrado de Pearson para Bondad de Ajuste
Ejercicio

• Los datos son:


• n = 103 ; k = 6 ; p = 1 parámetro
No.
Frecuencia
Cara
1 15
2 17
3 19
4 14
5 21
6 17

Estadística Inferencial 12/12/2018 44


pj es pj es
No.
Frecuencia Rj nj nj uniforme uniforme Ej Ej = n*pj Ej
Cara
discreta discreta

Ji-Cuadrado, 5
Ji-Cuadrado
grados de libertad

Estadística Inferencial 12/12/2018 45


El Método Ji-Cuadrado de Pearson para Bondad de Ajuste
Ejercicio

• Los datos son:


• n = 103 ; k = 6 ; p = 1 parámetro
No.
Frecuencia Rj
Cara
1 15 (-,1]
2 17 (1,2]
3 19 (2,3]
4 14 (3,4]
5 21 (4,5]
6 17 (5,)

Estadística Inferencial 12/12/2018 46


El Método Ji-Cuadrado de Pearson para Bondad de Ajuste
Ejercicio

• Los datos son:


• n = 103 ; k = 6 ; p = 1 parámetro
No.
Frecuencia Rj nj nj
Cara
1 15 (-,1] n1 15
2 17 (1,2] n2 17
3 19 (2,3] n3 19
4 14 (3,4] n4 14
5 21 (4,5] n5 21
6 17 (5,) n6 17

Estadística Inferencial 12/12/2018 47


El Método Ji-Cuadrado de Pearson para Bondad de Ajuste
Ejercicio

• Los datos son:


• n = 103 ; k = 6 ; p = 1 parámetro
pj es
No.
Frecuencia Rj nj nj uniforme
Cara
discreta
1 15 (-,1] n1 15 P(X  1)
2 17 (1,2] n2 17 P(X = 2)
3 19 (2,3] n3 19 P(X = 3)
4 14 (3,4] n4 14 P(X = 4)
5 21 (4,5] n5 21 P(X = 5)
6 17 (5,) n6 17 P(X > 5)

Estadística Inferencial 12/12/2018 48


El Método Ji-Cuadrado de Pearson para Bondad de Ajuste
Ejercicio

• Los datos son:


• n = 103 ; k = 6 ; p = 1 parámetro
pj es pj es
No.
Frecuencia Rj nj nj uniforme uniforme Ej Ej = n*pj
Cara
discreta discreta
1 15 (-,1] n1 15 P(X  1) 1/6 E1 103*1/6
2 17 (1,2] n2 17 P(X = 2) 1/6 E2 103*1/6
3 19 (2,3] n3 19 P(X = 3) 1/6 E3 103*1/6
4 14 (3,4] n4 14 P(X = 4) 1/6 E4 103*1/6
5 21 (4,5] n5 21 P(X = 5) 1/6 E5 103*1/6
6 17 (5,) n6 17 P(X > 5) 1/6 E6 103*1/6

Estadística Inferencial 12/12/2018 49


El Método Ji-Cuadrado de Pearson para Bondad de Ajuste
Ejercicio

• Los datos son:


• n = 103 ; k = 6 ; p = 1 parámetro
pj es pj es
No.
Frecuencia Rj nj nj uniforme uniforme Ej Ej = n*pj Ej
Cara
discreta discreta
1 15 (-,1] n1 15 P(X  1) 1/6 E1 103*1/6 17.17
2 17 (1,2] n2 17 P(X = 2) 1/6 E2 103*1/6 17.17
3 19 (2,3] n3 19 P(X = 3) 1/6 E3 103*1/6 17.17
4 14 (3,4] n4 14 P(X = 4) 1/6 E4 103*1/6 17.17
5 21 (4,5] n5 21 P(X = 5) 1/6 E5 103*1/6 17.17
6 17 (5,) n6 17 P(X > 5) 1/6 E6 103*1/6 17.17

Estadística Inferencial 12/12/2018 50


No Frecuenci
Los datos son:
Ej
Cara a

n = 103 ; k = 6 ; p = 1 1 15 17.17
2 17 17.17
3 19 17.17
6
(n j  E j ) 2 (15  17.17) 2 (17  17.17) 2 (19  17.17) 2
χ 
2
i =1
Ej
 17.17

17.17

17.17
4
5
14
21
17.17
17.17
(14  17.17)
2
(21  17.17)
2
(17  17.17) 2
   6 17 17.17
17.17 17.17 17.17
 0.27  0.00  0.20  0.58  0.86  0.00
k (n  E ) 2
 1.91 Rc: χ 2  
j j
 χ (α;
2
k - p - 1)
j1 Ej
pj es uniforme Ji-Cuadrado, 5
Rj nj Ej Ji-Cuadrado
discreta grados de libertad
(-,1] 15 1/6 17.17 0.273463 1.91262
(1,2] 17 1/6 17.17 0.001618
(2,3] 19 1/6 17.17 0.195793
(3,4] 14 1/6 17.17 0.584142
(4,5] 21 1/6 17.17 0.855987
(5,)
Estadística Inferencial 17 1/6 17.17 0.001618 12/12/2018 51
Cuando el número de regiones k,
(k  6), la variable aleatoria Ji-
Siendo: Cuadrado es aproximada por una
Ji-Cuadrado con (k – 1) grados de
libertad.

a = 0.10
χ α2 = 0.10;(k 1) =5  9.23 a = 0.05
a = 0.01
χ α2 = 0.05;(k 1) = 5  11.07
χ α2 = 0.01;(k 1) =5  15.10 0,00
*
2,00 4,00 6,00 8,00 10,00 12,00 14,00 16,00
6
(n j  E j ) 2
χ2  
i =1
Ej
 1.91

0,16

Valor p que proporciona 0,14


0,861
Esto nos lleva a un
evidencia estadística para no 0,12 Valor p >> 0.10
0,10

rechazar la Hipótesis Nula, 0,08

esto es, El dado es legal 0,06

0,04 0,100

0,02 0,0500

0,01
0,00
Estadística Inferencial 0 1,91 12/12/2018
9,23 11,07 15,1 52
Deber entregar el 3 de enero

• Problema 8.13 sobre Tabla de Contingencia


• Problema 8.11 Bondad e Ajuste Ji Cuadrado
• Problema 8.12 Bondad de Ajuste Ji Cuadrado

Estadística Inferencial 12/12/2018 53


Ejercicio 8.11

• 8.11.- En una cadena de tiendas de ventas al detal,


cada mes se determina la cantidad de empleados que
han logrado sobrepasar la meta medida que se les
asigna. Se estudian los registros de treinta y seis meses
consecutivos dándose los resultados que se muestran a
continuación: T x = (5 2 3 6 3
4 1 5 5 3
1 4 1 3 5
5 3 3 4 6)
4 3 3 1
2 3 1 3
4 1 2 5
1 3 4 3

Estadística Inferencial 12/12/2018 54


Ejercici8.12

• 8.12.- El número de estudiantes que ingresan cada minuto a un


comedor universitario durante el tiempo de almuerzo, se lo
contabiliza por una hora, obteniéndose los resultados siguientes:
Número de Número de
Estudiantes cada Frecuencia Estudiantes cada Frecuencia
minuto minuto
48 ó menos 3 53 7
49 6 57 8
50 7 58 4
51 14 59 3
52 7 60 ó más 1

• ¿Puede no rechazarse la Hipótesis Nula que el número de


estudiantes por minuto que ingresan a almorzar en ese período
puede ser modelado como una Variable Aleatoria Poisson con
parámetro l = 50?

Estadística Inferencial 12/12/2018 55


Distribución Empírica

La Distribución Empírica de una Muestra Aleatoria


XT = (X1 X2 … Xn) de tamaño n, tomada de una población
X es definida como:

0; si X  x (1)

k
F̂(x)   ; si x (k )  X  x (k 1) , k 1, 2,..., n 1
n
1; si X  x (n )

Estadística Inferencial 12/12/2018 56


…viene Ejemplo 8.11

Desarrollo. Tenemos que n = 5 y además:

X1 = 4; X2 = 7; X3 = 3; X4 = 2; y, X5 = 5;

Si ordenamos la Muestra obtenemos los siguientes


Estadísticos de Orden:

X(1) = 2; X(2) = 3; X(3) = 4; X(4) = 5; y , X(5) = 7;

Estadística Inferencial 12/12/2018 57


Ejemplo 8.12

Si a la muestra del problema previo, se le añade una


nueva lectura (observación) que resulta ser igual a 3,
ocurre que la misma es igual a:

xT = (4 7 3 2 5 3)

Construir la Distribución Empírica correspondiente.

Estadística Inferencial 12/12/2018 58


…viene Ejemplo 8.12

Desarrollo. El Tamaño de la Muestra es n = 6 y además,

X1 = 4 ; X2 = 7 ; X3 = 3 ; X4 = 2 ; X5 = 5; y , X6 = 3.

Ordenando la muestra:

X(1) = 2 ; X(2) = 3 ; X(3) = 3 ; X(4) = 4 ; X(5) = 5 ; y , X(6) = 7

Estadística Inferencial 12/12/2018 59


Bondad de Ajuste

Kolmogorov – Smirnov(K-S)
El procedimiento de Kolmogorov y
Smirnov para Bondad de Ajuste

• El procedimiento de Kolmogorov y Smirnov al


igual que el Método Ji-Cuadrado de Pearson,
permite determinar si la muestra con la que se
realiza un estudio proviene de una determinada
Distribución de Probabilidades.
• Kolmogorov y Smirnov es un procedimiento no
parámetrico

Estadística Inferencial 12/12/2018 61


Bondad de Ajuste: Contraste de
Hipótesis Kolmogorov y Smirnov

• El Contraste de Hipótesis para Bondad de Ajuste lucirá


como se presenta a continuación.

H0: La Muestra X ha sido tomada de una población X


que tiene Distribución específica F0

vs.

H1: No es verdad que la Distribución de la población X


de la que se ha tomado la Muestra X sea F0

Estadística Inferencial 12/12/2018 62


Bondad de Ajuste: Contraste de
Hipótesis Kolmogorov y Smirnov

• Con (1 - a)100% de Confianza, la Hipótesis Nula del


Contraste, debe ser rechazada si

ˆ
D n  Max F(x)  F0 (x)  D n,α
Distribución Distribución
F-Empírica Acumulada

• Dn se denomina Estadístico de Kolmogorov


• La Tabulación de Dn se encuentra en la Tabla Dn,a,
tabulación realizada por Smirnov. Tabla E, Anexo 1 del
texto Guía GZurita

Estadística Inferencial 12/12/2018 63


Estadística Inferencial 12/12/2018 64
Ejercicio Propuesto Texto Guía: 8.9

• 8.9.-A continuación se presentan datos correspondientes


al peso en gramos de tilapias crecidas en cautiverio y
que se las mide a fin de determinar su peso promedio
luego de un cambio de su dieta durante un mes. ¿Se
puede afirmar que estos datos pueden ser modelados
por una Población que es N(320, 25)?

Clase [305,310) [310,315) [315,320) [320,325) [325,330) [330,335) [335,340)

Frecuencia 7 20 39 30 17 6 1

Estadística Inferencial 12/12/2018 65

S-ar putea să vă placă și