Documente Academic
Documente Profesional
Documente Cultură
24-11-2016
Modelación estocástica.
Unidad 1. Determinación del tipo de distribución que
presenta un proceso estocástico.
Evidencia de Aprendizaje. Modelación de comportamiento de
procesos estocásticos.
http://images.slideplayer.es/3/1052654/slides/slide_51.jpg.png
Introducción
En las ciencias cuando se analiza, se estudia un fenómeno se busca de ser posible determinar las
causas del mismo y describir su comportamiento, para ello elaboramos un modelo matemático que describa el
comportamiento actual del fenómeno y su desarrollo posterior al momento en que se observa. En Mecánica
primero Galileo sentó las bases de la cinemática, lo cual permitió describir distintos tipos de movimiento y
describir su comportamiento pasado, presente y futuro; posteriormente Newton desarrolló la dinámica y esto
permitió conocer las causas del movimiento y sus efectos en el mismo. En diversas áreas del conocimiento
humano se estudian fenómenos que presentan un comportamiento aleatorio, analizamos el problema y tratamos
de determinar sus causas o comportamiento, para este último punto se requiere elaborar un modelo matemático
que describa de la mejor manera el mismo permitiéndonos con ello realizar un mejor análisis. Una vez planteado
el modelo se verifica que describa de manera aproximada el fenómeno, para ello medimos las diferencias entre
los valores observados y los esperados en base al modelo propuesto.
Si estamos interesados en determinar si los datos disponibles de una muestra aleatoria simple de tamaño
n corresponden a cierta distribución teórica. El primer paso a realizar consiste en descomponer el recorrido de
la distribución teórica en un número finito de subconjuntos: A1, A2, ..., Ak. Después, clasificar las observaciones
muestrales, según el subconjunto a que pertenezcan y por último, comparar las frecuencias observadas de cada
Ai con las probabilidades que les corresponderían con la distribución teórica a contrastar. Una prueba de bondad
de ajuste nos permite determinar la validez del modelo propuesto, entre las pruebas de bondad de ajuste
tenemos:
Prueba de bondad de ajuste Ji-cuadrada.
Es la prueba más conocida de las pruebas estadísticas y es adecuada para comprobar, distribuciones
de tipo discreto, o bien, cuando las observaciones que se realizan caen en clases determinadas; es una función
de distancia, ya que lo que hace es medir la distancia entre la función de densidad de la variable empírica y la
teórica. La prueba Ji cuadrada hace uso de la distribución del mismo nombre para probar la bondad del ajuste
al comparar el estadístico de prueba X2 con el valor en tablas de la mencionada distribución, con df grados de
libertad y un nivel de significancia alfa.
Supongamos que tenemos un número k de clases en las cuales se han ido registrado un total de n
observaciones (n será pues el tamaño muestral). Denotaremos las frecuencias observadas en cada clase por
O1, O2, ..., Ok (Oi es el número de valores en la clase Ai ). Se cumplirá: O1 + O2 + ... + O k = n, compararemos
las frecuencias observadas con las frecuencias esperadas (teóricas), a las que denotaremos por E1, E2, ..., E k
. Se cumplirá: E1 + E2 + ... + E k = n.
En base al histograma de los datos de la muestra elaboramos un histograma y en base a este, el tipo
de variable (uniforme o discreta) proponemos un tipo de distribución. Determinamos las FEi y elaboramos una
tabla de Clases, FOi, FEi, calculamos nuestro estimador:
𝑘
(𝐹𝐸𝑖 − 𝐹𝑂𝑖)2
𝐶=∑ , 𝑘 𝑒𝑠 𝑒𝑙𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
𝐹𝐸𝑖
𝑖=1
2
Calculamos 𝜒𝑑𝑓,𝛼 df=k-r-1, df son los grados de libertad, r los parámetros estimados a partir de la muestra,
2
k es el total de clases, el nivel de confianza es 1-α, si C<𝜒𝑑𝑓,𝛼 , no se puede rechazar nuestra propuesta de
modelo.
Si las frecuencias observadas son menores que 5, se agrupan las clases adyacentes y se suman las
(𝐹𝐸𝑖−𝐹𝑂𝑖)2
𝐹𝐸𝑖
de las clases adyacentes.
Prueba de Kolmogorov-Smirnov
Si S>0 la distribución es asimétrica hacia la derecha si es menor que cero es asimétrica hacia la derecha.
La curtosis determina el grado de concentración que presentan los valores en la parte central de la distribución
y se calcula mediante
𝑏2
𝑊𝑐 =
𝑆2
. si n es par
N impar
Si Wc<Wt se rechaza Ho.
Prueba de Anderson_Darling
La prueba de Anderson-Darling es usada para probar si una muestra viene de una distribución especifica. Esta
prueba es una modificación de la prueba de Kolmogorov- Smirnov donde se le da más peso a las colas de la
distribución que la prueba de Kolmogorov-Smirnov.
En estadística, la prueba de Anderson-Darling es una prueba no paramétrica sobre si los datos de una muestra
provienen de una distribución específica. La fórmula para el estadístico determina si los datos vienen de una
distribución con función acumulativa F. se usa en distribuciones normal, lognormal, exponencial, Weibull y
logística
N es el número de datos, f(x) es la función de distribución teórica, Fs(x) es la función de distribución propuesta
El estadístico de la prueba se puede entonces comparar contra las distribuciones del estadístico de prueba
(dependiendo que se utiliza) para determinar el P-valor
Si A2>AD la hipótesis nula se rechaza, AD se toma de la tabla anterior, dependiendo del tipo de distribución y
el nivel de significancia.
1) Distribución Beta
2) Problema Prototipo. Busca datos (mínimo 50 datos) de un fenómeno en particular y realiza lo siguiente:
a) Establece el planteamiento de tus datos
b) Define Xt, S y T
c) Elabora una gráfica de tus datos (diagrama de dispersión)
d) Elabora el histograma de Frecuencias
e) Obtiene la varianza y media
f) Realiza la prueba de bondad de ajuste con 2.
g) Realiza la prueba de bondad de ajuste con la prueba de Bondad de Ajuste de
Kolmogorov – Smirnov.
h) Concluye considerando tu análisis anterior.
Para un auto nuevo se considera como duración de sus llantas el kilometraje que señala el odómetro al
momento que requiera cambiarlas por el desgaste asociado al rodamiento (los neumáticos cuentan con
unas marcas las cuales señalan el momento idóneo para su cambio).
Nacional de Llantas, proveedor de neumáticos para los vehículos Journey fabricados en México por
Chrysler, otorga una garantía duración de 40,000 kms para su modelo GTS 4, necesita saber si su
producto cumple con lo ofrecido, para ello solicita a sus concesionarios información sobre la duración
de dicho modelo en kilómetros, anotando el kilometraje del odómetro cuando el cliente acude a cambiar
sus llantas, los datos proporcionados se consideran en la siguiente tabla. También desea conocer si es
recomendable ampliar la garantía del producto a 50 o 60 mil kms.
52452 51179 67662 50238 36950 62215 48662 66310 67430 59483
48698 61979 57884 46681 59880 37402 50356 41460 46850 64398
44411 80502 60727 78635 55989 53808 67124 41250 47950 28625
63692 50432 74582 53324 61390 65550 51269 35850 49860 33142
84588 65854 43068 55257 66520 59449 25875 53571 51360 42158
55643 41886 35342 56155 41720 49677 61065 41830 43250 68829
47012 40003 37748 58708 49010 85600 69010 32819 25860 58267
79426 40709 75850 41539 84566 59168 45500 35807 48950 37864
48240 55912 34754 44719 86070 72655 57840 61477 57277 61030
74239 71360 65996 51861 48035 29840 45313 89116 65585 55521
𝑋𝑡 = 𝐷𝑢𝑟𝑎𝑐𝑖ó𝑛 𝑒𝑛 𝑘𝑖𝑙ó𝑚𝑒𝑡𝑟𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑡 − é𝑠𝑖𝑚𝑎 𝑙𝑙𝑎𝑛𝑡𝑎 𝐺𝑇𝑆 4
𝑆 = [9116; 86076], 𝑑𝑢𝑟𝑎𝑐𝑖ó𝑛𝑒𝑛 𝑘𝑖𝑙ó𝑚𝑒𝑡𝑟𝑜𝑠, 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑜
𝑇 = {1, . . , 100} 𝑙𝑙𝑎𝑛𝑡𝑎𝑠 𝐺𝑇𝑆 4, 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑜
El diagrama de dispersión es:
90000
80000
70000
60000
50000
40000
30000
20000
10000
0
1
4
7
34
55
76
97
10
13
16
19
22
25
28
31
37
40
43
46
49
52
58
61
64
67
70
73
79
82
85
88
91
94
100
Intervalo
Frecuencia
Mínimo Máximo
9,116 16,812 1
16,812 24,508 1
24,508 32,204 4
32,204 39,900 10
39,900 47,596 18
47,596 55,292 21
55,292 62,988 20
62,988 70,684 13
70,684 78,380 5
78,380 86,076 7
Total 100
Por la forma del histograma proponemos una distribución normal.
Estimamos la media y la varianza de la muestra
𝑛 𝑛
1 1 1 22231119178
𝜇 = ∑ 𝑥𝑖 = (5327100) = 53271 𝜎 2 = ∑(𝑥𝑖 − 𝜇)2 = = 222,311,191.78
𝑛 100 𝑛 100
1 1
𝜎 = 14,910.10
𝑳𝒂 𝒎𝒆𝒅𝒊𝒂 𝒆𝒔 𝝁 = 𝟓𝟑𝟐𝟕𝟏 𝒆𝒔 𝒍𝒂 𝒅𝒖𝒓𝒂𝒄𝒊ó𝒏 𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐 𝒆𝒏 𝒌𝒊𝒍ó𝒎𝒆𝒕𝒓𝒐𝒔 𝒅𝒆 𝒍𝒂𝒔 𝒍𝒍𝒂𝒏𝒕𝒂𝒔 𝒎𝒐𝒅𝒆𝒍𝒐 𝑮𝑻𝑺 𝟒
𝑳𝒂 𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝑽 = 𝟐𝟐𝟐, 𝟑𝟏𝟏, 𝟏𝟗𝟏. 𝟕𝟖,
𝑳𝒂 𝒅𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝒆𝒔𝒕𝒂𝒏𝒅𝒂𝒓 𝒆𝒔 𝟏𝟒, 𝟗𝟏𝟎. 𝟏𝟎 𝒌𝒎.
16812 − 53271
𝑧1 = = −2.44526
14910.10
24508 − 53271
𝑧2 = = −1.92909
14910.10
32204 − 53271
𝑧3 = = −1.41293
14910.10
39900 − 53271
𝑧4 = = −0.89677
14910.10
𝑥𝑖 − 𝜇 47596 − 53271
𝑃𝑎𝑟𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑟 𝑃𝐸𝑖 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑚𝑜𝑠 𝑧𝑖 = , 𝑧5 = = −0.38061
𝜎 14910.10
55292 − 53271
𝑧6 = = 0.13555
14910.10
62988 − 53271
𝑧7 = = 0.65171
14910.10
70684 − 53271
𝑧8 = = 1.16787
14910.10
78380 − 53271
𝑧4 = = 1.68403
14910.10
Fei/Foi
FO i FE i 25
1 0.72
1 1.96 20
4 5.20
10 10.61 15
18 16.68
21 20.22 10
20 18.88
13 13.59 5
5 7.53
7 4.61 0
1 2 3 4 5 6 7 8 9 10
100 100.00 FE i FO i
Intervalo
FO i FE i (Fei-Foi)^2/Fei
Mínimo Máximo
9,116 16,812 1 0.72 0.1089
16,812 24,508 1 1.96 0.4702
24,508 32,204 4 5.20 0.2769
32,204 39,900 10 10.61 0.0351
39,900 47,596 18 16.68 0.1045
47,596 55,292 21 20.22 0.0301
55,292 62,988 20 18.88 0.0664
62,988 70,684 13 13.59 0.0256
70,684 78,380 5 7.53 0.8501
78,380 86,076 7 4.61 1.2391
Total 100 100.00 3.2068
Joel Alberto Montalvo Hernández 15/11/2016
MTRA.GUADALUPE DEL CARMEN RODRIGUEZ MORENO.
Modelación estocástica.
Unidad 1. Determinación del tipo de distribución que presenta un proceso estocástico.
Evidencia de Aprendizaje. Modelación de comportamiento de procesos estocásticos.
𝑀𝐷 = 0.0249
Planteamos nuestras hipótesis
𝐻𝑜 : 𝑙𝑎 𝑑𝑢𝑟𝑎𝑐𝑖ó𝑛 𝑒𝑛 𝑘𝑖𝑙ó𝑚𝑒𝑡𝑟𝑜𝑠 𝑑𝑒𝑙 𝑚𝑜𝑑𝑒𝑙𝑜 𝑑𝑒 𝑙𝑙𝑎𝑛𝑡𝑎 𝐺𝑇𝑆 4 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎 𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 (53271,14910.1)
Joel Alberto Montalvo Hernández 15/11/2016
MTRA.GUADALUPE DEL CARMEN RODRIGUEZ MORENO.
Modelación estocástica.
Unidad 1. Determinación del tipo de distribución que presenta un proceso estocástico.
Evidencia de Aprendizaje. Modelación de comportamiento de procesos estocásticos.
𝑃(𝑥 > 50,000) = 0.5868 = 58.68% 𝑝𝑜𝑑𝑟í𝑎 𝑎𝑚𝑝𝑙𝑖𝑎𝑟𝑠𝑒 𝑙𝑎 𝑔𝑎𝑟𝑎𝑛𝑡í𝑎 𝑑𝑒 𝑑𝑢𝑟𝑎𝑐𝑖ó𝑛 𝑎 50,000 𝑘𝑚𝑠
𝑃(𝑥 > 60,000) = 0.3259 = 32.59% 𝑠𝑒 𝑠𝑢𝑔𝑖𝑒𝑟𝑒 𝑛𝑜 𝑎𝑚𝑝𝑙𝑖𝑎𝑟 𝑙𝑎 𝑔𝑎𝑟𝑎𝑛𝑡í𝑎 𝑑𝑒 𝑑𝑢𝑟𝑎𝑐𝑖ó𝑛 𝑎 60,000 𝑘𝑚𝑠
Analiza los datos dados en cada caso, y determina su comportamiento probando tu propuesta a través
de la prueba de Bondad de Ajuste .
2
Para la prueba de bondad de ajuste 𝜒 2 , elaboramos una tabla de frecuencias observadas FO y esperadas
FE, donde FE=nF(x) para las distribuciones continuas y FE=np(x) para las discretas; se toma el criterio FEi≥ 5,
si no se cumple el criterio se adjuntan las clases adyacentes, calculamos el parámetro
3
(𝐹𝐸𝑖 − 𝐹𝑂𝑖)2
𝐶=∑
𝐹𝐸𝑖
𝑖=1
Determinamos los grados de libertad df=m-r-1, m es el número de clases, r los parámetros estimados, el
2
nivel de significancia 𝛼 = 0.05 , calculamos 𝜒𝑑𝑓,𝛼 , planteamos las hipótesis de trabajo Ho y alterna Ha, si se
2 2
tiene que 𝐶 ≤ 𝜒𝑑𝑓,𝛼 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻𝑜 𝑛𝑜 𝑝𝑢𝑒𝑑𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑠𝑒, 𝑠𝑖 𝐶 ≥ 𝜒𝑑𝑓,𝛼 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝐻𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎
3) El encargado de calidad en una fábrica de cajas lápices, cada caja trae 40 lápices, se revisaron el número
de lápices sin punta, se consideraron 50 cajas.
¿En qué modelo probabilístico encaja mejor el comportamiento que presentan los lápices sin punta?
𝑋𝑡 = 𝐸𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑙á𝑝𝑖𝑐𝑒𝑠 sin 𝑝𝑢𝑛𝑡𝑎 𝑒𝑛 𝑙𝑎 𝑐𝑎𝑗𝑎 𝑡, 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎 − é𝑠𝑖𝑚𝑜 𝑎𝑣𝑖ó𝑛
𝑆 = {15, … 32}, 𝑙á𝑝𝑖𝑐𝑒𝑠 sin 𝑝𝑢𝑛𝑡𝑎, 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑜
𝑇 = {1, . . , 50} 𝑐𝑎𝑗𝑎𝑠, 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑜
Por la forma del histograma y considerando que la variable aleatoria es discreta propongo una distribución
binomial b(x; n, p)
Calculamos la media y la varianza
Xi Frecuencia XiFi Fi(Xi- μ)^2
15 1 15 83.5396
16 1 16 66.2596
17 1 17 50.9796
18 0 0 0
19 0 0 0
20 1 20 17.1396
21 4 84 39.4384
22 5 110 22.898
23 7 161 9.0972
24 11 264 0.2156
25 2 50 1.4792
26 7 182 24.2172
27 3 81 24.5388
28 3 84 44.6988
29 1 29 23.6196
30 1 30 34.3396
31 0 0 0
32 2 64 123.5592
50 1207 566.02
Media 24.14
Varianza 11.3204
𝑛 𝑛
1 1 1 566.02
𝜇 = ∑ 𝑥𝑖 = (1207) = 24.14 𝜎 2 = ∑(𝑥𝑖 − 𝜇)2 = = 11.3204
𝑛 50 𝑛 50
1 1
4) Se hace un experimento con una urna de 12 bolas blancas y 8 bolas negras y se extraen 12 bolas, se
hace el experimento 50 veces teniendo como resultado, se contabilizan las bolas blancas:
Xi Frecuencia
19
18
5 4
6 7
7 18 7
8 19 4 2
9 2 5 6 7 8 9
Por la forma del histograma y considerando que la variable aleatoria es discreta y el experimento consiste en
extraer una muestra sin reemplazo proponemos una distribución hipergeométrica h(x; N,n,k), donde N es el
tamaño de la población, n el tamaño de la muestra, k el número de éxitos, en este caso N=20 (bolas en total),
n=12 el tamaño de la extracción, k=12 (12 bolas blancas en la urna)
Calculamos la media y la varianza
𝑘 𝑁−𝑘
( )( )
𝐿𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑒𝑠 ℎ(𝑥; 𝑁, 𝑛, 𝑘) = 𝑥 𝑛 − 𝑥 , 𝑀𝑎𝑥{0, 𝑛 − (𝑁 − 𝑘)} ≤ 𝑥 ≤ 𝑚ï𝑛{𝑛, 𝑘}
𝑁
( )
𝑛
𝑘
∑ ℎ(𝑥; 𝑁, 𝑛, 𝑘) = 1
𝑖=1
𝑛𝑘 12 ∗ 12 144
𝐸𝑛 𝑒𝑠𝑡𝑒 𝑐𝑎𝑠𝑜 𝑁 = 20, 𝑛 = 12, 𝑘 = 12, 𝜇 = = = = 7.2
𝑁 50 20
𝑁−𝑛 𝑘 𝑘 20 − 12 12 12 8 8
𝜎2 = 𝑛 ( ) ( ) (1 − ) = 12 ( ) ( ) (1 − ) = 12 ( ) ( ) = 2.021
𝑁−1 𝑛 𝑁 20 − 1 12 20 19 20
𝐸𝑛 𝑒𝑠𝑡𝑒 𝑐𝑎𝑠𝑜 𝑀𝑎𝑥{0,12 − (20 − 12)} ≤ 𝑥 ≤ 𝑚í𝑛{12,12} 𝑑𝑒 𝑑𝑜𝑛𝑑𝑒 𝑀𝑎𝑥{0,4} ≤ 𝑥 ≤ 12 → 4 ≤ 𝑥 ≤ 12
12 8
( )( )
ℎ(𝑥; 20,12,12) = 𝑥 12 − 𝑥 , 4 ≤ 𝑥 ≤ 12
20
( )
12
12 8 12! 8!
( )( ) 𝑥! (12 − 𝑥)! (12 − 𝑥)! (8 + 𝑥 − 12)! (12!)2 (8!)2
𝐹𝑒𝑖 = 50 𝑥 12 − 𝑥 = 50 = 2,
20 20! 20! 𝑥! ((12 − 𝑥)!)
( )
12 12! 8!
La tabla de frecuencias esperadas y observadas así como su histograma son:
Xi Foi Fei
5 4 2.71
6 7 10.27
7 18 17.60
8 19 13.76
9 2 5.66
19
18
17.60
13.76
10.27
5.66
2.71
2
1 2 3 4 5
Fei Foi
Al comparar Fei y Foi en el histograma se observa que los datos se ajustan a un modelo hipergeométrico..
Joel Alberto Montalvo Hernández 15/11/2016
MTRA.GUADALUPE DEL CARMEN RODRIGUEZ MORENO.
Modelación estocástica.
Unidad 1. Determinación del tipo de distribución que presenta un proceso estocástico.
Evidencia de Aprendizaje. Modelación de comportamiento de procesos estocásticos.
Analiza los datos dados en cada caso, y determina su comportamiento probando tu propuesta a través de la
prueba de Bondad de Ajuste de Kolmogorov - Smirnov.
En los siguientes problemas consideramos la prueba de Smirnov-Kolmogorov, por medio de los
siguientes pasos.
a) Elaborar la tabla de clases o intervalos y frecuencias observadas FO.
b) Calculamos la probabilidad observada POi=FOi/n.
c) Determinamos la probabilidades observadas acumuladadas POAi.
d) Calculamos las probabilidades esperadas PEi.
e) Calculamos las probabilidades acumuladas esperadas PEAi.
5) Se contabiliza el tiempo que tarda en reparación el wifi en horas, teniendo los siguientes resultados:
8.94 3.58 2.14 2.00 0.73
0.58 8.32 10.00 2.92 1.46
0.33 1.34 5.59 0.86 3.08
3.45 3.75 1.21 6.33 2.87
8.27 0.87 2.70 0.16 1.09
0.75 23.61 1.65 7.51 17.39
0.70 6.03 0.49 1.06 13.73
9.50 11.40 4.14 13.35 20.89
0.34 0.80 3.04 1.45 9.26
11.61 8.47 0.83 2.34 5.13
28
6 16.91-20.26 2
3
7 20.26-23.61 1 1 2 1
En el histograma se observa que las frecuencias decrecen rápidamente y como tenemos una variable aleatoria
continua con espacio de estado continuo considero que los datos se ajustan a un modelo exponencial.
𝑃𝑎𝑟𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑥𝑝𝑜𝑛𝑒𝑛𝑐𝑖𝑎𝑙 𝜇 = 𝜆, 𝜎 2 = 𝜆2
1 −𝑥
𝐿𝑎 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑒𝑛𝑠𝑖𝑑𝑎𝑑 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑥 𝑒𝑠 𝑓(𝑥; 𝜆) = { 𝜆 𝑒 , 𝑥 ≥ 0
𝜆
0, 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
100 100
𝑥𝑖 258.04 1 1482.23
𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑚𝑜𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑦 𝑙𝑎 𝑎𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝜇 = ∑ = = 5.16; , 𝜎 2 = ∑(𝑥 − 𝑥̅ )2 = = 29.645
100 50 100 50
𝑖=1 𝑖=1
1 − 𝑥
𝐸𝑛 𝑒𝑠𝑡𝑒 𝑐𝑎𝑠𝑜 𝜇 = 5.16, 𝜎 2 = 29.645, 𝑙𝑎 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑒𝑛𝑠𝑖𝑑𝑎𝑑 𝑒𝑠 𝑓(𝑥, 6) = 𝑒 5.16 ;
5.16
𝑏
1 − 𝑥 𝑥
𝑏 𝑎 𝑏
𝐹(𝑥; 𝑎, 𝑏) = ∫ 𝑒 5.16 𝑑𝑥 = −𝑒 −5.16 | = 𝑒 −5.16 − 𝑒 −5.16
𝑎 5.16 𝑎
𝑎 𝑏
𝑃𝑎𝑟𝑎 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝐹𝐸 = 𝑛𝐹(𝑥) = 50 (𝑒 −5.16 − 𝑒 −5.16 )
Fei/Foi
28
24.68
12.09
8
7
6.32
3 3.30
1 1.72 2 0.90 1 0.99
1 2 3 4 5 6 7
Foi Fei
Comparando las frecuencias en el gráfico notamos que los tiempos de reparación del wifi se ajustan a un modelo
exponencial con lambda=5.16
Elaboramos una tabla de FO, FeCalculamos POi=FOi/n, y generamos una tabla con IC, FO, POi, POAi
Clase Intervalo Foi Poi POAi
1 0.00-3.51 28 0.56 0.56
2 3.51-6.86 7 0.14 0.70
3 6.86-10.21 8 0.16 0.86
4 10.21-13.56 3 0.06 0.92
5 13.56-16.91 1 0.02 0.94
6 16.91-20.26 2 0.04 0.98
7 >20.26 1 0.02 1.00
Total 50
𝑎 𝑏
𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑚𝑜𝑠 𝑃𝐸𝑖 = 𝑒 −5.16 − 𝑒 −5.16 , 𝑃𝐴𝑖; |𝑃𝐸𝑖 − 𝑃𝑂𝑖| 𝑦 𝑀𝑎𝑥{|𝑃𝐸𝑖 − 𝑃𝑂𝑖|}, 𝑡𝑎𝑏𝑢𝑙𝑎𝑚𝑜𝑠
Intervalo Foi Poi POAi Pei PEAi |PEAi-Poi|
0.00-3.51 28 0.56 0.56 0.4935 0.4935 0.0665
3.51-6.86 7 0.14 0.70 0.2419 0.7354 0.0354
6.86-10.21 8 0.16 0.86 0.1264 0.8617 0.0017
10.21-13.56 3 0.06 0.92 0.0660 0.9278 0.0078
13.56-16.91 1 0.02 0.94 0.0345 0.9623 0.0223
16.91-20.26 2 0.04 0.98 0.0180 0.9803 0.0003
>20.26 1 0.02 1.00 0.0197 1.0000 0.0000
Total 50
𝑀𝐷 = 0.0665
Planteamos nuestras hipótesis
𝐻𝑜 : 𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑞𝑢𝑒 𝑡𝑎𝑟𝑑𝑎 𝑒𝑛 𝑟𝑒𝑝𝑎𝑟𝑎𝑐𝑖ó𝑛 𝑒𝑙 𝑤𝑖𝑓𝑖 𝑒𝑛 ℎ𝑜𝑟𝑎𝑠 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎 𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑥𝑝𝑜𝑛𝑒𝑛𝑐𝑖𝑎𝑙 𝜆 = 5.16
𝐻𝑜: 𝑋~ 𝑒𝑥𝑝𝑜𝑛𝑒𝑛𝑐𝑖𝑎𝑙 𝜆 = 5.16
𝐻𝑎 𝑛𝑜 𝐻𝑜
𝑃𝑎𝑟𝑎 𝛼 = 0.05 𝑐𝑜𝑛 𝑛 = 50 𝐷0.05,50 = 0.18841
𝐶𝑜𝑚𝑜 𝑀𝐷 = 0.0665 ≤ 0.18841 = 𝐷0.05,50 , 𝑛𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑝𝑎𝑟𝑎 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻𝑜, 𝑝𝑜𝑟 𝑙𝑜 𝑐𝑢𝑎𝑙 𝑝𝑜𝑑𝑒𝑚𝑜𝑠
𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝑑𝑒 0.05 𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑟𝑒𝑝𝑎𝑟𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑤𝑖𝑓𝑖 𝑒𝑛 ℎ𝑜𝑟𝑎𝑠 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎 𝑎
𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑥𝑝𝑜𝑛𝑒𝑛𝑐𝑖𝑎𝑙 (𝜆 = 5.16).
Tenemos una variable continua con un espacio de estados continuo, considerando la media se tienen
23 datos a izquierda y 27 a la derecha de la misma, podemos considerarla casi simétrica; en el intervalo
(𝜇 − 𝜎; 𝜇 + 𝜎) = (65.03; 73.60) contiene 32 de los datos el 64% contra el 68.26% esperado en una distribución
normal, por lo anterior proponemos un modelo normal (69.3198, 4.2858).
Joel Alberto Montalvo Hernández 15/11/2016
MTRA.GUADALUPE DEL CARMEN RODRIGUEZ MORENO.
Modelación estocástica.
Unidad 1. Determinación del tipo de distribución que presenta un proceso estocástico.
Evidencia de Aprendizaje. Modelación de comportamiento de procesos estocásticos.
62.78 − 69.3198
𝑧1 = = −1.5259
4.2858
65.59 − 69.3198
𝑧2 = = −0.8703
4.2858
68.40 − 69.3198
𝑧3 = = −0.2146
4.2858
𝑥𝑖 − 𝜇 71.21 − 69.3198
𝑃𝑎𝑟𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑟 𝑃𝐸𝑖 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑚𝑜𝑠 𝑧𝑖 = , 𝑧4 = = 0.4410
𝜎 4.2858
74.02 − 69.3198
𝑧5 = = 1.0967
4.2858
76.83 − 69.3198
𝑧6 = = 1.7523
4.2858
79.64 − 69.3198
𝑧7 = = 2.4080
4.2858
FO/FE
16
FO FE
12.770
3 3.175 11 11.145
6 6.430 9.660
11 11.145
6 6.430 6 6
16 12.770 4.825
6 9.660 3 3.175 2 1.995
6 4.825 1 2 3 4 5 6 7
2 1.995
FO FE
50 50.000
En el histograma se observa que en los intervalos 1, 2, 3, 6 y 7 las frecuencias observadas y esperadas tienen
valores muy cercanos y la suma de las frecuencias en los intervalos 4 y 5 presentan de igual modo valores muy
cercanos.
𝑀𝐷 = 0.0496
Planteamos nuestras hipótesis
𝐻𝑜 : 𝑒𝑙 𝑝𝑒𝑠𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑎𝑙𝑢𝑚𝑛𝑜𝑠 𝑑𝑒 𝑢𝑛𝑎 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑑𝑎𝑑 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎 𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 (69.3198, 4.2858).
𝐻𝑜: 𝑋~ 𝑛𝑜𝑟𝑚𝑎𝑙 (69.3198, 4.2858)
𝐻𝑎 𝑛𝑜 𝐻𝑜
𝑃𝑎𝑟𝑎 𝛼 = 0.05 𝑐𝑜𝑛 𝑛 = 50, 𝐷0.05,50 = 0.18841
𝐶𝑜𝑚𝑜 𝑀𝐷 = 0.0496 ≤ 0.18841 = 𝐷0.05,50 , 𝑛𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑝𝑎𝑟𝑎 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻𝑜, 𝑝𝑜𝑟 𝑙𝑜 𝑐𝑢𝑎𝑙 𝑝𝑜𝑑𝑒𝑚𝑜𝑠
𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝑑𝑒 0.05 𝑒𝑙 𝑝𝑒𝑠𝑜 𝑒𝑛 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑎𝑙𝑢𝑚𝑛𝑜𝑠 𝑑𝑒 𝑢𝑛𝑎 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑑𝑎𝑑
𝑠𝑒𝑗𝑢𝑠𝑡𝑎 𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 (69.3198, 4.2858).
7) El tiempo en minutos que tarda un persona en llegar a la fila para hacer la actualización de la placas
del auto son las siguientes:
16.09 19.92 15.95 16.75 16.32
Establece el modelo probabilístico que represente a los tiempos entre llegadas de las personas para
actualizar su placa.
𝑋𝑡 = 𝑇𝑖𝑒𝑚𝑝𝑜 𝑒𝑛 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑒𝑛𝑡𝑟𝑒 𝑙𝑙𝑒𝑔𝑎𝑑𝑎𝑠 𝑎 𝑙𝑎 𝑓𝑖𝑙𝑎 𝑝𝑎𝑟𝑎 𝑎𝑐𝑡𝑢𝑎𝑙𝑖𝑧𝑎𝑟 𝑠𝑢 𝑝𝑙𝑎𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑡 − é𝑠𝑖𝑚𝑎 𝑝𝑒𝑟𝑠𝑜𝑛𝑎
𝑆 = [0, … ,1440] 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑜, 𝑡𝑖𝑒𝑚𝑝𝑜 𝑒𝑛𝑡𝑟𝑒 𝑙𝑙𝑒𝑔𝑎𝑑𝑎𝑠 𝑒𝑛 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝑇 = {1, . . , 50} 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑜, 𝑎𝑣𝑖𝑜𝑛𝑒𝑠
8.60
𝑅𝑎𝑛𝑔𝑜 = 𝑀𝑎𝑥 − 𝑀í𝑛 = 23.94 − 15.34 = 8.60 𝑘 = √50 = 7.07~7, 𝐴𝑖 = = 1.23
7
La tabla de frecuencias e histograma son:
Intervalo
Mínimo Máximo FO
15.34 16.57 11
16.57 17.80 7
17.80 19.03 3
19.03 20.25 6
20.25 21.48 7
21.48 22.71 5
22.71 23.94 11
50
𝑥𝑖 982.59
𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑚𝑜𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑦 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝜇 = ∑ = = 19.6518,
50 50
𝑖=1
𝑘
2
1 395.5403
𝜎 = ∑(𝑥 − 19.6518)2 = = 7.9108
50 50
𝑖=1
Tenemos una variable continua y en el histograma se observan las frecuencias más altas en los intervalos de
los extremos, sugerimos un modelo uniforme continuo.
𝑎+𝑏 (𝑏 − 𝑎)2
𝑃𝑎𝑟𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑎 𝜇 = ; 𝜎2 = ,
2 12
1 𝑑
1 𝑥 𝑑
𝑓(𝑥) = {𝑏 − 𝑎 , 𝑎 ≤ 𝑥 ≤ 𝑏 , 𝐹(𝑥) = ∫ 𝑑𝑥 = |
𝑐 𝑏−𝑎 𝑏−𝑎 𝑐
0, 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
La media observada (19.6518) y la esperada (19.64) presentan valores muy próximos, para la varianza
observada (7.9168) y la esperada (6.1633) presentan valores próximos.
Elaboramos la tabla de FO y FE=50F(x) e histograma.
FO/Fe
Intervalo
Mínimo Máximo FO FE 11 11
15.34 16.57 11 7.151
16.57 17.80 7 7.151 7.151 7 7.151 7.151 7.093 7 7.151 7.151 7.151
17.80 19.03 3 7.151 6
5
19.03 20.25 6 7.093 3
20.25 21.48 7 7.151
21.48 22.71 5 7.151 1 2 3 4 5 6 7
22.71 23.94 11 7.151 FO FE
50 50.000
Generamos la tabla de frecuencia observada FO, PO=FO/100, POA, PE y PEA, |PEAi-POAi| yMD
Intervalo
Mínimo Máximo FO FE PO i POAi PE i PEAi |PEAi-POAi|
15.34 16.57 11 7.151 0.22 0.22 0.1430 0.143 0.077
16.57 17.80 7 7.151 0.14 0.36 0.1430 0.286 0.074
17.80 19.03 3 7.151 0.06 0.42 0.1430 0.429 0.009
19.03 20.25 6 7.093 0.12 0.54 0.1420 0.571 0.031
20.25 21.48 7 7.151 0.14 0.68 0.1430 0.714 0.034
21.48 22.71 5 7.151 0.10 0.78 0.1430 0.857 0.077
22.71 23.94 11 7.151 0.22 1.00 0.1430 1.000 0.000
𝑀𝐷 = 0.077
Planteamos nuestras hipótesis
𝐻𝑜 : 𝐸𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑒𝑛 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑒𝑛𝑡𝑟𝑒 𝑙𝑙𝑒𝑔𝑎𝑑𝑎𝑠 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑎 𝑙𝑎 𝑓𝑖𝑙𝑎 𝑝𝑎𝑟𝑎 𝑎𝑐𝑡𝑢𝑎𝑙𝑖𝑧𝑎𝑟 𝑠𝑢 𝑝𝑙𝑎𝑐𝑎 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎 𝑎 𝑢𝑛𝑎
𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑎 (15.34, 23.94)
𝐻𝑜: 𝑋~ 𝑈𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑎 (15.34, 23.94)
𝐻𝑎 𝑛𝑜 𝐻𝑜
𝑃𝑎𝑟𝑎 𝛼 = 0.05 𝑐𝑜𝑛 𝑛 = 50, 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒 𝑝𝑎𝑟𝑎 𝐷0.05,50 = 0.18841
𝐶𝑜𝑚𝑜 𝑀𝐷 = 0.077 ≤ 0.18841 = 𝐷0.05,50 , 𝑛𝑜 𝑠𝑒 𝑝𝑢𝑒𝑑𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻𝑜, 𝑝𝑜𝑟 𝑙𝑜 𝑐𝑢𝑎𝑙 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟
𝑞𝑢𝑒 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝑑𝑒 0.05 𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑒𝑛 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑒𝑛𝑡𝑟𝑒 𝑙𝑙𝑒𝑔𝑎𝑑𝑎𝑠 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑎 𝑙𝑎 𝑓𝑖𝑙𝑎 𝑝𝑎𝑟𝑎
Conclusiones.
Para poder determinar él modelo adecuado para una muestra de variables aleatorias debemos de:
Las pruebas de bondad ajuste nos permiten validar con un determinado nivel de confianza modelo que elegimos
para representar un proceso estocástico, con ello consideramos que el análisis, estudio del proceso es
completo.
Referencias
Walpole, R., Myers, R., Myers, S., & Ye, K. (2013). Probabilidad y estadística para ingeniería y ciencias 9a. ed.
México: Pearson.
Frias, M.. (2014). Estadística II tablas estadísticas. noviembre 15, 2016, de Universidad de jaén Sitio web:
http://www4.ujaen.es/~mpfrias/TablasInferencia.pdf.
Márquez, C.. (2012). Prueba de bondad de ajuste. noviembre 13, 2016, de Wordpress Sitio web:
https://carlosmarquez.files.wordpress.com/2012/02/prueba-de-bondad-de-ajuste.pdf
Mutis, J.. (2014). Prueba de normalidad Jarque-Bera. noviembre 24, 2016, de prezi Sitio web:
https://prezi.com/lt2jzea26lyu/prueba-de-normalidad-jarque-bera/
Montalván, L. (2014). Prueba de Shapiro-Wilk para probar normalidad. noviembre 24, 2016, de prezi Sitio web:
https://prezi.com/lt2jzea26lyu/prueba-de-normalidad-jarque-bera/
Cuba, E. (2014). Chequeo de aondad de ajuste Anderson-Darling. noviembre 24, 2016, de prezi Sitio web:
https://prezi.com/lt2jzea26lyu/prueba-de-normalidad-jarque-bera/