Sunteți pe pagina 1din 6

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

TERCERA PRCTICA DE ESTADSTICA Y PROBABILIDADES


Mallaopoma Prez, Keevin Reyner reii7500@hotmail.com

Facultad de Ingeniera Civil Universidad Nacional de Ingeniera

RESUMEN: El trabajo consisti en tomar mediciones de los intervalos de tiempo en que llegan los buses del metropolitano para nuestro caso en la estacin de Caquet y manejar el tiempo de espera de diez pasajeros, por otra parte debemos medir los intervalos de tiempo que llegan los buses de una lnea en particular que haga un recorrido por la estacin Caqueta.. Para el anlisis de datos se escoge una hiptesis (hiptesis nula) basada en una distribucin terica (distribucin exponencial). El procedimiento a seguir en cada caso es la aplicacin de la prueba de Kolmogorov-Smirnov y ver si se acepta o rechaza la hiptesis nula (H 0). Finalmente comparar los resultados obtenidos en los dos casos y obtener algunas conclusiones.

2 OBJETIVOS
Recordar y practicar las definiciones bsicas ya usadas en el tema de estadstica descriptiva como frecuencia relativa, frecuencia absoluta, frecuencia relativa acumulada, frecuencia absoluta acumulada, media, varianza, desviacin estndar, regla de Struges y construir grficos propios de la estadstica como histogramas o diagramas de frecuencias. Recordar la definicin del modelo probabilstico exponencial. Recordar las definiciones de variable aleatoria discreta y continua para el estudio de este experimento Registrar el tiempo exacto con el que llegan los buses a una estacin del METROPOLITANO as como para el tiempo que demoran los pasajeros en tomar los buses, para construir un histograma. Aprender a usar la prueba de KOLMOGOROV-SMIRNOV para ver si el histograma de aproxima una distribucin exponencial.

1 INTRODUCCIN
En el presente informe se aplicar lo aprendido en el curso de Estadstica y Probabilidades ayudndonos con el Test de Kolmogorov-Smirnov, que para esta ocasin se basa en datos obtenidos en la estacin del metropolitano en la cual se considera los tiempos de frecuencia que hay entre buses. En la construccin del modelo de simulacin es importante decidir si un conjunto de datos se ajusta apropiadamente a una distribucin especfica de probabilidad. Al probar mediante alguno de los mtodos, como el Test de Kolmogorov-Smirnov, se comparan las frecuencias observadas FO en cada categora o intervalo de clase con las frecuencias esperadas tericamente FE y mediante est comparacin se ve si los datos se pueden regir segn el modelo considerado.

3 FUNDAMENTO TERICO
PRUEBA DE SMIRNOV-KOLMOGOROV Esta es una prueba de bondad y ajuste. Surgi en 1939. Kolmogorov y Smirnov supusieron que la distribucin de probabilidad que se encontraba a prueba era continua y que se conoca ciertos parmetros de la poblacin (como la media y la varianza). La prueba se emplea para probar el grado de concordancia entre la distribucin de datos empricos de la muestra y alguna distribucin terica especfica. Esta prueba sirve para verificar o negar la hiptesis que un conjunto de observaciones

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

provienen de una distribucin. El estadstico D que se utiliza en esta prueba es una medida de la diferencia mxima observada entre la distribucin emprica y la terica supuesta. D es una variable aleatoria. Se utiliza esta prueba para verificar o negar que un conjunto de nmeros aleatorios tengan una distribucin supuesta inicialmente. El estadstico de prueba (D) est dado por la diferencia existente entre la frecuencia observada relativa y la frecuencia esperada relativa:

4 PRESENTACIN DEL PROBLEMA


El Metropolitano es un sistema integrado de transporte pblico de Lima, que cuenta con buses articulados de gran capacidad. El objetivo de este moderno sistema es elevar la calidad de vida de los ciudadanos, al ahorrarles tiempo en el traslado diario, brindarles mayor seguridad, una mejor calidad de servicio y trato ms humano. Bajo este contexto: Cunto ser el tiempo que espera un pasajero? Qu tan frecuente llegan los buses a una estacin? El tiempo en que llegan los buses seguir una distribucin exponencial?

*| ( )

( )| | ( )

( )|+

PROCEDIMIENTO A SEGUIR 1) Formular la hiptesis nula (H0). Teniendo en cuenta que los nmeros que se van a generar provienen de una distribucin. Se selecciona una muestra de tamao n de nmeros aleatorios. Se hallan los parmetros de acuerdo a la distribucin que se est utilizando y dems datos que sirvan de base para la realizacin de la prueba. Ej.: para el caso de una distribucin normal se deben hallar los parmetros respectivos (Media, desviacin estndar) y otros datos de utilidad. Se debe calcular la funcin de distribucin acumulada para despus hallar las frecuencias respectivas. Antes de poder hallar el estadstico de prueba se debe hallar la frecuencia relativa observada y la frecuencia relativa terica de cada uno de los intervalos establecidos de acuerdo al rango. Se aplica la ecuacin ( )| | ( ) ( )|+ *| ( ) Posteriormente, se halla el estimador Kolmogorov-Smirnov que es: Valor mximo entre todos los valores hallados para cada intervalo. Se establece un nivel de significancia de acuerdo al planteamiento. Con base a lo anterior se consulta la tabla de lmites de aceptacin para la prueba de Kolmogorov-Smirnov para un tamao de muestra n y un determinado nivel de riesgo , Si el estimador de la prueba es menor al valor buscado en la tabla se acepta H0.

5 RESOLUCIN DEL PROBLEMA


CASO I Para el Caso I a la llegada de un primer bus hemos considerado el instante de tiempo t=0 y con un cronmetro hemos calculado los intervalos de tiempo de la llegada de los dems buses.

2) 3)

TOTAL DE DATOS: n=50 Tabla 1. TIEMPO ENTRE LLEGADA DE LOS BUSES CASO I

4)

5)

6)

7)

8) 9)

TIEMPO 42 96 4 16 6 6 6 86 3 6 4 8 7 5 8 17 30 12 3 3 16 27 68 6 107

ACUMULADO 42 138 142 158 164 170 176 262 265 271 275 283 290 295 303 320 350 362 365 368 384 411 479 485 592

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

8 TIEMPO 10 59 11 3 5 4 11 5 171 6 10 86 7 5 TIEMPO MEDIO:

600 ACUMULADO 610 669 680 683 688 692 703 708 879 885 895 981 988 993

[12.875-24.75> [24.75-36.625> [36.625-48.5> [48.5-60.375> [60.375-72.25> [72.25-84.125> [84.125-96>

6 4 1 1 1 2 3

38 42 43 44 45 47 50

0.12 0.08 0.02 0.02 0.02 0.04 0.06

0.76 0.84 0.86 0.88 0.9 0.94 1

Usando el programa EXCEL, con la funcin ALEATORIO.ENTRE (0,T), siendo T=1254 seg, se forman 10 nmeros aleatorios que representaran el instante de llegada de 10 pasajeros elegidos al azar y asumiendo que toman el bus ms prximo que llega a la estacin, calculamos el tiempo que esperan dichos pasajeros.

Figura 1.HISTOGRAMA CASO I El histograma tiene una forma que se asemeja a la distribucin exponencial; usaremos la prueba de KolmogorovSmirnov para verificarlo. H0= El tiempo entre llegada de buses tiene una distribucin exponencial. H1= El tiempo entre llegada de buses no tiene una distribucin exponencial. n (nmero de intervalos)= 8 Nivel de significancia: =0.02 Calculamos la funcin de distribucin acumulada terica para cada intervalo, calculamos el Estadstico D. DISTRIBUCION EXPONENCIAL: F(ti)= ;=1/ ; Table 4.TABLA DE DISTRIBUCIN ACUMULADA TIEMPO ti Hi F(ti) [1 - 12.875> 12.875 0.64 0.48293 [12.875 - 24.75> 24.75 0.76 0.71859 [24.75 - 36.625> 36.625 0.84 0.84684 [36.625 - 48.5> 48.5 0.86 0.91664 [48.5 - 60.375> 60.375 0.88 0.95463 [60.375 - 72.25> 72.25 0.9 0.97531 [72.25 - 84.125> 84.125 0.94 0.98656 [84.125 - 96> 96 1 0.99269 TIEMPO |F(ti)-Hi| |F(ti)-Hi-1| Di

Tabla 2.TIEMPO SIMULADO DE ESPERA DE PASAJEROS CASO I TIEMPO DE PASAJERO BUS ESPERA 67 138 71 145 158 13 165 170 5 236 262 26 372 384 12 441 479 38 613 617 4 725 748 23 738 748 10 890 897 7 TIEMPO PROMEDIO DE ESPERA: 20.9 seg Ordenamos los tiempos recolectado y con ellos construimos nuestra tabla de frecuencias usando la regla de STURGES: R=Tmax-Tmin R= 96-1=95 K=1+3.3log (n) K=1+3.3log(50)=6.6 Tomamos nmero de intervalos K=8 W=R/K W=11.875 Tabla 3.TABLA DE FRECUENCIAS CASO I TIEMPO [1-12.875> f 32 F 32 h 0.64 H 0.64

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

[1- 12.875> [12.875- 24.75> [24.75- 36.625> [36.625- 48.5> [48.5- 60.375> [60.375- 72.25> [72.25- 84.125> [84.125- 96>

0.15707 0.04141 0.00684 0.05664 0.07463 0.07531 0.04656 0.00731

0.48293 0.07859 0.08684 0.07664 0.09463 0.09531 0.08656 0.05269

0.48293 0.07859 0.08684 0.07664 0.09463 0.09531 0.08656 0.05269

Tabla de frecuencias e histograma: R=326-24=302 K=1+3.3log(38)= 6.21 Tomamos K=7 W=R/K= 43.14

Tabla 7.TABLA DE FRECUENCIAS CASO II

D=Di(mx)=0.48293 Buscamos en la tabla del Test de Kolmogorov-Smirnov sobre Bondad de Ajuste en base a n y : D= 0.50654> D=0.48293 Esto quiere decir que se acepta Ho y por tanto el tiempo se puede ajustar a una Distribucin Exponencial.

TIEMPO [24 - 67.14> [67.14 - 110.29> [110.29 - 153.43> [153.43 - 196.57> [196.57 - 239.71> [239.71 - 282.86> [282.86 - 326]

f 19 9 1 3 3 1 2

F 19 28 29 32 35 36 38

h 0.5 0.2368 0.0263 0.0789 0.0789 0.0263 0.0526

H 0.5 0.7368 0.7632 0.8421 0.9211 0.9474 1

CASO II Para el Caso II con un cronmetro hemos medido cada cuanto tiempo llegan los buses y para este caso no hay la necesidad de tomar un tiempo t=0, medimos adems el tiempo que esperan de 10 personas elegidas al azar. TOTAL DE DATOS: n=38 Tabla 5.TIEMPO ENTRE LLEGADA DE LOS BUSES CASO II 24 27 217 34 101 97 47 78 196 185 98 65 75 308 46 106 100 29 62 29 237 64 48 326 85 24 48 55 120 24 254 54 36 38 185 223 25 91 TIEMPO MEDIO: Tabla 6. TIEMPO DE ESPERA DE 10 PASAJEROS CASO II 42 29 48 169 128 46 21 38 33 110 TIEMPO MEDIO DE ESPERA: 66.4seg Figura 2. HISTOGRAMA CASO II Tiene una forma semejante a la exponencial, as que lo comprobaremos mediante la prueba deKolmogorovSmirnov. Ho=El tiempo entre llegada de buses tiene una distribucin exponencial. H1= El tiempo entre llegada de buses no tiene una distribucin exponencial. n (nmero de intervalos)= 7 Nivel de significancia: =0.02 Calculamos la funcin de distribucin acumulada terica para cada intervalo, calculamos el Estadstico D. DISTRIBUCION EXPONENCIAL: F(ti)= ; =1/ ;

Tabla 8. TABLA DE DISTRIBUCIN ACUMULADA CASO II TIEMPO ti Hi [24- 67.14> 67.14 0.5 [67.1 - 110.29> 110.29 0.7368 [110.29- 153.43> 153.43 0.7632

F(ti) 0.4836 0.6622 0.7791

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

[153.43- 196.57> [196.57- 239.71> [239.71- 282.86> [282.86- 326] TIEMPO [24- 67.14> [67.1- 110.29> [110.29- 153.43> [153.43- 196.57> [196.57- 239.71> [239.71- 282.86> [282.86- 326]

196.57 239.71 282.86 326 |F(ti)-Hi| 0.0164 0.0746 0.0159 0.0134 0.0155 0.0092 0.0404

0.8421 0.9211 0.9474 1 |F(ti)-Hi-1| 0.4836 0.1622 0.0423 0.0924 0.0634 0.0171 0.0122

0.8555 0.9055 0.9382 0.9596 Di 0.4836 0.1622 0.0423 0.0924 0.0634 0.0171 0.0404

Los usuarios que toman una determinada lnea ( Expreso N3) tardan en tomar el bus 1min aproximadamente. En contraste con los datos anteriores estos son ms distantes de los que se puede inferir : Los usuarios que optan por esta modalidad de lnea, tratan de embarcarse lo ms rpido posible incluso , el bus me mostrar con mayor cantidad de pasajeros que su capacidad.

D=Di(mx)=0.4836 Buscamos en la tabla del Test de Kolmogorov-Smirnov sobre Bondad de Ajuste en base a n y : D= 0.53844> D= 0.4836 Por lo tanto se acepta Ho.

DISTRIBUCIN DEL TIEMPO: F(ti)=

7 CONCLUSIONES
Si hay un acercamiento entre la grfica (histograma) y el modelo exponencial existe una probabilidad de que los datos se ajusten a la distribucin terica. El uso de la prueba de KOLMOGOROV de ajuste resulta sencillo si se conoce y entiende la metodologa de esta prueba. Adems es importante conocer las bases estadsticas necesarias. Entendiendo claramente los conceptos de parmetros, sus propiedades y las tcnicas de solucin, as se puede entender la aplicacin de las pruebas de bondad de ajuste y hacer buen uso de estas pruebas tan importantes dentro de la estadstica. De los resultados, se aprecia que los promedios son muy distintos, de esto se puede decir que como los contextos son distintos, tambin los resultados lo son. De lo anterior, a pesar de que los promedios son distintos, existe cierta proporcin en la variacin de dichos promedios. Notamos que al momento de tomar los datos analizados, estos pueden presentar variaciones, puesto que influyen de manera significativa aspectos como los horarios , das feriados , fines de semana ,accidentes, etc.

6 RESULTADOS
CASO I TIEMPO MEDIO ENTRE LLEGADA DE BUSES: A Aproximadamente cada 19,52 segundos llega una unidad de transporte ,de cualquier lnea, en un terminal del metropolitano) TIEMPO PROMEDIO DE ESPERA DE UN PASASJERO: 20.9 seg En promedio cada usuario que ingresa a un terminal del metropolitano tarda en esperar el bus unos 20.9 segundos) Al comparar ambos resultados obtenidos anteriormente notamos que son muy prximos, lo cual nos indica que la frecuencia de los buses satisface en gran medida la gran demanda de usuarios del metropolitano. DISTRIBUCIN DEL TIEMPO: F(ti)=

CASO II TIEMPO MEDIO ENTRE LLEGADA DE BUSES: Aproximadamente cada 1,6 minutos se estaciona una unidad del metropolitano, de una lnea especfica (Expreso N3), en un determinado terminal. TIEMPO PROMEDIO DE ESPERA DE UN PASASJERO:66.4seg

8 BIBLIOGRAFA
Crdova ZamoraManuel, Estadstica Descriptiva e Inferencial.

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

Moya Caldern Rufino, Probabilidad e Inferencia Estadstica.

S-ar putea să vă placă și