Documente Academic
Documente Profesional
Documente Cultură
Presentado por:
Elkin Fabian Carreño Coronel
2170258
Presentado a:
Tulia Esther Rivera Flórez
Método 1:
Para realizar el Q-Q plot se calcula inicialmente la probabilidad acumulada (Probabilidad de que
el éxito esté en la zona roja de la gráfica 1), para esto hay diferentes fórmulas propuestas, para
nuestro análisis se utilizará la siguiente ecuación propuesta en el dropbox de la clase, aclarando
que sin importar la ecuación utilizada los resultados de probabilidad obtenidos son muy
similares:
1
𝑖−2
𝑃𝑖 =
𝑛
Donde Pi es el nivel de probabilidad, i es el contador de los datos, y n es el tamaño de la
muestra que se está analizando.
Inverso de la
Persona Altura Nivel de Probabilidad
Distribución Normal
1 1,62 0,005 -2,575829304
2 1,62 0,015 -2,170090378
3 1,63 0,025 -1,959963985
. . . .
. . . .
. . . .
98 1,8 0,975 1,959963985
99 1,81 0,985 2,170090378
100 1,81 0,995 2,575829304
Luego de esto se procedió a realizar el Q-Q Plot con la ayuda de Excel, con un gráfico de
dispersión que tenía en el eje x el cuantil teórico de una distribución normal (Inverso de la
Distribución Normal), y en el eje y, los datos obtenidos mediante la encuesta realizada para la
altura de los estudiantes hombres de la UIS (Altura), obteniéndose la siguiente gráfica (Altura
Vs. Inverso de la Distribución Normal):
Q-Q Plot
1.9
1.85
1.8
1.75
1.7
1.65
1.6
1.55
-3 -2 -1 0 1 2 3
Promedio 1,7177
Moda 1,69
Mediana 1,725
Maximo 1,81
Minimo 1,62
Rango 0,19
Desviación 0,048635
Varianza 0,0023654
N° Datos 100
Intervalos 10
Paso h 0,019
Curtosis -0,939314
Asimetria -0,045336
Se establecen H0 y H1:
Ho: Los datos analizados siguen una distribución Normal.
H1: Los datos analizados no siguen una distribución Normal.
Y se pasa a aplicar el estadístico de contraste, cuya explicación se omite para no hacer
extender el proyecto:
Donde α es el nivel de significancia del contraste, que para este proyecto será de 5%.
Como resultado final, D y Dα se calculan con las siguientes ecuaciones:
En donde para el caso de Dα, Cα y k(n) se obtienen de tablas que dependen de cada
distribución.
Para el caso de la distribución normal, se obtienen los siguientes resultados, donde D se obtuvo
con la ayuda de distributionFitter del programa Matlab :
𝐷𝛼 = 0.0888
𝐷 = 0.11
Como D es mayor que Dα se rechaza H0 y se concluye que los datos no siguen una distribución
normal.
𝐷𝛼 = 0.0874
𝐷 = 0.085
Como D es menor que Dα no se rechaza H0 y se concluye que los datos siguen una distribución
de Weibull.
Por último, se busca otra distribución que se ajuste a la verdadera distribución de los datos.
Se plantea como segundo modelo la distribución Gamma obteniéndose la siguiente forma:
1.3) El modelo que mejor se ajusta a los datos es la distribución de Weibull. La distribución
de Weibull es una distribución de probabilidad continua. aplicada por primera vez para
describir la distribución de los tamaños de determinadas partículas. Esta distribución se
caracteriza por tener los parámetros lambda y k, donde lambda es un parámetro de
escala y k es un parámetro de forma (lo que proporciona una gran flexibilidad a este
modelo), a continuación se muestra como varia la curva de la distribución según se
cambian estos dos parámetros:
Para el calculo de 𝑡𝐺.𝐿=𝑛−1;𝛼 utilizando la función de excel INV.T.2C que depende los grados
2
de libertad, que son el número de datos menos uno, y de la probabilidad que es igual a uno
menos el intervalo de confianza, y se obtuvo:
𝑡_(𝐺.𝐿=𝑛−1;𝛼/2) 1,98421695
Una vez calculado este valor, se haya el error estándar que es la expresión seguida del más o
menos, donde s es la desviación estándar muestral y n el número de datos, onteniendose el
siguiente error:
E(m) 0,00965024
E(cm) 0,965024
Y una vez se obtiene el valor del error, se calcula el intervalo de confianza que va desde la
media muestral menos el error, hasta la media muestral más el error, obteniéndose los siguientes
límites.
𝐼. 𝐶 = (1.708; 1.727)
Donde I.C es el intervalo de confianza de la estatura promedio de los estudiantes masculinos de
la UIS para un nivel de confianza del 95%.
Ahora se desea contrastar este valor con el promedio nacional.
Para este análisis se toman como punto de partida los resultados para la altura de un hombre
promedio en Colombia, sacado de un informe presentado por el periódico el tiempo ”Dentro de
los principales hallazgos se encontró que la talla promedio del hombre colombiano adulto es de
172 cm, y se encuentra en un nivel de normalidad entre los 159 y 186 cm”.
Ahora se postula como pregunta, ¿es menor el promedio de los estudiantes masculinos de la
UIS, al compararse con el promedio masculino nacional?
Para esto se utilizará el recurso de prueba de hipótesis, siguiendo los pasos que se presentan a
continuación:
Paso 1:
Se definen Ho y Ha.
Ho = 1.72 (m)
Ha < 1.72 (m)
Paso 2:
Calculamos el estadístico de prueba:
Calculamos los valores críticos, esto depende del valor de significancia, utilizando la siguiente
ecuación:
t -0,47291041
Paso 3:
Se determina la región de rechazo, esto dependiendo del nivel de significancia (α), que para este
problema es de 5%, esta área α se ubica en la cola izquierda de la distribución t, así:
Se obtiene que la región de rechazo está en el valor crítico -1,66039, esto se obtuvo con la ayuda
de Excel utilizando la función INV.T.
Paso 4:
A partir de la posición del estadístico de prueba, respecto a la región de rechazo se observa que
el estadístico de prueba no cae en la región de rechazo, por lo tanto se concluye que a un nivel
de significancia del 5%, no se rechaza H0, es decir, no hay evidencia suficiente para asumir que
la estatura promedio de los estudiantes masculinos de la UIS se encuentra por debajo del
promedio de la estatura masculina a nivel nacional.
Bibliografía
https://www.uv.es/ceaces/base/modelos%20de%20probabilidad/MODEPR1.htm
https://ljk.imag.fr/membres/Bernard.Ycart/emel/cours/sd/node9.html
https://www.youtube.com/watch?v=rrTweT5AUOw
https://www.dropbox.com/home/ESTADISTICA%20aplicada%20a%20la%20Ingenier%C3%A
Da/Elementos%20de%20Probabilidad/Elementos%20de%20probabilidad-
Parte%20II/VA%20Continuas?preview=Clase+3+C%C3%B3mo+probar+el+supuesto+normali
dad.doc
https://www.universoformulas.com/estadistica/descriptiva/curtosis/
https://www.eltiempo.com/archivo/documento/CMS-13128617