Sunteți pe pagina 1din 5

Análisis de la relación entre variable pecho y grasa

Jefferson Arley Paz Paz

Samuel Torres Acevedo

Introducción

Intuitivamente se puede decir que el análisis de estas dos variables entre sí, para un estudio del
IMC no sería tan especifico al decir si en la población a tratar la grasa depende del pecho, en este
caso la opinión que sobresale es que la relación que mejor se ajustaría seria abdomen y grasa, ya
que es más fácil de decir si tiene un IMC alto o no. Por genética se puede decir que el crecimiento
del pecho o IMC en esta parte del cuerpo no solamente es por grasa.

Análisis grafico

En el gráfico de la izquierda, en principio


podríamos sospechar que los datos
siguen un cierto patrón lineal, con datos
atípicos que sobresalen especialmente
para valores mayores en el eje “grasa”.

Sin embargo, según los resultados que se


consigan tras poner a prueba el modelo n
el programa R, podremos tener cierta
certeza sobre la efectividad del mismo.
En el boxplot se puede observar que hay
dos valores atípicos que afectan el
modelo lineal, se puede decir que en
este caso los dos están fuera de lo
esperado, para tener un modelo lineal
óptimo.

Se podrían eliminar los datos, para


reducir el error residual de este modelo.

Prueba de normalidad para Pecho

En la prueba de Shapiro-Wilk, para evaluar la normalidad, se consiguió un valor p menor que el


valor de significancia α=0.05, lo cual nos obliga a descartar la normalidad de los datos con la
etiqueta “pecho”.
Modelo lineal

𝑝𝑒𝑐ℎ𝑜(𝑥 = 𝑔𝑟𝑎𝑠𝑎) = 0.76452𝑥 + 86.34542

A continuación se presentan los valores p de los parámetros “intercepto” y “pendiente” del


modelo.

a) Para los parámetros intercepto y pendiente, sus respectivos valores p son menor que
2.2 ∗ 10−16, siendo entonces estos parámetros importantes.

b) Para el modelo se tiene que el valor p es < 2.2 ∗ 10−16, a partir de lo cual se podría afirmar que
sí se explicaría la variabilidad de los datos, como consecuencia de la aceptación de la hipótesis
alternativa.
Este error residual es grande, según lo que se puede ver en el resultado de la captura de
pantalla, luego de haber aplicado el comando summary al modelo.

Validación de supuestos

a) Normalidad de los residuos

Siguiendo los resultados arrojados por la prueba Shapiro de normalidad para los residuos del
modelo, podemos observar que el valor p es menor que la el valor de significancia del 0.05 que
habitualmente hemos estado utilizando, hecho que conlleva a la admisión de que estos datos no
siguen tal distribución.
b) Aleatoriedad de los residuos: Para este paso, se aplicó la prueba de Runs de aleatoriedad
de datos residuales de la que se obtuvo un valor de p mayor al valor de significancia
siendo, siendo esto el respaldo de la hipótesis de este inciso. Aun así, se recurrió a una
gráfica asociada, en la que es posible contemplar un grupo de datos residuales esparcidos
sin patrón aparente alguno.
Esto nos conduce a la conclusión de que los datos son aleatorios.

c) Homoscedasticidad de los residuos: Recurriendo nuevamente a una de las gráficas llamada


“Scale -Location”, se puede observar que la línea roja de en medio no es completamente
horizontal, pues tiende a curvarse e inclinarse a medida que avanza por el eje horizontal.
Por ende no se cumple la suposición de varianza constante para los residuos.

S-ar putea să vă placă și