Documente Academic
Documente Profesional
Documente Cultură
Para llevar a cabo la estimacin, utilizaron B-Splines con y sin restricciones de monotonicicidad para esti-
mar los efectos del precio del artculo, que en ste caso fue los zumo de naranja refrigerados, encontraron
que un modelo semiparamtrico con restricciones de monotonicidad impuesta a la respuesta, proporciona
un rendimiento superior comparado con un modelo sin restricciones de monotonicidad. Tambin llegan
a la conclusin de que el uso de B-Splines con restriccin funciona mejor y, adems, que al realizar el
modelo por regresin cuantlica sta proporciona estimaciones ms exactas de los intervalos de prediccin
ya que sta estima los cuartiles lo que hace que se ajuste mejor a los datos.
ste artculo, es muy interesante ya que utiliza B-Splines y Regresin Cuantlica de una forma diferente a
la que estamos utilizando en nuestro trabajo de grado, por tanto sera muy interesante seguir estudiando
acerca de ello.
Y sobre el ejemplo de los logros matemticos que contiene 1.721 estudiantes con sus respectivos puntajes
con el que se realiza las comparaciones entre los resultados obtenidos por medio de regresin lineal y
regresin cuantlica.
En el desarrollo del artculo se contrata los dos mtodos de regresin cuando se consideran modelos con:
un predictor continuo, un predictor dicotmico, c) un predictor continuo y dicotmico, y d) una aplicacin
longitudinal.
Siempre se resalta la diferencia entre la estimacin por regresin lineal que slo permite una estimacin
entre la relacin promedio entre el las variables regresoras y la variable respuesta, sin embargo en el estudio
por regresin cuantlica se produce estimaciones de mltiples puntos de la distribucin del resultado, algo
que es una de las razones por la que esta metodologa es aplicada en nuestro trabajo de grado.
1
2 2 ARTCULOS SOBRE APLICACIONES DE LOS MTODOS DE APRENDIZAJE ESTADSTICO
Se concluye que con el enfoque de FDA le da ms eciencia a la estimacin que el enfoque de regresin
cuantlica generalizada por separado.
Es por esto que es de nuestro inters, pues vemos que el anlisis de datos funcionales hace un gran aporte
a varias metodologas estadsticas y que por supuesto es necesario profundizar en este enfoque de FDA
no slo por ser una de las aplicaciones en nuestro trabajo de grado sino tambin porque que es un tema
de inters de todos los que ahora estamos en formacin
Lo que hicieron fue tomar 6 estaciones y tomando como referencia estudios anteriores, decidieron estimar
la concentracin del PM10 en el interior de cada una de las estaciones del metro subterrneas a partir
del nmero de trenes subterrneos en funcionamiento, el PM10 al aire libre, y la informacin sobre la
operacin de ventilacin utilizando el modelo de redes neuronales, para llevar a cabo lo anterior en primera
instancia observaron la correlacin entre el PM10 al aire libre y el PM10 en el interior, posteriormente,
se analiz el PM10 en el interior usando redes neuronales, llegando a la conclusin que la regresin que
utilizaron entre el PM10 al aire libre y el PM10 en el interior obtuvo una correlacin (R2) promedio entre
las 6 estaciones de 0.43 con un intervalo de (0.18 ? 0.63) y el segundo modelo que fue con redes neuronales
incluyendo las variables inicialmente habladas mostr un aumento en el coeciente de correlacin del 0.65
con un intervalo de (0.39 ? 0.81).
Nosotras consideramos que es importante compartir del tema con los compaeros del curso, pues las redes
neuronales nos dan otra alternativa de estimacin de patrones ambientales y es una metodologa que est
incursionando en el aprendizaje estadstico pues implementa la parte computacional y la interpretacin
estadstica por medio de regresin lineal.
Seminario (2017)
Seminario 3
para ir descendiendo progresivamente hasta las ms especcas, con el objetivo de identicar polticas
macroeconmicas de las variables bancarias bajo escenarios de estrs.
Los datos utilizados en el estudio son pblicos pertenecientes a estados nancieros trimestrales de bancos
estadounidenses, el anlisis se fue restringido slo a entidades con activos de $10 mil millones de dlares
en adelante durante menos de un trimestre en el periodo de 2000 a 2013, donde inicialmente se cont
con 251 instituciones que cumplan con el criterio de inclusin, sin embargo al nal baj a 156 entidades
como resultado de las reglas del estudio.
La metodologa empleada se divide el texto en dos partes; primero, se basa en realizar primero la tcnica
de regresin regularizada (LASSO) para identicar el subconjunto de variables macroeconmicas ms
signicativas para una variable bancaria y luego se realiza un Anlisis de Componentes Principales (ACP)
para extraer el primer factor como un resumen de las condiciones macroeconmicas.Segundo, se reere al
modelo parsimonioso con el enfoque Top-Down para abordar la heterogeneidad de las respuestas bancarias
a los impactos macroeconmicos.
Debido al amplio conjunto de variables macroeconmicas candidatas (un total de 165 variables generadas),
existe un problema de seleccin de variables para los modelos de pruebas de estrs por lo que en este caso
es til la metodologa de LASSO.
A manera de conclusin los autores dicen que sus resultados son un avance importante ya que en la
literatura no se ha abordado el caso de seleccin de variables para pruebas de estrs. Ya que con esta
seleccin cuidadosa del modelo y la aceptacin de la heterogeneidad entre las entidades bancarias fueron
fundamentales para obtener los resultados, donde se encontr que a pesar de que la industria bancaria de
los Estados Unidos ha mejorado en los ltimos aos dichos escenarios de estrs siguen implicando deterioro
en las posiciones de capital de los bancos. La importancia de este artculo se centra en la metodologa
de seleccin de variables empleada para el caso de problemas de dimensionalidad donde se cuenta con
muchas ms variables que individuos, siendo un problema comn en la vida real al que nos enfrentaremos
en una vida laboral futura. Por lo tanto, se considera que es un tema de mucha importancia en el cual se
debe estudiar con ms detalle.
En la parte aplicativa se usan dos conjuntos de datos reales; el primero datos de Ozono que contiene 3
variables categricas y 9 variables regresoras continuas para la variable respuesta media diaria de ozono
de mximo una hora de lectura"; segundo, datos que consiste en niveles de expresin gnica de 18.975
genes obtenidos de 120 ratas, con el objetivo de encontrar genes que estn relacionados con el gen TRIM32
conocido por ser el causante del sndrome de Bardet-Biedl.
Como ya se mencion anteriormente la metodologa para la seleccin de variables LASSO es muy impor-
tante y en este artculo tiene otro tipo de aplicacin muy interesante donde se presenta el mismo problema
de dimensionalidad antes sealado, es por esto que sta tcnica de regresin debe ser considerada para
compartir en el curso de seminario.
Seminario (2017)
4 2 ARTCULOS SOBRE APLICACIONES DE LOS MTODOS DE APRENDIZAJE ESTADSTICO
2.4. A boosting method for maximization of the area under the ROC curve
Este artculo se centra en el anlisis del rea bajo la curva ROC para problemas de clasicacin binaria en
campos clnicos, las cuales proporcionan herramientas para seleccionar modelos evaluando el rendimiento
de las pruebas diagnsticas. Donde la idea principal es maximizar el rea bajo la curva (AUC) usando
una combinacin lineal de mltiples variables caractersticas, siendo este un problema de alta dimensin.
Por lo que se propone un nuevo mtodo estadstico para detectar una asociacin ms esencial entre las
variables caractersticas y una variable de resultado binario mediante la metodologa Boosting con un
algoritmo de potencializacin y as obtener una mejor clasicacin.
En el artculo se realiza una simulacin para comprobar la efectividad del algoritmo planteado, sin embargo
tambin es aplicado a datos reales, que en este caso corresponden a resultados de la ciruga espinal
correctiva de 81 nios. Como se me mencion anteriormente la variable es binaria, si la cifosis est
presente o ausente (si presenta curvatura anormal en la columna vertebral). Las variables caractersticas
consideradas son: Edad, la edad del nio en meses; Nmero, nmero de vrtebras en la operacin e Inicio,
el comienzo de la gama de vrtebras implicadas en la operacin. Se concluye que el mtodo utilizado
(AUCBoost) ofrece una combinacin exible de varias de las variables caractersticas lo que se cumple
con la maximizacin de las AUC.
Esta tcnica de potencializacin ha sido muy nombrada y unos de los temas ms interesantes del apren-
dizaje estadstico desde nuestro punto de vista que tiene diferentes aplicaciones como tambin a datos de
alta dimensionalidad donde la seleccin de variables es mucho ms importante, el cual que es un tema
muy requerido actualmente en la estadstica.
Seminario (2017)
Seminario 5
mejorar la prediccin del modelo de pronstico grises pero los autores de ste artculo utilizan el modelo
de modicacin residuales basados en redes neuronales, pero trabajan con diferentes modelos utilizando
como base el modelo de prediccin grises, probando nalmente, que es el que mejor se ajusta a los datos
de demanda de energa.
Referencias
Guo, M., Zhou, L., Huang, J. Z. & Hrdle, W. K. (2015), `Functional data analysis of generalized regression
quantiles', Statistics and Computing 25(2), 189202.
Haupt, H., Kagerer, K. & Steiner, W. J. (2014), `Smooth quantile-based modeling of brand sales, price and
promotional eects from retail scanner panels', Journal of Applied Econometrics 29(6), 10071028.
Hu, Y.-C. & Jiang, P. (2017), `Forecasting energy demand using neural-network-based grey residual
modication models', Journal of the Operational Research Society 68(5), 556565.
Kapinos, P. & Mitnik, O. A. (2016), `A top-down approach to stress-testing banks', Journal of Financial
Services Research 49(2-3), 229264.
Komori, O. (2011), `A boosting method for maximization of the area under the roc curve', Annals of the
Institute of Statistical Mathematics 63(5), 961979.
Kwon, S., Ahn, J., Jang, W., Lee, S. & Kim, Y. (2017), `A doubly sparse approach for group variable
selection', Annals of the Institute of Statistical Mathematics 69(5), 9971025.
Lusa, L. et al. (2015), `Boosting for high-dimensional two-class prediction', BMC bioinformatics
16(1), 300.
Park, S., Kim, M., Kim, M., Namgung, H.-G., Kim, K.-T., Cho, K. H. & Kwon, S.-B. (2018), `Predicting
pm10 concentration in seoul metropolitan subway stations using articial neural network (ann)',
Journal of Hazardous Materials 341, 7582.
Petscher, Y. & Logan, J. A. (2014), `Quantile regression in the study of developmental sciences', Child
development 85(3), 861881.
Seminario (2017)