Documente Academic
Documente Profesional
Documente Cultură
Noorbatcha
Títle of paper: Cancer Recurrence Prediction Using Machine Learning
Journal: International Journal of Computational Science and Information Technology (IJCSITY)
Volume (issue): Vol.2
pag – pag (year): No.2, May 2014
Para cada conjunto de datos, se realizó un experimento LOOCV para variar el número de genes
seleccionados que van de 1 a 150. Los genes de cada rastro se seleccionaron utilizando la entropía
basada en la técnica descrita El hallazgo más sorprendente fue que el sistema alcanzó una precisión
del 100% en la predicción de la recurrencia del cáncer de próstata para cualquier número de genes
seleccionados. Esto implica que sólo hay un gen que actúa como biomarcador pronóstico del
cáncer de próstata. En otras palabras, usar un gen es suficiente para predecir si el cáncer de próstata
se repetirá. El sistema alcanzó un 100% de precisión en la predicción del cáncer de mama con el
número de genes superiores a 88. Esto implica que el número de biomarcadores pronósticos son
más altos para el cáncer de mama que para el cáncer de próstata. El sistema obtuvo la menor
precisión en la predicción de la recurrencia del cáncer del SNC.
Los resultados muestran que la precisión de predicción aumenta con el número de genes
seleccionados, aunque sin una monotonicidad perfecta. Los resultados también muestran que en
ciertos casos la exactitud disminuye con un aumento en el número de genes. Esto puede no ser
debido al clasificador porque AODEsr, al igual que cualquier otro clasificador Bayesiano, no es
sensible a características irrelevantes. Por lo tanto, la adición de un gen adicional no debería
degradar teóricamente la precisión. Las interrupciones en la monotonicidad podría ser debido a la
imperfección intrínseca en el procedimiento de selección de genes.
Debido a que nuestro sistema propuesto es capaz de predecir la recurrencia del cáncer con
precisión, incluso con muy pocos genes, los resultados refuerzan la creencia clínica de que sólo hay
unos pocos biomarcadores pronósticos para la recurrencia del cáncer. La máxima exactitud
LOOCV de nuestro clasificador de cáncer es de 100% para dos de cada tres conjuntos de datos. La
precisión máxima promedio de LOOCV de nuestro clasificador de cáncer en los tres conjuntos de
datos es de 98.9%. Vale la pena repetir el hecho de que utilizamos el clasificador AODEsr con
exactamente el mismo conjunto de parámetros (valor crítico de 1, límite de frecuencia de 250, valor
de peso M de estimación de 0,03) a lo largo de todos los experimentos con el fin de evitar sesgos.
A su leal saber y entender, la exactitud del sistema de predicción de recurrencia de cáncer
propuesto utilizando el clasificador AODEsr con el proceso de selección basado en entropía parece
ser significativamente mayor que la de otros sistemas de recurrencia de cáncer reportados en la
literatura.