Documente Academic
Documente Profesional
Documente Cultură
2017
ALGUNAS COSAS TILES QUE SABER ACERCA DEL APRENDIZAJE AUTOMTICO
A modo de introduccin, inferimos que el autor quiere dejar en claro que si bien en el aprendizaje
automtico las mquinas, por medio de los algoritmos, pueden averiguar o aprender cmo se
pueden realizar tareas generalizando a partir de la experiencia en las tareas realizadas, logrando
adems que estas sean ms factibles y rentables. Como resultado de este aprendizaje aplicable,
no solo al campo de la computacin, sino tambin en otros campos, pero que si bien este
conocimiento y desarrollo es posible, debido a su avance y estudio; afirma que tambin requiere
algo de magia que como es evidente no es posible encontrarla en los libros de texto.
Basndose en esta afirmacin, que desde nuestro punto de vista es bastante sui gneris, pero que,
metafricamente hablando, linda en la racionalidad del desarrollo de la tecnologa, sobre todo en
esa tecnologa del futuro en donde la era de la singularidad est a tiro de piedra, y cuya inminencia
es inevitable, es que Pedro Domingos desarrolla este artculo en el que resume doce lecciones
claves para el aprendizaje automtico, que en sus procesos de investigacin profesionales del
tema, aprendi.
Hoy en da existen muchos algoritmos de Machine Learning y se puede decir que an estn siendo
mejorados y tambin se desarrollan nuevos cada ao, pero nada cambia que cada algoritmo tenga
tres elementos fundamentales que los define como un buen algoritmo. Estos elementos son los
siguientes:
Representacin: Cmo representamos el conocimiento. Esto tal vez sea la pieza clave del
Machine Learning, muchos ejemplos usan arboles de decisiones, conjunto de reglas, instancias,
modelos grficos, redes neuronales, etc. La representacin es un elemento clave para empezar
con Machine Learning.
Optimizacin: La forma en cmo los programas candidatos son conocidos como proceso de
bsqueda. Por ejemplo, optimizacin combinada, optimizacin convexa, optimizacin con
restricciones, entre otras.
La eleccin de optimizacin de la tcnica es clave para lograr la eficiencia y ayuda a determinar
que el clasificador produce si la funcin de evaluacin tiene ms de una ptima.
Los datos por s solos no son suficientes, no importa cunto tenga. Como dira el filsofo David
Hume hace ms de 200 aos, pero incluso hoy en da, muchos errores en el aprendizaje de la
mquina provienen de fallar para apreciarlo. Cada alumno debe incorporar algn conocimiento
supuestos ms all de los datos que se dan para generalizar ms all de ella. Esto fue formalizado
por Wolpert en su famoso "no Free lunch" teoremas, segn el cual no el alumno puede superar las
suposiciones al azar sobre todas las funciones posibles para ser aprendido. En retrospectiva, la
necesidad de conocimiento en el aprendizaje no debera ser sorprendente. Aprender a mquina no
es magia; No puede conseguir algo de la nada. Tenemos que combinar conocimiento con datos
para hacer crecer programas.
Aun cuando en un inicio ms datos significa que se pueden aprender clasificadores ms complejos,
en la prctica se terminan los ms simples, puesto que los complejos tardan demasiado en
aprender
Parte de la razn por la que se utilizan algoritmos ms inteligente y tiene un costo menor es que,
en una primera aproximacin, todos hagan lo mismo. Esto se evidencia sorprendentemente,
cuando se consideran conjuntos de reglas r redes neuronales.
Los estudiante, suelen comparase en medidas de precisin y costo computacional, pero el ahorro
humano y comprensin adquirida, aunque es ms difcil de medir, suelen ser ms importantes.
Las organizaciones que aprovechan al mximo el aprendizaje automtico son aquellas que tienen
en su lugar una infraestructura que hace que la experimentacin con estudiantes diferentes,
fuentes de datos y problemas de aprendizaje sea fcil y eficaz y donde haya una estrecha
colaboracin entre expertos en aprendizaje de mquinas y dominios de aplicaciones.
APRENDE MUCHOS MODELOS, NO SLO UNO
Aprender muchos modelos, no slo uno, es el principio del xito del aprendizaje esperado. En todo
el mundo hay quienes se esfuerzan en sobresalir, tratando de ser el mejor en su rama. Es as que
se seleccionara seguramente aquel que se basara en varios modelos diferentes de estudio y
estrategia, combinando variables y otros.
Un ejemplo claro, es el de NETFLIX, un sistema de servicio de video a nivel mundial.
Diversas empresas e interesados, competan por lograr xito en este rubro, cada quien con sus
propias iniciativas tcnicas y logsticas, pero se tuvo que acudir a la unin de ms de uno de estos
interesados, para lograr formar un equipo lo suficientemente profesional y competente, y as formar
el xito de la firma NETFLIX.
Elegir el ms simple de dos clasificadores con el mismo error de entrenamiento es una buena
regla. El clasificador ms simple no siempre tiene la mejor precisin en el conjunto de datos de
prueba.
Una perspectiva quizs ms interesante es considerar la complejidad en trminos del tamao del
espacio de hiptesis para cada clasificador. Ese es el espacio de posibles clasificadores que cada
algoritmo podra generar. Un mayor espacio es probable que se muestre menos y el clasificador
resultante puede ser menos probable que haya sido overfit a la formacin de datos.
La conclusin es que las hiptesis ms simples deben ser preferidas porque la sencillez es una
virtud en s misma, no debido a una hipottica conexin con la exactitud.
Relacionados con escoger algoritmos favoritos, los practicantes pueden caer en la trampa de
escoger representaciones favoritas y justificarla con afirmaciones tericas de aproximacin
universal (por ejemplo, pueden usarse para aproximarse a cualquier funcin objetivo arbitraria).
Dados los datos finitos, el tiempo y la memoria, los estudiantes estndar pueden aprender slo un
minsculo subconjunto de todas las funciones posibles, y estos subconjuntos son diferentes para
los alumnos con diferentes representaciones.
Centrarse en el problema de la funcin objetivo se puede aprender, no puede ser representado.
CONCLUSIN:
Consideramos que no es necesario incorporar una conclusin por cada una de las doce
lecciones, por el contrario, creemos que es suficiente una sola que englobe a todas y que
desde nuestro punto de vista, nos describa como leccin aprendida. En ese sentido,
evidenciamos que el aprendizaje de las mquinas, es un presente inmediato, y que las
teoras y su desarrollo en este aspecto, no tendrn que dedicarse a vencer a los humanos,
sino a trabajar con ellos.