Documente Academic
Documente Profesional
Documente Cultură
Machine Learning.
¿Por dónde
<
empiezo?
La guía de conceptos imprescindibles
para obtener beneficios de tus datos.
1. Introducción
3. Métodos de Aprendizaje
Al igual que ocurría con las tecnologías Cloud hace unos años, la pregunta no es si
debemos de aplicar tecnologías de Inteligencia Artificial dentro de nuestras organizaciones,
sino cuándo lo haremos. Tal y como indican Erik Brynjolfsson y Andrew McAfee en The
Business of Artifical Intelligence, aquellos directivos que no estén empujando experimentos
en el área del Machine Learning, simplemente no están haciendo su trabajo.
En los próximos años, la Inteligencia Artificial no remplazará a los directivos, pero los
que la utilicen si reemplazarán a los que no lo hagan.
Más allá del debate filosófico o económico, en este libro aprenderás los conceptos
fundamentales que te ayudarán a entender cómo funciona el Machine Learning, sus distintos
tipos de modelos y algoritmos, así como casos de aplicación en diferentes sectores.
www.solidq.com/es | contact@solidq.com
2. ¿Qué es Machine Learning? ¿Cómo
funciona?
En definitiva, podemos imaginarlo como un sistema en el que entran datos que son filtrados
y cuya salida son esos mismos datos clasificados según los patrones detectados durante el
proceso de aprendizaje.
www.solidq.com/es | contact@solidq.com
reconocimiento de patrones y aprendizaje a través de ellos. Un concepto menos ambicioso
pero que permitía resolver problemas específicos.
El concepto Machine Learning nace en los años 80 y crece en popularidad, rompiendo con el
anterior paradigma empleado por los programadores. En estos sistemas no se define qué
sucede o cómo operar con los datos de entrada. Respaldado por el razonamiento
probabilístico, estadística y álgebra lineal, con Machine Learning es posible no programar
explícitamente un programa y obtener soluciones a determinados problemas.
Un concepto más moderno sería el Deep Learning (aprendizaje profundo). Esta técnica
permite implementar el aprendizaje automático que ha dado lugar, por ejemplo, a las redes
neuronales, en las que las estructuras de aprendizaje se reestructuran en capas imitando el
funcionamiento del cerebro humano.
Como resumen:
www.solidq.com/es | contact@solidq.com
• Machine Learning, es una familia de algoritmos de Inteligencia Artificial, en los que las
máquinas aprenden, a través de ejemplos, cómo reproducir un determinado
comportamiento.
Artificial
Intelligence
Machine
Learning
Deep
Learning
DEFINICIONES
Data Set. Los datos son una gran lista de ejemplos (instancias) sobre los que el sistema puede aprender.
Machine Learning es capaz de asimilar una amplia cantidad de orígenes y formatos a través de los cuales
detectar patrones en los datos.
Data Mining. Proceso mediante el cual se explora la información para encontrar patrones sobre unos datos
que antes eran desconocidos.
www.solidq.com/es | contact@solidq.com
Instancia o registro. Cada uno de los elementos que encontramos en un data set. En Machine Learning es
imprescindible contar con instancias para hacer un análisis. Cada una de ellas debe contar con una serie de
atributos o características que la describen.
Atributo, característica, campo. Son las propiedades de cada una de las instancias registradas en el data
set, necesarias para entrenar un sistema de Machine Learning.
Dimensiones. Aquellos atributos o características que nos permiten distinguir conjuntos dentro de los
datos. Son definidos por el usuario en el aprendizaje supervisado. Conceptualmente puede haber tantas
dimensiones como sean necesarias, aunque pueden verse limitadas por los recursos físicos de la máquina.
Modelo. Es el proceso mediante el cual se registra un patrón observado en el conjunto de datos que el
sistema aplicará posteriormente con nuevos datos de entrada para emitir predicciones.
Predicción. Aquel atributo o factor que se pretende obtener como solución. Es el objetivo del sistema.
Confianza. Probabilidad de acierto para cada una de las predicciones que se emiten en un sistema.
www.solidq.com/es | contact@solidq.com
3. Métodos de aprendizaje
Clasificación
Aprendizaje
Regresión
supervisado
Aprendizaje por
refuerzo
www.solidq.com/es | contact@solidq.com
3.1 APRENDIZAJE SUPERVISADO (Supervised learning)
La información se deduce a partir de los datos de entrenamiento. Dentro del Data Set, cada
instancia está asociada a su resultado. A partir de estos datos el sistema aprende a
generalizar y es entonces cuando se obtiene el modelo que aplicará a los nuevos datos en
entrada para obtener el resultado. Este método de aprendizaje sólo es válido para
predicciones a futuro que se basan en características previamente observadas en los datos.
Se considera que en este tipo de aprendizaje hay intervención humana porque se facilita una
clasificación inicial para los datos mediante etiquetas (labels).
Los problemas más comunes resueltos mediante aprendizaje supervisado son problemas de
regresión y clasificación. En la regresión se obtienen valores continuos y es aplicable a
predicciones de bolsa, predicciones de stocks, etc. En problemas de clasificación obtenemos
valores discretos. Uno de los primeros usos fue la detección de spam.
Dentro de los problemas de clasificación hay dos tipos: binarios (predice si una muestra
pertenece o no a una clase o categoría) o multiclase (predice a qué clase o clases pertenece).
Los problemas de detección de anomalías son realmente clasificadores binarios: distingue
entre una muestra anómala o una muestra no anómala.
• La obtención de una compresión básica de los datos al verificar una correlación entre las
variables de entrada
www.solidq.com/es | contact@solidq.com
3.2 APRENDIZAJE NO SUPERVISADO (Unsupervised learning)
En este tipo de aprendizaje no se conocen los resultados del Data Set antes del
entrenamiento. El aprendizaje se basa en información estadística y su distribución para
obtener patrones. Los datos no son etiquetados previamente, por lo que no se proporciona
un valor verdadero inicial (no hay intervención humana sobre los datos).
www.solidq.com/es | contact@solidq.com
3.3 APRENDIZAJE POR REFUERZO (Reinforcement learning)
Este modelo de “prueba y error” es una de las técnicas más prometedoras en la actualidad.
Por ejemplo, es empleada en la navegación de coches autónomos y la que ha hecho posible a
programas como AlphaZero o AlphaGo aprender a jugar al ajedrez y ganar a los campeones
mundiales.
www.solidq.com/es | contact@solidq.com
4. Algoritmos de Machine Learning
Caso práctico:
www.solidq.com/es | contact@solidq.com
Pero, ¿qué ocurriría si en vez de plátanos y fresas tuviéramos que distinguir plátanos y peras?
Si elegimos los mismos atributos, no conseguiremos distinguir las piezas de fruta.
Las dimensiones que en el primer caso eran suficientes para nuestro objetivo, ahora no lo
son. No obstante, podemos recurrir a analizar un tercer atributo para conseguir identificarlas.
Por ejemplo, identificaremos el número de pepitas de las frutas.
www.solidq.com/es | contact@solidq.com
Es frecuente conseguir separar conjuntos de datos agregando más dimensiones, pero
demasiadas dimensiones además de suponer un coste computacional superior y no siempre
es la opción más recomendada.
Nota: Cuando un sistema de Machine Learning divide agrupaciones en los datos no sólo
utiliza la ecuación de la recta o del plano, sino también otros tipos de regresiones. En este
ejemplo hemos utilizado una recta para simplificar la comprensión del concepto.
Proceso que emplea métodos de bifurcación para calcular todos los resultados posibles en
una decisión. Cada rama corresponde a un patrón reconocido en el proceso de aprendizaje.
En las hojas se sitúan las predicciones de cada patrón y su confianza (probabilidad de
acierto).
Caso práctico:
www.solidq.com/es | contact@solidq.com
En primer lugar, se observa una división en el porcentaje en el eje y, correspondiente a la
edad. Obtenemos, al igual que haría el sistema de Machine Learning automáticamente, la
primera ramificación del árbol.
Observando el espacio superior y el inferior, vemos que es posible dividir en dos estos dos
primeros segmentos según nos intereses asociados al nivel de estudios cursados. Tendríamos
de nuevo otra clasificación.
www.solidq.com/es | contact@solidq.com
Ante esta situación y un nuevo input, el sistema clasificaría automáticamente si la persona
querría asistir o no a ver la película basado en la propiedad encontrada.
Imitan el comportamiento del cerebro humano. Una red neuronal está formada por muchas
capas entre la entrada y la salida. Cada capa aprende de la anterior, por lo que en las
sucesivas se consigue un nivel superior de aprendizaje. Pueden manejar tareas
extremadamente complejas, el proceso de entrenamiento es lento y sus predicciones son
difíciles de comprender.
www.solidq.com/es | contact@solidq.com
www.solidq.com/es | contact@solidq.com
5. Machine Learning: presente y
futuro
La realidad es que cada vez disponemos de más datos y la tecnología nos permite
explotarlos, y obtener resultados en distintos sectores y negocios: mejorar procesos, la
comunicación con nuestros clientes, anticiparnos a determinadas situaciones críticas,
identificar oportunidades…
www.solidq.com/es | contact@solidq.com
¿Ya has implantado Machine Learning en tu negocio? ¿Aún no,
pero tienes claro que próximamente lo haréis?
De ti depende, ¿vas a sacarle partido o a esperar que tus competidores lo hagan por ti?
Conocer y contar con perfiles capacitados en Machine Learning es el primer paso hacia la
Inteligencia Artificial en tu negocio.
¿Ya has puesto en marcha proyectos de BI y quieres dar un paso más en tu estrategia?
Nuestro Ideation Workshop puede interesarte. ¡Descubre nuestra metodología!
www.solidq.com/es | contact@solidq.com