Sunteți pe pagina 1din 19

EBOOK

Machine Learning.
¿Por dónde
<
empiezo?
La guía de conceptos imprescindibles
para obtener beneficios de tus datos.

Síguenos y suscríbete a nuestras novedades:


http://www.solidq.com/es/subscribirse/
Índice

1. Introducción

2. ¿Qué es Machine Learning? ¿Cómo funciona?

3. Métodos de Aprendizaje

4. Algoritmos en Machine Learning

5. Machine Learning: Presente y futuro


1. Introducción

Desde la definición del concepto Inteligencia Artificial se ha perseguido dotar de


inteligencia a las máquinas. Enseñar a los sistemas a analizar, entender y responder a unos
datos como lo haríamos los humanos, moviéndonos de un mundo en el que hasta ahora
programábamos máquinas a un escenario en el que enseñamos a las máquinas.

Entendiendo la Inteligencia Artificial como un todo – un apartado de este libro está


destinado a las diferencias entre AI, Machine Learning y Deep Learning -, la mayoría de los
usuarios de internet interactuamos con mecanismos que ya aplican inteligencia artificial,
probablemente, sin darnos cuenta.

Al igual que ocurría con las tecnologías Cloud hace unos años, la pregunta no es si
debemos de aplicar tecnologías de Inteligencia Artificial dentro de nuestras organizaciones,
sino cuándo lo haremos. Tal y como indican Erik Brynjolfsson y Andrew McAfee en The
Business of Artifical Intelligence, aquellos directivos que no estén empujando experimentos
en el área del Machine Learning, simplemente no están haciendo su trabajo.

En los próximos años, la Inteligencia Artificial no remplazará a los directivos, pero los
que la utilicen si reemplazarán a los que no lo hagan.

Más allá del debate filosófico o económico, en este libro aprenderás los conceptos
fundamentales que te ayudarán a entender cómo funciona el Machine Learning, sus distintos
tipos de modelos y algoritmos, así como casos de aplicación en diferentes sectores.

www.solidq.com/es | contact@solidq.com
2. ¿Qué es Machine Learning? ¿Cómo
funciona?

¿Qué es Machine Learning o Aprendizaje Automático? Existen infinidad de definiciones para


explicar este concepto, pero tratando de obtener una definición sencilla que aglutine los
aspectos más importantes, podemos decir que:

Machine Learning es la capacidad otorgada a las máquinas para aprender por sí


mismas a partir de un conjunto de datos y optimizar progresivamente la secuencia de
instrucciones aplicadas para mejorar sus propios resultados y dar respuesta a un
problema de negocio.

¿Y esto cómo se consigue? Generalizando la información que se les presenta, descubriendo


relaciones y reglas entre el conjunto de datos de entrada, para obtener conclusiones
(denominadas predicciones).

En definitiva, podemos imaginarlo como un sistema en el que entran datos que son filtrados
y cuya salida son esos mismos datos clasificados según los patrones detectados durante el
proceso de aprendizaje.

Artificial Intelligence, Machine Learning, Deep Learning… ¿por qué en


ocasiones se confunden?

La inteligencia artificial nace en la década de los años 50 buscando replicar la inteligencia


humana, incluso superarla. Machine Learning surge años más tarde y pretendía estudiar el

www.solidq.com/es | contact@solidq.com
reconocimiento de patrones y aprendizaje a través de ellos. Un concepto menos ambicioso
pero que permitía resolver problemas específicos.

El concepto Machine Learning nace en los años 80 y crece en popularidad, rompiendo con el
anterior paradigma empleado por los programadores. En estos sistemas no se define qué
sucede o cómo operar con los datos de entrada. Respaldado por el razonamiento
probabilístico, estadística y álgebra lineal, con Machine Learning es posible no programar
explícitamente un programa y obtener soluciones a determinados problemas.

Un concepto más moderno sería el Deep Learning (aprendizaje profundo). Esta técnica
permite implementar el aprendizaje automático que ha dado lugar, por ejemplo, a las redes
neuronales, en las que las estructuras de aprendizaje se reestructuran en capas imitando el
funcionamiento del cerebro humano.

Tanto Machine Learning como Deep Learning se consideran subconjuntos de la Inteligencia


Artificial. Sin entrar en detalle, estas técnicas permiten enseñar a las máquinas a analizar
datos de manera contextual para proporcionar la información solicitada, realizar un análisis o
desencadenar un evento en función de los resultados encontrados. En cualquier caso, son
tres conceptos diferentes y no deben confundirse.

Algunos de los usos de programas o aplicaciones “artificialmente inteligentes” son:


predicciones de tráfico, detección de enfermedades, identificación de personas, definición de
recomendaciones de compra, identificar estados de ánimo, conducción automática…

Como resumen:

• La Inteligencia Artificial consiste en dotar a las máquinas de la habilidad de reproducir el


comportamiento humano, independientemente de la técnica utilizada para ello.

www.solidq.com/es | contact@solidq.com
• Machine Learning, es una familia de algoritmos de Inteligencia Artificial, en los que las
máquinas aprenden, a través de ejemplos, cómo reproducir un determinado
comportamiento.

• Deep Learning, son un subconjunto de algoritmos de Machine Learning en los que se


combinan diferentes capas de datos en una red neuronal, de forma sucesiva, para un
aprendizaje incremental de conceptos abstractos.

Artificial
Intelligence

Machine
Learning

Deep
Learning

DEFINICIONES

Data Set. Los datos son una gran lista de ejemplos (instancias) sobre los que el sistema puede aprender.
Machine Learning es capaz de asimilar una amplia cantidad de orígenes y formatos a través de los cuales
detectar patrones en los datos.

Data Mining. Proceso mediante el cual se explora la información para encontrar patrones sobre unos datos
que antes eran desconocidos.

www.solidq.com/es | contact@solidq.com
Instancia o registro. Cada uno de los elementos que encontramos en un data set. En Machine Learning es
imprescindible contar con instancias para hacer un análisis. Cada una de ellas debe contar con una serie de
atributos o características que la describen.

Atributo, característica, campo. Son las propiedades de cada una de las instancias registradas en el data
set, necesarias para entrenar un sistema de Machine Learning.

Dimensiones. Aquellos atributos o características que nos permiten distinguir conjuntos dentro de los
datos. Son definidos por el usuario en el aprendizaje supervisado. Conceptualmente puede haber tantas
dimensiones como sean necesarias, aunque pueden verse limitadas por los recursos físicos de la máquina.

Modelo. Es el proceso mediante el cual se registra un patrón observado en el conjunto de datos que el
sistema aplicará posteriormente con nuevos datos de entrada para emitir predicciones.

Algoritmo. Secuencia o serie de instrucciones que representan la solución a un problema. A diferencia de


los algoritmos tradicionales, en Machine Learning no son programados explícitamente.

Predicción. Aquel atributo o factor que se pretende obtener como solución. Es el objetivo del sistema.

Confianza. Probabilidad de acierto para cada una de las predicciones que se emiten en un sistema.

www.solidq.com/es | contact@solidq.com
3. Métodos de aprendizaje

Al escoger los modelos y algoritmos en la definición de un proyecto de Machine Learning, es


necesario tener en cuenta la naturaleza del problema a resolver, la cantidad y estructura de
datos que tenemos a nuestra disposición, la velocidad de entrenamiento, la cantidad de
memoria que necesitaremos (los recursos son finitos y cada algoritmo utiliza una cantidad
diferente de memoria), etc.

La recomendación general, especialmente si trabajas con Azure Machine Learning, es


emplear métodos de aprendizaje supervisado para aquellos proyectos con un valor objetivo.
Si no dispones del valor que deseas predecir, emplea algoritmos no supervisados.

A continuación, se describen las características principales del aprendizaje supervisado,


aprendizaje no supervisado y aprendizaje por refuerzo.

Clasificación

Aprendizaje
Regresión
supervisado

Machine Aprendizaje no Detección


Learning supervisado anómala

Aprendizaje por
refuerzo

www.solidq.com/es | contact@solidq.com
3.1 APRENDIZAJE SUPERVISADO (Supervised learning)

La información se deduce a partir de los datos de entrenamiento. Dentro del Data Set, cada
instancia está asociada a su resultado. A partir de estos datos el sistema aprende a
generalizar y es entonces cuando se obtiene el modelo que aplicará a los nuevos datos en
entrada para obtener el resultado. Este método de aprendizaje sólo es válido para
predicciones a futuro que se basan en características previamente observadas en los datos.

Se considera que en este tipo de aprendizaje hay intervención humana porque se facilita una
clasificación inicial para los datos mediante etiquetas (labels).

Los problemas más comunes resueltos mediante aprendizaje supervisado son problemas de
regresión y clasificación. En la regresión se obtienen valores continuos y es aplicable a
predicciones de bolsa, predicciones de stocks, etc. En problemas de clasificación obtenemos
valores discretos. Uno de los primeros usos fue la detección de spam.

Dentro de los problemas de clasificación hay dos tipos: binarios (predice si una muestra
pertenece o no a una clase o categoría) o multiclase (predice a qué clase o clases pertenece).
Los problemas de detección de anomalías son realmente clasificadores binarios: distingue
entre una muestra anómala o una muestra no anómala.

Algunos ejemplos de uso de Aprendizaje Supervisado son:

• La categorización de solicitudes de préstamos bancarios

• La asignación de clientes a segmentos predefinidos

• La obtención de una compresión básica de los datos al verificar una correlación entre las
variables de entrada

www.solidq.com/es | contact@solidq.com
3.2 APRENDIZAJE NO SUPERVISADO (Unsupervised learning)

En este tipo de aprendizaje no se conocen los resultados del Data Set antes del
entrenamiento. El aprendizaje se basa en información estadística y su distribución para
obtener patrones. Los datos no son etiquetados previamente, por lo que no se proporciona
un valor verdadero inicial (no hay intervención humana sobre los datos).

La máquina ha de ser capaz de encontrar estructuras existentes en los datos o formas de


organizarlos abstrayéndose de la información directamente. Este método de aprendizaje
iterativo sirve para reducir la dimensionalidad de los datos reduciendo la pérdida de
información o eliminar ruido.

El aprendizaje no supervisado es frecuentemente utilizado para resolver problemas de


agrupamiento (clustering). Es un tipo de exploración muy útil para obtener una mejor visión
de los datos, ya que es capaz de agrupar diferentes muestras (valores de entrada) en función
de las características que tienen en común. Puede aplicarse en cualquier proceso de
reconocimiento de patrones, por ejemplo:

• Identificar segmentos en una base de datos

• Predicciones de cuándo un cliente dejará de serlo

• Identificar los intereses de una audiencia para envíos de marketing

www.solidq.com/es | contact@solidq.com
3.3 APRENDIZAJE POR REFUERZO (Reinforcement learning)

Modelo de aprendizaje basado en la experiencia. No es necesario partir de un conjunto de


datos inicial ya que se trata de un sistema retroalimentado. Este modelo aplica una función
de premio/no-premio para ir optimizando las decisiones. El sistema aprende cuando toma
decisiones acertadas, dando más peso al proceso de decisión que ha obtenido una decisión
correcta.

Este modelo de “prueba y error” es una de las técnicas más prometedoras en la actualidad.
Por ejemplo, es empleada en la navegación de coches autónomos y la que ha hecho posible a
programas como AlphaZero o AlphaGo aprender a jugar al ajedrez y ganar a los campeones
mundiales.

www.solidq.com/es | contact@solidq.com
4. Algoritmos de Machine Learning

4.1 ALGORITMOS LINEALES

Resuelven problemas de clasificación (respuestas de sí/no, grupos, etc). Gráficamente se


representan como líneas que separan dos tipos de outputs. Son fáciles de comprender y
existen dos tipos de funciones: regresiones lineales y logísticas.

En ocasiones son demasiado sencillos para resolver problemas de clasificación complejos. Se


emplean en aprendizaje supervisado (se obtienen valores continuos).

Caso práctico:

Supongamos que, de un conjunto de frutas, queremos separar fresas y plátanos. Si


escogemos los atributos peso y color, será fácil dividir el espacio mediante una recta con la
que consigamos separar plátanos y fresas gracias a estos dos atributos. Nos encontraríamos
en este caso ante una regresión lineal.

www.solidq.com/es | contact@solidq.com
Pero, ¿qué ocurriría si en vez de plátanos y fresas tuviéramos que distinguir plátanos y peras?
Si elegimos los mismos atributos, no conseguiremos distinguir las piezas de fruta.

Las dimensiones que en el primer caso eran suficientes para nuestro objetivo, ahora no lo
son. No obstante, podemos recurrir a analizar un tercer atributo para conseguir identificarlas.
Por ejemplo, identificaremos el número de pepitas de las frutas.

www.solidq.com/es | contact@solidq.com
Es frecuente conseguir separar conjuntos de datos agregando más dimensiones, pero
demasiadas dimensiones además de suponer un coste computacional superior y no siempre
es la opción más recomendada.

Nota: Cuando un sistema de Machine Learning divide agrupaciones en los datos no sólo
utiliza la ecuación de la recta o del plano, sino también otros tipos de regresiones. En este
ejemplo hemos utilizado una recta para simplificar la comprensión del concepto.

4.2 ÁRBOLES DE DECISIÓN

Proceso que emplea métodos de bifurcación para calcular todos los resultados posibles en
una decisión. Cada rama corresponde a un patrón reconocido en el proceso de aprendizaje.
En las hojas se sitúan las predicciones de cada patrón y su confianza (probabilidad de
acierto).

Conceptualmente es fácil de entender cuando el árbol de decisión es sencillo (pocas ramas),


pero se complica cuando se concatenan distintos árboles entre sí.

Caso práctico:

Estamos evaluando el tráiler de una película que se estrenará próximamente. El tráiler se


muestra a personas entre 20 y 60 años y disponemos datos sobre su educación (7 clases, 1 =
más bajo, 7 = más alto). El 55% respondió, tras ver el tráiler, que irían a ver la película. ¿Qué
factores son más influyentes?

www.solidq.com/es | contact@solidq.com
En primer lugar, se observa una división en el porcentaje en el eje y, correspondiente a la
edad. Obtenemos, al igual que haría el sistema de Machine Learning automáticamente, la
primera ramificación del árbol.

Observando el espacio superior y el inferior, vemos que es posible dividir en dos estos dos
primeros segmentos según nos intereses asociados al nivel de estudios cursados. Tendríamos
de nuevo otra clasificación.

www.solidq.com/es | contact@solidq.com
Ante esta situación y un nuevo input, el sistema clasificaría automáticamente si la persona
querría asistir o no a ver la película basado en la propiedad encontrada.

4.3 REDES NEURONALES

Imitan el comportamiento del cerebro humano. Una red neuronal está formada por muchas
capas entre la entrada y la salida. Cada capa aprende de la anterior, por lo que en las
sucesivas se consigue un nivel superior de aprendizaje. Pueden manejar tareas
extremadamente complejas, el proceso de entrenamiento es lento y sus predicciones son
difíciles de comprender.

Una neurona artificial (perceptron) es un conjunto de entradas ponderadas con diferentes


pesos que se suman. Tanto los pesos como el umbral de decisión se determinan durante el
entrenamiento del sistema. Si el resultado final es mayor que el umbral, la salida depende de
la función de la que proviene, alimentando así las neuronas sucesivas. Este proceso se repite
en toda la red neuronal.

www.solidq.com/es | contact@solidq.com
www.solidq.com/es | contact@solidq.com
5. Machine Learning: presente y
futuro

Interactuamos cada vez más con distintas aplicaciones basadas en modalidades de


inteligencia artificial. Y no necesariamente nos referimos a “nuevas” aplicaciones como
chatbox o asistentes de voz como Cortana (Microsoft), Siri (Apple) o Alexa (Amazon), sino a
las aplicaciones que llevan años funcionando y optimizándose en determinados sectores:

• Predicción de ventas, análisis de geolocalización para la ubicación de nuevas aperturas,


recomendación de productos en canales online, gestión de abandono de carrito…

• Predicción de enfermedades, prevención de riesgos, cálculo de pólizas…

• Predicción de averías, optimización de rutas…

• Análisis de mercado, segmentación de clientes

• Detección de anomalías y fraude fiscal, mejora de atención al cliente, identificación de


clientes de riesgo…

La realidad es que cada vez disponemos de más datos y la tecnología nos permite
explotarlos, y obtener resultados en distintos sectores y negocios: mejorar procesos, la
comunicación con nuestros clientes, anticiparnos a determinadas situaciones críticas,
identificar oportunidades…

www.solidq.com/es | contact@solidq.com
¿Ya has implantado Machine Learning en tu negocio? ¿Aún no,
pero tienes claro que próximamente lo haréis?

De ti depende, ¿vas a sacarle partido o a esperar que tus competidores lo hagan por ti?
Conocer y contar con perfiles capacitados en Machine Learning es el primer paso hacia la
Inteligencia Artificial en tu negocio.

En SolidQ ofrecemos servicios de consultoría, mentoring y formación. Llevamos años


ayudando a empresas a hacer realidad sus proyectos de Analítica Predictiva y Machine
Learning. Durante este tiempo hemos desarrollado una metodología que permite arrancar
rápidamente proyectos de Machine Learning asegurando la viabilidad y el éxito de tu Data
Strategy.

¿Ya has puesto en marcha proyectos de BI y quieres dar un paso más en tu estrategia?
Nuestro Ideation Workshop puede interesarte. ¡Descubre nuestra metodología!

Más información: www.solidq.com/es/machine-learning-como-empiezo-mi-proyecto/

www.solidq.com/es | contact@solidq.com

S-ar putea să vă placă și