Sunteți pe pagina 1din 20

INE5643 Data Warehouse

Machine Learning e
Analytics
Fabrizio, Indiara, Lucas e Rafael
Índice

Breve histórico Desafios da


aprendizagem de
Aprendizagem de máquina aplicada a
máquina no cenário de negócios
analytics
Impactos da
Aplicações modernas de aprendizagem de
aprendizagem de máquina nos negócios
máquina
Conclusões
MACHINE
LEARNING
Visão geral
Machine learning (aprendizado de máquina) é um campo da ciência da
computação que usa técnicas estatísticas para dar a sistemas
computacionais a habilidade de “aprender” a partir de um conjunto
de dados, sem serem explicitamente programados para tal.

A definição de “aprender” utilizada nesse conceito é a de


progressivamente aumentar o desempenho ao realizar uma tarefa
específica.
Breve histórico
Década de 1950: Machine learning surge em pesquisas associadas à computação.

Década de 1980: economias de escala no armazenamento/processamento de


dados.

Alto nível de granularidade permite identificar padrões.

Campos de aplicação: inteligência artificial, data mining, estatística e otimização, e


por consequência, negócios.

Organizações passam a adotar maiores e mais complexas estratégias de analytics


Exemplos de problemas
Manutenção Preventiva de equipamento
Detectando informações inúteis (spam)
As empresas que se utilizam de maquinário
Substitui o sistema antigo baseado em
tinham uma manutenção mais reativa,
1 regras para remover spam, vários 3
entrando em funcionamento somente
servidores de email funcionavam apenas
quando as máquinas apresentavam
com sistemas baseados em regras,
problema, ou com períodos de tempo fixos
escritas por humanos.

Recomendação de produtos
Análise de mercado em uma área
Recomendação de produtos também era
2
algo que funcionava baseado em regras 4 Entender a situação socioeconômica de
definidas por um operador entre uma área para montar um novo negócio
produtos ou categorias, ou era complicado e a pesquisa poderia
aleatoriamente. levar meses
Explosão de Machine Learning nos últimos anos

Por quê?
Motivos da explosão do Machine Learning
●Problemas atuais tem dimensões
grandes
●Vastos conjuntos de dados, em formato
digital, formados desde o início da
popularização de computadores.
●Poder de processamento altíssimo
comparado às primeiras tentativas de
se utilizar ML
●Dominância das transações Web
(online)
MACHINE
LEARNING
APLICADA EM
ANALYTICS
Machine Learning aplicada em Analytics
Machine Learning se tornou uma categoria
de Data Analytics, com a vantagem de ter a
criação automática de modelos, que
historicamente tiveram que ser definidos, de
alguma forma, por um humano.

A ideia sendo que, apesar de ser


humanamente impossível definir modelos para
cada um dos casos possíveis no seu escopo, um
programa, analisando milhares de exemplos de
casos por dia, pode ser capaz de aprender os
padrões sozinho
Aplicações modernas
01 | Sistemas de recomendação
02 | Streaming analytics
03 | Deep learning e computação
cognitiva
Sistemas de Recomendação
● Usados para vários fins, mas mais comumente
em sites de compras, onde agregam valor ao
oferecer ofertas relevantes a usuários
baseadas em seus gostos e histórico de
compras;
● Problema de “cold start” onde em um primeiro
momento após a implementação podem ainda não
existir dados históricos de onde tirar as
informações relevantes para formar
recomendações personalizadas para cada
usuário.
Streaming Analytics
● Algumas aplicações, geralmente de maior risco envolvido, necessitam de decisões em
tempo real (ou quase) baseadas em modelos de aprendizado de máquina;

● Dados de tempo-real geralmente vêm de sensores, cujos tipos variam dependendo do


campo de aplicação.

Três tipos principais


01 | Edge Analytics: Dados coletados dentro de um
dispositivo (sensor, gateway)
02 | In-stream Analytics: Dados coletados entre o
dispositivo e o servidor (logs)

03 | At-rest Analytics: Dados coletados “em repouso”


(banco de dados relacional)
Deep Learning e Computação Cognitiva
● Deep learning é atualmente a melhor técnica para
classificar, reconhecer, detectar e descrever dados;

● Principal componente é a ANN (Artificial Neural Network);

● Um alto número de dados é necessário para treinar as ANNs;

● Deep learning é um dos fundamentos da computação


cognitiva, que é um campo onde sistemas complexos de
aprendizado de máquina são treinados para realizar tarefas
específicas de forma inteligente;

● Computação cognitiva busca combinar processamento de


linguagem natural, grandes bases de dados e
aprendizado de máquina para traduzir problemas em
linguagem natural para linguagem de máquina.
DESAFIOS
IMPACTOS
E FERRAMENTAS
Desafios
Organizacionais: Retenção e desenvolvimento de talentos. Carência de pessoal
treinado em analytics que envolvam técnicas complexas - necessidade crescente do
Chief Analytics Officer (CAO)

Dados: Grande volume de dados obtidos, em diversos formatos por diversas fontes,
que devem ser gerenciados, exigem um tratamento para garantir sua qualidade.

Segurança: Como dados dos modelos de machine learning devem ser usados,
armazenados e reutilizados?

Infraestrutura: Administração de banco de dados relacionais podem falhar frente à


variedade de dados.
Desafios

Modelagem: Requisitos Produção e Operação:


regulatórios podem ter Modelos implantados devem
dificuldades em serem prever rastreabilidade e
comprovadamente controle de versão,
atendidos em meio à entregando resultados em
complexidade dos modelos um formato compreensível.
de machine learning.
Impactos nos Negócios
Automotivo: sistemas de respostas emergenciais podem realizar manobras sem um
input do motorista;

Banking: novos produtos, balanceamento de risco, detecção de fraude;

Governos: Reconhecimento de padrões em imagens/vídeos podem melhorar segurança


e detecção de ameaças;

Manufaturas: Reconhecimento de padrões em dados obtidos por sensores podem


diagnosticar defeitos nos produtos e processos;

Comércio: Microsegmentação e monitoramento do comportamento do consumidor


pode levar à ofertas instantâneas, customizadas.
Ferramentas
Computação distribuída
Framework para processamento
distribuído de grandes conjuntos
de dados em clusters de
computadores usando modelos
simples de programação.
Computação numérica Análise de dados exploratória
Programação visual baseada em
Biblioteca para criação e
componentes. Abrange desde
treinamento de redes neurais,
visualização de dados até avaliação
comumente utilizadas para
empírica de algoritmos de
encontrar/decifrar padrões e
aprendizado e modelagem preditiva.
correlações.
Obrigado!

S-ar putea să vă placă și