Sunteți pe pagina 1din 39

Data Mining

Convencional/Multirrealacional

Leonardo Henrique da Costa Longo


Prof. Dr. Carlos Roberto Valncio
Disciplina: Bancos de Dados II
Agenda

Motivaes
O que Data Mining
Como funciona
Ferramentas
Estudos recentes
Problemticas
Porque Data Mining Multirrelacional
Como funciona o modelo Multirrelacional
Ferramenta para Data Mining Multirrelacional
Estudos recentes utilizando a abordagem Multirrelacional
Concluso
Motivao

A partir da observao de padres possvel


extrair informaes.

Porm quando o volume de dados muito


grande, se torna difcil o reconhecimento destes
padres.
Motivao

Como a extrao de informao foi


automatizada o volume de dados que temos
acesso aumentou exponencialmente.

Ex: Cmeras digitais, softwares de controle, redes


sociais.
Fonte: CSC, 2012
Motivao

Tornou-se ento necessrio analisar esse grande


volume informaes de forma otimizada.

Estamos nos afogando em informaes, mas com fome de


conhecimento John Naisbitt
Data Mining

Minerao de conhecimento

um processo que analisa uma grande


quantidade de dados em busca de informaes
relevantes que podem no ser fceis de perceber
Data Mining

Resumindo, as ferramentas
de Data Mining analisam os dados
tentando descobrir problemas ou
oportunidades escondidas nos
relacionamentos dos dados,
requerendo a mnima interveno
do usurio.
Exemplo

A partir da anlise de um sistema de um supermercado foi


extrado que 83% das vezes que foi comprado po, leite
tambm foi comprado.

O que fazer com essa informao?

Aproximar fisicamente os produtos na loja pode facilitar


a compra dos clientes e at aumentar o nmero de
vendas.
Como Funciona

So usadas diversas abordagens para a extrao do


conhecimento, entre elas esto:

Estatstica : a base de muitas outras abordagens e


essencial para o desenvolvimento de tcnicas de Data
Mining.

Inteligncia Artificial (IA) : Tenta aproximar-se da forma


humana de reconhecer padres e analisar estatsticas.
Como Funciona

O Machine Learning (Aprendizado de Mquina)


uma tcnica que combina ambos, IA e Estatstica,
e foca principalmente em automatizar o
aprendizado e tomar decises inteligentes para o
reconhecimento de padres complexos.
Que tipos de informaes
podem ser extradas?

Associaes
Sequncias
Aglomerao ou Clustering
Classificaes
Prognstico
Associaes

Ocorrncias relacionadas por um nico evento.

Ex: A partir da anlise dos bancos de dados de


uma rede de supermercados percebeu-se que
65% das vezes que um cliente comprou calados
ele tambm comprou meias.
Sequncias

Eventos que esto relacionados com o tempo.

Ex: A partir de dados extrados do banco de dados de


um e-commerce, observou-se que depois de
comprar um celular novo, depois de 8 meses 73%
decide comprar um modelo mais novo.
Aglomerao ou Clustering

Classifica os dados em grupos a partir de


caractersticas semelhantes.

Ex: Separao de um banco de clientes pelo sexo,


origem ou idade.
Classificaes

Classifica os dados em grupos atravs de outros


j classificados.

Ex: A partir de suas curtidas em comum com


outros usurio nas redes sociais concluiu-se que
o usurio uma mulher entre 21 e 35 anos.
Prognsticos

Faz a previso do prximo valor baseado em


valores anteriores.

Ex: A partir da anlise do valor das aes na bolsa


de valores nas ltimas semanas foi previsto que
as aes da empresa iriam cair 5,3% no valor at
o fim prxima semana
Mas todas as informaes
extraidas so uteis?

?
Inmeras descobertas

Aplicar a extrao de conhecimento em uma


base de dados resulta na percepo de vrios
padres, mas nem todos podem interessar.

O padro extrado interessante se for de fcil


entendimento, vlido ao ser aplicado em testes ou
comparado com novos dados, inovador e/ou
validam um hiptese que foi levantada.
Ferramentas para Data
Mining
Ferramentas para Data
Mining
Ferramentas para Data
Mining
Data Mining na analise de
acidentes de trnsito

Estudo realizado na ndia, no ano de 2016.

O que causa os acidentes? Onde estes acidentes


mais acontecem?
Data Mining na analise do
consumo de energia

Estudo realizado na Itlia, no ano de 2016.

Quais horas/dias o consumo de energia era


maior? Quais utenslios consomem mais energia?
Qual o maior tempo em que energia foi
consumida em grande escala?
Data Mining aplicado a jogos
virtuais

Estudo realizado na ndia, no ano de 2016.

Como determinar a capacidade de


entretenimento de um jogo? Como identificar os
possveis jogadores? Como elaborar o jogo para
que seja mais atrativo?
Problemticas

Eficincia e Escalabilidade

Interatividade

Privacidade

Metodologia
Data Mining Multirrelacional

Os algoritmos para o Data Mining convencional


consideram que os dados esto em uma nica
estrutura, uma tabela por exemplo.

Como aplicar para um banco da dados


relacional?
Data Mining Multirrelacional

Os dados podem ser tratados para que haja s


uma fonte de dados.

Ou

Aplicar um mtodo multirrelacional.


Data Mining Multirrelacional

A extrao aplicada aos dados tratados pode


no ser to satisfatria quanto ao ser aplicada em
um banco de dados relacional.

O pr-processamento pode gerar


inconsistncias nos dados e a quantidade de
dados resultantes da juno de vrias tabelas
pode atrapalhar no desempenho dos algoritmos.
Paciente Internao

Cod Nome Sexo ... Cod Paciente Motivo Dias ...


1 Joo M ...
1 n 111 1 Ataque 15 ...
2 Maria F ... Cardaco
3 Paulo M ... 124 2 Bronquite 2 ...
... ... ... ... 442 3 Febre Zika 30 ...
842 2 Meningite 12 ...
... ... ... ... ....
Cod_Paciente Nome Sexo Cod_Internacao Motivo Dias ...

1 Joo M 111 Ataque Cardiaco 15 ...

2 Maria F 124 Bronquite 2 ...

2 Maria F 842 Meningite 12 ...

3 Paulo M 442 Febre Zika 30 ...

... ... ... ... ... ... ...


Cod_Paciente Nome Sexo Num_Internacoes Media_Dias ...

1 Joo M 1 15 ...

2 Maria F 2 7 ...

3 Paulo M 1 30 ...

... ... ... ... ... ...


Data Mining Multirrelacional

Funciona de maneira parecida ao convencional,


porm leva em considerao os relacionamentos
entre as tabelas baseados em suas chaves
primarias e estrangeiras.
Data Mining Multirrelacional

Inductive Logic Programming (ILP)

Grafos
Ferramentas para Data
Mining Multirrelacional

Samorani, M. 2015. "Automatically Generate a Flat Mining Table with Dataconda." In 2015 IEEE International Conference on Data Mining
Workshop (ICDMW), pp. 1644-1647. IEEE, 2015.
Data Mining Multirrelacional
para gerencia de venda de
produtos
Estudo realizado no Ir, no ano de 2011

Onde o produto mais vendido? Qual produto


mais vendido? Qual a avaliao dos clientes sobre
o produto?
Concluso

Importante na atualidade

Abrange vrias reas

Escalabilidade

Data Mining Multirrelacional


Obrigado!
Perguntas?
Referncias
[5] ALI, U., BUCCELLA, C. CECATI, C. Households
[1] HAN, J. Data Mining: Concepts and Techniques. 3 ed. Electricity Consumption Analysis with Data Mining
2006. Disponvel em Techniques. Industrial Electronics Society , IECON 2016 -
http://hanj.cs.illinois.edu/bk3/bk3_slides/01Intro.ppt 42nd Annual Conference of the IEEE, 23 de outubro de
(Acesso 07/01/17 s 21:13h) 2016.

[2] TAN, P., STEINBACH, M., KUMAR, V. Introduction to [6] DZEROSKI, S. Multirelational Data Mining: An
Data Mining. 1 ed. University of Minnesota, 2006. Introduction. ACM SIGKDD Explorations Newsletter 5 (1),
1-16, 2003.
[3]JAIN, A., AHUJA, G., ANURANJANA, MEHROTRA, D.
Data Mining Approach to Analyse the Road Accidents in [7] PADHY, N., PANIGRAHI, R. Multi Relational Data
India. 5th International Conference on Reliability, Mining Approaches: A Data Mining Technique.
Infocom Technologies and Optimization (ICRITO) (Trends International Journal of Computer Applications (0975
and Future Directions), 07 de setembro de 2016, 8887), 2012.

[4] ANDRAT, A.; ANSARI,N Integrating Data Mining with [8] HOUSHMAND, M., ALISHAHI, M. Improve the
Computer Games. International Conference on classification and sales management of products using
Computing, Communication and Automation, 2016 multi-relational data mining. 2011 IEEE 3rd International
Conference on Communication Software and Networks,
2011.

S-ar putea să vă placă și