Documente Academic
Documente Profesional
Documente Cultură
Motivao
A informatizao dos meios produtivos permitiu a
gerao de grandes volumes de dados:
Transaes eletrnicas;
Novos equipamentos cientficos e industriais para observao
e controle;
Dispositivos de armazenamento em massa;
Motivao
Os recursos de anlise de dados tradicionais
so inviveis para acompanhar esta evoluo
Morrendo de sede por conhecimento
em um oceano de dados
Motivao
Motivao
Soluo:
Exemplo Preliminar
Um problema do mundo dos negcios:
entender o perfil dos clientes
Descoberta de Conhecimento em
Bancos de Dados
O processo no trivial de extrao de
informaes implcitas, anteriormente
desconhecidas, e potencialmente teis de uma
fonte de dados;
Torture os dados at eles confessarem;
O que um padro interessante ?
(vlido,
novo, til e interpretvel)
Conceitos
Etapas do KDD
Limpeza de dados
Integrao dos dados
Data Warehouse
Seleo
Transformao dos dados
Minerao
Avaliao ou ps-processamento
Visualizao dos resultados
Etapas do KDD
Bases de Dados
Visualizao
Aprendizado
de mquina
KDD
Estatstica
e Matemtica
Reconhecimento
de padres
Real
Virtual
Medicina
Deteco de Fraudes
Inteligncia Competitiva
Concorrentes
Tendncias do Mercado
Exemplos
reas de aplicaes potenciais:
Vendas e Marketing
Identificar padres de comportamento de consumidores
Associar comportamentos caractersticas demogrficas
de consumidores
Campanhas de marketing direto (mailing campaigns)
Identificar consumidores leais
Exemplos
Exemplos
reas de aplicaes potenciais:
Bancos
Identificar padres de fraudes (cartes de crdito)
Identificar caractersticas de correntistas
Mercado Financeiro ($$$)
Exemplos
Exemplos
reas de aplicaes potenciais
Mdica
Comportamento de pacientes
Identificar terapias de sucessos para diferentes
tratamentos
Fraudes em planos de sades
Comportamento de usurios de planos de sade
Exemplos
dbito
x
x
o
o
Um hiperplano paralelo de
separao: pode ser
interpretado diretamente como
uma regra:
o
o
t
x: exemplo recusado
o: exemplo aceito
x
o
o
Exemplo:
rvores de deciso;
induo de regras
renda
Mtodos
dbito
x
x
o
o
o
o
t
x: exemplo recusado
o: exemplo aceito
regresso linear;
perceptron;
o
o
renda
Mtodos
dbito
x
x
o
o
o
o
t
x: exemplo recusado
o: exemplo aceito
o
o
perceptrons multicamadas;
regresso no-linear;
renda
Mtodos
dbito
x
x
o
o
Mtodos baseado em
exemplos;
Exemplos:
o
o
t
x: exemplo recusado
o: exemplo aceito
x
o
o
k-vizinhos mais
prximos;
raciocnio baseado em
casos;
renda
Mtodos
Sumarizao
Envolve mtodos para encontrar uma descrio compacta para um
subconjunto de dados
Compras
Po, Leite, Manteiga
Leite ,Aucar
Leite
Manteiga
Leite, Manteiga
Manteiga, Acar
Suporte =
= 50%
Confiana =
= 66,6%
{Computador}
{TV}
{Rdio} >>{Comp}
Suporte =
= 40%
Classificao
Nome
Idade
Renda
Profisso
Classe
Daniel
30
Mdia
Estudante
Sim
Joo
31..50
Mdia-Alta
Professor
Sim
Carlos
31..50
Mdia-Alta Engenheiro
Maria
31..50
Baixa
Vendedora
No
Paulo
30
Baixa
Porteiro
No
Otavio
> 60
Mdia-Alta Aposentado
Sim
No
Classificao
Amostras
Classificadas
REGRAS
Banco de
Testes
Classificador
REGRAS CONFIVEIS
Classificao
rvore de Deciso
IDADE
30
RENDA
B
M
No
Sim
>60
No
M-A A
Sim
Sim
51-60
31-50
PROFISSO
Sim
Med Prof
Eng
Vend
Sim Sim
No Sim
Tarefas
Exemplos
Descoberta de Regras
de Associao
Associao
rvores de Deciso
Classificao
Regresso
Raciocnio Baseado
em
Casos ou MBR
Classificao
Segmentao
Algoritmos Genticos
Classificao
Segmentao
Classificao
Segmentao
Redes Neurais
Artificiais
Exemplos
SAS
http://www.sas.com
Information Havesting
http://www.convex.com
Red Brick
http://www.redbrick.com
Oracle
http://www.oracle.com
Sybase
http://www.sybase.com
Informix
http://www.informix.com
IBM
http://www.ibm.com
Exemplos
Concluses
Data mining um processo que permite compreender o
comportamento dos dados.
Data mining analisa os dados usando tcnicas de
aprendizagem para encontrar padres e regulariedades
nestes conjuntos de dados.
um problema pluridisciplinar, envolve Inteligncia Artificial,
Estatstica, Computao Grfica, Banco de Dados.
Pode ser bem aplicado em diversas reas de negcios
Concluses
Perguntas
Referncias Bibliogrficas
Tcnicas de Minerao de Dados -JAI - SBC2004
http://www.deamo.prof.ufu.br/arquivos/JAI-cap5.pdf (Acesso 02/06/2005)
http://www.deamo.prof.ufu.br/arquivos/JAI-slides.ppt (Acesso 02/06/2005)
Referncias Bibliogrficas
A Comparison of Leading Data Mining Tools (PDF format).
A
presentation by John F. Elder IV and Dean W.
http://www.datamininglab.com/pubs/kdd98_elder_abbott_nopics
_bw.pdf (Acesso 9/7/2005)
Oliveira, Aracele G.; Garcia, Denise F. Minerao da Base de
Dados de um Processo Seletivo Universitrio. p.38-43.
http://www.dcc.ufla.br/infocomp/artigos/v3.2/art07.pdf
(Acesso
31/05/2005)
Referncias
Fayyad et al. (1996). Advances in knowledge discovery and data
Referncias