Sunteți pe pagina 1din 3

Datamining

Data mining uma expresso inglesa ligada informtica cuja traduo minerao de dados. Consiste em uma funcionalidade que agrega e organiza dados, encontrando neles padres, associaes, mudanas e anomalias relevantes.

A expresso data mining surgiu pela primeira vez em 1990 em comunidades de bases de dado. A minerao de dados a etapa de anlise do processo conhecido como KDD (Knowledge Discovery in Databases), sendo a sua traduo literal "Descoberta de Conhecimento em Bases de Dado".

O data mining pode ser divido em algumas etapas bsicas que so: explorao, construo de modelo, definio de padro e validao e verificao.

A minerao de dados uma prtica relativamente recente no mundo da computao, e utiliza tcnicas de recuperao de informao, inteligncia artificial, reconhecimento de padres e de estatstica para procurar correlaes entre diferentes dados que permitam adquirir um conhecimento benfico para uma empresa ou indivduo. Para uma empresa, o data mining pode ser uma importante ferramenta que potncia a inovao e lucratividade.

A utilizao da minerao de dados bastante usual em grandes bases de dados, e o resultado final da sua utilizao pode ser exibido atravs de regras, hipteses, rvores de deciso, dendrogramas, etc.

Uma minerao de dados bem executada deve cumprir tarefas como: deteco de anomalias, aprendizagem da regra de associao (modelo de dependncia), clustering (agrupamento), classificao, regresso e sumarizao. O processo de data mining costuma ocorrer utilizando dados contidos dentro do data warehouse.

Existem vrias empresas e softwares que se dedicam minerao de dados, pois a identificao de padres em bancos de dados cada vez mais importante. No entanto, a identificao de padres relevantes no exclusivo do mundo informtico. O crebro humano, utiliza um processo semelhante para identificar padres e adquirir conhecimento.

Nos ltimos anos, a minerao de dados tem sido amplamente utilizada nas reas da cincia e engenharia, tais como bioinformtica, gentica, medicina, educao e engenharia eltrica.

O conceito de data mining muitas vezes associado extrao de informao relativa ao comportamento de pessoas. Por esse motivo, em algumas situaes, a minerao de dados

levanta aspectos legais e questes relativas privacidade e tica. Apesar disso, muitas pessoas afirmam que a minerao de dados eticamente neutra, pois no apresenta implicaes ticas.

Exemplos reais de Data Mining A minerao de dados muitas vezes usada por empresas e organizaes para a obteno de conhecimento a respeito de utilizadores / funcionrios / clientes. Por exemplo, no setor pblico possvel fazer o cruzamento de dados entre o estado civil de um funcionrio e o salrio que ele ganha, para verificar se isso tem influncia na sua vida conjugal.

Empresas como cadeias de supermercados podem recorrer a esse cruzamento de dados para determinarem produtos que so comprados em conjunto. Se um cliente que compra o produto X tambm compra o produto Y, talvez seja uma boa ideia posicionar os dois produtos perto, para facilitar a compra por parte do cliente.

Datawarehouse
O que Data Warehouse:

Data warehouse um depsito de dados digitais que serve para armazenar informaes detalhadas relativamente a uma empresa, criando e organizando relatrios atravs de histricos que so depois usados pela empresa para ajudar a tomar decises importantes com base nos fatos apresentados.

O data warehouse serve para recolher informaes de uma empresa para que essa possa controlar melhor um determinado processo, disponibilizando uma maior flexibilidade nas pesquisas e nas informaes que necessitam.

Para alm de manter um histrico de informaes, o Data Warehouse cria padres melhorando os dados analisados de todos os sistemas, corrigindo os erros e restruturando os dados sem afetar o sistema de operao, apresentando somente um modelo final e organizado para a anlise.

Data warehouse e data mart Um data mart uma subdiviso ou subconjunto de um data warehouse. Os data marts so como pequenas fatias de data warehouse, que armazenam subconjuntos de dados.

Normalmente o data mart direcionado para uma linha de negcios ou equipe, sendo que a sua informao costuma pertencer a um nico departamento.

Vantagens e desvantagens do data warehouse Algumas das principais vantagens do data warehouse so:

Inconsistncias so identificadas e solucionadas antes dos dados serem carregados, o que facilita a execuo da anlise e de relatrios; Contribuem para o processo de tomar decises, atravs de relatrios de tendncias, de exceo e relatrios que revelam os objetivos versus desempenho real. O data warehouse tambm tem algumas desvantagens, entre as quais:

No so uma soluo adequada para dados no-estruturados; Podem ter custos elevados e podem ficar ultrapassados com alguma rapidez. Data warehouse e Business intelligence Business intelligence (inteligncia empresarial em portugus), o processo de recolha e tratamento de informaes que apoiam a gesto de um negcio.

Normalmente, as vrias vertentes de business intelligence utilizam informao recolhida em um data warehouse. Apesar disso, nem todos os data warehouses so usados no contexto de business intelligence, porque nem todos as aplicaes de business intelligence exigem um data warehouse.

OLAP OLAP (Online Analytical Processing - Processo Analtico em Tempo Real), uma das ferramentas mais usadas para a explorao de um data warehouse. O OLAP possibilita alterar e analisar grandes quantidades de dados em vrias perspectivas diferentes.

A aplicao dessa ferramenta pode ser usada pelos gestores de qualquer rea e nvel, disponibilizando informaes e ajudando na deciso final. O uso da OLAP pode ser aplicado em funes muito distintas, algumas das mais utilizadas variam desde funes financeiras (anlises, fluxos de caixa, contas, oramentos, etc.) passando pelo marketing (anlise de preo, volume de mercado) concluindo nas vendas (previses, lucro, clientes).

S-ar putea să vă placă și