Documente Academic
Documente Profesional
Documente Cultură
Data Warehouse
1. DW
Nosso objetivo nesta aula tratar dos conceitos de Data Warehouse (DW)
e ETL. Comearemos pelos aspectos do DW e logo em seguida examinaremos as
especificidades relacionadas ETL.
16712855225
www.estrategiaconcursos.com.br
1 de 50
www.estrategiaconcursos.com.br
2 de 50
www.estrategiaconcursos.com.br
3 de 50
16712855225
www.estrategiaconcursos.com.br
4 de 50
1.2. Tipos de DW
A indstria atualmente reconhece pelo menos trs tipos diferentes de
Data Warehouses: Data Mart (DM), Data Warehouse Empresarial (EDW) e
Armazenamento de Dados Operacionais (ODS).
O qualificador "Empresarial" implica em ser grande e abrangente. Esta a
ideia tradicional de um armazm de dados. Algumas organizaes nunca vo
conseguir concluir um projeto de EDW, pois ele requer um compromisso enorme
de recursos. Ainda assim, se bem feito, um sistema abrangente acrescenta
toneladas de valor e produz um retorno considervel sobre o investimento.
conveniente, por vezes, a criao de uma coleo menor de dados
conhecida como Data Mart. Esta tem um pblico mais focado e normalmente
consiste em um subconjunto do EDW. Esse subconjunto pode ser definido pela
geografia (por exemplo, apenas os dados da Alemanha), linha de produtos (por
exemplo, apenas produtos para os cabelos), ou rea funcional (por exemplo, de
fabricao).
16712855225
www.estrategiaconcursos.com.br
5 de 50
www.estrategiaconcursos.com.br
6 de 50
1.3. Processo de DW
Apresentamos abaixo uma figura que descreve o processo de DW/BI. Essa
figura exibe os componentes que fazem parte do sistema. Vejamos a descrio
sucinta de cada um deles.
16712855225
www.estrategiaconcursos.com.br
7 de 50
1.4. Arquitetura de DW
H algumas arquiteturas bsicas de DW. As arquiteturas de 2 e 3
camadas so mais comuns. Hoffer as distingue dividindo o DW em trs partes:
1. O prprio DW, que contm os dados e o software associados, 2. Software de
aquisio de dados (retaguarda), que extrai dados de sistemas legados e fontes
externas, os consolida e resume, e depois os carrega e 3. Software cliente
(front-end), que permite aos usurios acessar e analisar dados a partir do DW.
16712855225
os
componentes
dentro
das
www.estrategiaconcursos.com.br
8 de 50
trs
camadas
da
16712855225
www.estrategiaconcursos.com.br
9 de 50
www.estrategiaconcursos.com.br
10 de 50
www.estrategiaconcursos.com.br
11 de 50
2. Modelagem multidimensional
Um modelo dimensional contm as mesmas informaes que um modelo
normalizado. Os pacotes de dados oferecem um formato com as seguintes
preocupaes: facilidade de compreenso ao usurio, desempenho da consulta e
resilincia s mudanas.
Imagine um executivo que descreve o seu negcio como, "Ns vendemos
produtos em vrios mercados e medimos o nosso desempenho ao longo do
tempo." Projetistas multidimensionais devem ouvir atentamente a nfase no
produto, mercado e tempo.
A modelagem multidimensional, ou dimensional como s vezes
chamada, a tcnica de modelagem de banco de dados para o auxlio s
consultas em um Data Warehouse nas mais diferentes perspectivas. A viso
multidimensional permite o uso mais intuitivo para o processamento analtico
pelas ferramentas OLAP (On-line Analytical Processing).
Toda modelagem dimensional possui dois elementos imprescindveis: as
tabelas Fatos e as tabelas Dimenses. Ambas so obrigatrias e possuem
caracterstica complementares dentro de um Data Warehouse. As Dimenses so
os descritores dos dados oriundos das tabelas Fato. Possui o carter qualitativo
da informao e relacionamento de um para muitos com a tabela Fato. a
Dimenso que permite a visualizao das informaes por diversos aspectos e
perspectivas.
16712855225
www.estrategiaconcursos.com.br
12 de 50
www.estrategiaconcursos.com.br
13 de 50
www.estrategiaconcursos.com.br
14 de 50
www.estrategiaconcursos.com.br
15 de 50
www.estrategiaconcursos.com.br
16 de 50
www.estrategiaconcursos.com.br
17 de 50
www.estrategiaconcursos.com.br
18 de 50
www.estrategiaconcursos.com.br
19 de 50
16712855225
www.estrategiaconcursos.com.br
20 de 50
Gabarito: C
Vamos agora apresentar algumas caractersticas e taxonomia para as
tabelas de dimenses.
Cada tabela de dimenso tem uma nica coluna de chave primria. Esta
chave primria incorporada como uma chave estrangeira em qualquer tabela
de fatos onde a descrio textual presente na linha da dimenso exatamente a
correta para a linha da tabela de fatos. Tabelas de dimenso so geralmente
grandes, desnormalizadas, com muitos atributos de texto de baixa
cardinalidade.
Embora os cdigos operacionais e os indicadores possam ser tratados
como atributos, os atributos de dimenso mais poderosos so preenchidos com
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
21 de 50
www.estrategiaconcursos.com.br
22 de 50
Uma nica dimenso fsica pode ser referenciada vrias vezes em uma
tabela de fato, com cada referncia ligando para um papel logicamente distinto
para a dimenso. Por exemplo, uma tabela de dados pode ter vrias datas, cada
uma delas representada por uma chave estrangeira para a dimenso de data.
essencial que cada chave estrangeira se refira a uma viso separada da
dimenso data de modo que as referncias sejam independentes. Estas
dimenses separadas (com nomes exclusivos de colunas de atributo) so
chamadas de papis.
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
23 de 50
www.estrategiaconcursos.com.br
24 de 50
3. ETL
Um ambiente de DW devidamente projetado possui um trade off entre o
trabalho na sala de aplicaes de BI e o trabalho do sistema de ETL. O primeiro
deve ser feito repetidas vezes pelos usurios de negcios, enquanto o segundo
feito uma vez pela equipe de ETL.
O processo de ETL o processo mais crtico e demorado na construo de
um DW. ETL e as ferramentas de limpeza de dados consomem um tero do
oramento num projeto de DW e 80% do tempo de desenvolvimento de um DW
consiste no processo de ETL. Abaixo temos uma figura que descreve as etapas
de um processo de ETL.
16712855225
www.estrategiaconcursos.com.br
25 de 50
www.estrategiaconcursos.com.br
26 de 50
www.estrategiaconcursos.com.br
27 de 50
www.estrategiaconcursos.com.br
28 de 50
de
ETL
deve
trabalhar
2. Sistema de backup
3. Sistema de recuperao e restart
16712855225
www.estrategiaconcursos.com.br
29 de 50
16712855225
www.estrategiaconcursos.com.br
30 de 50
Questes comentadas
Apresentamos abaixo um conjunto de questes, principalmente das
bancas CESPE, FCC, ESAF sobre o assunto de BI. Esperamos que elas ajudem na
fixao da matria. Qualquer dvida, estamos s ordens!
www.estrategiaconcursos.com.br
31 de 50
ANALISTA
Aproveitando para falar um pouco mais sobre BPM, ele tambm chamado de
Corporate Performance Management (CPM). BPM um conceito que veio ratificar
a importncia de ter sempre o alinhamento das informaes com a estratgia da
empresa. BPM (Business Performance Management), um conjunto de software,
processos de negcios e medidas de sucesso dos negcios (mtricas e KPI's key performance indicators) que, quando combinados, premitem a uma
organizao entender, agir e influenciar a performance de seus negcios.
16712855225
Gabarito: C
MPOG
PROVA:
BI Business Inteligence
A uma tcnica de otimizao da rvore de deciso.
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
32 de 50
ANALISTA
MPOG
PROVA:
ANALISTA
Um ambiente Datawarehouse
A uma coleo de dados volteis, invariantes em termos locais, integrados e
orientados a um assunto, direcionados a decises operacionais.
B ao ser projetado segundo a abordagem bottom-up, fundamenta-se nas
necessidades de informao de todos os nveis gerenciais da empresa.
C para ser implementado, requer a remoo de metadados e a integrao de
dados existentes em um banco de dados.
D ao ser projetado, segundo a abordagem
necessidades de informaes gerenciais.
top-down,
no
comporta
www.estrategiaconcursos.com.br
33 de 50
ANALISTA
www.estrategiaconcursos.com.br
34 de 50
16712855225
Nesta arquitetura
A Data Mining se refere ao processo que, na construo do Data Warehouse,
utilizado para composio de anlises e relatrios, armazenando dados
descritivos e qualificando a respectiva mtrica associada.
www.estrategiaconcursos.com.br
35 de 50
16712855225
10. ANO: 2015 BANCA: FCC RGO: TRT - 15 REGIO (CAMPINASSP) PROVA: ANALISTA JUDICIRIO - TECNOLOGIA DA INFORMAO
No contexto de Business Intelligence, os sistemas OLAP e OLTP se diferenciam
em diversas caractersticas. Na tabela abaixo, no que diz respeito s
caractersticas, est INCORRETO:
www.estrategiaconcursos.com.br
36 de 50
A Letra A
B Letra B
C Letra C
D Letra D
E Letra E
Comentrios: Vamos falar um pouco mais sobre OLAP na prxima aula. Mas se
lembrarmos do que vimos at aqui, podemos verificar que o texto presente na
caracterstica foco est trocado. OLAP foca no nvel estratgico da organizao,
enquanto OLTP visa atender as demandas operacionais. Desta forma a
alternativa E encontra-se incorreta. Como a questo pede para marcarmos a
incorreta, temos a nossa resposta.
Gabarito: E
A Data Mining.
B Online Transactional Database.
C Data Mart.
D Datawarehouse.
E Big Data.
Comentrios: Vejam que a questo trata de um gigantesco repositrio de
dados que sabemos que o DW Data warehouse.
Gabarito: D
www.estrategiaconcursos.com.br
37 de 50
13.
ANO: 2010 BANCA: FCC RGO: TCE-SP PROVA: AGENTE DA
FISCALIZAO FINANCEIRA - CONHECIMENTOS BSICOS
Os conceitos de inteligncia empresarial ou organizacional esto intimamente
relacionados com o PETI que considera
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
38 de 50
16712855225
www.estrategiaconcursos.com.br
39 de 50
Questes extras
14.
ANO: 2013 BANCA: FCC RGO: MPE-CE PROVA: ANALISTA
MINISTERIAL - CINCIAS DA COMPUTAO
Em relao ao entendimento do significado do termo Business Intelligence (BI) e
da soluo que prov, a definio que NO coerente com o termo Business
Intelligence a que
A consiste em uma metodologia que fornece objetivos de negcios ligados a
objetivos de TI, provendo mtricas e modelos de maturidade para medir a sua
eficcia e identificando as responsabilidades relacionadas dos donos dos
processos de negcios e de TI.
B se refere aplicao de tcnicas analticas para informaes sobre condies
de negcio no sentido de melhor-las, de uma maneira automatizada, mas com
a interpretao e respostas humanas, de forma a melhorar a tomada de
decises.
C rene recursos que provm a habilidade para que a pessoa certa receba a
informao adequada e no momento correto para tomar a melhor deciso.
D consiste em um sistema de negcios que inclui uma estrutura de busca efetiva
e acessvel, acurada, em tempo real, com informaes e relatrios que permitam
aos lderes das reas de negcio se manterem informados para tomar decises.
E uma soluo fcil de dizer, mas difcil de fazer corretamente pois envolve
mudanas na forma como a organizao conduz uma busca efetiva, bem como,
a necessidade de se possuir uma base de dados de qualidade para que se possa
tomar aes com o objetivo de otimizar a performance corporativa.
Gabarito: A
16712855225
15.
ANO: 2012 BANCA: FCC RGO:
JUDICIRIO - ANALISTA DE SISTEMAS
TST
PROVA:
ANALISTA
www.estrategiaconcursos.com.br
40 de 50
16.
ANO: 2015 BANCA: FCC RGO: TRT - 3 REGIO (MG) PROVA:
TCNICO JUDICIRIO - TECNOLOGIA DA INFORMAO
Um tcnico de TI precisa utilizar um subconjunto de dados de um Data
Warehouse direcionado rea administrativa de um Tribunal. Esses dados sero
armazenados em um banco de dado modelado multidimensionalmente, que ser
criado capturando-se dados diretamente de sistemas transacionais, buscando as
informaes relevantes para os processos de negcio da rea administrativa.
Esse banco de dados ser um
A Big Data.
B Data Mart.
C OLAP.
D MOLAP.
E Data Mining.
Gabarito: B
17.
ANO: 2014 BANCA: FCC RGO: TCE-RS PROVA: AUDITOR
PBLICO EXTERNO - TCNICO EM PROCESSAMENTO DE DADOS
A granularidade de dados uma questo crtica no projeto de um Data
Warehouse (DW), pois afeta o volume de dados que reside no DW e, ao mesmo
tempo, afeta o tipo de consulta que pode ser atendida. Considere:
I. Quanto mais detalhe existir, mais baixo ser o nvel de granularidade. Quanto
menos detalhe existir, mais alto ser o nvel de granularidade.
II. Quando h um nvel de granularidade muito alto, o espao em disco e o
nmero de ndices necessrios se tornam bem menores, mas h uma
correspondente diminuio da possibilidade de utilizao dos dados para atender
a consultas detalhadas.
16712855225
www.estrategiaconcursos.com.br
41 de 50
Gabarito: B
18.
ANO: 2015 BANCA: FCC RGO: CNMP PROVA: ANALISTA DO
CNMP - DESENVOLVIMENTO DE SISTEMAS
Considere que a equipe de Analistas de Desenvolvimento de Sistemas do CNMP
est projetando a arquitetura para o Data Warehouse (DW) da instituio,
conforme mostra a figura abaixo:
www.estrategiaconcursos.com.br
42 de 50
Gabarito: C
19.
ANO: 2015 BANCA: FCC RGO: TCM-GO PROVA: AUDITOR DE
CONTROLE EXTERNO - INFORMTICA
O Serpro relatou assim uma parceria com o Tribunal de Contas da Unio TCU:
O funcionamento do Sntese, simplificadamente, se dar da seguinte forma:
sero realizadas extraes de dados dos sistemas de informaes mantidos por
diversos rgos pblicos; esses dados sofrero transformaes para
compatibilizar codificaes e formatos, realizar classificaes, agrupar registros e
agregar valores; as informaes modificadas alimentaro o repositrio de dados
modelado especificamente para consultas analticas. O acesso ao repositrio ser
realizado pelo usurio final por meio de ferramentas que possuem uma interface
amigvel para elaborar consultas ou relatrios. A apresentao das consultas
pode ser em forma de matriz, grfico, documento de editor de texto ou planilha
eletrnica.
O repositrio de dados e as ferramentas, em destaque no texto, referem-se,
respectivamente, a
A ERP e SQL Server Reporting Service.
B SQL Server Reporting Service e Data Mining.
C Data Warehouse e OLAP.
D SQL Server Reporting Service e Business Intelligence.
E Data Warehouse e SQL Server Reporting Service.
Gabarito:C
16712855225
20.
ANO: 2014 BANCA: FCC RGO:
JUDICIRIO - BANCO DE DADOS - DBA
TJ-AP
PROVA:
ANALISTA
www.estrategiaconcursos.com.br
43 de 50
Gabarito: B
21.
ANO: 2015 BANCA: FCC RGO: TRT - 3 REGIO (MG) PROVA:
TCNICO JUDICIRIO - TECNOLOGIA DA INFORMAO
A modelagem multidimensional utilizada especialmente para sumarizar e
reestruturar dados e apresent-los em vises que suportem a anlise dos
valores desses dados. Um modelo multidimensional formado por dimenses, e
por uma coleo de itens de dados composta de dados de medidas e de
contexto, denominada
A schema.
B pivot.
C slice.
D fato.
E verso.
Gabarito: D
22.
ANO: 2015 BANCA: FCC RGO: TCM-GO PROVA: AUDITOR DE
CONTROLE EXTERNO - INFORMTICA
Quando o modelo de dados multidimensionais comea a ser definido, elementos
bsicos de representao precisam ter sido estabelecidos, de modo a se criar um
padro de modelagem. Considere um modelo em que as dimenses e fatos so
representados em tabelas, podendo haver mltiplas dimenses e mltiplas
tabelas de fatos.
16712855225
www.estrategiaconcursos.com.br
44 de 50
23.
ANO: 2013 BANCA: FCC RGO: MPE-MA PROVA: ANALISTA
JUDICIRIO - BANCO DE DADOS
Considerando um data warehouse, podem ser utilizadas, para sua consulta, as
ferramentas MOLAP (Multidimensional OLAP), cuja caracterstica principal fazer
o acesso a um conjunto de dados previamente calculados, denominado
A matriz de dados.
B lista ligada.
C matriz hash.
D milestone.
E cubo de dados.
Gabarito: E
16712855225
24.
ANO: 2013 BANCA: FCC RGO: MPE-MA PROVA: ANALISTA
JUDICIRIO - BANCO DE DADOS
Na modelagem de um data warehouse, pode ser feito o snowflaking, que
significa
A criptografar as tabelas fato e dimenso.
B normalizar as tabelas dimenso.
C excluir atributos do tipo binrio.
D indexar as tabelas dimenso por todos seus atributos.
E duplicar a tabela fato.
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
45 de 50
25.
ANO: 2013 BANCA: FCC RGO: MPE-MA PROVA: ANALISTA
JUDICIRIO - BANCO DE DADOS
Na modelagem dimensional de um data warehouse voltado para vendas, o tipo
de tabela fato que inclui pares de produtos adquiridos em uma mesma compra
recebe a denominao de
A cesta de mercado.
B tabela de degenerao.
C data mart.
D outrigger.
E pacote de integralizao.
Gabarito: A
26. ANO: 2009 BANCA: FCC RGO: TRT - 15 REGIO (CAMPINASSP) PROVA: ANALISTA JUDICIRIO - TECNOLOGIA DA INFORMAO
No contexto OLAP:
I. As vises materializadas agregadas a partir de uma tabela de fatos podem ser
identificadas exclusivamente pelo nvel de agregao para cada dimenso.
II. Quando aplicada a configurao star schema as tabelas de fatos e as de
dimenso so idnticas quanto totalidade dos atributos que contm e tambm
quanto ao grau de granularidade.
III. O esquema snow flake uma variao do star schema.
Est correto o que consta em
A I, somente.
16712855225
B I e III, somente.
C II e III, somente.
D III, somente.
E I, II e III.
Gabarito B
www.estrategiaconcursos.com.br
46 de 50
TST
PROVA:
ANALISTA
O processo de ETL em uma Data Warehouse possui vrias fases. Em uma destas
fases efetuada a
A extrao dos dados dos sistemas de origem.
B introduo de novos produtos no mercado.
C validao das interfaces de usurio.
D criao de diagramas estticos e comportamentais das classes e atributos.
E definio dos custos e prazos.
Gabarito: A
28.
ANO: 2010 BANCA: FCC RGO: TRT - 22 REGIO (PI) PROVA:
ANALISTA JUDICIRIO - TECNOLOGIA DA INFORMAO
No mbito dos DWs, uma outra concepo do ODS (Staging Area) est sendo
estabelecida por alguns autores. Trata-se de
A OLAP.
B Drill throught.
C ETL.
D Data Mining.
E Dynamic Data Storage.
Gabarito: E
16712855225
29. ANO: 2011 BANCA: FCC RGO: TRT - 14 REGIO (RO E AC)
PROVA: ANALISTA JUDICIRIO - TECNOLOGIA DA INFORMAO
No contexto de DW, uma categoria de ferramentas de anlise denominada
open-end e que permite ao usurio avaliar tendncias e padres no conhecidos
entre os dados. Trata-se de
A slice.
B star schema.
C ODS.
D ETL.
E data mining.
www.estrategiaconcursos.com.br
47 de 50
30.
ANO: 2013 BANCA: FCC RGO: TRT - 15 REGIO (CAMPINASSP) PROVA: ANALISTA JUDICIRIO - TECNOLOGIA DA INFORMAO
Arquitetar e manter processos ETL considerado por muitos uma das tarefas
mais difceis de um projeto de data warehouse. Muitos projetos deste tipo
utilizam ferramentas para manter este processo. ......, por exemplo, prov
recursos de ETL e tira vantagem das capacidades de banco de dados inerentes.
A lacuna acima corretamente preenchida com Oracle
A Warehouse Builder (OWB).
B Loading Data (OLD).
C Data Transformation (ODT).
D Query and Input (OQI).
E Business Intelligence (OBI).
Gabarito: A
31.
ANO: 2012 BANCA: FCC RGO:
JUDICIRIO - ANALISTA DE SISTEMAS
TST
PROVA:
ANALISTA
www.estrategiaconcursos.com.br
48 de 50
16712855225
www.estrategiaconcursos.com.br
49 de 50
Consideraes Finais
Chegamos ao final da nossa aula de business intelligence que tratou dos
aspectos de DW, modelagem e ETL!
Outros assuntos dentro deste tema estaro presentes nas prximas aulas.
At a prxima!
Thiago Cavalcanti
16712855225
www.estrategiaconcursos.com.br
50 de 50