0% acharam este documento útil (0 voto)
54 visualizações48 páginas

Datawarehouse: Léo Matos

O documento descreve conceitos relacionados a data warehouses e modelos dimensionais, incluindo estrela e floco de neve. São apresentadas questões sobre características de ETL, modelagem dimensional e esquemas como estrela.

Enviado por

Mateus rodrigues
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
54 visualizações48 páginas

Datawarehouse: Léo Matos

O documento descreve conceitos relacionados a data warehouses e modelos dimensionais, incluindo estrela e floco de neve. São apresentadas questões sobre características de ETL, modelagem dimensional e esquemas como estrela.

Enviado por

Mateus rodrigues
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 48

DATAWAREHOUSE

LÉO MATOS

Prof. Léo Matos @profleomatos


1. CESGRANRIO LIQUIGÁS
Data Warehouse pode ser conceituado como uma coleção de dados orientada por assuntos,
integrada, assim como

A não variante no tempo e volátil.


B não variante no tempo e não volátil.
C pouco variante no tempo e volátil
D variante no tempo e volátil
E variante no tempo e não volátil

Prof. Léo Matos @profleomatos


2. CESGRANRIO LIQUIGÁS
A tecnologia de datawarehousing tem se tornado uma importante ferramenta para
implementação do conceito de inteligência empresarial (business inteligence), proporcionando
uma integração dos dados empresariais para a realização de análises gerenciais e
estratégicas. Entre as suas características, inclui-se:

A extração de dados de fontes únicas, necessitando de um data mart para cada fonte.
B incapacidade de lidar com múltiplos níveis de tempo devido à sua não volatidade,
requerendo um DW para cada granularidade dessa dimensão.
C orientação por assunto, permitindo o foco em processos de negócio específicos.
D volatilidade, necessitando de atualização a cada transação realizada no BD transacional.
E processo baseado em simples consultas a tabelas específicas, gerando uma
correspondência 1-1 entre as tabelas do DW e do sistema transacional.

Prof. Léo Matos @profleomatos


3. CESGRANRIO PETROBRÁS
Em um ambiente de data warehousing, uma das fases mais importantes é a ETL (Extract,
Transformation and Load), em que se definem as estratégias de conversão, transformação e
consistência dos dados dos sistemas de origem para realizar a carga dos dados no sistema de
data warehouse. Uma característica relacionada a essa fase de ETL é que

A a garantia da consistência dos dados é especialmente necessária nos sistemas que incluem
SGBDs relacionais, pois estes são incapazes de garantir as consistências das transações e as
integridades referenciais.

B sua existência é incompatível com o uso dos sistemas legados, pois sua tecnologia
antiquada impede que estes sejam integrados em um sistema de data warehousing.

C pode ser eliminada, se o próprio SGBD relacional transacional for usado como o banco do
sistema de data warehousing, o que permite obter uma grande economia de recursos.

Prof. Léo Matos @profleomatos


D é necessária para se obter os dados das múltiplas fontes, de forma a transformá-los
nas variáveis que interessam ao processo de decisão.

E visa a garantir que cada registro do data warehouse corresponda a exatamente um


registro do SGBD transacional, para assegurar a correção das variáveis de decisão.

Prof. Léo Matos @profleomatos


4.CESGRANRIO TRANSPETRO
No processo de extração, transformação e carga (ETL), uma característica da data staging
área é a de
A aderir ao barramento de serviços da organização, de forma fisicamente
descentralizada.
B apresentar serviços de consulta e apresentação para usuários finais dos servidores
OLTP.
C armazenar os dados selecionados provenientes das diversas fontes para serem usados
pelo processo.
D criar uma estrutura normalizada em enterprise data warehouses para suportar
aplicações OLAP.
E suportar o processo de engenharia reversa interpretável pelo administrador de banco
de dados

Prof. Léo Matos @profleomatos


5.CESGRANRIO UNIRIO
Seja o modelo dimensional de dados a seguir representado, onde a tabela “Venda” é a
tabela de fatos, e as demais tabelas representam dimensões. Nesse esquema, os
atributos das tabelas foram omitidos. Nesse caso, qual o modelo multidimensional
adotado?

A Estrela, com a aplicação da 3ª forma normal em tabelas de dimensão de primeiro nível,


eleitas por um critério de desempenho.
B Estrela, com uma tabela de fatos central e tabelas de relacionamento ligadas a ela,
mesmo que indiretamente.

Prof. Léo Matos @profleomatos


C Estrela, pela conjugação da dimensão “Tempo” com as demais dimensões, que a
princípio deveriam ser modeladas em separado.
D Floco de neve, especializando tabelas de dimensão por decomposição hierárquica.
E Floco de neve, otimizando o desempenho do acesso aos dados pela decomposição de
dimensões indexadas

Prof. Léo Matos @profleomatos


6. CESGRANRIO LIQUIGÁS
Uma empresa pretende modelar um banco de dados multidimensional para tomada de
decisão na área de vendas. O gerente da área quer poder avaliar os dados históricos de
vendas, por código ou nome de produto, por mês/ano, por loja e por cidade (há várias
lojas em uma mesma cidade; das cidades é registrado apenas o seu nome; é necessário
registrar em que cidade está cada loja). Nesse banco de dados bem projetado, segundo
um esquema estrela, haverá

A apenas uma tabela com atributos, como código do produto, nome do produto,
mês/ano da venda, loja e cidade.
B três tabelas de dimensões (produto, tempo, loja) e uma tabela de fatos (vendas), uma
vez que cidade é atributo da tabela loja.
C três tabelas de dimensões (produto, tempo, loja) e uma tabela de fatos (vendas), uma
vez que cidade é atributo da tabela venda.

Prof. Léo Matos @profleomatos


D quatro tabelas de dimensões (produto, tempo, loja, cidade) e uma tabela de fatos
(vendas).
E quatro tabelas de fatos (produto, tempo, loja, cidade) e uma tabela de dimensões
(vendas).

Prof. Léo Matos @profleomatos


Prof. Léo Matos @profleomatos
7. CESGRANRIO CASA DA MOEDA
Analise a imagem a seguir relacionada a um Data Warehouse.

Prof. Léo Matos @profleomatos


Que tipo de modelo dimensional é apresentado nessa imagem?

a) Normalizado 3FN.
b) Floco de neve.
c) Boyce Codd.
d) Holístico.
e) Estrela.

Prof. Léo Matos @profleomatos


8. CESGRANRIO BNDES
Sejam as seguintes afirmativas sobre Data Warehouses:

I - Uma tabela de dimensão contém metadados relativos a uma ou mais tabelas de fatos.
II - O esquema floco de neve consiste em uma hierarquia de tabelas de fatos que
compartilham uma tabela dimensão.
III - Pivoteamento é uma técnica usada para sumarizar dados ao longo de uma dimensão.
IV - Drill-down é uma operação usada para prover uma visão desagregada dos dados.
Estão corretas APENAS as afirmativas

A I e III
B I e IV
C II e III
D II e IV
E III e IV

Prof. Léo Matos @profleomatos


9. CESGRANRIO PETROBRÁS
Bases de dados de sistemas de informações gerenciais são projetadas, muitas vezes,
em um esquema denominado estrela que:

A é uma arquitetura física que permite definir somente estruturas unidimensionais de


dados.
B é composta por uma tabela central, denominada de dimensão, e várias tabelas
periféricas a ela relacionadas, denominadas fatos.
C apresenta tabelas periféricas que se encontram desnormalizadas.
D faz com que a expansão e a evolução da base de dados necessite de grande
atividade de manutenção.
E é um esquema onde o número de junções realizadas é relativamente maior que o
realizado em bases de dados relacionais convencionais.

Prof. Léo Matos @profleomatos


10. CESGRANRIO PETROBRÁS
Técnicas de modelagem de Data Warehouses diferem das tradicionalmente utilizadas
em sistemas transacionais. Analisando uma dessas abordagens, o modelo
multidimensional estrela, verifica-se que

A possui melhor desempenho, quando comparado ao modelo floco de neve.


B representa hierarquias explicitamente.
C facilita a tarefa de manutenção das dimensões.
D assemelha-se ao modelo de classes conceitual da UML.
E é opcional a sua utilização, sendo substituído pelo diagrama de atividades da UML.

Prof. Léo Matos @profleomatos


11. CESGRANRIO PETROBRÁS
O modelo estrela (star schema) é a denominação comum para um modelo de dados
multidimensional. Nesse tipo de modelo,

A a entidade central é a transação


B as dimensões são um conjunto de fatos
C as dimensões podem ser decompostas em várias medidas, originando o modelo
conhecido como floco de neve (snowflake).
D o relacionamento entre o fato e as dimensões é de um para um, formando um cubo
ou hipercubo.
E cada dimensão é representada por uma tabela.

Prof. Léo Matos @profleomatos


12. CESGRANRIO PETROBRÁS
Um dos esquemas multidimensionais mais comuns é o esquema floco de neve. Nesse
esquema,

A existem apenas tabelas de fatos, sendo que cada tupla representa um fato
registrado.
B existem apenas uma tabela de dimensões e tantas tabelas de fatos quanto as que
foram necessárias para identificar cada uma das dimensões existentes.
C existem uma tabela de fatos e várias tabelas de dimensões, sendo estas últimas
organizadas em hierarquias e normalizadas.
D existem diversas tabelas de fatos e de dimensões, estando todas desnormalizadas
para melhor desempenho.
E não podem existir mais de 3 tabelas de dimensões, pois, se assim fosse, deixaria de
ser esquema floco de neve e passaria a ser esquema estrela.

Prof. Léo Matos @profleomatos


13. CESGRANRIO CASA DA MOEDA
I - A figura apresenta um modelo dimensional
floco-de-neve.
II - O modelo acima é apropriado para escrita e
não para leitura.
III - O modelo dimensional pode ser utilizado
para construção de um data warehouse.

Está(ão) correta(s) APENAS a(s) afirmativa(s)


A I.
B II.
C III.
D I e III.
E II e III.

Prof. Léo Matos @profleomatos


14. CESGRANRIO BANCO DO BRASIL
Ao desenvolver um Data Warehouse para o Banco W, um programador decidiu criar um
modelo conceitual com base no modelo estrela para cada fato analisado. Ao criar a
primeira tabela fato, relativa ao valor e ao prazo de empréstimos, foram identificadas as
seguintes dimensões, com os seus atributos descritos em parênteses: tempo (dia, mês e
ano), agência (estado, cidade, bairro e número da agência), produto (nome do produto e
juros do produto) e cliente (conta e nome do cliente). Segundo as regras e as práticas da
modelagem dimensional, e usando a granularidade mais baixa, que atributos devem
constar da tabela fato?
A fato_id, dia, mes, ano, estado, cidade, bairro, numero_agencia, nome_produto,
juros_mensais_produto, conta_cliente, nome_cliente, valor_emprestimo,
prazo_empréstimo

B fato_id, emprestimo_id, valor_emprestimo, prazo_emprestimo


C fato_id, tempo_id, agencia_id, produto_id, cliente_id, emprestimo_id

Prof. Léo Matos @profleomatos


D fato_id, tempo_id, agencia_id, produto_id, cliente_id, dia, mes, ano, estado, cidade,
bairro, numero_agencia, nome_produto, juros_mensais_produto, conta_cliente,
nome_cliente, valor_emprestimo, prazo_empréstimo

E fato_id, tempo_id, agencia_id, produto_id, cliente_id, valor_emprestimo,


prazo_emprestimo

Prof. Léo Matos @profleomatos


SLOWLY CHANGE DIMENSION (SCD)

TRANSACIONAL DW

Prof. Léo Matos @profleomatos


SLOWLY CHANGE DIMENSION (SCD)

TRANSACIONAL DW

Cód_matrícula Nome Sobrenome Telefone SK Cód_matrícula Nome Sobrenome Telefone


12323 João Silva 61989595958 1 12323 João Silva 61989595958

Prof. Léo Matos @profleomatos


Prof. Léo Matos @profleomatos
SUBTIPO 1

TRANSACIONAL DW

Cód_matrícula Nome Sobrenome Telefone Escola SK Cód_matrícula Nome Sobrenome Telefone Escola
12323 João Silva 61989595958 Católica 1 12323 João Silva 61989595958 Católica

Prof. Léo Matos @profleomatos


SUBTIPO 2

TRANSACIONAL DW

Cód_matrícula Nome Sobrenome Telefone Escola SK Cód_matrícula Nome Sobrenome Telefone Dt Início Dt Fim ativo
12323 João Silva 61989595958 Católica 1 12323 João Silva 61989595958 01/03/2018 02/03/2022 0
2 12323 João Silva 61989595958 01/04/2022 02/03/2099 1

Prof. Léo Matos @profleomatos


•O SCD Tipo 1 é a alteração que não armazena histórico na dimensão, ou seja, não é
feito o versionamento do registro modificado. Trata-se do tipo mais simples, pois não
há nenhum controle específico para a atualização dos dados, havendo apenas a
sobreposição.

•O SCD Tipo 2 é a técnica mais utilizada para atualizações de dimensões. Nesse tipo de
SCD é adicionado um novo registro com as mudanças, preservando sempre os dados
anteriores. Dessa forma, os registros da tabela fato vão apontar para a versão
correspondente nas dimensões de acordo com a data de referência.

Prof. Léo Matos @profleomatos


16.CESGRANRIO LIQUIGÁS
O drill-down (desmembramento) é uma operação que, em um cubo OLAP, permite
visualizar
A apenas dados agregados.
B dados do cubo, mantendo uma das dimensões fixa.
C dados detalhados, até o menor nível de granularidade da tabela de fatos.
D dados detalhados, além do menor nível de granularidade da tabela de fatos.
Eum subconjunto do cubo com mais de uma dimensão fixa.

Prof. Léo Matos @profleomatos


17.CESGRANRIO BANCO DO BRASIL
Um desenvolvedor precisava construir um modelo estrela para produzir um data
warehouse sobre as transferências eletrônicas disponíveis (TED) feitas pelos correntistas
do banco. Que tabelas seriam adequadas para representar as dimensões desse modelo?

A data, correntista, valor, banco destino


B data, correntista, valor, cpf destino
C correntista, valor, banco destino, cpf destino
D data, valor, banco destino, cpf destino
E data, correntista, banco destino, cpf destino

Prof. Léo Matos @profleomatos


18.CESGRANRIO BANCO DA AMAZÔNIA
O departamento de vendas de uma empresa possui informações sobre as vendas de
seus produtos em todos os municípios brasileiros. Essas informações foram
apresentadas, na forma de uma tabela de produtos x municípios, ao diretor de
operações. No entanto, a tabela ficou enorme e dificultaria o processo de tomada de
decisão. O diretor, então, solicitou que o departamento usasse os recursos das
ferramentas OLAP e reapresentasse as informações na forma de uma tabela de estados
x produtos. Quais operações OLAP a serem realizadas sobre a tabela inicial atenderão a
essa solicitação do diretor de operações?

A slice e roll-up
B roll-up e drill-down
C roll-up e rotation (pivot)
D rotation (pivot) e drill-down
E drill-down e slice

Prof. Léo Matos @profleomatos


19.CESGRANRIO LIQUIGÁS
Em um banco de dados multidimensional, os fatos aditivos
A não podem ser somados em nenhuma dimensão.
B podem ser somados apenas para um nível superior de uma dimensão, caso haja
hierarquia na dimensão.
C podem ser somados em apenas algumas dimensões.
D podem ser somados em todas as dimensões.
E só não podem ser somados na dimensão temporal..

Prof. Léo Matos @profleomatos


20.CESGRANRIO BANCO DO BRASIL
Considere as Tabelas abaixo.

O funcionário responsável pelo controle do


material de expediente de determinada agência
preparou a Tabela T com o registro do consumo
de alguns itens mais relevantes e apresentou-a ao
seu chefe. Esse, então, solicitou que o funcionário
montasse mais duas tabelas com formas
diferentes de apresentação desses dados. Dadas
as instruções para a realização da tarefa, o
resultado foi consolidado nas Tabelas X e Y.

Prof. Léo Matos @profleomatos


Considerando-se o conceito de OLAP, quais foram as operações realizadas de T para X e
de T para Y, respectivamente?

A Drill Down e Roll-Up


B Drill Down e Rotation
C Slice e Roll-Up
D Roll-Up e Drill Down
E Roll-Up e Rotation

Prof. Léo Matos @profleomatos


21. CESGRANRIO LIQUIGÁS
Em uma empresa, é comum haver vários sistemas de informações e aplicações, para
apoiar o seu funcionamento. Nesse contexto, os bancos de dados de sistemas

A OLAP seguem o modelo multidimensional.


B OLAP seguem o modelo relacional.
C OLTP são orientados por assunto.
D OLTP são concebidos apenas para consulta.
E OLTP têm por objetivo o apoio à decisão.

Prof. Léo Matos @profleomatos


22.CESGRANRIO TRANSPETRO
Um gestor acessa o servidor OLAP de sua organização, com o objetivo de analisar os
resultados anuais de seu desempenho. Após realizar uma consulta, ele pôde observar, a
cada ano, o rendimento médio de suas unidades de produção por região brasileira e por
produto produzido. Todavia, julgou, em um determinado momento, que sua decisão
precisava de um novo enfoque e mudou a estrutura da análise, observando o mesmo
rendimento médio anual por produto e por estado da federação.
Quais as duas operações OLAP ele realizou?

A drill across e dicing


B pivoting e drill down
C roll down e drill through
D roll up e slicing
E slicing e dicing

Prof. Léo Matos @profleomatos


23.CESGRANRIO TRANSPETRO
A tomada de decisão nas organizações pode ser suportada por um conjunto de ferramentas
computacionais que refinarão as análises e darão mais segurança aos seus clientes gestores. Uma
dessas ferramentas é o uso de bases de dados dimensionais, os armazéns de dados, ou data
warehouses. Uma das características inerentes a esse repositório de dados é verificada por

A diferenciar-se na estrutura de construção dos data marts, esses últimos construídos durante o
processo de data mining.
B permitir operações de manutenção similares às bases transacionais, com operações de alteração
e remoção de registros específicos.
C possibilitar a sua construção a partir de fontes de dados tanto internas quanto externas à
organização.
D possuir características atemporais, pelo caráter consolidador de suas estruturas de dados.
E ser direcionada a aplicações, com foco nos processos de negócio organizacionais.

Prof. Léo Matos @profleomatos


24.CESGRANRIO LIQUIGÁS
Um banco de dados multidimensional em uma empresa
A é semelhante a um banco de dados relacional, exceto por não possuir FKs (chaves
estrangeiras).
B é semelhante a um banco de dados relacional onde cada tabela tem uma coluna
adicional para representar a dimensão temporal.
C alimenta com seus dados os bancos de dados transacionais necessários para o
negócio.
D permite apenas consultas predefinidas aos dados armazenados.
E tem seus dados oriundos de bancos de dados transacionais.

Prof. Léo Matos @profleomatos


25. CESGRANRIO CMB
Um executivo de uma empresa brasileira, com atuação em todo território nacional, está
observando, em um sistema de apoio à decisão, as vendas de 2011 por estado.
Considerando-se que a dimensão Localidade está modelada na hierarquia (Região, Estado,
Município), que operação o executivo deve realizar para expandir os detalhes da venda na
localidade, apresentando os municípios das vendas?

A drill up
B drill down
C roll pivot
D drill and cross
E roll and cross

Prof. Léo Matos @profleomatos


26. CESGRANRIO PETROBRAS
Analisando-se esse resultado, infere-se que a
operação realizada foi
A concentrate
B drill down
C roll up
D rotation
E slice and dice

Prof. Léo Matos @profleomatos


27. CESGRANRIO PETROBRAS
Em produtos ROLAP, os cubos são alimentados
A por uma base de cláusulas e regras de negócio
B por um banco de dados relacional especialmente desenhado para o processamento
analítico
C por uma cópia dos dados carregada em uma matriz de armazenamento otimizada
D pelo cruzamento instantâneo de dados em bancos hierárquicos
E pelo mesmo banco de dados relacional desenhado para um sistema OLTP

Prof. Léo Matos @profleomatos


28. CESGRANRIO BANCO DO BRASIL
Uma empresa precisa implementar um sistema Big Data para controlar a movimentação
dos produtos que a empresa oferece. Esse sistema precisa estar com a configuração de
dados como sendo um fato, que seria um evento de ocorrência, como, por exemplo: as
compras de um determinado insumo, em um determinado fornecedor e em um
determinado instante. Para tal finalidade, esse sistema a ser implementado deverá estar
organizado segundo a configuração de
A Cubo de dados
B Tuplas estáticas
C Matriz de ocorrência
D Documentos lineares
E Subconjunto de atributos

Prof. Léo Matos @profleomatos


29. CESGRANRIO LIQUIGÁS
Que tipo de aplicação OLAP combina a tecnologia de banco de dados relacionais com a de
banco de dados multidimensionais?

A ROLAP
B MOLAP
C DOLAP
D HOLAP
E WOLAP

Prof. Léo Matos @profleomatos


30. CESGRANRIO PETROBRÁS
Um sistema de data warehouse pode oferecer melhor suporte ao processo decisório se for
integrado a ferramentas de análise do tipo OLAP. Relacione as variações destas ferramentas
de análise, apresentadas na coluna da esquerda, com as suas respectivas características,
indicadas na coluna da direita.

Ferramenta

I - MOLAP
II - ROLAP
III - DOLAP

Prof. Léo Matos @profleomatos


Estão corretas as associações
A I – W, II – X , III – Z.
B I – W, II – Y , III – X.
C I – X , II – W , III – Y.
D I – Y , II – Z , III – X.
E I – Y , II – W , III – Z.

Prof. Léo Matos @profleomatos


31. CESGRANRIO LIQUIGÁS
Uma consulta forma um cubo de dados que consiste nos dados de vendas anuais de duas
famílias de produtos de uma região. Com base nesse cubo de dados, se pretende obter outro
que tenha os dados de vendas mensais de apenas uma das famílias de produto por estado da
região original. As operações necessárias são:

A “Slice and dice”, “roll up” e “drill down”


B “Slice and dice”, “time down” e “drill down”
C “Slice and dice” e dois “drill down”
D “Drill across” e dois “drill down”
E “Drill across”, “time down” e “drill down”

Prof. Léo Matos @profleomatos


32. CESGRANRIO LIQUIGÁS
Considere o sistema de datawarehouse para responder à questão.
Definições do sistema datawarehouse:

• tempo (hierarquia dada por semana, mês e ano)


• item (hierarquia dada por produto, família de produtos, marca)
• local (hierarquia dada por loja, cidade, estado, região)

Sejam as seguintes consultas OLAP pedidas pelo cliente:

I - Vendas semestrais de dois tipos de produtos específicos por região


II - Vendas diárias de uma marca em uma cidade
III - Vendas mensais por família de produtos por bairro
IV - Vendas trimestrais por família de produtos de duas regiões diferentes

Prof. Léo Matos @profleomatos


De acordo com a hierarquia definida no sistema, são possíveis APENAS as consultas
pedidas em

A I e II
B I e IV
C II e IV
D III e IV
E I, III e IV

Prof. Léo Matos @profleomatos


DATAWAREHOUSE
LÉO MATOS

Prof. Léo Matos @profleomatos

Você também pode gostar

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy