terça-feira, 14 de junho de 2022

Estrutura de tabelas Dimensões e Fatos - Business Intelligence


Como se sabe, o sistema de Business Intelligence (BI) reúne diversas tecnologias que auxiliam o desenvolvimento e a disponibilização da solução de BI para organização. Uma das mais importantes é a tecnologia de Data Warehouse (DW).

O DW é uma base de dados utilizada para armazenar informações relacionadas à organização. Seu design permite a análise de grandes volumes de dados coletados dos mais diversos sistemas de informações da empresa. Os dados do DW são históricos e não voláteis.

A tecnologia de DW possui uma arquitetura dimensional (multidimensional) com vários componentes. As Dimensões e Fatos são alguns dos elementos presentes na estrutura e que permitem o armazenamento dos dados, desempenho e intuitividade nas análises das informações gerenciais do DW.

Os dados oriundos dos mais diversos sistemas informacionais passam a ser armazenados, após a fase de extração e tratamento, na estrutura de tabelas de Dimensões e Fatos no modelo dimensional.


A Dimensão possui característica descritiva dentro do DW. Ela qualifica as informações provenientes da tabela Fato. Através dela é possível analisar os dados sob múltiplas perspectivas. Por exemplo, podemos ter Dimensões como Produto, Região e Tempo em um DW.

A Fato possui característica quantitativa dentro do DW. A partir dela são extraídas as métricas que são cruzadas com os dados das Dimensões, concebendo, assim, informações significativas para a análise do usuário. A Fato armazena as medições necessárias para avaliar o assunto pretendido. O conteúdo histórico no DW, contendo longo período de tempo, ficam depositadas na Fato.

A estrutura dimensional normalmente é desenhada no formado do esquema estrela (star schema). Nesse modelo, as tabelas de Dimensões são ligadas diretamente a tabela Fato. Outra característica marcante é que os dados são desnormalizados, pois a redundância resultante gera benefícios para a otimização das consultas e navegação das informações.

As Dimensões e Fatos são componentes complementares e dependentes entre si. Em um modelo dimensional é obrigatório a existência de ambos. Sem um desses elementos, a compreensão e análise das informações ficam comprometidas no modelo dimensional, ou até mesmo inviabilizadas.

Portanto, na estrutura multidimensional é possível cruzar as informações dos dados centrais (métricas) com os dados periféricos (descritivos), permitindo assim a análise das informações nas mais diferentes visões, adequando-se de acordo com a necessidade do usuário na utilização de um sistema de BI.

Resumindo:

Tabela fato é a tabela no Power BI com uma quantidade enorme de linhas, e que representa os fatos de uma empresa, que podem se repetir ou não.

Tabela dimensão é a tabela que vai auxiliar a tabela fato com dados complementares ou explicativos, e que possui informações que não se repetem.

Na tabela fato de uma farmácia, por exemplo, os remédios vendidos são listados de acordo com a data. Já a Tabela Dimensão, armazena as informações de um único item, ou seja, as informações referentes a cada produto e por tanto não podem se repetir.

As tabelas fatos são aquelas onde o usuário realmente interage. São nelas, por exemplo, que você cadastra suas vendas, ou seja, as tabelas fatos são onde as coisas realmente acontecem, nelas listamos todas as ações.

Na modelagem dimensional, a chave primária da tabela-fato é composta pelas chaves primárias das tabelas-dimensão que estão ligadas diretamente a esse fato. Além disso, toda tabela-fato deve ter uma dimensão tempo associada a ela.

A chave primária, ou primary key, é o conceito mais básico relacionado à organização em um banco de dados. Toda tabela possuirá uma, e somente uma, chave primária. Essa chave é utilizada como identificador único da tabela, sendo representada por aquele campo (ou campos) que não receberá valores repetidos.

Degenerate Dimension (dimensão degenerada) É uma dimensão que é derivada da Tabela Fato e não tem sua própria Tabela de Dimensão.

Granularidade

Trata-se do menor nível da informação e é definido de acordo com as necessidades levantadas no início do projeto. Quanto maior for a granularidade, menor será o detalhe (ou maior será a sumarização).

Quanto menor for a granularidade, maior será o detalhamento (ou menor será a sumarização).