Mostrando postagens com marcador Business Intelligence (BI). Mostrar todas as postagens
Mostrando postagens com marcador Business Intelligence (BI). Mostrar todas as postagens

quinta-feira, 28 de julho de 2022

5. Pentaho OverviewO - Conceito e definição


Pentaho Overview é uma suíte completa de Business Intelligence (BI), que inclui recursos de geração de relatórios, integração e armazenamento de dados (data warehousing), ETL, análise de informações (OLAP), painéis (dashboards) para controle gerencial e mineração de dados (Data Mining), constituindo a mais popular e poderosa suíte de BI do mundo Open Source. 

Criado em 2004, o Pentaho é um software open source desenvolvido em Java e propriedade da Hitachi Vantara. Ele possui aplicações voltadas para estratégias de análise de dados e business intelligence e duas versões: Enterprise e Community (gratuita). Por conta do código aberto, configura uma das mais populares ferramentas de seu segmento, capaz de analisar precisamente um grande volume de informações com a velocidade e assertividade necessárias.

segunda-feira, 25 de julho de 2022

O que é Linguagem R ?

 

É uma linguagem e ambiente para computação estatística e gráficos. É um projeto GNU que é semelhante ao idioma e ao ambiente S desenvolvido na Bell Laboratories (anteriormente AT&T, agora Lucent Technologies) por John Chambers e colegas. R pode ser considerado uma implementação diferente de S.

Existem algumas diferenças importantes, mas muito código escrito para que S seja executado inalterado sob R. Ele fornece uma grande variedade de estatísticas (modelagem linear e não-linear, testes estatísticos clássicos, análise de séries temporais, classificação, agrupamento,…) e técnicas gráficas e é altamente extensível.

A linguagem S é muitas vezes o veículo de escolha para a pesquisa metodológica estatística, e R fornece uma rota de código aberto para participar dessa atividade.

Um dos pontos fortes da Linguagem R é a facilidade com que se podem produzir parcelas de qualidade de publicação bem concebidas, incluindo símbolos matemáticos e fórmulas, quando necessário. Grande cuidado foi assumido sobre os padrões para as escolhas menores do desenho em gráficos, mas o usuário mantém o controle total.

terça-feira, 14 de junho de 2022

Estrutura de tabelas Dimensões e Fatos - Business Intelligence


Como se sabe, o sistema de Business Intelligence (BI) reúne diversas tecnologias que auxiliam o desenvolvimento e a disponibilização da solução de BI para organização. Uma das mais importantes é a tecnologia de Data Warehouse (DW).

O DW é uma base de dados utilizada para armazenar informações relacionadas à organização. Seu design permite a análise de grandes volumes de dados coletados dos mais diversos sistemas de informações da empresa. Os dados do DW são históricos e não voláteis.

A tecnologia de DW possui uma arquitetura dimensional (multidimensional) com vários componentes. As Dimensões e Fatos são alguns dos elementos presentes na estrutura e que permitem o armazenamento dos dados, desempenho e intuitividade nas análises das informações gerenciais do DW.

Os dados oriundos dos mais diversos sistemas informacionais passam a ser armazenados, após a fase de extração e tratamento, na estrutura de tabelas de Dimensões e Fatos no modelo dimensional.

segunda-feira, 13 de junho de 2022

Modelagem Multidimensional

O Data Warehouse (DW) é uma tecnologia que pode ser implementada em sistemas de banco de dados tradicionais e é atualmente o grande alicerce da solução de Business Intelligence (BI). Mas, para a adequada estruturação e desempenho, o DW deverá ser modelado seguindo os preceitos da modelagem multidimensional.

A modelagem multidimensional, ou dimensional como às vezes é chamada, é a técnica de modelagem de banco de dados para o auxílio às consultas do Data Warehouse nas mais diferentes perspectivas.

A visão multidimensional permite o uso mais intuitivo para o processamento analítico pelas ferramentas OLAP (On-line Analytical Processing).

O OLAP possui um conjunto de técnicas para o tratamento dos dados contidos na visão multidimensional do Data Warehouse. As ferramentas OLAP podem ser de diferentes tipos: MOLAP, ROLAP ou HOLAP.

Análise Multidimensional - Conceito


Consideramos que Análise Multidimensional é uma forma representativa do cruzamento de informações. Dimensão é uma unidade de análise, representa um Eixo Principal no Estudo dos Dados (Exemplo de dimensões numa Empresa: Produto, Tempo, Região). Uma Dimensão pode possuir níveis hierárquicos. (Exemplo: A dimensão Região divide-se em Estados, que por sua vez divide-se em cidades ou em áreas de atuação, etc.).

OLAP (online analytical processing) é a análise multidimensional dos dados de negócios em diferentes dimensões, tendo uma capacidade para cálculos complexos, análise de tendências e modelagem de dados sofisticada.

Visão é o Cruzamento entre uma ou mais dimensões. (Exemplo: Estudo de um Produto ao longo do Tempo para uma determinada Região). Para melhor compreensão, tal análise é sempre associada a um Cubo, onde as arestas representam as Dimensões e cada célula representa um Indicador resultado de uma determinada Visão.

Por questões de performance, alguns Data Marts são construídos no formato Multidimensional, ou seja, pré-consolidando todas as células resultantes das visões.

Data Warehousing (DW)

Data Warehousing (Armazem de Dados) é um sistema de computação utilizado para armazenar informações relativas às atividades de uma organização em bancos de dados. O desenho da base de dados favorece os relatórios, a análise de dados e a obtenção de informações estratégicas que podem facilitar a tomada de decisão.

O Data Warehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transacionais (OLTP). São as chamadas séries históricas que possibilitam uma melhor análise de eventos passados, oferecendo suporte às tomadas de decisões presentes e a previsão de eventos futuros. Por definição, os dados em um DW não são voláteis, ou seja, eles não mudam, salvo quando é necessário fazer correções de dados previamente carregados. Os dados estão disponíveis somente para leitura e não podem ser alterados.

A ferramenta mais popular para exploração dos dados é a Online Analytical Processing (OLAP) ou Processo Analítico em Tempo Real, mas muitas outras podem ser usadas.

Os primeiros DWs surgiram como conceito acadêmico na década de 80.