Introdução

Com a evolução da tecnologia de informação e o crescimento do uso de computadores interconectados, praticamente todas as empresas de médio e grande porte estão utilizando sistemas informatizados para realizar seus processos mais importantes, o que com o passar do tempo acaba gerando uma enorme quantidade de dados relacionados aos negócios, mas não relacionados entre si. Estes dados armazenados em um ou mais sistemas operacionais de uma empresa são um recurso, mas de modo geral, raramente servem como recurso estratégico no seu estado original. Os sistemas convencionais de informática não são projetados para gerar e armazenar as informações estratégicas, o que torna os dados vagos e sem valor para o apoio ao processo de tomada de decisões das organizações. Estas decisões normalmente são tomadas com base na experiência dos administradores, quando poderiam também ser baseadas em fatos históricos que foram armazenados pelos diversos sistemas de informação utilizados pelas organizações.

Em termos simples, um Data Warehouse, ou em português, Armazém de Dados, pode ser definido como um banco de dados especializado, o qual integra e gerencia o fluxo de informações a partir dos bancos de dados corporativos e fontes de dados externas à empresa. Um Data Warehouse é construído para que tais dados possam ser armazenados e acessados de forma que não sejam limitados por tabelas e linhas estritamente relacionais. A função do Data Warehouse (DW) é tornar as informações corporativas acessíveis para o seu entendimento, gerenciamento e uso. Como o DW está separado dos bancos de dados operacionais, as consultas dos usuários não impactam nestes sistemas, que ficam resguardados de alterações indevidas ou perdas de dados. O DW não é como um software, que pode ser comprado e instalado em todos os computadores da empresa em algumas horas, na realidade sua implantação exige a integração de vários produtos e processos.

Um DW oferece os fundamentos e os recursos necessários para um Sistema de Apoio a Decisão (SAD) eficiente, fornecendo dados integrados e históricos que servem desde a alta direção, que necessita de informações mais resumidas, até as gerências de baixo nível, onde os dados detalhados ajudam a observar aspectos mais táticos da empresa. Nele, os executivos podem obter de modo imediato respostas para perguntas que normalmente não possuem respostas em seus sistemas operacionais e, com isso, tomar decisões com base em fatos, não com intuições ou especulações.

Com o surgimento do DW são necessários novos métodos de estruturação de dados e novas tecnologias, tanto para armazenamento, como para recuperação de informações. A necessidade destes novos métodos e tecnologias, surgiu da constatação, primeiro de que existe uma necessidade de informação não atendida pelos aplicativos comerciais convencionais, que atuam a nível operacional do negócio, e segundo, pelo fato de que a tecnologia de armazenamento de dados utilizada nestes aplicativos não atende às necessidades detectadas. Graças aos avanços nos bancos de dados relacionais, no processamento paralelo e na tecnologia distribuída, finalmente a tecnologia da informação pode permitir que qualquer organização elabore um Data Warehouse.

Como as empresas demoram vários anos para gerar e armazenar um volume considerável de informações, é normal que estes dados estejam espalhados por diversos locais e que tenham sido gerados por sistemas desenvolvidos em diferentes ambientes e linguagens. Um dos desafios da implantação de um DW é justamente a integração destes dados, eliminando as redundâncias e identificando informações iguais que possam estar representadas sob formatos diferentes em sistemas distintos.

Estudar e conhecer a tecnologia de DW pode ajudar os empresários a descobrir novas formas de competir em uma economia globalizada, trazendo melhores produtos ou serviços para o mercado, mais rápido do que os concorrentes, sem aumentar o custo do produto ou do serviço. Não existem ainda metodologias formais para implementação de um DW, ela deve ser adaptada às características e às expectativas de cada empresa, mas o principal objetivo em todas elas é o de descobrir maneiras diferentes de atuar no mercado e quais as mudanças internas que devem ocorrer para atender as novas realidades.

Este trabalho têm como objetivo fazer um estudo dos principais conceitos necessários para o desenvolvimento de um ambiente de DW. No capítulos 2 são apresentados alguns conceitos encontrados na literatura sobre o termo Data Warehouse. No capítulo 3 são apresentadas as principais características dos dados que serão mantidos em um DW. O capítulo 4 apresenta uma arquitetura genérica para um ambiente de suporte a tomada de decisões com o uso de Data Warehouse; além dessa são apresentadas algumas propostas simplificadas de arquiteturas e os principais componentes de software que um Data Warehouse deve possuir.

Uma questão muito importante no planejamento e desenvolvimento de um Data Warehouse é a definição dos diversos modelos de dados que darão suporte e orientação ao trabalho do ambiente do DW. No capítulo 5, são descritas duas metodologias de modelagem de dados para Data Warehouse conforme R.Kimball [KIM96] e W.H.Inmon [INM93], ambas apresentam três níveis de modelagem para os dados: alto nível (empresarial); intermediário (dimensional); e baixo nível (físico).

Depois de definir-se os modelos de dados do DW, deve-se definir algumas estratégias que orientarão o desenvolvimento do DW, estas orientações são apresentadas no capítulo 6. Após, pode-se efetivamente utilizar as ferramentas de DW, as quais podem ser divididas em dois grupos ferramentas de povoação (aquelas que extraem dados dos sistemas operacionais da empresa) e ferramentas de consulta (aquelas que realizam consultas sobre o DW. Os capítulos 7 e 8 tratam respectivamente da povoação e da extração dos dados que farão parte do DW.

No capítulo 9 são apresentadas algumas vantagens e desvantagens da utilização de um DW em uma organização. Por fim, no capítulo 10 são apresentadas algumas conclusões e sugestões de trabalhos futuros.

Página Inicial | Índice | Introdução | Conceitos | Características | Arquitetura do Data Warehouse
Modelo de Dados | Desenvolvimento do Data Warehouse | Povoando um Data Warehouse
Extração de Informações do Data Warehouse | Análise do Uso da Tecnologia Data Warehouse | Conclusão | Bibliografia

 

Adriano Dal'Alba