quinta-feira, 5 de junho de 2008

[sisII] - EQUIPE DE ORGANIZAÇÃO DE DADOS E INFORMAÇÕES

3) Faça uma postagem falando sobre as diferenças entre Data Warehouse,Data Marts e Data Mining.

Data Mining ou Mineração de Dados consiste em um processo analítico projetado para explorar grandes quantidades de dados na busca de padrões consistentes e/ou relacionamentos sistemáticos entre variáveis e, então, validá-los aplicando os padrões detectados a novos subconjuntos de dados. O processo consiste basicamente em 3 etapas: exploração; construção de modelo ou definição do padrão; e validação/verificação. É parte de um processo maior de conhecimento denominado Knowledge Discovery in Database (KDD). KDD consiste, fundamentalmente, na estruturação do banco de dados; na seleção, preparação e pré-processamento dos dados; na transformação, adequação e redução da dimensionalidade dos dados; no processo de Data Mining; e nas análises, assimilações, interpretações e uso do conhecimento extraído do banco de dados, através do processo de Data Mining.
Um data warehouse (ou armazém de dados) é um sistema de computação utilizado para armazenar informação relativa às atividades de uma organização em banco de dados, de forma consolidada. O desenho da base de dados favorece os relatórios e análise de grandes volumes de dados e obtenção de informações estratégicas que podem facilitar a tomada de decisão. O data warehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transacionais. Por definição, os dados em um data warehouse não são voláteis, ou seja, eles não mudam, salvo quando é necessário fazer correções de dados previamente carregados. Os dados então são somente para leitura e não podem ser alterados.
Data mart é sub-conjunto de dados de um Data Warehouse. Geralmente são dados referentes a um assunto em especial (ex: Vendas, Stock, Controladoria) ou diferentes níveis de sumarização (ex: Vendas Anual), que focalizam uma ou mais áreas específicas. Essa visão tem defesa menos técnica e mais intuitiva do que sua contra-parte: o Data mart é criado a posterioridade do Data Warehouse, pois ele seria montado com dados extraídos do Data Warehouse para atender especificamente um setor da organização.
Numa visão comparativa dos dados, onde consideramos os quesitos escopo, integração, tempo, agregação, análise e dados voláteis, percebemos que a diferença está no escopo, pois enquanto o Data Warehouse é feito para atender uma empresa como um todo, o data mart é criado para atender um sub-conjunto da empresa. Repare que atender um sub-conjunto da empresa pode significar reunir dados de outros setores, já que, na prática, raramente um único setor possui ou gera toda informação que precisa. Não se pode dizer que um Data Warehouse é um conjunto de Data marts.

by Elin, Valéria e Julita

Nenhum comentário: