Synthèse d'Informatique consacrée aux entrepôts de données.
[...] La performance : les chemins d'accès à la base de donnés sont prévisibles. Schéma en Flocon : La modélisation en flocon est une modélisation en étoile pour laquelle on éclate les tables de dimensions en sous tables selon la hiérarchie de cette dimension. L'avantage de cette modélisation est de formaliser une hiérarchie au sein d'une dimension. Par contre, la modélisation en Flocon induit une dé normalisation des dimensions générant une plus grande complexité en terme de lisibilité et de gestion. [...]
[...] En ce sens, il joue un rôle d'intégration au niveau des données. VII Système d'alimentation / ETL : Le système d'alimentation a pour but de transformer les données primaires (par exemple issues des systèmes de production) en informations stockées dans le Data Warehouse. Pour cela il est nécessaire de réaliser les fonctions suivantes : L'Extraction des données : Elle consiste à collecter les données utiles dans le système de production. Pour rafraîchir la base décisionnelle, il faut identifier les données ayant évoluer afin d'extraire le minimum de données, puis planifier ces extractions afin d'éviter les saturations du système de production. [...]
[...] Les attributs des dimensions : avec des descriptions complètes. A ce stade, la conception de la structure logique est terminée, et les autres étapes concernent la structure physique : Comment suivre les dimensions à évolution lente : la dimension client change constamment, car les humains changent de nom, se marient et divorcent et change d'adresse, et dans une compagnie d'assurances il est essentiel de savoir le statut de la personne assurée à l'époque d'un sinistre passé et non le statut actuel. [...]
[...] Données intégrées Les données alimentant l'entrepôt de données proviennent de multiples sources hétérogènes. Avant d'être intégrées dans le Data Warehouse, elles doivent être converties, reformatées et nettoyées. L'intégration de ces données consiste à contenir leurs hétérogénéités, afin de donner au contenu de l'entrepôt de données une présentation homogène et pour garantir sa qualité. Avant d'être incorporées dans l'entrepôt de données, les données subissent un processus de transformation et d'unification afin d'en avoir un état cohérent. Par exemple, la consolidation de l'ensemble des informations concernant un client est nécessaire pour donner une vue homogène de ce client. [...]
[...] Dans le cadre du Data Warehouse, la modélisation entité relation n'est pas appropriée, car elle est souvent utilisée pour créer un modèle complexe regroupant tous les processus de l'entreprise. C'est pourquoi la modélisation dimensionnelle a fait son apparition. Elle permet de créer des modèles individuels pour traiter des sujets de gestion discontinue. V Modélisation multidimensionnelle : Les données à analyser au niveau d'un magasin doivent refléter la vision d'une classe d'analystes Cette vision correspond à une structuration des données selon plusieurs dimensions pouvant représenter des notions variées telles que le temps et la localisation géographique. On parle alors de modélisation et de traitement multidimensionnels des données. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture