Les systémes ETL

Par: manfouo steve

cet article introduit la notion de systéme ETL (Extract transform Load) utilisée en BI pour alimenter les entrepôts de données. presente aussi les caractéristiques des systèmes présents sur le marché ainsi que quelques spécificités.

I- Principes

Pour continuer dans la série de publications propres au monde du décisionnel, nous allons parler des ETL (extract transform load).
L’approche décisionnelle comme nous l'avons présenter dans l'article intitulé (Système d'Informations Décisionnels), est basée sur le principe qu'un ensemble de données disparates issues des bases de productions chacune liée à un métier intègrent le processus de décision de l'entreprise. L'idée étant de construire un magasin de données (Datawarehouse) assez général sur lequel les experts du domaine pourront avoir toutes les informations voulues.
Ainsi donc, pour l’alimenter cet entrepôt, on utilise une gamme ou multitude d'outils connus sous le nom de ETL (" Extract, Transform, Load "). Comme son nom l'indique, ces outils permettent d'extraire des données à partir de différentes sources, d'y effectuer des transformations (formatage, fusion, filtrages, etc.), et de les charger dans une nouvelle base cible connue sous le nom d'entrepôt ou datawarehouse.
Entre autre, un ETL permet :

- d'éviter la réalisation des traitements récurrents
- d'effectuer le mapping (correspondance entre attributs) des données issues de différentes sources de données homogènes

II- Outils ETL

On distingue une liste assez importante d'outils realisant les fonctions ETL.

" Pentaho bussiness suite
" Ascential DataStage (qui a acheté Mercator Inside Integrator)
" BusinessObjects Data Integrator
" Cognos DecisionStream ( Data Manager)
" ETI (Evolutionary Technologies International)
" Talend open studio
" IBM DB2 Data Warehouse Manager
" Informatica (PowerCenter et SuperGlue)
" Microsoft SQL Server DTS
" Oracle Warehouse Builder


III- L'ETL Vs l'ELT

Ces deux notations, bien que similaires du point de vue des termes qui les composent à savoir (extraction, transformation et chargement (Load)) sont en fait deux modes complètement différents de fonctionnement.
On parlera d'ETL lorsque chaque serveur distinct se voit installé un moteur ou engine. C'est ce dernier qui réalise toute l'activité de l'ETL à savoir les transformations et filtrages sur les données qu'il a extraites des sources. Une fois cela réalisé, il les charge dans une cible qui lui à été indiqué (notons bien que les données chargées sont préalablement traitées et filtrées par le moteur ETL).
On parlera d'ELT dans la mesure où un code sql est généré et ce dernier est natif à chaque moteur de base de données impliqué dans le processus source et cible.Ici, les fonctionnalités propres à chaque base de données sont exploitées pour effectuer et optimiser la réalisation des transformations sur les données qui lui sont fournies par le moteur ELT. Cela implique un certain nombre de préréquis à savoir les requêtes de transformation doivent respecter la syntaxe spécifique au SGBD en question. (Notons que ici le moteur extrait et charge (load) mais laisse le soin au SGBD cible d'effectuer les transformations).
Il est cependant possible de coupler les deux approches pour tirer partie des deux avantages.


IV- catégories d'ETL

Actuellement trois catégories d'outils ETL existent

a- Engine-based : les transformations sont exécutées sur un serveur ETL, disposant en général d'un référentiel. Ce genre de d'outil dispose d'un moteur de transformation ;
b- Database-embedded : les transformations sont intégrées dans la BD ;
c- Code-generators : les transformations sont conçues et un code est généré. Ce code est déployabe indépendamment de la base de données.

V- Avantages des suites ETL

Nous ne citerons ici que quelques uns:

- Production automatique par le référentiel de l'ETL des rapports de mise en correspondance de données et d'analyse des dépendances
- Très bonne performance des outils ETL surtout lorsqu'il s'agit de masses importantes de données.
- Gestion le cas échéant des scénarios d'équilibre de charge entre serveurs par les ETL
- Développement simple, moins coûteux etc...

VI- Conclusion

Cet article présente le principe ETL dans l'architecture du décisionnel. L'on présente à quel niveau le moteur ETL intervient et la portée de son action en occurrence selon le type d'ETL. Enfin les avantages et la comparaison ETL/ELT permettent aux futurs utilisateurs de cette technologie de bien s'en tirer déjà dans le choix mais aussi dans l'architecture à mettre sur pied.

manfouo steve consultant en Informatique - yaoundé CMR

Source : Contenu Gratuit / Internet Business





Nbre Lectures : 3535     Nbre Mots Appx. : 643     Voir d'autres articles du même Auteur

Vous êtes autorisé à reproduire cet article sur votre site,
votre newsletter ou votre blog à condition de respecter
les 'Termes et conditions' de Contenu-Gratuit.com et
de maintenir les liens cliquables .




Lire Aussi:
Comment présenter le prix dans un message de vente Par : Mathhias Mazur
Que vous soyez un entrepreneur novice ou confirmé, vous avez sans doute remarqué la réticence et le manque d’entrain lorsque vous annoncez le prix de votre produit ou de votre solution. Cette attitude vient de la méfiance que la majorité des acheteurs ont vis-à-vis d’internet, surtout si votre nom n’est pas encore implanté dans un marché. Vous allez donc devoir présenter les prix dans vos messages de vente de façon à ce que votre liste baisse sa garde et se trouve en face d’une véritable affaire. Mais comment amener le futur client à cet état d’esprit ?

Comment inclure le suivi par email dans votre business internet Par : Matthias Mazur
Dans cet article, vous allez découvrir comment structurer et créer un suivi par email. Il vous sera très important pour garder ou établir un contact permanent avec votre liste. Ne sous-estimez pas ces conseils, qui ont aidé des milliers de personnes à mieux gérer leur business et à développer leurs revenus.

Comment réussir son premier projet internet ? Par : Matthias Mazur
Un concept qui est très important et que vous devez connaître, est : ne pensez pas que le premier projet internet que vous allez lancer vous rapportera des millions... Cela peut sembler simpliste ou un petit peu stupide, mais souvent ce que l'on se dit, c'est: je vais lancer un super projet internet, l'idée est bien, le marché est bien, l'époque est bien et donc cette aventure là va me rapporter des centaines de milliers d'euros et je vais pouvoir vivre la belle vie... La réalité c'est que la plupart du temps, ça ne va pas se passer comme ça! Le premier projet internet ne sera pas le bon! Si vous avez beaucoup de chance, c'est possible, mais la plupart du temps, votre premier projet internet ne va pas fonctionner...

Ce qu'il faut rechercher dans une société de référencement Par : seo junkies
Lors du choix d'une entreprise pour vous fournir une solution de référencement il est important de vérifier leur propre site web et où ils apparaissent dans les classements de recherche.