ETL vs ELT vs Streaming ETL’ ‘ETL vs ELT vs Streaming ETL

ETL vs ELT vs Streaming ETL

Exploration des paradigmes de conception par lots et en temps réel pour le traitement des données

Photo de Compare Fibre sur Unsplash

Extract, Transform, Load (ETL) et Extract, Load, Transform (ELT) sont deux concepts fondamentaux dans le contexte du traitement des données, utilisés pour décrire les paradigmes de conception de l’ingestion et de la transformation des données. Bien que ces termes soient souvent utilisés de manière interchangeable, ils font référence à des concepts légèrement différents et sont applicables à différents cas d’utilisation qui imposent également des conceptions variables.

Dans cet article, nous explorerons les différences et les similitudes entre ETL et ELT et discuterons de l’impact du cloud computing et de l’ingénierie des données sur les modèles de conception du traitement des données. De plus, nous soulignerons les principaux avantages et inconvénients qu’ils offrent aux équipes de données modernes. Enfin, nous discuterons de l’ETL en continu, un modèle de traitement des données émergent qui vise à résoudre divers inconvénients des approches par lots plus traditionnelles.

Les trois étapes d’intérêt

L’ingestion et la persistance des données provenant de sources externes dans un système de destination impliquent trois étapes distinctes.

ExtractionL’étape “Extraction” comprend tous les processus nécessaires pour extraire les données d’un système source. Ces sources peuvent inclure une interface de programmation d’application (API), un système de base de données ou un fichier, ainsi que des appareils Internet des objets (IoT), tandis que les données peuvent être de toute forme : structurées, semi-structurées ou non structurées. Les données extraites pendant cette étape sont généralement appelées “données brutes”.

TransformationPendant l’étape “Transformation”, le pipeline applique des transformations sur les données brutes afin d’atteindre un objectif spécifique. Cet objectif est généralement lié aux exigences commerciales ou techniques. Certaines transformations couramment appliquées incluent la modification des données (par exemple, la mise en correspondance de États-Unis avec US), la sélection d’enregistrements ou d’attributs, les jointures avec d’autres sources de données ou même les validations des données.

ChargementPendant l’étape “Chargement”, les données (brutes ou transformées) sont chargées dans un système de destination. Généralement, la destination est un système OLAP (c’est-à-dire un entrepôt de données ou…

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more