Die Abkürzung ELT steht für Extraktion (Extract) Laden (Load) und Transformation (Transform) und ist ein Datentransformationsprozess, bei dem Daten aus mehreren Datenquellen in einer Zieldatenbank vereinigt und trasnformiert werden.
Von Daten aus verschiedenen Datenquellen wie SAP, Datenbanken, XML-Dateien, Dokumenten oder API-Schnittstellen. Dabei können auch nur Teilaspekte der Quelldaten extrahiert werden.
Die Frequenz der Extraktion kann sich hier pro Datenquelle massiv unterscheiden. Man unterscheidet typischerweise anhand von
periodisch
Die Datenquelle erzeugt in regelmässigen Abständen neue Daten, wie zum Beispiel wöchentliche, tägliche oder stündliche Daten.
ereignisgesteuert
Die Datenquelle erzeugt bei einem bestimmten Ereignis einen neuen Auszug von Daten. Dies kann zum Beispiel ein abgeschlossener Wartungsprozess des Umsystems sein.
anfragegesteuert
Die Datenquelle wird vom eigenen System aktiv angefragt und bietet dann einen Zugriff auf aktuelle Daten. Dies erfolgt normalerweise durch eine Interaktion des Users.
Die aufbereiteten und bereinigten Daten können in die Zieldatenbank geladen werden.
Der Daten in das Schema und Format der Zieldatenbank indem diverse Transformationen z.B. von Datumsfeldern durchgeführt werden. In diesem Schritt können auch Duplikate entfernt, Datensätze verknüpft und Bereinigungen durchgeführt werden.
Der Name ELT und der dazugehörige Prozess wurde vor allem im Kontext von Data-Lakes, warehouse und Pipelines eingeführt. Grundsätzlich kann aber überall wo Datenmengen aus mehreren operationalen Datenbanken in eine weitere Datenbank überführt und dort transformiert oder vereinheitlicht werden, von ELT gesprochen werden.
Substring hat seit dem Jahr 2000 viele Firmen in der Einführung von digitalen Datenverarbeitungsprozessen unterstützt. ELT ist ein wichtiger Bestandteil jeder Business Unit, die ihre Prozesse digitalisiert und in einem Umfeld mit vielen digitalen Schnittstellen arbeitet.