Oft wird die Architektur eines Data Warehouses mit dem verwendeten Software Werkzeug gleichgesetzt. Davon ist abzuraten. Jedes BI Software Werkzeug kann ohne sinnvollen Architekturentwurf genutzt werden. Die Konsequenzen sind stets Datenredundanzen, mehrdeutige Informationen und geringe Wartbarkeit.

Unabhängig von dem eingesetzten Software Werkzeug folgen Best Practice Konzepte für Data Warehouse Architekturen einem mehrschichtigen Aufbau bestehend aus:

  • Quellsysteme
  • Interface Layer
  • Core Data Warehouse
  • Data Marts
  • Front Ends

Data Warehouses dienen der konsistenten Zusammenführung betriebswirtschaftlicher Grunddaten zur übergreifenden Unternehmenssteuerung. Diese Grunddaten sind in operativen Vorsystemen z.B. des Vertriebes, der Auftragsabwicklung oder der Finanzen zu finden. Ziel ist, Daten aus diesen Quellsysteme nach einheitlichen technischen Prinzipien zu extrahieren und für die weitere Verarbeitung im Interface Layer bereitzustellen. Da es sich bei diesen Vorsystemen i.d.R. um sehr komplexe technische und fachliche Umgebungen handelt sind Verantwortliche dieser Systeme frühzeitig in den Architekturentwurf einzubeziehen. Oft obliegt im Ergebnis die Verantwortung für Entwicklung und Betrieb von Extraktionslogiken bei den Verantwortlichen des jeweiligen Quellsystems.

Der besondere Vorteil des Interface Layers besteht in der zusätzlichen Ablage von extrahierten Daten: Diese können asynchron extrahiert und in das Data Warehouse beladen werden. Durch diese Entkopplung können Betriebscharakteristika von operativen Systemen wie des Data Warehouses gleichermaßen berücksichtigt werden.

Im Core Data Warehouse werden die Auswertungsdaten in einem integrierten Analysedatenmodell zusammengeführt. Da das Core Data Warehouse die Grundlage für möglichst viele darauf aufsetzende, fachbereichsspezifische Sichten ist, wird in hohem Maße auf Wiederverwendbarkeit der Dateninhalte geachtet. So werden im Core Data Warehouse vorbereinigte Daten abgelegt, ohne fachbereichsspezifische Anpassungen vorzunehmen. Auch sind die Daten des Core Data Warehouses von hoher Granularität, d.h. möglichst belegnah. Bei den Stammdaten gilt das Augenmerk ebenfalls der Allgemeingültigkeit in Definition und datenseitiger Abbildung, da hierdurch Auswertungsdimensionen wie Kunde, Lieferant, Produkt etc. in alle abhängigen Data Marts einheitlich geladen werden können. Eine wichtige Voraussetzung, um die Konsistenz bzgl. dieser Betrachtungsdimensionen über verschiedene Fachbereichssichten aufrechtzuerhalten.

 

Der Zusammenhang zwischen Core Data Warehouse und Data Marts wird dabei auch als “Hub-and-Spoke-Architektur” bezeichnet. Diese Bezeichnung lehnt sich an die Metapher eines Wagenrades an, bei welchem von der Radnarbe die Speichen ausgehen. Diese Analogie gilt für die Data Marts, die direkt auf das Core Data Warehouse aufsetzen.

 


Ein besonderer Schwerpunkt bei der Gestaltung des Datenintegrationslayers ist auf Verfahren zur Aufrechterhaltung und Steigerung der Informationsqualität zu legen. Wichtige Ansatzpunkte hierfür sind definierte Datenqualitätsregeln und Abbruchbedingungen auf Grundlage einer Quality Knowledge Base. Ferner sind Vorgehensweisen für die Nachbearbeitung von Datenqualitätsmängeln und ein Meßverfahren zur Protokollierung von Fehlern in der Datenqualität zu etablieren.

INFORMATION WORKS hat bereits hunderte Business Intelligence und Data Warehouse Architekturen erfolgreich aufgebaut. Nutzen Sie unsere Erfahrung. Sprechen Sie uns an.

Publikationen
BI Spektrum 2/2013: Datenintegration organisatorisch verankern (PDF)