Auf Basis des DWH sollen im Rahmen des Projektes zunächst folgende vier Reports abgebildet werden:
- Der Abruf aller Datensätze zu einem bestimmten Datum.
- Der Vergleich zweier (Kosten-) Zustände von Motoren oder Bauteilen, abhängig vom Datum.
- Die Anzeige des Kostenverlaufs von einem Motor oder Bauteil in einem bestimmten Zeitraum.
- Die Filterung und Anzeige fehlerhafter Daten für die Prüfung der Datenqualität des DWHs.
Das DWH besteht aus 2 Schichten (Stage Area & Data Mart). Üblicherweise gibt es eine Core-Schicht, die in unserem Fall nicht nötig ist, da die Funktionalität des Cores in der Stage Area zu finden ist. Dessen Hauptaufgabe ist es normalerweise, die Daten im DWH dauerhaft und effizient abzuspeichern. Zunächst werden die Rohdaten mithilfe des ,,Bulk Copy Programm” (bcp) unverändert in die Stage Area, genauer in die Replikation Schicht geladen. Nach dem Überprüfen der Daten werden sie mittels Transact Sequence Query Language (T-SQL) dauerhaft in der Persistent Stage Area (PSA) gespeichert. Bei T-SQL handelt es sich um eine Erweiterung der Datenbanksprache SQL.
In der PSA findet man 6 Tabellen vor, um das doppelte Abspeichern der Daten zu vermeiden.
Im nächsten Schritt werden alle Tabellen in der Data-Mart Schicht zusammengesetzt, sodass es für das Reporting einfacher ist, auf die Daten zuzugreifen. Für die Auswertung kommt Excel zum Einsatz, da dies schon in der Praxis verwendet wird. Mit Power Query ist Excel in der Lage sich mit der Tabelle zu verbinden, um so die Daten in dem Tool zu visualisieren.
Eine besondere Herausforderung für die Studierenden stellt bei dem Projekt die agile Vorgehensweise, sowie die Zusammenarbeit mit einem externen Partner dar. Darüber hinaus werden einige im Studium vermittelte Inhalte des Data Warehousing (Konzeptionierung, SQL-Abfragen und ETL-Prozesse) erstmalig praktisch angewandt.