Aus den Anforderungen und der Zielsetzung ergibt sich folgende Architektur:
Die identifizierten Datenquellen liegen im Excel-Dateiformat vor und weisen Strukturunterschiede und einen nicht einheitlichen Datenumfang auf. Zum Umgang mit dieser Problematik werden die Dateien durch ein Python-Skript harmonisiert. Die harmonisierten Daten werden dann unverändert in eine Microsoft SQL Server-Datenbank geladen.
Von dort aus werden die Daten über ETL-Prozesse und unter Nutzung verschiedener Transformations- und Bereinigungskonzepte in ein Core Data Warehouse nach dem Data Vault 2.0 Ansatz überführt. Für die Umsetzung wird Microsoft SQL Server Data Tools (SSDT) eingesetzt.
Aus dem Data Warehouse leiten sich anschließend Data Marts ab, die die Grundlage für das Dashboard als übergeordnetes Projektergebnis liefern.
Das Projekt bietet einige Herausforderungen für die Studierenden, weil diese erstmals in einem Projektteam zusammenarbeiten und agile Ansätze umsetzen müssen, um im laufenden Semester ans Ziel zu gelangen. Darüber hinaus erforderte die ESG-Thematik am Projektbeginn eine ausführliche Recherche, um das Verständnis der Anforderungen sicherzustellen.