Dieses Vorhaben birgt jedoch Herausforderungen für das Team. Einerseits wurde es mit bisher unbekannten Dateiformaten konfrontiert, beispielsweise mit hierarchischen JSON-Dateien. Aus diesen müssen die benötigten Informationen erst extrahiert werden. Andererseits muss eine Vielzahl von Entscheidungen getroffen werden, wie die Daten bestmöglich zusammengeführt werden. E* speichert beispielsweise den Namen in zwei Attributen [first_name] und [last_name], L* hingegen speichert beides in dem Attribut [name]. Nun muss beispielsweise eine automatisierte Möglichkeit gefunden werden, die Namen zu trennen. Was soll der Algorithmus aber mit Klaus B. Meyer machen?
Das Team entschied sich, diese Harmonisierung in einem sogenannten Data Warehouse durchzuführen. Ein Data Warehouse ist eine besondere Architektur, um Daten zu verarbeiten und zu speichern. Auf diese besondere Architektur wird im Folgenden näher eingegangen und zum besseren Verständnis eine Analogie zu einem Supermarkt aufgebaut. Dass in der Analogie ein Supermarkt verwendet wird, ist rein zufällig und hat keinen direkten Bezug zu den Lebensmitteleinzelhändlern L* und E*.
Insgesamt besteht ein Data Warehouse aus vier Schichten: der Staging und Cleansing Area, dem Core und den Data Marts.
In der Staging Area kommen die Daten unverändert an. Dies ist zu vergleichen mit der Anlieferungszone eines Supermarktes, in der gerade eine Lieferung ankommt. Danach gelangen die Daten in die Cleansing Area, den Kommissionierungsbereich. Dort wird eine Qualitätskontrolle der Lieferung durchgeführt und sie gegebenenfalls umstrukturiert. Nach der Cleansing Area erfolgt ein Laden in das Herzstück eines jeden Data Warehouses: den Core. Dieser ist zu vergleichen mit einem Hochregallager. Dort haben alle Waren ihren festen Platz und sind jederzeit auffindbar. Die letzte Schicht sind die sogenannten Data Marts. Zu vergleichen sind diese mit den einzelnen Ständen im Markt, die immer nur eine bestimmte Auswahl der Produkte anbieten. (Vgl. Schnider 2016: S. 6ff.)
Ein Dashboard bereitet die Daten, die die Data Marts zur Verfügung stellen, grafisch auf, sodass die Informationen benutzerfreundlich aufbereitet sind. Diese können in verschiedenen Abteilungen im Unternehmen zur Entscheidungsfindung genutzt werden. Mit dem Aufbau von Dashboards, die den Anforderungen des Auftraggebers entsprechen, endet das Studierendenprojekt.
Abschließend lässt sich sagen, dass das fünfmonatige Projekt für die Studierenden nicht nur fachlich eine herausfordernde Aufgabe ist. Erstmalig arbeiten die Studierenden zusammen in einem Projektteam und können erste praktische Erfahrungen im agilen Projektmanagement sammeln.