27.05.2025

Entwicklung eines Datenqualitätsregelkreises für das Data Warehouse des Redaktionsnetzwerk Deutschland (RND)

In Zusammenhang mit dem Redaktionsnetzwerk Deutschland (RND) entwickeln sieben Studierende der Hochschule Hannover einen Datenqualitätsregelkreis zur Kontrolle der Daten im bereits bestehenden Data Warehouse.

Im Rahmen des BI-Projekts unter der Leitung von Prof. Dr. Stephan Rensmann entwickeln Studierende des Studiengangs Wirtschaftsinformatik mit dem Schwerpunkt Business Intelligence (BI) im Sommersemester 2025 ein Konzept zur Überwachung und Sicherung der Datenqualität.

Zentrale Aufgabe ist zum einen die Konzeption eines datenqualitätsorientierten Regelkreises, der Prozesse zur automatisierten Fehlererkennung, -meldung und zur Förderung von Transparenz systematisiert. Zum anderen wird auf Basis dieses Regelkreises ein Prototyp für eine ausgewählte Datenquelle umgesetzt, um die Praxistauglichkeit des Konzepts zu evaluieren.

Das RND produziert digitale Nachrichteninhalte und bezieht dafür Informationen aus verschiedenen Quellen. Sind diese Informationen fehlerhaft oder weisen Lücken auf, wird von einer schlechten Datenqualität gesprochen. Das Thema Datenqualität ist für das RND von zentraler Bedeutung, da fehlerhafte Daten die datengestützte Entscheidungsfindung sowie die strategische Planung, etwa in Redaktion, Controlling oder Advertising erheblich beeinträchtigen können.

Das Konzept für den Regelkreis basiert auf einer sorgfältigen Prüfung der Datenqualität während der Transformation im Data Warehouse. Ein Data Warehouse ist eine zentrale Datenbank, in der aus verschiedenen Quellen Daten gespeichert und historisiert werden. Von dort aus können sie für Analyse- und Berichtszwecke abgerufen werden. Um die Daten im Data Warehouse zu speichern, müssen sie transformiert werden. Transformation bedeutet in diesem Zusammenhang, dass die Rohdaten aus dem Quellsystem in eine einheitliche, analysierbare Struktur überführt werden. Dazu gehört beispielsweise das Bereinigen fehlerhafter Werte oder das Vereinheitlichen von Formaten (z.B. Datumsformate). Der Regelkreis sieht vor, dass bei auftretenden Fehlern während der Transformation diese automatisiert in einem detaillierten Fehler-Log (eine separate Tabelle für auftretende Fehler) dokumentiert werden. Im Anschluss werden die Fehler in einem Dashboard visualisiert und die für die Korrektur zuständigen Mitarbeiter benachrichtigt. Da bislang kein ganzheitliches und automatisiertes Konzept zur Verfügung steht, soll der Regelkreis künftig eine schnellere und zuverlässigere Überprüfung der Vollständigkeit und Korrektheit der Unternehmensdaten ermöglichen.

Das beigefügte BPMN-Diagramm (Business Process Modeling Notation Diagramm) beschreibt einen kontinuierlichen Verbesserungsprozess nach dem PDCA-Zyklus (Plan, Do, Check, Act). Ein BPMN-Diagramm ist eine Modellierweise, mit der Geschäftsprozesse und Abläufe skizziert werden können.  

In der Plan-Phase werden Anforderungen festgelegt, um datenqualitätsbezogene Ziele zu definieren, Fehler zu kategorisieren und Zuständigkeiten festzulegen. Die daraus entstandenen Dokumente wurden im Verlauf des Projekts von den Studierenden erstellt und als Grundlage für den Regelkreis dem RND zur Verfügung gestellt. In der Do-Phase werden Tests zur Überprüfung der Datenqualität im Data Warehouse durchgeführt. Die Ergebnisse werden in einem Fehler-Log dokumentiert und abgestimmt. In der Check-Phase erfolgt die Auswertung der Testergebnisse. Identifizierte Fehler werden für das Dashboard visualisiert, analysiert und zur Behebung an einen zuständigen Mitarbeiter weitergeleitet. Die Zuständigkeiten für die Fehlerbehebung sind klar anhand des RACI-Prinzips (Responsible, Accountable, Consulted, Informed) definiert. Bleibt ein Fehler ungelöst, erhöht sich automatisch dessen Behebungspriorität. In der letzten Phase des Regelkreises, der Act-Phase, wird ein strukturierter Fragebogen ausgefüllt, der zentrale Aspekte und Abläufe der vorangegangenen Phasen reflektiert. Die gewonnen Erkenntnisse werden gemeinsam diskutiert und zu einem Feedback zusammengetragen. Dieses wird in der nächsten Plan-Phase als Grundlage für die Optimierung des Regelkreises genutzt.

Das Projekt stellt für die Studierenden eine anspruchsvolle Aufgabe dar, da sie erstmals in einem selbstorganisierten Projektteam eigenverantwortlich agieren. Dabei übernehmen sie Verantwortung für die Projektentwicklung, stehen im kontinuierlichen Austausch mit den relevanten Stakeholdern und integrieren stetig das erhaltene Feedback. Zugleich sammeln sie wertvolle Erfahrungen im agilen Arbeiten, sowie in der interdisziplinären Kommunikation zwischen fachlichen und technischen Beteiligten.

Datenqualitätsregelkreises für das Data Warehouse des Redaktionsnetzwerk Deutschland (RND)