Integrität und Konsistenz: Daten-Validierung von MARS-G-Fragebögen mit CUE

Ulm University

MA-Abschlussvortrag, Alexander Kübler, Ort: Online, Datum: 18.05.2022, Zeit: 11:30 Uhr

Die Integrität und Konsistenz von Daten ist essentiell die maschinelle Verarbeitung und Informationsextraktion. Wissenschaftler und Ingenieure investieren viel Zeit und Energie in die Bereiningung von Datensätzen. In dieser Arbeit wird validiert, ob die Programmiersprache CUE (Configure Unify Execute) in der Lage ist die Integrität und Korrektheit von Daten zu gewährleisten. CUE wurde entwickelt Daten, Schema- und Konfiguration-Dateien zu validieren. In dieser Arbeit wird CUE verwendet, Reviews der MARS-G-Fragebögen zu validieren. In verschiedenen Phasen der MHAD-Datenerhebung wird überprüft, ob CUE in der Lage ist die Daten Integrität und Konsistenz zu verbessern. Hierbei wurden fünf verschiedene Testfälle erstellt, um verschiedene Aspekte von CUE zu testen. Die Ergebnisse der Tests zeigen, das CUE in der Lage ist die Integrität und Korrektheit in verschiedenen Phasen der MHAD-Datenerhebung zu verbessern. Jedoch wird die Anwendung von CUE durch eine fehlende Dokumentation und nicht einheitliche Funktionalität erschwert.