Prädiktion von Studienabbrechern mittels Machine Learning

Ulm University

BA Abschlussvortrag, Philipp Schum, Ort: Online, Datum: 11.01.2021, Zeit: 15:00 Uhr

Die individuelle Betreuung einzelner Studenten in der Online-Lehre stellt sich als schwierig dar. Durch die Minimierung des direkten Kontaktes zwischen Dozenten und Studenten wird die Betreuung oft generalisiert, wodurch Probleme erschwert identifiziert und behoben werden können. Hinzu kommt eine Beeinträchtigung der Bildung von Lerngruppen unter den Studierenden. Mögliche Folgen sind eine sinkende Motivation, eine Verschlechterung der Lernleistungen und schlussendlich auch der Studienabbruch. In dieser Arbeit sollen zukünftige Studienabbrecher identifiziert werden, um diese individuell zu betreuen und zu einem erfolgreichen Studienabschluss verhelfen zu können. Dafür wird folgende Forschungsfrage gestellt: „Inwieweit ist es möglich, mit den Studierendendaten einer Fernuniversität unter Anwendung von Machine Learning zukünftige Studienabbrecher zu identifizieren?“. Zur Beantwortung der Forschungsfrage wurden zunächst Studierendendaten von 28.865 Studenten einer Fernuniversität extrahiert. Nach der Transformation und Bereinigung der Daten wurden diese mittels Datenanalysemetriken analysiert und durch Feature Engineering erweitert und optimiert. Machine Learning Modelle wurden mit einem Decision Forest, einem neuronalen Netz und einer logistischen Regression trainiert und entwickelt. Dabei erzielte das Modell mit dem Decision Forest das beste Ergebnis (Accuracy: 81,2%). Jedes Machine Learning Modell erreichte eine höhere Accuracy als das naive Modell (Accuracy: 60,5%). Dadurch wurde der Nutzen der angewandten Modelle zur frühzeitigen Identifizierung von Studienabbrechern bestätigt. In weiteren Untersuchungen wäre es möglich, die Accuracy der Modelle durch wiederholtes Feature Engineering zu optimieren und einen Dienst zur Vorhersage von künftigen Studienabbrechern zu realisieren.