Big (Social) Data Analytics - Seminar (Master)

Seminartitel

Big (Social) Data Analytics (Master)

 

Dauer

ein Semester (SS 18)

 

Themenvergabe

29.01. – 03.02.2018:
Präferenzeingaben durch die Studierenden im Tool

04.02.2018:
Hauptrunde des Seminarmatchings

11.02.2018:
Zweite Runde des Seminarmatchings

 

Leitung

Prof. Dr. Mathias Klier
Annette Felgenhauer
Roland Graef
Katharina Kaufmann
Andreas Obermeier

 

Inhalte

 

Das Seminar Big (Social) Data Analytics baut auf den Veranstaltungen „Big Data Analytics – Methoden und Konzepte“ sowie „Social Network Analysis – Methoden, Konzepte und Anwendungen“ auf und ist inhaltlich dem Schwerpunkt „Technologie- und Prozessmanagement“ zugeordnet.

Im Rahmen der Arbeit sollen Lösungsansätze für spezifische Fragestellungen aus dem Bereich Big (Social) Data Analytics beleuchtet und (weiter-)entwickelt werden. Hierfür sind in der Regel zunächst ein strukturierter Literaturüberblick zum Thema zu erarbeiten und Best Practices zu recherchieren. Ein kritischer Vergleich von Theorie und Praxis, eigene Ideen und Handlungsempfehlungen sowie ggf. auch der Einsatz bzw. die Evaluation von Software-Tools runden das Seminar ab.

 

 

Anmerkungen

Vorkenntnisse oder Voraussetzungen, die bestimmte Themen erfordern, werden durch den Betreuer bzw. die Betreuerin des Seminars nach der Vergabe (z. B. auf Basis des Notenspiegels) überprüft. Bitte melden Sie sich nur für Themen, deren Voraussetzungen Sie erfüllen. Sofern nicht anders vermerkt, wird jedes Thema nur einmal vergeben.

 

Thema 1

Was können Versicherungen mittels Social Media Analytics über ihre Kunden und deren Wünsche lernen?

Versicherungen stehen aktuell aufgrund der Niedrigzinspolitik der EZB vor besonderen Herausforderungen. Dazu kommen verschiedene zusätzliche Anforderungen in der Versicherungsbranche, die zum Beispiel durch mehr Transparenz für die Kunden entstehen (bspw. durch Online-Vergleichsportale). Um die aktuell besonders interessanten Kundengruppen – Generationen X, Y, Z – besser zu verstehen und deren Anforderungen ableiten zu können, möchten Versicherungen zunehmend Social Media (z. B. Twitter und Facebook) analysieren, um ihre Kunden und deren Wünsche kennenzulernen und in ihre Produkte und Dienstleistungen einfließen zu lassen.

Im Rahmen der Seminararbeit soll neben einem kurzen Überblick über die wichtigsten Methoden von Social Media Analytics aus der Literatur analysiert und (kritisch) diskutiert werden, welche Potenziale diese Verfahren im Kontext der Versicherungsbranche aufweisen. Die exemplarische praktische Anwendung ausgewählter Methoden anhand eines realen Twitter-Datensatzes rundet die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

Thema 2

Virtual Reality – Technologie vor dem Durchbruch?

2016 wurden in Deutschland rund 9 Mio. Virtual Reality-Brillen verkauft. Die Prognose für 2021 mit Verkaufszahlen von ca. 67 Mio. zeigt den enormen Hype um Virtual Reality. Trotz allem zählt die Technologie bis heute zu einem Nischenprodukt. Sind die Prognosewerte wirklich realistisch und steht Virtual Reality somit vor dem Durchbruch?

Im Rahmen der Seminararbeit soll neben einem kurzen Überblick über die wichtigsten Technologien von Virtual Reality aus der Literatur analysiert und (kritisch) diskutiert werden, welche Potenziale diese Technologie in Zukunft noch mit sich bringen könnte. Das Aufzeigen von Best Practices und potenziellen Anwendungskontexten rundet die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

Thema 3

Einsatz von Augmented Reality – Fluch oder Segen für Unternehmen?

Möbel und Einrichtungsgegenstände im eigenen Wohnzimmer virtuell platzieren und ausprobieren, ohne sie zu kaufen – IKEA erweitert seinen Katalog um Augmented Reality. Aber nicht nur IKEA setzt auf diese neue Technologie. Augmented Reality bietet eine Vielzahl an Einsatzmöglichkeiten für Unternehmen. Doch ist der Einsatz von Augmented Reality ein Fluch oder ein Segen für Unternehmen?

Im Rahmen der Seminararbeit soll neben einem kurzen Überblick über die wichtigsten Methoden von Augmented Reality aus der Literatur analysiert und (kritisch) diskutiert werden, welche Potenziale und Einsatzmöglichkeiten, aber auch welche Risiken die Technologie des Augmented Reality für Unternehmen (zukünftig) bietet. Best Practices und aktuelle Beispiele sowie ein kritischer Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

Thema 4

Einsatz von Augmented Reality – Fluch oder Segen für Privatpersonen?

7,7 Mio. Downloads hatte Pokémon Go 2016 – doch Pokémon Go war erst der Anfang von Augmented Reality. Die großen Tech-Konzerne sehen in Augmented Reality eine der wichtigsten Technologien der Zukunft. Aber nicht nur im Gaming-Kontext spielt Augmented Reality eine immer wichtigere Rolle. Für Privatpersonen ergeben sich viele weitere interessante Einsatzszenarien, die das Leben erleichtern können (bspw. interaktive Aufbauanleitungen). Doch ist der Einsatz von Augmented Reality für Privatpersonen wirklich ein Segen oder doch eher ein Fluch?

Im Rahmen der Seminararbeit soll neben einem kurzen Überblick über die wichtigsten Methoden von Augmented Reality aus der Literatur analysiert und (kritisch) diskutiert werden, welche Potenziale und Einsatzmöglichkeiten, aber auch welche Risiken die Technologie des Augmented Reality für Privatpersonen (zukünftig) bietet. Best Practices und aktuelle Beispiele sowie ein kritischer Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

Thema 5

Social Media Analytics – Sentimentanalyse am Beispiel von Versicherungsunternehmen

Social Media-Kanäle werden zunehmend von Unternehmen aus verschiedenen Branchen analysiert, um zum Beispiel die Kundenmeinung (Voice of the Customer) zu extrahieren und für Qualitätsmaßnahmen zu nutzen. Eine Ausprägung von Social Media Analytics befasst sich mit der Identifikation von „Sentiment“ in einzelnen Kundenposts. Hierzu werden verschiedene Verfahren (z. B. der wörterbuchbasierte Ansatz) angewendet. Besonders Versicherungen profitieren von dieser Analyse, da die „Generation Y“ mit Social Media-Kanälen vertraut ist und diese als besonders gewinnbringend für Versicherungs-unternehmen einzustufen ist.

Im Rahmen der Seminararbeit soll ein kurzer Überblick zu Methoden der Sentimentanalyse gegeben sowie auf den Kontext der Versicherungsbranche transferiert werden. Die exemplarische praktische Anwendung ausgewählter Methoden anhand eines realen Twitter-Datensatzes (z. B. Analyse zum Twitter-Sentiment von 5 ausgewählten deutschen Versicherern; was beschäftigt die Kunden von 5 ausgewählten deutschen Versicherern o. ä.) rundet die Arbeit ab. Falls keine Arbeit mit einem konkreten Datensatz gewünscht ist, kann alternativ eine theoretische Darstellung, wie man hierbei vorgehen könnte, erfolgen, die durch Beispiele aus der Praxis ergänzt wird.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

Thema 6

Fake News – Methoden und Ansätze zu deren Aufdeckung

Alternative Fakten, Fake News, Lügenpresse… Der Wahrheitsgehalt von Nachrichten und Aussagen hochrangiger Persönlichkeiten steht aktuell immer wieder öffentlich zur Diskussion. Doch woran lassen sich falsche Nachrichten eigentlich erkennen und gibt es Möglichkeiten, diese Erkennung zu automatisieren?

Im Rahmen der Seminararbeit soll ein Überblick über den aktuellen Stand der Forschung bezüglich Fake News und ihrer Erkennung gegeben werden. Dabei soll auch auf die zugrundeliegenden Analyseverfahren eingegangen werden. Ein Vergleich der dargestellten Ansätze und eine kritische Diskussion runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

 

Thema 7

Informationsausbreitung in Online Social Networks – Modelle und Anwendungen

Nachrichten und Informationen verbreiten sich heutzutage längst nicht mehr nur über die klassischen Medien, sondern auch über Online Social Networks (OSN) wie beispielsweise Twitter. Durch die Möglichkeit, eine Nachricht zu „retweeten“, d. h. erneut weiterzuversenden, können sich dort Nachrichten innerhalb kürzester Zeit über große Teile des Netzwerks ausbreiten. Doch wie genau funktioniert diese Verbreitung?

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die wissenschaftliche Literatur zu den wichtigsten Modellen sowie zugrundeliegenden Methoden zur Beschreibung der Informationsverbreitung in OSN gegeben werden. Nicht zuletzt auch vor dem Hintergrund praktischer Anwendung(sbeispiele) sollen diese anschließend verglichen und kritisch diskutiert werden.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

 

Thema 8

Natural Language Generation – Der Computer als Texter der Zukunft?

"Kopf-an-Kopf-Rennen zwischen Clinton und Trump laut neuer Umfrage". Dieser Satz wurde im Rahmen des Projektes PollyVote automatisch von einem Computer erzeugt. Er stammt aus der Feder von PollyBot – einer künstlichen Intelligenz, die Daten in Worte fasst. Ansätze aus dem Bereich Natural Language Generation ermöglichen das automatische Texten von journalistischen Beiträgen oder Produktbeschreibungen im Onlinehandel.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die wissenschaftliche Literatur zu Natural Language Generation gegeben werden. Best Practices und aktuelle Beispiele aus der Unternehmenspraxis sowie ein kritischer Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“ oder „Big Data Analytics – Methoden und Anwendungen“
Thema 9

Information Diffusion – Wie verbreiten sich (Fake-) News in sozialen Netzwerken?

In sozialen Netzwerken lass sich Nachrichten sehr schnell verbreiten. Insbesondere durch das Thema Fake-News rückt die Analyse der Verbreitung von Nachrichten in den Fokus der aktuellen Forschung. Dabei kann untersucht werden über welche Akteure sich Informationen besonders effizient verbreiten lassen, wie sich Informationen voraussichtlich ausbreiten und wie wahrscheinlich ein Weiterverbreiten der Information bei jedem Akteur ist.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über Methoden und Anwendungen innerhalb der wissenschaftlichen Literatur zu Information Diffusion in sozialen Netzwerken gegeben werden. Best Practices und eine kritische Reflexion runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“ oder „Big Data Analytics – Methoden und Anwendungen“
Thema 10

Topic Modeling – Wie bringt man Ordnung in unstrukturierte Textdaten?

Unternehmen haben über soziale Netzwerke wie Twitter oder Web 2.0 Anwendungen (z.B. Review-Seiten) eine schier unerschöpfliche Fülle an Daten etwa zu Kundenstimmen. Dabei stellt die Auswertung dieser unstrukturierten Textdaten besondere Anforderungen an die Aufbereitung und Verwertung der Daten. Eine Möglichkeit Textdokumente zu strukturieren stellt Topic Modeling dar. Dabei werden die Dokumente je nach Zugehörigkeit zu bestimmten Themenfeldern bewertet und eingeteilt.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die wissenschaftliche Literatur zu Topic Modeling gegeben werden. Best Practices und aktuelle Beispiele aus der Unternehmenspraxis sowie ein kritischer Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“ oder „Big Data Analytics – Methoden und Anwendungen“
Thema 11

Bose-Einstein-Kondensation und Phasenübergänge – Physik komplexer Netzwerke

Netzwerke lassen sich – unter bestimmten Voraussetzungen – mit den selben mathematischen Modellen beschreiben, die auch die statistische Physik nutzt. Bei der Entwicklung vieler komplexer Netzwerke (etwa dem World Wide Web oder Zitationsnetzwerken) lassen sich dabei mitunter aus der Physik bekannte Effekte wie etwa Phasenübergänge beobachten. Auch die Bose-Einstein-Kondensation ist dabei in den Fokus der Netzwerkforscher geraten und erlaubt tiefere Einblicke in die Evolution von Netzwerken.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die wissenschaftliche Literatur zu Phasenübergängen und Bose-Einstein-Kondensation in Netzwerken gegeben werden. Best Practices sowie eine kritische Reflexion runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“ oder „Big Data Analytics – Methoden und Anwendungen“
Thema 12

Semi-Supervised-Learning – Wie viel menschlichen Input brauchen maschinelle Lernverfahren wirklich?

Maschinelle Lernverfahren (auch Supervised Learning genannt) werden zunehmend im Big Data Umfeld zur automatisierten Klassifikation verwendet, um zum Beispiel Stimmungsbilder in Texten als positiv, negativ oder neutral zu erkennen. Damit diese maschinellen Lernverfahren überhaupt funktionieren, werden von Menschenhand klassifizierte Trainingsdaten benötigt, auf dessen Basis die Verfahren ein Muster erlernen können. Für adäquate Ergebnisse wird eine gewisse Grundmenge an Trainingsdaten vorausgesetzt, was leider mit einem hohen manuellen Aufwand einhergeht. Dem sollen Semi-Supervised-Learning Verfahren Abhilfe schaffen, da diese Verfahren nur eine geringe Menge an Trainingsdaten voraussetzen und damit den initialen Aufwand für maschinelles Lernen erheblich reduzieren könnten.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick zu Methoden des Semi-Supervised-Learning gegeben werden. Eine Analyse, inwiefern Semi-Supervised-Learning Verfahren in der Praxis eingesetzt werden bzw. herkömmliche Supvervised Verfahren ersetzen können, soll die Arbeit abrunden.

Voraussetzung: Veranstaltung „Big Data Analytics – Methoden und Anwendungen“
Thema 13

Automatisierte Systeme basierend auf Textual Case-based Reasoning – Können diese Systeme auf Dauer den Customer Service ersetzen?

Case-based Reasoning ist eine Methodik aus dem Bereich der künstlichen Intelligenz zum Lösen von Problemen basierend auf bereits gelösten ähnlichen Problemen. Eine Ausprägung stellt Textual Case-based Reasoning dar, welches Schlussfolgerungen auf Basis von Textdaten vornimmt. Insbesondere im Customer Service scheinen Systeme basierend auf Textual Case-based Reasoning vielversprechend, um schriftliche Kundenanfragen automatisiert zu beantworten. Der Grad der Automatisierung kann hierbei von der Unterstützung der Mitarbeiter bis hin zur vollständigen Ersetzung der Mitarbeiter durch das System variieren.

Im Rahmen der Seminararbeit soll neben einem strukturierten Überblick über die wichtigsten Methoden des Textual Case-based Reasoning aus der Literatur insbesondere analysiert und (kritisch) diskutiert werden, welche Potenziale diese Verfahren im Customer Service bieten. Ein (kritischer) Vergleich von Theorie und (potentieller) Praxis, eigene Ideen und Handlungsempfehlungen runden die Arbeit ab.

Voraussetzung: keine
Thema 14

Text Recognition in Images

Unter Text Recognition in Images versteht man das automatisierte Herausfiltern von Informationen in natürlicher Sprache, die in Bilder eingebettet sind. Dies stellt eine komplexe Aufgabe dar, da sich Text in Bildern in Bezug auf Größe, Schriftart, Abstand, Ausrichtung, Farbe und Struktur stark unterscheiden kann und dadurch für automatisierte Systeme schwer zu identifizieren ist. In der Ära des Smartphones lassen sich schnell und komfortabel Bilder von Dokumenten wie beispielsweise Rechnungen, Anträge, Kündigungen etc. machen, um die enthaltenen Informationen in Form der Bilder zu übermitteln. Allerdings werden diese Dokumente in Form von Bildern häufig noch von Mitarbeitern bearbeitet, die den Text aus den Bildern in das jeweilige System übernehmen. Um diesen Prozess zu automatisieren könnten Methoden der Text Recognition in Images verwendet werden.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die Methoden zu Text Recognition in Images gegeben werden. Aktuelle Beispiele sowie ein (kritischer) Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: keine
Thema 15

Predictive Analytics in Healthcare

Leider ist fast jeder von Zeit zu Zeit gezwungen zum Arzt zu gehen und erwartet eine gute Behandlung. Obwohl Ärzte eine hohe Expertise in der Medizin aufweisen, können Sie nicht alles wissen. Predictive Analytics beschäftigt sich im Healthcare Kontext mit der Auswertung von riesigen Datenmengen, um individuelle Behandlungsempfehlungen für Patienten geben zu können. Diese Datenmengen können sowohl die Ergebnisse von vergangenen Behandlungen als auch die neuesten veröffentlichten Behandlungsmethoden aus der Forschung miteinbeziehen. Dabei kann Predictive Analytics nicht nur individuelle Behandlungsempfehlungen geben, sondern durch die statistische Auswertung der Daten neue Behandlungsmethoden finden, die alleine durch Menschen nicht zu entdecken gewesen wären.

Im Rahmen der Seminararbeit soll analysiert und diskutiert werden, welche Möglichkeiten Methoden zu Predictive Analytics in Healthcare bieten und welche bereits angewendet werden. Best Practices und aktuelle Beispiele sowie ein kritischer Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Veranstaltung „Big Data Analytics – Methoden und Anwendungen“
Thema 16

Movie Recommender Systems – Sind die Empfehlungen von Netflix wirklich hilfreich?

Im Zeitalter von Netflix haben die meisten schon Empfehlungen zu Filmen oder Serien bekommen, die ihnen gefallen könnten. Diese Empfehlungen passen manchmal mehr und manchmal weniger gut zum eigenen Geschmack. Doch wie gut sind Recommender Systeme statistisch und im Vergleich zu einander wirklich? Um dies herauszufinden hat Netflix den „Netflix Prize“ ausgeschrieben, der dazu aufruft das Netflix eigene Recommendersystem anhand eines veröffentlichten Datensatzes zu überbieten. Daraufhin haben über 2000 Teams von der ganzen Welt neue Movie Recommender Systeme entwickelt und ihre Vorhersagen auf dem Netflix Datensatz eingereicht, wodurch der Algorithmus von Netflix weiter verbessert werden konnte.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die wissenschaftliche Literatur zu Movie Recommender Systeme gegeben werden. Insbesondere soll dabei auf die Methoden und Ergebnisse der Teilnehmer des „Netflix Prizes“ eingegangen werden, um anschließend zu diskutieren wie hilfreich die Empfehlungen wirklich sein können.

Voraussetzung: Veranstaltung „Big Data Analytics – Methoden und Anwendungen“
Thema 17

Künstliche Intelligenz basierend auf neuronalen Netzwerken – Lässt sich noch nachvollziehen wie die KI ihre Entscheidungen trifft oder vertrauen wir ihr blind?

Typische menschliche Fähigkeiten, wie zum Beispiel Gesichtserkennung, stellen eine unüberwindbare Hürde für herkömmliche Informationsverarbeitungssysteme dar. Um dem Abhilfe zu schaffen wurden künstliche Neuronale Netze entwickelt, die die Organisations- und Verarbeitungsprinzipien des menschlichen Gehirns imitieren. Dadurch zeichnen sich künstliche Neuronale Netzwerke gegenüber statistischen Verfahren durch Lernfähigkeit, Fehlertoleranz, Robustheit und Generalisierungsfähigkeit aus. Allerdings sind künstliche neuronales Netzwerke oft nach ihrer Erstellung so komplex, dass es nur schwer nachvollziehbar ist auf welcher Basis sie ihre Entscheidungen treffen. Daher verlassen sich viele in der Praxis oft blind auf die Ergebnisse der künstlichen neuronalen Netzwerke und betrachten diese Methode als eine Black Box.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die wissenschaftliche Literatur zu künstlichen neuronalen Netzwerken gegeben werden. Best Practices und aktuelle Beispiele aus der Unternehmenspraxis sowie ein kritischer Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“ oder „Big Data Analytics – Methoden und Anwendungen“

Bearbeitung

Die Themen können nur alleine bearbeitet werden. Zur Erlangung des Leistungsnachweises ist die Anfertigung einer Seminararbeit sowie einer Präsentation (10 Minuten) mit anschließender Diskussion (5 Minuten) notwendig.

 

Meilensteine

Themenvergabe mit Hilfe des zentralen Tools:

·        Deutsche Version:
econ.mathematik.uni-ulm.de/semapps/stud_de/

·        Englische Version:
econ.mathematik.uni-ulm.de/semapps/stud_en/

Abgabe der Seminararbeiten:
Termin wird rechtzeitig bekannt gegeben

Endpräsentation:
Zeitpunkt und Ort werden rechtzeitig bekannt gegeben

 

 

Allgemeine Anforderungen

 
  • analytische und konzeptionelle Fähigkeiten
  • selbständige, zielorientierte und systematische Arbeitsweise

 

Weitere Informationen siehe Webpage
www.uni-ulm.de/mawi/itop.html