Big (Social) Data Analytics - Seminar (MA)

Seminar

Big (Social) Data Analytics (Master)

Dauer

ein Semester (WS 17/18)

Themenvergabe

24.06. – 01.07.2017:
Präferenzeingaben durch die Studierenden im Tool

02.07.2017:
Hauptrunde des Seminarmatching

09.07.2017:
Zweite Runde des Seminarmatching

Leitung

Prof. Dr. Mathias Klier
Annette Felgenhauer
Roland Graef
Katharina Kaufmann
Andreas Obermeier

Inhalte

Das Seminar Big (Social) Data Analytics baut auf den Veranstaltungen „Big Data Analytics – Methoden und Konzepte“ sowie „Social Network Analysis – Methoden, Konzepte und Anwendungen“ auf und ist inhaltlich dem Schwerpunkt „Technologie- und Prozessmanagement“ zugeordnet.

Im Rahmen der Arbeit sollen Lösungsansätze für spezifische Fragestellungen aus dem Bereich Big (Social) Data Analytics beleuchtet und (weiter-)entwickelt werden. Hierfür sind in der Regel zunächst ein strukturierter Literaturüberblick zum Thema zu erarbeiten und Best Practices zu recherchieren. Ein kritischer Vergleich von Theorie und Praxis, eigene Ideen und Handlungsempfehlungen sowie ggf. auch der Einsatz bzw. die Evaluation von Software-Tools runden das Seminar ab.

Anmerkungen

Vorkenntnisse oder Voraussetzungen, die bestimmte Themen erfordern, werden durch den Betreuer bzw. die Betreuerin des Seminars nach der Vergabe (z. B. auf Basis des Notenspiegels) überprüft. Bitte melden Sie sich nur für Themen, deren Voraussetzungen Sie erfüllen. Sofern nicht anders vermerkt, wird jedes Thema nur einmal vergeben.

Thema 1

Social Media Analytics – Sentimentanalyse am Beispiel von Versicherungsunternehmen

Social Media-Kanäle werden zunehmend von Unternehmen aus verschiedenen Branchen analysiert, um zum Beispiel die Kundenmeinung (Voice of the Customer) zu extrahieren und für Qualitätsmaßnahmen zu nutzen. Eine Ausprägung von Social Media Analytics befasst sich mit der Identifikation von „Sentiment“ in einzelnen Kundenposts. Hierzu werden verschiedene Verfahren (z. B. der wörterbuchbasierte Ansatz) angewendet. Besonders Versicherungen profitieren von dieser Analyse, da die „Generation Y“ mit Social Media Kanälen vertraut ist und diese als besonders gewinnbringend für Versicherungsunternehmen einzustufen ist.

Im Rahmen der Seminararbeit soll ein kurzer Überblick zu Methoden der Sentimentanalyse gegeben sowie auf den Kontext der Versicherungsbranche transferiert werden. Die exemplarische praktische Anwendung ausgewählter Methoden anhand eines realen Twitter-Datensatzes (z. B. Analyse zum Twitter-Sentiment von 5 ausgewählten deutschen Versicherern; was beschäftigt die Kunden von 5 ausgewählten deutschen Versicherern o. ä.) rundet die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

Thema 2

Was können Versicherungen mittels Social Media Analytics über ihre Kunden und deren Wünsche lernen?

Versicherungen stehen aktuell aufgrund der Niedrigzinspolitik der EZB vor besonderen Herausforderungen. Dazu kommen verschiedene zusätzliche Anforderungen in der Versicherungsbranche, die zum Beispiel durch mehr Transparenz für die Kunden entstehen (bspw. durch Online-Vergleichsportale). Um die aktuell besonders interessanten Kundengruppen – Generationen X, Y, Z – besser zu verstehen und deren Anforderungen ableiten zu können, möchten Versicherungen zunehmend Social Media (z. B. Twitter und Facebook) analysieren, um ihre Kunden und deren Wünsche kennenzulernen und in ihre Produkte und Dienstleistungen einfließen zu lassen.

Im Rahmen der Seminararbeit soll neben einem kurzen Überblick über die wichtigsten Methoden von Social Media Analytics aus der Literatur analysiert und (kritisch) diskutiert werden, welche Potenziale diese Verfahren im Kontext der Versicherungsbranche aufweisen. Die exemplarische praktische Anwendung ausgewählter Methoden anhand eines realen Twitter-Datensatzes rundet die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

Thema 3

Smart City – Ist sie die Lösung der Urbanisierung?

„Häuser, die selbst das Licht ausmachen, Mülltonnen, die der Stadtreinigung Bescheid geben, wenn sie geleert werden müssen, Elektroautos, die dem Fahrer den Weg zum nächsten freien Parkplatz zeigen, Straßenlaternen, die sich dimmen, wenn niemand in der Nähe ist“ – so könnte die Stadt der Zukunft aussehen. Die UNO prognostiziert, dass bis zum Jahr 2050 rund 70% der Weltbevölkerung in Städten wohnen werden. Mit Hilfe von intelligenten Systemen, die über das Internet der Dinge die Stadt in eine Smart City verwandeln, sollen Städte diese Herausforderungen meistern.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die wissenschaftliche Literatur zu den wichtigsten Konzepten sowie Methoden einer Smart City gegeben und (kritisch) diskutiert werden. Aktuelle Beispiele sowie ein (kritischer) Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

Thema 4

Mobility und Big Data im Healthcare

Im Zeitalter von Mobility und Big Data werden Aktivitäts-Tracker (z. B. Fitness-Armbänder und Smart Watches) immer populärer. Der Absatz von „Wearables“ (am Körper getragene Elektronik) wird weltweit auf 213,6 Millionen Stück im Jahr 2020 prognostiziert. Mit ihnen kann der Nutzer u. a. Schritte zählen, die zurückgelegte Distanz anzeigen oder beim Sport verbrannte Kalorien berechnen. Manche von ihnen überwachen auch Schlafdauer und -zyklen, um die Schlafqualität zu ermitteln, oder messen die Herzfrequenz (Puls). Die durch Fitness-Tracker gesammelten Informationen wecken inzwischen auch bei Krankenversicherungen Begehrlichkeiten. So versprechen Krankenversicherungen bspw. Versicherten, die dazu bereit sind, per Fitness-Armband gesammelte Gesundheitsdaten zu übermitteln, Vergünstigungen in Form von Rabatten oder Prämien.

Im Rahmen der Seminararbeit soll analysiert und diskutiert werden, welche Möglichkeiten Methoden des Big Data Analytics im Healthcare-Kontext bieten und welche bereits angewendet werden. Best Practices und aktuelle Beispiele sowie ein kritischer Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Veranstaltung „Big Data Analytics – Methoden und Anwendungen“

Thema 5

Natural Language Generation – Der Computer als Texter der Zukunft?

"Kopf-an-Kopf-Rennen zwischen Clinton und Trump laut neuer Umfrage". Dieser Satz wurde im Rahmen des Projektes PollyVote automatisch von einem Computer erzeugt. Er stammt aus der Feder von PollyBot – einer künstlichen Intelligenz, die Daten in Worte fasst. Ansätze aus dem Bereich Natural Language Generation ermöglichen das automatische Texten von journalistischen Beiträgen oder Produktbeschreibungen im Onlinehandel.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die wissenschaftliche Literatur zu Natural Language Generation gegeben werden. Best Practices und aktuelle Beispiele aus der Unternehmenspraxis sowie ein kritischer Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“ oder „Big Data Analytics – Methoden und Anwendungen“

Thema 6

Fraud Detection & Predictive Analytics – Können Computer Betrüger erkennen?

Laut einer aktuellen Studie von PwC sind mehr als ein Drittel aller Unternehmen von Wirtschaftskriminalität betroffen. Um sich gegen betrügerische Absichten zur Wehr zu setzen, verwenden Unternehmen vermehrt datengetriebene Prognosemodelle aus dem Bereich Predictive Analytics, um Betrüger zu entlarven („Fraud Detection“).

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die wissenschaftliche Literatur zu Fraud Detection mittels Predictive Analytics gegeben werden. Best Practices und aktuelle Beispiele aus der Unternehmenspraxis sowie ein kritischer Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“ oder „Big Data Analytics – Methoden und Anwendungen“

Thema 7

NeuroBayes – Nach dem Internet das Next-Big-Thing der Teilchephysiker am CERN?

In der Forschungseinrichtung CERN werden in Beschleunigerexperimenten am LHC (Large Hadron Collider) unvorstellbare Datenmengen in Bruchteilen einer Sekunde erzeugt. Um die Daten effizient und exakt auswerten zu können wurde der Machine Learning-Algorithmus „NeuroBayes“ entwickelt. NeuroBayes wird inzwischen von der Firma Blue Yonder aggressiv vermarktet und soll den internationalen Predictive-Analytics-Markt aufrollen.

Im Rahmen der Seminararbeit sollen die Ideen hinter dem NeuroBayes-Algorithmus beleuchtet und mit anderen Machine Learning Verfahren (etwa Naive Bayes) verglichen werden. Best Practices und aktuelle Beispiele aus der Unternehmenspraxis zum Einsatz von NeuroBayes in der Wirtschaft sowie ein kritischer Vergleich zwischen Theorie und Praxis runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“, „Big Data Analytics – Methoden und Anwendungen“

Thema 8

Chatbots

Chatbots sind textbasierte Dialogsysteme, mit denen sich in natürlicher Sprache über Texteingabe kommunizieren lässt. Obwohl Chatbots ursprünglich eher mit einer Volltextsuchmaschine verwandt sind, kann der Einsatz von künstlicher Intelligenz diese sogar menschenähnlich reagieren lassen. Daher ist es oftmals das Ziel die Kommunikation mit einem echten Menschen zu simulieren. Ob ein Chatbot dieses Ziel erfüllt, kann bspw. mit dem Turing-Test nachgewiesen werden. Hierbei kommuniziert ein menschlicher Fragesteller gleichzeitig mit einem Menschen und einem Chatbot, ohne zu wissen welcher der beiden der Chatbot ist. Kann der Fragesteller den Chatbot nicht eindeutig identifizieren, gilt der Turing-Test als bestanden.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über die wissenschaftlichen Methoden in der Literatur zur Entwicklung von Chatbots gegeben werden. Best Practices und aktuelle Beispiele aus der Unternehmens­praxis sowie ein kritischer Vergleich von Methoden in der Theorie runden die Arbeit ab.

Voraussetzung: keine

Thema 9

Topic Detection – Methoden und Anwendungsgebiete

Als Topic Detection wird die automatisierte Identifizierung und Abgrenzung von bestimmten Themengebieten aus Datenstreams, wie bspw. Nachrichten aus Social Media-Kanälen, bezeichnet. Der Bereich des Text Mining bietet dafür eine Vielzahl an Methoden und Möglichkeiten um Topics aus unstrukturierten Textdaten zu extrahieren. Daraus resultieren die verschiedensten Anwendungsgebiete von bspw. Konsum- und Marktforschung bis hin zu Finanzmarktanalysen auf Basis der vieldiskutierten Topics.

Im Rahmen der Seminararbeit soll ein Überblick über zentrale wissenschaftliche Methoden in der Literatur zu Topic Detection in Textdaten gegeben werden. Best Practices und aktuelle Beispiele aus der Unternehmens­praxis sowie ein kritischer Vergleich von Methoden in der Theorie runden die Arbeit ab.

Voraussetzung: „Big Data Analytics – Methoden und Anwendungen

Thema 10

Sentiment Analysis auf Basis von Twitter

Sentiment Analysis bezeichnet die automatisierte Erkennung von Stimmungsbildern in Textnachrichten. Da bspw. (potenzielle) Kunden immer häufiger über soziale Medien wie gerade Twitter ihre Meinung zu Unternehmen und ihren Produkten äußern, ist es für den Erfolg der Unternehmen essentiell ihr Erscheinungsbild auf sozialen Plattformen zu messen. Ein anderes Beispiel für ein Einsatzgebiet von Sentiment Analysis ist in der Politik. Hier kann es zur Prognose von Wahlerfolgen genutzt werden. Die Sentiment Analysis bietet ein breites Spektrum an Anwendungsbereichen. Twitter bietet sich aufgrund der leichtzugänglichen Daten für eine Sentiment Analysis an und wurde daher in der Forschung oft als Datenquelle genutzt, um die Güte der verschiedenen Sentiment Analysis-Methoden zu evaluieren.

Im Rahmen der Seminararbeit soll ein strukturierter Überblick über Methoden aus der Literatur zur Sentiment Analysis gegeben werden. Best Practices und aktuelle Beispiele aus der Unternehmens­praxis sowie ein kritischer Vergleich zwischen Methoden in der Theorie runden die Arbeit ab.

Voraussetzung: Eine der Veranstaltungen „Social Network Analysis – Methoden, Konzepte und Anwendungen“ oder „Big Data Analytics – Methoden und Anwendungen“

Bearbeitung

Die Themen können nur alleine bearbeitet werden. Zur Erlangung des Leistungsnachweises ist die Anfertigung einer Seminararbeit sowie einer Präsentation (10 Minuten) mit anschließender Diskussion (5 Minuten) notwendig.

Meilensteine

Themenvergabe mit Hilfe des zentralen Tools:

·         Deutsche Version:
econ.mathematik.uni-ulm.de/semapps/stud_de/

·         Englische Version:
econ.mathematik.uni-ulm.de/semapps/stud_en/

Zwischenpräsentation:
Zeitpunkt und Ort werden rechtzeitig bekannt gegeben

Abgabe der Seminararbeiten:
Termin wird rechtzeitig bekannt gegeben

Endpräsentation:
Zeitpunkt und Ort werden rechtzeitig bekannt gegeben

Allgemeine Anforderungen

 
  • analytische und konzeptionelle Fähigkeiten
  • selbständige, zielorientierte und systematische Arbeitsweise

 

Weitere Informationen siehe Webpage
www.uni-ulm.de/mawi/itop.html