Seminar: Advances in Artificial Intelligence

Inhalt

Künstliche Intelligenz (KI) befasst sich mit der Entwicklung von Methoden, Techniken und Werkzeugen, die die Autonomie, Flexibilität und Adaptivität von Softwaresystemen enorm erhöhen. Anwendungssysteme, in dieser Weise mit intelligenten Komponenten versehen, sind z. B. in der Lage natürliche Sprache zu verstehen, automatisch Schlussfolgerungen zu ziehen, Gegenstände zu erkennen und selbständig zu lernen. Der Anwendungsbereich dieser intelligenten Systeme reicht von industriellen Applikationen, über Web-basierte Assistenzsysteme bis hin zu Steuerungssystemen für autonome Fahrzeuge.

Das Seminar befasst sich mit Themen aus den aktuellen Forschungsbereichen der Mitarbeiter des Instituts und bietet somit einen tiefgehenden Einblick in den weiten Bereich, in dem KI-Systeme schon heute nutzbringend eingesetzt werden.

Die einzelnen Themen werden unter Anleitung selbstständig erarbeitet und recherchiert. Die Präsentation und abschließende Diskussion der Beiträge erfolgt im Rahmen eines Workshops am Ende des Semesters.

Termine

24.10.13 Vorbesprechung
14.11.13, 16:00 Uhr, O27/429
- Kurzvorträge
- Vortrag zur Erstellung einer Ausarbeitung
Do. 12.12.13, Abgabe der Ausarbeitung
Do. 19.12.13, 16:00 Uhr, O27/429
- Besprechungen zum Peer-Review
- Vortrag zur Erstellung einer Präsentation
Do. 23.1.14, Abgabe der Präsentation, Abgabe der überarbeiteten Ausarbeitung
Do. 06.02.14., 15:00 - 18:00 Uhr (s.t.) in O27/441, Abschluss-Vorträge

Material

Vortrag zur Literaturrecherche
Vortrag zur Erstellung der Ausarbeitung
LaTeX-Vorlage für die Seminararbeit
Web-Resourcen zur Erstellung der Ausarbeitung (Englisch)
- The Beauty of Outlines
- How to Write a Paper in Scientific Journal Style...
Peer-Review Bewertungsbogen
ausführlicher Foliensatz im Netz "Wie halte ich einen Vortrag?"
kurzer Vortrag zur Erstellung eines Vortrags

Verfügbare Themen

Trial based Heuristic Tree Search for Finite Horizon MDPs

Ansätze zur Generierung von Lösungen für Markov Decision Processes (MDPs) sind beispielsweise Real-Time Dynamic Programming (RTDP), Monte-Carlo Tree Search (MCTS) und auch AO*. Alle diese Ansätze können im Framework Trial-Based Heuristic Search dargestellt werden. Dieses Framework betrachtet die jeweiligen Ansätze als spezifische Kombination von fünf elementaren Zutaten. Dadurch ermöglicht das Framework es auch, die einzelnen Zutaten gezielt neu zu kombinieren. Inhalt des Themas ist die Erarbeitung der einzelnen Ansätze mit ihren jeweiligen Vor- und Nachteilen als Instanzen des Frameworks.

Behandlung qualitativer Unsicherheit durch heuristische Suche

In dieser Arbeit wird ein bestimmter Ansatz zum Lösen
nicht-deterministischer Planungsprobleme untersucht. Ein solches Problem
beschreibt die Anforderung, bestimmte Ziele ausgehend von einem aktuellen
Zustand zu erfüllen. Während die Umgebung als voll observierbar
angenommen wird, können Aktionen potentiell mehrere Ausgänge haben.
Lösungen entsprechen Strategien, die das Erfüllen aller Ziele
garantieren, unabhängig davon, welche Aktions-Ausgänge bei der Ausführung der
Strategie eintreten.
Der hierzu verfolgte Ansatz erfordert die Verwendung einer bestimmten
Heuristik (Ziel-Distanz-Schätzung), die im Detail erörtert wird.

Point-Based Value Iteration

Value Iteration (VI) ist ein naiver Algorithmus zur Generierung von Lösungen, sogenannten Policies, für POMDPs, der allerdings nur sehr schlecht skaliert. Point-Based Value Iteration (PBVI) begrenzt die Komplexität der Berechnung durch eine gezielte Approximation des Vorgehens von VI. PBVI ist deshalb in der Lage interessantere Probleme zu lösen. Inhalt des Themas ist die Erarbeitung der Funktionsweise der Algorithmen Value Iteration und Point-Based Value Iteration.

Monte-Carlo Planning in large POMDPs

Monte-Carlo Tree Search (MCTS) bezeichnet eine Familie von Algorithmen, die Suchprobleme durch probabilistische Erforschung des Suchraums lösen. Als solche eignen sie sich auch für die Anwendung auf POMDPs. Hier ergeben sich sogar Synergien, die die Verwebung von Policy-Generierung und Policy-Ausführung vereinfachen und beim POMCP-Algorithmus ausgenutzt werden. Inhalt des Themas ist die Erarbeitung der Funktionsweise von MCTS und speziell des POMCP-Algorithmus.

Dozent

Prof. Dr. Susanne Biundo-Stephan

Betreuer

Pascal Bercher

Felix Richter