Systembiologische Analyse und Modellbildung

Ein Vergleich von Änderungen der Genexpression in Stammzellen und regenerativen Geweben von Modellorganismen, genetischen Modellen und Alterung im Menschen wird unser Verständnis der menschlichen Alterung verbessern und die Wahl von Modellsystemen unterstützen, die für spezifische Aspekte der menschlichen Alterung relevant sind. Um die Analyse in diesem Kontext durchzuführen, werden in Abhängigkeit von den verfügbaren Daten mathematische Modelle verschiedener Granularität entwickelt. Hiermit können beispielsweise Interaktionen und funktionale Redundanz zwischen den wichtigsten beteiligten Signalwegen untersucht werden.

Aus einem mathematischen Blickwinkel haben Redundanz und Robustheit der Systeme und Subsysteme einen maßgeblichen Einfluss auf die Alterung: In Systemen, die aus hochgradig redundanten Elementen mit konstanten Ausfallquoten bestehen, können Phänomene wie die Verringerung der Mortalität im hohen Alter erklärt werden. Diese mathematischen Modelle können statisch oder dynamisch sein und verschiedene Unsicherheitsmaße beinhalten, so dass eine variable Anzahl von Parametern spezifiziert werden muss (beispielsweise Differentialgleichungen, Boole'sche Netwerke, regelbasierte Formalismen). Letztendlich sind abstraktere Beschreibungen unerlässlich, da der Zustand eines Systems nicht in all seinen Details gemessen werden kann. Auf einer solchen abstrakten Ebene gesehen sind alle dynamischen Eigenschaften solcher Systeme stochastisch.

Das Arbeitspaket Modellierung gliedert sich in die Teilarbeitspakete:

  • D.a Datenvorverarbeitung
  • D.b Multimodale Informationsintegration
  • D.c Kontinuierliche Modellierung
  • D.d Regel-basierte Modellierung
  • D.e Stochastische Modellierung

D.a. Datenvorverarbeitung

Das Arbeitspaket zur Datenvorverarbeitung dient der Aufbereitung und Analyse der primären experimentellen Daten. Beteiligt sind die Arbeitsgruppen Kestler und Palm. Es werden Standard Operating Procedures zur Auswertung der Agilent Genexpressionsprofile und der RNA-Seq Daten definiert. Diese Methoden implementieren das Vorgehen zur Normalisierung und Bestimmung differentieller Gene aus den Expressionsprofilen der verschiedenen Organismen. Es werden Prozeduren zum maschinellen Lernen eines Gene-Rankings auf der Menge der differentiellen Gene weiterentwickelt. Ein weiterer Teilaspekt ist die Entwicklung von Methoden zur Differenzierung zwischen „alten“ und „jungen“ Expressionsprofilen. Hierfür werden Verfahren zur Merkmalsselektion weiterentwickelt. Weiter werden Klassifikationsverfahren zur Einstufung von hochdimensionalen und niedrig-kardinaligen Expressionsprofilen entwickelt.

D.b. Multimodale Informationsintegration

Ziel dieses Arbeitspakets ist die Integration biologischen Hintergrundwissens und die Erstellung von Assoziationen zu den identifizierten differentiellen Genen. Unter Einbindung externer Datenbanken (z.B. KEGG, TRANSPATH) werden statistisch überrepräsentierte Pathways zu den Experimenten bestimmt. Assoziationen zu funktionalen Geninformationen werden aus der Gene Ontology Datenbank gewonnen. Diese Assoziationen werden in die zentrale Datenbank verlinkt. Es werden Methoden zur Einbindung von Unsicherheit in die Integration von Expressions, Pathway und Gene Ontology Informationen entwickelt. Es werden semantische Beschreibungssprachen (RDF/OWL) zur Modellierung der Ontologien und zur semantischen Suche eingesetzt.

D.c. Kontinuierliche Modellierung

In diesem Teil-Arbeitspaket sollen Modellierungs- und Simulationsverfahren entwickelt und adaptiert werden die eine zeitkontinuierliche Modellierung intrazellulärer Signalwege auf der Basis von Differential-Gleichungen (DGL) erlauben. Insbesondere sollen hier auch Erweiterung diese Modellierungsansatzes eine Rolle spielen wie z.B. die Verwendung von Time-Delays und Kompartmentbildung. Mit diesen Modellen sollen spezifisch die Aging relevanten Signalpfade wie notch, p53, NFκB und Wnt modelliert werden.

 

D.d. Regelbasierte und graphische Modellierung

Die Modellierung größerer Netzwerke ist durch regelbasierte und graphische Modelle möglich. Im Sinne eines Mehrebenen Modells sollen diese Ansätze dabei eher, im Gegensatz zu DGL-Modellen, qualitative Eigenschaften größerer Netzwerke abbilden. Hier sollen nun insbesondere das Wnt Signalnetzwerk in einem dynamischen regelbasierten probabilistischen Modell abgebildet werden. Weiterhin ist eine statische und qualitative regelbasierte (Boolsche Netzwerke mit synchronen update) Modellierung der Interaktion verschiedenen Signalpfade geplant. Bei (probabilistischen) graphischen Modellen könnte dies eine Veränderung der Verteilung der Wahrscheinlichkeiten oder der Struktur auf dem Graphen bedeuten, die dann wiederum Rückschlüsse auf die in der Alterung wichtigen Compounds zulässt.

 

D.e. Stochastische Modellierung

In diesem Teilpaket soll die altersabhängige stochastische Genexpressionsvariation untersucht werden. Dazu sollen (statische) mathematische Modelle entwickelt werden und die Daten aus den Projektteilen B und C integriert werden.

Beteiligte Arbeitsgruppen

Folgende Arbeitsgruppen sind an diesem Arbeitspaket beteiligt:

  • Hans A. Kestler (Bioinformatik & Systembiologie)
  • Günther Palm (Neuroinformatik)
  • Ulrich Stadtmüller (Stochastik)
  • NN Junior PI
  • NN Senior PI