zum Inhalt springen

Hans Kestler bringt Ordnung in die Bio-Daten

Hans Kestler ist ein Grenzgänger zwischen Ulmer Fakultäten, Verwaltungen und Disziplinen. Molekularbiologen und Biomediziner auf dem Ulmer Campus reißen sich um den quirligen Endvierziger. Sie alle brauchen Hilfe vom Systembiologen, der ihren gigantischen Datenmengen mit Modellen und Algorithmen beikommt.

Kestler ist studierter Elektroingenieur („das ist angewandte Mathematik“) und leitet am Institut für Neuroinformatik der Universität Ulm die Forschungsgruppe für Bioinformatik und Systembiologie. Die Zahl seiner laufenden Projekte kann er auf Anhieb nicht nennen, so viele sind es mittlerweile: „Ich ertrinke in Arbeit“, sagt er beiläufig. In der Tat findet, wer danach sucht, in auffällig vielen biowissenschaftlichen Arbeiten Ulmer Forscher der letzten Jahre Kestlers Namen. Sorgen um sein Arbeitspensum begegnet er launig mit den Worten: „Ich mag ziemlich gern viele Action“.

Maschinelle Lernverfahren müssen Datenflut Herr werden

PD Dr. Hans Kestler © Pytlik

Zwei Paradigmenwechsel in der Biologie haben Leute wie ihn unverzichtbar für Lebenswissenschaftler gemacht: Hochdurchsatzverfahren, Omics-Technologien und molekulare Bildgebung haben das Daten-Rinnsal zu einem gigantischen Datenstrom anschwellen lassen. „Wir brauchen statistische maschinelle Lernverfahren, um mit diesen Daten zurechtzukommen, um daraus Wissen zu generieren", sagt Kestler. Er nennt das „Wissensextraktion" auf einer symbolischen Ebene:  Messdaten, die noch keine Bedeutung haben, müssen auf eine „Ebene übertragen werden, die wir verstehen, auf eine Wissensrepräsentations-Ebene mit Wenn-Dann-Regeln beispielsweise".  

Der zweite Paradigmenwechsel hat die Komplexitätsschraube etliche Umdrehungen hochgedreht. Noch vor zehn Jahren stellte sich die Forschung die zelluläre Informationsverarbeitung in (Signal-)Pfaden vor. Heute weiß man: Es ist viel komplexer; Zellen verarbeiten ihre Informationen über ganze Netzwerke mit wichtigen vernetzten Knoten darin. Vorbei die Zeiten, als einzelne Forscher alle möglichen Konfigurationen in einem Experiment durchspielen konnten. Diesen Part übernehmen leistungsstarke Rechner, die von Bioinformatikern wie Hans Kestler instruiert werden.  

Ein iterativer Prozess, der enge Kooperation erfordert

Es sind Methoden des maschinellen Lernens, der Statistik und der dynamischen Modellierung (Differentialgleichungssysteme und Simplifikationen wie Boolesche Netzwerke), mit denen Hans Kestler diese Datenmengen zu bändigen sucht. Dafür müssen beide Seiten eng zusammenarbeiten. Das sei ein iterativer Prozess: Ein in silico entwickeltes Modell muss im steten Wechselspiel mit Laborergebnissen und allem verfügbaren Wissen überprüft, angepasst und auf dem Wege des Falsifizierens, Verifizierens und Verbesserns optimiert werden. Ein übersichtlicher Campus wie der Ulmer sei für solch enge Zusammenarbeit ideal, betont Kestler.

Dort ist er seit 1992 tätig, als er sich nach dem Studium gegen einen Industriejob und für ein Angebot des Ulmer Uniklinikums entscheidet. Die Kardiologie sucht einen Experten für die Einstufung hochverstärkter Elektrokardiogramme mit Hilfe neuronaler Netze. Kestler kann damit gewissermaßen seine Diplomarbeit fortführen. Er tritt an unter der Voraussetzung, dass ihn die Ulmer Informatik als Doktorand annimmt. „In der Informatik war ich als E-Techniker ein Alien“, weshalb er als ‚Externer‘ eine dreistündige Fächerprüfung bei drei Professoren ablegen muss. Nach dreieinhalb Jahren in der Kardiologie wechselt Kestler in die Neuroinformatik als Doktorand zu Günther Palm, behält aber sein Zimmer in der Kardiologie. Diese Zweigleisigkeit begleitet Hans Kestlers Wirken seither.

Forschungsdozentur wird zur Initialzündung

Mit dem Venn-Diagramm lassen sich komplexe Gen-Zusammenhänge visualisieren. © Kestler, Uni Ulm

2003 erhält Kestler eine auf fünf Jahre angelegte Forschungsdozentur des Stifterverbandes für die Deutsche Wissenschaft. Sie passt in kein Raster, ist so erfolgreich, dass eine andere Stiftung weiteres Geld zuschießt. Sie gibt seiner Forschung „den totalen Kick". Großen Anteil daran hat auch sein Mentor Guido Adler, einer der einflussreichsten Universitätsmediziner (inzwischen Chef des Heidelberger Uniklinikums); er hievt Kestler endgültig in die Bioinformatik.

Die Forschungsdozentur macht Hans Kestler am Ulmer Campus relativ schnell bekannt - viele  Kooperationsprojekte sind die Folge. So entwickelt er 2005 in der Arbeitsgruppe von Thomas Gress (Abt. Innere Medizin II) eine neue Methode zur Visualisierung komplexer Gen-Zusammenhänge mit Hilfe eines neuen flächenproportionalen Venn-Diagramms, das alle Beziehungen zwischen den betrachteten Mengen darstellt. Daraus kann man Zusammenhänge ablesen und aus vorliegenden einzelnen Relationen auf andere schließen.

Warum Entwicklungsbiologen Modelle brauchen

Mit einem Zustandsdiagramm lassen sich das Verhalten eines (beispielsweise biologischen) Systems oder die zulässige Nutzung der Schnittstelle eines Systems bestimmen. © Kestler, Uni Ulm

Schnell kommt Kestler auch in Kontakt mit dem Entwicklungsbiologen Michael Kühl (Direktor des Instituts für Biochemie und Molekulare Biologie). Dieser sucht jemanden für die Modellierung dynamischer Systeme in der Biologie. Kühl hat entdeckt, dass die artenübergreifende Entwicklung des Herzen wohl von einem hochkonservierten Gen-Netzwerk gesteuert wird. Ob sich dieses den Arten anpasst, möglicherweise erweitert und mit anderen Signalnetzwerken interagiert, kann der Biochemiker Kühl nur mit mathematischer Hilfe herausfinden.

„Wir waren froh, endlich einmal Probleme zu haben für unsere lernenden Systeme, die auch eine gewisse Relevanz haben", erinnert sich Kestler an die 2000er-Jahre. Und schwärmt gleich von den „tollen kurzen Wegen hier in Ulm", wo er sich zwei Minuten später mit Kollegen aus den Lebenswissenschaften in der Cafeteria treffen und sich beispielsweise mit Michael Kühl über das mathematische Modell des WNT-Signalweges austauschen kann, der eine wichtige Rolle bei der Krebsentstehung, der Embryonalentwicklung und auch im Alterungsprozess spielt.

Mit mathematischen Modellen dem molekularen Altern auf der Spur

Grafische Darstellung der Folgen eines Schadens im Gen h2afx, das zur Bildung des Nukleosoms und damit zur Struktur der Erbsubstanz DNA beiträgt. © Kestler, Uni Ulm
Vorläufiger Höhepunkt seines Ulmer Wirkens: Mit „Systar" (systems biology analysis of impaired stem cell function and regeneration during aging) hat er zusammen mit Lenhard Rudolph (jetzt Leibniz-Institut für Altersforschung) einen dicken Fisch an Land gezogen. 7,4 Mio. Euro hat dafür das Bundesforschungsministerium gegeben; Ende 2012 ist das Verbundprojekt angelaufen, in dem 14 Ulmer Forschergruppen - Kliniker, Grundlagenforscher, Bioinformatiker und Mathematiker - erstmals zusammen arbeiten, um diejenigen molekularen Mechanismen zu identifizieren, die mit einer altersabhängigen verminderten Stammzellfunktion und einer Erschöpfung der Regenerationsfähigkeit in Verbindung stehen. Eines der Kernziele ist es, systembiologische Ansätze zur Generierung von mathematischen Modellen der Stammzellalterung auf Basis experimenteller Daten zu nutzen. Für ein zweites Großprojekt, den Ulmer SFB 1074 (Experimental Models and Clinical Translation in Leukemia) liefert und verbessert Kestlers Arbeitsgruppe die komplexe Datenanalyse. Damit lassen sich robuste Vorhersagen zur Klassifizierung hochdimensionaler Daten niedriger Sample-Größe treffen. Kestlers Expertise ist in vielen Bereichen lebenswissenschaftlicher Forschung gefragt: Mit Pathologen erstellt er eine Lymphom-Datenbank, mit dem Virologen Thomas Mertens etabliert er eine Datenbank zur Medikamentenresistenz bei bestimmten Mutationen im Genom des HCMV (Humanes Cytomegalie-Virus). Wie unverzichtbar die Bioinformatik inzwischen geworden ist, zeigt eine andere hochrangig publizierte Arbeit zu einem möglichen Alzheimer-Biomarker (Watabe-Rudolph, Neurology, 2012).

Ungelöstes Problem: der Umgang mit Forschungsdaten

Kaum hat sich herumgesprochen, dass datenhungrige Lebenswissenschaftler auf die Hilfe von Mathematikern/Informatikern angewiesen sind - und damit auch auf große und schnelle Rechnerkapazitäten -, da stellt sich schon ein Folgeproblem ein: der Umgang mit Forschungsdaten, ihre langfristige Speicherung und personalintensive Verwaltung. Das hat Hans Kestler jüngst auf einem Workshop der Deutschen Forschungsgemeinschaft festgestellt.
Es überrascht nicht, wenn Hans Kestler erzählt, dass sich seine Mitarbeiter (Biotechnologen, Physiker, Informatiker) fast überall auf dem Campus verteilen und von unterschiedlichen Einrichtungen und Fördertöpfen finanziert werden. „Es ist alles ein bisschen heterogen, aber es passt alles zusammen“, schiebt Hans Kestler lächelnd nach. Das passt auch zu seiner Ankündigung, dass er mit Martin Bossert vom Institut für Nachrichtentechnik einen Antrag für den DFG-Schwerpunkt Informations- und Kommunikationstheorie in der Molekularbiologie (InKoMBio) einreicht. Es scheint kaum noch Disziplinen zu geben, die auf angewandte Mathematik verzichten können.

Literaturhinweis:
Watabe-Rudolph M et al:Chitinase enzyme activity in CSF is a powerful biomarker of Alzheimer disease, Neurology. 2012 Feb 21;78(8):569-77. (doi: 10.1212/WNL.0b013e318247caa1. Epub 2012 Feb 8.)

Seiten-Adresse: https://www.gesundheitsindustrie-bw.de/fachbeitrag/aktuell/hans-kestler-bringt-ordnung-in-die-bio-daten