Powered by

Hans Kestler bringt Ordnung in die Bio-Daten

Hans Kestler ist ein Grenzgänger zwischen Ulmer Fakultäten, Verwaltungen und Disziplinen. Molekularbiologen und Biomediziner auf dem Ulmer Campus reißen sich um den quirligen Endvierziger. Sie alle brauchen Hilfe vom Systembiologen, der ihren gigantischen Datenmengen mit Modellen und Algorithmen beikommt.

Kestler ist studierter Elektroingenieur („das ist angewandte Mathematik“) und leitet am Institut für Neuroinformatik der Universität Ulm die Forschungsgruppe für Bioinformatik und Systembiologie. Die Zahl seiner laufenden Projekte kann er auf Anhieb nicht nennen, so viele sind es mittlerweile: „Ich ertrinke in Arbeit“, sagt er beiläufig. In der Tat findet, wer danach sucht, in auffällig vielen biowissenschaftlichen Arbeiten Ulmer Forscher der letzten Jahre Kestlers Namen. Sorgen um sein Arbeitspensum begegnet er launig mit den Worten: „Ich mag ziemlich gern viele Action“.

Maschinelle Lernverfahren müssen Datenflut Herr werden

PD Dr. Hans Kestler © Pytlik

Zwei Paradigmenwechsel in der Biologie haben Leute wie ihn unverzichtbar für Lebenswissenschaftler gemacht: Hochdurchsatzverfahren, Omics-Technologien und molekulare Bildgebung haben das Daten-Rinnsal zu einem gigantischen Datenstrom anschwellen lassen. „Wir brauchen statistische maschinelle Lernverfahren, um mit diesen Daten zurechtzukommen, um daraus Wissen zu generieren", sagt Kestler. Er nennt das „Wissensextraktion" auf einer symbolischen Ebene:  Messdaten, die noch keine Bedeutung haben, müssen auf eine „Ebene übertragen werden, die wir verstehen, auf eine Wissensrepräsentations-Ebene mit Wenn-Dann-Regeln beispielsweise".  

Der zweite Paradigmenwechsel hat die Komplexitätsschraube etliche Umdrehungen hochgedreht. Noch vor zehn Jahren stellte sich die Forschung die zelluläre Informationsverarbeitung in (Signal-)Pfaden vor. Heute weiß man: Es ist viel komplexer; Zellen verarbeiten ihre Informationen über ganze Netzwerke mit wichtigen vernetzten Knoten darin. Vorbei die Zeiten, als einzelne Forscher alle möglichen Konfigurationen in einem Experiment durchspielen konnten. Diesen Part übernehmen leistungsstarke Rechner, die von Bioinformatikern wie Hans Kestler instruiert werden.  

Ein iterativer Prozess, der enge Kooperation erfordert

Es sind Methoden des maschinellen Lernens, der Statistik und der dynamischen Modellierung (Differentialgleichungssysteme und Simplifikationen wie Boolesche Netzwerke), mit denen Hans Kestler diese Datenmengen zu bändigen sucht. Dafür müssen beide Seiten eng zusammenarbeiten. Das sei ein iterativer Prozess: Ein in silico entwickeltes Modell muss im steten Wechselspiel mit Laborergebnissen und allem verfügbaren Wissen überprüft, angepasst und auf dem Wege des Falsifizierens, Verifizierens und Verbesserns optimiert werden. Ein übersichtlicher Campus wie der Ulmer sei für solch enge Zusammenarbeit ideal, betont Kestler.

Dort ist er seit 1992 tätig, als er sich nach dem Studium gegen einen Industriejob und für ein Angebot des Ulmer Uniklinikums entscheidet. Die Kardiologie sucht einen Experten für die Einstufung hochverstärkter Elektrokardiogramme mit Hilfe neuronaler Netze. Kestler kann damit gewissermaßen seine Diplomarbeit fortführen. Er tritt an unter der Voraussetzung, dass ihn die Ulmer Informatik als Doktorand annimmt. „In der Informatik war ich als E-Techniker ein Alien“, weshalb er als ‚Externer‘ eine dreistündige Fächerprüfung bei drei Professoren ablegen muss. Nach dreieinhalb Jahren in der Kardiologie wechselt Kestler in die Neuroinformatik als Doktorand zu Günther Palm, behält aber sein Zimmer in der Kardiologie. Diese Zweigleisigkeit begleitet Hans Kestlers Wirken seither.

Forschungsdozentur wird zur Initialzündung

Mit dem Venn-Diagramm lassen sich komplexe Gen-Zusammenhänge visualisieren. © Kestler, Uni Ulm

2003 erhält Kestler eine auf fünf Jahre angelegte Forschungsdozentur des Stifterverbandes für die Deutsche Wissenschaft. Sie passt in kein Raster, ist so erfolgreich, dass eine andere Stiftung weiteres Geld zuschießt. Sie gibt seiner Forschung „den totalen Kick". Großen Anteil daran hat auch sein Mentor Guido Adler, einer der einflussreichsten Universitätsmediziner (inzwischen Chef des Heidelberger Uniklinikums); er hievt Kestler endgültig in die Bioinformatik.

Die Forschungsdozentur macht Hans Kestler am Ulmer Campus relativ schnell bekannt - viele  Kooperationsprojekte sind die Folge. So entwickelt er 2005 in der Arbeitsgruppe von Thomas Gress (Abt. Innere Medizin II) eine neue Methode zur Visualisierung komplexer Gen-Zusammenhänge mit Hilfe eines neuen flächenproportionalen Venn-Diagramms, das alle Beziehungen zwischen den betrachteten Mengen darstellt. Daraus kann man Zusammenhänge ablesen und aus vorliegenden einzelnen Relationen auf andere schließen.

Warum Entwicklungsbiologen Modelle brauchen

Mit einem Zustandsdiagramm lassen sich das Verhalten eines (beispielsweise biologischen) Systems oder die zulässige Nutzung der Schnittstelle eines Systems bestimmen. © Kestler, Uni Ulm

Schnell kommt Kestler auch in Kontakt mit dem Entwicklungsbiologen Michael Kühl (Direktor des Instituts für Biochemie und Molekulare Biologie). Dieser sucht jemanden für die Modellierung dynamischer Systeme in der Biologie. Kühl hat entdeckt, dass die artenübergreifende Entwicklung des Herzen wohl von einem hochkonservierten Gen-Netzwerk gesteuert wird. Ob sich dieses den Arten anpasst, möglicherweise erweitert und mit anderen Signalnetzwerken interagiert, kann der Biochemiker Kühl nur mit mathematischer Hilfe herausfinden.

„Wir waren froh, endlich einmal Probleme zu haben für unsere lernenden Systeme, die auch eine gewisse Relevanz haben", erinnert sich Kestler an die 2000er-Jahre. Und schwärmt gleich von den „tollen kurzen Wegen hier in Ulm", wo er sich zwei Minuten später mit Kollegen aus den Lebenswissenschaften in der Cafeteria treffen und sich beispielsweise mit Michael Kühl über das mathematische Modell des WNT-Signalweges austauschen kann, der eine wichtige Rolle bei der Krebsentstehung, der Embryonalentwicklung und auch im Alterungsprozess spielt.

Mit mathematischen Modellen dem molekularen Altern auf der Spur

Grafische Darstellung der Folgen eines Schadens im Gen h2afx, das zur Bildung des Nukleosoms und damit zur Struktur der Erbsubstanz DNA beiträgt. © Kestler, Uni Ulm
Vorläufiger Höhepunkt seines Ulmer Wirkens: Mit „Systar" (systems biology analysis of impaired stem cell function and regeneration during aging) hat er zusammen mit Lenhard Rudolph (jetzt Leibniz-Institut für Altersforschung) einen dicken Fisch an Land gezogen. 7,4 Mio. Euro hat dafür das Bundesforschungsministerium gegeben; Ende 2012 ist das Verbundprojekt angelaufen, in dem 14 Ulmer Forschergruppen - Kliniker, Grundlagenforscher, Bioinformatiker und Mathematiker - erstmals zusammen arbeiten, um diejenigen molekularen Mechanismen zu identifizieren, die mit einer altersabhängigen verminderten Stammzellfunktion und einer Erschöpfung der Regenerationsfähigkeit in Verbindung stehen. Eines der Kernziele ist es, systembiologische Ansätze zur Generierung von mathematischen Modellen der Stammzellalterung auf Basis experimenteller Daten zu nutzen. Für ein zweites Großprojekt, den Ulmer SFB 1074 (Experimental Models and Clinical Translation in Leukemia) liefert und verbessert Kestlers Arbeitsgruppe die komplexe Datenanalyse. Damit lassen sich robuste Vorhersagen zur Klassifizierung hochdimensionaler Daten niedriger Sample-Größe treffen. Kestlers Expertise ist in vielen Bereichen lebenswissenschaftlicher Forschung gefragt: Mit Pathologen erstellt er eine Lymphom-Datenbank, mit dem Virologen Thomas Mertens etabliert er eine Datenbank zur Medikamentenresistenz bei bestimmten Mutationen im Genom des HCMV (Humanes Cytomegalie-Virus). Wie unverzichtbar die Bioinformatik inzwischen geworden ist, zeigt eine andere hochrangig publizierte Arbeit zu einem möglichen Alzheimer-Biomarker (Watabe-Rudolph, Neurology, 2012).

Ungelöstes Problem: der Umgang mit Forschungsdaten

Kaum hat sich herumgesprochen, dass datenhungrige Lebenswissenschaftler auf die Hilfe von Mathematikern/Informatikern angewiesen sind - und damit auch auf große und schnelle Rechnerkapazitäten -, da stellt sich schon ein Folgeproblem ein: der Umgang mit Forschungsdaten, ihre langfristige Speicherung und personalintensive Verwaltung. Das hat Hans Kestler jüngst auf einem Workshop der Deutschen Forschungsgemeinschaft festgestellt.
Es überrascht nicht, wenn Hans Kestler erzählt, dass sich seine Mitarbeiter (Biotechnologen, Physiker, Informatiker) fast überall auf dem Campus verteilen und von unterschiedlichen Einrichtungen und Fördertöpfen finanziert werden. „Es ist alles ein bisschen heterogen, aber es passt alles zusammen“, schiebt Hans Kestler lächelnd nach. Das passt auch zu seiner Ankündigung, dass er mit Martin Bossert vom Institut für Nachrichtentechnik einen Antrag für den DFG-Schwerpunkt Informations- und Kommunikationstheorie in der Molekularbiologie (InKoMBio) einreicht. Es scheint kaum noch Disziplinen zu geben, die auf angewandte Mathematik verzichten können.

Literaturhinweis:
Watabe-Rudolph M et al:Chitinase enzyme activity in CSF is a powerful biomarker of Alzheimer disease, Neurology. 2012 Feb 21;78(8):569-77. (doi: 10.1212/WNL.0b013e318247caa1. Epub 2012 Feb 8.)

Glossar

  • Biotechnologie ist die Lehre aller Verfahren, die lebende Zellen oder Enzyme zur Stoffumwandlung und Stoffproduktion nutzen.
  • Ein Gen ist ein Teil der Erbinformation, der für die Ausprägung eines Merkmals verantwortlich ist. Es handelt sich hierbei um einen Abschnitt auf der DNA, der die genetische Information zur Synthese eines Proteins oder einer funktionellen RNA (z. B. tRNA) enthält.
  • Das Genom ist die gesamte Erbsubstanz eines Organismus. Jede Zelle eines Organismus verfügt in Ihrem Zellkern über die komplette Erbinformation.
  • Lytisch zu sein ist die Eigenschaft eines Bakteriophagen, seine Wirtszelle bei der Infektion zu zerstören.
  • Mit dem Begriff Mutation wird jede Veränderung des Erbguts bezeichnet (z. B. Austausch einer Base; Umstellung einzelner DNA-Abschnitte, Einfügung zusätzlicher Basen, Verlust von Basen oder ganzen DNA-Abschnitten). Mutationen kommen ständig in der Natur vor (z. B. ausgelöst durch UV-Strahlen, natürliche Radioaktivität) und sind die Grundlage der Evolution.
  • Translation im biologischen Sinn ist der Prozess, bei dem die Basensequenz der mRNA in die Aminosäuresequenz des Proteins übersetzt (translatiert) wird. Dieser Vorgang findet an den Ribosomen statt. Nach der Vorlage eines einzigen mRNA-Moleküls können zahlreiche Proteinmoleküle synthetisiert werde
  • Ein Virus ist ein infektiöses Partikel (keine Zelle!), das aus einer Proteinhülle und aus einem Genom (DNA oder RNA) besteht. Um sich vermehren zu können, ist es vollständig auf die Stoffwechsel der lebenden Zellen des Wirtsorganismus angewiesen (z.B. Bakterien bei Phagen, Leberzellen beim Hepatitis-A-Virus).
  • Bioinformatik ist eine Wissenschaft, die sich mit der Verwaltung und Analyse biologischer Daten mit Hilfe modernster Computertechnik, befasst. Dient derzeit hauptsächlich zur Vorhersage der Bedeutung von DNA-Sequenzen, der Proteinstruktur, des molekularen Wirkmechanismus und der Eigenschaften von Wirkstoffen. (2. Satz: mwg-biotech)
  • HTS steht für Hochdurchsatzverfahren; mit diesem automatisierten Verfahren kann in kurzer Zeit eine sehr hohe Anzahl von Wirkstoffen auf ihre biologische Wirksamkeit geprüft werden.
  • Neuron ist der Fachausdruck für Nervenzelle. Diese besteht aus einem Zellkörper, einem Axon und Dendriten.
  • Stammzellen sind Zellen, die die Fähigkeit zur unbegrenzten Zellteilung besitzen und die sich zu verschiedenen Zelltypen ausdifferenzieren können. Stammzellen können aus Embryonen, fötalem Gewebe und aus dem Gewebe Erwachsener gewonnen werden. In Deutschland ist die Gewinnung embryonaler Stammzellen verboten.
  • Ein Lymphom ist eine Gewebe-Neubildung in lymphatischen Geweben (Milz, Lymphknoten). Entzündliche, gutartige Vergrößerungen der Lymphknoten bei Infektionskrankheiten sind Ausdruck ihrer Abwehrtätigkeit. Maligne Lymphome sind bösartige Tumore des Lymphsystems und entstehen durch eine ungebremste monoklonale Vermehrung von Lymphozyten (weiße Blutkörperchen). Maligne Lymphome werden in Hodgkin-Lymphome und Non-Hodgkin-Lymphome unterteilt.
  • Biomarker sind messbare Produkte von Organismen (z.B. Proteine, Stoffwechselprodukte oder Hormone), die als Indikatoren beispielsweise für Umweltbelastungen oder Krankheiten herangezogen werden.
  • Biochemie ist die Lehre von den chemischen Vorgängen in Lebewesen und liegt damit im Grenzbereich zwischen Chemie, Biologie und Physiologie.
  • Die Molekularbiologie beschäftigt sich mit der Struktur, Biosynthese und Funktion von DNA und RNA und und deren Interaktion miteinander und mit Proteinen. Mit Hilfe von molekularbiologischen Daten ist es zum Beispiel möglich, die Ursache von Krankheiten besser zu verstehen und die Wirkungsweise von Medikamenten zu optimieren.
  • Die Pathologie ist ein Teilgebiet der Medizin, das sich mit der Erforschung und Lehre von den Ursachen, der Entstehung, der Verlaufform und der Auswirkungen von krankhaften Symptomen sowie von Missbildungen beschäftigt.
  • Die Neurologie ist ein Teilgebiet der Medizin und befasst sich mit den Erkrankungen des Nervensystems.
  • Molekular bedeutet: auf Ebene der Moleküle.
  • Die Alzheimer-Krankheit (auch Morbus Alzheimer genannt) ist eine langsam fortschreitende Demenz-Erkrankung, die sich in einer immer stärkeren Abnahme der Hirnfunktionen äußert. Sie tritt vor allem im Alter auf. Die Hauptursache von Alzheimer sind intrazelluläre Ablagerungen eines Fragments des Amyloid-Vorläufer-Proteins (APP), wodurch es zu einem zunehmenden Verlust von Nervenzellen und damit der Gehirnmasse kommt. Die Betroffenen zeigen anfangs nur eine geringfügigen Vergesslichkeit. In späteren Stadien sind vor allem die Sprache, das Denkvermögen und das Gedächtnis beeinträchtigt. Im Endstadium der Krankheit kommt es schließlich zu einem vollständigen Verlust des Verstandes sowie der Persönlichkeit der betroffenen Personen.
  • CSF ist die Abkürzung für: colony-stimulating factors; die englische Bezeichung für Kolonie stimulierende Faktoren.
  • Heterogenität bedeutet Ungleicheit bzw. Verschiedenheit in der Struktur.
  • Im Elektrokardiogramm (EKG) wird die Summe der elektrischen Aktivitäten aller Herzmuskelfasern registriert. Es wird durch Elektroden von Gliedmaßen und Brustwand abgeleitet und in einer Zeitachse aufgezeichnet (Elektrokardiographie). Aus dem Kurvenlauf lassen sich Aussagen zu Eigenschaften und Erkrankungen des Herzens (Herzrhythmusstörungen, Herzinfarkt) treffen.
  • Drastische Änderung eines bisher vorhandenen Denkmusters. Durch die Änderung wird eine völlig neue Grundlage für die Wissenschaft und die Forschung geschaffen. In der Biologie wird zum Beispiel die Evolution als Paradigmenwechsel zur Schöpfung angesehen.
  • Chitin ist ein Polysaccharid, das in Gliederfüßer, Pilzen, Ringelwürmern und Weichtieren vorkommt. Im Vergleich zur Cellulose trägt der Grundbaustein beta-Glucose eine N-Acetylgruppe.
  • Bei einer Chitinase handelt es sich um ein Enzym, dass den Abbau des Chitins katalysiert.
Seiten-Adresse: https://www.gesundheitsindustrie-bw.de/de/fachbeitrag/aktuell/hans-kestler-bringt-ordnung-in-die-bio-daten/