Powered by

Data-Mining: Neue Chancen für Medizin und Gesundheit

In der Forschung und im Gesundheitswesen werden riesige Datenmengen erzeugt, die sinnvoll ausgewertet werden müssen. Dies macht die rechnergestützte Extraktion relevanter Daten unter dem Einsatz statistischer Methoden nötig. Dieses Verfahren, das man als Data-Mining bezeichnet, ermöglicht es, sinnvolle Muster in großen Datenmengen zur erkennen. Besonders relevant ist Data-Mining zum Beispiel beim Einsatz von High-Throughput-Verfahren, beim Einsatz von Visualisierungstechniken und in der Telemedizin.

Mit zum Teil riesigen, computergesteuerten Gerätschaften teilt sich menschliche Arbeitskraft heutzutage die Wirkungsstätte. © GATC Biotech AG

Damit Daten nach bestimmten Vorgaben ausgewählt, aufbereitet und analysiert werden können, kooperieren Experten aus der Informatik, Mathematik und Statistik mit Spezialisten aus den jeweiligen Anwendungsgebieten - also etwa mit Biologen, Pharmazeuten oder Medizinern. Vertreter noch junger Berufsbilder wie Bioinformatiker und Systembiologen haben damit begonnen, das große Potenzial dieser Entwicklung zu erschließen.

Datenaufkommen sinnvoll nutzen

Derzeit arbeiten Anwender in Medizin und Forschung mit Datenvolumen im Terabyte- und Petabyte-Bereich. Alle zwei Jahre soll sich Schätzungen zufolge die weltweit insgesamt bestehende Datenmenge verdoppeln. Der Begriff „Big Data“ versucht das Ausmaß der Datenlawine zu beschreiben, die immer schneller auf Wissenschaftler und Institutionen zurollt. So verändern die schnellen Entwicklungen in der Genom- und Proteomforschung die Biowissenschaften auf geradezu dramatische Weise. Nicht nur die Datenressourcen im Bereich Genomsequenzierung werden angesichts der rasanten Entwicklung weiter steigen. Doch nützlich werden die Daten erst, wenn sie organisiert und durch den Einsatz von Data-Mining-Algorithmen anhand ihrer Muster interpretierbar werden.

Praktischer Nutzen im Gesundheitswesen

Eine Laborantin wertet Daten am Computer aus. © GATC Biotech AG

Konkreten Nutzen für den Alltag im Gesundheitswesen kann Data-Mining sowohl in wirtschaftlicher als auch in medizinischer und organisatorischer Hinsicht bieten. So lassen sich Datenressourcen in Krankenhäusern und Kliniken beispielsweise für Controllingprozesse, das medizinische Prozessmanagement oder für die Risikoerkennung aufbereiten. Verschiedene Data-Mining-Methoden und Modelle der Aufbereitung machen Datenressourcen übersichtlich und ermöglichen fachgerechte Interpretationen. Auch in der medizinischen Versorgung und Betreuung können Abfragen und Ergebnisse aus Data-Mining-Verfahren genutzt werden, beispielsweise durch das Abfragen von Vergleichsdaten aus medizinischen Analysen für Prophylaxe, Diagnose, Therapie oder Nachsorge.

Simulation lebender Zellen

Bioinformatik und Proteindesign gehen heute Hand in Hand. © BIOPRO/Bächtle

Allein in Baden-Württemberg existieren eine ganze Reihe von Biotechnologie-Unternehmen, die aufgrund ihrer technologischen Kernkompetenz das Thema „Big Data“-Handling im Fokus haben. Beispielhaft werden hier die Unternehmen Insilico Biotechnology AG in Stuttgart sowie die quantiom bioinformatics GmbH & Co. KG in Weingarten vorgestellt.

Die Insilico Biotechnology AG aus Stuttgart gestaltet und optimiert biotechnologische Prozesse für die chemische und pharmazeutische Industrie sowie für die Ernährungsindustrie. „Wir liefern Vorhersagen für das Verhalten von Zellen oder Organismen. Dadurch können wir die Entwicklungszeit für neue biotechnologische Prozesse verkürzen oder bestehende Prozesse optimieren - etwa für die Produktion von Medikamenten“, erklärt Klaus Mauch, Geschäftsführer von Insilico. Das Unternehmen verfügt über eine weltweit einmalige Systembiologie-Plattform, welche proprietäre Datenbanken, Zellmodelle und rechnergestützte Auswertungsverfahren zusammenfasst. Durch die Integration und Auswertung experimenteller Daten mittels genomweiter Netzwerkmodelle bietet Insilico neue Lösungen zur Herstellung von Biochemikalien und Biopharmazeutika sowie zur Validierung von Wirkstoffen. Zu den Kunden gehören große Industrieunternehmen, zum Beispiel die Boehringer Ingelheim Pharma GmbH & Co. KG in Biberach.

Innovative Patientenüberwachung

Mit einer erfolgreich in Klinik und Forschung eingesetzten Data-Mining-Software zur Patientenüberwachung überzeugt das Unternehmen quantiom bioinformatics GmbH & Co. KG aus Weingarten. Die Software erleichtert das Lesen von Messprofilen einzelner Patienten. Der sogenannte 'Generic Signal Profiler' ermöglicht eine automatisierte Untersuchung von Patientenprofilen. Er kann beispielsweise erkennen, ob ein Patient während des Schlafens Atemstörungen hat. Ein Produkt, das mit dem Generic Signal Profiler entwickelt wurde - die sogenannte RNA Integrity Number (RIN) - ist dem Unternehmen zufolge bereits Industriestandard zur Qualitätskontrolle von RNA (Ribonukleinsäure) in Tausenden von Laboren weltweit.

Automatische Bildanalysen

Ein wegweisend neues Verfahren zur automatisierten Bewegungsverfolgung von biologischen Partikeln in Bildern aus der Zellmikroskopie wurde im Jahr 2012 in Barcelona prämiert. Das probabilistische Verfahren für „Partikel Tracking“ ist eine Entwicklung von Dr. William J. Godinez und Dr. Karl Rohr in enger Kooperation mit Partnern am Universitätsklinikum Heidelberg. Das Verfahren kommt bei der Erforschung von Infektionskrankheiten durch Hepatitis-C-Viren zum Einsatz.

Verfahren mit Zukunft

Schon heute sind Data-Mining-Verfahren verfügbar, die auf durchschnittlichen Standardrechnern Tausende von Datensätzen bewältigen. Zusätzliche Potenziale erschließen sich für Data-Mining durch die fortschreitende Speicherintensität der Medien sowie eine zunehmende Vernetzung von Datenbanken in Medizin, Gesundheit und Forschung.

Glossar

  • Biotechnologie ist die Lehre aller Verfahren, die lebende Zellen oder Enzyme zur Stoffumwandlung und Stoffproduktion nutzen.
  • Ein Gen ist ein Teil der Erbinformation, der für die Ausprägung eines Merkmals verantwortlich ist. Es handelt sich hierbei um einen Abschnitt auf der DNA, der die genetische Information zur Synthese eines Proteins oder einer funktionellen RNA (z. B. tRNA) enthält.
  • Das Genom ist die gesamte Erbsubstanz eines Organismus. Jede Zelle eines Organismus verfügt in Ihrem Zellkern über die komplette Erbinformation.
  • Für den Begriff Organismus gibt es zwei Definitionen: a) Jede biologische Einheit, die fähig ist, sich zu vermehren und selbstständig, d. h. ohne fremde Hilfe, zu existieren (Mikroorganismen, Pilze, Pflanzen, Tiere einschließlich Mensch). b) Legaldefinition aus dem Gentechnikgesetz: „Jede biologische Einheit, die fähig ist, sich zu vermehren oder genetisches Material zu übertragen.“ Diese Definition erfasst auch Viren und Viroide. Folglich fallen gentechnische Arbeiten mit diesen Partikeln unter die Bestimmungen des Gentechnikgesetzes.
  • Die Ribonukleinsäure (Abk. RNS oder RNA) ist eine in der Regel einzelsträngige Nukleinsäure, die der DNA sehr ähnlich ist. Sie besteht ebenfalls aus einem Zuckerphosphat-Rückgrat sowie einer Abfolge von vier Basen. Allerdings handelt es sich beim Zuckermolekül um Ribose und anstelle von Thymin enthält die RNA die Base Uracil. Die RNA hat vielfältige Formen und Funktionen; sie dient z. B. als Informationsvorlage bei der Proteinbiosynthese und bildet das Genom von RNA-Viren.
  • Die Ribonukleinsäure (Abk. RNS oder RNA) ist eine in der Regel einzelsträngige Nukleinsäure, die der DNA sehr ähnlich ist. Sie besteht ebenfalls aus einem Zuckerphosphat-Rückgrat sowie einer Abfolge von vier Basen. Allerdings handelt es sich beim Zuckermolekül um Ribose und anstelle von Thymin enthält die RNA die Base Uracil. Die RNA hat vielfältige Formen und Funktionen; sie dient z. B. als Informationsvorlage bei der Proteinbiosynthese und bildet das Genom von RNA-Viren.
  • Ein Virus ist ein infektiöses Partikel (keine Zelle!), das aus einer Proteinhülle und aus einem Genom (DNA oder RNA) besteht. Um sich vermehren zu können, ist es vollständig auf die Stoffwechsel der lebenden Zellen des Wirtsorganismus angewiesen (z.B. Bakterien bei Phagen, Leberzellen beim Hepatitis-A-Virus).
  • Bioinformatik ist eine Wissenschaft, die sich mit der Verwaltung und Analyse biologischer Daten mit Hilfe modernster Computertechnik, befasst. Dient derzeit hauptsächlich zur Vorhersage der Bedeutung von DNA-Sequenzen, der Proteinstruktur, des molekularen Wirkmechanismus und der Eigenschaften von Wirkstoffen. (2. Satz: mwg-biotech)
  • Biopharmaka sind Arzneimittel, die mit Hilfe von biologischen Systemen hergestellt werden.
  • Das Proteom ist die Gesamtheit aller zu einem bestimmten Zeitpunkt unter definierten Bedingungen vorhandenen Proteine in einem Lebewesen, einem Gewebe oder einer Zelle.
  • Validierung oder Validation ist der Prozess der Prüfung einer These oder eines Lösungsansatzes in Bezug auf das zu lösende Problem.
  • Eine Hepatitis ist eine Entzündung des Lebergewebes mit nachfolgender Zellschädigung. Sie macht sich zunächst durch grippale Erscheinungen bemerkbar, wie Glieder- und Kopfschmerzen, Appetitlosigkeit, Druck in der Magen- und Lebergegend und Fieber, später gehört die Gelbsucht zur Symptomatik. Verantwortlich dafür können Viren, Bakterien oder Parasiten sein, ebenso wie Autoimmunerkrankungen, Medikamente, Alkohol oder Chemikalien. Häufigste Ursache sind jedoch Viren, wobei man fünf Virustypen unterscheidet, die mit den Buchstaben A, B, C, D und E bezeichnet werden.
Seiten-Adresse: https://www.gesundheitsindustrie-bw.de/de/fachbeitrag/dossier/data-mining-neue-chancen-fuer-medizin-und-gesundheit/