Powered by

IDP: Effiziente Hilfe zur Bewältigung der Datenflut

Jede Körperzelle verfügt über die selbe genetischen Ausstattung. Das unterschiedliche Verhalten von Zellen im gleichen Körper lässt sich durch die Expression spezifischer Gene erklären. Mittels DNA-Mikroarrays kann man dies simultan an Tausenden von Genexpressionsprodukten nachverfolgen. Damit die Analyse automatisiert erfolgt, entwickelte das Institut für Datenanalyse und Prozessdesign (IDP) an der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) eine intelligente Software. Diese reduziert den Arbeitsaufwand erheblich. Das Institut ist seit jüngstem Mitglied im BioLAGO e.V. und spezialisiert auf die statistische Datenanalyse sowie Modellierung und Optimierung von Prozessen und Systemen.

Professoren, Dozenten, Wissenschaftliche Mitarbeiter und Angestellte am IDP © Institut für Datenanalyse und Prozessdesign

Über 400 Projekte hat das IDP in seinem bisherigen 12-jährigen Bestehen durchgeführt. Die Anwendungsgebiete und Schwerpunkte liegen dabei unter anderem in den Bereichen Laboranalytik, Gesundheit und Medizin sowie Umwelt und Ökologie. Zu den Arbeitsgebieten gehören beispielsweise die Untersuchung von High-Content-Screening-Daten, Analyse von Massenspektren sowie verschiedener Assay-Plattformen und ebenfalls die Analyse von Genexpressionsdaten (DNA-Mikroarray und RNA-Seq). Ein Beispiel-Projekt hierfür ist die RACE-Software (Remote Analysis Computation for gene Expression data). Das IDP entwickelte ein Webtool, das erlaubt in halb-automatisierter Weise eine Mikroarrayanalyse durchzuführen, die auf modernen statistischen Methoden beruht. So lassen sich beispielsweise Gene ausfindig machen, die für die Anzahl der Haare an den Geschlechtskämmen der männlichen Fliegenbeine verantwortlich sind. „Ausgangspunkt sind immer die sogenannten CEL-Files, wie sie als Rohdaten für die Genexpressionsanalyse von Affymetrix-Chips anfallen“, erklärt Prof. Dr. Beate Sick, Dozentin für statistische Datenanalyse und Projektleiterin an der ZHAW. Das Verfahren erzeugt quantitative und skalierbare Ergebnisse, indem die gesamte DNA einer oder mehrerer Zellen unter verschiedenen Bedingungen auf ihre Expressionsstärke getestet wird. Für die Qualitätssicherung werden die Rohdaten in die Klassen „good“, „suspicious“ oder „bad“ klassifiziert. Nur wenn die Datenqualität der Rohdaten akzeptabel ist, kann der Benutzer davon ausgehen, dass die Resultate verlässlich sind.
Mit DNA-Mikroarrays lässt sich die Expression vieler Gene gleichzeitig bestimmen.  Die Menge an mRNA, die in einer Zelle vorhanden ist, entspricht dabei der Genexpression, die mRNA stellt ein Äquivalent für die Genaktivität in einer Zelle dar. Damit können beispielsweise Unterschiede in der Expression verschiedener Gene zwischen Tumorgewebe und Normalgewebe untersucht werden.

Identifikation fehlerhafter Chips

Rund 90 % fehlerhafter Chips erkennt das Tool zuverlässig. „Eine 100-prozentige Zuverlässigkeit wird auch in Zukunft nicht garantiert werden können, schon weil die Daten extrem hochdimensional und heterogen sind“, erklärt Dr. Oliver Dürr, Dozent für statistische Datenanalyse & Projektleiter an der ZHAW. Je mehr Daten aber zur Identifikation fehlerhafter Chips verwendet werden können, umso grösser wird die Zuverlässigkeit. „Ziel dieser Software ist es die typischen 80% der Fälle, die bei der Analyse von Affymetrix Mikroarray Daten anfallen, abzudecken." Affymetrix Mikroarrays werden für genomweite Genexpressionsanalysen unter anderem bei der medizinischen Erforschung von diversen Erkrankungen genutzt. Insbesondere in der Tumorforschung hat sich diese Technologie etabliert, um relevante Gene für die Diagnose und Therapie zu finden. Eines der Module des Tools ist die sogenannte GO-Analyse. GO kennzeichnet eine biomedizinische Ontologie, die die Bereiche "Zelluläre Komponente", "Biologischer Prozess" und "Molekulare Funktion" abdeckt.

Anwendungsmöglichkeiten: Gen-Analyse bei Darmkrankheiten

Screenshot des entwickelten Webtools © Institut für Datenanalyse und Prozessdesign
Das Webtool wurde bereits in verschiedenen Forschungs- und Entwicklungsprojekten verwendet, beispielsweise bei der Analyse der Genexpression bei chronischen Entzündungen des Darms im Modellorganismus Maus. „In diesem Projekt der Niederländischen Organisation für Angewandte Naturwissenschaftliche Forschung wurde die Entwicklung der Pathologie als Antwort auf die drei wöchentlichen Einflößungen von Trinitrobenzolsulfonsäure (TNBS) beurteilt“, so Dr. Oliver Dürr. Während dieses Zeitrahmens entwickelte sich bei den Mäusen eine Darmentzündung und die Struktur des Darms veränderte sich. Die pathologischen Merkmale im Gewebe stimmten mit den Ergebnissen der mRNA-Analyse überein. Man konnte feststellen, dass Chemokine aktiviert wurden und somit eine Entzündung stattgefunden hat.

Erhebliche Zeitersparnis durch RACE

Die Vorteile der Software liegen ganz klar in der bewussten Restriktion auf die wichtigsten Anwendungsfälle. Gleichzeitig konnte der Arbeitsaufwand einer manuellen Analyse von etwa 12 h auf unter 2 h reduziert werden. „Auf Grund der Transparenz und Reproduzierbarkeit können nun auch weniger erfahrene Nutzer komplexe Auswertungen durchführen“, fügt Prof. Beate Sick an. Die Berechnungen im Hintergrund werden mit der frei zugänglichen Statistiksoftware R durchgeführt. Hierbei handelt es sich um ein Werkzeug zur statistischen Datenanalyse und zur grafischen Darstellung der Daten beziehungsweise der Ergebnisse. Beliebige Erweiterungen auf Funktionalität, die schon in R existieren, sind daher denkbar einfach. Auch wäre es laut Oliver Dürr möglich das RACE-Tool auf neue Technologien der Messung der Genexpression, wie dem RNA-Seq, zu erweitern.

Breite Akzeptanz in Kliniken und Hochschulen

Inzwischen wird das Tool in der Schweiz von zahlreichen universitären Mikroarray-Zentren und Spitälern genutzt und es werden an jedem Wochentag zwischen 5 und 50 Auswertungen durchgeführt. Als ein Institut an einer Schweizer Fachhochschule liegt der Schwerpunkt des IDP in der angewandten Forschung, die im Idealfall in Zusammenarbeit oder im Auftrag von der Industrie durchgeführt wird. „Wir hoffen durch BioLAGO oder BIOPRO, verstärkt bei Projekten aus den Life Sciences aktiv werden zu können“, erwähnt Oliver Dürr. Grundsätzlich sei man aber an allen Projekten interessiert, bei denen Datenanalyse wichtig ist, ergänzt er.

Seiten-Adresse: https://www.gesundheitsindustrie-bw.de/de/fachbeitrag/aktuell/idp-effiziente-hilfe-zur-bewaeltigung-der-datenflut/