Powered by

Das Humanproteom - das nächste große Ziel

Das „Humanproteom-Projekt“, eine auf zehn Jahre angelegte globale Initiative zur systematischen Kartierung aller Proteine des Menschen in ihrem biologischen Zusammenhang, ist aus dem Planungsstadium in die experimentelle Phase eingetreten. Die effektive Bedeutung des Projektes hängt davon ab, wieweit die dadurch bereitgestellten Ressourcen von Proteomforschern genutzt werden und diese ihre Daten in das Projekt einbringen.

Ziel des Humanproteom-Projektes ist es, alle Proteine des Menschen zu identifizieren. Illustration aus “De humani corporis fabrica” von Andreas Vesalius 1543. © Berliner Medizinhistorisches Museum

Von der erfolgreichen Sequenzierung des menschlichen Genoms im Humangenomprojekt vor mehr als zehn Jahren hatte man sich versprochen, dass durch die Identifizierung krankheitsrelevanter Gene nunmehr auch Wege zur Therapie bisher unheilbarer Krankheiten gefunden würden. Rasch musste man erkennen, dass diese Erwartungen sich nicht erfüllen konnten. Krankheiten sind wie alle physiologischen und entwicklungsbiologischen Zustände des Organismus Ausprägungen des Phänotyps, der in einer intensiven Wechselbeziehung mit seiner Umwelt steht.

Die wichtigsten Komponenten und Akteure des Phänotyps und seiner Interaktionen sind die Proteine. Wie schon ihr Name ausdrückt (der von dem sich ständig verwandelnden griechischen Meeresgott Proteus abgeleitet ist), sind Proteine außerordentlich veränderlich. Während man sich inzwischen weitgehend einig ist, dass der Mensch 20.000 bis 21.000 proteinkodierende Gene besitzt, schätzt man die Gesamtzahl aller im Menschen wirksamen Protein-Isoformen auf etwa eine Million. Sie entstehen durch DNA-Rekombination, alternatives Spleißen der primären Gen-Transkripte und unterschiedlichste post-translationale Modifikationen - darunter Glykosylierungen und Phosphorylierungen - und sind abhängig von Entwicklungsstand und Expressionsort sowie von den physiologischen, pathologischen und pharmakologischen Umständen.

Das 2008 beschlossene und im September 2011 begonnene Humanproteom-Projekt (HPP) hat sich das gigantische Ziel gesetzt, innerhalb von zehn Jahren eine Proteomkarte zu erstellen, die Ordnung in die verwirrende Vielfalt der Gesamtheit aller menschlichen Proteine bringen und als Gerüst und Bezugspunkt aller künftigen Proteomforschung dienen kann.

Technologische Säulen und Forschungsstrategien

Die Initiatoren des HPP - die Creme der internationalen Proteomforschung - gehen davon aus, dass durch die technischen Fortschritte der letzten Jahre eine Kartierung des menschlichen Proteoms möglich geworden ist. Wie schon das Humangenomprojekt gezeigt hatte, erzeugen solche Großprojekte auch eine Dynamik, durch die ganz unvorhersehbare Innovationen entstehen, die das Projekt weiter und womöglich schneller vorantreiben können. Das erwartet man auch für das HPP.

Mit seiner experimentellen Strategie beruht das Proteomprojekt auf drei technologischen Pfeilern: (1) quantitative Massenspektrometrie in Verbindung mit Flüssigkeitschromatografie und anderen Auftrenn-Verfahren wie zweidimensionaler Gelelektrophorese; (2) das Abfangen und Identifizieren von Proteinen mithilfe von Antikörpern („protein capture“); (3) Bioinformatik-Instrumente und Datenbanken („knowledge bases“).

Zwei unterschiedliche Strategien zur Erforschung des menschlichen Proteoms werden parallel und unabhängig voneinander verfolgt: I. das „Chromosomen-zentrische“ Humanproteinprojekt (C-HPP) und II. das an der Biologie der etwa 230 verschiedenen menschlichen Zellen und den Haupterkrankungen des Menschen ausgerichtete B/D-HPP („Biology/Disease-Driven“ HPP). Über den Stand des C-HPP sind jetzt erste Berichte veröffentlicht worden, und für den 12. Jahreskongress der Human Proteome Organization, der im September 2013 im japanischen Yokohama stattfinden wird, erwartet man viele neue Beiträge, die bereits eine Vorstellung davon geben werden, welch eine Explosion an Informationen durch dieses Großprojekt noch ausgelöst werden kann.

Das „Chromosomen-zentrische“ Humanproteinprojekt C-HPP

Karyogramm des Menschen mit 22 Chromosomenpaaren sowie X- und Y-Chromosom. © Humangenetik, Universitätsklinikum Heidelberg

Aus der bekannten DNA-Sequenz des menschlichen Genoms kann die Zahl der proteinkodierenden Gene relativ genau ermittelt werden. Sie beträgt 20.059 - nach den neuesten Angaben (Dezember 2012) von neXtProt, einer vom Schweizerischen Institut für Bioinformatik entwickelten, auf menschliche Proteine spezialisierten Datenbank. Die meisten Publikationen gehen aber noch von 20.300 bis 21.000 proteinkodierenden Genen aus. Die Ziele des C-HPP sind die Kartierung und Funktionsbeschreibung der gesamten Proteingarnitur, die von jedem einzelnen Chromosom kodiert wird.

Ein 25-gliedriges Konsortium wurde gebildet, in dem alle 24 menschlichen Chromosomen-Typen (die 22 diploid vorliegenden Autosomen und die beiden Geschlechtschromosomen X und Y) sowie das Mitochondriengenom unter Federführung von Forschungsgruppen oder Organisationen verschiedener Staaten oder einer Staatengruppe bearbeitet werden. Wissenschaftler, die am C-HPP mitarbeiten wollen, können sich ein Chromosom wählen, das ihrem eigenen Interesse etwa an spezifischen Krankheiten (zum Beispiel Krebs oder genetische Erkrankungen) oder an bestimmten Targets (zum Beispiel Biomarker) entspricht.

Die Teilnahme erfordert keine Veränderung der eigenen und eigenständigen Proteom-Experimente; nur Daten werden mit allen anderen Teams der entsprechenden Chromosomengruppe ausgetauscht. Vergleichbarkeit wird durch gemeinsame Standards und Referenzproteine festgelegt. So werden Kenntnisse über die von dem Chromosom kodierten Proteine und auch Informationen über noch „fehlende oder schlecht charakterisierte Proteine“ zusammengetragen und der wissenschaftlichen Gemeinschaft zugänglich gemacht.

Offene Fragen

Zweidimensionale Polyacrylamid-Gelelektrophorese zur Proteomanalyse. © HUPO

Nach heutigen Daten aus der Massenspektrometrie und dem „protein capture“ sind bisher etwa zwei Drittel der erwarteten Proteine mit einiger Sicherheit identifiziert worden; ihre Funktionen sind aber meist nur lückenhaft bekannt. Zu durchschnittlich 30 bis 35 Prozent der proteinkodierenden Gene auf allen Chromosomen gibt es noch keine verlässlichen Informationen über ihre Genprodukte. Durch weiteres Absenken der Nachweisgrenze für Proteine in den experimentellen Daten kann die Informationslücke vielleicht verkleinert werden. Wahrscheinlich gibt es aber auch biologische Ursachen, welche die Gesamtproteom-Analyse komplizieren:

  • Viele Proteine werden von mehr als einem Gen kodiert; ein Beispiel für ein solches Multigenprotein ist der von acht Genen kodierte Rezeptor 2W1 aus dem Riechepithel. Mit Mitteln der Proteomik sind solche genetischen Komplikationen nicht zu klären.
  • Umgekehrt kann ein hoher Grad an Polymorphismus eines Proteins dazu führen, dass es in den analytischen Daten vielfach auftaucht; das klassische Beispiel dafür sind die Proteine des Hauptkompatibilitätskomplexes MHC.
  • Ganze Proteingruppen könnten systematisch unterrepräsentiert sein, weil sie schwer aufzutrennen oder aufgrund extremer Homologie nicht zu unterscheiden sind; dazu gehören z.B. membrangebundene Proteine, Cytokeratine oder die olfaktorischen Rezeptoren.

  • Manche Proteine sind noch nicht entdeckt worden, weil sie eine sehr kurze Lebensdauer haben und nur in winzigen Mengen vorkommen, wie regulatorische Proteine im Zellkern, oder weil sie nur schwach in solchen Geweben oder Zellen exprimiert werden, die bisher nicht gut untersucht worden sind.

Diese Punkte sind sicher nur eine unvollständige Aufzählung der Herausforderungen, denen sich die Proteomforscher während der Laufzeit des C-HPP zu stellen haben. Viele Probleme wird man lösen können, aber andere, heute noch unabsehbare Fragestellungen werden hinzukommen.

Das von „Biologie und Krankheiten getriebene“ HPP

Der zweite Arm der globalen Proteom-Initiative, das sogenannte „Biology/Disease-driven HPP“, verläuft parallel und liefert komplementäre Informationen zum C-HPP. Es ist - nach gegenwärtigem Stand - in 16 Teilprojekte gegliedert, die sich an spezifischen biologischen Prozessen oder Systemen und Krankheitsbereichen orientieren. Für fünf Bereiche haben sich bereits federführende Teams gebildet: Diabetes, Krebsproteomik, Mitochondrien, Infektionskrankheiten und Epigenetik / Chromatin-assoziierte Proteine.

Andere Bereiche wie die Proteomik des Blutplasmas, der Leber, des Gehirns, der Nieren und Harnwege, der Herz-Kreislauf-Krankheiten, der Stammzellen sowie die Proteomik von Modellorganismen befinden sich noch im Planungsstadium. Für alle Teilprojekte werden von den Experten Listen von Proteinen erarbeitet, die für das Thema besonders relevant sind oder es doch sein könnten. Für die Untersuchung von Signalwegen beispielsweise wären alle menschlichen Proteinkinasen (das sogenannte Kinom) zu erfassen, ein Gebiet, das auch für die pharmazeutische Industrie von besonderer Bedeutung ist. Die Themen des B/D-HPP bieten auch Raum für die Proteomanalysen intrazellulärer Kompartimente und Systeme wie dem Kernporenkomplex und dem Endo-Exocytose-Transportweg und schließen beispielsweise auch die Proteome von infektionsverursachenden Parasiten ein.

Noch 2013 werden verschiedene Pilotprojekte beginnen. Wie auch das C-HPP ist das B/D-HPP auf die Mitarbeit führender Proteomlaboratorien in der Welt angewiesen. Sein Erfolg hängt davon ab, dass die durch Massenspektrometrie und Affinitätschromatografie gewonnenen Daten und Proben der wissenschaftlichen Öffentlichkeit ungehindert zur Verfügung gestellt werden.

Wie der Schweizer Proteomforscher Ruedi Aebersold, eine der führenden Persönlichkeiten des HPP, schreibt, ist es das Ziel des B/D-HPP, weit mehr zu sein als eine Bestandsliste der Proteinexpression. Das Projekt liefert Informationen über biologische Netzwerke, Verbindungen zu anderen zellulären Komponentenklassen und Systemen wie dem Genom, Epigenom, Transkriptom und Metabolom, und es stellt Reagenzien und Informationen für Wissenschaftler bereit, die für die biologische und klinische Forschung Proteomik benutzen.

„Vom Humanproteomprojekt kann die wissenschaftliche Gemeinschaft einen vollständigen Katalog von Proteinen erwarten, einschließlich neuer Wirkstoff-Targets, neuer diagnostischer Biomarker und einer Bestandsliste der Isoformen der zellulären Regulatoren wie zum Beispiel der wichtigsten Signalwege“ (zitiert nach: J. Proteome Res., Special Issue C-HPP, 20. Dec. 2012). Die Struktur des HPP stellt sicher, dass sich das Forschungsgebiet kontinuierlich weiterentwickelt – mit stetig verbesserten Technologien, Probensammlungen und Datenbanken, einer internationalen Koordination im Datenmanagement und einem globalen Austausch an Information.

Glossar

  • Antikörper sind körpereigene Proteine (Immunglobuline), die im Verlauf einer Immunantwort von den B-Lymphozyten gebildet werden. Sie erkennen in den Körper eingedrungene Fremdstoffe (z. B. Bakterien) und helfen im Rahmen einer umfassenden Immunantwort, diese zu bekämpfen.
  • Chromosomen sind die unter dem Mikroskop sichtbaren Träger der Erbanlagen. Die Anzahl der im Zellkern vorhandenen Chromosomen ist artspezifisch. Beim Menschen sind es zweimal 23. Mit Ausnahme der Geschlechtschromosomen liegen Chromosomen in Körperzellen sowie in befruchteten Eizellen paarweise als sog. homologe Chromosomen vor. In den Keimzellen ist nach Abschluss der Reifungsteilungen nur ein einfacher Chromosomensatz vorhanden.
  • Diabetes mellitus (Zuckerkrankheit) wird durch einen Mangel an Insulin hervorgerufen. Man unterscheidet zwei Typen. Bei Typ 1 (Jugenddiabetes) handelt es sich um eine Autoimmunkrankheit, bei der körpereigene Immunzellen die Beta-Zellen der Bauchspeicheldrüse, die Insulin produzieren, zerstören. Typ 2 (Altersdiabetes) ist dagegen durch eine Insulinrestistenz (verminderte Insulinempfindlichkeit der Zielzellen) und eine verzögerte Insulinausschüttung gekennzeichnet.
  • Desoxyribonukleinsäure (DNS / DNA) trägt die genetische Information. In den Chromosomen liegt sie als hochkondensiertes, fadenförmiges Molekül vor.
  • Die Gelelektrophorese ist eine Methode, um in ein Gel eingebettete Nukleinsäuremoleküle oder Proteine aufgrund ihrer Beweglichkeit in einem elektrischen Feld aufzutrennen. Die verwendeten Gele bestehen aus Agarose oder Polyacrylamid.
  • Ein Gen ist ein Teil der Erbinformation, der für die Ausprägung eines Merkmals verantwortlich ist. Es handelt sich hierbei um einen Abschnitt auf der DNA, der die genetische Information zur Synthese eines Proteins oder einer funktionellen RNA (z. B. tRNA) enthält.
  • Das Genom ist die gesamte Erbsubstanz eines Organismus. Jede Zelle eines Organismus verfügt in Ihrem Zellkern über die komplette Erbinformation.
  • Lytisch zu sein ist die Eigenschaft eines Bakteriophagen, seine Wirtszelle bei der Infektion zu zerstören.
  • Für den Begriff Organismus gibt es zwei Definitionen: a) Jede biologische Einheit, die fähig ist, sich zu vermehren und selbstständig, d. h. ohne fremde Hilfe, zu existieren (Mikroorganismen, Pilze, Pflanzen, Tiere einschließlich Mensch). b) Legaldefinition aus dem Gentechnikgesetz: „Jede biologische Einheit, die fähig ist, sich zu vermehren oder genetisches Material zu übertragen.“ Diese Definition erfasst auch Viren und Viroide. Folglich fallen gentechnische Arbeiten mit diesen Partikeln unter die Bestimmungen des Gentechnikgesetzes.
  • Der Phänotyp beinhaltet alle sichtbaren Eigenschaften eines Organismus. Er wird vom Genotyp (der genetischen Ausstattung) und der Umwelt bestimmt.
  • Proteine (oder auch Eiweiße) sind hochmolekulare Verbindung aus Aminosäuren. Sie übernehmen vielfältige Funktionen in der Zelle und stellen mehr als 50 % der organischen Masse.
  • Die Rekombination ist der Vorgang, bei dem DNA neu kombiniert wird. Als natürlicher Prozess findet Rekombination bei der geschlechtlichen Vermehrung während der Meiose statt. Bei der In-vitro-Rekombination werden mit Hilfe molekulargenetischer Methoden DNA-Abschnitte unterschiedlicher Herkunft miteinander verknüpft.
  • Rezeptoren sind Moleküle, die u. a. auf Zelloberflächen anzutreffen sind und die in der Lage sind, ein genau definiertes Molekül – ihren Liganden – zu binden. Das Zusammentreffen von Ligand und Rezeptor kann eine Abfolge von Reaktionen innerhalb der Zelle auslösen.
  • Nukleotidsequenzen sind Abfolgen der Basen Adenin, Thymin, Guanin und Cytosin auf der DNA (bzw. Uracil statt Thymin bei RNA).
  • a) DNA-Sequenzierung ist eine Methode zur Entschlüsselung der Erbinformation durch Ermittlung der Basenabfolge. b) Protein-Sequenzierung ist eine Methode zur Ermittlung der Aminosäurenabfolge.
  • Eine Sonde im molecularbiologischen Sinn ist ein Stück markierte RNA oder DNA, die mit einer gesuchten Sequenz binden (hybridisieren) kann.
  • Mit Transkription im biologischen Sinn ist der Vorgang der Umschreibung von DNA in RNA gemeint. Dabei wird mithilfe eines Enzyms, der RNA-Polymerase, ein einzelsträngiges RNA-Molekül nach der Vorlage der doppelsträngigen DNA synthetisiert.
  • Bioinformatik ist eine Wissenschaft, die sich mit der Verwaltung und Analyse biologischer Daten mit Hilfe modernster Computertechnik, befasst. Dient derzeit hauptsächlich zur Vorhersage der Bedeutung von DNA-Sequenzen, der Proteinstruktur, des molekularen Wirkmechanismus und der Eigenschaften von Wirkstoffen. (2. Satz: mwg-biotech)
  • Das Proteom ist die Gesamtheit aller zu einem bestimmten Zeitpunkt unter definierten Bedingungen vorhandenen Proteine in einem Lebewesen, einem Gewebe oder einer Zelle.
  • Stammzellen sind Zellen, die die Fähigkeit zur unbegrenzten Zellteilung besitzen und die sich zu verschiedenen Zelltypen ausdifferenzieren können. Stammzellen können aus Embryonen, fötalem Gewebe und aus dem Gewebe Erwachsener gewonnen werden. In Deutschland ist die Gewinnung embryonaler Stammzellen verboten.
  • Biomarker sind messbare Produkte von Organismen (z.B. Proteine, Stoffwechselprodukte oder Hormone), die als Indikatoren beispielsweise für Umweltbelastungen oder Krankheiten herangezogen werden.
  • Die Expression ist die Biosynthese eines Genprodukts (= Umsetzung der genetischen Information in Proteine). Sie erfolgt in der Regel als Transkription von DNA zu mRNA und anschließender Translation von mRNA zu Protein.
  • Die Pathologie ist ein Teilgebiet der Medizin, das sich mit der Erforschung und Lehre von den Ursachen, der Entstehung, der Verlaufform und der Auswirkungen von krankhaften Symptomen sowie von Missbildungen beschäftigt.
  • Die Pharmakologie ist eine Wissenschaft, die sich mit der Wechselwirkung zwischen Arzneimitteln und Organismen befasst. Dabei gibt es zwei Verfahren zur Beurteilung: Die Pharmakokinetik beschreibt die Aufnahme, Verteilung, Verstoffwechselung und Ausscheidung des Wirkstoffs, die Pharmakodynamik beschreibt die Wirkung des Arzneimittels im Organismus.
  • Physiologie ist die Lehre von den biochemischen und physikalischen Vorgängen in Zellen, Geweben und Organen der Lebewesen.
  • Polypropylen (Abkürzung: PP) ist ein thermoplastisches Polymer des Propylens (auch: Propens).
  • Glykosilierung ist das Anbringen von Zuckerstrukturen an Proteinen, bspw. zur Erhöhung der Stabilität eines Proteins.
  • Chromatin ist ein Komplex aus Proteinen und DNA, das in der Interphase der Mitose auftaucht. Es stellt die entspiralisierten Chromosomen dar.
  • Die Massenspektrometrie ist ein Verfahren zur Messung des Masse-zu-Ladung-Verhältnisses eines Teilchens. Bei biologischen Fragestellungen werden meist Proteine massenspektrometisch untersucht.
  • Die Epigenetik beschäftigt sich mit den vererbbare Veränderungen in der Genexpression, die nicht auf Abweichungen in der Sequenz der DNA zurückzuführen sind.
  • Ein Mitochondrium ist ein von einer Doppelmembran umschlossenes Organell, das im Zellinneren der Eukaryonten vorkommt. Als "Kraftwerk der Zelle" dient es der Energiegewinnung, weshalb Zellen mit hohem Energiebedarf (z. B. Muskel- oder Nervenzellen) viele Mitochondrien enthalten.
  • Als Spleißen wird der Vorgang bezeichnet, bei dem aus einem primären RNA-Transkript durch Herausschneiden der Introns und Zusammenfügen der Exons das fertige RNA-Produkt gebildet wird. Dieser Schritt ist Teil der Proteinbiosynthese.
  • Als Target (engl.:Ziel) werden Biomoleküle bezeichnet, an die Wirkstoffe binden können. Targets können Rezeptoren, Enzyme oder Ionenkanäle sein. Die Interaktion zwischen Wirkstoff und Target löst eine Wirkstoff-Target-spezifische Reaktion aus. Die Identifikation eines Targets ist für die biomedizinische und pharmazeutische Forschung von großer Bedeutung. Erkenntnisse über spezifische Wechselwirkungen helfen grundlegende molekularbiologische Vorgänge zu verstehen und neue Angriffpunkte für Arzneimittel zu identifizieren.
Seiten-Adresse: https://www.gesundheitsindustrie-bw.de/de/fachbeitrag/dossier/das-humanproteom-das-naechste-grosse-ziel/