Big Data
„Mehr Daten bedeutet nicht automatisch mehr Wissen“
Evidenzbasierte, also wissenschaftliche Medizin ist in Deutschland mit seinem Namen verbunden. Im Interview äußert sich Prof. Dr. rer. nat. Gerd Antes, Co-Direktor von Cochrane Deutschland, zum Hype der Big Data, warnt vor falschen Versprechen und bringt Selbstverständliches in Erinnerung.
Big Data gelten als neue Heilsbringer für die Medizin. Teilen Sie als Vertreter der evidenzbasierten Medizin die Zuversicht?
Prof. Dr. Gerd Antes, einer der deutschen Lordsiegelbewahrer evidenzbasierter Medizin.
© Cochrane Deutschland
Man muss sich nicht auf den Standpunkt evidenzbasierter Medizin zurückziehen, sondern braucht nur die grundlegenden Kriterien von Wissenschaft anzuwenden. Dann wird schnell klar, dass die pauschale ‚Hyperisierung‘ von Potenzial eine völlig einseitige Betrachtungsweise ist. Evidenzbasierte Medizin achtet akribisch auf Nutzen, Schaden und Kosten. Bei allen Lobpreisungen der Big Data fällt auf, dass diese beiden letzten Punkte schlicht „vergessen“ wurden. Schaden und Kosten kommen nicht vor. Das ist gerade bei Einführung neuer Technologien oder großer Umwälzungen ein fataler Fehler. Jede Technikfolgenabschätzung wägt diese drei Aspekte grundsätzlich gegeneinander ab. Dieses Fehlen fällt auch dem Laien schnell auf. Nur traut sich bei diesem Hype niemand, das laut zu sagen.
Mehr Daten bedeutet nicht automatisch mehr Information. Mehr Daten können sehr wohl mehr falsche Informationen bedeuten. Natürlich gibt es Aspekte, die Nutzen haben, aber die muss man finden und dann bevorzugt fördern. Wir brauchen nicht niedrigere Schranken und mehr Geld in Big Data. Wir brauchen eine schnellere Bewertung dessen, was wirkliches Potenzial hat.
Für die einen sind prospektive randomisierte kontrollierte Studien (RCT) Goldstandard für die Bewertung diagnostischer und therapeutischer Verfahren. Andere kritisieren deren experimentelle Anordnung und bezweifeln ihre Aussagekraft für Patienten unter Alltagsbedingungen (Real Life Data). Was ist von solch gegensätzlichen Bewertungen zu halten?
Das Abheben auf Real Life Data ist eine der ganz großen Fehlentwicklungen beim Erkenntnisgewinn. Wissenschaft produziert Richtiges und Falsches und damit zwanglos auch „falsch Positive“. Dieser Begriff kommt aus der Diagnostik, gilt aber für die Wissenserzeugung ganz allgemein. Da gibt es Aussagen, die z. B. von Big-Data-Mechanismen als neues Wissen gekennzeichnet werden, tatsächlich aber falsch sind. Wir werden zwangsläufig von einer Welle von falsch Positiven überrollt werden, wenn wir nicht die von Ioannidis (s.u.) geforderte rigide Methodik anwenden. Sie ist auch nicht fehlerfrei, aber viel sicherer als Beobachtungsstudien oder riesige Datenmengen, deren Validierung nicht mehr nötig erscheint.
Ist es nicht grundsätzlich sinnvoll, auf weitere Daten aus bildgebenden Verfahren, Genomsequenzierungen, Registern, Beobachtungsstudien oder generell auf Sekundärdaten zuzugreifen?
Ja. Grundsätzlich ist es sinnvoll. Wir haben jedoch 20 Jahre Erfahrung, die zeigt, wie fehlerhaft das sein kann. Zwei Beispiele: Krankenkassen analysieren ihre Abrechnungsdaten, die aber wegen der Abrechnungssysteme großenteils kein Abbild der Krankheiten geben. Zieht man aus ihnen Schlüsse auf die Medizin, sind diese zwangsläufig falsch. Ähnliches gilt für genomassoziierte Daten: Es ist naiv zu glauben, wenn ich einen genetischen Schalter gefunden habe, diesen umzulegen und damit die Krankheit zu heilen. (Das gilt nicht für monogenetische Krankheiten, d. Red.) Hier wird jede Menge falsche Hoffnung produziert. Warum? Weil es für eine Krankheit nicht einen genetischen Schalter, sondern eine Fülle davon gibt, die überdies wechselseitig miteinander agieren. Die Bioinformatik quält sich seit vielen Jahren damit herum, dort Ordnung zu schaffen. Und jetzt kommen die Heilsversprecher von Big Data und tun so, als ob das mit einem Fingerschnippen erledigt werden könnte.
Welchen wissenschaftlichen Ansprüchen müssen Daten genügen, die vorgeblich näher am medizinischen Alltag sind, also die medizinische Routineversorgung widerspiegeln?
Das sind schon Beobachtungsstudien. Aber wenn ich nicht den ersten Schritt tue – den proof of principle“ – dann weiß ich nicht, ob etwas überhaupt funktioniert und gucke gleich, was macht es im Alltag. Damit bewege ich mich auf extrem dünnen Eis. Ich führe etwas ein und frage danach die Patienten. Werden die „richtigen“ Leute gefragt, also diejenigen, die zufrieden sind, dann ist dieses Verfahren „erfolgreich“.
Inwieweit könnten Real Life Data in RCTs integriert werden und dazu beitragen, die Bewertung diagnostischer und therapeutischer Verfahren vielleicht sogar zu verbessern? Gibt es dafür Beispiele?
Ja, seit 30 Jahren. Natürlich sind RWD* das, was in der Arzneimittelentwicklung seit Ewigkeiten gemacht wird: Nach der Zulassung kommt die Phase IV, wo die randomisierten Studien mit Marktdaten ergänzt werden.
Mein orthodoxes Credo lautet: Wir haben fast alles, müssen diese Methodik nur viel rigider anwenden, die fast 90 Jahre lang seit der Randomisierung (1932) von vielen klugen Köpfen entwickelt worden ist. Jetzt kommen Leute daher und meinen, sie müssten ein bisschen disruptiv sein. Deren Argumente sind aber nicht wissenschaftlich. Es gibt Artikel und Bücher, die fordern regelrecht die Abschaffung der Theorie durch Datenwissenschaft, weil die Datensintflut helfe, alle Probleme sicher zu lösen. Das ist wohl der größte Schwachsinn, den man aus wissenschaftlicher Perspektive formulieren kann.
Die personalisierte Medizin, die auf Omics-Daten setzt, bringt mitunter Ein-Patienten-Studien ins Spiel. Ist das eine Alternative zu den RCTs?
Nein, natürlich nicht. Wir predigen seit Jahrzehnten, dass ein einzelner Fall keinerlei Verallgemeinerungsfähigkeit für den nächsten Patienten hat. Die Präzisionsmedizin hat den gleichen Traum, dass sie mit der völligen genetischen Entschlüsselung die komplette Architektur des Menschen kennt und damit auch den Schalter, mit dem sie Symptome ausschalten kann. Ich verweise hier auf einen Artikel zur Entstehung von Parkinson (Gasser, s.u.). Alles, was man für die Entwicklung von Therapien braucht, ist das bekannte Repertoire: falsch-positive Ergebnisse kleinhalten, im ganzen Entwicklungsprozess das Richtige schneller finden, das Falsche schneller ausschließen und Fehler grundsätzlich minimieren.
Gibt es Beispiele, wo Big Data in Studien integriert wurden, die den Prinzipien wissenschaftlicher Evidenz gehorchten?
Großansicht:
Farbliche Darstellung der Aktivität eines Wikipedia-Bots über einen längeren Zeitraum: typisches Beispiel der Veranschaulichung von „Big Data“ mit einer Visualisierung.
© CC-Lizenz
Da muss man auf die Definition von Big Data zurückkommen: Big Data sind nicht definiert. Das ist die Grundlage der Verwirrung. Bücher wie „Das Ende des Zufalls. Wie die Welt vorhersagbar wird“, die wissenschaftlich nicht ernst zu nehmen sind, tun dann ihr Übriges und schalten in weiten Kreisen jede Reflexion und kritische Betrachtensweise aus.
Natürlich gibt es überall gute Beispiele. Deswegen wäre es auch ein Fehler und auch faktisch unmöglich, den Fortschritt zu verdammen. Zum Beispiel Register mit kompletten Daten, mit denen medizinisch sehr relevante Fragen beantwortet werden können. Das gibt es alles, aber das ist kein Big Data.
Big Data ist das Versprechen, dass wir nur Zugang zu allen Daten haben müssen, auf die irgendwelche intransparenten Mechanismen losgelassen werden. Negativbeispiel hierfür ist Watson von IBM, der laut Werbung die Welt verbessern wird. Dafür gibt es bisher nicht die geringsten Belege. Dr. Watson ist gerade aus einer der größten US-amerikanischen Krebskliniken, MD Anderson, herausgeflogen.
Der etablierte Grundsatz orthodoxer Methodik für Entscheidungen in der Medizin ist, systematische Fehler (Bias) zu minimieren (Risk-of-Bias-Konzept) und damit das Risiko, zu kontrollieren, systematisch falsche Ergebnisse zu produzieren. Künstliche Intelligenz kennt dieses Problem überhaupt nicht, weil sie automatisch alles richtig macht. Belege dafür fehlen jedoch weitgehend. In einschlägigen Publikationen werden aus der Medizin immer die gleichen Beispiele für den Big-Data-Erfolg genannt. So konnte Google angeblich Grippe-Pandemien vorhersagen. Das ist längst widerlegt (Nature 494, 155–156 (14 February 2013) doi:10.1038/494155a). Die Prognose gelang ein oder zwei Jahre, im dritten nicht mehr. Warum? Sie hatten die ersten beiden Jahre einfach Glück, es wird jedoch selbst heute noch als Erfolgsstory genannt. Die Beispiele stammen großenteils aus erfolgreicher Verkaufsförderung durch personalisierte Werbung, die als Vorbild für die Medizin sicherlich zweifelhaft ist.
Was muss passieren, damit das viel beschworene Potenzial von Big Data in der Medizin dem Patienten nutzt?
Man muss sich wieder darauf besinnen, dass der Patient im Mittelpunkt steht. Blickt man auf Förderprogramme, so sind manche geradezu schädlich. Ich beobachte seit Jahren eine Biologisierung der Medizin, wo der Patient völlig aus dem Blick gekommen ist und wo wir Milliarden in die falsche Richtung werfen und Erkenntnisse gewonnen werden, die nicht zielgerichtet zu Methoden entwickelt werden und implementiert werden. Trotz der geforderten Translation von Forschungsergebnissen in die Praxis erleben wir eine extreme Asymmetrie des Mitteleinsatzes zugunsten von Big Data und Digitalisierung, während die Umsetzung der Erkenntnisse am Menschen als kostengünstige Selbstverständlichkeit angesehen wird. Das ist sicherlich falsch. Gerade der letzte Schritt für den Menschen braucht eine valide Methodik, rigide Überprüfung des Erfolgs durch empirische Verfahren. Der Erfolg muss an patientenrelevanten Ergebnissen gemessen werden, nicht an der Anzahl Datenbanken oder dem Digitalisierungsgrad von Kliniken und Arztpraxen. Dafür sind Big Data und Digitalisierung Hilfsmittel, aber nicht das Ziel der Medizin.