Wenn eine Maschine die Sprachen der Medizin versteht
Wissensplattform ist mehr als ein „Google für Life Sciences"
Die weltweit verfügbaren Daten vermehren sich viel zu schnell, als dass menschliche Analysten sie noch sinnvoll interpretieren könnten. Alle 73 Tage die doppelte Menge, sagte Dr. Gunjan Bhardwai, so dass man es Anfang August 2020 mit 32-mal so viel Daten zu tun haben werde wie heute am Tag seines Vortrags beim Workshop „Digital Transformation in Pharma“. Um in dieser Flut bedeutsame Informationen zu finden, bedürfe es einer rasend schnell arbeitenden maschinellen Intelligenz, die wisse, worauf es ankomme. Eine solche auf Gesundheitsdaten spezialisierte Intelligenz hat Bhardwaj mit seiner Firma Innoplexus geschaffen. 2015 von ihm gegründet, hat das Eschborner Start-up inzwischen 360 Beschäftigte. Ontosight® heißt die von Innoplexus angebotene digitale Plattform, auf der „eine künstliche Intelligenz, die die Sprache der Life Sciences spricht“ gezielt befragt werden kann.
„Den Königsweg im Kontext finden"
Ontosight® basiert auf einer lernenden Software, die nach Angaben von Bhardwaj mehr als zehn Milliarden Webseiten pro Tag nach biomedizinisch und pharmazeutisch relevanten Informationen durchsuchen und alle Dateiformen daraus extrahieren kann. Diese Extraktion basiert auf einem Algorithmus, der die Semantik natürlicher Sprachen verarbeitet und seine jeweiligen Fundstücke dadurch in eine sinnvolle Beziehung zu unzähligen anderen Gesundheitsdaten aus ganz unterschiedlichen Quellen setzen, sie also kontextualisieren kann. Die Maschine dürfe dabei nie auslernen, betonte Bhardwaj. „Wir müssen sie ständig mit tiefen, dichten und diversen Daten füttern, damit sie der Dynamik der Sprachentwicklung der Life Sciences gewachsen bleibt.“ 13 Millionen Informationseinheiten lägen Ontosight® schon zugrunde und machten sie zur größten Gesundheitsdatenplattform weltweit. Ungern wolle er sein Produkt aber ein „Google für Life Sciences“ nennen lassen, sagte Bhardwaj. Es sei nämlich mehr. Es indexiere nicht einfach nur, sondern strukturiere seine Suchergebnisse danach, wie semantisch nahe sie sich im Kontext der Lebenswissenschaften seien.
Dadurch ermögliche die Plattform ein Wissensmanagement, das den in der biomedizinischen Forschung vorherrschenden Tunnelblick auf ein „Punktproblem“ weite und überraschende neue Lösungshorizonte eröffne. Wolle man neue Medikamente zur Therapie einer bestimmten Krankheit entwickeln, dann finde man den Königsweg dazu seiner Ansicht kaum, wenn man sich auf den Kauf und die Durchsicht aller Daten zu dieser speziellen Indikation beschränke, sondern viel eher dann, wenn man tief in das gesamte Universum medizinischen Wissens eintauche und darin unerwartete Einsichten finde. „Denn Pharmaforschung hat es mit einem außerordentlich komplexen System mit unzähligen beweglichen Zielen zu tun. Sich reduktionistisch zu verengen, wird ihr wenig helfen.“
„Die Bereitschaft zum Teilen von Daten belohnen!"
Das Universum medizinischen Wissens, sagte Bhardwaj, umfasse freilich nicht nur den publizierten, sondern auch den unpublizierten Bereich. Dieser müsse dringend in das Wissensmanagement einbezogen werden, wenn die Pharmaforschung effektiver werden wolle. Oft arbeiteten Wissenschaftler an benachbarten Universitäten an ähnlichen Projekten und könnten ihre Forschung beschleunigen, wenn sie nur voneinander wüssten und einander unterstützten, sowohl im Austausch ihrer Erfolge als auch ihres Scheiterns. Weil sie aber primär auf Publikationen aus seien, schwiegen sie lieber, statt Daten auszutauschen und damit den Weg neuer Medikamente zu den Patienten zu beschleunigen. „Die Währung der künstlichen Intelligenz sind Daten“, betonte Bhardwaj. „Aber keiner will Daten tauschen, sondern wartet lieber, bis er sich im Glanz seiner Publikationen sonnen kann.“ Zum Zeitpunkt ihrer Publikation in erstklassigen Journals seien die meisten Forschungsergebnisse aber schon mehr als anderthalb Jahre alt.
Bhardwaj sprach sich dafür aus, „falsche Incentives“ abzuschaffen und durch neue zu ersetzen: „Wir sollten Wissenschaftler dafür belohnen, wenn sie ihre Daten teilen. Mit Hilfe der Blockchain-Technologie können sie dies auf sichere Art und Weise tun.“ Nicht nur auf Wissenschaftler münzte Bhardwaj diese Aussage, sondern auch auf alle gesunden und kranken Menschen, die ihre Daten teilen. Sie dafür zu bezahlen, wenn sie ihre Daten in eine sichere Plattform einbinden lassen, könnte seiner Ansicht nach für Europa ein erfolgversprechender Weg sein, um sich sowohl von den USA („Datenverkauf ohne Gewinnbeteiligung der Patienten“) und von China („Datenpools schaffen ohne die Betroffenen um Erlaubnis zu fragen“) im Wettbewerb um die beste Gesundheitsdatenplattform positiv abzuheben.
„Den Ausgang klinischer Studien vorhersagbar machen"
Auch ohne auf unpublizierte Daten zurückgreifen zu können, bietet Ontosight® seinen Nutzern, wie Bhardwaj demonstrierte, eine Vielzahl umfassender und ausgefeilter Suchmöglichkeiten, sei es nach Entwicklungspräparaten, Behandlungsmethoden oder meinungsführenden Spezialisten. Patienten können dort den Weg zu einer qualifizierten Zweitmeinung finden, Wissenschaftler neue Wirkstoffe und Targets sondieren, Pharmaunternehmen die Performance klinischer Studienzentren nachverfolgen, Investoren das Risiko innovativer Projekte abschätzen. Vor allem aber will Innoplexus mit seiner Plattform dazu beitragen, neue Medikamente schneller zu den Patienten zu bringen. „Unser Ziel ist es, ein virtuelles Paradigma der Arzneimittelforschung und -entwicklung zu etablieren.“ Die Erfolgsaussichten klinischer Studien kann Ontosight® schon heute mit bemerkenswerter Treffsicherheit voraussagen. „Retrospektiv betrachtet, haben wir ausschließlich auf öffentlich zugänglichen Daten basierend das Ergebnis von 400 klinischen Prüfungen zu 85 Prozent richtig vorhergesagt“. Besonders spektakulär gelang das im Fall von Aducanumab, dem Alzheimer-Kandidaten von Biogen, dessen Scheitern in Phase III im März dieses Jahres viele Analysten überraschte – nicht aber Bhardwaj und sein Team. Sie hatten Aducanumab allenfalls eine 10- bis 30-prozentige Erfolgschance prophezeit.