Medizinische Daten von Patienten dürfen nur in sehr engen Grenzen für die Forschung genutzt werden. Wie sich die Fakten realer Erkrankungsfälle dennoch weitergeben und zwischen Forscherteams weltweit teilen lassen, erklären Prof. Martin Hofmann-Apitius, Leiter des Geschäftsfelds Bioinformatik am Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI und sein Stellvertreter und Leiter der Forschungsgruppe für künstliche Intelligenz und Data Science Prof. Holger Fröhlich.

Guten Tag Herr Prof. Hofmann-Apitius, hallo Herr Prof. Fröhlich. Sie haben am Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI einen Forschungsschwerpunkt etabliert, um Kohorten virtueller Patienten für die medizinische Forschung zu erzeugen.

Hofmann-Apitius: Unser Ziel ist es, anhand realer Patientendaten eine möglichst umfangreiche Gruppe virtueller Patienten zu generieren. Diese Kohorten an »errechneten« Patienten können wir Krankheitsbildern zuordnen, denen das Schicksal echter Patienten zugrunde liegt. Und das, ohne dass Rückschlüsse auf den echten Fall möglich sind. Diese virtuellen Patienten können dann zur Erforschung von Erkrankungen und Therapiemöglichkeiten genutzt werden.

Fröhlich: Jeder der virtuellen Patienten erhält einen eigenen, synthetisch erzeugten Krankheitsverlauf. Und zwar in einen Umfang, wie wir sie auch von realen Daten aus klinischen Studien kennen: von einfachen demographischen Merkmalen, wie Alter und Geschlecht, über Kognitions- und Verhaltenstests bis hin zu den Ergebnissen bildgebender Verfahren und genetischer Analysen.

Synthetisch generierte Patientendaten ermöglichen Krankheitsforschung in weltweiten Expertennetzwerken, ohne den Persönlichkeitsschutz realer Patienten zu gefährden. Bild: Fraunhofer SCAI

Letztlich sprechen Sie von einer einfachen Anonymisierung von Daten …

Fröhlich: … nein, so einfach ist es nicht. Es geht nicht um die Erstellung eines digitalen Zwillings. Selbst eine namenlose 1:1 Kopie der Erbgutinformationen eines Menschen wäre prinzipiell immer noch ihrem echten Besitzer zuordenbar. Unsere virtuellen Patienten basieren daher nicht auf einzelnen realen Fällen. Unser Ansatz geht vielmehr von der Gesamtheit aller in einer longitudinalen klinischen Studie zu einer Erkrankung erfassten Patientendaten aus. Auf der Basis dieser Daten trainieren wir spezielle KI-Algorithmen, die dann die Erzeugung einzelner synthetischer Krankheitsverläufe ermöglichen. Dabei ist zum einen sichergestellt, dass keiner dieser synthetischen Patienten einfach nur eine Kopie eines realen Patienten ist. Und zum anderen ist dafür gesorgt, dass unsere virtuelle Patientenkohorte medizinischen Merkmale besitzt, die die Besonderheiten und die Variabilität innerhalb der jeweiligen Studie realitätsgetreu abbildet.

Hofmann-Apitius: Zur Berechnung dieser synthetischen Patientenverläufe verwenden wir Modelle, die die verschiedenen in einer klinischen Studie erfassten Variablen zueinander in Beziehung setzen. Weil aber jede klinische Studie mit ihrem eigenen Methodenset misst und Gleiches mitunter anders dokumentiert und bewertet, ist es erforderlich, die Modelle an jeden Anwendungsfall anzupassen. Unsere Datenspezialisten müssen also die vorhandenen Studiendaten zuerst sehr präzise analysieren und dieses medizinische Wissen dann nutzen, um die Daten für das Trainieren unserer KI-Modelle aufzubereiten ...

... Sie bewegen sich damit aber immer noch auf der Ebene einer einzelnen Klinik und nicht in einem Netzwerk medizinischer Studien und Forscherteams.

Hofmann-Apitius: Soweit es den Prozess der Generierung synthetischer Krankheitsverläufe betrifft, ist das vollkommen richtig. Was aber den Einsatz der auf Klinikebene erzeugten virtuellen Patienten angeht, eröffnen sich ganz neue Möglichkeiten – über die Grenzen der einzelnen Kliniken hinaus. Denn die synthetisch generierten Patientendaten können zwischen verschiedenen Organisationen geteilt werden. Sie unterliegen nicht den rechtlichen Beschränkungen, die im Umgang mit realen Patientendaten erforderlich sind.

Fröhlich: Das bedeutet auch, dass wir die klinikspezifischen Daten und Erkenntnisse in eine einheitliche Sprache und Form überführen können. Auf diese Weise erhöhen wir die Vergleichbarkeit medizinischer Studien deutlich. Data Scientists sind nun in der Lage, aktuell verfügbare Datensilos zu kombinieren und mit einheitlichen Analyseverfahren nach bisher unbekannten Besonderheiten und Zusammenhängen zu suchen. Außerdem können wir Methoden der Künstlichen Intelligenz einsetzen …

Die Bildung virtueller Kohorten bringt klinikspezifische Daten und Erkenntnisse in eine einheitliche Form und ermöglicht so die Zusammenführung von Datensilos. Bild: Fraunhofer SCAI

… Das aber würde bedeuten, dass sie Hunderttausende Patientendaten benötigen. Das scheint mir unrealistisch.

Fröhlich: Die Zahl realer Patientendaten wäre dafür zu klein – da haben Sie recht. In unserem Fall aber haben wir die Möglichkeit, anhand von wenigen tausend Patienten Millionen synthetische Krankheitsverläufe zu generieren - ohne Verlust von Realitätsnähe.

Hofmann-Apitius: Für die pharmazeutische Forschung haben die virtuellen Kohorten einen weiteren Vorteil: Mit virtuellen Patienten kann ich Was-wäre-wenn-Szenarien testen: Wirkstoffforscher könnten damit unter anderem abschätzen, wie sich der Gesundheitszustand der aktuell erkrankten Kohorte entwickelt hätte, wenn alle Patienten bereits seit zwanzig Jahren mit einem bestimmten Medikament behandelt worden wären. In Kombination mit einer mathematischen Modellierung klinischer Versuchsstudien helfen die virtuellen Patienten also dabei, den zu erwartenden Verlauf einer Testreihe bereits im Vorfeld ihrer Durchführung zu berechnen. Dies kann beim Design klinischer Studien sehr von Vorteil sein.

Wann dürfte die Entwicklung virtueller Kohorten soweit abgeschlossen sein, dass Sie die medizinische Forschung grundlegend unterstützen?

Fröhlich: Es gibt bereits eine Reihe Forschungsprojekte, bei denen virtuelle Kohorten eingesetzt werden. Beispielsweise zu neurodegenerativen Erkrankungen und speziell in der Alzheimerforschung. In diesem Bereich gibt es zwar schon eine ganze Reihe von klinischen Studien, von denen jede jedoch nur einen kleinen Ausschnitt der Realität erfasst. Um in der Erforschung von Krankheiten wie Alzheimer signifikant Fortschritte zu erzielen, ist jedoch der Blick auf die Gesamtpopulation unverzichtbar. Deshalb arbeiten wir aktuell intensiv daran, unsere synthetisch erzeugten Patientendaten zu einer weltumspannenden, virtuellen Metakohorte zusammenführen zu können.

Das lokal auf Klinikebene vorhandenes Wissen zu einer Erkrankung lässt sich mittels synthetisch generierter Erkrankungsfälle in einer Meta-Kohorte zusammenführen. Bild: Fraunhofer SCAI

Hofmann-Apitius: Grundsätzlich gilt: Die Verfahren und Methoden, die wir für die Generierung und Bearbeitung synthetischer Daten einsetzen, sind weder auf ein bestimmtes Krankheitsbild noch auf den Anwendungsbereich Medizin beschränkt. Im Gegenteil. Die Komplexität, die die Modelle und Systeme in Bezug auf Alzheimer bewältigen können müssen, ist enorm. Eine Anwendung virtueller Kohorten für weitere Krankheiten und in anderen Forschungsbereichen dürfte in den allermeisten Fällen daher problemlos möglich sein.

(stw)

Keine Kommentare vorhanden

Das Kommentarfeld darf nicht leer sein
Bitte einen Namen angeben
Bitte valide E-Mail-Adresse angeben
Sicherheits-Check:
Eins + = 5
Bitte Zahl eintragen!
image description
Interviewpartner
Alle anzeigen
Prof. Dr. Martin Hofmann-Apitius
  • Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI
Prof. Dr. Holger Fröhlich
  • Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI
Weitere Artikel
Alle anzeigen
Objektive Kennzahlen zur besseren Früherkennung
Virtual Reality zur Regeneration bei Demenz
Gut verteilt
Stellenangebote
Alle anzeigen