Wie wahrscheinlich ist es, dass jemand in den nächsten 20 Jahren einen Herzinfarkt erleidet, an Diabetes erkrankt – oder psychische Probleme entwickelt? Ein neues KI-Modell, entwickelt unter anderem vom Europäischen Laboratorium für Molekularbiologie (EMBL) und dem Deutschen Krebsforschungszentrums (DKFZ), verspricht Prognosen für über 1.000 Erkrankungen – auf Basis von Daten aus der realen Welt.
Von der Einzelkrankheit zum Gesamtbild
Bisherige Modelle konzentrierten sich meist auf eine Krankheit – etwa das kardiovaskuläre Risiko oder genetische Prädispositionen für Krebs. Delphi-2M denkt größer: Es wurde mit Datensätzen von mehr als zwei Millionen Menschen trainiert, kombiniert genetische, klinische und demografische Informationen und zieht daraus Wahrscheinlichkeiten für verschiedenste Krankheitsbilder. Im Kern handelt es sich um ein sogenanntes Generative Pre-trained Transformer-Modell (GPT) – also einen Algorithmus, der Muster erkennt und auf dieser Basis Vorhersagen trifft.
In Tests schnitt Delphi-2M erstaunlich gut ab: Für Erkrankungen mit klaren Verlaufsmustern wie bestimmte Krebsarten oder Herzinfarkte erreichte das Modell teils höhere Genauigkeit als spezialisierte Einzelmodelle. Schwieriger wurde es bei psychiatrischen Erkrankungen, Schwangerschaftskomplikationen oder seltenen Leiden, wo der Verlauf komplexer und die Datenlage dürftiger ist.
Chancen und Fallstricke
Fachleute sind beeindruckt – und zugleich vorsichtig. Prof. Robert Ranisch (Universität Potsdam) sieht in Delphi-2M „ein eindrucksvolles Beispiel für das Potenzial generativer KI in der Gesundheitsforschung“. Doch er warnt: Bias, Diskriminierung und der verantwortliche Umgang mit sensiblen Gesundheitsdaten bleiben zentrale Herausforderungen.
Auch die ethische Dimension ist in der Diskussion: Niemand sollte mit einer persönlichen Risikoanalyse konfrontiert werden, ohne zugestimmt zu haben. Das Recht auf Nicht-Wissen müsse ebenso gewahrt bleiben wie der Datenschutz.
Doch es geht ja nicht nur um Vorhersagen. So erinnert Carsten Marr vom Helmholtz Zentrum München daran: „Spannend ist vor allem, welche bislang unbekannten Korrelationen zwischen Krankheiten sichtbar werden – Zusammenhänge, die wir sonst vielleicht nie erkannt hätten.“
KI-Orakel oder Werkzeug?
Die durchschnittliche AUC (Area Under the Curve, Bewertungsmaß für die Leistung eines Klassifikationsmodells) von 0,76 zeigt: Für den individuellen Patienten ist Delphi-2M noch kein präzises Orakel. Aber als Forschungsinstrument und Grundlage für Präventionsstrategien hat es enormes Potenzial.
Am Ende bleibt Delphi-2M das, was sein Name verspricht – ein Werkzeug, das uns erlaubt, in die Zukunft zu blicken, aber keine Schicksalsmaschine. Wie wir mit diesen Blicken umgehen, ist weniger eine Frage der Technik als eine der Ethik.
Oder, wie Ranisch es ausdrückt: „Solche Prognosen sind keine Schicksalsurteile – aber wertvolle Anhaltspunkte für Prävention und Therapie.“
