KI, die Lungen-CT-Aufnahmen so interpretiert wie ein Radiologe

14. April

Verfasst vom Web-Team

Jeden Tag sichten Radiologen eine große Menge an CT-Aufnahmen auf der Suche nach etwas, das leicht übersehen werden könnte. Ein kleiner Knoten. Ein kaum wahrnehmbarer Schatten. Etwas, das ein Lungenkrebs im Frühstadium sein könnte – oder auch gar nichts.

Lungenkrebs fordert weltweit mehr Todesopfer als jede andere Krebsart. Die Überlebenschancen hängen stark davon ab, wie früh die Erkrankung erkannt wird. Und die Arbeitsbelastung in den meisten radiologischen Abteilungen lässt kaum Raum für die Art von anhaltender, doppelter Aufmerksamkeit, die die Erkennung einer kleinen verdächtigen Läsion tatsächlich erfordert.

Eine soeben in „Scientific Reports“ veröffentlichte Studie eines internationalen Forschungsteams, dem auch Wissenschaftler der Technischen Universität Kaunas in Litauen angehören, hat ein KI-System entwickelt, das eine Aufgabe bewältigen soll, mit der bestehende Tools bisher immer wieder zu kämpfen hatten. Es betrachtet den Scan gleichzeitig auf zwei verschiedene Arten.

Wie ein Radiologe einen Scan tatsächlich auswertet

Wenn ein Radiologe eine CT-Aufnahme auswertet, wechselt er ständig die Perspektive. Er zoomt einen Bereich von Interesse heran, um feine Details zu untersuchen. Dann nimmt er wieder Abstand, um zu verstehen, wie dieser Bereich mit der gesamten Lunge zusammenhängt. Es ist nicht entweder das eine oder das andere. Es ist beides, immer wieder, während der gesamten Befundung.

Die meisten für diese Aufgabe entwickelten KI-Systeme mussten sich für eine der beiden Optionen entscheiden. Entweder sind sie gut darin, feine lokale Details zu erfassen, oder sie sind gut darin, den übergeordneten strukturellen Kontext zu verstehen. Beides gleichzeitig zu erreichen, war bislang ein hartnäckiges technisches Problem.

Die Lösung des Teams ist ein Modell, das sie „C-Swin“ nennen. Es kombiniert zwei verschiedene Arten von neuronalen Netzwerkarchitekturen, die zusammenarbeiten. Ein konvolutionelles neuronales Netzwerk verarbeitet die feinkörnigen lokalen Merkmale – also die detaillierte Mustererkennung, die kleine Läsionen und subtile Texturen erfasst. Ein „Swin Transformer“, eine Architektur, die einen Ansatz mit verschiebbaren Fenstern zur Analyse räumlicher Bildbereiche nutzt, verarbeitet den breiteren Kontext. Die beiden Komponenten arbeiten parallel, wobei ihre Ergebnisse integriert und nicht sequenziell verarbeitet werden.

Der an der KTU tätige Forscher Inzamam Mashood Nasir beschreibt es ganz einfach: Ein Teil des Modells konzentriert sich auf kleine Details, wie zum Beispiel winzige Flecken oder Strukturen in der Lunge, während ein anderer Teil das Gesamtbild betrachtet und den größeren Zusammenhang erfasst. Man kann sich das so vorstellen, als hätte man gleichzeitig eine Lupe und einen Gesamtüberblick über den Scan.

Was die Ergebnisse zeigten

Das Modell wurde anhand des IQ-OTH/NCCD-Datensatzes getestet, einer öffentlich zugänglichen Sammlung von CT-Aufnahmen, wobei die Aufnahmen in drei Kategorien eingeteilt wurden: normal, gutartig und bösartig.

Die Unterscheidung zwischen gutartigen (nicht krebsartigen) Knoten und bösartigen Tumoren gehört zu den schwierigsten Aufgaben in der Radiologie; eine Fehleinschätzung führt entweder dazu, dass Krebserkrankungen übersehen werden oder dass unnötige, invasive Biopsien durchgeführt werden.

Die Ergebnisse waren überzeugend. C-Swin erzielte eine Genauigkeit von 96,26 % bei einer Präzision von 97,48 % und einem F1-Wert von 97,42 %. Im Vergleich zu bestehenden Methoden lag die Verbesserung der Genauigkeit je nach Vergleich zwischen 2,31 % und 6,81 %.

In der Medizin sind diese Unterschiede nicht unerheblich. Ein Prozentpunkt an diagnostischer Genauigkeit, hochgerechnet auf Tausende von Patienten und Hunderttausende von Untersuchungen, macht sich in konkreten Ergebnissen bemerkbar.

Die Forscher sind vorsichtig mit ihren Aussagen. Das Modell wurde anhand eines einzigen Datensatzes trainiert. Es wurde noch nicht mit Geräten verschiedener Hersteller, unterschiedlichen Bildgebungsprotokollen oder verschiedenen Patientengruppen getestet. Nasir spricht dies ganz offen an. Unter realen Bedingungen gibt es viele Variablen, und das System muss vor dem klinischen Einsatz unter Berücksichtigung all dieser Variablen getestet werden.

Dieser Vorbehalt schmälert die Erkenntnis nicht. Es handelt sich um eine ehrliche Beschreibung dessen, wo gute Forschung steht, bevor sie in die klinische Praxis Einzug hält. Die nächsten Schritte sind die klinische Validierung, Tests im Krankenhausumfeld und die Integration in bestehende medizinische Bildgebungssysteme.

Warum das richtige Timing entscheidend ist

Lungenkrebs wird nach wie vor meist erst in einem späten Stadium diagnostiziert, wenn die Behandlungsmöglichkeiten eingeschränkter sind und die Prognosen schlechter ausfallen. Die Kluft zwischen dem, was biologisch möglich ist, und dem, was die Patienten tatsächlich rechtzeitig erreicht, ist eines der zentralen Probleme in der Onkologie.

KI-Tools, die tatsächlich die Zahl der übersehenen Fälle verringern und die Falsch-Positiv-Rate senken – was bedeutet, dass weniger Patienten zu unnötigen Untersuchungen überwiesen werden und die damit verbundene Angst abnimmt –, gehen beide Aspekte dieses Problems gleichzeitig an.

Nasir weist darauf hin, dass sich dieser Ansatz nicht nur auf Lungenkrebs beschränkt. Jede Aufgabe im Bereich der medizinischen Bildgebung, die sowohl eine detaillierte lokale Analyse als auch ein umfassenderes strukturelles Verständnis erfordert, könnte von diesem Ansatz profitieren. Als mögliche Anwendungsbereiche werden Hirntumore, Brustkrebs und Augenerkrankungen genannt.

Das Gesamtbild

Diese Woche gab Demis Hassabis, CEO von Google DeepMind, zwei bedeutende Interviews – eines im „20VC“-Podcast mit Harry Stebbings und eines mit der Wissenschaftskommunikatorin Cleo Abram –, in denen er seine Vision davon darlegte, was KI in der Medizin leisten kann. Seine durchgängige Botschaft lautete, dass die wichtigste Aufgabe der KI nicht in Konsumgütern liege, sondern in der Bekämpfung von Krankheiten. Er sprach davon, dass er sich wünsche, den jahrzehntelangen Prozess der Arzneimittelentwicklung auf wenige Monate zu verkürzen. Darüber, dass KI einen Punkt erreichen wird, an dem die Medizin nicht mehr so aussehen wird wie heute.

Die C-Swin-Studie ist nicht von solch großem Anspruch. Es handelt sich um ein Modell, einen Datensatz und eine sorgfältig abgegrenzte Reihe von Ergebnissen, die auf ihre klinische Validierung warten. Aber genau so wird die Distanz zwischen dem Hier und dem Dort überwunden. Nicht in einzelnen Sprüngen, sondern durch Studien wie diese, die sorgfältig durchgeführt, offen veröffentlicht und vom nächsten Team weiterentwickelt werden.

Die biologischen Zusammenhänge von Lungenkrebs werden immer besser verstanden. Die Behandlungsmethoden beginnen, sich daran anzupassen. Und nun folgt langsam auch die Diagnostik.

Quelle: Yousafzai SN, Nasir IM, Mansour S et al. Ein hybrider Deep-Learning-Ansatz, der CNN und Transformer zur Klassifizierung von Lungenkrebs anhand von CT-Aufnahmen integriert. Scientific Reports. 2026. doi:10.1038/s41598-026-41161-7

Bild: Von einer KI erstellte Illustration

Den Artikel lesen

Web-Team

KI, die Lungen-CT-Aufnahmen so interpretiert wie ein Radiologe

Jeden Tag sichten Radiologen eine große Menge an CT-Aufnahmen auf der Suche nach etwas, das leicht übersehen werden könnte. Ein kleiner Knoten. Ein kaum wahrnehmbarer Schatten. Etwas, das ein Lungenkrebs im Frühstadium sein könnte – oder auch gar nichts.

Schnellere Biomarker-Tests bei Lungenkrebs: Unser FAST-NGS-Pilotprojekt kommt nach Griechenland

Warum breitet sich Lungenkrebs so häufig auf das Gehirn aus?

Bleiben Sie auf dem Laufenden