Inhaltszusammenfassung:
Viele KI-Algorithmen aus dem Bereich des deep learning konnten in den letzten Jahren zeigen, dass die automatisierte Segmentierung der Prostata auf MRT- Datensätzen in ihrer Gesamtheit bereits sehr gute und für den klinischen Alltag akzeptable Ergebnisse liefern kann (Bardis et al., 2021). Von großem Interesse ist das Forschungsfeld der strukturierten KI-basierten Befundung der mpMRT der Prostata hinsichtlich dreier Aspekte: der großen Zeitersparnis gegenüber einer manuellen Bearbeitung der Datensätze, einer über Anwenderinnen und Anwendern hinweg vergleichbaren Befundung und der diagnostischen Präzision, die eine KI bei zunehmenden Bilddatenmengen leisten kann.
Die vorliegende Arbeit ist aus einem Projekt heraus entstanden, das eine KI- basierte Entscheidungshilfe zur Behandlung eines Prostatakarzinoms entwickelt. Eine Anwendung soll dabei prätherapeutisch valide Aussagen zur Wahrscheinlichkeit eines Nervenerhalts bei geplanter radikaler Prostatektomie sowie den postoperativen Resektionsstatus treffen. In einer retrospektiven Erhebung wurden dazu bizentrisch an den beiden Standorten Tübingen und Mannheim 185 und 255 Patientendaten, in Summe also 340, erhoben. Dazu zählen neben den Bildsequenzen der mpMRT der Prostata auch zahlreiche klinische und demographische Parameter.
Vorrangiger Forschungsgegenstand dieser Studie ist es, mögliche Einflussfaktoren auf die Performanz der KI zu untersuchen. Dazu wurde der KI- Algorithmus anhand dreier Trainingsdatensätze zu je 100 Patienten beübt und auf einen Testdatensatz mit 52 Patienten angewandt. Die automatisierten Segmentierungen wurden mit den vom Doktoranden vorgenommenen manuellen Segmentierungen anhand des Sørensen-Dice Koeffizienten verglichen. Die berechneten Sørensen-Dice Koeffizienten dienten als Ausdruck der Güte der KI. Sie wurden als Antwortvariable mittels Verallgemeinernder Schätzgleichung anhand der Prädiktorvariablen Body-Mass-Index, PSA-Dichte, Prostatavolumen im MRT, extraprostatische Ausbreitung, Anzahl suspekter Läsionen, Diameter einer Indexläsion und dem PI-RADS-Score untersucht. Dabei konnte das Prostatavolumen als signifikanter Einflussfaktor identifiziert werden. Die auf Grundlage unterschiedlicher Trainingsdatensätze beübten KIs wurden mit Hilfe eines Äquivalenztests auf Unterschiedlichkeiten hinsichtlich ihrer Segmentierungen analysiert. Es stellte sich heraus, dass sich die drei KIs im Rahmen der zuvor definierten Grenzen nicht unterscheiden. Zur qualitativen Analyse wurden die KI-basierten Segmentierungen außerdem anhand von vier Kategorien klassifiziert.
Uns ist keine Veröffentlichung bekannt, die Einflussfaktoren auf die Performanz automatisierter Segmentierungsalgorithmen untersucht. Künftige Studien könnten auf dieser Arbeit aufbauend weitere Einflussfaktoren analysieren. Denkbar und von sicherlich großem Interesse wäre außerdem eine Untersuchung unserer sowie anderer Einflussfaktoren auf die zonale Segmentierung der Prostata sowie der Umrandung suspekter Läsionen oder konkret eines Prostatakarzinoms. In diesem Bereich erzielen die KI-basierten Algorithmen noch keinen so durchschlagenden Erfolg wie es die Segmentierungen der Prostatagrenzen schaffen.