SePaMiM – Sequential Pattern Mining und Pattern Matching von Krankheits- und Behandlungsverläufen für klinische Krebsregister

Projektbeschreibung

Mithilfe computergestützter Methoden und Verfahren der Künstlichen Intelligenz (KI) sind die Möglichkeiten zur Auswertung von in Krebsregistern gespeicherten Daten in den vergangenen Jahren erheblich gestiegen; gleiches gilt aber auch für die Komplexität dieser Daten. Ihr volles Potenzial kann mit den gegenwärtigen Standards noch nicht vollständig erschlossen werden. Dazu wäre es wichtig, Behandlungs- und Krankheitsverläufe zu identifizieren und für weitere Analysen selektieren zu können. Ohne geeignete Verfahren und Werkzeuge ist diese Herausforderung nur mit enormem manuellem Aufwand umzusetzen. Bislang existieren vor allem Kennzahlen, welche die Diagnosedaten betrachten – so etwa den Anteil der histologisch verifizierten Diagnosen – oder einzelne Behandlungsschritte, wie beispielsweise eine Operation. Es fehlen geeignete Herangehensweisen, die einen Behandlungsverlauf im Ganzen plausibel verdeutlichen.

Hier setzt das Projekt SePaMiM an: Die Forschenden untersuchen, inwiefern die Identifikation und Selektion komplexer Behandlungs- und Krankheitsverläufe aus Registerdaten mithilfe geeigneter IT-Systeme unterstützt werden kann. Hierzu sollen geeignete Verfahren des Pattern Matching sowie Methoden des Data Mining genutzt werden. Dazu entwickeln und evaluieren sie einen mehrstufigen Demonstrator einer IT-Anwendung. Dieser Demonstrator soll an ca. 800.000 Datensätzen des Landeskrebsregisters Nordrhein-Westfalen erprobt werden, um Patientengruppen anhand der Behandlungs- und Krankheitsverläufe zu ermitteln und mit den Ergebnissen sowohl eine Qualitätssicherung der Daten als auch eine vergleichende Analyse der Gruppen durchzuführen. Das Projekt wird für drei Jahre mit insgesamt ca. 705.000 Euro gefördert.

Im Erfolgsfall trägt es zur Verbesserung der Datenqualität bei Krebsregistern bei und gibt Impulse für weitere wichtige Datenfelder. Die Auswertung der Daten wird dazu führen, Lücken und Unschlüssigkeiten in der Erfassung zu identifizieren.

Konsortialpartner

Landeskrebsregister NRW gGmbH