Process Mining: PMCube

In der Versorgungsforschung stehen komplexe, patientenbezogene und sich oft über Jahre erstreckende, von unterschiedlichen Leistungsträgern erbrachte Prozesse der Gesundheitsversorgung im Blickpunkt. Diese müssen – i. d. R. manuell – zunächst datenschutzkonform ermittelt und beschrieben werden.


Eine Alternative zur manuellen Erhebung der Versorgungsprozesse stellt das Process Mining dar. Darunter sind Techniken zum automatischen Extrahieren, Analysieren und Manipulieren von Prozessmodellen zu verstehen. Diese sind unter anderem in der Lage, aus den während der Ausführung von Prozessen aufgezeichneten Ereignisdaten (Event Logs) automatisch entsprechende Modelle zu extrahieren, die das beobachtete Verhalten beschreiben. Da es sich bei den Event Logs jedoch um flache Tabellen handelt, die alle zu einem Prozess aufgezeichneten Events beinhalten, bietet Process Mining zunächst lediglich eine Gesamtsicht auf den Prozess. Für die Versorgungsforschung ist aber vor allem eine differenzierte Analyse von verschiedenen Patientengruppen (z. B. mit unterschiedlichem Alter oder Vorerkrankungen)
von Interesse. Zudem ist im Vorhinein meist nicht bekannt, worin Unterschiede zwischen den einzelnen Patientengruppen liegen könnten. Daher ist eine explorative Analyse der Prozesse wünschenswert, die einem Nutzer die schrittweise Analyse und den Vergleich unterschiedlicher Patientengruppen ermöglicht.


Die Grundidee hinter dem Ansatz zum multidimensionalen Process Mining ist, dass sich die Eigenschaften der Patientengruppen, die als Attribute im Event Log stehen, als Dimensionen interpretieren lassen, die gemeinsam einen multidimensionalen Datenwürfel aufspannen. Mittels OLAPOperationen können dann beliebige Patientengruppen durch entsprechende Datenausschnitte als Datengrundlage für das Process Mining definiert werden. Somit lassen sich separate Modelle für die verschiedenen Patientengruppen erstellen, die dann vom Nutzer gegenübergestellt und miteinander verglichen werden können. Werden jedoch nicht die erwarteten Unterschiede festgestellt, kann der Nutzer die OLAP-Anfragen anpassen und entsprechend andere Patientengruppen definieren, etwa eine Unterscheidung nach Vorerkrankungen anstatt nach Alter. Somit kann der Nutzer Schritt für Schritt dieVersorgungsprozesse aus unterschiedlichen Blickwinkeln betrachten und letztendlich Auffälligkeiten darin identifizieren. Diese können dann als Ausgangspunkt für weitere Analysen dienen, indem z. B. neue Forschungshypothesen aufgestellt werden.

Ziel des Projektes PMCubeist es, neue Ansätze für das multidimensionale Process Mining zu entwickeln und deren Anwendbarkeit in der Versorgungsforschung zu untersuchen. Dazu werden die Ansätze in einem Werkzeug prototypisch implementiert. Zur Evaluation soll dasWerkzeug in
praxisrelevanten Szenarien der Versorgungsforschung zum Einsatz gebracht und zur Beantwortung vorausgewählter Fragestellungen verwendet werden.