Online-Recommender-Systeme auf Basis von Datenstrommanagementsystemen

23. Januar 2017, 16:15 , 17:45

Veranstalter:  Cornelius Ludmann, Universität Oldenburg
Ort:  OFFIS, Escherweg 2, Raum F02

Abstract:
Recommender-Systeme werden in verschiedenen Informationssystemen mit dem Ziel eingesetzt, aus einer großen Menge an Objekten (z. B. Nachrichtenartikel, Filme oder Produkte) einige wenige als Empfehlungen für eine Benutzerin oder einen Benutzer auszuwählen. Dazu wird für jedes Objekt, das zur Empfehlung in-frage kommt, durch das Recommender-System geschätzt, wie nützlich bzw. interessant dieses für die Benut-zerin oder den Benutzer ist. Dazu nutzen viele Verfahren explizit erfragtes oder implizit berechnetes Feed-back von Benutzerinnen und Benutzern zu Objekten.
Für viele Recommender-Systeme ist es von Bedeutung, dass das aktuelle Interesse der Benutzerin oder des Benutzers, aktuelle Trends, sowie neu hinzugefügte Objekte bei der Berechnung von Empfehlungen berück-sichtigt werden. Aus diesem Grund ist es wichtig, dass im realen Einsatz die Verzögerung, bis neue Feedback- oder Objektdaten bei der Berechnung von Empfehlungen berücksichtigt werden (sog. Time-to-Serve Delay), möglichst kurz ist. Verfahren, die in Offline-Evaluationen meistens die besten Ergebnisse erzielen, lernen aus einer statischen Datenbank ein Modell an, mit dem die Nützlichkeit von Objekten für eine Benutzerin oder einen Benutzer berechnet werden kann. Wenn im realen Einsatz neue Feedbackdaten hinzukommen und sich somit die Datenbasis ändert, muss das Modell neu gelernt oder aktualisiert werden. Da dieses Vorgehen zeitaufwändig ist, führt dies zu einem hohen Time-To-Serve Delay, welches die Aktualität und somit auch die Qualität der Empfehlungen negativ beeinflusst.
In diesem Promotionsvorhaben wird untersucht, wie Techniken eines generischen Datenstrommanagement-systems (DSMS) für die Umsetzung eines Online-Recommender-Systems genutzt werden können. Dazu wer-den die Feedbackdaten von Benutzerinnen und Benutzern zu Objekten als transiente Ereignisse in einem potentiell unendlichen Datenstrom aufgefasst. Ziel des Vorhabens ist ein Konzept, wie mit datenstrombasier-ten Operatoren, basierend auf der Relationenalgebra, Ausführungspläne zur kontinuierlichen Verarbeitung der Feedbackdaten erstellt werden können. Das soll ermöglichen, zu jeder Zeit Empfehlungen geben zu kön-nen, die das aktuelle Interesse von Benutzerinnen und Benutzern sowie aktuelle Trends berücksichtigen.
Der wissenschaftliche Beitrag besteht aus einem neuen Ansatz für Online-Recommender-Systeme, der die Forschungsergebnisse aus den Communities der Recommender-Systeme und der DSMS vereint. Das soll ermöglichen, dass Wissenschaftler und Betreiber von Recommender-Systemen von den Techniken der Da-tenstromverarbeitung durch DSMS bei der Realisierung von Online-Recommender-Systemen profitieren können. Eine prototypische Implementierung auf Basis des DSMS Odysseus soll mit reellen Daten für die Empfehlung von Nachrichtenartikeln im Rahmen der CLEF NewsREEL Challenge im Live-Betrieb evaluiert werden.
Betreuer: Prof. Dr. Susanne Boll