Abschlussarbeiten aus dem Bereich Datenstromverarbeitung/Odysseus

Hier finden sich einige aktuelle Ausschreibungen zu Abschlussarbeiten aus dem Bereich Datenstromverarbeitung/Odysseus.

Bitte sprechen Sie Marco Grawunder direkt an, wenn Sie zu einem der Themen weitere Informationen benötigen.

Weitere Hintergrundinformationen sind auf der Odysseus-Seite zu finden.

Angebotene Abschlussarbeiten

Bachelorarbeiten

  • Simulator für Protokolle aus dem Energienetz auf Basis von Odysseus (Bachelor Thesis)
    Im Energienetz kommen unterschiedliche Protokolle zur Kommunikation zum Einsatz, unter anderem DLMS/COSEM und IEC 60870-5-104. Das Arbeiten mit diesem Protokollen ist allerdings nicht immer ganz einfach, vor allem, wenn man keine Testdaten zur Verfügung hat. Hier kommt die Vision ins Spiel, einen erweiterbaren Protokollsimulator zu haben, der Testdaten liefern kann, einfach zu bedienen ist, und vor allem leicht erweiterbar und parametrierbar ist.

    Im Rahmen einer Bachelorarbeit soll das Datenstrommanagementsystem Odysseus verwendet werden um einen erweiterbaren Simulator für Energienetzprotokolle zu entwickeln. Als ein Beispiel für einen solchen Simulator kann man sich den Fink WinPP Protokollsimulator anschauen (http://www.ipcomm.de/product/FinkWinPP/de/sheet.html). Neben funktionalen Anforderungen an den Simulator, die in Zusammenarbeit mit dem Betreuer ausgearbeitet werden sollen, geht es auch darum, einen Client mit Benutzeroberfläche zu designen.
  • Möglichkeiten der Videoüberwachung mit Odysseus (Bachelor Thesis)
    Odysseus besitzt grundsätzliche Fertigkeit zur Bild- und Videoverarbeitung. In dieser Arbeit soll theoretisch untersucht und praktisch mit Hilfe unterschiedlicher Raspberry Pi basierter Kameras evaluiert werden, welche Möglichkeiten es gibt, Odysseus zur Überwachung von sicherheitsrelevanten Bereichen einzusetzen (Stichworte: Bewegungserkennung und Gesichtserkennung).
  • Algorithmus zum Vergleich von Event Logs (Bachelor Thesis)
    In dieser Arbeit soll ein direkter Vergleich von Event-Logs mit entsprechender Visualisierung entwickelt werden (siehe BPMDS-Paper von Alfredo-Bolt)
  • Enabling Digital Signal Processing over Data Streams (Bachelor Thesis, Master Thesis)
    Es gibt eine ganze Reihe von Datenquellen, die nicht relationaler Natur sind. In dieser Arbeit sollen Ansätzen untersucht und implementiert werden, die es erlauben, Odysseus auch mit Verfahren der Signalverarbeitung auszustatten. In der Arbeit https://infoscience.epfl.ch/record/220881/files/EPFL_TH7183.pdf in Kapitel 7 sind Ansätze dafür aufgezeigt.
  • Serialisierbarkeit von Operatoren in Odysseus (Bachelor Thesis)
    Die Serialisierbarkeit von Operatoren oder ihrer Zustände spielt in Datenstrom(management)systemen eine große Rolle. Zum Beispiel müssen Operatorzustände für etwaige Recoverymaßnahmen regelmäßig gespeichert und im Falle einer Recovery entsprechend wiederhergestellt werden. Ein anderes Beipiel stellt die Übertragung von Operatorzuständen von einem Operator auf einen anderen im Falle eines Load Balancings dar. In dieser Bachelorarbeit soll unser Datenstrommanagementsystem Odysseus dahingehend erweitert werden, dass Operatoren bzw. ihre Zustände in einer konsistenten Art und Weise gesichert und geladen werden können. Dazu soll zum einen zunächst recherchiert werden, wie andere Datenstrom(management)systeme, wie zum Beispiel Apache Flink oder Apache Kafka, vorgehen. Zum anderen muss die Architektur von Odysseus analysiert und entsprechend berücksichtigt werden.
  • Active Standby in Odysseus (Bachelor Thesis, Master Thesis)
    Eine Datenstromverarbeitung bedarf besonderer Maßnahmen um eine hohe Verfügbarkeit zu garantieren, da die zumeist aktiven Datenquellen nicht aufhören Daten zu senden, wenn das Datenstrommanagementsystem (DSMS) "down" ist. Eine Möglichkeit eine hohe Verfügbarkeit zu gewährleisten besteht darin, die Datenstromverarbeitung redundant auf mind. zwei Knoten durchzuführen, wobei nur ein Knoten Ergebnisse an die entsprechenden Senken schickt, während der sogenannte Backup-Knoten dies nur dann tut, wenn der andere Knoten ausgefallen wird. In einer Bachelorarbeit soll das Verfahren "Active Standby" umgesetzt werden, bei dem der Backup-Knoten bereits während der andere Knoten noch aktiv ist, die Verarbeitung durchführt und seine Ergebnisse puffert. Von Zeit zu Zeit gibt der aktive Knoten an, welche Ergebnisse er erfolgreich abliefern konnte, so dass bei einem Ausfall der Backup-Knoten umgehend alle Daten ab diesem Checkpoint an die Senken schicken kann. Im Falle einer Masterarbeit soll darüber hinaus das Verfahren "Passive Standby" umgesetzt werden, bei dem der Backup-Knoten zunächst keine aktive Verarbeitung durchführt, sondern erst, wenn der andere Knoten ausgefallen ist. Außerdem sollen die beiden Verfahren bzgl. Kosten und Nutzen verglichen werden.
  • Happy-flow-basiertes Layouting von Prozessmodellen (Bachelor Thesis)
    Process Mining Algorithmen können je nach Parametrisierung zu Prozessmodellen mit unterschiedlichem Detaillierungsgrad führen. Z.B. können weniger relevante Knoten und Kanten aus dem Modell herausgefiltert werden. Die zur Visualisieerung verwendeten Layoutalgorithmen für Graphen orientieren sich i.d.R. nur an der Graphtopologie. Knoten und Kanten werden dabei so angeordnet, dass sie sich möglichst nicht überschneiden. Als Folge werden bei Parameteränderungen die Modellelemente aufgrund der geänderten Graphtopologie anders angeordnet, sodass die Auswirkungen der Parameteränderungen nur schwer zu erkennen sind. Außerdem werden die Elemente der Prozessmodelle häufig so angeordnet, dass die Darstellung nicht dem Hauptpfad (Happy flow) des Prozesses folgt, was die Interpretation zusätzlich erschwert. Ziel der Arbeit ist es daher, einen Layout-Algorithmus zu entwerfen, der die Flusssemantik von Prozessmodellen berücksichtigt und darüber hinaus die räumliche Anordnung der Knoten auch bei Modellen mit unterschiedlichem Detaillierungsgrad beibehält. Dabei soll sich der Algorithmus am Happy Flow des Prozessmodells orientieren. Außerdem soll untersucht werden, welche weiteren Process-Mining-basierten Metriken genutzt werden können, um eine sinnvolle und im Hinblick auf die Interpretation der Modelle zielführende Anordnung der Modellelemente zu erhalten. Der konzipierte Layouting-Algorithmus soll in die vom Process-Mining-Werkzeug PMCubeExplorer verwendete Layouting-Bibliothek GraphSharp integriert und anhand von Beispielen aus dem Process Mining evaluiert werden.
  • Generische Trace-Alignment-Komponente für PMCube Explorer (Bachelor Thesis)
    PMCube Explorer bietet bereits ein Token-Replay-Verfahren, um die Übereinstimmung (Conformance) eines Prozessmodells mit einem Eventlog zu überprüfen. In dieser Arbeit soll PMCube Explorer um die Alternative eines sogenannten Trace-Alignments erweitert werden. Das zu entwickelte Plugin soll dabei so entworfen werden, dass es unterschiedliche Arten von Prozessmodellen (Process Trees, Petrinetze, ...) verarbeiten kann.
  • Umgang mit großen Fenstern (Bachelor Thesis)
  • Odysseus und Micro-Services (Bachelor Thesis)
    Mircoservices stellen eine aktuellen Architekturansatz dar um auf der Basis von kleinsten Prozessen komplexe Anwendung zu gestalten. Hier spielt vor allem die Zusammenstellung (Orchestrierung) eine wesentliche Rolle als auch der Umgang mit Fehlern. In dieser Arbeit soll untersucht werden, wie Odysseus als Plattform für die Integration von Microservices verwendet werden kann. Im Rahmen eines kleinen Beispielszenarios soll diese Integration überprüft werden.
  • Unterschiedliche Join Algorithmen für Odysseus (Bachelor Thesis)
    Basierend auf der BSc von Michael Cammert http://archiv.ub.uni-marburg.de/diss/z2014/0500/pdf/dmc.pdf
  • Evaluierung der Skalierbarkeit von OdysseusNet mit Apache Kafka (Bachelor Thesis)
    Zur Zeit geschieht die Kommunikation und vor allem auch der Datenstromtransfer zwischen verschiedenen Instanzen über eine eigens entwickelte NodeCommunication-Klasse (siehe http://odysseus.informatik.uni-oldenburg.de:8090/display/ODYSSEUS/Developing+with+OdysseusNet für einen schematischen Überblick). Da OdysseusNet modular aufgebaut ist, besteht die Möglichkeit die NodeCommunication-Klasse durch etwas anderes zu ersetzen um verschiedene Implementierungen für verschiedene Szenarien verfügbar zu haben und/oder sie mit einander zu vergleichen. Eine mögliche andere Implementierung könnte in diesem Zusammenhang sein, die Datenströme über ein Publish/Subscribe-System (konkret Apache Kafka, http://kafka.apache.org/) zu verteilen und zu überprüfen, in wie weit sich dadurch die Performanz, die Ausfallsicherheit und die Skalierbarkeit ändern.
  • Visualisierung (verteilter) Anfragepläne in Odysseus(Net) (Bachelor Thesis)
    Odysseus verfügt über eine RCP-Komponente, die physische Anfragepläne als Graphen darstellt. Diese GUI-Komponente weist allerdings Mängel auf, wenn es entweder um die Darstellung von massiv parallelisierten Teilgraphen oder um die Darstellung von auf mehrere Knoten verteilten Anfragen geht. Bei der Parallelisierung ist der Graph aufgrund der vielen Elemente nicht mehr gut lesbar und bei der Verteilung wird. lediglich der lokale Teil der Anfrage dargestellt. Diese Mängel sollen durch eine Neuentwicklung der GUI-Komponente für die Anfragepläne behoben werden. Dabei sollte zunächst auch nach geeigneten Frameworks recherchiert werden.
  • Stream Processing Templates (Bachelor Thesis, Master Thesis)
    Es ist immer noch relativ schwierig zu starten. https://templates.prediction.io/ bieten auch dem Bereich des Data Minings Templates an von denen man ausgehen kann. Könnte man sowas auch für Stream-Processing und Odysseus machen?
  • Sprache für Apache Flink Anfragen in Odysseus (Bachelor Thesis)
    Apache Flink kommt Odysseus (im Vergleich zu anderen Systemen) relativ nah. Um uns aber besser mit Flink vergleichen zu können, wäre es interessant, Flink-Anfragen in Odysseus formulieren zu können. Beispiel: // Stream of (sensorId, carCnt) val vehicleCnts: DataStream[(Int, Int)] = ... val tumblingCnts: DataStream[(Int, Int)] = vehicleCnts // key stream by sensorId .keyBy(0) // tumbling time window of 1 minute length .timeWindow(Time.minutes(1)) // compute sum over carCnt .sum(1) val slidingCnts: DataStream[(Int, Int)] = vehicleCnts .keyBy(0) // sliding time window of 1 minute length and 30 secs trigger interval .timeWindow(Time.minutes(1), Time.seconds(30)) .sum(1) (Quelle: http://flink.apache.org/) Aspekte: - Punkt-Notation - Reihenfolge von Parametern - Zugriff auf Parameter über Index - Integration mit xText
  • Data Provenance in Streaming Systems (Bachelor Thesis, Master Thesis)
    Data Provenance meint den Ursprung eines Datums/Events. Es soll demnach möglich sein, in einem Datenstrommanagementsystem ein Ausgabedatum/-event bis hin zu den Eingabedaten/Events, die zu seiner Existenz beigetragen haben, zurückzuverfolgen. Dies ist vor allem für Diagnosen, Debugging aber auch für eine Transparenz gegenüber Nutzern wichtig. Ein Ansatz zu diesem Thema ist im Anhang beschrieben und soll in einer Bachelor- oder Masterarbeit für Odysseus umgesetzt werden, wobei sich eine Masterarbeit noch intensiver mit eigenen, anderen Ansätzen/Umsetzungsmöglichkeiten auseinander setzen sollte.
  • Mechanismen zur Sicherstellung von Datenqualität in DSMS (Bachelor Thesis, Master Thesis)
  • Überwachung von Netzwerkaktivität mit Odysseus/Intrusion Detection (Bachelor Thesis)
    Intrusion Detection Systeme analyisieren Netzwerkereignisse. In dieser Arbeit soll untersucht werden, in wie weit Odysseus in der Lage ist, diese Aufgabe zu übernehmen und ggf. prototypisch umzusetzen.
  • Enrich: Caching des Enrich-Operators (Bachelor Thesis, Master Thesis)
    Das Caching wird aktuell sehr naiv als HashMap von Java realisiert. Hier wäre unterschiedliche Ansätze möglich, dies schlauer zu machen (z.B. indem SSDs integriert werden) oder MemCache eingesetzt wird. Ggf. könnten auch Hauptspeicherdatenbanken verwendet werden.

Masterarbeiten

  • Enabling Digital Signal Processing over Data Streams (Bachelor Thesis, Master Thesis)
    Es gibt eine ganze Reihe von Datenquellen, die nicht relationaler Natur sind. In dieser Arbeit sollen Ansätzen untersucht und implementiert werden, die es erlauben, Odysseus auch mit Verfahren der Signalverarbeitung auszustatten. In der Arbeit https://infoscience.epfl.ch/record/220881/files/EPFL_TH7183.pdf in Kapitel 7 sind Ansätze dafür aufgezeigt.
  • Active Standby in Odysseus (Bachelor Thesis, Master Thesis)
    Eine Datenstromverarbeitung bedarf besonderer Maßnahmen um eine hohe Verfügbarkeit zu garantieren, da die zumeist aktiven Datenquellen nicht aufhören Daten zu senden, wenn das Datenstrommanagementsystem (DSMS) "down" ist. Eine Möglichkeit eine hohe Verfügbarkeit zu gewährleisten besteht darin, die Datenstromverarbeitung redundant auf mind. zwei Knoten durchzuführen, wobei nur ein Knoten Ergebnisse an die entsprechenden Senken schickt, während der sogenannte Backup-Knoten dies nur dann tut, wenn der andere Knoten ausgefallen wird. In einer Bachelorarbeit soll das Verfahren "Active Standby" umgesetzt werden, bei dem der Backup-Knoten bereits während der andere Knoten noch aktiv ist, die Verarbeitung durchführt und seine Ergebnisse puffert. Von Zeit zu Zeit gibt der aktive Knoten an, welche Ergebnisse er erfolgreich abliefern konnte, so dass bei einem Ausfall der Backup-Knoten umgehend alle Daten ab diesem Checkpoint an die Senken schicken kann. Im Falle einer Masterarbeit soll darüber hinaus das Verfahren "Passive Standby" umgesetzt werden, bei dem der Backup-Knoten zunächst keine aktive Verarbeitung durchführt, sondern erst, wenn der andere Knoten ausgefallen ist. Außerdem sollen die beiden Verfahren bzgl. Kosten und Nutzen verglichen werden.
  • Integration von Domänenwissen in Process Mining: Landmark-aware Process Discovery (Master Thesis)
    Process-Discovery-Algorithmen sind in der Lage, ohne apriori-Wissen aus einem Eventlog ein passendes Prozessmodell zu erzeugen. Jedoch verfügen die an der Prozessanalyse beteiligten Domänenexperten in der Regel über umfangreiches Hintergrundwissen, das jedoch in der Analyse nicht berücksichtigt wird. So gibt es in medizinischen Prozessen z.B. bestimmte Aktivitäten (z.B. Aufnahme, Operation, Entlassung), die für jede Prozessinstanz nur einmal vorkommen sollten, während andere Aktivitäten (z.B. Laboruntersuchungen) beliebig oft zu unterschiedlichen Zeitpunkten ausgeführt werden können. In der Arbeit soll ein Process-Discovery-Algorithmus entwickelt werden, der diese Unterschiede bei der Modellgenerierung berücksichtigt.
  • Parallele Anfrageverarbeitung auf der Grafikkarte (Master Thesis)
  • Dynamische Lastverteilung in Odysseus (Master Thesis)
    Die Last (CPU, RAM, Netzwerk), die durch eine Datenstromverarbeitung entsteht, kann über die zeit variieren. Dies ist vor allem durch die lange Laufzeit von Anfragen in einem Datenstrommanagementsystem begründet. In Odysseus ist es aber im Moment nur möglich statisch beim Erstellen einer Anfrage eine Lastverteilung vorzunehmen. Ziel dieser Masterarbeit ist es, eine dynamische Lastverteilung in Odysseus zu konzipieren und zu realisieren. Dazu gehört eine Sichtung des Forschungsfeldes bzgl. vorhandener Konzepte, eine Adaption mindestens eines geeigneten Konzepts, sowie die Möglichkeit für weitere alternative Konzepte zu schaffen.
  • Stream Processing Templates (Bachelor Thesis, Master Thesis)
    Es ist immer noch relativ schwierig zu starten. https://templates.prediction.io/ bieten auch dem Bereich des Data Minings Templates an von denen man ausgehen kann. Könnte man sowas auch für Stream-Processing und Odysseus machen?
  • Data Provenance in Streaming Systems (Bachelor Thesis, Master Thesis)
    Data Provenance meint den Ursprung eines Datums/Events. Es soll demnach möglich sein, in einem Datenstrommanagementsystem ein Ausgabedatum/-event bis hin zu den Eingabedaten/Events, die zu seiner Existenz beigetragen haben, zurückzuverfolgen. Dies ist vor allem für Diagnosen, Debugging aber auch für eine Transparenz gegenüber Nutzern wichtig. Ein Ansatz zu diesem Thema ist im Anhang beschrieben und soll in einer Bachelor- oder Masterarbeit für Odysseus umgesetzt werden, wobei sich eine Masterarbeit noch intensiver mit eigenen, anderen Ansätzen/Umsetzungsmöglichkeiten auseinander setzen sollte.
  • Mechanismen zur Sicherstellung von Datenqualität in DSMS (Bachelor Thesis, Master Thesis)
  • Enrich: Caching des Enrich-Operators (Bachelor Thesis, Master Thesis)
    Das Caching wird aktuell sehr naiv als HashMap von Java realisiert. Hier wäre unterschiedliche Ansätze möglich, dies schlauer zu machen (z.B. indem SSDs integriert werden) oder MemCache eingesetzt wird. Ggf. könnten auch Hauptspeicherdatenbanken verwendet werden.

Laufende Abschlussarbeiten

  • Erkennung emergenter Trents am Beispiel von Twitter mit Hilfe von Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
  • Online Nutzerklassifizierung über Twitter Streams mit Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
  • Entwicklung eines Konzepts zum Einsatz eines Robo-Advisors zur Unterstüzung der Portfolioverwaltung in einer Bank (Master Thesis; Betreuer: Marco Grawunder)
  • Webbasierte Erstellung von Anfrageplänen für Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
  • Social Media Monitoring Show Case mit Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
    Im Rahmen von Abschlussarbeiten wurden erste Schritte hin zu einer Plattform gemacht, die ein Überwachen von Social Media Auftritten (wie Facebook, Twitter oder auch Foren) ermöglicht. Die dabei entstandenen Basistechnologien sollen hier weiter verknüpft, vertieft und an einem realen Szenario evaluiert werden.
  • Security-Punctuations in Odysseus (Bachelor Thesis; Betreuer: Michael Brand)
    In der Literatur gibt es ein Framework für Datenstrommanagementsysteme (DSMS), das nach Meinung der Autoren (Nehme, Rundensteiner und Bertino) einen flexiblen Sicherheitsansatz für Datenströme und deren Verarbeitung umsetzt. Bei diesem Ansatz wird angenommen, dass zukünftige, personenbezogene Geräte die Datenströme, die sie übermitteln, direkt mit Sicherheitsrichtlinien koppeln und sich die Sicherheitsrichtlinien daher schnell und häufi g ändern. Die Sicherheitsrichtlinien werden in dem Konzept entsprechend über den Datenstrom in Form von Sicherheits-Punctuations kommuniziert, damit sie auch umgehend bei den folgenden Datenstromelementen Anwendung finden können. Als Punctuations werden dabei Elemente in einem Datenstrom bezeichnet, die keine Nutzdaten tragen, sondern für andere Informationen, wie in diesem Fall Zugriffsrechte, genutzt werden können. Im Rahmen einer Bachelorarbeit soll dieses Konzept auf Odysseus übertragen werden. Ein weiterer Aspekt der Arbeit ist das Finden eines geeigneten Szenarios, sowie der Daten- und Punctuations-Erzeugung für dieses Szenario.
  • Möglichkeiten der Erstellung von Anfragen auf der Basis von Sprache (Bachelor Thesis, Master Thesis; Betreuer: Marco Grawunder)
    Anfragen werden in Odysseus typischweise mit Hilfe von PQL oder CQL (einem SQL-Dialekt) formuliert. Bei Einsatz z.B. in einem SmartHome ist diese Formulierung für den Nutzer u.U. etwas zu kompliziert. In dieser Arbeit geht es darum zu untersuchen, welche Verfahren des Natural Language Processing dabei helfen, eine natürlichsprachliche Anfrage im Stil von "Schalte immer das Licht an wenn ich fernsehe und es draußen dunkel ist" möglich ist.
  • Out-of-Order-Verarbeitung in Odysseus (Bachelor Thesis; Betreuer: Michael Brand)
    Die Verarbeitung in Odysseus ist i.d.R. darauf ausgerichtet, dass die Daten in der richtigen zeitlichen Reihenfolge auftreten. Typischerweise wird die Ordnung dabei zu Beginn der Verarbeitung hergestellt. Es gibt in Odysseus bereits einige Möglichkeiten, mit einer Out-of-Order-Verarbeitung umzugehen. In dieser Arbeit sollen die unterschiedlichen Ansätze analysiert, getestet und bewertet werden. Ggf. werden dabei noch neue, zu implementierende Ansätze erkannt.
  • Profiling von kontinuierlichen Anfragen in Odysseus (Bachelor Thesis, Master Thesis; Betreuer: Marco Grawunder)
    z. B.: - Latenz verteilt auf die einzelnen Operatoren im Anfrageplan
  • XML-basierte Verarbeitung in Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
    Odysseus bietet aktuell als Austauschdatenformat vor allem relationale Tupel an. Es gibt bereits Ansätze, JSON Objekte (als KeyValue) zu verarbeiten. In dieser Arbeit soll es darum gehen, zu analysieren und umzusetzen, wie die Verarbeitung auf der Basis von XML (und bspw. entsprechenden XPath-Ausdrücken) möglich ist, um so Streaming auch auf XML zu ermöglichen.

Abgeschlossene Abschlussarbeiten

  • Klassifikation von Zeitreihen mit symbolischen Repräsentanten und Lücken (Master Thesis; Betreuer: Marco Grawunder)
    Externe Arbeit zusammen mit Kisters Sebastian Horwege
  • Entwicklung einer Webanwendung für IFTTT (If this then that)/ MS Flow mit Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
    Es gibt verschiedene Dienste (wie IFTTT oder Microsoft Flow) die beim Eingehen bestimmter Events Reaktionen auslösen. In dieser Arbeit soll es darum gehen, die beiden existierenden Dienste zu analysieren und einen prototypische Umsetzung auf der Basis von Odysseus zu realisieren. Da Odysseus viele der Dinge schon kann, geht es hier im Wesentlichen um ein Tool mit dem auch Laien die gewünschten Funktionen umsetzen können.
  • Odysseus Datenpumpe: Schnelles Schreiben von Events in NoSQL Systeme (Bachelor Thesis; Betreuer: Marco Grawunder)
    Normalerweise haben Datenstromsysteme einen Fire-and-Forget-Ansatz. Daten die bei den Senken ankommen, werden nicht weiter betrachtet. Es besteht aber die Möglichkeit, Daten in eine Datenbank zu schreiben- In dieser Arbeit soll es darum gehen zu untersuchen, welche Möglichkeiten es gibt, Daten möglichst schnell (ggf. auch parallel) wegzuspeichern. Dazu sollen verschiedene NoSQL-Systeme untersucht werden.
  • Online Content-based Filtering in Datenstrommamagementsystemen (Master Thesis; Betreuer: Cornelius Ludmann)
  • Modulare Online Matrix-Faktorisierung über Sliding Time Windows in Odysseus (Master Thesis; Betreuer: Cornelius Ludmann)
  • Echtzeitberechnung des Value-at-Risk zur Einschätzung von Marktpreisrisiken mit Odysseus (Master Thesis; Betreuer: Cornelius Ludmann)
  • Kryptographie und Datenstromverarbeitung (Master Thesis; Betreuer: Marco Grawunder)
  • SomeMod: Social Media Monitoring Dashboard (Bachelor Thesis; Betreuer: Marco Grawunder)
    Webbasierter Client für eine Social Media Monitoring Tool
  • Integration von Neuronalen Netzen in Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
  • Dynamische Parallelisierung in Odysseus (Master Thesis; Betreuer: Marco Grawunder)
  • Graphverarbeitung mit Odysseus (Master Thesis; Betreuer: Michael Brand)
    - Wie kann man Graphverabeitung (Graphdatenbanken) und Datenstromverarbeitung zusammen bringen? - Was gibt es in diesem Bereich bereits? - Welche DSMS können mit Graphen umgehen? - Wie kann man Graphinformationen einlesen? Tupel? - Wie baut man daraus einen Graphen/ Wie wird dieser in Odysseus repräsentiert? - Wie sehen bei Graphen/ Graphelementen Gültigkeiten aus? Fenster? Mögliches Szenario: DEBS Grand Challenge 2016
  • Vergleich mit Apache Flink (Master Thesis; Betreuer: Marco Grawunder)
    Es wäre schön uns mit Apache Flink zu vergleichen, da es Odysseus (im Vergleich zu anderen aktuellen Systemen) am meisten zu ähneln scheint.
  • ETL mit Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
  • Optimierungsansätze für Stream Reasoning in Odysseus (Master Thesis; Betreuer: Marco Grawunder)
  • Anfragebasiertes Admission Control in Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
    Ansätze zum Anfragebasierten Admission Control zu Ende durchdenken und umsetzen. Ausgangspunkt kann das BTW-Paper sein. Zusätzlich notwendig: Komplexes Szenario definieren, evaluieren und CADL
  • Odysseus auf Grafikkarten (Bachelor Thesis; Betreuer: Timo Michelsen)
  • Map-DashboardPart (Bachelor Thesis; Betreuer: Timo Michelsen)
  • Loadbalancing in Odysseus (Master Thesis; Betreuer: Timo Michelsen)
  • Erweiterung eines DSMS durch OPC UA am Beispiel von Odysseus (Master Thesis; Betreuer: Marco Grawunder)
  • Erweiterung des Matrix-Features in Odysseus (Bachelor Thesis; Betreuer: Cornelius Ludmann)
    Erweiterung des Matrix-Features in Odysseus um mindestens folgende Funktionen: * Effiziente Speicherung dünn besetzter Matrizen * Matrix-Faktorisierung (MF) / Matrix-Decomposition für voll besetzte Matrizen (z. B. SVD) und dünn besetzte Matrizen (z. B. Low-rank, nonnegativ, probabilistic Matrix Factorization) Operatoren für die MF sollten modular aufgebaut sein, sodass z. B. unterschiedliche Verlustfunktionen genutzt werden können.
  • Nutzung von Open Linked Data für ein RecSys mit Odysseus (Master Thesis; Betreuer: Cornelius Ludmann)
    Beispieldatensatz: http://sisinflab.poliba.it/events/lod-recsys-challenge-2015/
  • Entwicklung eines Condition Monitoring-Werkzeugs auf der Basis von Datenströmen mit Odysseus (Master Thesis; Betreuer: Marco Grawunder)
  • Entwicklung eines generischen Konzepts zur Materialisierung im MPM (Master Thesis)
    Besonderer Fokus sollte auf der Materialisierung von Zwischenergebnissen der Mining-Algorithmen liegen. Dabei ist zu beachten, dass im MPM belibige Algorithmen mit unterschiedlichen Zwischenergebnissen vorhanden sein können
  • Integration von Process-Enhancement in den PMCubeExplorer (Bachelor Thesis, Master Thesis; Betreuer: Thomas Vogelgesang)
    Ziel dieser Arbeit ist es, ein generisches Konzept zum Process-Enhancement zu entwickeln und in den PMCube Explorer zu integrieren. Dabei soll durch die konkrete Umsetzung einer oder mehrerer Perpektiven die Erweiterbarkeit/Austauschbarkeit des Ansatzes gezeigt werden.
  • Conformance Checking auf Process Trees (Bachelor Thesis; Betreuer: Thomas Vogelgesang)
    Im PMCubeExplorer stehen bereits Conformance-Checking Technologien (Token Replay, Comparing Footprints) zur Verfügung, allerdings nur für Petrinetze. Anders als Petrinetze haben Process Trees jedoch keine Netzstruktur, wodurch ein einfaches Verfolgen der Kanten vom Start- bis zum Endknoten nicht möglich ist. Ziel dieser Arbeit ist es, bestehende Techniken zum Conformance-Checking (Token-Replay, Comparing Footprints) auf Baumstrukturen zu übertragen. Dadurch soll es möglich werden, die Fitness für Process-Trees zu ermitteln.
  • Parallelisierte Verarbeitung von Datenströmen in Multicore-Umgebungen mit dem Datenstrommanagement-Framework Odysseus (Master Thesis; Betreuer: Marco Grawunder)
    SIGMOD TUTORIAL SESSIONS Tutorial 1: How to Stop Under-Utilization and Love Multicores Tuesday 10:30-12:10, Tuesday 13:30-15:10 Location: Magpie Hashtag: #sigmod14 #tutorial1 Presenters: Anastasia Ailamaki, EPFL; Erietta Liarou, EPFL; Pinar Tozun, EPFL; Danica Porobic, EPFL; Iraklis Psaroudakis, EPFL, SAP AG
  • Ein Transformationsansatz für die automatische Erstellung von ereignisgesteuerten Softwaresystemen (Master Thesis; Betreuer: Marco Grawunder)
    Aktuell werden immer Anfragen direkt in einer Odysseus-Runtime ausgeführt. Diese Arbeit soll Ansätze untersuchen, wie man Anfragen exportiert, kompiliert und dann laufen lässt. --> Compiler für Anfragen. Das Ganze kann erstmal auf Java-Ebene erfolgen, später aber vielleicht auch für andere Programmiersprachen.
  • Smart Home mit Odysseus P2P (Master Thesis; Betreuer: Timo Michelsen)
    OdysseusP2P im Smart Home Kontext mittels einem Netzwerk aus Raspberry Pi einsetzen
  • Big Windows - Processing Large Datasets in DSMS (Master Thesis; Betreuer: Marco Grawunder)
    SweepArea mit vielen Daten a) Indexstrukturen b) Kompression c) Auslagerung
  • Adaptive State Estimation with Odysseus and Mosaic (Master Thesis; Betreuer: Marco Grawunder)
  • Erstellung und Analyse von Bewegungsprofilen mit Odysseus (Master Thesis; Betreuer: Marco Grawunder)
  • Odysseus/Bilderkennung/Fussball (Bachelor Thesis; Betreuer: Marco Grawunder)
    Kristian Bruns
  • Odysseus SCADA (Bachelor Thesis; Betreuer: Marco Grawunder)
    EclipseScada + Windml.org --> Odysseus
  • Integration von Natural-Language-Processing-Verfahren in ein Datenstrom-Management-System (Bachelor Thesis; Betreuer: Marco Grawunder)
    Sprachliche Analyse von Twitter-Nachrichten mit Hilfe von Natural Language Processing Verfahren
  • MEL-Designer (Bachelor Thesis; Betreuer: Thomas Vogelgesang)
    Ziel der Arbeit ist es, ein Werkzeug für den Aufbau von MEL zu entwerfen und umzusetzen. Das Tool soll unter anderem folgende Funktionalitäten enthalten: - Tabellenstruktur aus Metadaten - Händisches und automatisches Befüllen von Dimensionstabellen - Funktion zur Integration von Event Logs über eine generische Schnittstelle. Dabei sollen insbesondere existierende Event-Log-Formate genutzt werden Für diese Arbeit wird das Metadatenmodell (inl. Editor) und ggf. die XES-Implementierung von Alexander Meister bereitgestellt.
  • Werkzeug zur integrierten Überwachung sozialer Netzwerke auf Basis von Odysseus (Master Thesis; Betreuer: Marco Grawunder)
  • Securing Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
    Evtl. durch Julian Cekici
  • Parallelisierung von Process-Mining-Algorithmen (Master Thesis; Betreuer: Thomas Vogelgesang)
    Es soll untersucht werden, inwieweit Process-Mining-Verfahren (insbesondere Process-Discovery) parallelisiert werden können (z.B. durch Map-/Reduce-Ansätze. Dabei sollen unter anderem verschiedene Algorithmen auf ihre Parallelisierbarkeit untersucht werden (z.B. Alpha-Algorithmus, Heuristics Miner, Multiphase Process Mining, Genetic Miner (schon in anderen Arbeiten diskutiert). Gegebenenfalls muss eine parallelisierte Variante eines bestehenden Algorithmus bzw. ein neuer paralleler Algorithmus entwickelt und umgesetzt werden.
  • Process-Mining auf Datenströmen (Bachelor Thesis, Master Thesis; Betreuer: Thomas Vogelgesang)
    Es soll untersucht werden, inwiefern Process Mining Techniken auf Datenströmen (für den Operational Support) angewendet werden können. Mögliche Fragestellungen sind: Conformance Checking auf Event-Strömen und mit vorhandenem (statischem Modell) - Wie können die Event-Ströme aussehen? - Wie können die Ergebnisse aussehen? - Implementierung eines eigenen Operators Inkrementeller Process Discovery Algorithmus - Wie kann man ein Prozessmodell inkrementell erstellen, um ständige Scans der Daten zu vermeiden? Process Discovery auf Fenstern - Implementierung als eigenen Operator (ähnlich zur Diss von DGe)
  • Big Windows (Bachelor Thesis, Master Thesis; Betreuer: Marco Grawunder)
    Procesing large Windows (millions of tuples), what are the options? What is for which cases the best option (e.g. including main memory stores)
  • Entwicklung eines verteilten Reputationssystems zur Anwendung in OdysseusNet (Bachelor Thesis, Master Thesis; Betreuer: Michael Brand)
  • GWT-basierte Oberfläche für Odysseus (Bachelor Thesis; Betreuer: Timo Michelsen)
    Entwicklung einer GWT-basierten Oberfläche: - textuelle definition von Datenquellen und Anfragen - Starten, Stoppen und Entfernen von Anfragen - Übersichten über Stati der Anfragen - optional: grafische Ansicht der physischen Anfragepläne Anforderungsliste nach oben offen. Orientierung an RCP-Version.
  • Modellbasierte Anfrageverteilung im P2P-Netzwerk (Master Thesis; Betreuer: Timo Michelsen)
    Umsetzung der grundlegenden Strukturen und Implementierungen, um Odysseus in einem P2P-Netzwerk auszuführen. Darunter fallen: - Anfragedefinition, Quellendefinition - Zerlegung der Anfragen - Verteilung der Anfrageteile - Ausführung - Senden der Ergebnisse an Absender
  • GWT-basierter grafischer Anfrageditor (Bachelor Thesis; Betreuer: Timo Michelsen)
    Aktueller Stand ist, dass ein Nutzer eine Anfrage textuell in der Sprache PQL oder CQL schreiben muss. Das ist für unerfahrene Nutzer, die einfach Anfragen auf Datenströme ausführen wollen, u. U. ungeeignet. Weiterhin ist der Editor in einer Odysseus-GUI eingebaut, sodass jemand, welcher Anfragen stellen will, Odysseus als Ganzes runterladen und installieren muss. Das soll durch den browserbasierten Ansatz gelöst werden, sodass Odysseus bspw. alleine ohne GUI ausgeführt werden kann (bspw. als Peer o. ä.) Im groben geht es darum, einen grafischen Editor aufzubauen, mit dem es möglich ist, sich eine Anfrage grafisch zusammenzustellen, (oberflächlich) zu prüfen und an Odysseus zu senden. Man soll sich bspw. die Operatoren, welcher die Daten empfangen und verarbeiten sollen, zusammenklicken und miteinander verbinden können. Es ist wichtig, dass der Editor in einem Browser ausgeführt werden kann. GWT als Framework scheint dafür geeignet zu sein. Odysseus bietet eine WebService-Schnittstelle an, an die die Anfragen gesendet und ausgeführt werden können. Das bedeutet theoretisch, dass an Odysseus nichts angepasst werden muss. Der Nutzer soll auf einer Webseite sich eine Anfrage zusammenklicken und abschicken können. Ein spezieller Übersetzer auf Seiten des Servers setzt dann die grafische Struktur in textuelle PQL-Statements um, um sie dann an Odysseus zu senden (Odysseus muss sich nicht auf dem Webserver befinden) Odysseus führt diese aus und soll die Ergebnisse an die Webseite zurücksenden. Die Webseite zeigt diese dann an (bspw. als Tabelle). Folgende Themen werden damit angeschnitten: - Java-Programmierung - GWT - Odysseus - PQL - WebServices
  • Load Balancing in Odysseus (Bachelor Thesis; Betreuer: Marco Grawunder)
  • Verteiltes Query Sharing (Master Thesis; Betreuer: Marco Grawunder)
  • Überwachung von sozialen Netzwerken mit Hilfe von DSMS Technologie (Bachelor Thesis; Betreuer: Marco Grawunder)
  • Visualisierung von Datenströmen in Karten (Bachelor Thesis; Betreuer: Marco Grawunder)
    In Odysseus ist im Laufe der Zeit eine Komponente entwickelt worden, die zur Darstellung der Inhalte von Datenströmen verwendet werden kann. Im Moment beschränkt sich diese Darstellung auf einfachen thematische Karten. In dieser Arbeit soll eine Erweitung dieser Komponente u.U. auf sogenannte Heatmaps (http://de.wikipedia.org/wiki/Heatmap) erfolgen und die Bedienung verbessert werden.
  • Abrechungsmodelle für den Nutzen von Odysseus Cloud Diensten (Lena Eylert) (Master Thesis; Betreuer: Marco Grawunder)
  • Abrechungsmodelle für den Nutzen von Odysseus Cloud Diensten (Mischa Böhm) (Master Thesis; Betreuer: Marco Grawunder)

Weitere Abschlussarbeiten sind unter der folgenden Adresse zu finden:

odysseus.informatik.uni-oldenburg.de/index.php