Systemsoftware und Verteilte Systeme

Zuverlässiges Datenmanagement in dynamischen verteilten Systemen

Beginn des Projekts Dienstag 01. 04. 2008, Ende des Projekts Montag, 01. 10. 2012

Beschreibung

Die Dynamik in einem verteilten System wird durch die Dynamik der daran teilnehmenden Komponenten beschrieben: zu jeder Zeit können Prozesse neu hinzukommen oder das System freiwillig verlassen. Ein Fehlermodell spiegelt u.a. die Art und Weise des Ausfalls, die Länge des Ausfalls und die Reparaturdauer wider. Derzeit werden dynamische fehlerbehaftete verteilte Systeme durch spezielle Fehlermodelle beschrieben, die den Dynamik-Aspekt mit abzudecken versuchen. In der Literatur werden u.a. Prozess-Fehlermodelle, Kommunikationsverbindungs-Fehlermodelle, sowie Kombinationen dieser Modelle beschrieben. Das meist genutzte Fehlermodell ist das sog. Grenzwert-Modell, d.h. maximal k aus n Prozesse können fehlerbehaftet sein. Die Literatur stellt jedoch kein explizites, getrenntes Dynamikmodell vor. Es gibt aber komplexere Fehlermodelle, in denen das Ausfallen bzw. die Reparatur sowie das Hinzukommen bzw. das Verlassen der Prozesse nach bestimmten Wahrscheinlichkeitsverteilungen erfolgt.

Ein grosser Teil der Forschung in dem Bereich der dynamischen fehlerbehafteten verteilten Systeme beschäftigt sich zur Zeit mit der Beziehung zwischen Dynamik und Fehlertoleranz. Alle bisherigen Modelle betrachten nur die Dimension der Fehlertoleranz und kombinieren diese mit spezifischen Dynamik-Aspekten, wie zuvor dargestellt. Die Trennung der beiden Dimensionen Fehlertoleranz und Dynamik und die Erstellung der reinen, sie beschreibenden Modelle könnte ein Anfang für neue Lösungen in dynamischen fehlerbehafteten verteilten Systemen bedeuten: jede Dimension hat spezifische Begriffe und Methoden für den Entwurf solcher Systeme. Eine allgemeine Lösung für das Entwurfsproblem könnte in der Komposition der existierenden Methoden und Lösungen der beiden Dimensionen Fehlertoleranz und Dynamik liegen. Ein konkretes Beispiel für die Dimensionstrennung und die Dimensionskomposition ist das Konzept der Quorensyteme und das des Epochenwechsels, die getrennt auf den beiden Dimensionen wirken und zusammen dynamische fehlertolerante verteilte System implementieren können. Dieser Ansatz der Trennung und Komposition kann z.B. in einer sensornetzwerk-spezifischen Anwendung gut evaluiert werden.

Ein bekanntes Problem in dynamischen fehlerbehafteten verteilten Systemen ist das "Persistent Core"-Problem. Es ist schwierig, wichtige Anwendungsdaten in solchen Systemen persistent zu speichern, da kein Prozess des Systems ausreichend lange und funktionsfähig zur Verfügung steht. Wichtige Daten müssen daher so repliziert und verwaltet werden, dass zu jeder Zeit ein "Kern" - eine Teilmenge der Prozesse - existiert, der die Datenzugriffe für eine bestimmte Anwendung konsistent erbringen kann. Dieses Problem ist wichtig für sensornetzwerk-spezifische Anwendungen, wie z.B. bei der akkumulierten Sensorwertzwischenspeicherung in einem autonomen Sensornetzwerk. Die bisher bekannten Lösungen für dieses Problem gehen jedoch von unrealistischen Modellannahmen aus, die sie für den erfolgreichen realen Einsatz disqualifizieren. Insbesondere sind diese Lösungen nicht in der Lage einer Skalierbarkeitsanforderung adequat Rechnung zu tragen. Durch eine Kombination von speziellem Epochenmanagement und geeigneten Quorensystemen aus dem Bereich der Datenreplikation sowie der missionsangemessenen Wahl des Konsistenzgrades für die Daten des Persistent Core vermuten wir, deutlich vorteilhaftere Lösungen erarbeiten zu können.

Kontakt

  • M.Sc. CS Kinga Kiss-Iakab