Systemsoftware und Verteilte Systeme

Unmasking Fault Tolerance -  Masking vs. Nonmasking Fault Tolerance

Beginn des Projekts Dienstag, 01. 04. 2008, Ende des Projekts Montag, 01. 10. 2012

Beschreibung

Fehlertoleranz ist nicht nur in kritischen Szenarien von Bedeutung, in denen Menschen von der Robustheit eines Systems abhängig sind, sondern auch in Anwendungsgebieten wie sanften Realzeitapplikationen. Daher ist das Ziel bei der Gestaltung fehlertoleranter Systeme nicht nur ein hoher Grad an Fehlertoleranz. Auch die wettbewerbsfähigkeit spielt eine wichtige Rolle. Eine besondere Herausforderung bei der Konzeption fehlertoleranter Systeme ist die Verifikation eines Mindestmaßes an Fehlertoleranz bei Systemen, die aus einer Vielzahl an Komponenten bestehen. Weitere Herausforderungen ergeben sich durch neue Anforderungen, wie beispielsweise einem geringen Energieverbrauch, welche anderen Zielfunktionen wie der Fehlertoleranz sogar entgegenwirken.

Fehlertoleranz lässt sich in maskierende Fehlertoleranz, bspw. TMR oder Majority Consensus, und nichtmaskierende Fehlertoleranz, bspw. selbststabilisierende Algorithmen oder Videocodecs, unterteilen. Während maskierende Fehlertoleranz zwingend Redundanz voraussetzt, die entweder in Zeit oder in Raum bereitgestellt werden muss, setzt nichtmaskierende Fehlertoleranz den Benutzer den Effekten auftretender Fehler vorübergehend aus. Während Fehlertoleranz immer eine Fehlerklasse spezifiziert, die toleriert werden kann, bildet die Klasse derjeniegen Fehler, die maskiert werden können eine Subklasse jener Klasse. Bisher fokussierten sich wissenschaftliche Arbeiten auf die synthetische Erweiterung nichtmaskierender Systeme durch das Hinzufügen von Redundanz um einen betsimmten Grad an Maskierung zu erreichen. Eine Untersuchung möglicher Lösungen die sich auf den Grad der Maskierung konzentriert um "günstige" Lösungenzu finden fand noch nicht statt.

Da zum einen die Arten der Kosten wie auch der Zielmetriken vielseitig sind, bspw. Energieverbrauch, Abdeckung oder Konsistenz, wird eine Methode benötigt, welche auch mit noch zu spezifizierenden Dimensionen umgehen kann. Da die Anzahl möglicher Lösungen überberechenbar (und in einem kontinuierlichen Parameterraum unendlich) ist, wird eine intelligente Suche nach angemessenen Lösungen benötigt.

Kontakt

Nils Müllner