Systemsoftware und Verteilte Systeme

Semantische Interpretation von Dateien

Individuelles Projekt Diplom

Abgeschlossen am 30. November 2006 durch Sebastian Gebhardt. PDF-Dokument

Ansprechpartner

Themengebiete

  • Dateisysteme

Hintergrund

Es gibt tausende verschiedener Dateiformate, die zu allem Überfluß auch noch ineinander verschachtelt werden können: Z.B. ist ein Debian-GNU/Linux-Paket ein ar-Archiv, daß u.a. ein gzip-komprimiertes tar-Archiv mit den Dateien enthält, z.B. ein OpenOffice.org-Dokument, was nichts anderes ist als ein zip-Archiv mit mehreren xml-Textdateien und weiteren eigebetteten Dateien wie png-Bilder oder Filmen, die wiederum in einem QuickTime-mov-Containerformat ein mpeg2-Video und mehrere ogg-vorbis-Tonspuren enthält. Diese Paket-Datei ligt dann in einem ISO-9660 Dateisystem, welches per loop-back-Device aus einer Datei auf einem ext3-Dateisystem bereitgestellt wird, welches per RAID5 über mehrere SATA-Festplatten gebildet ist.

Auf der untersten Ebene sind die Bits als Nullen und Einsen gespeichert; erst mit dem nötigen Kontextwissen können sie richtig interpretiert werden. Insbesondere beim Auftreten von Fehlern ist die Fehlersuche sehr aufwendig, da die Beschreibung der Formate oft nur textuell existiert und von der fehlersuchenden Person mühselig durchgearbeitet werden muß.

Für einige wenige Formate gibt es spezielle Editoren, die beim Low-Level-Editieren eine bessere Unterstützung anbieten. Aber wie das Beispiel oben zeigt, können viele Formate miteinander verküpft und ineinander verschachtelt werden.

In einer ggf. späteren Erweiterungen sollen die Kontextinformationen auch dazu genutzt werden, um die Änderungen zwischen verschiedenen Versionen einer Dateien effizienter speichern zu können.

Aufgabenbeschreibung

Im Rahmen der Arbeit soll ein Rahmenwerk zum Anzeigen und ggf. auch Editieren von Daten erstellt werden. Dabei soll es möglich sein, für verschiedene Formate Informationen zur Interpretation der Daten abzulegen. Anhand einiger typische Dateiformate ist die Praxistauglichkeit der erstellten Lösung zu untermauern.

Vorkenntnisse

  • BS1
  • (VBS)

Kommentar

Die Arbeit enthält praktische Anteile.