ich war hier: BSys08Dateisystem

Version [22543]

Dies ist eine alte Version von BSys08Dateisystem erstellt von RonnyGertler am 2013-03-27 12:50:32.

 

 (image: http://wdb.fh-sm.de/uploads/QualipaktLehre/BMBF_Logo_klein.jpg)

Betriebssysteme (Betriebssystemtheorie) - Kapitel 8 - Dateisystem


Inhalte von Dr. E. Nadobnyh


8.1. Begriffsdefinition


Sekundärspeicher


Der Speicher eines Rechners ist unterteilt in Primärspeicher und Sekundärspeicher. In der Speicherhierarchie steht der Sekundärspeicher weiter vom Prozessor als Primärspeicher.

 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys53.gif)

1) Der Primärspeicher (interner Speicher) ist der Hauptspeicher (Arbeitsspeicher) für aktiven Programmen, welche vom Prozessor ausgeführt werden.

2) Der Sekundärspeicher (externer Speicher) ist die dauerhafte Datenablage auf Massenspeichern.

Beispiele:
Plattenspeicher (Harddisc), Magnetbänder, CD.

Eigenschaften im Vergleich:
  1. Der Sekundärspeicher ist nichtflüchtig (persistent), d.h. zulässt eine dauerhafte Speicherung.
  1. Der Sekundärspeicher ist meist billiger, langsamer und größer als Primärspeicher.


Datei und Dateisystem


Daten in einem Sekundärspeicher werden zu Dateien zusammengefasst.

Eine Datei (file) ist ein logisches Betriebsmittel, welches eine endliche Menge zusammengehöriger Daten beinhaltet. Dateien existieren, um Daten zu speichern und später wieder abzurufen.

Ein Dateisystem (file system, Dateiverwaltung) ist ein Teil des Betriebssystems, der der Verwaltung von Daten auf einem Sekundärspeicher dient.

Alle Dateisysteme zielen auf Geräteunabhängigkeit ab, d. h ein Programm muss sich nicht darum kümmern, ob eine Datei sich auf Platte, Magnetband oder einem anderen Massenspeicher befindet.

⇒ Demo 1


8.2. Dateiattribute


Logische Organisation


Eine Datei besteht aus zwei Teilen:

1) Eine logische Datei ist eine Einheit von Daten, die vom Dateisystem abgelagert wird. Eine physische Datei ist eine Implementierung davon und kann in mehrere Abschnitte aufgeteilt werden und sogar auf mehreren Datenträgern gespeichert werden.

2) Ein Dateideskriptor ist eine Tabelle mit Dateiattributen. Dateideskriptoren werden vom Dateisystem auf dem Datenträger abgelegt.

Dateiattribute sind dateispezifische Informationen für der Verwaltung von Dateien. Einige Dateiattribute sind;
1) Dateiname
2) Dateityp
3) Ablageort
4) Datum der Erstellung usw.

⇒ Demo 2.


Metadaten


Als Metadaten bezeichnet man allgemein Daten, die Informationen über andere Daten enthalten.

Beispiele:
  1. Der Name des Autors und die Auflage zu einem Buch.
  1. Attribute zu einer Datei.

Da im Dateideskriptor nur eingeschränkter Platz für die Attribute zur Verfügung steht, können Metadaten zusätzlich direkt in die Datei integriert werden.

 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys54.gif)

Beispiel: ID3-Tags in MP3-Dateien.


Dateinamen


Eine Datei ist bei der Erzeugung zu bezeichnen. Unter ihrem Namen kann eine Datei von verschiedenen Prozessen benutzt werden.

Die Dateinamenserweiterung (filename extension, Dateierweiterung, Dateiendung, Dateisuffix) ist der letzte Teil eines Dateinamens und wird gewöhnlich mit einem Punkt abgetrennt, z.B.: „prog.c“.

Die Erweiterung ist optional und wird oft eingesetzt, um das Format einer Datei erkennbar zu machen, ohne die Datei vorher einlesen zu müssen.

⇒ Demo 3.


Dateitypen und Dateizuordnung


Ein Dateityp (Dateiformat) ist eine Definition der Syntax und Semantik von Daten innerhalb einer Datei. Die Erkennung des Formats einer Datei ist notwendig, um Datei-Inhalte richtig interpretieren zu können.

Jedes Betriebssystem muss zwei Varianten von Dateitypen unterscheiden:

1) ausführbare Programme, die in Form von Dateien (executable files) gespeichert werden. Bei der Auswahl wird dieses Programm gestartet, z.B.: „prog.exe“.

2) nicht ausführbare Dateien (Daten, Dokumente). Diese Dateien werden vom Betriebssystem nicht interpretiert, sondern Anwendungsprogrammen zugeordnet, die die Dateien interpretieren können.

Nach der Art des Inhaltes werden unterschieden:

1) Binärdateien enthalten beliebige Bytewerte (auch nicht-alphabetische Zeichen) und können in der Regel nur durch entsprechende Anwendungen gelesen werden. Dazu gehören auch ausführbare Dateien.
Beispiele: a.xls, a.exe, a.obj.

2) Textdateien (ASCII-Dateien) enthalten nur reinen Text und einfache Steuerzeichen, z.B. Zeilenumbruch. Viele Steuerdateien sind Textdateien.
Beispiele: a.htm , a.txt, a.bpr.


Dateityp-Ermittlung


Das Dateiformat kann auf drei verschiedene Arten automatisch ermittelt werden:

1) Die Ermittlung durch Dateinamenserweiterung ist häufig verwendete Methode.

Beispiel: Beim Doppelklick auf buch.doc startet Windows das zugeordnete Programm Microsoft Word mit dieser Datei als Parameter.

2) Die Ermittlung durch Dateiinhalte. Dabei wird auf bekannte Muster untersucht, z.B.: UNIX identifiziert den Dateityp durch die so genannten „magischen Zahlen“.

3) Die Ermittlung durch Metadaten ist die zuverlässigste Methode, weil das Dateiformat zusammen mit der Datei abgelegt ist.


Die Dateityp-Ermittlung durch die Dateinamenserweiterung kann als Anlockung von Würmer benutzt werden.

1) Beim Umbenennen einer Dateinamenserweiterung ändert sich schließlich nur der Dateiname, das Dateiformat bleibt dabei erhalten.

2) Bei Windows werden einige Dateinamenserweiterung standardmäßig nicht angezeigt, z.B. „.exe“.

3) Ein Benutzer kann z.B. per e-mail die ausführbare Datei „Name.jpg.exe“ erhalten, die beim Aufruf Schaden anrichten kann.

4) Der Benutzer wird so in die Irre geführt, da er den Namen „Name.jpg“ sieht und tatsächlich eine ausführbare Datei statt einer Bilddatei aktivieren kann.

⇒ Demo 4


8.3. Dateioperationen


Datei-Spezifikation


Eine Spezifikation einer logischen Datei (abstrakter Datentyp, ADT-Datei) ist eine formalisierte Beschreibung der grundlegenden Dateioperationen unabhängig vom konkreten Dateisystem.

Es wird von der tatsächlichen Implementierung der Operationen abstrahiert. Die Abbildung der logischen Datei auf reale Speichergeräte (Platte, Band, Drucker, etc.) erfolgt durch das Dateisystem.

Eine logische Datei wird vom Dateisystem wie ein langer char-Vektor behandelt:

1) Eine logische Datei ist ein Behälter für eine Reihenfolge von Bytes.
2) Der Dateiinhalt ist beliebig, da er vom Dateisystem nicht interpretiert wird.
3) Die Dateilänge ist nicht im Voraus abzusehen.


Dateiindex


Zu der Spezifikation einer logischen Datei gehört ein Dateiindex (Schreib-/Lese-Zeiger, Dateizeiger, Byte-Position, Seek-Zeiger, Zeichenposition, aktuelle Position, Dateiposition), der von Dateioperationen benutzt wird.

Alle Bytes in einer Datei sind von 0 bis N-1 durchnummeriert. in Dateiindex ist eine ganzzahlige Variable, die innerhalb einer Datei beliebig positioniert werden kann.

Dateiindex ist die Position eines Bytes, welches als Nächstes gelesen oder geschrieben wird.

 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys55.gif)

Ein Dateiindex wird beim Öffnen einer Datei angelegt und beim Schließen der Datei gelöscht. Grundsätzlich gilt, dass der Dateiindex beim Lesen bzw. Schreiben entsprechend der transferierten Anzahl der Bytes in Richtung Dateiende verschoben wird.

Die Dateiendesituation (End Of File, EOF) wird festgestellt, wenn der Dateiindex das Dateiende erreicht. Beim Lesevorgang wird bei jeder Vorwärtsbewegung geprüft, ob die Dateiendesituation gerade vorliegt.

Begriffsverwirrung: Der Begriff Dateizeiger (File-Pointer) wird auch in ANSI C für die Bezeichnung eines Zeigers vom Typ FILE verwendet.


Grundlegende Dateioperationen


Unabhängig von konkreten Systemen sind folgende grundlegende Dateioperationen spezifiziert:

1. Create und Delete
  1. Erzeugen einer leeren Datei.
  1. Löschen einer vorhandenen Datei.

2. Open und Close
  1. Öffnen einer vorhandene Datei. Ein Dateiindex wird angelegt und positioniert.
  1. Schließen der Datei. Der entsprechende Dateiindex wird gelöscht.

3. Write und Read
  1. Schreiben in eine Datei ab einem Dateiindex.
  1. Lesen aus einer Datei ab einem Dateiindex.

4. Seek - Positionieren des Dateiindexes.


Öffnen und Schließen von Dateien


1) Beim Öffnen einer Datei wird eine Strukturvariable angelegt, die als eine Kennung (Deskriptor, Handle) bezeichnet wird. Eine Kennung enthält u.a. einen Dateiindex. Nach dem Öffnen sind die Zugriffe auf die Datei erlaubt, z.B. Lesen, Schreiben, Positionieren. Nachfolgende Dateioperationen arbeiten mit der Kennung.
Wird eine Datei mehrmals geöffnet, so wird für jedes neue Öffnen eine separate Kennung angelegt.

2) Schließen der Datei ist eine komplementäre Operation zum Öffnen. Danach wird die Kennung gelöscht und keine weiteren Zugriffe auf die Datei erlaubt.


Kanal und Datenstrom


Ein- und Ausgabe wird als Datenstrom (Byte-Strom, stream) behandelt. Streams sind immer unidirektional.

1) Beim Öffnen einer Datei wird ein Kanal (logischer Kanal, Zugriffskanal, Verbindung ) vom Prozess zur vorhandenen logischen Datei angelegt und eine Übertragungsrichtung des Kanals festgelegt:
  1. unidirektionaler Kanal für Ausgabe,
  1. unidirektionaler Kanal für Eingabe,
  1. bidirektionaler Kanal für abwechselnde Eingabe und Ausgabe.

2) Bei der Ausgabe wird eine Folge von Bytes durch den Kanal transportiert und in die Datei geschrieben.

3) Bei der Eingabe kann die gespeicherte Reihenfolge durch den Kanal exakt wieder abgerufen werden.


Prinzipbeispiel


Datei-Öffnen zur Ausgabe

 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys56.gif)


Dateizugriffsschnittstellen


Eine Menge von Dateioperationen einer logischen Datei kann als eine Dateizugriffsschnittstelle bezeichnet werden. Die unterschiedlichen Systeme stellen konkrete Dateizugriffsschnittstellen zur Verfügung.

Zwei Abstraktionsniveaus sind bekannt:

1) Low-Level-Dateizugriff mittels der Operationen von Betriebssystemen. Diese Operationen sind hardwareunabhängig, gehören aber nicht zu dem ANSI C-Standard.

2) High-Level-Dateizugriff mittels der Operationen von Standardbibliotheken. Diese Operationen sind unabhängig von Betriebssystemen bzw. portabel.

 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys57.gif)


Einige Dateioperationen


C-Standardbibliothek (stdio.h) Unix-Dateisystem Windows-Dateisystem Beschreibung
fopen open /create CreateFile Neue Datei erzeugen
remove unlink DeleteFile Datei löschen
fopen open CreateFile Vorhandene Datei öffnen
fclose close CloseHandle Datei schließen
fread /fwrite read /write ReadFile /WriteFile Lesen von Datei und Schreiben in Datei
fseek lseek SetFilePointer Positionieren des Dateizeigers
fflush fsync FlushFileBuffers Sofortiges Schreiben des Puffers
feof - - Prüft, ob Dateiende erreicht



8.4. Einige Dateioperationen der C-Standardbibliothek


Erzeugen und Löschen von Dateien


1) Es gibt keine spezielle Funktion zum Erzeugen einer Datei. Eine Datei kann durch die Funktion „fopen“ implizit erzeugt werden. Prototyp:
FILE* fopen(char* dateiname, char* modus);

Das Argument „modus“ ist die Zugriffsart. Beim bestimmten Modus wird eine Datei mit dem „dateiname“ erzeugt, falls sie noch nicht existiert. Danach wird diese Datei sofort geöffnet.

2) Eine Datei wird durch die Funktion „remove“ gelöscht. Prototyp:
int remove(char* dateiname);

Vor dem Löschen muss die Datei geschlossen werden. Bei fehlerfreier Ausführung liefert „remove“ den Wert 0 zurück.

⇒ Demo 5.


Öffnen von Dateien


FILE* fopen(char* dateiname, char* modus);

1) Betriebssystem sucht oder erzeugt die Datei mit dem „dateiname“.

2) Beim Erfolg wird eine FILE-Struktur (Kennung) erzeugt.

3) Die Eigenschaften der Datei werden in einer FILE-Struktur abgelegt, z.B.:
  1. ein Dateiindex wird gesetzt,
  1. ein programminterner Dateipuffer wird angelegt.

4) Die Adresse auf der FILE-Struktur wird zurückgegeben, die beim Dateizugriff verwendet wird.

FILE ist eine spezielle Struktur und ist in stdio.h definiert. Im Normalfall sollte der Programmierer nichts mit den Interna der FILE-Struktur zu tun haben.


High-Level-Dateizugriff


 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys58.gif)


Einige Zugriffsarten beim Öffnen


Modus Beschreibung
„w“ und „w+“ (write) 1) Datei zum Schreiben („w+“ - und zum Lesen) öffnen.
2) Existiert die Datei, wird der alte Inhalt überschrieben.
3) Datei wird erzeugt, wenn sie noch nicht existiert.
„a“ und „a+“ (append) 1) Datei zum Anfügen („a+“ - und zum Lesen) öffnen.
2) Existiert die Datei, wird es am Dateiende weiter geschrieben.
3) Datei wird erzeugt, wenn sie noch nicht existiert.
„r“ und „r+“ (read) 1)Datei zum Lesen („r+“ - und zum Schreiben) öffnen.
2)Datei muß existieren.


Der Modus bestimmt auch die Dateiart:

Modus Dateiart Besonderheiten
t oder implizit Text-Datei Unter Windows werden Steuerzeichen in der Datei beachtet.
b Binär-Datei Steuerzeichen werden nicht beachtet.


Beispiele: „rt“, „wb“ , „at+“, „rb+“ usw.


Schreiben und Lesen von Dateien


Die C-Standardbibliothek bietet auch Funktionen für zeichenweisen, zeilenweisen, formatierten und blockweisen Datentransfer, während sich Unix und Windows auf den Blocktransfer beschränken.

Daten Zeichen C-String Formatierte Daten Block
Schreiben fputc fputs fprintf fwrite
Lesen fgetc fgets fscanf fread


Beispiel:
  1. fread liest aus der Datei fp in den Zwischenpuffer zp bis zu n Datenobjekte der Größe size:
int fread (void* zp, int size, int n, FILE* fp);
  1. fwrite ist die Gegenfunktion:
int fwrite(void* zp, int size, int n, FILE* fp);

⇒ Demo 6


Textmodus


1) Bei Windows-Compilern gibt es den Unterschied zwischen einer Datei im Text- und im Binärmodus. Im Textmodus wird:
  1. beim Schreiben eines Zeilenendes ein LF durch ein CR LF (Carriage Return, Line Feed) ersetzt,
b) beim Lesen ein CR LF durch ein LF ersetzt.

2) Bei UNIX-Compilern wird der Schalter b zwar akzeptiert, es gibt jedoch keinen Unterschied zwischen Text- und Binärmodus.
Es wird auf den Ersetzungsvorgang am Zeilenende komplett verzichtet.

⇒ Demo 7


Dateipuffer


Die High-Level-Funktionen verwenden einen programminternen Dateipuffer. Die Funktionen greifen zum Lesen und Schreiben immer nur auf den Dateipuffer zu. Der Dateipuffer ermöglicht einen effektiver Datentransfer zwischen Primärspeicher und Sekundärspeicher.

Der Dateipuffer birgt jedoch das Risiko eines möglichen Datenverlustes in sich. Wenn eine Datei für die Ausgabe geöffnet wurde, werden Daten erst beschrieben, wenn der Puffer voll ist. Ist das Programm durch einen Fehler abgebrochen, gehen die Daten im Puffer verloren.

Die Funktion fflush schreibt sofort alle Daten des Ausgabestroms aus dem Dateipuffer in den Sekundärspeicher. Es wird empfohlen, nach der Ausgabe sehr wichtiger Daten die Funktion fflush aufzurufen.


Wahlfreier Dateizugriff


Der wahlfreie Dateizugriff (direkter Zugriff, random access) bietet die Möglichkeit, die Informationen direkt an einer bestimmten Position in der Datei zu lesen bzw. zu verändern.

Eine der Funktionen zur Positionierung ist:
int fseek(FILE *fp, long offset, int basis);

fseek positioniert den Dateiindex in der Datei fp auf die Position basis mit dem Abstand offset. Der Abstand kann auch negativ sein. Der Bezugspunkt basis kann einen der folgenden drei Werte haben: 0 -Dateianfang, 1 -aktuelle Position, 2– Dateiende.

Im Fehlerfall ist der Funktionswert ungleich Null.

Bemerkung:
Es gibt zusätzliche Bedingungen für die Positionierung in Textdateien.

⇒ Demo 8


8.5. Verzeichnishierarchie


Verzeichnisse


Verzeichnisse (Kataloge, Ordner, directories, directory files, Folder) sind spezielle Systemdateien, die zur Verwaltung von normalen Dateien dienen. Verzeichnisse werden für die Gruppierung logisch zusammengehöriger Dateien verwendet.

Ein Verzeichnis stellt eine Liste von Verzeichniseinträgen (directory entry) dar. Jeder Eintrag enthält:
  1. den Dateinamen,
  1. die Attribute,
  1. der Verweise auf den Sekundärspeicher.

In manchen Systemen können die Attribute außerhalb eines Verzeichniseintrags verwaltet werden, z.B. im I-Node. Dann enthält der Eintrag einen entsprechenden Verweis auf den I-Node.

Die interne Struktur des Verzeichnisses wird vom Anwender versteckt. Er kann auf Verzeichnisse nur mittels Systemfunktionen zugreifen.

Ein Verzeichnis kann Einträge von verschiedenen Dateiarten enthalten:

1) normale Dateien (regular files),
2) wiederum Verzeichnisse (directory file),
3) Verknüpfungen (links)
4) weitere Arten von Spezialdateien, z.B. Gerätedatei (device files).

Beispiel:
 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys59.gif)


Verzeichnishierarchie


Die innere Struktur eines Verzeichnisses ist für den Aufbau der Verzeichnishierarchie geeignet. Die Hierarchie hat eine gut verständliche logische Organisation.

Es gibt zwei bekannte Arten der Hierarchie:

1) Ein Betriebssystem (z.B. UNIX) fasst alle Verzeichnisse zu einem einzigen Gesamt-Verzeichnisbaum zusammen.

2) Ein Betriebssystem (z.B. Windows) verwaltet mehrere Verzeichnisbäume (Wald).

Die externen Datenträger werden üblicherweise in Form von logischen Laufwerken betrachtet. Dabei können sich auf einem physikalischen Laufwerk mehrere logische Laufwerke befinden (Partitionierung).

⇒ Demo 9


Besondere Verzeichnisse


1) Ein Wurzelverzeichnis (root directory, Stammverzeichnis) ist das höchste Verzeichnis eines Verzeichnisbaumes. Über das Wurzelverzeichnis sind alle Dateien erreichbar.

2) Ein Unterverzeichnis (sub directory) ist jede Verzweigung eines Verzeichnisses.

3) Ein Elternverzeichnis (parent directory) ist ein im Baum übergeordnetes Verzeichnis.

4) Ein Arbeitsverzeichnis (working directory, aktuelles Verzeichnis) ist ein Element der Prozessumgebung und wird für jeden Prozess individuell gesetzt.

Ein Arbeitsverzeichnis wurde zur Vereinfachung de Navigation im Verzeichnisbaum eingeführt. Der Benutzer (Prozess) kann jederzeit ein beliebiges Verzeichnis des gesamten Verzeichnisbaumes zum Arbeitsverzeichnis erklären.


Absoluter Pfadname


Zur Lokalisierung einer Datei dient der Pfadname, welcher aus Teilen, nämlich dem Verzeichnispfad und dem Dateinamen besteht.

Ein absoluter Pfadname ist eine Folge von Unterverzeichnissen von der Wurzel bis zur Datei. Die einzelnen Bezeichnungen werden durch einen Separator getrennt. Verschiedene Systeme verwenden unterschiedliche Separator-Formen: /, \, <.

Beispiele:
  1. für Unix- /home/ernie/oscar.jpg
  1. für Windows- C:\home\ernie\oscar.jpg

Vorteil: Es ist stets eine eindeutige Identifizierung der Datei gewährleistet.
Nachteil: Der Pfadname kann sehr lang sein.


Relativer Pfadname


Dateien können relativ zu dem Arbeitsverzeichnis adressiert werden.

Dafür wird zusätzliche Symbolik verwendet:
  1. Der Name ".“ verweist auf das Arbeitsverzeichnis.
  1. Der Name "..“ verweist auf das Elternverzeichnis.

Vorteil: Pfadnamen werden kürzer.

Nachteil: Da die Lage des Arbeitsverzeichnisses sich dynamisch ändern kann, können relative Pfadangaben zusätzliche Fehler verursachen.

Beispiele:
  1. absoluter Pfadname: /meier/projekt/daten/dat1
  1. working directory: /meier/projekt/
  1. relativer Pfadname: daten/dat1


Funktionen für Verzeichniszugriffe


Die unterschiedlichen Systeme stellen konkrete Verzeichniszugriffsschnittstellen zur Verfügung. Es gibt auch die portablen Verzeichniszugriffsschnittstellen, die unabhängig von Betriebssystemen sind.

Funktionen für den Zugriff auf Verzeichnisse sind im POSIX-Standard (Portable Operating System Interface) spezifiziert.

POSIX-konforme Funktionen sind vorwiegend in der UNIX-Welt beheimatet.

Auch MS-Windows-Anwender können diese Funktionen nutzen. In vielen Compilern unter diesem System sind diese Funktionen integriert.


Einige Verzeichnis-Funktionen


UNIX, POSIX Windows Beschreibung
mkdir CreateDirectory Verzeichnis erzeugen
rmdir RemoveDirectory Verzeichnis löschen
opendir - Verzeichnis öffnen
closedir FindClose Verzeichnis schliessen
readdir FindFirstFile Ersten Eintrag suchen
readdir FindNextFile Nächsten Eintrag suchen
getcwd GetCurrentDirectory Arbeitsverzeichnis abfragen
chdir SetCurrentDirectory Arbeitsverzeichnis ändern
link, symlink CreateHardLink CreateSymbolicLink Dateiverknüpfung anlegen


Es gibt keine Funktionen für das Hinzufügen oder Entfernen von Einträgen im Verzeichnis. Das erfolgt implizit beim Erzeugen und Löschen einer Datei bzw. eines Unterverzeichnisses.

⇒ Demo 10 und 11


Arbeitsverzeichnis wechseln


Während des Prozessablaufes kann sich ein Prozess beliebig in der Verzeichnishierarchie bewegen und damit sein Arbeitsverzeichnis wechseln.

Prototyp: int chdir(const char *path);

chdir (change directory) setzt das durch path bezeichnete Verzeichnis als aktuelles Arbeitsverzeichnis, z.B.:
chdir („C:\temp");

Sonderfälle:
chdir(".."); - Der Prozess bewegt sich zum Eltern-
Verzeichnis.
chdir("."); - Der Prozess bewegt sich nicht.

⇒ Demo 12


8.6. Verknüpfungen


Dateiverknüpfungen


Eine Dateiverknüpfung (Verknüpfung, Link) ist eine zusätzliche Verbindung (Verweis) zwischen dem Verzeichnis und einer
normalen Datei. Damit kann eine nur einmal vorhandene Datei in verschiedenen Verzeichnissen erscheinen.

 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys60.gif)

Verwendung:
1) Gemeinsame Dateien für Prozesskommunikationen. Um die Synchronisierung muss sich der Anwender selbst kümmern.
2) Gemeinsame Datei-Benutzung von mehreren Entwickler in der projektorientierten Arbeit.
3) Vermeidung von Dateikopien durch zusätzliche Verknüpfung.
4) Vereinfachung der Aktualisierung und Wartung.

⇒ Demo 13.


Verzeichnisverknüpfung


Eine Verzeichnisverknüpfung (Ordnerverknüpfung) ist eine besondere Dateiverknüpfung, die nicht auf eine Datei, sondern
auf ein Verzeichnis verweist. Damit kann ein nur einmal vorhandenes Verzeichnis in verschiedenen Verzeichnissen erscheinen.

 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys61.gif)

Alle Dateien des Unterverzeichnisses sind dann auch in beiden Oberverzeichnissen erreichbar.

Hier können unerwartete Zyklen im Verzeichnisbaum entstehen. Das ist die eventuelle Ursache für endlose Schleife in naiven
Programmen.


Verknüpfungsarten


1) Harte Verknüpfungen (hard links) sind zusätzliche Verzeichniseinträge, die auf dieselbe Datei systemintern verweisen.

 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys62.gif)

2) Weiche Verknüpfungen (symbolische Verknüpfung, soft link, symlink) sind spezielle Dateien vom Typ „link“. Eine solche Datei enthält den absoluten Pfad zur verknüpften Datei.

 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys63.gif)



Einführung


Unter der Implementierung (Realisierung) versteht man Strukturen der Abbildung von Dateien und Verzeichnissen auf den Sekundärspeicher.

Bei der Sekundärspeicherverwaltung werden ähnliche Strategien verwendet, wie bei Hauptspeicherverwaltung. Die meisten Dateisysteme sind Betriebssystemspezifisch. Viele Betriebssysteme unterstützen mehr als ein Dateisystem.

Die Implementierung ist für den Anwender von geringem Interesse, obgleich sie große Bedeutung für die Entwickler eines Dateisystems darstellt.


Blockspeichermodell


Der Sekundärspeicher ist langsamer als Primärspeicher. Aus Effizienzgründen werden Daten zwischen beiden Speicher blockweise ausgetauscht. Das Dateisystem steht auf der Blockspeicher-Schnittstelle, die systemintern ist.

Ein Datenträger stellt im Blockspeichermodell einen Behälter mit N eindeutig adressierbaren Blöcken dar.

Blöcke sind benachbart angelegt und von 0 bis N-1 durchnummeriert. Diese Nummerierung stellt die logische Blockadressierung (LBA, logical block addressing, logische Nummer) dar.

 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys64.gif)

Konkret treten Blockspeicher als Wechselmedien (Diskette, CD-ROM, DVD usw.) und als Partitionen auf Festplatte auf.

Partitionen beschreiben fest abgegrenzte Teilbereiche auf Festplatten. Sie erlauben das Aufteilen eines physisches Gerät in mehrere logische Laufwerke. Je nach Rechner und Typ des Datenträgers gelten feste Vorgaben für die Blockgrößen, z.B. 0,5KB bis 32KB für Plattenspeicher und 2KB für CD-ROM.

Analog: Aufteilung des Hauptspeichers in Seiten gleicher Größe.


Datei-Abbildung


Die Abbildung einer logischen Datei in eine physische Datei erfolgt in zwei Schritten:

1) Ein Dateisystem teilt eine logische Datei in logische Blöcke auf.

2) Ein Gerätetreiber speichert logische Blöcke abhängig von der physikalischen Struktur des Gerätes, z.B. auf Festplatte als physikalische Sektoren. Die Adressierung erfolgt über die Plattenkoordinaten: Zylinder, Kopf, Sektor (Cylinder, Head, Sector).


Schichtenmodell


 (image: http://ife.erdaxo.de/uploads/BSys08Dateisystem/BSys65.gif)


Aufgaben der Blockspeicherverwaltung
Definition


Eine Dateiallokation (blockweise Dateiallokation, Belegung) ist ein Verfahren zur Verfolgung, welche Blöcke des Blockspeichers mit welchen Dateien assoziiert (zugeordnet) sind.

Eine Dateiallokation ist die wahrscheinlich wichtigste Aufgabe bei der Implementierung der Dateispeicherung.

Methoden (Formen) der Dateiallokation:
  1. Kontinuierliche Allokation.
  1. Allokation durch verkettete Liste.
  1. Allokation durch eine Belegungstabelle.
  1. Allokation durch I-Nodes.


Kontinuierliche Allokation
Diese Seite wurde noch nicht kommentiert.
Valid XHTML :: Valid CSS: :: Powered by WikkaWiki