ASCII und Binär
In jedem Computersystem wird zwischen ASCII- und Binärdateien unterschieden. Im Grunde handelt es sich dabei um Dateitypen. Das ausschlaggebende ist hierbei die Lesbarkeit. Binärdateien werden, wie der Name schon sagt, im Binärcode gespeichert. Diese stellt eine Kombination von Einsen und Nullen dar. Diese Dateien können normalerweise von einem Menschen nicht gelesen und verstanden werden. ASCII-Dateien hingegen enthalten menschenlesbare Daten. Diese können in einem Editor geöffnet und gelesen werden. Es müssen sich allerdings nicht immer nur um lesbare Buchstaben handeln, auch hier können sich Maschinenzeichen aufhalten. Allerdings liegen diese immer im Rohformat vor
Genau an diesem Punkt liegt das eigentliche Problem. Damals, als die verschiedensten Betriebssysteme entwickelt wurden, war man sich nicht so ganz einig, wie eine Textdatei auszusehen hat. So wurden dann durch die Programmierer der verschiedenen Systemen unterschiedliche Spezifikationen für Textdateien festgelegt. Daraus folgte, dass Dateien von verschiedenen Spezifikationen nicht miteinander kompatibel sind. Das größte Problem dabei ist der Zeilenumbruch. Die Programmiersprachen kennen 3 verschiedene Arten dessen: CR, LF und NL. Prinzipiell haben alle drei Arten die gleiche Aufgabe. Der Cursor soll nach Betätigen der Enter-Taste in die nächste Zeile springen. Unter UNIX ist LF (linefeed, Zeilenvorschub) der Standard. Alle Dateien die in der UNIX-Welt geschrieben wurden, sind miteinander kompatibel.
Unter Windows hingegen hat sich die Kombination LF und CR (carriage return, Wagenrücklauf) durchgesetzt. Das hat zur Folge, dass neben einer neuen Zeile auch noch ein neuer Absatz markiert wird.
Deswegen sind Textdateien unterschiedlicher Betriebssysteme nicht kompatibel. Kopiert man Beispielsweise eine Textdatei von UNIX nach Windows, können viele Windows-Texteditoren die Zeichen nicht eindeutig verstehen und produzieren eine falsche Darstellung. Sehr oft wird der Text in nur einer langen Zeile dargestellt.
Bei diesen Problemen wird ein so genanntes Konvertierungsprogramm verwendet. Das ist eigentlich nicht weiter kompliziert, da lediglich die Zeichen CR, LF und NL in das Zeichen des entsprechenden Betriebssystems übertragen wird.
This entry was posted on Oct 24, 2006 at 19:58:23 and is filed under Windows vs. Unix. You can follow any responses to this entry through the RSS 2.0 feed, or leave a response (below) .
Bisher keine Kommentare für diesen Eintrag...
Kommentare sind für diesen Beitrag geschlossen.