Verschiedene Systeme (DOS-PCs, Windows-PCs, Apple-Computer, World Wide Web) verwenden teils unterschiedliche Kodierungen und es ist wichtig zu wissen, in welcher Kodierung ein Dokument vorliegt, da sonst i.d.R. Buchstabensalat angezeigt wird, wenn für die Anzeige des Dokuments die falsche Kodierung gewählt wird.
Eine Besonderheit stellt Unicode (manchmal UCS, Universal Coded Character Set genannt) dar. Das Unicode-Projekt hat das Ziel, sämtliche Zeichen aller Sprachen und alle Symbole zu kodieren. Aufgrund der sehr großen Anzahl werden die Kodes in Unicode aus Effizienzgründen abhängig von der Kodierung unterschiedlich in Zahlenfolgen übersetzt. Die wichtigsten Kodierungen sind UTF-16 LE unter Windows und UTF-8 im Web und für Gedcom-Dateien.
Die wichtigsten Kodierungen für AGS sind in der folgenden Tabelle aufgeführt:
Kodierung | ID | Verwendung |
---|---|---|
ANSI - Lateinisch I | 1252 | Standardkodierung unter Windows in Mitteleuropa, verpflichtend für RTF-Dateien |
UTF-16 LE | 1200 | Unicode, Standardkodierung unter Windows |
UTF-8 | 65001 | Unicode, häufig im Web, Gedcom-Dateien |
US-ASCII | 20127 | 7-bit, Buchstaben, Ziffern und einige Sonderzeichen |
OEM | 437 | DOS (US-amerikanische Kodeseite), Omega |
ANSEL | - | Gedcom-Dateien |
ISO 8859-1 Lateinisch I | 28591 | Standardkodierung unter Unix in Mitteleuropa |
MAC - Romanisch | 10000 | Apple-Computer |
Sie können folgende Faustregeln verwenden, um die Kodierung einer Datei zu erraten:
Textdokumente (Notizen, Gedcom-Dateien, ...) können in unterschiedlichen Kodierungen vorliegen. Der Editor und der Gedcom-Import-Assistent erkennen die Kodierung der Dokumente meist selbständig. Im unteren Bereich des Datei-öffnen-Dialogs können Sie die Kodierung der zu öffnenden Datei aber auch einstellen, wenn Sie diese kennen. Üblicherweise ist die Auswahl für die Kodierung mit ? vorbelegt, wodurch die Kodierung vom Programm erraten wird.