Verschiedene Systeme (DOS-PCs, Windows-PCs, Apple-Computer, World Wide Web) verwenden teils unterschiedliche Kodierungen und es ist wichtig zu wissen, in welcher Kodierung ein Dokument vorliegt, da sonst i.d.R. Buchstabensalat angezeigt wird, wenn für die Anzeige des Dokuments die falsche Kodierung gewählt wird.
Eine Besonderheit stellt Unicode (manchmal UCS, Universal Coded Character Set genannt) dar. Das Unicode-Projekt hat das Ziel, sämtliche Zeichen aller Sprachen und alle Symbole zu kodieren. Aufgrund der sehr großen Anzahl werden die Kodes in Unicode aus Effizienzgründen abhängig von der Kodierung unterschiedlich in Zahlenfolgen übersetzt. Die wichtigsten Kodierungen sind UTF-16 LE unter Windows und UTF-8 im Web und für Gedcom-Dateien.
Die wichtigsten Kodierungen für AGS sind in der folgenden Tabelle aufgeführt:
Kodierung | ID | Verwendung |
---|---|---|
ANSI - Lateinisch I | 1252 | Standardkodierung unter Windows in Mitteleuropa, verpflichtend für RTF-Dateien |
UTF-16 LE | 1200 | Unicode, Standardkodierung unter Windows |
UTF-8 | 65001 | Unicode, häufig im Web, Gedcom-Dateien |
US-ASCII | 20127 | 7-bit, Buchstaben, Ziffern und einige Sonderzeichen |
OEM | 437 | DOS (US-amerikanische Kodeseite), Omega 5 |
ANSEL | - | Gedcom-Dateien |
ISO 8859-1 Lateinisch I | 28591 | Standardkodierung unter Unix in Mitteleuropa |
MAC - Romanisch | 10000 | Apple-Computer |
Sie können folgende Faustregeln verwenden, um die Kodierung einer Datei zu erraten: