[buug-l] Encoding von Text-Dateien
Christoph Biedl
cbiedl at gmx.de
Son Sep 19 01:03:00 CEST 2004
Michael Wiedmann wrote...
> Welche Möglichkeit gibt es heraus zu finden, in welchem Encoding
> eine (Text) Datei vorliegt?
>
> Konkret will ich wissen, ob eine Datei "x.xml" in ISO-8859-8 codiert
> ist oder - vielleicht aus versehen - in irgendeinem anderen Encoding.
Verstehe ich richtig: Du hast eine Datei, die _vermutlich_ ISO-8859-8
ist (Hebräisch, wenn ich richtig sehe), aber eventuell doch etwas
anderes (-1/-15 - oder darf's auch japanisch oder russisch sein?). Und
Du willst den passendsten Zeichensatz erraten.
Außer statistischen Modellen fällt mir dazu nicht viel ein. Und daß das
Ergebnis nie 100%ig sein wird, ist eh klar.
Christoph