[buug-l] Encoding von Text-Dateien

Christoph Biedl cbiedl at gmx.de
Son Sep 19 01:03:00 CEST 2004


Michael Wiedmann wrote...

> Welche Möglichkeit gibt es heraus zu finden, in welchem Encoding
> eine (Text) Datei vorliegt?
> 
> Konkret will ich wissen, ob eine Datei "x.xml" in ISO-8859-8 codiert
> ist oder - vielleicht aus versehen - in irgendeinem anderen Encoding.

Verstehe ich richtig: Du hast eine Datei, die _vermutlich_ ISO-8859-8
ist (Hebräisch, wenn ich richtig sehe), aber eventuell doch etwas
anderes (-1/-15 - oder darf's auch japanisch oder russisch sein?). Und
Du willst den passendsten Zeichensatz erraten.

Außer statistischen Modellen fällt mir dazu nicht viel ein. Und daß das
Ergebnis nie 100%ig sein wird, ist eh klar.

    Christoph