[buug-l] Encoding von Text-Dateien
Michael Wiedmann
mw at miwie.in-berlin.de
Son Sep 19 10:26:53 CEST 2004
* Christoph Biedl <cbiedl at gmx.de> wrote [040919 01:03]:
> Verstehe ich richtig: Du hast eine Datei, die _vermutlich_ ISO-8859-8
> ist (Hebräisch, wenn ich richtig sehe), aber eventuell doch etwas
> anderes (-1/-15 - oder darf's auch japanisch oder russisch sein?). Und
> Du willst den passendsten Zeichensatz erraten.
Richtig (japanisch/russisch ist es defintiv nicht, zumindest das
letztere habe ich bereits ausreichend "in den Händen" gehabt).
Derjenige, der mir mit einiger Sicherheit sagen könnte, ob die
Datei wirklich in 8859-8 (hebräisch) codiert ist, ist z.Z. leider in
Urlaub. Und ich habe Zweifel ob das stimmt, da meine Toolkette
(xsltproc/libxml2) damit nicht zurecht kommt.
> Außer statistischen Modellen fällt mir dazu nicht viel ein. Und daß das
> Ergebnis nie 100%ig sein wird, ist eh klar.
Ist schon klar,
ich warte einfach zwei Wochen ab.
Michael
--
mw at miwie.in-berlin.de http://www.miwie.org