[buug-l] Encoding von Text-Dateien

Michael Wiedmann mw at miwie.in-berlin.de
Son Sep 19 10:26:53 CEST 2004


* Christoph Biedl <cbiedl at gmx.de> wrote [040919 01:03]:

> Verstehe ich richtig: Du hast eine Datei, die _vermutlich_ ISO-8859-8
> ist (Hebräisch, wenn ich richtig sehe), aber eventuell doch etwas
> anderes (-1/-15 - oder darf's auch japanisch oder russisch sein?). Und
> Du willst den passendsten Zeichensatz erraten.

Richtig (japanisch/russisch ist es defintiv nicht, zumindest das
letztere habe ich bereits ausreichend "in den Händen" gehabt).

Derjenige, der mir mit einiger Sicherheit sagen könnte, ob die
Datei wirklich in 8859-8 (hebräisch) codiert ist, ist z.Z. leider in
Urlaub. Und ich habe Zweifel ob das stimmt, da meine Toolkette
(xsltproc/libxml2) damit nicht zurecht kommt.

> Außer statistischen Modellen fällt mir dazu nicht viel ein. Und daß das
> Ergebnis nie 100%ig sein wird, ist eh klar.

Ist schon klar,
ich warte einfach zwei Wochen ab.

Michael
-- 
mw at miwie.in-berlin.de                              http://www.miwie.org