[OT] Internationalisierung (was: [wos] wos3: Inhalte)

( Marc A. Lehmann ) pcg at goof.com
Thu Apr 24 17:31:09 CEST 2003


On Wed, Apr 23, 2003 at 02:50:37PM +0200, Helge Hielscher <hhielscher at unternehmen.com> wrote:
> Susanne Schmidt wrote:
> >Ich glaube, du hast einen sehr eingeschränkte Vorstellung von
> >"Internationalisierung". Internationalisierung ist nicht bloss, dass man 
> >KDE
> >oder GNOME in seiner Muttersprache im Menu angezeigt kriegt und alle

doch, genau das ist Internationalisierung (I18n), nichts mehr.

> >Scriptsprachen ihre Reg Ex nach einem definierten Locale-Setting ordentlich

das ist keine i18n, das ist lokalisierung (L10n).

> >mischen. Internationalisierung bedeutet - wenn man wirklich mehrere 
> >Sprachen >spricht und auch bearbeiten will, dass man die im System (elegant!) mischen

Das ist globalisierung (G11n).

(Das war nur zur Begriffsklärung, denn so werden die Begriffe auch in der
Praxis benutzt, und wenn man sie anders benutzt, wird jegliche Diskussion
überflüssig).

I18n: Übersetzung der Meldungen
L10n: Anpassung an den Ort
G11n: gleichzeitige Benutzung meherere Sprachen (nicht notwendigerweise
      locales).

> >kann: Fehlermeldungen auf englisch, Editor mit einem Tastendruck
> >zwischen Unicode oder ISO-8859-1 gewechselt (Ja, einige können das),

Jaein... meistens geht es ums Speichern, denn ein editor ediert TEXT,
nicht iso-8859-1-text, wie ers also intern speichert ist egal. In der
Praxis macht das nur Probleme, wnen intern z.b. unicode-3 verwendet wird,
in dem manche (aus GB18030 z.b.) zeichen nicht darstellbar sind, oder
schlimmer. unicode2 (wie qt), wo dann wirklich jede menge fehlt.

> >less bitte automatisch je nach Filetype, sort meinetwegen auf deutsch,
> >Währung bitte Euro und dann freue ich mich schon auf 4 verschiedene
> >Xterms nebeneinander, wo eins chinesisch kann, das zweite eine
> >ligaturen-basierte Sprache/Schrift wie arabisch oder devanagari
> >anzeigt, das dritte deutsch und so weiter.

technisch geht das alles jetzt schon, und vieles ist schon implementiert
(habe noch keine output-methods für devengari und arabisch gesehen, und
es wird auch keine geben, dnen gtk+, mozilla, qt etc. hacken sich ja alle
ihre eigene nischenlösung zusammen).

> Wozu gibt es Unicode? Einige Distributionen, wie Redhat, nutzen schon 
> UTF-8 per default.

Nun, unicode hat durchaus seine lücken, und gerade user, die viele
sprachen mischen wollen (also die linguistik-geeks) stossen meistens auf
die lücken.

> >französisch, sondern auch türkisch. Gut, ich kann mir jetzt für X neue
> >Kombinationen hinbauen, damit ich den Keycode irgendwo hinlegen kann, wo es
> >mir gut passt. Das geht aber auf Dauer natürlich nicht für viele 
> >verschiedene
> >Sprachen. 
> 
> Für KDE kann ich nicht sprechen, aber bei Gnome schalte ich einfach auf 
> die German xkb Keymap um, und es funktioniert:

Das Problem ist, da sman auch vershciedene Eingabemethoden benutzen
muss, z.B. kann man nicht einfach von chinesisch auf japanisch auf
türkisch umschalten, da sich japanische und chinesische eingabemethoden
durchaus stark unterscheiden. Japaner sind zu erstaunlichen
texteingabegeschwindigkeiten fähig, da die meisten eingabemethodem
wörtbuchuntestützung u.ä. bieten.

Und da gibts auch probleme: einem unicode (v2)-text kann man die sprache
nicht ansehen (bei v3 ists möglich, aber wird noch seltener benutzt als
lang-attribute in html), d.h. die eingabemethode ist nicht so einfach
wechselbar.

> Warum reicht nicht ein kompletter Unicode Font für alle Sprachen?

Ein kompletteer unicode font ist der absolute irrsinn. Die Vorstellung
eines unciode-fonts macht gar keinen sinn, wozu soll der gut sein?

Ich will nicht, nur weil ich für meine deutschen texte arial verwende
dann auch die chinesischen zeichen des arial-unicode-fonts verwenden,
genausowenig die arabischen.

Die Idee von unicode fonts ist so sinnlos wie die vorstellung, alle
fonts ausser 9x15bold zu löschen.

(Hinweis: japanische und chinesische fonts unterscheiden sich häufig,
auch bei gleichen zeichen. Das mag zwar lesetechnisch kein problem sein,
aber wer will schon gezwungen werden, times zu verwenden, nur weil der
fonthersteller nur noch einen font besitzt).

Leider spukt die vorstellung von unicode-fonts in dne Köpfen vieler Leute
herum, aber das einzig richtige sind virtuelle "unicode-fonts", also wie
die X11 fontsets, bei denen je nach locale (aha, locale!!) verschiedene
fonts benutzt. Leider klappt das bei unicode nicht gut, denn unicode hat
keine verschiedene lokales.

Diese Richtung ist also eine Sackgasse.

(Sorry für das technische, aber ich woltle _etwas_ zur Klärung der
Begriffe beitragen).

-- 
      -----==-                                             |
      ----==-- _                                           |
      ---==---(_)__  __ ____  __       Marc Lehmann      +--
      --==---/ / _ \/ // /\ \/ /       pcg at goof.com      |e|
      -=====/_/_//_/\_,_/ /_/\_\       XX11-RIPE         --+
    The choice of a GNU generation                       |
                                                         |


More information about the Wos mailing list