baanthai Computing - Gestaltung von Webseiten
Gestaltung von Webseiten

von Hans Möller

Bei der Gestaltung von deutsch-thailändischen Webseiten kommt irgendwann die Frage auf, wie die Sprachcodierung am besten zu lösen ist.

Oft kommt es vor, daß auf einer Webseite, welche deutsche und thailändische Schrift enthält, immer nur eine der beiden Sprachen korrekt angezeigt wird. Schaltet man den Webbrowser auf thai fehlen die deutschen Umlaute, schaltet man auf deutsch, kann man die thailändischen Zeichen nicht mehr lesen.

Es sind verschiedene Methoden zur Bearbeitung solcher Seiten möglich. Die Zielstellung ist natürlich, daß möglichst viele Besucher der Seiten ohne großen Aufwand sowohl die deutschen als auch die thailändischen Texte korrekt angezeigt bekommen.

Nachfolgend werden unterschiedliche Methoden dargestellt und diskutiert.

ANSI (TIS620) universal

Bei dieser Methode wird dem Webbrowser nicht mitgeteilt, um welche Sprache es sich bei der angezeigten Seite handelt. Die Auswahl der Zeichen geschieht einzig durch die gewählte Schriftart.

Der Ansi oder ASCCI Zeichensatz kennt 255 Zeichen. Die ersten 126 Zeichen werden durch das englische Alphabet und diverse Sonderzeichen belegt. Die höheren Zeichen werden von den nationalen Buchstaben (thai, deutsche Umlaute) genutzt. Die verwendete Schriftart bestimmt, welche Sprache zur Geltung kommt.

Im Quelltext der Webseite wird die Schriftart über das HTML-Tag <font> ausgewählt. ZB wählt <font face='Phan'> die Schriftart Phan für den nachfolgenden Text aus. Mit dem HTML-Tag </font> wird wieder auf die Standard-Schriftart umgeschaltet.

Der Nachteil dieser Methode ist, daß die ausgewählte Schriftart auf dem PC des Betrachters installiert sein muß. Außerdem kann man beim Bearbeiten der Webseiten im Quelltext immer nur deutsch oder thai sehen. Die Ansicht beider Sprachen zusammen im Quelltext ist nicht möglich.

Link Beispiel: Der Schriftzug Krung Thep mit TIS620

ANSI (TIS620) mit Sprachvorgabe

Über einen Befehl im Quelltext der Seite wird der Webbrowser angewiesen, eine bestimmte Sprache bei der Anzeige der Seite zu benutzen. Diese Einstellung gilt für alle Buchstaben auf der Seite.

Mit dieser Methode lassen sich Webseiten in vielen Sprachen darstellen. Sogar chinesische Zeichen können so eingebaut werden. Der Nachteil ist jedoch, daß für eine Webseite immer nur eine Sprache vorgegeben werden kann. Ein Gemisch aus deutsch und thai läßt sich somit nicht darstellen.

Folgende Anweisung veranlaßt den Webbrowser auf thai umzuschalten:
<head>
...
<meta http-equiv='Content-Type' content='text/html; charset=windows-874'>
...
</head>

Link Beispiel: Der Schriftzug Krung Thep mit windows-874

Special Characters

In der HTML-Spezifikation ist vorgesehen, daß bestimmte Zeichen über eine Kennung oder durch Angabe des Zeichencodes definiert werden können. So gibt zB die Zeichenfolge '&gt;' (greater) im Quelltext das größer-als Zeichen '>' im Webbrowser aus.

Für viele Zeichen sind Namen festgelegt worden wie 'größer-als' (greater) = 'gt', 'kaufmännisches Und' (ampercent) = '&' usw. Diese Zeichen sind mit dem Quelltext &#[Name]; anzeigbar. Um alle Zeichen darstellen zu können, unterstützen die Webbrowser jedoch auch die Angabe eines Zeichens über dessen Nummer in der Zeichentabelle. Dazu muß man im Quelltext der Internetseite &#[Nummer]; angeben. Das Rautezeichen # weist den Webbrowser an, daß jetzt keine Name sondern eine Zahl mit dem Zeichencode folgt. Das Semikolon schließt die Definition ab.

Die Zeichen bis zum Zeichencode 255 beherrschen auch die älteren Versionen der Webbrowser. So wird durch die Verwendung von '&#120' der kleine Buchstabe 'x' definiert. Ab dem 128ten Zeichen fangen dann jedoch die sprachspezifischen Buchstaben an. Dazu gehören auch die deutschen Umlaute. In dem Bereich ab 128 wurden unter TIS620 auch die thailändischen Zeichen definiert. Dies führt dazu, daß je nach Schriftart entweder die deutschen Sonderzeichen oder die thailändischen Buchstaben angezeigt werden.

Um eine sichere Darstellung zu gewährleisten sollte man die Unicode-Nummern der Buchstaben benutzen. Dabei wird vorausgesetzt, daß der Webbrowser Unicode unterstützt. Der erste Buchstabe des thailändischen Alphabets ist dann &#3585;.

Link Beispiel: Der Schriftzug Krung Thep mit Special Characters

Unicode

Ab Windows NT (und Nachfolgern 2000 und XP) bzw Internet Explorer 5 können Internetseiten in Unicode angezeigt werden. Mit Unicode kann man theoretisch beliebige Schriftzeichen aus allen Sprachen nebeneinander auf einer Internetseite darstellen. Man benötigt dazu jedoch eine Schriftart (Fonts-Datei), welche auch wirklich alle Zeichen enthält.

Der Vorteil dieser Methode ist, daß man auch im Quelltext die thailändischen Zeichen sieht und somit Änderungen einfacher vorzunehmen sind.

Ein erster Ansatz dazu ist die Schrift Arial Unicode MS von Microsoft. Diese ist zum freien Download erhältlich. Diese Schriftart beinhaltet (fast) alle Schriftzeichen der Welt und hat daher auch mehr als 13 MB.

Beim Einsatz von Unicode sollte UTF8 genutzt werden. Dies muß man dem Webbrowser durch einen entsprechenden Eintrag in der Webseite mitteilen:
<head>
...
<meta http-equiv='Content-Type' content='text/html; charset=utf-8'>
...
</head>

Wenn Webseiten in Unicode kodiert sind, kann jeder Besucher die Seite mit einem unicode-fähigen Webbrowser anschauen. Alle Zeichen, egal ob deutsche Umlaute oder die thailändischen Zeichen werden korrekt angezeigt. Die Nutzung von Unicode ist sicherlich die beste Methode. Allerdings kann es bei Besuchern mit älterem Betriebssystem oder Webbrowser passieren, daß diese nur Hieroglyphen sehen. Diese Gefahr ist jedoch relativ gering, da heute die alten Versionen der Webbrowser eine Verbreitung von weniger als 5% haben.

Der Internet Explorer von Microsoft beherrscht sogar die korrekte Silbentrennung, wenn die Seite verkleinert und der Fließtext umgebrochen wird.

Link Beispiel: Der Schriftzug Krung Thep mit utf8

Bilddatei

Thailändischer Text kann auch als Grafik in eine Webseite eingebaut werden. Dazu benutzt man am besten das GIF-Format, welches einen transparenten Hintergrund unterstützt.

Hierbei sind keine besonderen Steueranweisungen für den Webbrowser nötig.

Der Vorteil dieser Methode ist, daß man die Anzeige der thailändischen Zeichen zu 100 Prozent sicherstellt (sofern nicht im Browser die Anzeige von Grafiken ausgeschaltet ist).

Der Nachteil ist, daß Aktualisierungen sehr umständlich sind. Es muß bei jeder kleinen Änderung eine neue Bilddatei erstellt werden. Zudem paßt sich die Grafik nicht an die Fenstergröße und die Schriftgröße an, welche vom Webbrowser des Betrachters vorgegeben werden.

Eine weitere Variante der Verwendung von Bilddateien ist, jeden thailändischen Buchstaben als einzelnen Grafik zu erstellen und dann Worte durch Kombination der Grafiken zu bilden. Dies ist sehr aufwändig und erfordert eine Vielzahl von Bilddateien da Kombinationen aus Konsonant und Vokal und/oder Betonungszeichen in der thailändischen Schrift sehr viele einzelne Grafiken erfordern.

Link Beispiel: Der Schriftzug Krung Thep als Bilddatei

Schriftarten (Fonts-Dateien)

Eine Auswahl von Schriftarten zum Download finden Sie auf der Seite Thai Fonts.

Fazit

Die einfachste Methode zur Erzeugung von Webseiten mit deutschen und thailändischen Buchstaben ist die Verwendung von Unicode. Hierbei kann der Quelltext der Seite in beiden Sprachen bearbeitet werden und eine korrekte Anzeige der Seiten in den meisten Webbrowsern ist sichergestellt.

Kommentar anzeigen / erfassenKommentare
Besuchen Sie auch Deutsch-Thai Wörterbuch Thaibuch.De Thailand Fotos Phuut Thai .NET Sudoku
© 1997 - 2007 und Anbieter · Hans Möller · Büttgenweg 12 · 40547 Düsseldorf · info @ phuutthai.net