Sprache einer HTML Seite
Inhaltsverzeichnis
Warum die Sprache einer HTML Seite festgelegt werden sollte
Es gibt viele Gründe, die dafür sprechen, die Sprache einer HTML Seite im Quellcode festzulegen. Zunächst wird es dadurch User-Agents erleichtert, den Text einer Internetseite richtig darzustellen. Außerdem stellt die Sprache eines HTML Dokuments für viele Suchmaschinen wie z.B. Google ein wichtiges Filterkriterium für die Suchergebnisse dar, die einem User aus einem bestimmten Land angezeigt werden. Wenn die Sprache einer Seite nicht explizit im HTML Code angegeben wird, versuchen diese Suchmaschinen, die Sprache der Seite anhand von anderen Faktoren (siehe Abschnitt 2) zu bestimmen, was häufig zu Fehlinterpretationen führen kann.
Darüber hinaus sollten auch Sprachwechsel innerhalb einer HTML Seite entsprechend gekennzeichnet werden, um beispielsweise Übersetzungsdiensten die Arbeit zu erleichtern.
Einflussfaktoren auf die Zuordnung der Sprache
Wie oben bereits erwähnt, haben Suchmaschinen bei fehlender Sprachdeklaration im HTML Code einige weitere Möglichkeiten, die Sprache einer Webseite zu ermitteln. So können moderne Suchmaschinen wie Google über eine einfache Textanalyse die Sprache der Webseite erkennen und so dem richtigen Landesindex für die Suche zuordnen. Problematisch wird dies jedoch, wenn es wenig zu analysierenden Text oder gar Text in mehreren Sprachen auf ein und derselben Webseite gibt.
Weiterhin können der Standort des Servers oder die Domain Endung zur Zuordnung der Sprache herangezogen werden, was jedoch auch nicht immer zu einer korrekten Spracherkennung führt. Als Beispiel sei hier eine Webseite genannt, deren Domain auf .de endet und dessen Server sich ebenfalls in Deutschland befindet, die aber einzelne Seiten auch auf Englisch anbietet.
Um solche Fehlinterpretationen zu vermeiden, sollte also immer die Sprache einer Seite im HTML Code angegeben werden. Wie dies genau funktioniert, erklären wir Ihnen im nächsten Kapitel.
Festlegung der Sprache im HTML Code
Am einfachsten können Sie die Sprache einer Seite über folgendes lang Attribut im HTML Element (HTML 5) festlegen:
<html lang="de">
Das Attribut sollte immer im HTML Element angegeben werden, da es dadurch auch an alle anderen Elemente vererbt wird und somit auch die Sprache für den Text im Head-Bereich festlegt. Dies wäre bei einer Angabe im Body-Element nicht der Fall.
Wenn innerhalb einer Seite Teile des Textes in einer anderen Sprache geschrieben sind, sollte das lang Attribut jedem Element, das solche fremdsprachigen Teile umschließt, hinzugefügt werden.
Für Seiten, die als XML ausgeliefert werden, ist das xml:lang-Attribut zu verwenden.
Veraltete Angaben der Sprache in den Meta-Attributen einer Webseite z.B.
<meta http-equiv="content-language" content="de">
verstehen Suchmaschinen zwar, sollten aber nicht mehr verwendet werden.
Zur Ermittlung der jeweiligen zweibuchstabigen Sprachkürzel nach ISO 639-1, können Sie das IANA-Register für Sprachkürzel heranziehen. Diese Codes können sich auch aus zwei Teilen zusammensetzen, wobei der erste Teil auf die Sprache verweist und der zweite Teil auf das Land, in dem die Sprache gesprochen wird, z.B. “en-us” für amerikanisches Englisch.
Hat man trotz dieser Hinweise Probleme bei der sprachlichen Zuordnung, kann man zum Beispiel bei Google über die Search Console (unter Website-Einstellungen) die geographische Ausrichtung der Webseite für Google manuell festlegen.
Möglichkeiten zur Strukturierung mehrsprachiger Websites
Wenn eine Website Seiten in verschiedenen Sprachen enthält, da ein Unternehmen z.B. international tätig ist, gibt es verschiedene Möglichkeiten diese zu strukturieren.
So kann beispielsweise für jedes Land die entsprechende Länderdomain erworben werden, also z.B. example.de, example.es, example.it usw.
Eine weitere Möglichkeit besteht darin, jede Sprachversion auf einer entsprechenden Subdomain bereitzustellen, also de.example.com, es.example.com, it.example.com usw.
Alternativ können Webmaster für jede Sprache ein entsprechendes Unterverzeichnis anlegen, wobei die Hauptversion der Website im Hauptverzeichnis bleibt, also z.B. example.com/es/ oder example.com/it/.
Bei dynamischen Seiten besteht zudem die Möglichkeit, einen Parameter für die jeweilige Sprache zur URL hinzuzufügen, z.B. example.com/produkte.php?lang=es.