Internationalisierung: Know-How für multisprachliche Webauftritte

Internationale Unternehmen treten im Web gerne mit unterschiedlichen Sprachversionen ihrer Site an. Bei der Umsetzung einer internationalen digitalen Strategie wird oft nicht darauf geachtet, ob die richtige Sprachversion auch in der Suchmaschine beim richtigen Sprachpublikum ankommt. Welche Fallstricke lauern und worauf Sie bei der Internationalisierung Ihrer Website achten müssen, erklärt unser Blogbeitrag.

Zitat Google: „Google does not use locational meta tags (like geo.position or distribution) or HTML attributes for geotargeting.”

Aus der täglichen Praxis mit internationalen Unternehmensseiten stelle ich oft fest, dass das grundlegende Missverständnis auf Webmaster-Seite darin besteht, dass Land und Sprache oft keine eindeutig übereinstimmenden Kategorien darstellen. Marketer, die ein regionales Zielpublikum in der DACH-Region in der Zielsprache deutsch ansteuern wollen, können ein Lied davon singen. Global gesehen ist das Zuordnungsproblem zwischen Land und Sprache noch einmal eine Hausnummer größer: Eine englischsprachige .com-Seite kann nicht nur Traffic aus den USA anlocken, sondern auch aus Großbritannien, Australien oder Kanada – oder gar aus Ländern, wo Englisch “nur” Amtssprache bzw. gängige Lingua Franca ist, z.B. Indien oder Südafrika. Das mag für den Webmaster oder Marketer im ersten Moment bequem sein, aber zielführend ist eine solche Situation nicht.

Internationalisierung = Lokalisierung

Was ist, wenn aus den Zufallstreffern im Schrotgewehrmodus eine geplante Zielgruppenansprache mit anschließender Conversion werden soll? Dann funktioniert eine einzelne englischsprachige Seite nicht, sondern muss auf die jeweilige Zielgruppe in ihrem Land zugeschnitten werden. Ergo: Der Auftritt benötigt nun mehrere lokalisierte Seiten, die die Bedürfnisse der Kunden im jeweiligen Land und in der jeweiligen Sprache präzise berücksichtigen. Und die Grundvoraussetzung, dass der User überhaupt zu diesen Seiten findet: Sie müssen in der richtigen Suchmaschinenlokalisierung entsprechend weit oben auftauchen.

Unvermeidlich: Duplicate Content

Sie erraten sicherlich, dass genau an diesem Punkt die Schwierigkeiten mit den Suchmaschinen beginnen. Suchmaschinen sind sehr empfindlich, wenn ihnen auf mehreren Seiten identischer oder ähnlicher Inhalt aufgetischt wird – Stichwort „Duplicate Content“. Google sortiert gern Seiten aus, die der Algorithmus als Kopien einstuft. Das, was die Suchmaschine für das Original hält, ist weit oben positioniert, alles andere taucht entweder nicht gar nicht erst auf oder ist auf hinteren Positionen nur für hartnäckige Sucher auffindbar. Für Unternehmensauftritte, die bei der Internationalisierung naturbedingt eine inhaltliche Gleichförmigkeit auf mehreren Seiten anstreben, ist dieser Umstand eine Tragödie und ein Akt algorithmischer Willkür.

Die Lösung: HREFLANG

Auch für die Suchmaschinen, allen voran Google, war dieser Umstand etwas unbefriedigend. Die Suchmaschine will dem User das passende Ergebnis bieten. Wenn sie dabei eine lokalisierte Information aufgrund des Verdachts auf Duplicate Content unterschlägt, nur weil das Unternehmen Inhalte für unterschiedliche Regionen, Länder und Sprachen mehrfach nutzt, gefährdet sie ihren eigenen Qualitätsanspruch. Daher akzeptiert Google eine Lokalisierung von Webseiten über Markup mit dem Attribut hreflang. Allerdings: hreflang ist kein Allheilmittel. Es ist nicht dazu gedacht,

  1. die Geo-Ranking-Faktoren der Suchmaschinen zu ersetzen oder zu beeinflussen oder
  2. Duplicate Content (falls wider erwarten indexiert) zu höheren Rankingpositionen zu verhelfen.

Es geht beim hreflang-Attribut nur darum, die korrekte Zuordnung von Inhalten zu den entsprechenden Suchmaschinenlokalisierungen herzustellen. Nicht mehr und nicht weniger!

Drei Wege, ein Ziel: Ressourcenfragen bei der Integration des hreflang

Es gibt insgesamt drei Möglichkeiten, den hreflang zu integrieren.

  • HTTP-Header: Dies empfiehlt sich insbesondere bei Nicht-HTML-Dokumenten wie PDFs. Beispiel:
    http://www.beispielseite.es/;rel="alternate";hreflang="es"

     

  • HTML-Header: Im Head-Bereich des HTML-Dokuments können die verschiedenen Versionen der Seite durch entsprechend ausgestattete hreflang-Attribute in Link-Elementen angegeben werden. Beispiel:
    <link href="http://www.beispielseite.es" rel="alternate" hreflang="es" />

     

  • Sitemap.xml: Entsprechende Einträge in die Sitemap.xml geben die Information über unterschiedliche Lokalisierungen direkt an Suchmaschinen weiter. Vorteil unter anderem: Die Sitemap.xml kann auch direkt über Google-Webmastertools hochgeladen werden. Beispiel:
    <xhtml:link rel="alternate" hreflang="es" href="www.beispielseite.es" />

Die Frage nach dem besten Weg der Implementierung ist ressourcentechnisch recht interessant, denn die Variante mit dem http-Header erfordert Administratoren-Know-How. Die Eingabe per HTML-Header funktioniert nur, wenn das CMS eine Eingabemöglichkeit gewährt bzw. sich die unterschiedlichen Versionen unter diesem Aspekt im CMS gemeinsam verwalten lassen (cross input, damit nicht auf allen anderen Seiten der gleiche Eintrag noch einmal vorgenommen werden muss). Last but not least ist die Integration in eine Sitemap.xml die smarteste Herangehensweise, da sie auf dem Level eines Content Managers stattfinden kann. Bei besonders komplexen Site-Architekturen und vielen Lokalisierungen ist auch hier eine maschinelle Hilfe (Sitemap-Generator, CMS-Lösung etc.) nötig.

X-Default-Wert

Beim hreflang werden für die einzelnen Lokalisierungen Werte entsprechend der internationalen Codes für Sprache (ISO 639-1) und Länder (ISO 3166-1 Alpha 2) angegeben. Da jedoch auch das Bedürfnis besteht, einen globalen Auftritt ohne explizite Ausrichtung auf ein bestimmtes Land zu installieren, hat Google auch hierfür eine Möglichkeit geschaffen: Statt des Länder- bzw. Sprachencodes kann der Wert „x-default“ heißen. Beispiel für einen x-default-Eintrag in der Sitemap.xml:

<xhtml:link rel="alternate" hreflang="x-default" href="www.beispielseite.es" />

 

Strange Brew: hreflang und Canonical

Der Einsatz des Canonical Tags hat sich seit dessen Einführung 2009 als Quasi-Standard durchgesetzt. Gängige CMS legen neue Seiten mit einem selbstreferentiellen Canonical an. Das ist zwar nicht im Sinne des Erfinders, hat jedoch im Fall der Selbstreferenz keinerlei schädliche Auswirkungen. Nur darf die Warnung nicht unerwähnt bleiben: Verwechseln Sie hreflang nicht mit Canonical, denn Letzteres hat indexausschließende Wirkung für die verweisende Seite! Sollten Sie Canonical-Tags nutzen und nun im Zuge einer Internationalisierungsstrategie hreflangs verwenden, ist eine Prüfung Ihrer Canonicals Pflicht.

Webmastertools 

Die Webmastertools der Suchmaschinen erlauben die Zuweisung von Sprache und Land zu einem Internetauftritt. Google hatte sehr oft darauf hingewiesen, dass eines der wichtigsten Indizien für die Einordnung die Länder-TLD ist und die IP-Adresse ist.


Das Google Webmastertool hat jedoch einen gravierenden Nachteil: Die Zuweisung eines Auftritts zu einem bestimmten Land funktioniert nicht bei der Lokalisierung einzelner Seiten innerhalb der Ordnerstruktur, sondern immer nur für eine einzige Site.

Weiteres Geo-Targeting

Google akzeptiert nicht jede Information im HTML-Head einer Webseite (siehe Eingangszitat), doch können Sprach- und Länderkennungen in den Metatags unter Umständen wertvoll sein. Als Ranking-Faktor taugen (abgesehen vom Page-Title) diese Informationen nicht, sind jedoch für die Lokale Suche von Google besonders interessant, da sich über solche Tags auch Positionsangaben, z.B. für Filialen einfügen lassen. Hier ist vor allem das Zusammenspiel mit Services wie Google Places interessant.

Tweet about this on TwitterShare on Google+Pin on PinterestShare on StumbleUponShare on RedditShare on LinkedInShare on Facebook

, , , ,

Leave a Reply

Your email address will not be published. Required fields are marked *

*