Comment utiliser hreflang pour un site web multilingue

13 Juil 2020 | Référencement naturel (SEO), Tutoriel

La balise hreflang a pour but d’indiquer la langue que vous utilisez sur une page spécifique de votre site afin que le moteur de recherche puisse servir ce résultat aux utilisateurs qui recherchent dans cette langue.

Si cette balise est essentielle pour les sites désirant s’adresser à des internautes dans un pays différents du leur, elle est mal maîtrisée. Une étude de SEMrush de 2018 affirmait que 75% des sites web présentaient des erreurs de mise en œuvre des hreflang.

Si à cela s’ajoutent d’éventuels problèmes de localisation et d’utilisation, comme par exemple un site en arabe qui ne se lirait pas de droite à gauche, ce sont plus de 80% des sites qui ne sont pas optimisés.

Nous allons voir dans cet article les éléments à avoir en tête pour l’utilisation de la balise hreflang.

 

Ciblez vos pays et structurez vos URL en conséquent

Au moment de définir votre stratégie de développement à l’international, le choix des pays est aussi important que la manière dont vous allez les aborder. Cela est valable de manière physique, bien entendu, mais également en ligne.

Au niveau de la construction de vos URL, il existe 4 principales approches et une cinquième optionnelle.

  • Les différents ccTLD, ou plus communément appelées, les extensions. Il s’agit des lettres figurant après le “.” suivant le nom de domaine. Il s’agit par exemple du .fr pour la France, du .it pour l’Italie, du .us pour les États-Unis ou encore du .cn pour la Chine ;
  • Sous-domaine : il s’agit d’un préfixe que vous ajouterez préalablement à votre nom de domaine. Il peut s’agir des lettres relatives au pays que vous visez, celles-ci étant séparées de votre nom de domaine par un point. Exemple : vi.wikipedia.org, la version vietnamienne de Wikipédia ;
  • Sous-répertoire : dans ce cas, l’idée est de reprendre les lettres de l’extension du pays que vous visez et de les intégrer dans un répertoire de vos URL. En d’autres termes, vous positionnez l’extension entre deux “/” comme par exemple la version polonaise du site d’Arte : www.arte.tv/pl/ ;
  • Un domaine entièrement différent : il s’agit d’une solution d’autant plus intéressante si votre domaine originel n’équivaut pas au nom de votre marque ;
  • Paramètre : il s’agit d’ajouter un paramètre type ?lang=fr ou similaire dans votre URL pour modifier la langue. Néanmoins, ce type de structure n’est pas recommandé car il ne vise aucun pays en particulier.

Si vous souhaitez en savoir plus sur la construction de votre URL pour votre développement à l’international, vous trouverez un article plus détaillé sur notre blog.

 

Comment structurer les balises hreflang

Une balise hreflang commence toujours par le ciblage de la langue. Cela étant, elle peut ensuite intégrer d’autres variables comme par exemple :

  • Langue : “fr”, « en », « es » ou une autre valeur enregistrée ;
  • Scénario : « Latn », « Cyrl », ou autres codes ISO 15924 ;
  • Région : codes ISO 3166, ou codes UN M.49 ;
  • Variante : à l’instar de « guoyu », « Latn », « Cyrl » ;
  • Extension : lettre unique suivie de sous-titres supplémentaires.

Quel que soit le degré de ciblage de vos balises, elles doivent également respecter le format ci-dessous :
{language}-{extlangtag}-{script}-{region}-{variant}-{extension}

La majorité d’entre nous connaît surtout le format suivant : {language}-{region}.

Toutefois, si votre activité est présente en Chine, vous serez davantage susceptible d’utiliser {langue}-{script}-{région}, à l’image de zh-Hans-cn (chinois simplifié pour la Chine continentale).

Pour plus de détails sur les spécifications de l’Internet Engineering Task Force (IEFT) vous pouvez consulter le document à cette adresse.

Passons désormais en détail les différentes variables.

Balise de langue

Chaque langue et langage international dispose de son propre code ISO. Il s’agit du code ISO 639-1. Ce dernier attribue à l’ensemble des 500 langues ou familles de langues du monde un identifiant à 2 lettre permettant de le repérer.

Voici quelques exemples de code ISO 639-1 pour quelques pays :

  • Français : fr ;
  • Breton : br ;
  • Anglais : en ;
  • Catalan : ca ;
  • Chinois : zh ;
  • Birman : my ;
  • Ourdou : ur ;
  • Hindi : hi, etc.

Le code langue pris en charge provient de la liste de classification ISO 639-1. Toutefois, dans certains cas, la balise de langue étendue {extlangtag} peut être utilisée seule.

Balise de langue étendue

Les balises {extlangtag} sont des sous-balises qui peuvent être utilisées pour spécifier des langues sélectionnées qui sont étroitement identifiées avec une sous-balise de langue primaire (ou macro-langue) existante. Parmi les principales macro-langues existantes figurent le Chinois, l’Arabe ou encore le Quechua.

La macro-langue Chinois

Pour le Chinois, par exemple, de nombreux dialectes peuvent être associés au code ISO 639-1 initial. On trouve 13 extensions parmi lesquelles yue pour le Cantonais, cmn pour le Mandarin ou encore cpx pour le Puxian. Ces trois exemples s’écriront respectivement zh-yue, zh-cmn et zh-cpx.

La macro-langue Arabe

Pour la macro-langue Arabe, autre exemple, de nombreuses langues peuvent y être rattachées. Ainsi, nous écrirons ar-afb pour parler de l’Arabe des pays du Golfe.

Script

Les sous-balises de script ont également une classification ISO. Il s’agit de la norme ISO 15924. Elle inclut un codet alphabétique à quatre lettres permettant de définir l’alphabet de référence. On trouve ainsi :

  • Arab pour l’alphabet arabe ;
  • Cyrl pour l’alphabet cyrillique;
  • Egyp pour l’écriture hiéroglyphique égyptienne ;
  • Latn pour l’alphabet latin;
  • Laoo pour le laotien ;
  • Hans pour la variante simplifiée des idéogrammes han (le “S” signifiant simplifiée) ;
  • Hant pour la variante traditionnelle des idéogrammes han (le “T” signifiant traditionnelle), etc.

Quelques exemples de tournure de scripts :

  • uz-Cyrl : Ouzbek en cyrillique ;
  • uz-Latn : Ouzbek en alphabet latin ;
  • zh-Hans : Chinois en écriture simplifiée ;
  • zh-Hant : Chinois en écriture traditionnelle.

Une seule sous-balise de script peut être utilisée par balise hreflang.

Région

Les codes de région sont issus de la norme ISO 3166-1. Et plus précisément de la liste alpha-2. Cette liste de codes à deux lettres permet de définir les domaines de premier niveau pour chaque pays. Ils sont accompagnés de la balise de langue.

Des erreurs récurrentes sont à éviter comme par exemple :

  • Cibler le RW pour “Rest of the world” (ou Reste du monde) alors qu’il s’agit du code du Rwanda ;
  • Cibler le LA pour “Latin America” (ou Amérique latine) alors qu’il s’agit du code du Laos.

Variante

La sous-balise variante peut être utilisée pour indiquer des dialectes, ou des variations d’écriture, non couverts par la langue, la macro-langue ou la balise région.

A priori, il est très peu probable que vous deviez recourir à des variantes de sous-balises. Mais cela est possible si vous vous adressez à un marché de niche. Voici quelques exemples de ces variantes :

  • sl-SI-nedis : dialecte de Nadiza de Slovénie, tel qu’il est parlé en Slovénie ;
  • de-DE-1901 variante de l’orthographe allemande datant des réformes de 1901, telle qu’elle est parlée en Allemagne).

Extension

Les sous-balises d’extension permettent d’ajouter des extensions à la balise de langue. C’est le cas par exemple de la balise d’extension « u ». Cette dernière a été enregistrée par le consortium Unicode pour ajouter des informations sur la langue ou le comportement local. Il est très peu probable que vous ayez un jour besoin de les utiliser.

 

Lorsqu’elle est correctement mise en œuvre, elle devrait ressembler à ceci :
<link rel="alternate" hreflang="fr-fr" href="https://votresite.fr" />
<link rel="alternate" hreflang="en-gb" href="https://website.co.uk" />
<link rel="alternate" hreflang="en-us" href="https://website.com" />

 

Considérations complémentaires sur hreflang

Cibler la langue ou les pays

Les principaux problèmes rencontrés lors de la mise en œuvre des balises hreflang résultent d’une mauvaise adéquation avec les objectifs affichés pour les marchés ciblés.

Prenons l’exemple d’un site en espagnol mis en ligne avec le code hreflang="es". Avec ce dernier, le site ne visera pas seulement l’Espagne. Il indiquera une version espagnole localisée pour tous les marqueurs sur la carte. En d’autres termes, la balise fournira une version localisée pour tous les pays et régions hispanophones à l’instar de l’Amérique latine, des Caraïbes mais également aux États-Unis. En revanche, la balise hreflang="es-es" n’indiquera la pertinence que pour l’Espagne.

Retour des onglets

Si une page A renvoie à une page B par un hreflang, alors la page B doit renvoyer à la page A. Sinon, votre hreflang pourrait ne pas être lu correctement. Vous pouvez voir si votre site contient de telles erreurs dans la Search Console.

URL absolues

Concernant les annotations hreflang, elles doivent être des URL absolues référencées dans le sous-tag href.

 

Mise en œuvre de la balise hreflang

Avant de mettre en oeuvre votre balise hreflang, il est primordial que vous sachiez si les moteurs de recherche utilisés dans le pays ou la région de votre cible supportent la balise.

Quels moteurs de recherche supportent hreflang ?

  • Google (multilingue) via HTML et XML Sitemap ;
  • Yandex (Russe, Anglais) via HTML ;
  • Seznam (Tchèque) via HTML.

Quels moteurs de recherche ne supportent pas hreflang ?

  • Baidu (Chinois) : utiliser la balise HTML Meta Language ;
  • Naver (Coréen) : utiliser la balise HTML Meta Language ;
  • Bing (multilingue) : utiliser la balise HTML Meta Language.;

Concernant Bing, la meilleure pratique consiste à inclure systématiquement la balise hreflang d’une part et la balise HTML Meta Language d’autre part. Cela donne le résultat suivant :

Vous souhaitez en savoir plus sur la manière de développer votre site web pour les marchés internationaux ? Consultez nos experts en SEO international !

Pour aller plus loin