Google et les séparateurs
Quant on parle d'optimisation pour le référencement l'on est obligé de traiter également de l'URL-rewriting et de l'inclusion de mots clefs judicieusement choisis dans l'adresse des pages internet. Seulement on est également et rapidement amené à se poser la question : "quel séparateur de mot employer pour être référencé au mieux sur les moteurs de recherche et en particulier sur Google ?"
La prise en compte des séparateurs par Google ?
Une fois mise de côté la question de l'espace qui n'est pas un séparateur conseillé dans l'URL et le + caractère pouvant être diversement interprétés par les navigateurs ou les scripts de vos sites, c'est tout naturellement que l'on envisage d'employer les tirets (-) ou les underscores (_) voir même pour certains webmasters pointilleux et téméraires d'utiliser la virgule (,) comme séparateur de mots clefs (devrait-on plutôt dire "chaînes de caractères ") dans l'URL.
Pour y voir plus clair nous avons pratiqué les 10 et 11 décembre 2007 un test d'indexation afin de vérifier ce que Google considérait comme un séparateur valable et ce qui à l'évidence n'en était pas.
Présentation du test underscore, virgule et tiret.
Le 10 décembre 2007 nous avons mis en ligne une page de test dont l'adresse était :
http://outils.enaty.com/wag22atu-sit22ozf-az22ole_vuk22ert,boz22erp,bou22nbi.php
Composée donc de mots n'existant pas et ne renvoyant aucun résultats sur Google, ces mots sont dans l'URL : wag22atu-sit22ozf-maz22ole_vuk22ert,boz22erp,bou22nbi.
Ils sont séparés soit par des tirets soit par des underscores ou soit encore par des virgules.
Dans le corps de cette page nous avons indiqué de manière totalement lisible pour l'oeil humain d'autres mots clefs, différents et également et présentés par doublons utilisant l'un des séparateurs pré-cités : ingo22ogle_we22trust exal22eadle-conc22urrentet yahoo22en,for22metre.
Le principe de validation du test.
Nous partons d'un postulat simple, pour être considéré comme ayant une valeur séparatrice de chaîne, l'un de nos séparateurs doit renvoyer des résultats pour un mot clef issu d'un doublon. Pour être plus clairs nous précisons bien que la page doit être retournée lorsque 'une requête est faite, ainsi que suit.
Résultats du test.
Nul doute sur la valeur séparatrice du tiret employé déjà, et conseillé, lors des réécritures d'URL, nous allons donc directement nous attacher à la valeur séparatrice de l'underscore.
L'underscore dans l'URL.Si l'underscore a une valeur séparatrice il devrait donc renvoyer la page sur une requête faite d'un extrait du doublon correspondant présent dans l'URL (maz22ole_vuk22ert), il n'en est rien.
Comme vous pouvez le constater le mot maz22ole ne renvoie aucun résultat. Ceci est confirmé quand nous remplaçons l'underscore du doublon par un espace dans notre champ de recherche Google, toujours aucun résultat.
Pour autant une recherche du doublon avec son underscore conduit bien à l'affichage de notre page en tant que résultat.
La conclusion est donc que l'underscore n'est pas un séparateur apte a séparer des mots clefs dans l'adresse de pages web.
La virgule dans l'adresse.Nous nous somme intéressés par la suite et selon le même cheminement intellectuel à ce prétendu séparateur, réagit-il comme le tiret ou bien comme l'underscore ?
Nous avons recherché si l'un des membres du doublon séparé par une virgule renvoyait notre page en résultat lors d'une requête sur google, signe qu'il était bien séparé de la fin de notre chaîne (boz22erp,bou22nbi).
C'est à l'évidence le cas, la virgule a donc une valeur séparatrice de mots clefs dans l'adresse des pages web.
L'underscore dans le corps du texte.En langage écrit, l'underscore est il faut bien le reconnaître très peu utilisé, toujours est-il qu'il est intéressant de savoir si Google sépare une chaîne de deux groupes de caractères disjoints par un underscore (exemple si votre page contient " http://outils.enaty.com/wag22atu-sit22ozf-maz22ole_vuk22ert,boz22erp,bou22nbi.php" elle pourrait être réactive).
Nous allons pour cela vérifier si notre doublon présent dans le corps de notre page de test renvoie notre page en résultat.
La réponse est oui quand l'on recherche notre doublon séparé de son underscore, mais non quand on le sépare d'un espace.
C'est également non, quand on ne recherche que la première partie de notre doublon.
L'underscore ne sépare donc pas non plus une chaîne de caractères dans le corps d'un texte.
La virgule dans le corps du texte.Il n'est bien entendu pas utile de prouver que la virgule est séparatrice dans le corps du texte. Non bien sur car Google n'aurait sans doute pas le même succès en France.
Et le tiret ?On est bien entendu en droit de se demander si le tiret que l'on emploie dans les mots composés est un séparateurs valide, c'est-à-dire si une requête portant sur la première partie d'un mot composé serait réactive (exemple : chat-perché, la page réagit-elle seulement sur chat-perché ou également sur chat ?). ne pouvant employer ce mot nous avons utilisé un mot composé fantaisiste exal22eadle-conc22urrentet puis recherché la partie exal22eadle.
Le résultat semble être concluant, le tiret est également un séparateur valide de chaîne de caractères dans le corps des textes.
Derniers articles de cette rubrique:
- 01-07-2009 : Le référencement facile en 100 questions
- 16-06-2009 : PageRank Sculpting : Matt Cutts met les choses au point
- 11-06-2009 : Fichiers Sitemap : de légères améliorations
- 03-06-2009 : Exalead rappelle que le contenu ne suffit pas
- 03-06-2009 : Matt Cutts enterre le Pagerank sculpting