Articles web

Nos articles concernant les techniques web sont centrés sur des solutions pratiques qui mettent en œuvre, le plus souvent, notre framework web : Vae Soli!

Des articles généraux sont également fournis dans le respect des standards du web.

Tous nos articles web sont disponibles sous le couvert de la licence Icône Creative Commons Creative Commons — Paternité - pas de modification.

2009-12-11 à 15:35:59

Microsoft, Google, Yahoo et MSN ont introduit conjointement une nouvelle forme de la balise link pour permettre d'indiquer sous quel URL une page doit être indexée. Cette balise permet donc de référencer correctement la page de base lorsque celle-ci peut prendre de multiples variantes (c'est le cas lorsque des URLs peuvent prendre des paramètres différents).

En soi, cette possibilité évite donc la duplication de contenu … et permet ainsi un meilleur référencement auprès des moteurs de recherche.

C'est grâce à la balise <link ...>, ainsi qu'indiqué ci-dessus, qu'on peut mentionner une URL canonique. Prenons un exemple concret : une page est accessible avec un paramètre qui contrôle la présentation …

  1. pages.php?display=decorated
  2. pages.php?display=bleach
  3. pages.php?display=no-image

Le paramètre n'influence pas du tout le contenu mais seulement la présentation. Pourtant, la page est considérée

Domaines et sous-domaines link rel="canonical" peut indiquer une adresse dans un autre sous-domaine, mais pas une adresse dans un autre domaine. Je ne peux donc pas utiliser: Par contre, ceci ne poserait pas de problème: ou http et https On peut parfaitement utiliser link rel="canonical" pour demander l'indexation des versions http au lieu des versions https des pages. A ne pas faire Cela pourrait marcher dans certains cas, mais ne jouez pas avec le feu: évitez les liens relatifs ne faites pas des chaînes de link rel="canonical" ne faites pas pointer link rel="canonical" vers une page en erreur 404 ou autre Faut-il oublier les règles de bonne pratique ? Non, efforcez-vous toujours d'utiliser partout la même URL pour une page donnée. Utiliser plusieurs URL pour un même contenu crée toujours une charge inutile provenant des robots des moteurs de recherche. Il y a de nombreuses situations qui font qu'une page est accessible à plusieurs URL, en général à cause d'une mauvaise conception du site (j'ai d'ailleurs donné des conseils pour corriger les problèmes de contenus dupliqués). Ceci pose problème pour le référencement car : pour analyser une page web ou tout document web indexable (PDF, Flash, .doc, etc.), les moteurs de recherche fonctionnent avec comme principe 1 page = 1 URL : une page est identifiée par une URL. donc si l'URL est différente, c'est a priori une autre page, analysée différemment En conséquence, quand une même page web est accessible à plusieurs endroits, les moteurs de recherche considèrent par défaut qu'il s'agit de plusieurs pages. Imaginons donc une fiche produit accessible à plusieurs URL (à cause des identifiants de session, des paramètres de tracking et d'affiliés, de la présence du produit dans plusieurs catégories, etc.). Si chacune de ces versions reçoit des liens différents (venant d'autres sites par exemple), alors chaque page est en concurrence avec les autres dans les pages de résultats Google. Si inversement le site est bien construit et qu'une page n'est accessible qu'à une seule URL quelles que soient les conditions, alors cette page concentre tous les atouts pour le référencement (notamment au travers de ces fameux backlinks). Conclusion : vous n'allez pas recevoir un carton rouge de la page de Google parce que vous avez des pages accessibles à plein d'URL à la fois, mais vous vous donnez beaucoup moins de chances de réussir à bien vous positionner dans les moteurs.