Francis Chouquet Graphiste Lettering

Tuto de l’été n°2: Comprendre l’utilisation et l’importance du sitemap Google

0

Sur WordPress, très peu se posent la question de savoir comment fonctionne le sitemap. On installe le plugin et c’est parti !! 😀 Mais ce matin, dans la continuité de nos tutos de l’été, je voudrais vous expliquer simplement ce qu’est le sitemap et comment il va vous aider à travers l’utilisation de Google Webmaster Tools.

Avant tout, il faut comprendre comment les moteurs de recherche vont découvrir votre blog. Ca se passe souvent par le biais d’un autre site, qui lui est indexé, et qui va amener le robot du moteur jusque sur votre site, via un lien. Le robot arrive sur votre site et va référencer les pages qui lui sont accessibles. C’est en tout cas comme ça que fonctionnait le référencement avant l’apparition des sitemaps. Car en effet, ce protocole va permettre au robot de parcourir l’ensemble du site grâce au plan que le sitemap va lui donner.

C’est pour ça que l’on crée un fichier XML, appelé sitemap.xml. Voici à quoi il ressemble pour 2 URLs:

Config Sitemap Google

On commence par définir le type de fichier avec sa version ( ici XML, version 1 et codage UTF-8) . Ensuite, on ouvre un « urlset » qui va référencer toutes les url de chaque page du blog. Celles-ci sont insérées dans une balise « url ». Ensuite, on indique l’url la page (loc), la fréquence de modification de ces pages (changefreq), la date de la dernière mise à jour (lastmod), et l’importance de chaque page comparée aux autres (priority). Ainsi, vous pouvez dire au robot qu’elles sont les pages que vous estimez être les plus importantes sur votre blog et quand elles ont été mises à jour pour la dernière fois !

Je vous rassure, sur votre blog, l’ensemble est mis à jour de manière automatique. Chaque nouvelle page est automatiquement intégrée dans le sitemap. Si vous allez sur la page d’administration du plugin Google Sitemaps (Options > Sitemap), vous y trouverez comment paramétrer l’ensemble de votre blog pour référencer différents certaines pages que d’autres. Et pour savoir si votre sitemap est correct et bien pris en compte par Google, allez sur votre tableau de bord de Google Webmaster Tools, et cliquez sur l’onglet « Sitemaps ». Vous allez y trouver différentes informations intéressantes:

Sitemaps-Google

Tout d’abord, vous allez avoir la date à laquelle vous avez soumis le sitemap. Ensuite, la date à laquelle le robot de Google est « passé » sur votre blog et à pris en compte les derniers changements sur votre blog. Les statut du sitemap est indiqué juste après et si tout va bien, il devrait vous indiquer OK. Enfin, la dernière ligne vous indique le nombre d’URL soumises au robot. Si le robot n’arrive pas à accéder à toutes vos pages, il vous le fera savoir sur le Dashboard de Google Webmaster Tools à travers les Crawl Errors:

Crawl-Errors-Google

Ici, par exemple, Google n’a pas trouvé 23 pages qui sont indexées dans le sitemap. Vous remarquerez que l’outil vous fournit différentes raisons pour lesquelles il n’arrivent pas à accéder à vos pages:

  • HTTP Errors: Le robot n’a pas accès à cette page. Ca peut être par exemple une page qui requiert un mot de passe.
  • Not found: le robot ne trouve pas les pages, celles-ci ne semblent pas exister.
  • URLs not followed: Ce sont les URL qui sont redirigées vers une autre page, mais dont la redirection ne fonctionne pas.
  • URLs restrited by robots.txt: le robot n’a pas accès à la page parce que le fichier robots.txt le lui interdit.
  • URLs timed out et Unreachable URLs: Le robot n’a pas eu accès à la page dans le temps qui lui était donné.

Dans notre cas ici, on va cliquer sur le lien « Not found » et voir les différentes URL qui ne sont pas accessibles par le robot de Google.

Un bon moyen de régler ce genre de problème est de mettre à jour votre sitemap. Pour cela, direction l’admin du plugin Google Sitemaps et cliquez sur le bouton « Reconstruire le fichier Sitemap ».

Donc, vous voyez que grâce à cet outil, vous allez pouvoir vérifier que Google vient bien scanner l’ensemble des pages de votre blog mais aussi quand il vient le faire. Si vous n’indiquez pas de sitemap, Google n’aura aucune possibilité d’indexer l’ensemble de votre site. La seule manière de le faire sera uniquement via les liens externes ou internes qui pointent sur des pages de votre blog. Le sitemap a donc une importance capitale et l’utilisation de Google Webmaster Tools ne fait que vous aider dans cette tache. Et déjà, avec ça, vous allez pouvoir faire un peu le ménage sur les URLs de votre blog !

Une autre chose qu’il faut savoir, c’est que Yahoo et Microsoft ont rejoint Google pour utiliser et promouvoir le protocole Sitemaps. Vous trouverez toutes les infos et dernières nouvelles sur sitemaps.org.

Source: Article de Vanessa Fox dans .net magazine UK du mois de juin 2007.

Francis

6 Commentaires

  • Concis et clair.
    Les plugins ont beau être facile à activer, je trouve comme toi idiot ne pas vouloir savoir ce que l’on fait tourner sur son blog! Pour celui-ci au moins, c’est clair pour tout le monde.
    Continuons donc…

  • Effectivement… Ici, le plugin est quand même très important, mais si on ne comprends pas le fonctionnement du fichier sitemap, on ne sait pas non plus comment bien paramétrer le plugin et du coup on passe à côté d’un élément important du référencement…

  • Meric de nous faire partager ta sicence ! ^^

  • pako69

    Bonjour,
    J’arrive un peu tard, vu la date des derniers commentaires, mais je voudrais tout de même préciser que l’utilisation d’un sitemap n’a rien , mais rien à voir avec un meilleur référencement.

    Et ce n’est pas moi qui le prétend, mais Google himself :
    Allez sur cette page et téléchargez le pdf :
    http://www.google.com/support/.....swer=35291

    Ensuite consultez la page parlant justement des sitemap, en gros cela explique que c’est utile pour vous-même et ensuite pour vos utilisateurs, c’est tout mais en aucun cas pour un meilleur référencement.

Success, your comment is awaiting moderation.