Un sitemap d’un site, aussi appelé “plan de site”, est une liste d’informations sur toutes les pages, vidéos, images et autres fichiers d’un site web. Ces informations sont utilisées par les robots d’exploration du Web et les moteurs de recherche pour comprendre la structure d’un site Web et les relations entre les fichiers et les pages qu’il contient.
Il existe plusieurs types de sitemaps :
Deux d’entre eux sont les principaux types de sitemaps et les plus utilisés : les sitemaps HTML et les sitemaps XML.
Le protocole Sitemaps a été introduit par Google, mais est pris en charge par la plupart des grands moteurs de recherche tels que Bing, Yahoo et Ask.
Les sitemaps XML sont principalement destinés aux moteurs de recherche, à leurs robots et aux robots d’exploration du Web, afin de leur donner un meilleur aperçu de la structure de votre site Web.
Cela permet aux robots d’accéder facilement à toutes les pages de votre site Web ainsi qu’à toutes les informations pertinentes le concernant.
Il s’agit généralement de l’URL de la page, de la date de la dernière mise à jour et de toute variante linguistique de la page, mais cela peut également inclure des informations supplémentaires telles que la fréquence des modifications et la priorité relative d’une page par rapport aux autres.
Les sitemaps HTML sont normalement réalisés dans un format et une structure faciles à lire et sont utilisés pour aider les utilisateurs à trouver ce qu’ils recherchent.
Un sitemap HTML ne doit pas nécessairement inclure toutes vos URL/pages et doit être conçu pour aider un utilisateur à trouver ce qu’il cherche s’il se perd sur votre site. Beaucoup créent un modèle HTML pour aider l’utilisateur à trouver les pages les plus importantes de leur site Web.
En connaissant la structure de votre site Web, les moteurs de recherche peuvent l’explorer intelligemment et s’assurer que toutes les pages de votre site figurent dans leur index de recherche.
Dans un sitemap XML, il est possible d’ajouter des informations supplémentaires à une URL, qui aident les robots d’exploration à optimiser la façon dont ils parcourent votre site Web.
Ces facteurs aident les moteurs de recherche à déterminer les pages à explorer en priorité et la fréquence à laquelle ils doivent les explorer à nouveau.
Si certaines pages de votre site Web sont importantes et changent fréquemment, ces attributs peuvent être utilisés pour que Google les explore plus souvent et que la version la plus récente soit représentée dans son index.
Le fait de disposer d’un plan de site XML et de le soumettre aux principaux moteurs de recherche est excellent pour le référencement et constitue une bonne pratique courante chez les spécialistes du marketing.
Avoir un sitemap – et le soumettre à Google – est une pratique qui ne peut qu’être bénéfique pour votre site et pour laquelle vous ne serez jamais pénalisé (confirmé par Google).
Si vous utilisez beaucoup d’images et de vidéos, vous pouvez créer et soumettre des sitemaps spécifiques pour celles-ci également. Cela peut contribuer à améliorer la visibilité dans les recherches d’images et de vidéos, tout en offrant la possibilité de soumettre des informations supplémentaires sur ces fichiers.
Le plan du site d’une vidéo peut inclure la durée de la vidéo, la catégorie et le classement par âge, tandis que le plan du site d’une image peut inclure le sujet, le type et la licence.
Note : pensez aussi à renseigner le fichier robots.txt, qui contient des commandes pour les robots d’indexation des moteurs de recherche !
Si toutes vos pages sont correctement liées, les robots d’exploration des moteurs de recherche seront généralement en mesure de les découvrir sans sitemap. Mais en ajoutant des informations supplémentaires dans un plan de site, vous aidez les robots d’exploration à accroître leur efficacité et à découvrir les modifications plus rapidement qu’ils ne le feraient autrement.
Les robots d’exploration des moteurs de recherche n’explorent pas chaque page de votre site web à chaque fois qu’ils le visitent. Si vous ne fournissez pas d’informations sur les pages les plus importantes à explorer, il faudra souvent du temps pour que les modifications soient découvertes.
Bien que tous les sites Web doivent disposer d’un plan de site, les sites qui répondent à l’un de ces quatre critères bénéficieront des améliorations les plus significatives :
Chaque site Web dispose d’un budget de crawl (ou d’exploration) limité et, dans le cas de sites très volumineux, cela signifie qu’il peut s’écouler beaucoup de temps avant que le robot d’exploration ne trouve les URL nouvellement mises à jour ou créées.
En indiquant une date de dernière modification dans le plan du site, vous pouvez faire en sorte que les robots d’exploration ne négligent pas les pages récemment mises à jour.
Si votre sitemap fait plus de 50 Mo ou contient plus de 50 000 URL, Google ne l’acceptera pas. Dans ce cas, vous devrez diviser votre sitemap en plusieurs sitemaps et les télécharger individuellement. Vous pouvez également créer un fichier d’index sitemap contenant des liens vers les différents sitemaps.
Si certaines parties de votre site Web ne sont pas correctement reliées à votre site, il est possible que les moteurs de recherche négligent ces pages et ne les placent pas dans leur index. Cela peut être le cas si vous avez de vieilles archives de contenu ou des pages orphelines sur votre site web.
Les robots d’exploration des moteurs de recherche découvrent le contenu sur l’internet en suivant les liens d’une page à l’autre. Si votre site Web ne comporte que peu de backlinks externes provenant d’autres sites Web, il se peut que les moteurs de recherche ne le découvrent pas du tout.
Si votre site Web utilise Google News ou d’autres contenus rich média dans les moteurs de recherche, les informations supplémentaires contenues dans votre sitemap peuvent être utilisées pour améliorer votre contenu.
Certains CMS peuvent générer automatiquement des sitemaps XML. Par exemple, si vous utilisez WordPress, le plugin Yoast SEO est un excellent outil à utiliser. Screaming Frog et XML-sitemaps.com sont d’autres outils gratuits que vous pouvez utiliser pour générer des sitemaps XML.
N’oubliez pas de soumettre votre sitemap XML à Google :
Et voilà, c’est simple comme bonjour !
Pour en savoir plus sur l’utilité du sitemap en SEO, notre équipe vous propose une formation sur le référencement naturel pour détailler le sujet.
Le plus facile et rapide est de placer le fichier sitemap à la racine de votre site Web. Par exemple : à l’adresse “http://www.example.com/sitemap.xml”.
L’emplacement du fichier est important, car les URL soumises doivent commencer par le même chemin que le plan du site.
En d’autres termes, si votre plan du site est présent dans un sous-dossier (par exemple, http://www.exemple.com/sousdossier/sitemap.xml), vous ne pouvez ajouter que des URL faisant partie du chemin d’accès à http://www.exemple.com/sousdossier/.
Cela ne fonctionnera pas si vous soumettez des URL qui se trouvent :
Il n’y a aucune obligation concernant le nom du fichier ou l’extension du fichier (.xml), alors n’hésitez pas à l’appeler comme vous le souhaitez, tant qu’il est accessible et peut être soumis aux moteurs de recherche.
Vous vous posez d’autres questions ou vous ne savez pas comment réaliser votre sitemap ou plan de site ? Besoin d’organiser votre arborescence web ? Boost Your Web, votre agence SEO à Saint-Nazaire vous accompagne, contactez-nous !