L’indexation d’une page web
L’indexation d’une page web

L’indexation d’une page web

Mes pages ne sont pas indexées, Horreur !

Comment de simples robots sont capables de détecter la valeur ajoutée de vos pages web ? Mais au fond qu’est-ce que ça veut dire l’indexation ? Et pourquoi parfois certaines pages ne sont pas indexées ?

L’indexation d’une page est stratégique !    

Indexer les pages d’un site internet c’est retrouver l’URL d’une image ou d’une page, dans un index de recherche. Dans le e-marketing, le moteur de recherche est le point d’ancrage ou est répertorié l’ensemble des urls dans un index. Et l’index de Google c’est la somme de toutes ces urls. Imaginez un grand répertoire qui rassemble la liste de toutes les pages web. Aujourd’hui, la taille de l’index de Google est estimée à plus de 130 000 milliards d’URL. En effet, il y a du monde !

Vous pouvez les retrouver sous différentes catégories : image, texte, vidéo, etc.

Et bien sûr, nous évoquons encore Google comme le moteur de recherche référent.  Malgré les nombreux concurrents qui existent sur le marché, pour en citer quelques-uns : Ecosia, Duckduckgo, Bing, Yahoo et Qwant, Google reste leader sur le marché.

La Russie quant à elle à son propre moteur de recherche : Yandex ainsi que la Chine, avec Baïdu.

Aujourd’hui, pour être bien indexé, il faut suivre les règles régies par le robot d’indexation. Lors de cette exploration, ce dernier s’intéresse au contenu de vos pages comprenant : le fichier HTML, le fichier CSS, les photos et vidéos. Les critères de pertinence peuvent évoluer d’un pays à un autre par rapport à la volonté d’un groupe, d’une personne ou d’une volonté politique.

Les problèmes d’indexations peuvent être multiples

  • Le contenu de votre site internet est inexistant. Vous avez créé un site fantôme.  C’est à dire ? C’est simplement un terme d’argot donné pour un site Web qui reste en ligne, mais qui n’est plus mis à jour ou maintenu.
  • L’index de votre site internet (sitemaps) n’est pas déclaré dans la Search Console
  • Le fichier robot.txt bloque certaines urls
  • Il y a des problèmes de redirections (permanentes ou temporaires) qui donnent des informations contradictoires aux robots. 
  • Un fichier d’accès « htacess » bloque le site

Bref tout un panel de problème qui en déroute plus d’un. 

Htaccess qu’est-ce que c’est ? 

C’est tout simplement un fichier de configuration de base de votre site web. Et le serveur web dont il se retrouve configuré lui donne des directives : Go or no to Go ! C’est Oui, ou bien c’est non. 

Du coup, si y a des restrictions d’accès à des pages web, c’est donc logique que certains robots ne puissent pas aller au bout de leurs missions. C’est pourquoi l’indexation ne peut pas se faire.

     Pour la petite histoire du logiciel Apache

Le logiciel Apache est considéré comme un petit ancêtre du web. Né en 1995, il est considéré aujourd’hui comme le serveur plus ancien et le plus viable. C’est un exemple de serveur, mais y en a d’autres.

En résumé, Apache est un logiciel de serveur web qui stocke les fichiers composant un site web. Le second le plus populaire dans le milieu de l’entreprise du web est : Nginx (prononcez « moteur-x »). Chacun a des avantages et des inconvénients, mais entre eux, ne sont pas des concurrents directs. Nginx par exemple est beaucoup plus performant pour gérer un gros de connexions simultanées.

Enfin, sans aller dans les détails, vous pouvez lire d’autres informations à ce sujet sur le lien de Kinsta « nginx-vs apache »

Et si on revenait sur l’indexation ?

Le sujet de l’indexation est tellement vaste, qu’il est nécessaire de rappeler la valeur d’un contenu bien structurer pour être visible rapidement sur le web.

Reprenons donc le sujet de l’indexation.

Pour indexer une page, le robot doit parcourir le contenu de votre site. Il inspecte le code de la balise. Il analyse la structure sémantique de cette dernière. 

« Une balise sémantique est une balise HTML qui apporte une indication sur le contenu d’une page web. ».

Par exemple : tu peux préciser si votre titre est un titre d’ordre premier ou secondaire. Ce sont les fameux « titre 1 » ou « titre 2 » et en anglais « head 1 » ou « head 2). Ce qui nous ramène à l’abréviation : H1, H2, etc.  Ce sont des termes connus dans les champs d’optimisation d’une page sur les moteurs de recherche (communément appelé le référencement naturel (SEO)) 

Toute histoire à son titre principal

Comme dans une histoire, chaque page de votre site internet doit avoir un titre principal (H1). Cette information est un indicateur parmi beaucoup d’autres qui aide le robot à donner un ordre d’importance à votre contenu. 

Ne confondez pas le crawl ou le scroll 

La saviez-vous, en marketing nous utilisons beaucoup de terme en anglais. Notamment le mot « le crawl ». De ce fait, ce n’est pas seulement une nage, mais un terme qui veut dire « explorer ». C’est l’exploration par le robot du moteur de recherche qui parcoure l’ensemble des liens de votre site internet.

Tandis que le scroll c’est lorsque vous naviguez sur une page et que vous faites défiler sous vos yeux des images et du texte à n’en plus finir. Nous parlons du « scroll infini » ou bien en anglais « l’infinite scroll ». Ce petit effet peut améliorer l’expérience utilisateur. En revanche, pour l’optimisation de vos pages (temps de chargement), ce n’est pas forcément la meilleure stratégie à adopter.

Au final, si votre page apparaît dans les premières positions c’est que le résultat du contenu est évalué intéressante.

L’indexation, intéressante pour qui ? 

Pour votre client, il faut répondre à ses besoins à lui. Souvent, nous parlons technique et le client s’en fiche. Le résultat seul compte. Sauf pour les Geeks et les avertis. 

Indexer votre site internet n’intéresse pas le client final. En revanche être visible sur les moteurs de recherche : OUI ! Et du coup, le pont entre la technique et le besoin se fait naturellement. 

Il y a des étapes indispensables pour l’indexation d’un site web

D’abord, avertissez Google que votre site est disponible et en ligne.

Pour cela, vérifier que l’index de l’ensemble des urls de votre site internet est bien fait.

Tapez déjà dans l’URL du moteur de recherche les termes suivants :  site:url-devotre-site-internet. Dans le résultat des recherches, il y aura le nombre de pages indexées dans le moteur de recherche. 

  • Ensuite, structurer votre contenu pour aider le robot Google à comprendre votre page. 
  • Et enfin, si vous souhaitez être visible sur le mobile, pensez ergonomie afin d’avoir vos pages indexées sur les portables.

N’hésitez pas à nous laisser un commentaire dans l’article.   

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

LinkedIn
Instagram