L’indexation est la phase au cours de laquelle le moteur de recherche recueille, analyse et stocke les données pour faciliter la recherche rapide et précise d’informations par les internautes.
La conception de l’index du moteur de recherche intègre des concepts interdisciplinaires issus de la linguistique, de la psychologie cognitive, des mathématiques et de l’informatique.
Les noms alternatifs pour le processus d’indexation dans le contexte des moteurs de recherche conçus pour trouver des pages web sur Internet sont l’indexation web ou l’indexation dans les moteurs de recherche.
Les moteurs de recherche utilisent des crawlers automatique pour trouver des pages web à indexer.
Si un site n’est pas indexé, il ne peut pas apparaître dans les résultats de recherche.
L’indexation est donc la première et la plus importante opération que les moteurs de recherche effectuent afin de pouvoir transmettre les résultats dans leurs pages de résultats de recherche, appelées SERP.
Cependant, il ne faut pas les confondre avec le positionnement ou l’optimisation.
En fait, si une page est indexée, cela signifie que le moteur de recherche connaît son existence, mais cela ne garantit pas qu’elle obtienne un bon classement.
Les moteurs populaires (comme Google) se concentrent uniquement sur l’ »indexation en texte intégral », c’est-à-dire qu’ils lisent le contenu textuel des pages web.
Avant l’avènement de cette technologie, qui a commencé à se consolider au milieu des années 1990, l’indexation était uniquement basée sur des mots-clés insérés dans des métabalises (telles que les balises de titre et les méta descriptions), des données insérées dans un code HTML créé spécifiquement pour fournir des informations sur les pages aux moteurs de recherche.
Aujourd’hui, ces métadonnées, grâce à l’ »indexation en texte intégral », ont perdu de leur importance au profit des contenus présents sur la page, qui sont la véritable valeur d’un site pour les moteurs de recherche, ainsi que pour les êtres humains.