Un index complet
Tout d’abord, il faut savoir que toutes les informations disponibles sur les pages Web sont répertoriées et organisées dans l’index de recherche de Google.
Cet index est comme une immense bibliothèque rassemblant toutes les informations de tous les sites internet.
Lors de la création de votre site internet, vous indiquez à Google votre Sitemap. Dès que les robots Google explorent les sites, ils recherchent de nouveaux liens vers d’autres pages à découvrir. Google accorde une importance particulière aux nouveaux sites, aux modifications effectuées sur des sites existants, et aux liens qui ne fonctionnent pas (erreur 404, 500 etc…). Google définit alors quels sites sont à explorer, la fréquence de ces explorations et le nombre de pages à explorer pour chaque site. La Search console permet d’indiquer à Google d’explorer de nouveau certaines pages et permet également de demander à Google de ne pas indexer certaines pages.
L’index de Google contient des centaines de milliards de pages et a une taille de plus de 100 000 000 de Gigaoctets, il se compare à l’index que nous trouvons à la fin d’un livre. Cependant, il contient tous les mots de toutes les pages web.
Une réponse instantanée
Il y a tellement d’informations disponibles sur le web, que si elles n’étaient pas triées, il serait impossible de trouver l’information que nous cherchions. C’est pour cela que Google utilise des systèmes de classement. Ils trient les centaines de milliards de pages web de l’index de recherche. Ils vous proposent ensuite les meilleurs résultats, utiles et pertinents en une fraction de seconde.
Ces systèmes de classement sont composés d’un grand nombre d’algorithmes qui prennent en compte :
- les mots clés de votre recherche
- la pertinence et la facilité d’utilisation des pages
- le niveau d’expertise des sources
- votre position
- vos paramètres
La pondération de chaque facteur varie en fonction de la nature de votre requête.
Ex: Pour Google, si vous recherchez un article d’actualité, l’actualisation du contenu a un rôle plus important que si vous recherchiez la définition d’un mot.
Une réponse de plus en plus adaptée
Les internautes veulent une réponse rapide à leurs recherches. Vous souhaitez connaître la météo ? Google affiche les prévisions directement sur la page de recherche. L’utilisateur n’a pas besoin de cliquer sur un lien pour accéder à l’information. Dans la même logique, si vous recherchez “trajet vers la gare de Bordeaux”, il est appréciable d’avoir directement une carte qui s’affiche comportant un itinéraire sur la page de recherche directement. Cette adaptation des recherches est d’autant plus importante sur les appareils mobiles. Porquoi ? Car la bande passante peut être limitée et la navigation entre les pages ralentie.
Ces algorithmes sont constamment étoffés et travaillés par des milliers de chercheurs et de scientifiques afin de développer de nouvelles méthodes de recherche.
Le web évolue sans cesse, toutes les secondes, des centaines de nouvelles pages sont créées. Google réexplore le web en permanence pour indexer ces nouveaux contenus. Suivant les recherches, les résultats doivent être actualisés plus ou moins fréquemment. Si vous recherchez les résultats d’un match de Foot, Google doit effectuer les mises à jour chaque seconde. A contrario, si vous recherchez des informations sur un personnage historique, les résultats peuvent rester les mêmes durant des années.
Google gère plusieurs milliers de milliards de recherches chaque année. 15% des requêtes que Google traite chaque jour sont inédites. Le contrôle qualité continu et un énorme investissement sont nécessaires pour mettre au point ces algorithmes de recherche capables d’afficher les résultats les plus utiles pour toutes ces requêtes.