AddThis Social Bookmark Button
| +33(0)4 66 04 06 13

PageRank de Google

Le PageRank de Google : qu'est ce que c'est? à quoi ça sert? Quelques éléments de compréhension de cette mesure de popularité de Google.

 

 

Mesure avancée de la popularité par Google : le PageRank.

Les revenus de Google proviennent de la vente d’espace publicitaire. Il faut donc qu’il ait la meilleure audience possible. Pour cela, Google a fait le pari de présenter aux internautes les résultats de recherche les plus pertinents dans les 5 premières places.

Le PageRank est un des éléments historiques de la mécanique de classement des sites. On peut facilement avoir accès à cette information en installant des extensions (sur FireFox, SEOpen Toolbar par exemple).

Le PageRank est attribué à une page : il n'est pas constant dans tout le site. C'est un indice qui essaye de mesurer la popularité réelle d'une page (échelle de 0 à 10).

Google définit la popularité d'une page par le nombre de liens qui y font référence et par la qualité des pages qui diffusent le lien.

Comment Google produit il cet indice ?

En plusieurs processus distincts, menés parallèlement.

  • Découvertes de liens. Comme évoqué dans l'article "introduction au référencement", des robots parcourent le web, de lien en lien, pour découvrir des pages. Pour chaque page visitée, sont répertoriés dans les index, la liste des liens présents et le nombre de liens de la page.
  • Pondération des liens à priori. Les liens sont qualifiés, les valeurs des liens sont notamment minorées si les sujets de la page de départ et d’arrivée sont différents.
  • Le calcul du PageRank lors d'un processus bâptisé "Google Dance".


Le Page Rank est un calcul itératif réalisé en permanence. Les serveurs se partagent le web par groupes d’adresses IP de telle manière que chaque Dance dure moins de 4 heures. Les index constitués par les robots à un instant T servent de base au calcul : ils sont pris à l’envers c'est-à-dire du point de vue des arrivées des liens, et non des pages de départ :  on connaît donc tous les liens entrants vers une page. Il est alors possible de calculer pour une page donnée ce fameux indice qui fait le bilan de la quantité et qualité des liens qui font référence à notre page.

 

Un exemple fictif de calcul du PageRank

Imaginons le réseau de liens suivants entre 4 pages (de différents sites) : A, B, C,D.

 

exemple de réseau de liens pour le calcul du PageRank

Voici la version simplifiée du calcul (sans prendre en compte des éléments de pondérations sur la qualification des liens). Au début de la Google Dance, tous les PageRank valent 1. Un premier calcul du PageRank a lieu : toutes les pages référencées héritent d’une même quote-part du PageRank de la page mère (ici à 1).

Exemple (ligne 1) : A pointe B et C, ce qui veut dire que B et C héritent chacun de 0.5 points de popularité issu de A.

 

Page A Page B Page C Page D
Page A 0 0.5 0.5 0
Page B 0 0 1 0
Page C 1 0 0 0
Page D 0 0 1 0
Total PR (1) 1 0.5 2.5 0


Une deuxième vague de calcul est ensuite réalisée : les pages héritent du Page Rank calculé lors de la première itération, et non plus de 1 : c'est ce nouveau PageRank qui est distribué aux pages cibles.

 

Page A Page B Page C Page D
Page A (1)
0 0.5 x 1 0.5 x 1 0
Page B (0.5)
0 0 1 x 0.5 0
Page C (2.5)
1 x 2.5 0 0 0
Page D (0) 0 0 1 x 0 0
Total PR2 2.5 0.5 1 0
PR Final 2 0 1 Indéterminé


Les PageRank (ligne PR final du tableau ci-dessus) sont ensuite arrondis.

La page D qui n’a aucun lien pointant vers elle, a un PageRank indéterminé : cette situation est différenciée de celle de la page B qui, elle, dispose de liens mais qui sont trop peu nombreux et/ou de mauvaise qualité pour avoir un PageRank non nul. La page C est celle qui a le plus de liens. Malgré cela, la Page A a un PageRank supérieur : c’est ici la qualité des liens qui profite à la page A. Il vaut mieux avoir un lien depuis C plutôt qu’un lien depuis A, B et D.


Les valeurs prises ici permettent de simplifier l’exemple. Dans les faits, le PageRank prend des valeurs très grandes, réduits par une échelle logarithmique (probablement en base proche de 6) à des nombres de 1 à 10.

formule du PageRank

On en parle dans ces articles...

 
adwords_certified_partner_web_FR

P'tit dej référencement

Actualités

Google rebaptise ses services : Picasa et Blogger
23/01/2012
Dites au revoir à l’appellation de Picasa et Blogger : Google a l'intention de prendre sa retrait...
Google fait le ménage avec les nouveaux changements sur son algorithme
23/01/2012
Vous avez beaucoup de publicités sur votre site ? L'algorithme de Google Recherche va prendre en co...
Nouveauté Google Outils Webmaster
23/12/2011
Google Outils webmaster propose aux développeurs, qui s’intéressent au suivi des résultats de r...
Mise à jour algorithme Google et Caffeine
22/11/2011
La nouveauté de Google d’il y a quelques semaines vient de voir son application avec l’algorith...
Nos clients sont à Nîmes, Alès, Sète, Montpellier, Arles, Avignon, Pont Saint Esprit, Uzès, Lunel, Vendargues, Gard, Hérault, Vaucluse, Bouches du Rhône, Sud de la France, Provence,  Alpilles, Languedoc Roussillon