[...]
Pour obtenir une matrice de liens étant irréductible, stochastique, et possédant un unique vecteur propre, Larry Page et Sergeï Brin ont eu l'idée de rajouter une probabilité de tomber sur une page web grâce à un surfeur aléatoire. Si on imagine un internaute qui se promène sur le web, la personne aura deux possibilités pour accéder à une page web : soit de cliquer sur un lien pointant vers cette page, soit d'écrire l'adresse dans son navigateur. C'est grâce à ce modèle que la matrice de Google est aussi efficace.
On considère la probabilité [...] de ne pas suivre de lien, et donc de se transporter de manière équiprobable vers une page parmi l'ensemble des pages. Par conséquent, la probabilité de suivre un lien sera de (1 - [...]). Cette probabilité est fixée par Google, et est généralement égale à 0,15.
Suite à cela, on déduit la matrice Google G : [...]
Il faut donc itérer la multiplication de G par le vecteur [...] pour obtenir une valeur qui va tendre vers le vecteur propre de la matrice. On peut choisir n'importe quel vecteur de norme 1, car dans tous les cas, le résultat tend vers ce même vecteur propre.
On peut aussi ajouter que le choix du paramètre [...] influence grandement la vitesse de convergence de la méthode de la puissance. Si on augmente la valeur de [...], la convergence va se faire plus lentement.
Au final, l'algorithme n'est pas extrêmement compliqué, puisqu'il consiste à effectuer des multiplications successives grâce à une boucle while. La condition de l'itération correspond à la norme de la différence entre vk+1 et vk. Nous avons choisi une valeur très petite pour avoir une bonne précision (...)
[...] Notre travail consiste à trouver la façon dont Google classe ses résultats de manière à afficher en premier les plus pertinents d'entre eux, grâce à sa technologie PageRank développée par Larry Page et Sergey Brin. Pour cela, nous allons utiliser des outils mathématiques, notamment en algèbre et en probabilité, mais aussi de la programmation Principe : Afin de comprendre les méthodes d'analyse et de classement des pages effectués par Google nous avons utilisé un exemple d'un groupe de pages Web liées entre elles par des liens. [...]
[...] On obtient alors : Pour cette matrice l'indice μj peut être calculé grâce à la relation : ai , j µj= 8 i i 1 ai , j 18 ai , p i 1 p 1 On obtient les valeurs qu'on compare avec μgoogle : j μj μgoogle On remarque qu'on est encore loin de μgoogle Avec cette méthode, on fait confiance aux internautes, car les résultats sont classés en fonction du nombre de liens pointant vers la page concernée. Les internautes ont donc une grande influence sur le classement des pages, s'il n'est pas faussé . En effet, on pourrait biaiser ce classement en créant des pages ou des sites contenant des liens pointant vers une page qu'on désire mieux classer. Ou demander d'insérer ce lien dans d'autres sites II- Comptage pondéré des liens : En partant de la matrice on pondère chaque lien i j par où le nombre de liens qui partent. [...]
[...] En effet, nous n'avions pas pensé à établir un plan détaillé à suivre au long du projet, ce qui a peut être été la cause des difficultés rencontrées. Il nous a également aidé à gérer le travail en groupe qui diffère de celui des études Pour conclure, nous pouvons dire que ce projet nous a amené à découvrir le secret le mieux caché du célèbre moteur de recherche Google. Grâce à une bonne méthode d'avancement, nous avons pu analyser et comprendre d'où provient la formule utilisée par Google pour calculer l'indice d'une page. [...]
[...] On peut choisir n'importe quel vecteur de norme car dans tous les cas, le résultat tend vers ce même vecteur propre. On peut aussi ajouter que le choix du paramètre α influence grandement la vitesse de convergence de la méthode de la puissance. Si on augmente la valeur de α, la convergence va se faire plus lentement. Au final, l'algorithme n'est pas extrêmement compliqué, puisqu'il consiste à effectuer des multiplications successives grâce à une boucle while. La condition de l'itération correspond à la norme de la différence entre vk+1 et vk. [...]
[...] Malgré le fait que nous n'ayons pas pu appliquer cette technique sur une page web, nous avons compris le fonctionnement du PageRank. Nous nous sommes rendu compte que le succès d'une des firmes les plus riches au monde est basé sur un simple calcul De plus, cette expérience nous sera sans doute très utile dans l'avenir, puisque nous serons amenés en tant qu'ingénieurs à participer ou même à mener des projets, c'est donc une très bonne initiation dans le sens où l'on apprend à gérer les difficultés, même si dans l'avenir elles ne seront pas de la même taille. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture