Mini-thèse faisant partie d'un mémoire de fin d'études ayant concouru à l'obtention du diplôme d'ingénieur en informatique. Réflexion sur l'amélioration de la pertinence des résultats des moteurs de recherche Web (Google,...).
[...] De plus, l'opération exacte effectuée sur le pageRank calculé pour obtenir le pageRank connu (de 0 à 10) reste secrète. Les résultats les plus proches sont obtenus en appliquant un logarithme à un multiple du pageRank calculé. Figure 19 - Fonctionnement de résultats de recherches Web II.5. Les limites à la pertinence Récemment, sur certains moteurs de recherche dont Google, lorsque vous saisissiez le mot-clé failure de l'anglais signifiant échec, le résultat affiché en première position était la biographie officielle de George W. [...]
[...] Nous nous intéresserons à ceux dont le principe est d'optimiser la pertinence des résultats, à l'exclusion des moteurs de recherche sémantiques. Le travail collaboratif Dans le principe du pageRank, le robot attribue une note de qualité à une page en fonction des liens existants vers cette page. Cela signifie que le classement actuel d'une page repose sur des pages construites par d'autres webmasters, servant ainsi de base d'évaluation de la pertinence. Il est alors possible d'extraire de ce fonctionnement un concept de communauté. [...]
[...] Le principe de la popularité est défini ci-après. Le pageRank se veut être l'unité de mesure de la notoriété d'une page. En principe, il s'agit d'une probabilité, donc d'un nombre entre 0 et 1. C'est par commodité qu'il prend la forme d'un nombre entier jusqu'à 10. Le concept est le suivant : Si une page P1 présente un lien vers une page P2, il est considéré que l'auteur de la page P1 estime que la page P2 est de bonne qualité, ou du moins qu'elle présente un intérêt. [...]
[...] Le pageRank de noté dépend des pageRank de P1 à Pi, donc de Pr(P1), Pr(P2) Pr(Pi). N est le nombre total de pages, et e une constante appelée coefficient d'échappement dont la valeur équivaut généralement à 0,15. Nl(Px) est le nombre de liens vers d'autres pages contenus dans la page Px, ce qui donne : Pr(P) = + x [ + + . + ] PageRank est un bien que chaque page distribue aux pages qu'elle cite : si une page en cite beaucoup, elle ne transmet à chacune qu'une faible partie de sa richesse ; si elle en cite peu, elle les enrichit plus. [...]
[...] Nous appellerons ce temps TemspVisite. IndicePertinence = TempsVisite / TempsLectureComplète Cela signifie que plus le temps passé sur la page se rapproche du temps nécessaire à la lecture totale de celle-ci, plus l'indice de pertinence sera élevé. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture