Avec plus de 3 milliards de documents en ligne (cf. www.google.com) et 20 millions de
nouvelles pages web publiées chaque jour [1], le web est une source d'information de plus en
plus importante. Les nombreux web masters désireux d'attirer et de garder les nouveaux
visiteurs, sont amenés à effectuer des analyses afin de comprendre le comportement de leurs
visiteurs puis, éventuellement, ensuite, concevoir ou repenser au mieux leur site Internet.
Le Web Usage Mining (WUM) consiste à analyser la façon dont un site web est
parcouru et à déterminer des schémas de navigation des utilisateurs afin d'optimiser son
fonctionnement tant d'un point de vue système (meilleur gestion de la mise en mémoire
cache), que d'un point de vue ergonomique (présentation adapté).
Dans une première partie, nous aurons une vision assez large pour voir où se situe le
WUM dans le Web Mining et sur quelles sont les données source de ce processus. Dans une
seconde partie, nous décrirons justement les différentes étapes de ce processus, afin de mieux
en comprendre le fonctionnement. Pour finir, nous verrons dans quels domaines est utilisé le
WUM.
[...] Conclusion Il existe bien d'autres domaines où le WUM est, pourrait être et va être utilisé. La recherche avance dans ce sens. Toutefois, le WUM provoque déjà l'inquiétude d'un certain nombre de personnes. En effet, en s'intéressant d'un peu (trop) près aux comportements de l'utilisateurs, afin de répondre selon son profil, les firmes collètent énormément d'informations de l'ordre privé. Les atteintes à nos vies privées sont à craindre, c'est pourquoi le W3C commence dès à présent à travailler sur le sujet afin de définir des règles à respecter Références principales Doru Tanasa, Brigitte Trousse. [...]
[...] Identifier les robots connus (dont les IP sont listés). Identifier les robot par la vitesse de consultation des pages (Si la consultation est supérieure à 2pages/sec alors il s'agit d'un robot). : Rendre les IP anonymes en utilisant des identifiants. : Identifier l'utilisateur par le couple (Host, User Agent) issu du log. : Regrouper toutes les requêtes d'un même utilisateur pour une même page ou ressources de cette page dans un court laps de temps en une seule requête. : Regrouper en visite (ensemble d'actions d'un utilisateur), l'ensemble des requêtes d'un même utilisateur toutes les minutes. [...]
[...] L'article présente le langage MINT qui repose sur ce principe et utilise aussi des expressions régulières. On voit bien que les méthodes sont nombreuses pour mettre en relief les patterns et règles qui nous intéressent Domaines d'application du WUM Le Web Usage Mining trouve des applications dans de nombreux domaines, mais deux sont essentiellement porteur : l'e-commerce et l'e-learning E-commerce Assez logiquement, là où il y a de l'argent engagé (c'est à dire là où il y a de l'argent à récupérer), la recherche avance. [...]
[...] Jaideep Srivastava, Robert Cooley, Mukund Deshpande, Pang-Ning Tan. Web Usage Mining : Discovery and Applications of Usage Patterns from Web Data Department of Computer Science and Engineering, University of Minnesota, Minneapolis. Osmar R. Zaïane. Web Usage Mining for a better Web-Based Learning Environment. Department of Computing science Edmonton, Alberta, Canada. John Punin, Mukkai Krishnamoorthy, Mohammed Zaki. LOGML XML Language for Web Usage Mining. 10th International World Wide Web Conference 2001. [...]
[...] Web usage mining Mots clés : Web Usage Mining, Données d'usage. Introduction Avec plus de 3 milliards de documents en ligne (cf. www.google.com) et 20 millions de nouvelles pages web publiées chaque jour le web est une source d'information de plus en plus importante. Les nombreux web masters désireux d'attirer et de garder les nouveaux visiteurs, sont amenés à effectuer des analyses afin de comprendre le comportement de leurs visiteurs puis, éventuellement, ensuite, concevoir ou repenser au mieux leur site Internet. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture