On pourrait définir le « Data Mining », en français la prospection de données, de la
façon suivante : Technique d'analyse utilisée pour dénicher des tendances ou des corrélations
cachées parmi des masses de données, ou encore pour détecter des informations stratégiques
ou découvrir de nouvelles connaissances, en s'appuyant sur des méthodes de traitement
statistique (par exemple).
Avec plus de 3 milliards de documents en ligne (cf. www.google.com/), le web est une
source d'information de plus en plus importante. Les web masters désireux d'attirer et de
garder les nouveaux visiteurs sont amenés à effectuer des analyses afin de comprendre le
comportement de leurs visiteurs puis concevoir ou repenser au mieux leur site internet.
Le « Web Usage Mining » (WUM) consiste à analyser la façon dont un site web est
parcouru et à déterminer des schéma de navigation des utilisateurs afin d'optimiser son
fonctionnement tant d'un point de vue système (meilleur gestion de la mise en mémoire
cache), que d'un point de vue ergonomie (présentation adaptée).
J'ai choisi ce thème en espérant ainsi approfondir mes connaissances dans ce domaine
utile à tous créateur de site internet. De plus, l'année dernière j'ai suivi un cours de base de
données à l'Ecole supérieure en Sciences informatiques de Sophia-Antipolis, en France, et
mon enseignant (M. Rueher) nous a vaguement parlé du sujet, puisqu'il s'agit de l'un de ses
sujets de recherche à l'Université Nice Sophia-Antipolis (UNSA), en collaboration avec
l'Institut National de Recherche en Informatique et en Automatique (INRIA).
[...] : Le prétraitement des fichiers logs Web dans le Web Usage Mining multi sites. Doru Tanasa, Brigitte Trousse 2003 Journées Francophones de la Toile Equipe AxIS INRIA Sophia-Antipolis Titre : Auteurs : Date : Réf. : Improving the Effectiveness of a Web Site with Web Usage Mining. Myra Spiliopoulou, Carsten Pohle, Lukas C. Faulstich 1999 Institute of Information Systems, Humboldt-University Berlin Institute of Computer Science, Free university Berlin Titre : Auteur : Date : Réf. : A non-invasive learning approch to building web user profiles. [...]
[...] Critique de l'article : Ce texte est très intéressant car il appuie sa démarche d'analyse sur un fond commerçant En effet, il est intéressant de différencier les utilisateurs d'un site web et également intéressant de différencier leurs chemins de navigation, mais plus intéressant encore de coupler les deux, afin de conduire un utilisateur dont le comportement de navigation laisse penser qu'il ne sera pas client du site à le devenir. Toutefois, on peut regretter que le texte ne présente pas une étude de cas complète, afin de mieux comprendre les subtilités de la méthode, en la mettant en pratique. Revue de littérature Rapport Initial : Web usage mining Texte 3 Identification bibliographique : Titre : Auteurs : Date : Réf. : A non-invasive learning approch to building web user profiles. Philip K. [...]
[...] - Les marques pages : également appelés favoris ils reflètent clairement l'intérêt des utilisateur pour les pages marquées. - Le contenu des pages : généralement les liens présents sur une page que l'on apprécie nous intéressent, et réciproquement, la page en amont des pages qui nous intéressent, nous intéresse également. - Les fichiers logs d'accès : qui permettent de connaître le temps passé par un visiteur sur chaque page. Temps souvent lié à l'intérêt porté, mais parfois aussi influencé par la taille de la page (également connue et dont l'on tiendra compte). [...]
[...] On utilise souvent la notion de co-occurrence pour enrichir sémantiquement un domaine, c'est-àdire que si l'on retrouve fréquemment deux termes (bi-grams) ensemble alors, c'est probablement qu'ils sont liés. L'auteur de l'article ajoute que si l'un des deux termes est présent sans l'autre alors il faut diminuer cette dépendance. L'auteur souligne également que si l'on généralisait le processus de co-occurrence à n termes (n-grams), il serait rapidement d'une trop grande complexité. C'est pourquoi le texte suggère un algorithme d'approximation pour cette étape. [...]
[...] Revue de littérature Rapport Initial : Web usage mining Résumé de l'article : Le processus de WUM est composé de trois étapes principales : prétraitement, fouille des données et analyse de motifs extraits. L'article s'intéresse exclusivement à la première étape : le prétraitement des données provenant des fichiers logs http des serveurs (prétraitement multi sites). Le prétraitement du WUM est un processus complexe et fastidieux car la quantité de données à traiter est grande et que l'on dispose de peu d'informations dans les fichiers logs web. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture