Dans un monde idéal, il serait à coup sûr très intéressant de pouvoir déterminer avec précision le coût d'étiquetage des documents d'entraînement, le coût de la constitution du corpus d'entraînement et de le minimiser le maximum possible. Sans doute qu'une grande partie du temps consommé pour catégoriser un texte est consacré à sa lecture, puis possiblement à sa relecture. On peut aussi imaginer que la longueur des textes à catégoriser est assez déterminante du temps qui va être requis pour cette activité, et que la vitesse de lecture varie d'une personne à une autre. Une fois cette étape accomplie, il faut déterminer à quelle(s) catégorie(s) ce texte appartient. Au temps de réflexion qui s'impose s'ajoute, si nécessaire, le temps de se référer à la description des catégories et éventuellement de consulter d'autres textes préalablement associés à certaines classes, pour valider la décision (...)
[...] À ce jour, il n'y a aucune catégorisation hiérarchique définie pour les embranchements des adjectifs et des adverbes. Ce déséquilibre potentiellement problématique se retrouve à l'intérieur même des Parseur WordNet 19 2007/2008 Projet d'été ENSI supercatégories, où il est évidemment beaucoup plus apparent dans la branche nominale : certains mots sont ainsi liés à une grande chaîne de concepts finement graduée, tandis que d'autres sont très proche des concepts les plus généraux. En plus la relation d'hyponymie implémentée dans WordNet correspond en fait à plusieurs relations sémantiques distinctes e.g. [...]
[...] Le traitement de la morphologie inflectionnel fait partie de l'interface entre WN et utilisateur. Connaitre la place d'un mot dans ce réseau de relations, c'est connaitre son sens Organisation des mots dans WordNet WordNet est organisé en noms pour 79689 synsets en les divisant en plusieurs hiérarchies : Parseur WordNet 12 2007/2008 Projet d'été ENSI organism, entity, abstraction, psychol. feature, nat. phenomenon, activity, event, group, location, possession, shape, state. Chaque hiérarchie correspond à un champ sémantique distinct mais elles ne sont pas mutuellement exclusives. [...]
[...] Et quel sont les différents symboles pour spécifier les synsets dans un fichier WordNet ? Pour bien analyser cette partie, il est plus commode de traiter l'algorithme extraireDonneeWN qui a pour fonction l'extraction des données WordNet et les stocke dans la mémoire. Cette méthode appartient à la classe ExtractionDonneeWN qui n'a aucun paramètre en entrée et elle retourne une variable de type FichierWN. Parseur WordNet 22 2007/2008 Projet d'été ENSI 2.3 Les sens dans le fichier WordNet Dans le fichier WordNet les senses sont traité es après l'autre. [...]
[...] Le présent rapport se décompose en quatre chapitres. Dans ce qui suit, on présentera le contenu de chaque chapitre. Le premier chapitre, qui s'intitule étude et analyse de WordNet, on y présentera une définition de ce concept et comment il est organisé. Le second chapitre sera consacré pour l'étude et l'analyse d'un fichier résultat WordNet et sa structure. Parseur WordNet 7 2007/2008 Projet d'été ENSI Le troisième chapitre, sera réservé à la spécification et à la conception de la méthode d'extraction des données. [...]
[...] Des différences de comportement syntaxique peuvent motiver la division d'un arbre en plusieurs sous-arbres. Exemple: a. John wove the wool into a rug. BUILD Parseur WordNet 17 2007/2008 Projet d'été ENSI b. John wove a rug from the wool. c. She composed a quartet out of the song. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture