La présente étude tend à comparer cinq logiciels d'étiquetage. Les logiciels en question sont Xerox, Pilaf, Connexor, IOTA et Engtwol. Je me suis permis d'attribuer deux notes (regroupées en une note globale) à chacun de ces programmes, afin de mettre en évidence ceux que j'ai perçus comme étant, selon moi, les meilleurs ou les moins bons outils.
Le logiciel IOTA n'a pu être étudié qu'en surface, car il ne fonctionnait pas, ce qui explique qu'il n'ait pas été noté. Engtwol, quant à lui, a été étudié à part, car, s'agissant d'un logiciel anglais, il ne pouvait subir la même étude que les programmes acceptant la langue française.
La notation concernant la présentation générale est attribuée d'un point de vue global et est donc arbitraire.
La notation concernant l'étude est, elle, basée sur un barème :
- 0 point : ne fonctionne pas ; réponse fausse ; pas de réponse.
- 0.5 point : fonctionne partiellement ; réponse incomplète.
- 1 point : fonctionne correctement ; réponse judicieuse.
Pour n'avoir pas subi la même étude que les autres logiciels, Engtwol ne suit pas ce barème et sa note est donnée d'un point de vue global.
[...] - Il n'y a visiblement pas de limites dans le nombre de requêtes possibles. En revanche, l'accessibilité par moteur de recherche est difficile. Le seul gros problème rencontré concerne l'encodage des caractères, celui- ci étant probablement lié uniquement à la version de démonstration et non à la version d'achat. Néanmoins, l'étude s'en est trouvée affectée. PILAF (13/20) Le logiciel Pilaf a été développé dans les années 80 et trouve ses fondements théoriques dans la thèse d'état de Jacques Courtin, publiée en 1977 à l'université Joseph Fourier (Grenoble 1). [...]
[...] better "good" A CMP "well" ADV CMP "better" V PRES -SG3 VFIN @+FMAINV "better" V INF "better" V IMP VFIN @+FMAINV "better" V SUBJUNCTIVE VFIN @+FMAINV Ici, le logiciel donne des précisions concernant la nature du mot better en précisant qu'il peut s'agir des formes comparatives de l'adjectif good ou de l'adverbe well On apprend également qu'il peut s'agir du verbe to better améliorer mais qu'il s'agit là d'une forme rarement employée. Ainsi, bien qu'il soit regrettable de ne pas pouvoir faire d'étude plus poussée (phrases complètes), on peut constater que Engtwol a un dictionnaire bien conçu et complet, qui propose des réponses plutôt riches. En ce qui concerne les caractéristiques propres à la version de démonstration, on remarque s'un lien e-mail pour joindre la webmestre est disponible. De plus, Engtwol est facilement accessible par moteur de recherche. [...]
[...] Il s'agit ici plutôt d'un analyseur/générateur morphologique que d'un étiqueteur. En effet, la segmentation ne semble pas être son point fort (ne reconnaît pas les dates ou encore les sigles pare exemple) et il ne procède pas à la désambiguïsation (il donne toujours toutes les solutions possibles à une requête). Ainsi dans une phrase simple telle que J'aime les fraises le logiciel considèrera le verbe aimer comme pouvant être ici aux formes indicatives, subjonctives ou impératives. Il ne prend donc pas en compte la syntaxe, alors que celle-ci lui indique, à travers la présence du pronom personnel je qu'il ne peut s'agir d'une forme impérative. [...]
[...] On peut ajouter à ceci qu'elle est très facilement accessible par moteur de recherche. IOTA (Non étudié en profondeur) IOTA a vu le jour au début des années 90, prenant sa source dans la thèse de Mr Patrick Palmer (Etude d'un analyseur de surface de la langue naturelle: application à l'indexation automatique de textes) (Université Joseph Fourier, 1990). L'implémentation actuelle est plus récente et date d'environ 1996, cette version traite le français avec une option pour le vietnamien. (Renseignements fournis par le webmestre). [...]
[...] Concernant cette version de démonstration, on peut souligner l'intérêt de la présence d'un lien mail dans l'interface du programme. En revanche, le site n'est pas facilement accessible par moteur de recherche. De plus, on constate que la dernière mise à jour date de 2002, ce qui aura des répercussions sur les entrées du dictionnaire (les mots entrés ces cinq dernières années dans les dictionnaires, et dont certains font désormais partie du langage courant ne seront sûrement pas reconnus par le programme). [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture