La présente étude tend à comparer cinq logiciels d'étiquetage. Les logiciels en question sont Xerox, Pilaf, Connexor, IOTA et Engtwol.
Je me suis permise d'attribuer deux notes (regroupées en une note globale) à chacun de ces programmes, afin de mettre en évidence ceux que j'ai perçus comme étant, selon moi, les meilleurs ou les moins bons outils.
Le logiciel IOTA n'a pu être étudié qu'en surface car il ne fonctionnait pas, ce qui explique qu'il n'ait pas été noté. Engtwol, quant à lui, a été étudié à part, car, s'agissant d'un logiciel anglais, il ne pouvait subir la même étude que les programmes acceptant la langue française. (...)
[...] Module de désambiguïsation qui permet de réduire tous les choix proposés précédemment. Propose également un module de segmentation qui découpe la phrase en mots. Légendes d'étiquettes pour les différents modules (désambiguïsation, analyse morphologique, segmentation). 14 choix de langues possibles. Possibilité de copier des caractères accentués depuis la page d'accueil. Option permettant d'effacer le texte tapé. PILAF Accessibilité aux légendes d'étiquettes. Présence d'un module de génération (lemmatisation). Possibilité de choisir un encodage. Possibilité de voir apparaître le lemme de chaque terme entré. Interface agréable et claire. [...]
[...] Ainsi, tout ce qui ne s'y trouve pas se retrouve étiqueté comme superclasse (cls). Il s'agit ici plutôt d'un analyseur/générateur morphologique que d'un étiqueteur. En effet, la segmentation ne semble pas être son point fort (ne reconnaît pas les dates ou encore les sigles pare exemple) et il ne procède pas à la désambiguïsation (il donne toujours toutes les solutions possibles à une requête). Ainsi dans une phrase simple telle que J'aime les fraises le logiciel considèrera le verbe aimer comme pouvant être ici aux formes indicatives, subjonctives ou impératives. [...]
[...] Considère qu'il s'agit de dét-nom-vbdét-nom Ne trouve pas d'ambiguïté. Reconnu comme chiffre. L'analyse morphologique liste toutes les possibilités, mais le module de désambiguïsation considère qu'il s'agit du verbe être Reconnu comme chiffre. Reconnu comme chiffre. Ne désambiguïse pas. Considère qu'il peut s'agir du verbe être ou suivre Considère qu'il s'agit du verbe être Résultat / 10 7,5/10 4/10 7,5/10 Engtwol se distingue des autres étiqueteurs étudiés ici de par son acception unique pour la langue anglaise. De plus, il n'autorise que des requêtes mot à mot. [...]
[...] représentation des relations syntaxiques. Peu d'intérêt au mouvement des arbres syntaxiques qui sont plutôt un frein à la compréhension. Présentation en anglais. Résultat /10 4/10 8/10 XEROX Nom composé sans tiret (ex : pomme de terre) Nom propre (ex : Jean) Sigle (ex : SDF) Nom composé avec tiret (ex : aprèsmidi) (masculin et féminin) Mot récemment entré dans les dictionnaires (ex : meuf) Non reconnu comme un nom composé mais comme nom-prép-nom PILAF Non reconnu comme un nom composé. [...]
[...] Ainsi, bien qu'il soit regrettable de ne pas pouvoir faire d'étude plus poussée (phrases complètes), on peut constater que Engtwol a un dictionnaire bien conçu et complet, qui propose des réponses plutôt riches. En ce qui concerne les caractéristiques propres à la version de démonstration, on remarque s'un lien e-mail pour joindre la webmestre est disponible. De plus, Engtwol est facilement accessible par moteur de recherche. Cette version est limitée à 100 mots par jour, ce qui semble assez conséquent. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture