XML TEI définition langage de programmation règles syntaxiques balises
Depuis longtemps, le fait d'annoter des documents dans le but d'en faciliter leur étude s'est répandu. Ce fait consiste à insérer des balises électroniques à des textes. Pour se faire, la norme la plus utilisée de nos jours est celle du SGML, c'est-à-dire du Standard Generalized Markup Language. Chaque utilisateur peut ainsi créer des balises propres à ses besoins (marquer dans un texte des noms de lieu, des dates...) grâce à l'écriture d'une DTD, Définition du Type de Document. Cette dernière se veut adaptée à tout chercheur désirant parcourir des corpus de texte sous forme électronique.
Il existe différents sous ensemble de SGML comme HTML, XML ou bien encore la TEI. Chaque langage possède sa propre spécificité et utilise au maximum les possibilités syntaxiques offertes par SGML. Il s'agit ici de voir plus précisément ce que sont le XML et le TEI par des définitions approfondies et des exemples pertinents.
[...] Celui-ci se fait sur différents logiciels comme XML Copy Editor ou bien encore Oxygen XML Editor (comme pour la TEI). Tout d'abord, il faut savoir qu'à la différence du HTML où celles-ci ne sont pas toujours obligatoires, il doit toujours y avoir en XML une balise fermante en plus de la balise ouvrante. On parle alors d'éléments. Ceux-ci doivent se fermer dans l'ordre où ils ont été ouverts. Le XML commence toujours par l'élément et suit toujours par une balise racine obligatoire qui a pour fonction d'englober le tout du document. [...]
[...] Elles permettent de décrire des éléments de la DTD indépendante grâce à l'option CONCUR. Structure de L'EN-TETE En TEI, tout document conforme se constitue donc de deux parties. La première étant l'en- tête, associée à l'élément . Elle est indispensable lorsque l'utilisateur à une multitude de documents à gérer. Elle permet en effet d'avoir des renseignements sur le document et se compose de quatre grandes sections, comme le montre le schéma suivant. Structure de l'en-tête TEI - L'élément fileDesc : est l'équivalent d'une page de garde. [...]
[...] C'est le seul élément obligatoire de la TeiHeader. - L'élément encodingDesc : décrit la manière dont le texte a été codé en donnant par exemple des informations sur le projet dans lequel s'inscrit l'encodage du texte. - L'élément profileDesc : donne des informations non bibliographiques sur le document comme la langue dans laquelle il est écrit, les sujets dont il traite, la situation dans laquelle il a été produit, etc. - L'élément revisionDesc : décrit de façon précise toutes les modifications apportées au texte. [...]
[...] Cet ensemble se compose de deux modules : la TEI core et la TEI header. - Des balises de base (les base tag sets) : il s'agit ici de six ensembles définis correspondant à de grandes catégories de textes : poésie, théâtre, prose, transcription du discours, dictionnaires et informations terminologiques. On retrouve dans cette catégorie différents modules comme : o TEI.verse : pour le codage des textes poétiques (lignes, strophes, etc.) o TEI.drama : pour le codage des œuvres théâtrales o TEI.prose : pour le codage des textes en prose (paragraphes, chapitres, section, etc.) o TEI.spoken : pour le codage d'interviews ou de discours o TEI.dictionaries : pour le codage des dictionnaires o TEI.terminology : pour le codage des bases terminologiques - Des balises additionnelles (les additional tag sets) : il s'agit ici d'éléments servant à montrer que des actions ont été réalisées sur des documents, quelque soit leur type. [...]
[...] Le XML est également un code à interpréter. Il passe par un interpréteur (navigateur) pour être visualisé. Il interprète alors chronologiquement le code sauf les erreurs, à la différence du compilateur. La DTD permet de vérifier la syntaxe d'un document, son arborescence (nom des balises, leur ordre Si celle-ci est associée au document XML et conforme, nous parlons de document valide. En revanche, lorsqu'un document respecte exclusivement les règles du XML, comme les balises fermées par exemple, nous parlons de document bien formé. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture