Informatique, message informatique, caractère informatique, nombre associé, ASCII American Standard Code for Information Interchange, code de caractère, tabulation, ISO-8859-1, caractère accentué, latin-1, Alphabet, interopérabilité, codage UTF-8, page web, représentation informatique, Windows, octet, compatibilité immédiate, Unicode
Lorsqu'on souhaite transmettre un message sous une forme numérique, on doit commencer par s'accorder sur la correspondance à respecter entre les caractères (A, 9, é, € ...) et les nombres qu'on leur associe (65, 57 ...). Plusieurs normes ont été définies par le passé, afin de faciliter les échanges.
[...] Voici la table de codage à suivre pour coder un caractère Unicode en UTF-8. Remarque Le nombre d'octets utilisés (de 1 à dans le codage UTF-8 est déterminé par le nombre de bits à 1 écrits tout à gauche dans le premier octet. • • • • Si Si Si Si le le le le premier premier premier premier octet octet octet octet est est est est de la forme 0xxxxxxx alors le codage est sur 1 octet. de la forme 110xxxxx alors le codage est sur 2 octets. [...]
[...] ISO-8859-1 Comme le code ASCII n'intègre pas de caractères accentués, celui-ci a été étendu à 256 codes pour donner naissance entre autres à l'ISO-8859-1 qui contient les principaux caractères accentués d'Europe occidentale, tout en restant compatible avec l'ASCII. L'ISO-8859-1 est aussi appelé latin1. C'est le codage initialement utilisé pour le Web. Unicode Les codages ISO-8859 ont été multipliés pour intégrer d'autres alphabets ainsi que d'autres caractères comme le symbole euro € (ISO-8859-15, dit latin9), mais ont entraîné une incompatibilité de codage. [...]
[...] Ceci assure une compatibilité totale avec l'ASCII. Le symbole euro € est quant à lui référencé sous le numéro 8364 (20AC en hexadécimal) et a pour code Unicode : U+20AC. Ce symbole peut être utilisé directement dans une page web par la notation €. Un problème demeure cependant, celui du codage du numéro : comment 8364 doit il être représenté informatiquement dans des ordinateurs manipulant des octets. Plusieurs choix ont été rendus possibles : sur Windows par exemple on emploie souvent le codage UTF-16 LE qui consiste en un codage sur 2 ou 4 octets (suivant la taille du nombre à coder), sur Linux et sur le Web on emploie le codage UTF-8 qui consiste en un codage sur ou 4 octets. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture