Patirmoine et éducation > Scolarité France > Actualité
Les systèmes d'encodage, de l'ASCII à l'Unicode
Ou comment pouvoir afficher moult langues sur son écran
Par Marie Lebert, le lundi 15 mars 2010 à 14:53:32 - 0 commentaire
12
ASCII
Le premier système d'encodage informatique fut l’ASCII (American standard code for information interchange). Publié en 1968 aux États-Unis par l’American National Standards Institute (ANSI), avec actualisation en 1977 et 1986, l'ASCII est un code standard de 128 caractères traduits en langage binaire sur sept bits (A est traduit par «1000001», B est traduit par «1000010», etc.). Les 128 caractères comprennent 33 caractères de contrôle (qui ne représentent donc pas de symbole écrit) et 95 caractères imprimables: les 26 lettres sans accent en majuscules (A-Z) et minuscules (a-z), les chiffres, les signes de ponctuation et quelques caractères spéciaux, le tout correspondant aux touches du clavier anglophone.
L'ASCII permet uniquement la lecture de l’anglais et du latin. Il ne permet pas de prendre en compte les lettres accentuées présentes dans bon nombre de langues européennes, y compris le français, et à plus forte raison les langues non alphabétiques (chinois, japonais, coréen, etc.). Ceci ne pose pas de problème majeur les premières années, tant que l’échange de fichiers électroniques se limite essentiellement à l’Amérique du Nord. Mais le multilinguisme devient bientôt une nécessité vitale. Des variantes de l’ASCII (norme ISO-8859 ou ISO-Latin) prennent en compte les caractères accentués de quelques langues européennes. La variante pour le français, par exemple, est définie par la norme ISO-8859-1 (ISO-Latin-1).Avec le développement du web dans les années 1990, l’échange des données s’internationalise de plus en plus. On ne peut plus se limiter à l’utilisation de l’anglais et de quelques langues européennes, traduites par un système d’encodage datant de 1968. De plus, le passage de l’ASCII original à ses différentes extensions devient vite un véritable casse-tête, y compris au sein de l’Union européenne, les problèmes étant entre autres la multiplication des variantes, la corruption des données dans les échanges informatiques ou encore l’incompatibilité des systèmes, les pages ne pouvant être affichées que dans une seule langue à la fois.
Unicode
Publié pour la première fois en janvier 1991, l’Unicode est un système d'encodage «universel» sur 16 bits spécifiant un nombre unique pour chaque caractère. Ce nombre est lisible quels que soient la plateforme, le logiciel et la langue utilisés. L’Unicode peut traiter 65.000 caractères uniques et prendre en compte tous les systèmes d’écriture de la planète. À la grande satisfaction des linguistes, il remplace progressivement l’ASCII. L’Unicode se décline en plusieurs variantes en fonction des besoins, par exemple UTF-8, UTF-16 et UTF-32 (UTF: Unicode transformation format). Il devient une composante des spécifications du World Wide Web Consortium (W3C), l'organisme international chargé du développement du web.
L’utilisation de l’Unicode se généralise en 1998, par exemple pour les fichiers texte sous plateforme Windows (Windows NT, Windows 2000, Windows XP et versions suivantes), qui étaient jusque-là en ASCII.
Dix ans plus tard, en 2008, les deux systèmes d'encodage sont également représentés sur l'internet, à savoir 50 % pour les fichiers en ASCII et 50 % pour les fichiers en Unicode.
En 2010, l'Unicode poursuit sa progression avec le vent en poupe, et dépasse désormais l'ASCII, ce qui était bien son but lors de son lancement il y a près de vingt ans, preuve qu'il faut du temps pour toute chose, y compris dans le domaine informatique.
Copyright © 2010 Marie Lebert. Tous droits réservés. Avec diffusion en ligne par ActuaLitté.
Par Marie Lebert, le lundi 15 mars 2010 à 14:53:32 - 0 commentaire
Mots clés :
systèmes -
encodage -
langue -
ASCII
Tribunes
"La campagne Sempé contre la hausse de la TVA se poursuit"
Rappel de la campagne Sempé contre le relèvement de la tva, elle se poursuit et prend une dimension à la mesure des impacts négatifs qui paraissent semaine après semaine.
Reportages
"Numérisation à la BnF : dégradations, retards et scandales"
Dans le cadre d'un marché public, la société Jouve a pris la main pour la numérisation de 70.000 oeuvres chaque année durant trois ans. Mais après quelques mois à peine, la question de la réalisation du marché se pose lourdement...
Reportages
"Pandas et libraires, une histoire de survie pour espèces menacées"
Pour une fois que l'on ne parle pas de moteur de recherche ni d'algorithme avec cette histoire de bestioles...
Reportages
"Réalité Bis : l'intersection entre lecture et écriture interactive"
Réalité [?ea.li.te] : (n.f) Un récit dont vous incarnez le personnage principal, confronté à une succession de choix.
Précédentes Suivantes
Suivez-nous
Communiqué
Enjeux contemporains de la littérature
Jeudi 26 janvier : coup d’envoi des Enjeux contemporains de la littérature organisés par la Maison des écrivains et de la...
Profitez d'un vaste réseau de diffusion pour communiquer sur votre actualité, vos événements et vos parutions !
En savoir +






















Publier un commentaire