Le monde de l'édition > Reportages
L'ebook a 40 ans > 1991 > L'Unicode, système d'encodage universel
Par Marie Lebert, le vendredi 20 mai 2011 à 11:11:04 - 3 commentaires
12
Contrairement à l’ASCII conçu pour l’anglais, avec des variantes pour quelques langues supplémentaires, l’Unicode prend en compte toutes les langues de la planète.
De l’ASCII à l’Unicode
Pour mémoire, le premier système d'encodage informatique est l’ASCII (American Standard Code for Information Interchange), publié en 1968 aux États-Unis par l’American National Standards Institute (ANSI) pour encoder des informations en anglais. Mais le multilinguisme devient bientôt une nécessité vitale. Des variantes de l’ASCII (norme ISO-8859 ou ISO-Latin) prennent en compte d’autres langues en 1985 et dans les années qui suivent. Avec le développement de l’internet, l’échange des données s’internationalise de plus en plus, si bien qu’il n’est plus possible de se limiter à un système d’encodage datant des débuts de l’informatique, même avec ses extensions.
Publié pour la première fois en janvier 1991, l’Unicode est un système d'encodage universel sur 16 bits spécifiant un nombre unique pour chaque caractère (ou idéogramme). Ce nombre est lisible quels que soient la plateforme, le logiciel et la langue utilisés. L’Unicode peut traiter 65.000 caractères uniques et prendre en compte tous les systèmes d’écriture de la planète. À la grande satisfaction des linguistes, il remplace progressivement l’ASCII, avec des variantes UTF-8, UTF-16 et UTF-32 (UTF: Unicode Transformation Format) selon le nombre de bits utilisés pour l’encodage.L'Unicode est maintenu par l'Unicode Consortium et devient une composante des spécifications du World Wide Web Consortium (W3C), fondé en octobre 1994 pour promouvoir le développement du web. L’utilisation de l’Unicode se généralise à partir de 1998, par exemple pour les fichiers texte sous plateforme Windows (Windows NT, Windows 2000, Windows XP et versions suivantes), qui étaient jusque-là en ASCII.
Une tâche énorme
Mais la tâche s’annonce rude. Patrick Rebollar, professeur de français et de littérature française au Japon et modérateur de la liste de diffusion LITOR (littérature et ordinateur), précise en janvier 2000 : « Il s'agit d'abord d'un problème logiciel. Comme on le voit avec Netscape ou Internet Explorer, la possibilité d'affichage multilingue existe. La compatibilité entre ces logiciels et les autres (de la suite Office de Microsoft, par exemple) n'est cependant pas acquise. L'adoption de la table Unicode devrait résoudre une grande partie des problèmes, mais il faut pour cela réécrire la plupart des logiciels, ce à quoi les producteurs de logiciels rechignent du fait de la dépense, pour une rentabilité qui n'est pas évidente car ces logiciels entièrement multilingues intéressent moins de clients que les logiciels de navigation.» (Entretien du NEF)

Luc Dall’Armellina, co-auteur et webmestre d’oVosite, un espace d’écriture hypermédia, écrit en juin 2000 : « Les systèmes d’exploitation se dotent peu à peu des kits de langues et bientôt peut-être de polices de caractères Unicode à même de représenter toutes les langues du monde ; reste que chaque application, du traitement de texte au navigateur web, emboîte ce pas. Les difficultés sont immenses : notre clavier avec ses ± 250 touches avoue ses manques dès lors qu’il faille saisir des Katakana ou Hiragana japonais, pire encore avec la langue chinoise. La grande variété des systèmes d’écriture de par le monde et le nombre de leurs signes font barrage. Mais les écueils culturels ne sont pas moins importants, liés aux codes et modalités de représentation propres à chaque culture ou ethnie. » Un sentiment prémonitoire puisque l’Unicode ne supplantera l’ASCII qu’en 2008.
Notre prochain épisode: 1992 > Les premiers textes électroniques
Copyright © 2011 Marie Lebert
Par Marie Lebert, le vendredi 20 mai 2011 à 11:11:04 - 3 commentaires
Mots clés :
anniversaire -
ebook -
unicode -
encodage
Publié par Didier Misson
Multilingue, UTF... mais pas doué en math !
On parle de 1991, donc ça fait 20 ans et pas 40 ans !...
;-)
Publié par Momohd
Mais non, il s'agit d'un dossier qui reprend toutes les évolutions depuis 40 ans...
Publié par Alex
Certains auteurs s'étant déjà amusés avec l'alphabet classique (comme dans "la Disparition" de Georges Perec), j'ai pour ma part rendu hommage à cet encodage et tenté crânement une blague en Unicode dès la première page de mon roman (qui heureusement est une parodie) : http://www.garypower.fr/lecture_en_ligne.html
Publier un commentaire
Reportages
"Bob Stein : lecture, écriture, 'Il nous faut construire un écosystème neuf'"
Penseur - panseur - de l'édition numérique
Interviews
"Nicci French : « Si on commence à se sentir en sécurité, il est temps d'arrêter »"
Pour la sortie de Lundi Mélancolie, Nicci French laisse pénétrer une intimité du double, de la fragilité et de la solitude. Avec ce qu'il faut d'humour.
Interviews
""Satellite Sisters est mon premier vrai thriller de science-fiction" (Maurice G. Dantec)"
Le retour d'un grand auteur
Interviews
"Jean-Daniel Magnin : "Je suis passionné par la question du monstre""
L'homme qui voulait écrire Matrix sans le voir...
Précédentes Suivantes
Suivez-nous
Actus
Société
Plantu met en vente des dessins originaux pour son association Cartooning for Peace
Une vente aux enchères organisée par la maison Piasa.
Acteurs numériques
Des ebooks dans les Lumia 900 et 610 de Nokia, avec Numilog
Avec, à la clef, 50 000 titres en français.
Scolarité France
L'Education nationale va rendre publics 17 rapports maintenus cachés
De la transparence.
Société
Disparition de la romancière Muriel Cerf
Une grande voyageuse qui s'en va.
Comics
Urban Comics réédite V pour Vendetta
Une façon de faire mieux connaître l'original.
Communiqué
Dédicaces - Dimanche 3 juin 2012 à 17h00 - A la librairie Rencontre-Signature avec Nejib pour Haddon Hall : quand...
Profitez d'un vaste réseau de diffusion pour communiquer sur votre actualité, vos événements et vos parutions !
En savoir +
Sondage


























Réactions