medias

La norme ISO 639-3 codifie toutes les langues connues

Marie Lebert - 31.10.2013

Edition - International - norme ISO - langues - codes


À l'ère numérique, qui dit diffusion dit aussi codification. La norme ISO 639-3 attribue donc un code de trois lettres à 7.500 langues (par exemple « fra » pour le français). Elle est mise à jour en continu, avec une liste officielle publiée une fois par an.

 

 

Alphabet Texture Creator Extended

Filter Forge, CC BY 2.0

 

 

Les débuts

 

La première norme en vigueur ne date pas d'hier puisqu'elle est publiée dès 1967. À l'époque, la norme ISO 639-1 identifie chaque langue sur deux lettres, ce qui paraît largement suffisant.

 

Vingt ans plus tard suit la norme ISO 639-2. Adoptée en 1998, elle identifie cette fois chaque langue au moyen de trois lettres, mais se limite à 400 langues. La norme ISO 639-2 est le résultat de la fusion entre la norme ISO 639-1 (1967) et la norme américaine ANSI Z39.53 (1987), qui regroupe les codes de langues MARC institués lors de l'informatisation massive des catalogues de bibliothèques.

 

Par ailleurs, un autre effort de codification est poursuivi par l'Ethnologue, catalogue encyclopédique de langues vivantes publié par SIL International et devenu une référence en la matière (voir notre actualitté).

 

Dès 1971, l'équipe de l'Ethnologue crée ses propres identifiants de trois lettres pour chaque langue, afin de faciliter leur repérage dans la nouvelle base informatique de l'encyclopédie lancée la même année, avec inclusion de ces identifiants dans l'encyclopédie elle-même à compter de la 10e édition (1984).

 

Les années 2000

 

Arrive l'an 2000. Dans un monde devenu global, la norme ISO 639-2 devient insuffisante avec la codification de 400 langues alors qu'il en existe plusieurs milliers. 

 

En 2002, l'ISO (Organisation internationale de normalisation) invite donc SIL International à plancher sur une nouvelle norme qui harmoniserait les identifiants de la norme ISO 639-2 avec ceux de l'Ethnologue, en y ajoutant les codes des langues mortes utilisés par la Linguist List, une grande liste de diffusion à destination des linguistes.

 

SIL International s'acquitte brillamment de cette tâche, qui fut sans nul doute un véritable casse-tête. Le résultat est la norme ISO 639-3, dont la première version est publiée en 2007. Cette norme attribue un code de trois lettres à 7.500 langues, à savoir l'ensemble des langues de la planète, que celles-ci soient vivantes ou mortes, anciennes ou artificielles, importantes ou minoritaires, écrites ou non écrites.

 

SIL International devient aussi l'organisme responsable de l'enregistrement de nouvelles langues (langues artificielles ou langues minoritaires oubliées jusque-là) et de la gestion du cycle annuel des modifications et mises à jour dans un domaine en évolution constante. 

 

Les versions en cours

 

L'ultime version est la norme ISO 639-3 (2012) qui, entre autres, inclut les langues des signes et les macrolangues. 130 langues des signes sont répertoriées mais, de l'avis de SIL International, la liste est loin d'être exhaustive et d'autres langues des signes mériteraient d'y figurer, avec un travail en cours pour les localiser. Quant aux 60 macrolangues, elles comprennent par exemple l'arabe ou le chinois en tant que systèmes d'écriture communs à plusieurs langues nationales.

 

La norme ISO 639-3 (2013) est presque prête, avec publication sur le web de tous les changements proposés en cours d'année par des particuliers ou des organismes, et possibilité de commentaires pour ou contre tel changement jusqu'au 15 décembre 2013.

 

La norme ISO 639-3 (2014) est déjà en chantier, avec un formulaire permettant de proposer un changement de code pour une langue donnée ou d'inclure un code pour une nouvelle langue.

 

On reste rêveur devant les tableaux alphabétiques des codes ISO 639 toutes versions confondues, qui évoquent un travail immense assez bluffant lorsqu'on pense à l'énergie qu'il a fallu dépenser depuis bientôt cinquante ans (1967-2013) pour mettre tout le monde d'accord par-delà les différences linguistiques, géographiques, politiques et culturelles.