D’après une étude récente, la moitié des 7.000 langues parlées dans le monde aura disparu d’ici à la fin du siècle. Un laboratoire du CNRS, la collection Pangloss, a entrepris de les recenser et de les collecter dans le cadre d’une vaste bibliothèque sonore
Voici ce qu’indique France Culture qui évoque cette étude : « Comme le rappelle Yann Verdo dans Les Echos.fr, « la moitié des 7,8 milliards d’habitants de la planète s’expriment ou communiquent par le truchement d’une vingtaine d’entre elles (anglais, arabe, espagnol, français, hindi, mandarin, portugais…), alors que 97 % de ces 7.000 idiomes se partagent un nombre total de locuteurs ne dépassant pas 4 % de la population mondiale ». Parmi ces milliers de langues rares, l’écrasante majorité n’a pas d’écriture, ce qui rend l’entreprise de bibliothèque sonore particulièrement salvatrice. La collection Pangloss « contient désormais plus de 3.600 enregistrements audio ou vidéo en 170 langues, dont près de la moitié sont transcrits et annotés ». Pour cela, les linguistes utilisent aussi l’intelligence artificielle, qui a fait de grands progrès dans le traitement des langues »
Pangloss : Une archive ouverte pour la sauvegarde du patrimoine linguistique mondial
La collection Pangloss rassemble des enregistrements de langues rares. Les documents que le visiteurs peut librement consulter (et télécharger) sont le fruit du travail patient de linguistes professionnels qui œuvrent à la collecte, l’étude et la sauvegarde d’un patrimoine linguistique mondial. Cette tâche présente un caractère d’urgence, car la diversité des langues connaît un déclin rapide, parallèle au déclin de la biodiversité.
Dans le cas le plus typique, la langue est étudiée sur le terrain, là où elle coule de source : dans son contexte géographique et social. On pourrait dire, détournant le mot du dialectologue selon lequel chaque mot a son histoire particulière (Jaberg 1908: 6), que chaque document hébergé dans la collection Pangloss a son histoire. Il naît d’une rencontre entre le visiteur-enquêteur et l’auteur du document (le locuteur), dans le cadre de relations de collaboration qui s’étendent souvent sur de nombreuses années. Ainsi, Georges Dumézil désignait le dernier locuteur de la langue oubykh, dont on peut écouter la voix dans la collection Pangloss, comme « mon maître et ami Tevfik Esenç ».
La collection Pangloss est le fruit de plus de vingt ans de travaux de chercheurs et d’ingénieurs spécialisés du CNRS. Elle s’agrandit au fil des ans, par des contributions provenant de centres de recherche français et de leurs partenaires dans de nombreux lieux dans le monde.
En 2020, la collection contient environ 780 heures d’écoute dans plus de 170 langues. Environ la moitié des enregistrements (1530 sur 3600) sont transcrits et annotés, permettant à tous les auditeurs de comprendre ce qu’ils écoutent. Le choix des langues de traduction utilisées est laissé à l’appréciation des déposants. Si vous souhaitez proposer une traduction supplémentaire (par exemple, traduire en français l’histoire oubykh La chèvre et le mouton, qui n’a pour l’instant qu’une traduction en anglais), nous vous encourageons à nous contacter. Toutes les contributions sont mentionnées dans la fiche du document (ses métadonnées).
Crédit photo : DR
[cc] Breizh-info.com, 2021, dépêches libres de copie et de diffusion sous réserve de mention et de lien vers la source d’origine