The ROSETTA Project | Global Huck

Resources for Endangered Languages Through Translated Texts

About the Project

Out of the world’s 6000+ languages only a small fraction currently enjoys the benefits of modern information technologies. Languages and cultures left behind are called endangered, indigenous, or technologically low-resourced. ROSETTA is a collaborative and interdisciplinary digital humanities research project, between Stanford University and the Université de Lille and funded by the France-Stanford Center for Interdisciplinary Studies. It aims to preserve and sustain knowledge diversity and cultural heritage by combining different disciplines: Information and Communication Science, Computational Linguistics, American Literature, and Translation Studies. Much as the Rosetta stone helped decipher the demotic and hieroglyphic scripts thanks to the presence of the Greek translation, our project intends to preserve contemporary endangered languages and cultures and assist with their survival through existing transnational translated texts.

ROSETTA puts to use extant translated versions of a single text into a number of endangered and low-resourced languages. The project relies on crowdsourcing approaches as well as inclusive, interactive and collaborative user-based approaches for data and information collection. Natural Language Processing methods are then used to generate multilingual knowledge and language resources (corpora, thesauri, dictionaries, etc). During their contribution and exploration, users and scholars will have a contextualized overview about the intercultural and global circulation of a transnational text through an interactive global knowledge map.

A first experiment of ROSETTA uses extant translated versions of a single fictional text — Mark Twain’s Adventures of Huckleberry Finn — into a number of low-resourced languages spanning a period of nearly a century and a half. In the process, users and scholars will have the opportunity to gain insight into the global circulation of a transnational American novel.

"Global Huck” is a literary and cultural historical project out of which ROSETTA grew, and it involves identifying global editions of The Adventures of Huckleberry Finn and having scholars contribute comments about the cultural work that each translation does in specific cultural contexts.

Résumé du Projet

Sur les plus de 6000 langues parlées dans le monde, seulement une petite fraction bénéficie des technologies modernes de l’information. Les langues et cultures délaissées sont appelées indigènes ou en voie de disparition ou encore technologiquement peu dotées. ROSETTA est un projet d’humanité numérique collaboratif et interdisciplinaire qui vise à préserver le patrimoine culturel et à soutenir la diversité de connaissances en combinant plusieurs disciplines : les Sciences de l’Information et la Communication, la Linguistique Computationnelle, la Littérature Américaine et la Traductologie. Tout comme la pierre de Rosette qui a permis le déchiffrement des hiéroglyphes grâce à la présence de la traduction grecque, le projet ROSETTA vise à préserver les langues et cultures menacées de disparition et à les développer grâce à l’existence de supports langagiers traduits.

ROSETTA propose d’utiliser les traductions existantes d’un même texte dans un certain nombre de langues en danger et peu dotées. Le projet se base sur des approches de crowdsourcing ainsi que sur une approche inclusive, interactive et collaborative basée sur la contribution de l’utilisateur pour la collecte de données et d’information. Les méthodes de traitement automatique de la langue permettent ensuite de générer des ressources langagières multilingues (corpus, thésaurus, dictionnaires, etc.). Durant leurs contributions et explorations, les utilisateurs et les experts auront un aperçu contextualisé sur la circulation globale et interculturelle d’un texte transnational à travers une carte globale et interactive de connaissances.

Une première expérimentation a été réalisé en collectant les traductions existantes du roman Adventures of Huckleberry Finn dans un certain nombre de langues en danger et peu dotées couvrant une période de près d’un siècle et demi. Durant le processus, les utilisateurs et les experts pourront contextualiser et explorer la circulation globale et inter-culturelle d’une oeuvre américaine transnationale.

"Global Huck" est un projet historique littéraire et culturel à partir duquel ROSETTA a été établi. Le projet implique l'identification des éditions mondiales du roman Les Aventures de Huckleberry Finn et il permet aux chercheurs de fournir les contextes culturels spécifiques qui enrichissent chaque traduction.

Meet the Team