KorA

KorA

Le projet Korpusiñ asambl (KorA) est d’abord une thèse effectuée par Ronan Stéphan, sous la direction de Marie Varin et moi-même, au sein de l’unité de recherche LIDILE (école doctorale ÉLICC), depuis octobre 2020.

Titre de la thèse : Korpusiñ asambl. Application de traitement collaboratif de corpus. Intérêt et applications linguistico-didactiques, linguistiques et traductologiques


Résumé de la thèse :

Tout locuteur apprend sa langue maternelle, ou les langues de ses parents et de ses proches, par exposition permanente au langage naturel, en contexte. Les corpus, définis comme de grands ensembles de données linguistiques, sont utilisés depuis des décennies pour la lexicographie et leurs domaines d’application s’étendent encore avec le développement des outils informatiques. Ils pourraient, avec un outil numérique approprié, être constitués et traités de manière collaborative pour permettre l’exposition d’apprenants à des données linguistiques authentiques.

L’objet du projet KorA sera donc dans un premier temps de mettre en place une interface permettant la constitution de corpus oraux et écrits, ainsi que tous les outils permettant leur traitement : étiquetage morphosyntaxique, reconnaissance optique de caractères, transcription dans la langue des documents oraux, transcription phonétique, traduction. Dans un deuxième temps, il s’agira de démontrer, par des expériences avec des apprenants de breton sur toute une année scolaire, que la participation à ces traitements, dans une optique de partage à la collectivité et avec le soutien des enseignants, aura des retombées bénéfiques sur leur apprentissage de la langue. Si cette utilité est démontrée, la thèse proposera des méthodes pour utiliser l’application avec des apprenants de quelque langue que ce soit. Si elle ne l’est pas, la constitution et le traitement collaboratif de corpus pourront néanmoins rester très importants pour l’archivage et la mise à disposition de ressources linguistiques souvent isolées ou incomplètement traitées, pour la linguistique et, par exemple, la mise en place de l’écriture intuitive.

L’innovation consistera donc à exposer les apprenants à des corpus authentiques pour étudier les adaptations nécessaires, à la fois dans la relation enseignant-apprenant et dans la démarche d’apprentissage, pour que l’exercice soit productif. Il s’agira aussi de permettre aux apprenants d’étudier des variantes non ou moins documentées de quelque langue que ce soit qui, pourtant, répondraient le mieux à leur besoin affectif. En dépassant l’enseignement de type « vertical », l’outil favorisera l’apprentissage collaboratif des langues et sera alors vecteur d’ouverture et de créativité.


Nature du financement : contrat ARED (co-financement région Bretagne, Université Rennes 2)
Obtenu le : 28/09/2020