Accès au corpus


Au sein de l’équipe des cinq universités partenaires, Lyon (Carole Etienne et Justine Lascar) et Freiburg (Daniel Alcón, Marie Skrovec et Camille Martinez) ont été responsables du traitement des données linguistiques pour les banques de données CLAPI (responsable : C. Etienne) et MOCA (responsable : D. Alcón). Ils ont, entre autre,

Le projet a commencé en janvier 2009 et la banque de données a été publiée en 2018.

Le projet a bénéficié d’un soutien de départ (370.000 €) dans le cadre d’un programme conjoint de l’ANR (France) et de la DFG (Allemagne) qui a permis d’assurer le travail pendant les 4 premières années. Il a ensuite bénéficié des apports ponctuels du Laboratoire ICAR/CNRS Lyon et du Romanisches Seminar/U. Freiburg et des sources de financement que ces deux centres ont pu recueillir.

Le corpus CIEL_F est accessible par les deux bases de données ayant géré l’implémentation du projet.

Chaque base de données offre une interface et des outils de recherche spécifiques, permettant de diversifier les exploitations et les traitements du corpus CIEL_F.

CLAPI

La base de données CLAPI (Corpus de LAngue Parlée en Interaction) est née à Lyon au début des années 2000. Inspirée par une démarche de linguistique interactionnelle et par une pratique de terrain visant à enregistrer des activités interactionnelles informelles et institutionnelles, CLAPI a développé de nombreux outils de recherche semi-automatique, qui, au-delà des collocations, tiennent compte aussi des environnements séquentiels des phénomènes visés et permettent de filtrer les recherches par les descripteurs de corpus.

MOCA

La base de données MOCA (Multimodal Oral Corpora Administration) est née à Freiburg, en collaboration avec VALIBEL, Louvain-la-Neuve au début des années 1990. Inspirée par une double approche prosodique et sociolinguistique et par une pratique de linguistique de corpus des deux universités visant à enregistrer des activités interactionnelles face à face et mediatisées, MOCA a développé de nombreux outils d’archivage et de requête semi-automatique, qui tiennent compte aussi des environnements séquentiels des phénomènes visés et permettent de filtrer les recherches par les descripteurs linguistiques et sociolinguistiques de corpus individualisés.

Corpus Ciel-F (moca3)



ANR | Lyon | Freiburg | DFG