Corpus de langage oral : formats, conversion, visualisation et interrogation
PFC: Phonologie du Français Comptemporain
Corpus Acquisition Français L2
Corpus Franco-Suédois L1 et L2
Corpus Colaje
1. Membres
Membres rattachés à titre principal
Christophe Parisse (responsable)
Françoise Gadet
Anne Lacheret
Jean-Luc Minel
Colette Noyau
2. Problématique et description
Pour rentabiliser les efforts consentis pour constituer des corpus, il faudrait disposer d’outils qui permettent de les exploiter au mieux, y compris avec des approches pour lesquelles ils n’étaient pas nécessairement conçus à l’origine. Le but principal de l’opération est de créer de tels outils utilisables sur des données de toute langue et qui complètent l’offre logicielle déjà disponible.
3. Actions
Diffusion des techniques: le laboratoire organise des formations (IRCOM, Ecole d'annotation linguistique) et participe à faire connaître l'utlisation des corpus en linguistique.
Les outils que nous entendons développer permettront de valoriser les résultats des autres actions du laboratoire. Les outils multi-plateformes (Windows, Macintosh, Linux) développés utiliseront uniquement des logiciels gratuits et « open-source » et seront rendus disponibles à la communauté scientifique sous la même forme, ce qui garantit la possibilité d’extension future. Cette ouverture est également assurée par l’utilisation de codages normalisés (XML et Unicode) sous contrôle de l’expertise de projets comme ORTOLONG et en accord avec IRCOM, et compatibles avec ceux qui sont développés actuellement dans les projets CHILDES et PHON.
- Vues: 21725