Corpus de langage oral : formats, conversion, visualisation et interrogation

PFC: Phonologie du Français Comptemporain

Corpus Acquisition Français L2

Corpus Franco-Suédois L1 et L2

Corpus Colaje

 

  1. Membres
  2. Problématique
  3. Actions

1. Membres

Membres rattachés à titre principal
Christophe Parisse (responsable)
Françoise Gadet
Anne Lacheret
Jean-Luc Minel
Colette Noyau

2. Problématique et description

Pour rentabiliser les efforts consentis pour constituer des corpus, il faudrait disposer d’outils qui permettent de les exploiter au mieux, y compris avec des approches pour lesquelles ils n’étaient pas nécessairement conçus à l’origine. Le but principal de l’opération est de créer de tels outils utilisables sur des données de toute langue et qui complètent l’offre logicielle déjà disponible.

3. Actions
Diffusion des techniques: le laboratoire organise des formations (IRCOM, Ecole d'annotation linguistique) et participe à faire  connaître l'utlisation des corpus en linguistique.
 Les outils que nous entendons développer permettront de valoriser les résultats des autres actions du laboratoire. Les outils multi-plateformes (Windows, Macintosh, Linux) développés utiliseront uniquement des logiciels gratuits et « open-source » et seront rendus disponibles à la communauté scientifique sous la même forme, ce qui garantit la possibilité d’extension future. Cette ouverture est également assurée par l’utilisation de codages normalisés (XML et Unicode) sous contrôle de l’expertise de projets comme ORTOLONG et en accord avec IRCOM, et compatibles avec ceux qui sont développés actuellement dans les projets CHILDES et PHON.

  • Vues: 21725
En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies.