Dans la foulée de l’engouement pour la linguistique de corpus outillée, le développement récent des humanités numériques détermine de nouveaux usages des données en sciences humaines et sociales. A partir du travail réalisé depuis une dizaine d’années autour d’un grand corpus de français parlé (ESLO - Enquêtes sociolinguistiques à Orléans) et de plusieurs programmes destinés à la diffusion de corpus oraux, j’aborderai les points les plus significatifs d’une démarche de mise à disposition et d’exploitation scientifique de données linguistiques et je proposerai quelques éléments d’un premier bilan.
La plateforme Cocoon (Collections de corpus oraux numériques) permet de diffuser et d’archiver des ressources orales. Nous présenterons les développements récents de la plateforme orientés vers le « Linked Open Data » (LOD) qui place l’interopérabilité des données au niveau sémantique. Ainsi les vocabulaires, ontologies et référentiels disponibles dans différents secteurs permettent aujourd’hui d’envisager de nouvelles pratiques de documentation et les modèles de diffusion des données du LOD ouvrent la porte à de nouvelles organisations pour la gestion de l’information.