Étude : Il existe en France une tradition importante d'études sur l'oral [4, 3] qui commence à rencontrer et à s'interfacer avec les études conduites en linguistique formelle [8, 9] dans la perspective à long terme d'une analyse automatique de la langue orale. L'analyse automatique de cette variété de langue pose essentiellement deux problèmes : * un problème d'identification des niveaux d'organisation linguistiques qui contribuent à structurer l'oral (micro-syntaxe, macro-syntaxe, sémantique, pragmatique, micro-prosodie, macro-prosodie) et de leurs interactions. * un problème de segmentation du discours en unités pertinentes. Contrairement à l'écrit où le texte est segmenté par le rédacteur par des marques de ponctuations fortes (et sur lesquelles s'appuient les analyseurs syntaxiques) les discours oraux se présentent a priori comme un flux continu de parole. Il est connu que prosodie et syntaxe jouent un rôle essentiel dans l'identification des unités basiques en termes de structuration de l'information et gestion de la communication et pour cette raison je souhaite concentrer mes recherches sur l'interaction de ces deux niveaux d'organisation. Les études (et notamment les travaux en cours sur le corpus Rhapsodie) montrent que les frontières prosodiques majeures ne correspondent pas nécessairement à des frontières syntaxiques majeures et vice versa. Il y a donc un intérêt à la fois pratique et théorique à comprendre les raisons de ces non-coïncidences : pratique, car c'est aujourd'hui la piste la plus prometteuse pour améliorer l'analyse syntaxique automatique de l'oral (en tenant compte des indices prosodiques dans le traitement) et théorique pour comprendre quels sont les rôles respectifs dévolus à la prosodie et la syntaxe et comment les deux se complètent dans l'organisation du discours. Objectifs : J'envisage d'élaborer un modèle modulaire et opérationnel de la corrélation entre syntaxe et prosodie utilisant des méthodes qui reposent à la fois sur les travaux en grammaires formelles (notamment les grammaires synchrones [12], les grammaires de transformation de graphes [5] utilisées pour décrire des correspondances entre structures), sur les travaux en acquisition automatique par des méthodes statistiques et enfin sur les principes de l'UML (unified modeling language) [14] pour la spécification et la modélisation de l'architecture modulaire à laquelle je souhaiterai aboutir. Une approche modulaire des composantes de l'oral permet de décrire de façon exhaustive et cohérente chaque module et de disposer "d'un appareil notationnel qui permet l'établissement de liens précis entre les modules" [11]. Les grammaires synchrones et les grammaires de transformation de graphes permettent de formaliser ces descriptions en représentant chaque module par des structures de graphes et permettant de modéliser leurs interactions de manière efficace. D'un point de vue théorique général, nous posons l'hypothèse d'un principe d'économie [13, 6, 7, 10] selon lequel la redondance intono-syntaxique ne s'impose pas : les marqueurs syntaxiques et prosodiques coopèrent pour instancier la structure communicative du message et construire le sens, quand il y a redondance entre les deux niveaux de traitement, alors cette redondance est explicable fonctionnellement (mise en saillance des éléments, contrastes, parallélismes). Travail préliminaire : Dès la licence 3, j'ai eu la chance de participer à la création du treebank prosodique et syntaxique Rhapsodie. L'expérience que j'ai acquise dans le cadre de ce projet ces trois dernières années constitue la base de mon projet de recherche. Les structures macro et micro-syntaxiques et prosodiques y sont représentées par des arborescences. On dispose donc de données de langue qui se prêtent naturellement à une modélisation par les grammaires formelles présentées plus haut. Dans le cadre de ma participation au projet Rhapsodie et de mon travail de recherche de master 2 "Ingénierie Linguistique" j'ai formalisé et implémenté une structure de données modulaire multi-arbre dans laquelle s'intègrent les représentations objets de la syntaxe et de la prosodie [1]. J'ai aussi développé les outils de parsing de cette structure nécessaires à son exploitation statistique tant descriptive que quantitative. J'ai eu l'opportunité de la tester dans le cadre de mon master 2 "Phonétique et Phonologie" par une étude intono-syntaxique qui se focalisait sur l'analyse d'un phénomène d'interface précis, à savoir la prosodie des entassements syntaxiques [2]. Approche : J'envisage de mener ce projet de recherche en adoptant une approche à la fois inductive et théorique. L'exploration statistique automatique du corpus ne se limitera pas à vérifier certaines hypothèses formulées par la littérature mais mettra en évidence des corrélations entre des structures non encore répertoriées. Une partie du travail consistera à sélectionner parmi ces corrélations celles qui peuvent avoir une valeur linguistique et à théoriser un ensemble de règles qui les concerne. Bibliographie partielle : [1] J. Belião. Création d'un multi-arbre à partir d'un texte balisé : l'exemple de l'annotation d'un corpus d'oral spontané. In RECITAL, 2012. [2] J. Belião. Formalisation, implémentation et exploitation d'une hiérarchie objet intono-syntaxique : Étude sur un treebank de français oral spontané (mémoire de master). Université Sorbonne Nouvelle, 2012. [3] A. Berrendonner. Les deux syntaxes. Verbum XXIV, 1-2 :25-35, 2002. [4] C. Blanche-Benveniste. Le français parlé, études grammaticales. Paris, 1990. [5] B. Bohnet, A. Langjahr, and L. Wanner. A development environment for MTT-based sentence generators. SEPLN, pages 35-36, 2000. [6] W. Chafe. Givenness, contrastiveness, subject, topic, and point of view. Subject and Topic. New York : Academic Press, 1976. [7] O. Jespersen. The Philosophy of Grammar. Chicago Studies in Ethnomusicology Series. University of Chicago Press, 1965. [8] S. Kahane and P. Pietrandrea. Les parenthétiques comme "unités illocutoires associées" une approche macrosyntaxique. in M. Avanzi & J. Glikman (éd.), Les Verbes Parenthétiques : Hypotaxe, Parataxe ou Parenthèse ?, 2011. [9] A. Lacheret, S. Kahane, P. Pietrandrea, M. Avanzi, and B. Victorri. Oui mais elle est oú la coupure là ? quand syntaxe et prosodie s'entraident ou se complètent. Langue française, 170 :61?80, 2011. [10] A. Martinet. Grammaire fonctionnelle du français. 1979. [11] H. Nolke and J-M. Adam. Approches modulaire : de la langue au discours. Delachaux et Niestlé (Lausanne), 1999. [12] S. Shieber and Y. Schabes. Generation and synchronous tree-adjoining grammars. Computational Intelligence, 7 :220-228, 1991. [13] G.K. Zipf. The Psycho-Biology of Language : An Introduction to Dynamic Philology. Number vol. 21 in International Library of Psychology. Routledge, 1999. [14] K. Siau and T. Halpin. Unified Modeling Language : Systems Analysis, Design and Development Issues, Keng Siau and Terry Halpin (eds) Idea Group Publishing, 2001.