Unité(s) du texte

 

  1. Membres
  2. Problématique
  3. Actions




1. Membres de l’opération

Membres rattachés à titre principal
Annie Bertin
Jean-Luc Minel
Anne Trévise


Membre associé
Jean-Jacques Briu
Catherine Camugli Gallardo

Doctorants
Mekioussa Ait Saada
Khadija Elkandoussi
Banafsheh Karamifar
Eugenia Mogollon Ballestas
Agnès Muller
Aiala Rosa
Svetlana Tyaglova
Alexandra Vraciu





2. Problématique

La conception du langage dans laquelle s’inscrit l’équipe « activité langagière » pose la double question épistémologique des unités et de l’unité du texte, c’est-à-dire des relations entre le local et le global, le statique et le dynamique dans la construction de l’interprétation. Cette question traverse aujourd’hui de nombreuses théories du texte (cf. le numéro 163 de la revue Langages (sept. 2006), dirigé par D. Legallois). Dans le cadre de la présente opération, la solidarité du continu et du discontinu sera traitée sous trois angles : la représentation des unités du texte dans le cadre de son traitement informatique, leur transformation en diachronie et leur dénomination en didactique des langues.

L’adoption par la communauté scientifique d’une représentation structurée des textes, conçue sous forme d’éléments imbriqués (TEI) soulève des problèmes théoriques et méthodologiques qui sont travaillés dans l’action « Représentation et traitement informatique des unités du texte ». Une attention particulière est portée aux différents niveaux de relations entre les unités textuelles. Les différents projets qui relèvent de cette action visent une modélisation du discours, avec des applications notamment dans les domaines de la compréhension et de l’extraction d’informations.

En diachronie, il s’agira de s’interroger sur la disparition de certaines unités dans des séries grammaticales et sur l’apparition d’unités résultant d’un processus de grammaticalisation ou de création. La catégorie de la conjonction constitue un poste d’observation privilégié à plusieurs titres : catégorie relationnelle par excellence, elle a subi un renouvellement important entre l’ancien et le moyen français en même temps qu’évoluaient les frontières et les propriétés syntaxiques des unités mises en relation. Il en résulte un double problème terminologique qui rejoint les questions posées en didactique : qu’entend-on par conjonction selon que l’on décrit tel ou tel état de la langue ? et comment dénommer les unités textuelles reliées par les conjonctions ?

En didactique des langues, le poids de la tradition logico-grammaticale a longtemps occulté la question théorique des « unités du texte », et celle, indissociable, de leur dénomination. Aujourd’hui, le foisonnement terminologique impose un examen qui ne dissocie pas les perspectives linguistiques et didactiques : en fonction de quels critères faut-il recourir à des termes spécifiques ou peut-on emprunter à une terminologie en vigueur pour la description de la phrase ? Comment articuler les différents niveaux d’analyse dans une perspective didactique ?

Ces questions renvoient au choix des cadres théoriques permettant de mettre en relation des expressions linguistiques et des activités langagières dans un contexte de communication. Posant conjointement la question des « paliers de traitement » de l’énoncé et des unités correspondant à telle ou telle opération, les grammaires fonctionnelles (Van Vallin & La Polla, 1997) justifient la hiérarchisation des niveaux d’analyse non de façon uniquement interne mais par la relation qu’ils entretiennent avec le discours et la cognition dans une perspective communicative. Il y a là, selon B. Combettes (2005), une perspective pertinente pour une grammaire de phrase renouvelée, compatible avec l’étude du texte et du discours. Dans le cadre de l’action, Terminologie et dénomination des « unités du texte », cette hypothèse sera soumise à la confrontation de linguistes et didacticiens de différentes langues, travaillant dans différents cadres théoriques.





3. Actions

1) Terminologie et dénomination des « unités du texte »
Un rapide tour d’horizon fait apparaître les limites et les contradictions des solutions retenues aujourd’hui en didactique des langues. Dans l’enseignement du français dit langue maternelle, la grammaire de phrase relève toujours des concepts et des méthodes du distributionnalisme, tandis que des notions empruntées à la linguistique du texte et du discours ont été ajoutées sans réorganisation conceptuelle d’ensemble. En didactique des langues en revanche, l’approche communicative dans sa version la plus radicale relègue au second plan l’étude du système de la langue. Dans l’enseignement de l’anglais, l’introduction de la théorie des opérations énonciatives est restée par bien des aspects superficielle. Quant au secteur des langues romanes, si une ébauche d’articulation entre niveaux d’analyse émerge depuis peu pour l’espagnol et le portugais, en italien les choix demeurent flous et peu explicités.
On s’appuiera sur la réflexion déjà engagée pendant le précédent contrat, dans le cadre de l’élaboration d’un glossaire de termes linguistiques pour la didactique des langues. L’objectif sera de poursuivre la rédaction d’entrées du glossaire autour de la problématique des unités du texte. Il s’agira de fournir des analyses permettant d’éclairer les choix des rédacteurs de programmes, de manuels et des enseignants en didactique des langues. Le choix des entrées privilégiera la recherche d’articulations entre niveaux d’analyse, par exemple en prolongeant le travail déjà engagé sur le groupe nominal par des entrées sur la construction référentielle, l’identification et l’activation d’un référent dans le discours. Le travail pourra ensuite être élargi aux notions de prédication, de classe de prédicats, etc.

2) La subordination dans l’histoire du français »

Le travail articulera deux axes :
L’étude du « renouvellement des conjonctions » pour reprendre la formule de Meillet- disparition, création, selon des schémas cognitifs mis en lumière dans le cadre de la grammaticalisation, mais aussi sous l’action de contacts de langues (en particulier le latin scolastique), en fonction des genres textuels (importance des textes juridiques) la créativité n’étant pas l’apanage de la langue orale spontanée. Le sujet donnera lieu à un groupe de travail en 2007-2008. On partira d’une présentation de B. Kortman, Adverbial subordinators in the languages of Europe, qui fait suite aux travaux du groupe « Adverbial Relations, Operators and Connectives » (resp. van der Auwera) du programme de recherche international EUROTYP.
L’étude de la « conjonction », notion aussi floue que tenace dans la grammaire occidentale (pour Aristote c’est aussi bien tel mot-outil que l’agencement qui donne l’Odyssée), amène à s’interroger sur le statut de la notion même de subordination voire de phrase, particulièrement dans l’optique des textes médiévaux. Les propositions, la phrase sont-elles des unités pertinentes pour étudier la phrase médiévale ? Cette question rejoint certainement les interrogations d’autres linguistes de l’équipe, en particulier en ce qui concerne les productions scolaires.

A ces deux axes, on associera les travaux suivants :
- Etude d’un préfixe -re (non répertorié dans les dictionnaires latins) au sens de « blocage dans la case temporelle considérée » (ex. : remanere, remanoir en ancien français, to remain en anglais) ;
- tant marque d’une opération qui n’a rien à voir avec l’intensité - mais qui est la marque d’entrée dans un monde réduit logique quantifié et connu.

3) Représentation et traitement informatique des unités du texte
L’adoption, par la communauté des chercheurs qui travaillent sur corpus, de standards de balisage (XML) et de ses différences instances dédiées (TEI) soulève, sous couvert de problèmes techniques, de nombreux problèmes théoriques et méthodologiques. Parmi ceux-ci, nous nous intéressons plus spécifiquement au problème de la représentation informatique d’un texte, c’est-à-dire aux unités et aux relations qui le composent. Nous disposons actuellement d’une représentation élaborée dans le cadre du projet Navitexte (Couto 2006, Couto & Minel 2007a, 2007b) et mise à l’épreuve dans différentes applications (Battistelli & al. 2007, Mathieu 2006, Lundquist & al. 2006). Les résultats obtenus nous amènent à enrichir ce modèle en nous confrontant à d’autres types de textes et notamment ceux étudiés par les membres de l’équipe, notamment les corpus scolaires, le discours rapporté, et les pages Web dédiées à un domaine.
D’autre part, nous élargissons notre réflexion aux problèmes posés par l’extraction d’informations dans le cadre du Web sémantique. La plupart des approches actuelles ne prennent pas en compte la dimension textuelle et se limite au contexte local dans leur processus de repérage ou d’extraction d’informations. Les travaux menés par F. Amardeilh (2007) et l’élaboration du langage OPALE a démontré toute l’importance de disposer d’une représentation, et d’un langage formel associé, qui soit apte à accueillir les relations syntaxiques, sémantiques et rhétoriques qu’entretiennent les unités d’un même texte.
Cette opération est adossée à trois projets ANR en cours et à trois collaborations internationales :
Par ailleurs, en collaboration avec l’équipe dirigée par Mme Lita Lundquist (Département de français Institut F.I.R.S.T, Copenhagen Business School, Danemark), nous développons le logiciel NaviLire, outil d’aide à la compréhension de textes complexes pour des étudiants FLE qui s’appuie sur la plate-forme NaviTexte. L’objectif est de concevoir un outil qui permette à un apprenant de voir et de naviguer dans un texte entre des unités textuelles assurant la cohérence. Cet outil constitue un instrument didactique très performant et motivant, tant pour l’apprentissage de la lecture que pour l’apprentissage de la production écrite de textes. Une première version de NaviLire est diffusée au Danemark avec l’ouvrage « Tekstkompetence på fremmedsprog » publié par, Forlaget samfundslitteratur. Ce projet est soutenu par l’ambassade de France au Danemark.