Versione stampabile

Sandrine CADDÉO, Frédéric SABIO

Le Groupe Aixois de Recherche en Syntaxe et les recherches actuelles sur le français parlé

Sandrine Caddéo & Frédéric Sabio
Aix Marseille Univ, CNRS, LPL, Aix-en-Provence, France
sandrine.caddeo@univ-amu.fr
frederic.sabio@univ-amu.fr

Résumé

Les travaux que Claire Blanche-Benveniste et le Groupe Aixois de Recherche en Syntaxe ont consacrés à la description du français parlé à partir des années 1970 ont d’emblée engagé des choix méthodologiques, théoriques ou thématiques dont certains se sont diffusés au-delà de notre cercle et demeurent très actuels. Sans ambitionner d’établir un véritable « état des lieux », cet article abordera succinctement quelques orientations fondamentales du GARS en s’interrogeant sur les évolutions qu’elles ont connues depuis plusieurs années, et sur les échos qu’elles ont pu avoir parmi l’ensemble des linguistes versés dans la description de la syntaxe du français oral. Nous évoquerons plus particulièrement la question des données orales et celle de l’articulation entre la microsyntaxe et la macrosyntaxe.

Introduction

Cet article propose de revenir sur certains apports du Groupe Aixois de Recherche en Syntaxe (GARS), en adoptant un double point de vue, à la fois historique et contemporain. Nous rappellerons tout d’abord à partir de quelles conceptions méthodologiques fondamentales s’est constitué le groupe, qui a été marqué par la personnalité de C. Blanche-Benveniste, et qui, même s’il apparaît aujourd’hui relativement « éclaté » en raison de l’éloignement géographique de ses membres, poursuit l’entreprise de description grammaticale du français moderne initiée il y a une quarantaine d’années. Nous évoquerons ensuite la manière dont certaines propositions émanant du GARS ont été reçues dans la communauté des linguistes et comment elles ont pu évoluer à l’intérieur même de notre groupe au cours des années récentes. Nous insisterons tout particulièrement ici sur deux domaines spécifiques : celui du statut des données orales et celui de l’articulation entre micro- et macrosyntaxe.

1. Le GARS : quelques conceptions fondamentales

Le Groupe Aixois de Recherche en Syntaxe a été fondé à l’Université de Provence dans le milieu des années 1970. C’est au cours de cette période qu’ont été définies et exposées certaines orientations fondamentales qui constitueront le socle méthodologique de l’« école aixoise » de syntaxe du français parlé. Il nous a paru utile de revenir rapidement sur quelques-unes de ces options, en les situant dans le contexte académique de l’époque, afin de mettre en lumière la cohérence du programme d’étude proposé et l’originalité de certaines pistes de description envisagées.

a) La nécessité de prendre en considération les données orales dans le cadre d’une réflexion générale sur la syntaxe du français contemporain était évidemment motivée par le fait que les études fondées sur des données essentiellement écrites ou introspectives, qui prévalaient à l’époque, avaient un caractère nettement fragmentaire. D’emblée, l’objectif du groupe a donc été d’élaborer une grammaire de la langue qui rende compte de la pluralité des usages linguistiques, entreprise novatrice qui annonçait les approches « usage-based » qui se sont grandement développées depuis lors.

b) Les linguistes qui ont fondé le GARS étaient convaincus qu’entre l’institution française de la grammaire traditionnelle et la grammaire générative (qui se tenait éloignée de la description des faits langagiers attestés et avait explicitement pris position contre l’usage des données spontanées), il était possible de promouvoir de nouvelles pratiques en se fondant notamment sur les acquis les plus précieux du distributionnalisme. Parmi les pistes descriptives qui se sont avérées particulièrement fructueuses, on peut mentionner la recherche d’une critériologie opératoire pour repérer et classer les faits de rection verbale, la réflexion sur la limite entre le domaine régi et le domaine non régi, une clarification de la notion de « types de phrases » à travers la notion de « dispositifs de la rection », le réexamen du concept de subordination, et la recherche de « grandes unités » syntaxiques plus opératoires que la « phrase » ou la « proposition ».

c) Comme l’on sait, la linguistique générative des débuts accordait une très grande confiance dans la capacité qu’auraient les locuteurs d’une langue donnée à distinguer entre les structures grammaticales et agrammaticales en rendant un jugement de grammaticalité fondé sur la seule introspection. Le GARS s’est d’emblée montré extrêmement méfiant sur la fiabilité de tels jugements, préférant miser sur les données de corpus, qui, si elles possèdent sans doute l’inconvénient de mêler de façon complexe faits de « structure » et faits de « performance », possèdent le très gros avantage de livrer des formes attestées qui constituent une base documentaire irremplaçable pour toute entreprise de description linguistique.

d) Dès ses premiers travaux, le GARS a renoncé à s’inscrire dans la mouvance sociolinguistique variationniste élaborée à l’époque par W. Labov. Ce refus était essentiellement motivé par le fait que, dans l’esprit de ses membres, le répertoire des structures syntaxiques produites à l’oral demeurait à l’époque trop imparfaitement connu et qu’un important travail de description proprement grammaticale restait à effectuer avant toute interprétation sociologique. À cet égard, on peut souscrire à la remarque de F. Gadet (2012 : 35) qui évoque « une rencontre inachevée » entre « la sociolinguistique de la langue et la syntaxe du français parlé » au sein de notre équipe.

e) La question de la frontière entre le niveau des relations syntaxiques et celui des relations discursives avait souvent été réduite à une question de ponctuation dans le cas des textes écrits (voir les oppositions naïves entre le niveau « phrastique » et le niveau « supra-phrastique »), mais devait être réexaminée dans le cas des données orales (et de certaines données écrites) pour lesquelles la distribution entre faits de syntaxe et faits de discours apparaît bien plus complexe. Le GARS a notamment exprimé une position très ferme sur la nécessité de séparer dans l’analyse les faits relevant de la rection syntaxique (microsyntaxe) et ceux liés à la « mise en énoncé » des constructions (macrosyntaxe), en prévoyant que le recouvrement entre ces deux dimensions puisse n’être que partiel.

f) Le GARS a régulièrement insisté sur le fait que la seule nature des morphèmes ne garantissait pas l’existence d’un lien de rection syntaxique mais devait nécessairement être couplée à d’autres critères tels que la proportionnalité avec une proforme, la possibilité pour les éléments régis d’entrer dans un dispositif de la rection comme le clivage ou le pseudo-clivage, la possibilité d’opérer des contrastes de modalité ou de s’adjoindre un adverbe paradigmatisant, etc. C’est ainsi qu’il a été montré que de nombreuses conjonctions dites « de subordination » peuvent entrer dans des emplois non subordonnants.

Parmi les éléments de description élaborés par le GARS, nous souhaitons en évoquer deux, qui occupent une place tout à fait centrale à l’intérieur de notre cadre : d’une part la question des données orales et de la constitution de corpus, dont l’importance a été affirmée dès les premiers travaux ; d’autre part, la double dimension – microsyntaxique et macrosyntaxique – de notre modèle, qui a été formulée plus tardivement et a donné lieu à de nombreuses études dans les années récentes.

2. Données orales et corpus

Les ouvrages Le français parlé. Transcription et édition (1987) et Le français parlé. Etudes grammaticales (1990) développent les bases de la démarche théorique et méthodologique des études syntaxiques sur corpus de français parlé défendues par l’équipe du GARS. Mais autant la réflexion apporte des perspectives inédites sur l’analyse de la langue orale à une époque où « peu de gens y voient un objet légitime d’étude, même chez les linguistes » (BLANCHE-BENVENISTE & JEANJEAN, 1987 : 1), autant le matériau de travail – le corpus – se constitue plus lentement. Au-delà des raisons techniques (le matériel d’enregistrement est à l’époque peu performant) et académiques (les exigences de la formation nécessitent de moduler les ambitions), c’est la question même de l’édition des données qui monopolise la réflexion, car elle dépasse les simples considérations pratiques, au vu des implications qu’entraîne le fait de « saisir » l’oral en passant par l’écrit. Les exigences et précautions ont été telles qu’on aboutit à un paradoxe : d’un côté le savoir-faire de l’équipe aixoise devient une référence dans le domaine, mais les deux grands corpus qui ont fini par être élaborés ne sont pas librement diffusés.

2.1 La « banque de données » du GARS : historique, originalité et limites

Le premier corpus de français parlé du GARS (qui sera par la suite appelé CorpAix) regroupe au fil des années 1990-2000 des enregistrements et transcriptions établis par plusieurs générations d’étudiants de la formation. C’est une première banque de données d’à peu près 1 million de mots, qui ne vise toutefois aucun objectif de représentativité. Les données étant recueillies pour la grande majorité localement, les locuteurs appartiennent principalement à la région d’Aix-Marseille et il s’agit surtout de récits (récits de vie, souvenirs…), types discursifs plus faciles à recueillir et à transcrire pour des étudiants non experts des enquêtes de terrain.

La constitution de cette première banque de données est marquée par son caractère très « artisanal », au vu des normes actuelles : enregistrements sonores de qualité variable, anonymisation et autorisations d’exploitation non systématiquement faites et aucun d’alignement texte/son. Le format des documents se prêtait mal à être couplé à des outils de requêtes1. En résulte une faible diffusion des données, CorpAix étant surtout utilisé pour des recherches au sein même du GARS.

Fin 2000, l’équipe DELIC (Description Linguistique Informatisée sur Corpus)2, dirigée par J. Véronis, finalise le projet CRFP (Corpus de Référence du Français Parlé), financé par la Délégation à la Langue Française. Il s’agit d’un corpus d’environ 440 000 mots échantillonné à partir de critères sociolinguistiques (zone géographique, tranche d’âge, sexe, situation de parole, niveau scolaire)3. Bien que certains points aient fait l’objet de plus d’attention en amont (qualité des enregistrements, numérisation des supports, échantillonnages, fiches d’informations, autorisations), et qu’il y ait un alignement texte/son, le système d’exploitation automatique des données – le logiciel Contextes4 – n’est plus disponible et la diffusion du CRFP reste discrète5.

De manière rétrospective et à la lumière du développement plus marqué de l’intérêt pour les études de la langue sur corpus et, de ce fait, pour la constitution de corpus, que l’on constate en France à partir des années 2000, le GARS fait tout de même figure de précurseur en linguistique de corpus pour ce qui est de la constitution de bases de données6, qui a, depuis, gagné en reconnaissance. Les chercheurs en Sciences Humaines et Sociales peuvent, par exemple, faire valoir l’édition de corpus comme production scientifique. L’AERES7 précise ainsi : « Est considéré comme une production scientifique de rang A : (…) pour le secteur SHS, la constitution de bases de données accessibles ou de corpus de référence, (…) ».

Les financements de nombreux projets tournés vers cette thématique, avec l’objectif de constituer des bases de données orales (mais aussi écrites) quantitativement plus importantes, augmentent. Se développent naturellement des projets collaboratifs de plus grande ampleur8 et surtout permettant l’interaction de spécialistes divers : ingénieurs, informaticiens, phonéticiens, lexicologues, syntacticiens, linguistes orientés TAL…

Les avancées technologiques facilitent l’édition et l’archivage : les questions d’alignement texte/son, d’annotations ou d’échantillonnages peuvent être anticipées en adoptant d’emblée des outils d’exploitation élaborés simultanément.
Les ressources gagnent en complexité : les annotations sont de divers niveaux (parties du discours, dépendances syntaxiques, organisation informationnelle, structure prosodique…) et les outils de requêtes sont de plus en plus perfectionnés.

Un effort particulier est porté sur la diffusion des données et leur accès : l’exploitation du web est première, avec le développement de plates-formes9.

2.2 Elaboration et interrogation des corpus : quelques points en débat

S’il faut se féliciter des effets bénéfiques que les progrès technologiques et l’intérêt croissant pour les corpus apportent à la communauté des chercheurs, certaines précautions – très présentes dans les théories et les travaux du GARS, et encore très actuelles – ne nous semblent pas toujours être prises. Nous appuierons notre propos à partir de trois problématiques : (a) peut-on parler de grammaire de l’oral ? ; (b) les outils de requêtes sont-ils incontournables dans les études sur la langue ? ; (c) la transcription orthographique de l’oral est-elle encore un enjeu ?

a) Principalement en didactique – et plus particulièrement en FLE – émergent des ouvrages qui s’interrogent sur l’enseignement de la « grammaire de l’oral » ou « grammaire de l’oralité » à des étudiants étrangers (DELAHAIE, 2008, ou WEBER, 2013). Après la grande vague de l’approche communicative des années 1960-1970, un retour vers l’enseignement de la grammaire (entre autres FOUGEROUSE, 2001) et surtout un mouvement vers l’intégration des usages oraux voient le jour. Cependant, les perspectives développées pourraient laisser penser que le système de la langue française à l’oral serait spécifique et « coupé » de la langue écrite, alors que le GARS a toujours cherché à l’absorber comme une des faces du fonctionnement du français, certaines de ses particularités relevant plutôt des usages (cf. partie 1 de ce même article). Nous pouvons regretter de ne pas pouvoir citer une grammaire française similaire à la Longman Grammar of Spoken and Written English (BIBER et al., 1999)10 qui intègre oral, écrit et genres à sa description. Comme le soulignaient en 2012 J. Deulofeu & J.-M. Debaisieux :

« Toute grammaire de référence d’une langue devrait se présenter à la fois comme une somme organisée des connaissances ou des savoirs que les locuteurs ou les spécialistes ont sur cette langue, et comme un recensement des usages effectifs que font les locuteurs de cette langue dans les divers registres selon lesquels elle est utilisée. Le constat que l’on peut faire si l’on regarde le domaine français est, d’une part, qu’il n’existe pas d’ouvrage qui combine les deux approches et, d’autre part, que l’orientation recensement des usages à vocation d’exhaustivité a été beaucoup moins privilégiée que l’autre » (p.27).

Dans ce domaine, malgré la multiplication des ressources disponibles et une recherche dynamique, la France garde un important retard.

b) L’évolution de la technologie et du savoir-faire en TAL a rendu disponibles de nombreux outils de requêtes qui peuvent se trouver en libre accès sur le web (par exemple AntConc 3.2.4w11) ou qui sont intégrés aux plates-formes des projets (c’est ce qui est le plus courant). Ces concordanciers permettent d’interroger les bases de données brutes ou annotées, mais leurs contraintes inhérentes (la majorité est programmée pour repérer une chaîne de caractères ou un lemme12) semblent orienter les chercheurs vers certains phénomènes aux dépens d’autres. D’après B. Combettes (2011),

[…] les études se trouvent trop souvent limitées aux phénomènes qui se prêtent facilement à la recherche automatisée, d’où l’abondance de travaux sur des expressions, des formes identifiables après lemmatisation, et la mise à l’écart de nombreux sous-domaines de la syntaxe.

Les études mettant en jeu par exemple la linéarisation sont de ce fait moins nombreuses, comme les sujets et objets antéposé ou postposés, les formes et longueurs des énoncés ou les dépendances à distance. Les difficultés sont sans doute liées à l’absence d’outils encore fiables proposant un étiquetage morpho-syntaxique de plusieurs niveaux ou au fait que le chercheur doive parfois d’abord acquérir des compétences en langage spécifique, comme les expressions régulières.

Mais même si des progrès peuvent être attendus sur les annotations, certaines dimensions continueront d’échapper à la recherche automatique. Certains faits linguistiques peuvent être observés de manière plus fréquente à certains moments des tours de parole d’une interaction. C. Blanche-Benveniste (2010) avait dégagé des constantes dans la présence des pseudo-clivées ; elle disait à ce propos (c’est nous qui soulignons) :

Les usages discursifs montrent que ce dispositif de développement de valence en deux temps se situe souvent dans le milieu d’une unité de discours, après que le thème du discours dont il est question a déjà été introduit. Les locuteurs l’utilisent par exemple pour reprendre les termes d’une question avant de fournir la réponse (ROUBAUD, 2000):
(5) L1 qu’est-ce qui vous plaît dans ce travail
L2 ben ce qui me plaît d’abord c’est que j’ai une très bonne ambiance (R)
Il arrive fréquemment que le contenu lexical d’une tournure pseudo-clivée soit repris ensuite par un dispositif clivé, qui agit comme conclusion d’une unité discursive:
(6) oui ce qui est dommage c’est que généralement ils font venir les plus mauvais c’est ça qui est dommage (R)
C’est donc un dispositif de valence verbale voué aux positions discursives médianes, souvent utilisé dans la progression d’une argumentation, menée soit par un seul locuteur, soit par plusieurs locuteurs.

La lecture linéaire et le repérage « manuel » semblent ici nécessaires ; ce ne sont pas des méthodes à marginaliser sous le couvert d’une course au quantitatif.

c) Les publications du GARS concernant l’importance à accorder à la transcription de l’oral et ses enjeux ont été constantes. L’expérience accumulée permet d’affirmer que les choix à adopter, s’ils sont principalement en relation avec les études visées, doivent également tenir compte de ce que l’on sait des faits linguistiques. Il nous semble cependant que l’attention portée à ce dernier point fait parfois défaut. Pourtant les cas où un choix de transcription implique une analyse abondent13. La projection à l’écrit des données orales n’est pas anodine ; certaines informations seront portées par l’orthographe, alors qu’elles resteront floues à l’oral lorsque la prononciation n’est pas discriminante. La valeur de pluriel en est une bonne illustration, comme le montre l’exemple suivant où l’absence d’indices permettant de savoir si le locuteur fait référence à un seul patient ou à plusieurs est compensée par la mise entre parenthèses des marques de pluriel (convention adoptée par le GARS) :

1. et puis euh de temps en temps euh - je demande au(x) patient(s) de m'arrêter s'il(s) trouve(nt) que je parle trop

Garder la trace des hésitations ne relève pas d’un excès de précautions, mais rend compte de différences fondamentales dans le système même de la langue : les principes d’organisation de ces informations – qui relèvent fréquemment de la morphologie nominale et verbale – ne sont pas strictement comparables entre l’oral et l’écrit. Le français, déjà taxé de langue à morphologie pauvre, en comparaison avec ses sœurs romanes, est encore plus déficitaire dans sa dimension parlée.

Pour d’autres cas, la connaissance de certaines régularités permet de justifier la transcription. Dans l’exemple suivant, notre expérience nous inciterait à corriger la transcription, proposée par un étudiant, en supprimant les parenthèses. Dans ce contexte, nous ferions l’hypothèse que le pronom clitique prend une valeur collective que peut marquer la personne 6, mais pas la personne 3 :

2. et résultat final j'étais vingt-cinquième vingt-cinquième sur la liste + et il(s) prenai(en)t que les vingt premiers (transcription d’un étudiant)

Parmi les trucages orthographiques, censés donner un effet d’oralité pour se rapprocher de variantes de prononciation, certains produisent une confusion sur la nature des morphèmes présents, ce qui peut fausser les jugements sur les compétences des locuteurs.

Dans les deux exemples suivants, la présence des éléments que nous avons mis en gras est incongrue. Une analyse un peu hâtive, doublée de représentations sur la langue des enfants, laisserait entendre une défaillance dans l’emploi des pronoms clitiques de fonction objet. Nous savons cependant que la forme « il » (et « ils », selon les contextes), possède une variation de prononciation dont certaines sont de réalisations courtes comme [l] ou [i].

3. monsieur Grégory l’avait un filet
4. son bouton y il s'est attaché à un fil
(Corpus CLEA (PEROZ, 2012), enfants de grande section de maternelle)

Une hypothèse plus raisonnable serait de considérer que dans les deux cas, l’enfant a réalisé le pronom personnel sujet « il ». En rétablissant l’orthographe correcte, on observe un fait banal de dislocation du sujet dans les deux exemples, avec une répétition, tout aussi banale, dans le second :

5. monsieur Grégory il avait un filet
6. son bouton il il s'est attaché à un fil

Certains aménagements orthographiques ont cependant été retenus par le GARS, comme le =z= marquant une liaison dite fautive observable dans des exemples du type « il y a des gens qui sont très très peu =z= intéressants ». Comme le rappelle S. Caddeo (2012),

Loin de souligner la faute, la notation de ces liaisons remarquables s’inscrit dans une étude sur les marques de nombre à l’oral. Le français étant une langue à morphologie pauvre (BLANCHE-BENVENISTE, 1999), les locuteurs semblent faire porter l’information de pluriel au niveau du syntagme dont la liaison, représentée par [z], est la manifestation et qui se comporte comme un véritable morphème de pluriel lorsqu’elle est placée dans des séquences inédites. (p. 33)

On comprend combien ce choix s’appuie sur une réflexion théorique.

La transcription orthographique de l’oral repose sur des prises de décision délicates qui croisent des préoccupations de plusieurs niveaux outre celles qui concernent la langue : lisibilité, fidélité aux sources, adéquation aux outils informatiques. La tâche même de transcription a une portée heuristique.

3. Le cadre de description : microsyntaxe et macrosyntaxe

Initialement formulée à Louvain par K. van den Eynde, l'hypothèse pronominale a été explorée à Aix-en-Provence au début des années 1970. C. Blanche-Benveniste en a proposé une application à la syntaxe du français en 1975. En 1984, plusieurs membres du GARS ont publié un ouvrage collectif, Pronom et syntaxe (BLANCHE-BENVENISTE et al., 1984), qui expose la manière d’appréhender les relations de dépendance entre un verbe recteur et les éléments qu’il régit, en proposant une critériologie qui accorde une large place à la notion d’insertion dans un paradigme.

Comme on le voit, jusqu’à la parution de l’ouvrage Le français parlé : études grammaticales (Blanche-Benveniste et al., 1990), l’approche pronominale a constitué le socle théorique et méthodologique principal de notre entreprise de description. L’ouvrage de 1990 proposera une innovation majeure, en marquant l’inscription du GARS dans un modèle à deux composantes : désormais, il sera souvent fait référence à l’approche pronominale sous le terme de « microsyntaxe », afin de le distinguer de la seconde composante du modèle, le niveau macrosyntaxique.

Nous dirons peu de choses ici sur l’approche pronominale dans la mesure où il s’agit d’un cadre qui a d’emblée été assez fortement unifié à la fois dans l’objectif poursuivi (décrire les relations de rection) et dans sa méthodologie. En comparaison, la composante macrosyntaxique demeure moins stabilisée sur le plan critériologique et constitue un champ important d’innovation dans notre équipe qui continue de donner lieu à d’assez nombreux ajustements notionnels. Nous proposons de revenir sur la genèse du niveau de description macrosyntaxique, en dégageant certaines spécificités de l’approche aixoise, et en dégageant certaines difficultés spécifiques posées par ce niveau d’analyse.

3.1 Eléments de genèse

Ce qui a permis à la macrosyntaxe de faire une entrée remarquée – et durable – dans le paysage de la linguistique française est son usage quasi-simultané dans le titre de deux publications consacrées à la langue parlée, élaborées indépendamment l’une de l’autre : l’ouvrage de 1990 dirigé par C. Blanche-Benveniste qu’on a mentionné ci-dessus et un article d’A. Berrendonner (« Pour une macro-syntaxe », en 1991). Les écoles aixoise et fribourgeoise poursuivent depuis lors leurs recherches dans le domaine, sans volonté d’unifier leurs approches, mais en entretenant un dialogue suivi14.

La convergence de fond des deux équipes résulte de deux constats essentiels :

  • l’insuffisance de la notion de phrase pour la description de l’oral et la volonté de trouver des unités plus opératoires (cf. BERRENDONNER, 1991 : 25, et l’avant-propos de BLANCHE-BENVENISTE et al., 1990).

  • la difficulté de rendre compte des relations non rectionnelles dans le seul cadre (micro-)syntaxique : A. Berrendonner l’indique dans la citation donnée supra ; et C. Blanche-Benveniste et al. soulignent, de manière à peu près similaire, que « ce que nous appelons macro-syntaxe [concerne] des relations qu’on ne peut pas décrire à partir des rections de catégories grammaticales » (BLANCHE-BENVENISTE, 1990 : 113)15.

Pour le reste, les deux programmes recèlent des différences assez profondes : les conceptions théoriques de base sont différentes (conceptions fonctionnalistes pour Fribourg et descriptivisme distributionnel pour Aix) et le lien avec la pragmatique est fondamental pour Fribourg, alors que la macrosyntaxe aixoise a comme caractéristique majeure de rester assez strictement située dans le domaine de la syntaxe, sans proposer de ponts avec la pragmatique ou l’analyse de discours.

Le seul domaine extérieur à la grammaire dont la pertinence est clairement revendiquée est celui de la prosodie16 :

Les rapports de dépendance et d’interdépendance particuliers, que l’on tente de décrire ici, sont à expliciter non seulement par des analyses distributionnelles usuelles, mais aussi par des critères d’intonation et par des interprétations sémantiques. (BLANCHE-BENVENISTE, 1990 : 113)

Ce choix de méthode semble avoir été motivé par l’idée d’une absolue indépendance des niveaux d’organisation langagière, qui a été défendue avec d’autant plus de vigueur que plusieurs études proposèrent à partir des années 1980 de décrire certaines constructions non canoniques

non pas comme des problèmes syntaxiques, mais comme la manifestation directe de l’intervention dans la forme des énoncés d’un élément de la ‘composante pragmatique’ de la description. La syntaxe de ces énoncés ne serait donc pas autonome, mais le simple reflet ‘iconique’ de leur organisation pragmatique. (DEULOFEU, 2003 : 83)

Le problème ici est que, s’il est exact que de nombreux énoncés qui manifestent une organisation informationnelle particulière (qui présentent par exemple des faits de saillance se manifestant par certaines caractéristiques prosodiques ou topologiques) peuvent être interprétés sur une base pragmatico-sémantique, il n’en demeure pas moins que leur description strictement formelle ne peut faire l’économie d’un traitement syntaxique précis. On peut le montrer de manière évidente en relevant que les différentes langues n’autorisent pas les mêmes structures, ce dont il serait vraiment très difficile de rendre compte sur une base exclusivement fonctionnelle. Par exemple, dans une séquence telle que celle qui est soulignée

7. les autres filles elles gagnaient au volley + à la natation à la gym. + au vélo + moi non à la pétanque (oral, CorpAix)

le regroupement qui s’instaure entre moi et non, banal en français, serait tout simplement irrecevable dans une langue comme l’anglais :

8. *me no

J. Deulofeu a apporté d’importantes contributions à la macrosyntaxe « aixoise », en proposant certains développements tout à fait originaux. On note qu’à la différence de C. Blanche-Benveniste (1990), qui ne revendique explicitement aucune filiation, J. Deulofeu (2001, 2003) a souvent été soucieux de situer la méthode macrosyntaxique parmi certains grands courants de la linguistique du XXe siècle ; c’est ainsi qu’il y voit un développement de la méthode structuraliste classique représentée en France par A. Meillet et J. Vendryes (1948) ainsi que C. Bally (1932), et cite les travaux de J. Perrot comme précurseur d’un « modèle structuraliste étendu » (DEULOFEU, 2003 : 84). Au plan notionnel, c’est en particulier l’ancienne distinction entre les faits d’hypotaxe et les faits de parataxe qui peut être vue comme la grande inspiratrice des approches contemporaines sur l’opposition entre composante micro et composante macro.

3.2 Quelques difficultés

L’intérêt suscité, au sein de notre équipe et bien au-delà, par l’introduction de la macrosyntaxe dans le champ grammatical ne doit pas dissimuler les difficultés qui subsistent quant à l’objet précis de ce niveau d’analyse ou les choix méthodologiques à opérer. Là où une critériologie remarquablement stable permettait de décrire, au niveau de la microsyntaxe, les ensembles rectionnels formés par le verbe et sa rection, l’étude des énoncés entreprise au niveau de la macrosyntaxe s’avère d’emblée plus hésitante en raison-même de la complexité des objets à décrire. Voici, sans souci d’exhaustivité, quelques une de ces difficultés :

3.2.1 La dimension « composite » des énoncés 

Comme le soulignait C. Blanche-Benveniste (2010 : 151),

« Les énoncés produits par les locuteurs comportent des matériaux composites de syntaxe, de prosodie, de sémantique, de pragmatique, ainsi que tout un ensemble de routines de discours, certaines relations étant signalées par des marqueurs morphologiques et d’autres non. Comme ces organisations ne peuvent pas être caractérisées uniquement par la syntaxe des catégories grammaticales, plusieurs études récentes se sont accordées pour les situer à un niveau plus englobant de macro-syntaxe. »

Cette citation rappelle à quel point la description des énoncés engage une pluralité de niveaux de structuration, dont les interactions sont difficiles à modéliser : par exemple, la plupart des effets de regroupements observés mettent en jeu de manière cruciale la dimension prosodique, dont on peut penser qu’elle n’est pas toujours suffisamment prise en compte par notre approche. De la même façon, les relations qui se tissent entre un élément Noyau et ses divers éléments Satellites (pré-noyau, post-noyau…) sont assez fortement reliées à la dimension illocutoire, qui pose de sérieuses difficultés en termes de critères d’analyse. Enfin la relation entre les configurations macrosyntaxiques et les effets qu’elles produisent sur l’articulation informationnelle des énoncés (par exemple l’organisation en topic / comment) reste posée de manière centrale. Même en se cantonnant aux aspects les plus proprement lexicaux et syntaxiques, le niveau de la macrosyntaxe conduira nécessairement à prendre en considération « [d]es marques (…) hétérogènes (morphèmes, contrastes lexicaux, parallélismes syntaxiques, prosodie et effet de rythme) de segmentation et de hiérarchisation des unités de textes » (DEULOFEU, 2013 : 439).

En résumé, même si notre cadre affirme que la forme des énoncés peut être décrite sur une base grammaticale relativement autonome vis-à-vis des autres domaines, il n’en demeure pas moins que le champ macrosyntaxique se situe par son objet même au confluent de plusieurs dimensions langagières, avec les difficultés que pose la description de telles intrications.

3.2.2 La coexistence de « petits modèles » d’énoncés 

L’établissement d’une typologie des énoncés du français, qui est l’un des objectifs visés par la macrosyntaxe, se heurte au fait que la forme de ces derniers repose souvent sur des principes d’organisation hautement spécifiques, qu’il est souvent difficile de ramener à quelques principes structurels très généraux. En d’autres termes, et à la différence du domaine microsyntaxique pour lequel une critériologie unifiée permet de décrire la quasi-totalité des faits de rection verbale, la macrosyntaxe amène régulièrement les chercheurs à isoler des types particuliers d’énoncés dont la forme apparaît fortement idiosyncrasique, et qu’il faut donc appréhender « structure par structure ». On peut signaler les quelques types suivants en guise d’illustration :

  • Structures routinisées introduisant un cadre temporel, dans lesquelles la séquence verbale qui apporte l’information temporelle n’est pas analysable comme un élément régi par le verbe :

    9. il s’est installé dans la région ça fait huit ans (oral, CorpAix)

  • Structures à « spécification progressive », dans lesquelles l’élément régi est d’abord donné sous forme de proforme, puis développée lexicalement (quoineuf ans) :

    10. En gros, j'avais quoi, 9 ans quand j'ai commencé à jouer (écrit, Web)

  • Structures à verbe « présentatif » :

    11. il y a des chambres vraiment tu as pas envie de faire un coup de balai (oral, CorpAix)

  • Conditionnelles « non marquées » ou « paratactiques » :

    12. tu en buvais cinq tu étais raide (oral, ex. G. Corminboeuf)

  • Clivées non contrastives à effet de « saillance discursive », qui peuvent être réanalysées comme des connecteurs discursifs :

    13. j'avais perdu mon père à douze ans et je ne connaissais pas tellement la fabrication ma mère a fait tout ce qu'elle a pu mais eh eh elle était pas du métier bon alors j'ai cherché à ayant deux frè- deux frères et une sœur à leur laisser la place pour avoir une profession et moi me perfectionner dans mon métier et c'est comme ça que je suis venu à Amiens en dix-neuf cent vingt-huit après mon service militaire (oral, corpus CRFP – Orféo)

  • Formes clivées en « Ce n’est pas parce que P que P » dotées d’un effet réfutatif :

    14. c'est pas parce que je fais des études de Sciences du Langage que je dois forcément bien parler (oral, corpAix)

3.2.3 La question des « unités maximales » en macrosyntaxe 

Comme on l’a plusieurs fois mentionné, le domaine de la microsyntaxe est assez précisément fixé dans notre cadre, à la fois quant aux critères de définition de la rection verbale (voir les différents tests d’insertion paradigmatique) et dans la définition de l’unité maximale, qu’on désigne souvent sous le terme d’« unité rectionnelle ». Mais si l’on sait, dans la plupart des cas, quand commencent les relations de macrosyntaxe, il est bien plus délicat de savoir à quel moment elles s’arrêtent : un indice évident de cette difficulté est l’hésitation que nous avons pour désigner les « grandes unités » de la macrosyntaxe : Énoncés ? Configurations d’énoncés ? Unités d’énoncés ? Regroupements ? J. Deulofeu (2013 : 438) n’est pas plus précis lorsqu’il évoque de manière très générale « les grandes unités dont sont faits les textes ».

C’est donc la question du passage entre le domaine de la macrosyntaxe et celui du discours qui est posée ici. Un exemple peut être fourni par certains faits de parallélisme qui apparaissent fréquemment dans les corpus oraux, au point de constituer de véritables routines discursives. Tel est le cas des regroupements qui présentent une suite de deux Noyaux macrosyntaxiques, d’abord une construction affirmative puis une construction négative :

15. j’ai pas vu grand-chose / j’ai vu que la place (oral, CorpAix)
16. je m’occupe pas des arbres en ce moment / je m’occupe plutôt de la terrasse (oral, CorpAix)

Il est difficile de savoir si ces organisations doivent être considérées comme des types spécifiques de configurations macrosyntaxiques ou si elles échappent à tout conditionnement syntaxique pour ne relever que du domaine textuel.

Un second exemple sera fourni par la forme alors que, lorsqu’elle « apparaît dans des contextes d’énumération ou de simple addition d’unités de discours et souligne un contraste entre les contenus énumérés » (LAFONTAINE, 2015 : 100).

17. Certains bons films ne se regardent qu’une fois ou deux, alors que d’autres peuvent se laisser regarder 100 fois. (écrit, LAFONTAINE, 2015 : 92)

De tels exemples doivent-ils être considérés comme des énoncés macrosyntaxiquement « complexes » caractérisés par une forme spécifique d’« attelage » de Noyaux, ou, ainsi que le propose F. Lafontaine (2015), comme des faits d’organisation textuelle extérieurs au champ grammatical ? De telles questions, qui ne font l’objet d’aucun consensus parmi nous, illustrent bien la nécessité de poursuivre la réflexion sur la nature des « unités maximales » de la macrosyntaxe.

3.2.4 Le recouvrement entre microsyntaxe et macrosyntaxe

Si le recours au niveau macrosyntaxique trouve régulièrement à s’appliquer à la description des relations non rectionnelles (cf. ex. 9), il convient de rappeler que le modèle tel qu’il a été élaboré par l’école aixoise17 a d’emblée été formulé pour prendre également en compte certaines relations rectionnelles. Un exemple classique en serait le procédé de clivage (ex. c’est à Marie que j’ai parlé) analysable comme une construction rectionnelle unique (dans notre exemple, le verbe parler est accompagné des éléments qu’il régit : Sujet et Objet), mais réalisé comme une séquence de deux éléments macrosyntaxiques successifs [Noyau – Postnoyau]. C’est ainsi qu’à côté des divers types de rattachements macrosyntaxiques qui ont pour effet d’intégrer dans une même unité d’énoncé plusieurs séquences qui ne partagent aucun lien de rection, l’organisation macrosyntaxique est également engagée dans de nombreux phénomènes de « dégroupement », par lesquels une seule construction verbale peut se trouver réalisée sous la forme d’une séquence de plusieurs éléments macrosyntaxiques successifs.

Même si l’idée d’un recouvrement possible entre les composantes micro et macro18 a été adoptée de longue date et a été souvent illustrée, notamment à travers la notion de « dispositif de la rection », il n’en demeure pas moins que, pour des raisons qu’on pourrait qualifier de « pédagogiques », la macrosyntaxe a souvent été définie comme le moyen de décrire les relations non rectionnelles, « des relations qu’on ne peut pas décrire à partir des rections de catégories grammaticales » (BLANCHE-BENVENISTE et al., 1990 : 113).

Cette présentation, qui a pu prêter à confusion, sera amenée à évoluer : en 2010, C. Blanche-Benveniste évoque, pour présenter la macrosyntaxe, les « organisations qui ne peuvent être décrites uniquement par des dépendances entre catégories grammaticales » (2010 : 87, nous soulignons).

La nuance est évidemment bienvenue, mais montre qu’il n’est pas si évident de donner une définition précise des domaines couverts par la notion de macrosyntaxe.

Conclusion

Ce tour d'horizon des idées soutenues et développées par l'équipe du GARS a permis de souligner que les orientations engagées dans les années 1970 conservent un caractère actuel.

La linguistique de corpus, qui – nous l’avons rappelé – n’a cessé de se développer, est aujourd’hui un terrain de croisement des disciplines tout à fait intéressant. L’intérêt pour les données ne doit cependant pas être contraint par la modernisation des outils de requêtes et la course à la quantité, ou bien par le seul souci d’archivage et de diffusion. Les connaissances accumulées sur les enjeux de la transcription et les choix méthodologiques en lien avec l’analyse de la langue sont primordiaux et les problématiques soulevées sont très actuelles, comme en témoignent les difficultés en RAP (reconnaissance automatique de la Parole) sur la transcription automatique de la parole spontanée concernant la reconnaissance, entre autres, des phénomènes de mode de planification du discours (répétitions, faux départs, amorces de mots, etc.).

D’un point de vue descriptif, la diversité de réalisation des relations de dépendance et la manière de les décrire demandaient que l’on se dote d’outils pour analyser syntaxiquement des énoncés dont l’organisation originale cadrait mal avec la notion de phrase et ne se suffisait pas d’arguments relevant strictement du discours.

Références bibliographiques

ABEILLE, Anne, GODARD, Danièle, « La Grande Grammaire du Français et la variété des données », Langue française 4, n. 176, 2012, p. 47-68.

ADAM, Jean-Pierre, « Exploitation informatique des corpus de langue parlée au GARS », in BILGER, Mirelle, (ed.), Corpus. Méthodologie et applications linguistiques, Paris/Perpignan: Honoré Champion, 2000, p. 121-126.

BALLY, Charles, Linguistique française et linguistique générale, Paris, Leroux, 1932.

BARRECA, Giulia, CHRISTODOULIDES, George, « Un concordancier multi-niveaux et multimédia pour des corpus oraux », Traitement Automatique du Langage Naturel, 2014.
http://dial.uclouvain.be/pr/boreal/fr/object/boreal%3A145311/datastreams

BERRENDONNER, Alain, « Pour une macro-syntaxe », Travaux de Linguistique, n. 21, 1991, p. 25-36.

BIBER, Douglas et al., Longman Grammar of Spoken and Written English, Pearson Education ESL, 1999.

BILGER, Mireille, (coord.), « Données orales. Les enjeux de la transcription », Cahiers de l'Université de Perpignan, n. 37, Presses Universitaires de Perpignan, 2008.

BLANCHE-BENVENISTE, Claire, Recherches en vue d’une théorie de la grammaire française. Essai d’application à la syntaxe des pronoms, Paris, Champion, 1975.

BLANCHE-BENVENISTE, Claire, « Langue parlée et écrite : décalages entre morphologie et syntaxe », in MOURA, Denilda, (org.), Os múltiplos usos da língua, Maceió, UFAL, p. 16-25.

BLANCHE-BENVENISTE, Claire, « Le recouvrement de la syntaxe et de la macro-syntaxe », in SCARANO, Antonietta, (a cura di), Macro-syntaxe et pragmatique. L’analyse linguistique de l’oral, Roma, Bulzoni, 2003, p. 53-75.

BLANCHE-BENVENISTE, Claire, Le français – Usages de la langue parlée, Paris / Louvain, Peeters, 2010.

BLANCHE-BENVENISTE, Claire, « Les pseudo-clivées et l’effet deux points », in BEGUELIN, Marie-José, AVANZI, Mathieu, CORMINBŒUF, Gilles, (dirs), La parataxe, Berne, Peter Lang, 2010.

BLANCHE-BENVENISTE, Claire, BILGER, Mireille, ROUGET, Christine, VAN DEN EYNDE, Karel, MERTENS, Piet, Le français parlé, études grammaticales, Paris, Éditions du CNRS, 1990.

BLANCHE-BENVENISTE, Claire, DEULOFEU, José, STEFANINI, Jean, VAN DEN EYNDE, Karel, L’Approche pronominale et son application au français, Paris, SELAF, 1984.

BLANCHE-BENVENISTE, Claire, JEANJEAN, Colette, Le français parlé, transcription et édition, Paris, Didier Erudition, 1987.

CADDÉO, Sandrine, « La transcription orthographique pour l'analyse des données orales : un fragile compromis », in DRUETTA, Ruggero, (éd.), Claire Blanche-Benveniste. La linguistique à l'école de l'oral, Sylvain-les-Moulins, Éditions GERFLINT (Coll. Essais Francophones, vol.1), 2012, p. 27-37.

CAPEAU, Paul, GADET, Françoise, « Où en sont les corpus sur les français parlés ? », Revue Française de Linguistique Appliquée, 1, n. 121, 2017, p. 129-133.

COMBETTES, Bernard, « Linguistique diachronique et corpus ; problèmes théoriques et méthodologiques », Colloque annuel de l’AFLS, Nancy, 8-12 septembre, 2011.

CRESTI, Emanuela, « Force illocutoire, articulation topic / comment et contour prosodique en italien parlé », Faits de langue, n.13, 1999, p. 168-181.

CRESTI, Emanuela, Corpus di italiano parlato, I-II, Firenze, Accademia della Crusca, 2000.

DELAHAIE, Juliette, « La grammaire du français parlé en classe de FLE, un problème d’enseignement ou un problème de contenu ? », Enseigner les structures langagières en FLE, Bruxelles, 2008, p. 1-10.

DEULOFEU, José, « La morphosyntaxe globale de Jean Perrot : une réponse structuraliste aux défis de l’analyse syntaxique », in LOFFLER-LAURIAN, Anne-Marie, (éd.), Études de linguistique générale et contrastive, Paris, CRELS, 2001, p. 95-107.

DEULOFEU, José, « L’approche macrosyntaxique en syntaxe : un nouveau modèle de rasoir d’Occam contre les notions inutiles ? », Scolia, n.16, 2003, p. 77-95.

DEULOFEU, José, « L’approche macrosyntaxique : sources et controverses », in DEBAISIEUX, Jeanne-Marie, dir., Analyses linguistiques sur corpus. Subordination et insubordination en français, Paris, Lavoisier / Hermes Sciences, 2013, p. 427-497.

DEULOFEU, José, DEBAISIEUX, Jeanne-Marie, « Une tâche à accomplir pour la linguistique française du XXIᵉ siècle : élaborer une grammaire des usages du français », Langue française 4, n. 176, 2012, p. 27-46.

EQUIPE DELIC, Recherches sur le français parlé, n. 18, Autour du corpus de référence du français parlé, Aix-en-Provence, Publications de l’Université de Provence, 2004.

FOUGEROUSE, Marie-Christine, « L'enseignement de la grammaire en classe de français langue étrangère », Ela, 2, n.122, 2001, p. 165-178.

GADET, Françoise, « Une rencontre inachevée : la sociolinguistique de la langue et la syntaxe du français parlé », in CADDÉO, Sandrine, ROUBAUD, Marie-Noëlle, ROUQUIER, Magali, SABIO, Frédéric, (dirs.), Penser les langues avec Claire Blanche-Benveniste, Presses Universitaires de Provence, 2012, p. 35-43.

LAFONTAINE, Fanny, « Étude micro- et macro-syntaxique de quelques conjonctions à sémantisme oppositif ; alors que, bien que, tandis que, au lieu que », thèse, Aix-Marseille Univ, 2015.

MEILLET, Antoine, VENDRYES, Joseph, Traité de grammaire comparée des langues classiques, Paris, Honoré Champion, 1948.

MOREL, Mary-Annick, DANON-BOILEAU, Laurent, Grammaire de l’intonation. L’exemple du français, Gap / Paris, Ophrys, 1998.

PEROZ, Pierre, (dir.), corpus CLEA (Comment Les Enfants Apprennent à parler à l’école), IUFM de Lorraine, 2012.

RACINE, Isabelle, ZAY, Françoise, DETEY, Sylvain, KAWAGUCHI, Yuji, « De la transcription de corpus à l’analyse interphonologique : enjeux méthodologiques en FLE », in COL, Gilles, OSU, Sylvester N., (eds), Transcrire, écrire, Formaliser, Rennes, PUR, Travaux Linguistiques du CerLiCO 24, 2011, p. 13-30.

WEBER, Corinne, Pour une didactique de l'oralité. Enseigner le français tel qu'il est parlé, Paris, Didier, 2013.

1
J-P. Adam, informaticien, membre de l’INALCO, avait élaboré un logiciel d’interrogation (XCOR), mais il n’a pas été adapté par la suite aux nouveaux systèmes d’exploitation informatique (pour plus de détails, ADAM, 2000).

2
Équipe d’accueil (EA 3779) de l’Université de Provence.

3
Cf. le numéro 18 de la revue Recherches sur le français parlé (équipe DELIC, 2000), qui est entièrement consacré au projet.

4
© J. Véronis

5
L’ensemble du corpus est intégré à la base Orfeo qui sera très prochainement disponible (cf. http://www.projet-orfeo.fr/).

6
Pour un état des lieux couvrant les années 1970-1980, cf. BLANCHE-BENVENISTE et JEANJEAN, 1987.

7
L’agence de la Recherche et de l’Enseignement supérieur est devenue « Le Haut Conseil de l'évaluation de la recherche et de l'enseignement supérieur » (http://www.hceres.fr/) en 2014. Le document source est intitulé « Critères d’identification des chercheurs et enseignants-chercheurs ‘publiants’ ».

8
Cf. la naissance de consortiums comme Corpus, Langues et Interactions (CORLI), labellisé en janvier 2016 (pour un descriptif : http://www.huma-num.fr/consortiums).

9
Cf. Ortolang - Outils et Ressources pour un Traitement Optimisé de la LANGue ou Le consortium IRCOM - Corpus Oraux et Multimodaux http://ircom.huma-num.fr/site/accueil.php.

10
Nous citerons un projet qui n’a pas encore été publié : « La grande grammaire du français » (pour une présentation, cf. ABEILLE & GODARD, 2012).

11
Le logiciel est développé sous windows par Laurence Anthony, Faculty of Science and Engineering, Waseda University, Japon.

12
Dans ce domaine, les progrès sont rapides. En témoigne la conférence de G. Barreca & G. Christodoulides (2014) concernant un concordancier multi-niveaux et multimedia.

13
Pour d’autres illustrations, cf. entre autres BILGER, 2008.

14
L’équipe Lablita (Université de Florence), animée par E. Cresti et M. Moneglia, se saisira, à sa manière, de la notion sur le thème de la description syntaxique, pragmatique et prosodique de l’italien parlé (Cf. CRESTI, 1999 et 2000). Si le terme de macrosyntaxe n’y est pas utilisé, les propositions descriptives de MOREL et DANON-BOILEAU (1998), elles aussi fortement centrées sur l’intonation, s’inscrivent dans une problématique comparable.

15
La définition sera amenée à évoluer ; nous y reviendrons.

16
Dans l’ouvrage qui fonde la macrosyntaxe aixoise, P. Mertens propose un chapitre très développé sur l’intonation. Et dans le tout dernier ouvrage paru en 2010, C. Blanche-Benveniste a sollicité l’expertise de P. Martin.

17
L’école de Fribourg ne partage pas nos vues sur ce sujet.

18
Voir BLANCHE-BENVENISTE, 2003.

Per citare questo articolo:

Sandrine CADDÉO, Frédéric SABIO, Le Groupe Aixois de Recherche en Syntaxe et les recherches actuelles sur le français parlé, Repères DoRiF n.12 - Les z'oraux - Les français parlés entre sons et discours - Coordonné par Enrica Galazzi et Marie-Christine Jamet, DoRiF Università, Roma juillet 2017, http://dorif.it/ezine/ezine_articles.php?id=340

Ritorna alla Barra di Navigazione