Versione stampabile

Françoise GADET, Anaïs MORENO

Des incidences de la proximité sur les données : l’exemple du corpus oral MPF

Françoise Gadet
Université Paris Ouest & MoDyCo
gadet@u-paris10.fr

Anaïs Moreno
Université Paris Ouest & MoDyCo
moreno_anais@hotmail.fr

Résumé

À travers l’étude de deux phénomènes aux fonctionnements bien différents (les marqueurs discursifs et le discours rapporté), cet article qui prend pour base le cadre du corpus MPF visera à s’interroger sur les avantages, les conséquences et les limites d’une approche des données en termes de proximité (par opposition à la distance). Il insistera sur la nécessité de dépasser les critères externes mis en œuvre pour le recueil de données (en particulier les catégorisations socio-démographiques), qui éludent un facteur crucial susceptible d’influencer les productions langagières : la relation entre les interactants.

Malgré de nombreux travaux qui ont pu établir sans ambiguïté que l’oral, tout autant que l’écrit, se manifestait à travers différents genres discursifs1, les préjugés demeurent puissants pour continuer à le regarder comme une version inférieure de la langue, cantonné à l’informel (BLANCHE-BENVENISTE & JEANJEAN, 1986). Et c’est naturellement encore plus le cas pour l’oral ordinaire, que beaucoup considèrent encore comme trop sommaire ou trop monotone pour comporter des genres distincts. Pourtant, parler de l’oral au singulier comme d’un objet homogène, ce serait négliger la grande diversité des produits susceptibles d’émerger dans la large gamme des situations de communication : une audience dans un tribunal ne répond pas aux mêmes exigences qu’une conversation entre amis. Il existe bien des genres oraux, que l’on peut saisir en particulier à travers l’axe immédiat (ou proximité) vs. distance, conçu dans le modèle de KOCH & OESTERREICHER (2001). On mettra dès lors le terme « oraux » au pluriel (comme dans le titre du colloque de Venise), afin de prendre en compte la grande diversité des productions possibles.

1. Le corpus MPF

Parmi les paramètres pouvant influer sur les productions langagières et contribuer à les diversifier, nous avons accordé une place centrale à l’interaction et au degré de proximité entre les interactants : c’est l’exigence essentielle qui a présidé à la constitution du corpus MPF (Multicultural Paris French). Cette option de recueil, si elle permet d’avoir accès à des données « naturelles » ordinaires, se heurte cependant à quelques difficultés de mise en œuvre, le pôle de l’immédiat (de l’ordinaire) s’avérant le plus délicat à documenter.

Le corpus MPF (toujours ouvert) a été recueilli depuis 2010 dans la région de Paris, métropole multiculturelle et multilingue, dans le but d’observer d’éventuels effets sur le français de son contact avec les langues de l’immigration. Nous nous demandons notamment si ces contacts ont des effets sur la langue dominante ; et, en cas de réponse positive, si ce sera à tous les niveaux de la langue qu’ils se manifesteront.

Les locuteurs visés par le projet sont ceux qui sont considérés comme les plus « innovateurs », comme de possibles vecteurs de changements linguistiques et langagiers, les adolescents et jeunes adultes : « adolescents lead other age groups in linguistic change […] and quite probably in the coining of lexical items, discourse markers, intonation patterns, and so forth » (ECKERT,  2004). Plus précisément, il s’agit de « jeunes » de milieu modeste (CONEIN & GADET, 1998), ayant grandi en région parisienne et ayant des contacts multiculturels réguliers.

Cependant, cette catégorisation socio-démographique n’est pas le facteur que nous avons privilégié pour la sélection des témoins, car nous considérons que c’est moins un tel échantillonnage qui serait à l’origine des différenciations entre les façons de parler que les rapports ou relations entre locuteurs, tels qu’ils émergent dans l’échange. C’est pourquoi nous avons accordé un rôle capital à l’interaction en train de se jouer et au degré de proximité communicative entre les interactants. Nous avons dès lors privilégié des liens de réseaux pré-existants aux enregistrements, ce qui a eu pour conséquence de multiplier les enquêteurs (24 au total), les réseaux de chacun étant forcément limités (voir GADET, sous presse). Il y a eu là un investissement lourd pour réaliser des entretiens et recueillir des données écologiques, ces dernières ayant été les plus délicates à recueillir. Le corpus finalisé compte actuellement un peu plus d’un million de mots, plus de 72 heures d’enregistrement mises au point et il illustre les façons de parler de 223 locuteurs différents (les enquêteurs n’étant dénombrés comme locuteurs que quand ils sont partie prenante d’un échange écologique).

Les enquêtes ont été classifiées selon trois catégories, sur la base de l’écoute des enregistrements et non pas à partir de critères externes (voir GADET, 2015). Nous avons ainsi distingué entre « entretiens traditionnels », « entretiens de proximité » et « enregistrements écologiques ». Si la distinction entre les entretiens et les enregistrements écologiques est fondée sur des critères explicitement précis (présence ou non de l’enquêteur2, événement discursif qui se serait produit même sans les besoins de l’enquête vs. provoqué par l’enquêteur), il n’en va pas de même pour les deux types d’entretiens, dont la différenciation est plus ténue et peut-être plus subjective. C’est à travers une écoute attentive des enregistrements réalisés qu’a été instituée la différentiation entre les deux types d’entretiens. Cette classification n’est cependant pas figée, et, au fur et à mesure des analyses, nous avons fréquemment été amenés à recatégoriser des enquêtes (nous reviendrons sur ce point).

Dans le cadre de cet article, nous n’avons pas pris en compte l’ensemble du corpus actuellement disponible : nous nous appuierons sur un sous-ensemble de 24 enquêtes retenues pour leur diversité, 8 pour chaque catégorie :

FGAM 1

Tableau 1 : Les enquêtes prises en compte pour les analyses

Précisons que cet article a avant tout pour objectifs une réflexion autour de la démarche méthodologique mise en œuvre, les méthodes de recueil de corpus oraux dans la proximité et l’évaluation des données ainsi obtenues. Il cherchera à établir l’intérêt de dépasser l’échantillonnage en catégorisations socio-démographiques, en s’intéressant aux effets langagiers de la qualité de relation entre les interactants, plus particulièrement pour des phénomènes relevant de la grammaire et du discours (avec des effets sémantiques et pragmatiques).

Pour davantage de renseignements sur MPF en général, voir GADET (dir. sous presse) ; pour des précisions sur les analyses esquissées ici, voir les références dans chaque partie.

2. Mises en œuvre de l’option de la proximité

En commençant à décrire le corpus MPF, nous ne nous attendions pas à rencontrer des faits linguistiques inouïs, étant donné que les phénomènes qui sont souvent qualifiés « d’émergents » (terme récurrent pour qualifier les parlers jeunes), s’inscrivent pour la plupart dans une certaine continuité avec le français populaire (CONEIN & GADET, 1998 ; GADET, dir. sous presse).

2.1 Des phénomènes « émergents » ?

La notion d’émergence peut s’entendre de différentes façons. Il peut s’agir en effet : 1) de phénomènes inédits en français (c’est le sens auquel pensent immédiatement les médias) ; 2) de phénomènes déjà attestés voire décrits dans l’histoire de la langue, mais dont les contraintes et les collocations apparaissent nouvelles ; ou 3) d’effets du contact avec d’autres langues. Les 3 interprétations ne sont toutefois pas en distribution strictement complémentaire.

Ainsi, si les emprunts lexicaux ne constituent pas un phénomène nouveau, les langues dont ils proviennent et les champs concernés évoluent au cours du temps, en conséquence de contacts de plus en plus diversifiés, avec des langues de plus en plus nombreuses. Les effets du contact sont donc indéniables et omni-présents pour le lexique ; ils demeurent objets de discussions pour le phonique (PATERNOSTRO, 2016) ; mais il reste à se demander si des effets peuvent être observés aux autres niveaux de la langue, en particulier pour la morpho-syntaxe, dont la plus grande résistance au changement est bien établie. Dans quelle mesure est-elle elle aussi perméable au contact ? Et tous les phénomènes variables sont-ils concernés ? (voir POPLACK & LEVEY, 2010 ; MATRAS, 2009).

Nous faisons l’hypothèse que la façon dont le corpus a été constitué, avec la proximité mise en position déterminante, devrait favoriser la présence de phénomènes qui n’émergent que dans la proximité (ou surtout dans la proximité), en eux-mêmes ou compte tenu des contraintes auxquelles ils sont soumis. Mais les phénomènes et les catégories qui peuvent être ainsi concernés, sans être rares, ne sont pas des plus nombreux : la sélection mérite donc d’être soigneusement discutée et justifiée.

On ne reviendra pas ici sur le lexique ; on a exploré ailleurs le phénomène, très variable, que sont les interrogatives (voir GADET, à paraître), formes dont la présence et la diversité sont limitées dans la plupart des corpus reposant sur des entretiens, alors qu’elles sont très fréquentes dans les interactions ordinaires de la vie quotidienne – et elles sont justement très nombreuses dans MPF, en particulier dans les enregistrements écologiques. De plus, elles offrent une diversité dans les formes ordinaires rarement illustrées dans les corpus, comme le montrent (parmi de nombreux autres) les exemples (1) pour une interrogative directe et (2) pour une interrogative indirecte :

(1) Qu'est-ce que tu courses tes frères ? (Nacer3, 2018)

(2) on m’a pris un gâteau mais je sais pas c’est qui (Elodie2, 717)

Les interrogatives, catégorie très variable, permettent bien d’ailleurs d’établir à quel point il est inutile de chercher des phénomènes émergents massifs (quelque chose de radicalement nouveau). Au chapitre des candidats à l’émergence, on aurait aussi pu envisager des phénomènes comme certains emplois de genre (voir TOURON, 2016), qui, au moins pour certains d’entre eux, ne sont pas signalés dans la littérature linguistique de façon ancienne (toutefois, voir YAGUELLO 1998, qui fait déjà mention de formes recueillies tout au long du XXᵉ siècle).

Mais nous prendrons ici des exemples dans d’autres catégories syntaxiques et discursives, en gardant en tête les mises en garde formulées dans BLANCHE-BENVENISTE (2010) quant à la mauvaise connaissance que les linguistes continuent à avoir de la syntaxe de l’oral, du fait de la position vue comme dominée que continue à revêtir l’oral. Nous évoquerons successivement certains marqueurs discursifs et le discours direct, en considérant que, pour des raisons différentes, ces deux catégories fonctionnent comme des indices de proximité entre les interactants.

2.2 Les marqueurs discursifs

Parmi les marqueurs discursifs, nous nous intéresserons ici aux continuateurs3 ou particules d’extension (DUBOIS, 1992) : et tout, nanana, machin, nanani, et tout ça… Ces marqueurs (qui peuvent parfois se cumuler) occupent une position finale dans l’énoncé ; ils ont pour fonction d’indiquer qu’il y a une suite à concevoir (CAPPEAU & MORENO, sous presse parlent aussi de « prolongateurs de listes »). Ces éléments peuvent être regardés comme des indices de coopération communicative, de proximité, dans la mesure où ils ne peuvent remplir pleinement leur rôle que si l’énonciateur sait pouvoir compter sur l’implicite et la connivence de la part du/des interactant(s), permis par le grand nombre de connaissances partagées, de façon contextuelle ou générale. Ils apportent un sous-entendu du type : « tu vois ce que je veux dire », « à toi de restituer la suite »…

Nous prendrons ici l’exemple de et tout, d’un usage très fréquent dans plusieurs enquêtes de MPF. À titre d’exemple, on en trouve 64 occurrences dans Wajih4 (79 mn – voir exemple (3)) et 54 dans Emmanuelle2 (56 mn – voir exemple 3). Ces deux extraits, chacun d’une durée de quelques secondes, en contiennent plusieurs :

(3) Même sa mère elle a vu et tout dès qu’il est sorti et tout il avait des bleus et tout. (Wajih4, 2869)

(4) Et après je sais pas (.) deux minutes après on est devenu on est (.) on a parlé et tout on a moi j'ai dit vas-y arrête Rimka on passe et tout on se tape et tout. (Emmanuelle2, 1527)

Parmi les 24 enquêtes ici prises en compte, les occurrences de et tout4 se répartissent comme suit :

FGAM 2

Tableau 2 : Le marqueur discursif et tout dans les différentes catégories d’enregistrement

À première vue, la fréquence d’apparition à la minute de et tout distingue nettement les enregistrements écologiques des entretiens. En revanche, l’écart n’est pas net entre les deux types d’entretiens, les entretiens traditionnels comportant un peu plus d’occurrences que les entretiens de proximité. Pour autant, l’hypothèse des effets de la proximité ne nous semble pas à remettre totalement en cause. La moyenne pour les entretiens traditionnels (0,29) peut en effet en partie s’expliquer par des emplois dédoublés de et tout dans l’enquête Anaïs2, à plusieurs reprises :

(5) il y en a beaucoup qui font genre les (..) enfin pff comment dire ça genre je fume et tout et tout et tralala tralali ça fait pitié quoi voilà. (Anaïs2, 369)

Ces marqueurs doubles ont pour effet d’augmenter le nombre d’occurrences et la moyenne de l’ensemble des entretiens traditionnels – l’alternative aurait été de les regarder comme un élément spécifique, et tout et tout, et donc de ne pas les prendre en compte avec les autres. Il faut aussi observer que les enquêtes divergent fortement les unes des autres de ce point de vue et l’emploi massif et récurrent de et tout pourrait s’interpréter comme une sorte de tic langagier, propre à certains locuteurs. Ainsi par exemple, sur les 64 occurrences rencontrées dans l’enquête Wajih4, 59 sont le fait du même locuteur. De façon complémentaire, et tout est tout à fait absent de plusieurs enregistrements, dans lesquels d’autres locuteurs font usage d’autres continuateurs. Ainsi, ces observations viennent conforter l’observation de FERRE (2009) : « chaque locuteur se ‘spécialise’ dans l’emploi d’une particule par rapport aux autres ».

Mais ce qui semble ne pas exister (en tous cas, que nous n’avons pas rencontré), ce sont des discours de proximité qui seraient entièrement dépourvus de tels continuateurs : TAGLIAMONTE (2016) en fait d’ailleurs une spécificité des façons ordinaires de parler des adolescents (son ouvrage porte sur l’anglais, mais les jeunes français ne semble pas différer sur ce point – voir aussi plus haut la citation de ECKERT, 2004).

2.3 Le discours rapporté (DR)

Le discours direct (désormais DD) constitue un phénomène très fréquent dans les interactions ordinaires et offre, plus que d’autres formes de DR, l’illusion que les propos cités sont fidèles à l’original. Le DD nous intéresse aussi du fait qu’il répond à une mise en scène, une théâtralisation de voix in absentia (qui peut d’ailleurs constituer la mise en scène de sa propre voix, dans le cas des autocitations).

2.3.1 Fréquence d’emploi et indices du Discours Direct

Avant de donner quelques chiffres, il convient de définir succinctement le discours direct et de présenter les indices qui le balisent. Traditionnellement, et d’une façon qui correspond mieux à l’écrit qu’aux discours ordinaires, le DD est défini comme épousant la forme canonique :

  • « verbe introducteur + signes typographiques (guillemets, tiret, deux points – tous signes qui n’ont pas d’équivalent à l’oral) + concordance des temps »

L’exemple suivant en constitue une illustration :

(6) Pierre m’a dit : « je pars demain. » (exemple construit)

Cependant, même à l’écrit et sans doute encore plus à l’oral, ces caractéristiques ne sont pas toutes toujours présentes : « parmi les caractéristiques du DD […], il n’y en a aucune qui constitue un trait nécessaire au DD » (KOMUR-THILLOY, 2010).

Nous allons ici nous limiter aux indices encadrant le DD : verbes introducteurs, explicitations correspondant à la verbalisation d’informations complémentaires, particules d’amorce (voir (7)) et d’extension (voir (8)) ; enfin, pause entre le verbe introducteur et le discours cité (cette dernière n’étant ici qu’évoquée par sa prise en compte dans les moyennes d’indices) :

(7) Tu as dit à Noëlle ouais j'ai peur de Mylène j'ose pas lui dire voilà (Elodie2, 556)

(8) Et direct il lui envoie un message sur FB […] ouais (.) comment ça tu te fous de ma gueule et tout (Zakia3, 312)

Afin d’évaluer la fréquence du DD, nous avons calculé le nombre d’occurrences par minute5 :

FGAM 3

Tableau 3 : Les occurrences de DD par minute dans les différentes catégories d’enquêtes

On observe d’importantes disparités selon les différents types d’enquêtes. Plus on s’approche du pôle de la proximité, plus la fréquence de DD est élevée : les entretiens de proximité comptent presque deux fois plus d’occurrences à la minute que les entretiens traditionnels, et les enregistrements écologiques en comptent presque deux fois plus que les entretiens de proximité. Ainsi, la distinction entretiens/écologiques apparaît-elle aussi pertinente que celle entre les deux types d’entretiens. La présence de DD parait dès lors constituer un bon indice d’implication du locuteur dans son discours et un indice de proximité.

Quant aux indices signalant le DD, nous postulons que plus la distance entre interactants est grande, plus il est besoin de marquer le DD de façon explicite. Au contraire, dans une relation de proximité, les interactants peuvent faire l’économie de certains indices, compte tenu des savoirs implicites qu’ils partagent. Pour rendre compte de l’emploi d’indices dans chaque situation, nous avons calculé des moyennes6 :

FGAM 4

Tableau 4 : Moyenne d’indices du DD dans les différentes catégories d’enquêtes

À première vue, ces résultats ne confortent pas l’hypothèse : il y a moins d’indices dans les entretiens de proximité que dans les données écologiques. Cependant, plutôt que d’abandonner l’hypothèse, nous allons chercher à comprendre pourquoi un tel résultat. Tout d’abord, les données écologiques, contrairement à la distinction entre les deux types d’entretiens, reposent moins sur la proximité des interactants que sur le naturel social d’un événement qui se serait déroulé même sans l’enregistrement. Les données écologiques relèvent donc de situations très diverses et le continuum des degrés de proximité est plus étendu que pour les entretiens. Ainsi, parmi les enquêtes écologiques, nous avons enregistré un rendez-vous de travail (Roberto4d). Même si l’enregistrement est décontracté, entre copains, il reste quelque chose de formel du fait des objectifs professionnels. A contrario, les enquêtes de Wajih ont été classées comme entretiens de proximité, bien qu’elles soient à la limite de l’écologique et tendent vers la conversation ordinaire : ayant pris place dans le cadre d’un entretien avec un enquêteur (même si Wajih est perçu comme un proche), elles ne sont pas écologiques. Pourtant, à l’écoute, elles apparaissent moins formelles que le rendez-vous de travail. Cette différence est confortée par les chiffres : l’enquête Wajih5 compte une moyenne de 2 occurrences par minute, contre 0,9 occurrences pour l’enquête Roberto4d.

De plus, il s’agit de moyennes, qui ne rendent pas compte de différences d’emploi d’indices au sein d’une catégorie et parfois chez un même locuteur, comme en témoignent les deux exemples suivants :

(9) Ils ont (.) tu sais ils ont pris ma daronne tout ça après ils lui ont parlé tout ça ils lui ont dit ouais (.) faut dire à son f- faut dire à votre fils tout ça (.) qui qu’il do- qu’il donne le n- qu’il donne le nom de ses potes sinon si- c’est vous allez tout payer tout ça. (Wajih3, 629)

(10) Il disait comment j'aimerais trop que tu te manges une grande baffe devant moi toi. (Wajih3, 542)

En (9), le locuteur indique le DD au moyen d’un verbe introducteur, une particule d’amorce et une particule d’extension ; mais il n’y a qu’un verbe introducteur en (10). Les indices sont donc sujets à des variations qui jouent sur les résultats. Ils indiquent des tendances globales, d’où il ressort bien que dans les entretiens traditionnels, plus proches de la distance, le DD est davantage marqué et signalé par les locuteurs (voir MORENO, 2016).

2.3.2 Wesh et zaama : des particules de proximité ?

Nous nous intéresserons à présent aux introducteurs de DD que nous appelons « particules d’amorce », que nous allons classer en plusieurs catégories. Au-delà d’introducteurs « classiques », largement partagés avec l’écrit, d’autres commencent à être assez bien renseignés dans la littérature, comme genre (YAGUELLO, 1998 ; ROSIER, 2008 ; VIGNERON, 2013 ; TOURON, 2016…), la locution être là ou comme quoi. Toutefois, cela n’exclut pas la créativité : ainsi, alors que comme quoi est habituellement traité comme un introducteur de discours indirect (LEFEUVRE, 20037), nous avons relevé plusieurs exemples où il introduit un DD :

(11) Et il leur a dit une phrase comme quoi déjà vous m'envoyez ça à moi mais bande de cons vous parlez de ça mais vous utili- leur tru- en gros vous utilisez vous leur compte (Wajih5, 2679).

(12 ) il a dit comme quoi j'aurais dû (.) de prof- de rester avec mes parents je profite avec mes parents (Anna13, 1910)

Il pourrait s’agir là d’un mode émergent d’introducteur de DD, ce qui sera à vérifier avec davantage de données. D’autres introducteurs sont encore moins attendus, notamment l’entrée dans le DD par une question. Le pronom interrogatif quoi permet de construire une interrogation partielle laissant attendre une réponse orientée (CAPPEAU & MORENO, sous presse). Ce mode d’introduction appuie la mise en scène et met en relief les propos cités :

(13) Après ils nous disent quoi ? (.) Ouais on va appeler vos parents ils vont venir vous chercher (Wajih3, 460)

Mais on trouve encore d’autres modalités d’introduction, avec des particules comme wesh et zaama, qui sont peu fréquentes et n’ont pour le moment été relevées que dans des situations de proximité8 :

(14) Tu dis wesh faut faut sortir tu te dis wesh mais il faut sortir armé maintenant c'est c'est quoi le délire. (Zakia3, 2171)

(15) Moi il y a un mec qui est à la boxe avec moi il m'a dit (.) zaama Aulnay c'est chaud tout ça. (Wajih4, 3230)

Toutes deux empruntées à l’arabe, ces particules signifient respectivement quoi ou comment et genre. Elles sont souvent dites typiques des parlers jeunes, et sont référencées dans des dictionnaires comme le Dictionnaire de la zone. Elles seraient donc de bons candidats pour entrer dans des corrélations générationnelles. Mais les données de MPF conduisent à mettre en cause ce type de corrélation. Seuls 9 locuteurs (sur 49) emploient spontanément wesh parmi nos 24 enquêtes. Ils sont âgés de 15 à 24 ans et 6 d’entre eux ont des origines maghrébines. De ce point de vue, l’âge et l’origine des locuteurs pourraient être regardés comme des facteurs favorisant l’emploi de wesh, mais pas de façon exclusive. Cependant, cette observation est insuffisante, à la fois parce qu’il y a des locuteurs d’origine maghrébine qui n’en font pas usage et parce qu’il y a des locuteurs faisant usage de wesh qui ont des origines différentes, dont franco-françaises. La particule zaama est, quant à elle, utilisée par seulement 3 locuteurs, tous d’origine maghrébine. Mais comme pour wesh, si ce facteur était suffisant, on en aurait relevé davantage d’occurrences, chez des locuteurs de même profil.

Au-delà des caractéristiques socio-démographiques, il faut souligner l’absence de ces particules dans les entretiens traditionnels, dont certains concernent pourtant des locuteurs avec des profils apparemment similaires (jeunes, d’origine maghrébine). Cette remarque confirme qu’il faut songer à d’autres facteurs pour comprendre l’emploi de ces formes. En classifiant nos données en fonction des conditions de réalisation des enquêtes (entretiens vs écologiques) et du degré de proximité (traditionnels vs proximité), nous avons d’emblée postulé que la relation entre les interactants pouvait influer sur les productions des locuteurs.

Les particules constituent un exemple parmi d’autres de la pertinence de cette approche. En effet, le plus grand nombre d’occurrences de wesh et zaama a été relevé dans les enquêtes de Wajih. Ce dernier fréquentait régulièrement les locuteurs qu’il enregistre, ayant vécu plusieurs années dans le même quartier de Mantes-la-Jolie et ayant été assistant d’éducation dans un collège de la ville. Il partage avec ses interlocuteurs, en plus d’un passé/vécu commun (le quartier), une culture et une langue (l’arabe)9. L’ancienneté de relation et le nombre de connaissances partagées pourraient jouer sur l’emploi des particules, en plus de considérations sociales et/ou ethniques. Autrement dit, il ne suffit pas d’être « jeune » et d’origine maghrébine pour en faire usage. La situation de communication et les liens entre interactants en présence sont des paramètres tout aussi décisifs.

3. Remarques conclusives : retour sur les données, les méthodes de recueil et la classification des enquêtes

Avoir constitué le corpus en se reposant sur le degré de connivence entre les locuteurs comporte à la fois des avantages et des inconvénients et nous avons cherché à ne pas passer outre à ces derniers.

3.1 Des critères pour la proximité ?

La décision de privilégier les liens de réseaux des enquêteurs a eu pour conséquence qu’aucun informateur de MPF n’est un total inconnu. De ce point de vue, nous aurions pu nous attendre à n’avoir affaire qu’à une seule catégorie « entretien », par opposition avec les données écologiques (voir GADET, 2015). Mais ce que le corpus offre à entendre/voir, ce sont au contraire des données assez nettement diversifiées : une large palette de données orales. La distinction attribuée ultérieurement entre deux types d’entretiens, quant à elle, peut paraître fragile, mais il s’agissait avant tout d’en faire un premier mode d’évaluation parmi les enquêtes. Dans la façon dont elle a été conçue, cette distinction ne repose pas en effet en premier lieu sur la nature des liens entre les interactants, mais sur des traits langagiers et/ou linguistiques perceptibles à l’écoute. Ce n’est que dans un second temps que nous nous sommes rendu compte que les locuteurs enregistrés dans ce que nous avions appelé « entretiens de proximité » entretenaient un passé conversationnel plus important avec l’enquêteur.

Si l’on s’appuyait uniquement sur le degré de proximité supposé entre les interactants, il n’y aurait pas davantage de distinction entre entretiens et écologiques. La relation entre les interactants ne suffit donc pas à elle seule pour réaliser un classement pertinent des enregistrements ; il faut aussi prendre en compte le déroulement des interactions, ainsi que ce qui se joue entre les interlocuteurs – facteurs difficiles à quantifier et même à observer.

La tentative pour établir des critères précis nous a amenés à reclasser plusieurs enregistrements au fur et à mesure que des analyses étaient pratiquées et que de nouveaux critères étaient établis. Nous avons par exemple reclassé l’enquête Marion1, qui avait initialement été considérée comme écologique : Marion interagit avec des amis d’enfance qui constituent sa bande habituelle d’amis. La très forte proximité entre les interactants est manifeste audiblement, dans la présence de nombreux phénomènes para-linguistiques et de formes surtout activées dans la proximité. Cependant, Marion se met dans une position d’enquêteur, du fait qu’elle cherche à orienter ses questions sur un sujet qui ne relève pas de la sociabilité ordinaire d’une bande d’amis : leurs façons de parler. On y vérifie de nouveau la ressemblance entre certains entretiens de proximité et certains enregistrements écologiques, et on conforte ainsi l’une de nos hypothèses, selon laquelle les enregistrements occupent des positions diversifiées sur un continuum, loin de se présenter en simple dichotomie ou en grands types identifiables.

De plus, la proximité entre les interactants constitue un paramètre trop instable et labile, en raison de sa subjectivité, pour être retenu comme un critère a priori : il parait difficile en effet de chercher à quantifier le « degré de connivence entre interactants ». Il est par ailleurs probable que ce que perçoit le chercheur, en tant qu’observateur extérieur à l’échange ne disposant que de l’écoute des enregistrements et des fiches de métadonnées, ne correspondra que pour partie à ce qui se joue véritablement dans l’interaction – et il n’en va qu’à peine différemment si le descripteur est aussi l’enquêteur. Il ne saurait y avoir de critère indiscutable permettant de quantifier la proximité entre interactants. Y a-t-il d’ailleurs seulement là une question pertinente ? On peut avancer deux arguments pour considérer que tel n’est pas le cas : 1) la connivence n’est pas un facteur figé ou immuable, elle peut évoluer, s’ajuster, se négocier, se renforcer ou au contraire diminuer, parfois au cours d’un même échange. Ainsi, si nous trouvions un moyen de quantifier efficacement la proximité (ce qui, selon nous, est impossible10), ce ne pourrait être que pour un instant T de l’échange. 2) Un critère objectif de proximité pourrait être constitué par la fréquence des échanges. Cependant, interagir souvent ne préjuge pas du développement d’un sentiment de proximité (on peut discuter fréquemment avec des collègues, sans pour autant se sentir proche d’eux, sans partager autre chose que le travail).

Nous avons néanmoins continué à essayer d’établir d’autres critères, qui pourraient être formulables voire quantifiables comme indices de proximité. Outre les deux exemples abordés dans la partie précédente, outre les faits de lexique (voir GUERIN & WACHS, sous presse), on peut évoquer le débit11 ou encore les chevauchements, qui sont en général peu nombreux dans les entretiens traditionnels (voir GADET, sous presse), et au contraire fréquents dans les enregistrements écologiques. Les chevauchements peuvent être vus comme des effets de la négociation entre deux locuteurs rivalisant pour la parole. Négocier la prise de parole semble davantage un enjeu dans les situations de proximité que dans la distance, où les tours de parole de chaque interlocuteur sont plutôt respectés (nous ne parlons pas ici de débats, par essence plus conflictuels). D’autres indices apparaissent plus ambigus : c’est surtout le cas des silences et des rires qui, s’ils peuvent être des signes de décontraction, peuvent parfois aussi constituer des signes de malaise. Enfin, tous les indices ne revêtent certainement pas le même poids, et il faudrait savoir comment les hiérarchiser.

3.2 Les avantages de la proximité pour les enquêtes de MPF

Il est hors de doute qu’aucune classification n’est parfaite, qu’aucun corpus ne présentera jamais la totalité des faits linguistiques d’une langue, et qu’aucune option de recueil ne saurait documenter toute la gamme de tous les faits linguistiques et langagiers. La diversité des interactions, parfois au sein de ce qui pourrait être qualifié de même « type » ou « genre » de données, invite ainsi à mettre le terme « oral » au pluriel. On peut d’ailleurs aller jusqu’à se demander s’il n’existerait pas autant de « types oraux » qu’il y a d’interactions, tant les situations de communication et les paramètres à prendre en compte sont nombreux, complexes et intriqués de façon serrée.

Pourtant, malgré les limitations qu’elle induit (mais y a-t-il des corpus qui ne connaîtraient pas de limitations ?), l’option de la proximité fait pleinement sens, pour l’oral ordinaire certainement et encore plus pour la population visée par MPF, compte tenu de l’organisation sociale des jeunes concernés, en réseaux de connaissances serrés, cohésifs et multiplexes. C’est pourquoi nous avons fait l’hypothèse d’une congruence entre l’organisation sociale des groupements de jeunes, qui pourrait difficilement demeurer sans effets langagiers, et le degré de connivence, qui joue sur l’intensité de la collaboration communicative des locuteurs et tire parti des savoirs et des connaissances (implicites) qu’ils partagent, selon des manifestations langagières certainement diverses.

Si la question « qui parle ? » (sans oublier « à qui ? ») reste néanmoins pertinente pour décrire les corpus, il arrive souvent que les formes qui peuvent être considérées comme émergentes dépassent les catégorisations générationnelles et/ou ethniques préétablies, qui perdent dès lors quelque peu de leur importance. En ce sens, la conception traditionnelle en « langue des jeunes » ou « parlers jeunes » est problématique. Il apparaît en effet que ces façons de parler ne sont plus l’apanage de jeunes et qu’il s’agit plutôt d’un français parmi d’autres, adopté par certains et négligé par d’autres, qui constitue désormais une façon sociale de parler dans la proximité. C’est pourquoi le terme Vernaculaire Urbain Contemporain (RAMPTON, 2011) ouvre des perspectives interprétatives intéressantes. Il est conçu par Rampton comme l’ensemble des formes et des pratiques linguistiques émergeant dans des « quartiers urbains ethniquement mixtes » et sa définition ne fait référence ni à l’âge ni à l’ethnicité de ses locuteurs, en ne retenant que deux caractéristiques : sa circulation ordinaire dans les villes, bien au-delà des locuteurs jeunes ; et le fait qu’il peut perdurer chez certains locuteurs, bien au-delà de la jeunesse.

Références bibliographiques

BLANCHE-BENVENISTE, Claire, Le français. Usages de la langue parlée, Peeters, Leuven et Paris, 2010.

BLANCHE-BENVENISTE, Claire, & JEANJEAN, Colette, Le français parlé, transcription et édition, Paris, Didier-érudition, 1986.

BOUQUET, S., (dir.), Les genres de la parole, Revue Langages n° 153, Armand Colin, 2004.

CAPPEAU, Paul, & MORENO, Anaïs, « Les tendances grammaticales », Les parlers jeunes dans l'Ile-de-France multiculturelle, in GADET, F., (dir), (sous presse).

CONEIN, Bernard, & GADET, Françoise, « Le “français populaire” des jeunes de la banlieue parisienne entre permanence et innovation », in ANDROUTSOPOULOS, J., & SCHOLZ, A., Jugendsprache / Langue des jeunes / Youth language, Frankfurt, Peter Lang, 1998, p. 105-123.

Dictionnaire de la zone, http://www.dictionnairedelazone.fr/

DUBOIS, Sylvie, “Extension particles, etc.”, Language Variation and Change n° 4, 1992, p. 179-203.

ECKERT, Penelope, “Adolescent language”, in FINEGAN, E., & RICKFORD, J., (eds), Language in the US : Themes for the Twenty-first Century, New-York, Cambridge University Press, 2004, p. 361-374.

FERRE, Gaëlle, « Analyse multimodale des particules d’extension “et tout ca, etc.” en français », in YOO, H.-Y., and DELAIS-ROUSSARIE, E., (eds.), Proceedings of interface Discours & Prosodie (IDP09), Paris, France, 2009, p.157- 171.

GADET, Françoise, « Le style et les corpus : réflexions à partir d’un corpus de la région parisienne », in JEPPESEN KRAGH, K., & LINDSCHOUW, J., (eds), Les variations diasystématiques et leurs interdépendances dans les langues romanes, Copenhague, ELiPhi Editions de Linguistique et de Philologie, 2015, p. 339-352.

GADET, Françoise, « Pour étudier les parlers jeunes », in GADET, F., (dir), Les parlers jeunes dans l'Ile-de France multiculturelle, Paris, Ophrys, 2017, pp.27-53.

GADET, Françoise, (Dir.), Les parlers jeunes dans l'Ile-de France multiculturelle, Gap et Paris, Ophrys (collection l’Essentiel français), 2017.

GADET, Françoise, « Nouveau corpus d’oral, nouvelles données, nouveaux questionnements : vers de nouveaux outils d’analyse ? », in CAPPEAU, P., (éd), Une grammaire à l'aune de l'oral, (à paraître).

GUERIN, Emmanuelle, & WACHS, Sandrine, « Dynamique des mots », in Les parlers jeunes dans l'Ile-de France multiculturelle, in GADET, F., (dir), Les parlers jeunes dans l'Ile-de France multiculturelle, Gap et Paris, Ophrys (collection l’Essentiel français), 2017, pp.101-125.

KOCH, Peter, & OESTERREICHER, Wulf, « Langage oral et langage écrit », Lexikon der Romanistischen Linguistik, 1-2. Tübingen : Max Niemeyer Verlag, 2001, p. 584-627.

KOMUR-THILLOY, Greta, Presse écrite et discours rapporté, Paris, Orizons, 2010.

LEFEUVRE, Florence, « Comme quoi en diachronie », in COMBETTES, B., MARCHELLO-NIZIA, C., & PREVOST, S., (éds), La grammaticalisation en français, Verbum XXV-4, Presses de l’Université de Nancy, 2003, p. 455-468.

MATRAS, Yaron, Language Contact, Cambridge University Press, 2009.

MORENO, Anaïs, Le discours rapporté dans les interactions ordinaires : l’effet de la proximité et des communautés de pratique sur sa construction à l’oral et à l’écrit, Thèse de doctorat, Université Paris Ouest Nanterre La Défense, 2016.

PATERNOSTRO, Roberto, Diversité des accents et enseignement du français. Les parlers jeunes en région parisienne, Paris, L’Harmattan, 2016.

POPLACK, Shana, & LEVEY, Stephen, "Contact-induced grammatical change: A cautionary tale", in AUER, P., & SCHMIDT, J.E., (eds), Language and Space. An International Handbook of Linguistic Variation, Mouton de Gruyter, 2010, p. 391-419.

RAMPTON, Ben, « From ‘multi-ethnic adolescent heteroglossia’ to ‘Contemporary urban vernaculars », Language & Communication 31, 2011, p. 276-294.

ROSIER, Laurence, Le discours rapporté en français, Paris, Ophrys, 2008.

TAGLIAMONTE, Sali, Teen Talk. The Language of Adolescents, Cambridge University Press, 2016.

TOURON, Julie, Tu vois le genre ? Mémoire de Master2, Université de Paris Ouest Nanterre la Défense, 2016.

VIGNERON, Jeanne, « Genre en français, like en anglais et so en allemand : mise en scène et mise à distance dans le discours direct », in CHUQUET, H., NITA, R. & VALETOPOULOS, F., (dir), Des sentiments au point de vue, Étudesde linguistique contrastive, Presses Universitaires de Rennes, 2013, p. 195-210.

YAGUELLO, Marina, Petits faits de langue, Paris, Seuil, 1998.

1
Voir par exemple la revue Langages qui a consacré un numéro aux « genres de la parole » (BOUQUET, 2004), à la fois à l’oral et à l’écrit.

2
L’enquêteur est présent dans beaucoup d’enregistrements écologiques, mais la définition même du terme implique que celui-ci soit perçu comme un pair par les interactants et que l’enregistrement n’ait pas été provoqué pour les besoins de l’enquête.

3
Les continuateurs ne sont pas toujours regardés comme des marqueurs discursifs : FERRE (2009) présente une synthèse de différentes études dont les conclusions divergent. Elle en conclut que « le statut des particules d’extension n’est toujours pas déterminé […] ».

4
Nous nous sommes ici concentrées sur et tout en laissant de côté et tout ça.

5
Pour obtenir ces moyennes, nous additionnons la durée des enquêtes pour une catégorie et divisons le nombre d’occurrences par la durée. Ainsi, pour les données écologiques, la durée cumulée des 8 enregistrements est 313 mn, pour 683 occurrences. Soit 683/313 = 2,18.

6
Ces moyennes ont été obtenues en additionnant les indices présents dans une enquête. Nous avons divisé le total par le nombre d’occurrences. Ces « sous-moyennes » ont ensuite été additionnées et divisées par le nombre d’enquêtes pour obtenir une moyenne par type de situation. Ainsi, pour les entretiens de proximité, l’addition des moyennes d’indices est de 3,09 pour 8 enquêtes : 3,09/8 = 0,386.

7
Toutefois, Lefeuvre a travaillé sur un corpus de textes littéraires du XVIIᵉ au XXᵉ siècle, ce qui pourrait en partie expliquer qu’elle n’ait pas relevé l’emploi de comme quoi en tant qu’introducteur de DD. Cet emploi semble récent et on le rencontre surtout dans des situations de communications ordinaires, orales ou écrites.

8
Il y a toutefois des occurrences de wesh et zaama dans certains « entretiens traditionnels », mais leur emploi répond à des sollicitations de l’enquêteur. Les particules sont en revanche employées de façon spontanée dans les entretiens de proximité et les enregistrements écologiques, et nous n’avons retenu ici que cet usage. De plus, nous ne parlons que de wesh et zaama particules d’amorce, en contexte de DD.

9
La majorité des jeunes d’origine maghrébine enregistrés dans MPF ne sont pas véritablement des locuteurs de l’arabe, mais même quand ils ne le parlent pas du tout, l’arabe est partie prenante de leur imaginaire langagier et à ce titre on pourrait dire qu’il fait partie de leur répertoire.

10
Néanmoins, en nous appuyant sur les différents paramètres de KOCH & OESTERREICHER (2001) (communication privée/publique, interlocuteur intime/inconnu, émotionnalité forte/faible, communication spontanée/préparée), nous pouvons nous rapprocher encore davantage d’une classification des données sur le continuum proximité/distance. Soulignons toutefois que, si certains paramètres sont facilement identifiables (sphère publique/sphère privée), d’autres, comme la relation entre les interactants sont, comme nous l’avons déjà évoqué, plus subjectifs. Notamment, il existe de multiples nuances entre les pôles de l’interlocuteur inconnu et de l’interlocuteur intime. On mesure ainsi à quel point toutes les démarches qui ne mettent en avant qu’une seule dimension, quel que soit l’intérêt de ce qu’elles permettent de montrer, ont pour effet de simplifier à l’extrême ce qui est de fait fort complexe.

11
Au-delà d’un indice global fourni par le ratio entre durée de l’enregistrement et nombre de mots, il s’agit de fait d’un phénomène difficile à quantifier, compte tenu des constantes variations de débit au cours d’une même enquête.

Per citare questo articolo:

Françoise GADET, Anaïs MORENO, Des incidences de la proximité sur les données : l’exemple du corpus oral MPF, Repères DoRiF n.12 - Les z'oraux - Les français parlés entre sons et discours - Coordonné par Enrica Galazzi et Marie-Christine Jamet, DoRiF Università, Roma juillet 2017, http://dorif.it/ezine/ezine_articles.php?id=345

Ritorna alla Barra di Navigazione