Versione stampabile

Maude ELOLA, Marie-Noëlle ROUBAUD

La compréhension du lexique dans les manuels scolaires d’histoire : Un exemple de recherche en lisibilité linguistique.

Maude Elola
LPL, Aix-Marseille Université
maude.ELOLA@etu.univ-amu.fr


Marie-Noëlle Roubaud
LPL, Aix-Marseille Université
marie-noelle.roubaud@univ-amu.fr

Résumé

Cet article s’inscrit dans le cadre d’une recherche universitaire concernant la lisibilité linguistique des textes dans des manuels scolaires d’histoire pour des élèves de 9 à 11 ans. Certaines études sur la lisibilité ont intégré à leur modèle des listes de fréquence lexicales pour extraire les mots opaques des textes. Prenant ce parti, nous avons étudié la lisibilité d’un ensemble de manuels d’histoire, à travers l’emploi de certaines formules de lisibilité et la comparaison avec des listes de fréquence. Cependant, il nous semble que cette méthode comporte des risques, notamment parce que les paramètres régissant les formules sont la plupart du temps formels et ne considèrent le mot que comme une unité libre, sans lien avec son contexte (la phrase, par exemple). Dans cette optique, nous nous sommes alors intéressées à la compréhension des textes étudiés par des élèves de CM1 et CM2. En effet, il nous semble que c’est à travers l’analyse de la compréhension que nous pourrons comprendre d’où proviennent les problèmes de lisibilité. Deux textes de manuels ont été choisis et les mots dits opaques en ont été extraits. À partir de ces mots, classés selon leur potentiel de difficulté de compréhension, nous avons élaboré un questionnaire, pour essayer d’identifier les raisons de leur incompréhensibilité, le but étant d’analyser les stratégies de compréhension employées par les élèves. Les premières conclusions tendent à montrer que la prise en compte du lexique comme unité isolée n’est pas une stratégie gagnante, et que le contexte a un poids très fort (paramètre souvent oublié dans les formules de lisibilité).

Abstract

This article is part of a larger research project on the linguistic readability of texts from history school textbooks for pupils from age 9 to 11. Some studies on readability have used lexical frequency lists in their theoretical model to extract opaque words from texts. By this means, we studied the readability of a corpus of history textbooks, using mathematical readability formulas as well as comparing the words to lexical frequency lists. However, this strategy alone seems not without risk, mainly because the parameters operating the formulas are, most of the time, formal, and only acknowledge the word as a free unit, disregarding its context (the sentence, for example). In this regard, we studied the comprehension of texts from textbooks destined to pupils from French classes CM1 and CM2 (the third cycle of primary school in France). It appeared to us that analyzing comprehension would lead us to a better understanding of the origin of readability issues. Two texts were selected in textbooks and opaque words were extracted using the aforementioned protocol. From these words, sorted by order of potential comprehension difficulty, we created a question sheet, aiming to understand the reasons behind their difficulties. The aim was to analyze the comprehension strategies employed by the pupils. Our first conclusions tend to emphasize that acknowledging the lexicon as a single unit is not a rewarding strategy, as well as showing the utmost importance of context, a parameter often overlooked in readability formulas.

Introduction

Les manuels scolaires font l’objet de critiques récurrentes portant, notamment, sur les choix pédagogiques des auteurs, les idées véhiculées, les approximations, voire les erreurs qui s’y trouvent (LEROY 2012). Différentes recherches sur le terrain ont également mis en avant des difficultés dans l’utilisation des manuels et leur appropriation par les élèves et les enseignants, portant notamment sur la lisibilité des textes (LEROY 2012). La présente étude, qui s’inscrit dans un travail doctoral plus vaste1, s’intéresse à la lisibilité linguistique de deux textes, sélectionnés sur un ensemble de 24 manuels d’histoire pour le CM1 (élèves de 9-10 ans) et le CM2 (élèves de 10-11 ans).

Nous donnerons dans un premier temps un aperçu des recherches sur la lisibilité et centrerons notre analyse sur le traitement lexico-syntaxique des textes choisis en nous référant aux listes de fréquence. Ces dernières nous ont permis d’établir le niveau probable d’opacité des mots dans le corpus de recherche et de les classer (cf. partie 1). Nous avons alors mené une expérimentation afin de vérifier la pertinence de notre classement et les sources des difficultés. Pour cela, nous avons interrogé des élèves de CM1 et de CM2 sur le sens de certains mots (cf. partie 2). En effet, il existe un lien très fort entre lisibilité et compréhension. Nous leur avons également demandé d’expliciter à l’oral le sens de ces mots, ce qui nous a permis d’analyser les stratégies des élèves pour accéder au sens des textes. Cet aller et retour entre le niveau probable d’opacité des mots et leur appropriation par les élèves a ouvert d’autres perspectives sur le rôle du contexte, à l’échelle de la phrase (syntaxe et contexte) et du texte (présence d’un glossaire par exemple).

Nos résultats permettent de nourrir les recherches sur la lisibilité et de dégager de nouveaux paramètres de mesure (cf. partie 3).

1. Lisibilité et listes de fréquence

Nous donnerons un aperçu des recherches en lisibilité afin de centrer la question sur notre étude puis nous discuterons de la pertinence des listes lexicales avant de les mettre en relation avec notre corpus.

1.1. Aperçu de la question

La problématique de la lisibilité a vu le jour aux États-Unis dès le début du XXe siècle, lorsque furent menées en parallèle des études sur l'alphabétisation des soldats et la lisibilité des textes auxquels ils pourraient être confrontés (DUBAY 2004 : 3-11). Les premiers outils pour mesurer la lisibilité firent leur apparition dès les années 1920. Deux types de tests vont alors se développer. Le premier type est le test de closure, mis au point par Taylor en 1953, qui consiste à supprimer un mot sur cinq dans un texte afin de le proposer à des lecteurs qui devront remplir les blancs. Suivant l’exactitude des réponses, il est alors possible de déterminer si un texte est lisible ou non. Le second type est la construction de calculs mathématiques (ou formules de lisibilité) dont le tout premier a été établi en 1923 par Lively et Pressey. Les paramètres pris en compte dans la plupart de ces formules de lisibilité sont le plus souvent des paramètres formels, comme la longueur des mots, la longueur des phrases ou le nombre de syllabes mais certains chercheurs ont mis en avant d’autres paramètres comme la fréquence des mots (LIVELY ET PRESSEY 1923) ou le nombre de mots dits « difficiles » (GRAY ET LEARY 1935). Pour cela, les chercheurs ont, dans la plupart des cas, proposé de comparer les mots du texte avec des listes de fréquence lexicale : un mot absent d’une liste sera considéré comme difficile.

Les études sur la lisibilité d’un texte en langue française ont été plus tardives. Les linguistes francophones ont, tout d’abord, proposé des adaptations d’une des formules anglo-saxonnes de lisibilité : celle de Flesch, au contexte du français. C’est le cas de Kandel et Moles (1958) en France et de De Landsheere (1975) en Belgique. D’autres ont constitué leurs propres outils à partir des recherches en langue anglaise : Henry (1975) constituera son propre test de closure et Richaudeau (1969, 1988) établira un nombre important de mesures dont une formule d’efficacité en lecture.

L’utilisation des formules de lisibilité est un moyen d’obtenir une première idée du niveau de lisibilité des textes mais ce n’est pas suffisant, car comme l’écrit Labasse (2015 : 45), dans le processus de traitement d’un texte, le lecteur passe par quatre étapes : « la reconnaissance des signaux graphiques » (niveau de la mise en forme graphique du texte), « le traitement lexical et syntaxique » (niveau de la lisibilité), « l’établissement des relations entre les éléments d’information » (niveau sémantique) et « la construction d’un modèle mental de l’état du monde que présente le texte » (niveau de la compréhension). Pour que le lecteur comprenne un texte, il doit parcourir ce chemin. Si l’une de ces étapes pose problème (par exemple le niveau de lisibilité), il aura des difficultés pour accéder à la compréhension.

C’est donc à travers l’étude de la compréhension des textes par les élèves que nous espérons obtenir des informations sur le niveau de lisibilité de ces textes. Dans notre étude, nous nous intéressons au traitement lexical et syntaxique des textes par les élèves ; l’approche syntaxique étant le plus souvent délaissée dans les recherches au profit des analyses lexicales (MASSERON 2011).

1.2. La « charge lexico-syntaxique » des textes

Pour évaluer la « charge lexico-syntaxique » d’un texte (LABASSE 2015), nous pouvons mesurer d’un côté la difficulté du mot pris isolément et de l’autre, celle du mot en contexte.

Pour déterminer si un mot isolé peut être qualifié de difficile (charge lexicale), on peut recourir aux listes de fréquence : un mot n’appartenant pas à une liste de fréquence choisie pourra être considéré comme tel. Cependant, dans la suite de cette étude, nous utiliserons plutôt le qualificatif de mot « opaque » plutôt que « difficile » ou « complexe ». En effet, « difficile » signifie littéralement « Qui n'est pas facile, se fait avec effort, peine » (TLFi, article : difficile), ce qui implique, dans le cas d’une lecture, le ressenti du lecteur. Or dans notre cas, il s’agit de mettre en avant les mots qui peuvent poser des problèmes de compréhension en excluant tout paramètre du sujet. « Complexe », de son côté, renvoie à d’autres notions en linguistique. C’est le cas en morphologie où un mot complexe (ou construit) est un mot composé de plusieurs morphèmes et est mis en opposition avec la notion de mot simple, constitué d’un seul morphème (APOTHELOZ 2002). La notion de complexe a aussi été utilisée par Cabré (1998) pour désigner plusieurs entités graphiques. Concernant le qualificatif « opaque », il nous semble plus en adéquation avec nos analyses : un mot « opaque » est un mot : « qu'on ne peut comprendre ; dont on ne peut entièrement saisir le sens, la signification » (TLFi, article : opaque).

L’intérêt de la méthode de comparaison avec les listes est sa facilité d’opérationnalisation car elle permet de détecter les mots opaques en tant qu’unité isolée. Elle a été mise en pratique, par exemple, en 1948, aux États-Unis, par Dale et Chall qui, dans leur formule de lisibilité, extraient le pourcentage de mots qui n’appartiennent pas à une liste de fréquence donnée. Toutefois, la réduction au précepte : « rareté = difficulté » n’est pas sans danger, comme ont pu l’expliquer Gougenheim et ses collègues (1964). En effet, les auteurs constatent, lors de l’élaboration du français fondamental (base de données écrite créée à partir d’enregistrements oraux, qui établit la liste des mots les plus fréquents de la langue française dans le but d’enseigner le français) que ce n'est pas parce qu'un mot est connu qu'il est fréquent, à l’instar, par exemple, de « fourchette » : bien que nous la maniions tous les jours, nous ne la nommons pas forcément (GOUGENHEIM et al. 1964 : 136). Ce n'est pas parce que notre environnement nous met en rapport avec des mots qu’ils sont les plus fréquemment utilisés. Ces auteurs en arrivent à la conclusion que les mots concrets n'apparaissent qu'avec une faible fréquence dans les listes. En réalité, les mots dits concrets sont de fréquence variable, ils changent suivant l'époque, le lieu ou la culture. Par exemple, Gougenheim et ses collègues s'attardent sur le mot « roi » (1964 : 137). Sa fréquence varie selon la nature des textes (sa rencontre dans les documents historiques est fort probable), selon le pays (on parlera plus facilement de roi au Royaume-Uni qu'en France), ou encore selon les circonstances (la mort d'un roi par exemple sera relayée par les journaux). Les chercheurs du français fondamental opposent également la notion de mots fréquents et de mots disponibles. Ces derniers ont une fréquence faible mais présentent un degré de disponibilité. Cette notion de disponibilité est liée à la mémoire : dans une situation donnée, les premiers mots qui nous viendront à l'esprit seront en rapport direct avec le sujet de la conversation ; cela ne veut pas dire cependant que notre mémoire ne stocke pas d'autres mots en lien avec d'autres sujets. Gougenheim et al. lient la disponibilité avec les centres d'intérêts propres à chacun (GOUGENHEIM et al. 1964 : 137).

Cependant, la méthode de comparaison avec les listes ne permet pas d’expliquer les raisons pour lesquelles les mots sont opaques ; il s’agit simplement de les classer. C’est pourquoi nous emploierons le terme de « niveau probable d’opacité », car le classement effectué est en fonction des listes choisies, du genre de texte évalué.

Pour déterminer si le contexte est un frein ou une aide à la compréhension du mot (charge lexico-syntaxique), il faut examiner la situation dans laquelle apparaît le terme (construction syntaxique, présence dans un glossaire, densité lexicale…). Dans notre étude, cette information nous sera donnée par l’examen des réponses des élèves sur la compréhension des mots. Comme l’écrit Nonnon (2012 : 43), on ne peut isoler l’étude du lexique des autres composantes du langage (syntaxe, sémantique, énonciation, discours).

1.3. L’identification des mots opaques dans les manuels d’histoire

Dans notre recherche (33 chapitres extraits de 24 manuels d’histoire pour le primaire de 7 éditeurs différents s’étalant de 1996 à 2012), nous avons mis en regard les textes sélectionnés avec trois listes de fréquence lexicale, les autres méthodes de mesure de lisibilité n’en utilisant qu’une seule. Cette comparaison entre plusieurs listes de tailles différentes a mis en évidence les lemmes2 hors listes et a permis de les classer en trois niveaux : probabilité d’opacité faible (Niveau 1), probabilité d’opacité moyenne (Niveau 2) et probabilité d’opacité élevée (Niveau 3). Le principe de classement est illustré dans la Figure 1 ci-dessous

elola figure 1 tris

Les trois bases de données choisies sont en lien avec les textes écrits que rencontrent des élèves de l’école primaire de nos jours : littérature, presse, manuels, documentaires. La liste de fréquence de Brunet (2002) rassemble près de 1.500 lemmes parmi les plus fréquents de la littérature française à l’écrit (liste proposée aux enseignants). La base Manulex rend compte du vocabulaire qu'un enfant de 6 à 11 ans peut rencontrer dans les manuels scolaires de français et de lecture. Cette base regroupe 48.886 formes orthographiques et 23.812 lemmes (LÉTÉ 2004). La liste peut être réduite à 4.377 lemmes en jouant sur le taux de fréquence des mots. La base Essentiel3 regroupe un ensemble de 9.907 lemmes extraits de 892 articles de journaux français (datés de 2002 à 2011).Cette base peut être utilisée dans le logiciel en ligne Text Balancer. Bien que créée dans l'optique d'une étude en FLE, elle permet de disposer d’une liste de lemmes récents. Sa facilité d'utilisation avec les formules de lisibilité en fait un outil en adéquation avec les problématiques de cette étude.

Le tableau suivant recense le nombre de lemmes opaques extraits du rapprochement des textes du corpus de recherche (soit un total de 17.041 mots) avec ces trois listes de fréquence lexicale, en fonction de leur catégorie grammaticale :

elola tableau 1 tris

Dans ce tableau n’apparaissent pas les expressions comme « coup d’État » car les listes ne considèrent que les mots isolés. Les mots lexicaux5 sont plus nombreux que les items grammaticaux6 qui servent la syntaxe (HALLIDAY 1985 : 83-86).

Dans les deux classes, un nombre plus important d’items appartient au niveau 2 (probabilité moyenne). On observe aussi qu’il y a 1,5 fois plus de mots potentiellement opaques dans les textes des manuels à destination du CM2 que dans ceux du CM1. Si nous faisons des comparaisons au sein de chaque niveau, il y a, pour le CM1, près de 2 fois plus de mots appartenant aux niveaux 2 et 3 confondus (difficulté moyenne et haute) qu’au niveau 1 (difficulté faible). Pour le CM2, c’est presque 3 fois plus. Il en résulte que la difficulté de lecture des textes pour CM2 est proportionnellement plus haute.

Qu’en est-il des mots concrets et des mots disponibles ? Il est très difficile de mesurer cette notion de disponibilité, puisqu’elle est liée au lecteur et à la situation de langage. Concernant les mots concrets, il semblerait que la liste établie de mots opaques soit composée d’autant de mots concrets qu’abstraits. Notre étude a aussi démontré que l’ensemble des mots classés comme opaques ne sont pas tous des items spécialisés. Beaucoup de mots courants à forte polysémie composent cette base.

1.4. La spécificité des textes des manuels scolaires

Les textes des manuels scolaires peuvent être qualifiés de textes de spécialité. Cette qualification implique une opposition avec la notion d’ordinaire (SAGER 1990 : 102, CUSIN-BERCHE 2003 : 116). Leur but est de transmettre une connaissance, une technique. On peut différencier deux types de textes de spécialité : informatifs, à destination de ses pairs ou à d’autres spécialistes, et didactiques, ayant pour but l’apprentissage (le public visé est donc novice ou amateur) :

Les discours didactiques [...], à la différence de la vulgarisation scientifique, [...] s’adressent à des destinataires bien définis (par niveau, par année...) se formant précisément à cette discipline ; ils sont fortement contraints par le cadre institutionnel dans lequel ils s’insèrent et ils sont énoncés par des auteurs du domaine, dont les places sont clairement établies, voire hiérarchisées. A côté des discours de recherche dont la fonction vise à faire avancer l’état des connaissances du domaine, ils cherchent plutôt à faire avancer l’état des connaissances chez l’autre, à l’intérieur d’une situation ritualisée, régie par un contrat préalable tacitement accepté par les interlocuteurs, (BEACCO et MOIRAND 1995 : 39-40).

Cela signifie que le texte est rédigé dans un langage spécifique, qui peut donc être une source de difficulté de compréhension. C’est Vygotski (1934) qui a mis en avant la notion de concepts scientifiques qu’il oppose aux concepts quotidiens (ou spontanés). Les concepts scientifiques s’acquièrent grâce à l'intervention et l'explication du maître (dans une situation d'apprentissage à l'école), alors que les seconds se développent au quotidien, de manière inconsciente (exemple de « fourchette »). L'appropriation des concepts scientifiques se fait donc de manière réfléchie, cependant : « ils ne sont pas acquis au coup par coup. Leur introduction par le maître est guidée par la fonction qu’ils occupent dans le système conceptuel sur lequel on travaille. » (BROSSARD 2008 : 72-78).

Cette distinction entre les deux types de « concepts » se fait à travers le lexique : on peut séparer le lexique courant et le lexique relevant de la discipline (lexique de spécialité comme le lexique historique). Contrairement aux textes de spécialité, dans le cas des textes d’histoire s’ajoute une difficulté supplémentaire, la polysémie des mots (exemple du verbe « siéger »), comme l’explique Laparra (1991 : 105) :

Contrairement à ce que l'on pense, les textes didactiques historiques (comme d'ailleurs de ce point de vue les autres textes didactiques) sont difficiles à lire, moins en raison de l'utilisation d'un vocabulaire technique spécifique sur lequel l'attention des maîtres et des élèves est attirée que par le recours à un lexique abstrait à très haute polysémie.

Les problèmes de compréhension dépassent le lexique pris isolément. Le contexte dans lequel apparaît le mot (charge lexico-syntaxique) a un rôle à jouer et nous devons prendre en compte les particularités textuelles des textes de spécialité (CHARTRAND et al. 2015 : 25). En effet, dans les manuels scolaires d’histoire, les élèves d’école primaire ont des difficultés à identifier certains référents, à saisir les relations de cause et de conséquence ou à comprendre les relations syntagmatiques (ROUBAUD 1989, SARDIER 2016).

2. L'enquête

L’expérimentation, présentée dans cet article, concerne deux manuels scolaires d’histoire et deux « leçons » : l’une extraite du manuel des éditions Nathan de 1996 pour le CM1 (9-10 ans) et l’autre, du manuel des éditions Istra de 2004 pour le CM2 (10-11 ans). Le principal critère de sélection de ces textes a été leur longueur, devant permettre une lecture assez rapide par l’élève pendant l’enquête. L’étude plus générale a montré que les années d’édition n’avaient pas de réelle influence sur la lisibilité.

2.1. Objectifs et justifications

Nous voulions avoir une meilleure connaissance des difficultés que le lexique posait à des élèves de 9 à 11 ans (CM1 et CM2), en situation de lire un texte d'histoire extrait d'un manuel scolaire. Bien que l’un des objectifs d’apprentissage en histoire soit l’acquisitionde nouveaux mots (lexique de spécialité), il est important, pour plus de lisibilité, de ne pas rajouter de difficultés complémentaires, au niveau du texte, qui peuvent freiner, à terme, la compréhension et in fine l’apprentissage.

Afin de pointer les difficultés lexicales (mots isolés et en contexte) que le texte d’histoire pose aux élèves d’une même classe et de les analyser, nous avons mené l’enquête en orientant le questionnaire sur trois points particuliers : la vérification de la compréhension des mots (sens du mot), l’accès aux synonymes (organisation du lexique) et les difficultés du texte (ressenti des élèves). Rappelons que les élèves de 9 à 11 ans, évoluant à l’école primaire en France, sont habitués à définir les mots ou à trouver des synonymes.

Tous les mots sélectionnés pour l’étude appartiennent aux niveaux 2 ou 3 de probabilité d’opacité (la polysémie des mots comme campagne augmente l’opacité) :

elola tableau 2

Pour chaque classe, huit questions ont été posées. Les mots sur lesquels les élèves ont été interrogés ont été choisis en fonction de leur opacité, mais également avec le souci d’avoir, pour chaque classe, le même nombre de questions portant sur les définitions, sur les synonymes ainsi que le même nombre de verbes, de noms, le même nombre d’interrogations sur le sens, propre ou figuré, etc. L’objectif était d’effectuer non seulement une étude par classe mais aussi de comparer les réponses des deux classes. Parmi les mots choisis, une question concerne un nom propre. Ce choix a été soupesé car les noms propres font partie intégrante des difficultés lexicales des textes d’histoire. L’analyse des noms communs permet de vérifier si le vocabulaire employé appartient au lexique des élèves. La question sur les verbes montre si le texte est plus accessible car les nominalisations posent en général plus de problèmes de compréhension que l’emploi des verbes (HALLIDAY 1985). Nous avons aussi testé dans chaque classe une expression composée de mots de niveau 1 : guerre de Cent ans et coup d’État.

2.2. Méthodologie

Pour effectuer cette étude, un protocole précis a été mis en place dans deux classes d’une école du sud de la France. Les interrogations ont été faites sous la forme d’un entretien personnel (chercheur-élève) à l’aide d’un magnétophone pour recueillir les réponses pour chacune des classes : CM1 et CM2. Il est arrivé que l’enquêtrice demande à l’élève une précision sur ce qu’il a répondu.

Dans les deux classes, les élèves ont, tout d’abord, reçu un exemplaire de la page sélectionnée dans le manuel d’histoire. La tâche demandée était de lire silencieusement le texte (cf. Annexes), avec la possibilité d’observer les documents figurant sur la leçon (images, frise). Avec l’aide de l’enseignant, la page a été distribuée de manière à ce que chaque élève ait assez de temps pour lire le texte à son rythme et que la durée écoulée entre la lecture personnelle et l’entretien ne soit pas trop longue. Dans les deux cas, l’étude a été menée en fin d’année, après que les élèves ont théoriquement suivi un enseignement en histoire toute l’année.

Pour chaque classe, lors de l’entretien, la phrase dans laquelle se trouvait le mot, objet de la question, était relue par le chercheur. Il était toujours précisé que la question portait sur le mot présent dans le manuel que l’élève repérait sur la page. Au total, 44 élèves ont été interrogés : 18 en CM1 et 26 en CM2. Les entretiens individuels ont duré 10 minutes environ.

Le tableau suivant recense les questions posées aux élèves, dans l’ordre chronologique :

elola tableau 3 tris

Chaque classe a répondu à cinq questions sur le sens des mots (« Qu’est-ce que / Que veut dire… ? »), deux sur les synonymes (« Connais-tu un synonyme de… ? ») et une sur leur ressenti (« Qu’est-ce que te gêne le plus… ? »). L’équilibre parfait entre la nature des mots choisis à définir ou expliciter n’a pas pu être réalisé à cause des textes sélectionnés : en CM1, on a 4 noms communs, 1 nom propre, 1 expression, 1 verbe alors qu’en CM2, il y a 1 verbe de plus et 1 nom commun en moins (cf. Tableau 3).

3. Analyse des réponses

L’analyse des réponses des élèves nous a permis de cerner certaines difficultés que rencontrent les élèves de 9 à 11 ans face à un texte d’histoire, extrait d’un manuel scolaire. Les lexèmes choisis étant de niveau 2 ou 3 d’opacité, nous nous demandions quelles stratégies les élèves allaient mettre en œuvre pour comprendre la phrase dans laquelle se trouvait le mot sur lequel ils étaient interrogés. Au-delà des réponses du type « je ne sais pas », prouvant bien que le mot était difficile à comprendre, ce sont de vraies pistes pédagogiques pertinentes qui s’ouvrent à nous.

Nous avons découvert que les élèves mettent en œuvre deux types de stratégies pour répondre aux questions de compréhension : produire du sens à partir du mot pris isolément et se servir du contexte pour comprendre le mot.

3.1. La production de sens à partir du mot isolé

Certains élèves s’appuient sur le mot pris isolément (hors contexte) pour répondre à la question posée.

a) Le recours à l’approximation

Face à la question : « Connais-tu un synonyme du mot réforme ? » (dans la phrase : « Il effectue de nombreuses réformes. »), 50% des élèves de CM2 ont répondu « je ne sais pas ». D’autres, comme les adultes, fonctionnent par approximation (ROUBAUD 1989) pour répondre ; c’est le cas de quatre élèves qui se servent du mot chose, comme celui-ci qui explique : « il faut de nouvelles choses qui n’étaient pas avant ».

b) L’appui sur la morphologie

Une stratégie des élèves peut être de décomposer le mot. Ainsi au CM1, à la question de la recherche d’un synonyme du mot défaite dans la phrase « Les armées royales françaises subissent de graves défaites à Crécy en 1346. », près de 61 % des élèves ont répondu perdre ou perdu. Quelques-uns ont répondu « défaire » ou « quelque chose que tu ne fais pas bien ». Quand l’enquêtrice a demandé aux élèves d’expliquer leur réponse, certains ont précisément dit avoir décomposé le mot défaite en dé + faite (préfixe négatif et le verbe faire conjugué). Si nous consultons le TLFi, les deux premiers sens donnés au mot défaite sont bien en relation avec ce préfixe négatif « perte d’une bataille, d’une guerre » et le verbe faire « action de se défaire de quelque chose, de quelqu'un ».

Toujours pour le même texte, dans la phrase « L’économie se relève », les élèves devaient expliquer le sens du verbe se relever. Une des stratégies adoptées pour comprendre ce verbe a été la segmentation en morphèmes : préfixe re- + verbe (se) lever si bien que les réponses correspondent à la première définition du verbe « se mettre debout » avec l’idée de répétition marquée par le préfixe re-. C’est ainsi que 28% des élèves expliquent se relever par : « il est par terre et il se lève », « c’est se mettre debout » ou encore « se réveille ». Dans le TLFi, le sens figuré en lien avec l’économie n’apparaît qu’après un grand nombre de sens propres. Certains mots polysémiques, de par leur construction morphologique, peuvent induire en erreur leur interprétation car les élèves doivent référer au contexte pour choisir le bon sens du mot.

Cette stratégie de décomposition du mot en morphèmes n’est pas toujours rentable. En effet en CM2, 3 élèves sur 26 ont, pour trouver un synonyme du mot réforme, répondu « forme » ou « former », ce qui ne les a pas aidés à trouver le sens du mot et à comprendre la phrase.

c) Les liens phonétiques entre les mots

Certains élèves, pour répondre, établissent des liens entre des mots qu’ils ont mémorisés. Ils construisent des réseaux hors contexte et le résultat n’est pas celui attendu. Ainsi à la question « qu’est-ce qu’un duc ? », un élève de CM1 a répondu : « un pont ». Cette réponse est étonnante, toutefois, il semblerait que cet enfant ait fait le lien avec le mot viaduc et a donc pensé à un pont.

De même, cet autre élève de CM1 a répondu « confondre » à la question « Est-ce que tu connais un synonyme du mot conflit ? », en s’appuyant probablement sur la première syllabe du mot. De la même façon, deux élèves du CM2, devant donner un synonyme de réforme ont répondu « réplique » et « répété », probablement à la recherche d’un mot commençant par la même syllabe que réforme.

On ne peut donc pas ignorer ces stratégies d’élèves qui, même à 9-10 ans, s’appuient sur une syllabe du mot, sans tenir compte du contexte dans lequel il apparaît.

d) Le poids du vécu

Pour trouver un synonyme, les élèves peuvent référer à leur univers direct, monde qu’ils connaissent bien. Ainsi, lorsque nous avons demandé un synonyme du mot campagne (CM2) (dans la phrase « Il poursuit ses campagnes victorieuses contre presque tous les pays d’Europe. »), même si 62% des élèves sont restés dans le domaine militaire avec « guerres », « victoires », « batailles », les autres sont sortis de ce champ et ont relié le mot aux vacances en proposant : « camping », « camp », « la campagne où il y a les animaux et tout ça » ou encore aux élections « république », « électorale », les tests ayant été effectués peu de temps après les élections présidentielles et législatives qui ont eu lieu en France en 2017.

Le même comportement a été observé pour le synonyme du mot conflit (CM1) (dans la phrase « […] le conflit reprend et tourne au désastre pour la France après la bataille d‘Azincourt (1415). »). Même si 45% des élèves ont donné un synonyme de « conflit », la moitié des réponses a été « dispute », « se disputent ». On mesure à quel point leur vie d’écolier, où les conflits possibles sont des disputes, contraint le sens de certains mots. La référence à l’univers propre de l’enfant peut l’emporter sur le sens du mot en contexte.

Les liens de parenté ou hiérarchiques avec des personnes proches (enseignant, animateur…) font partie de l’univers de l’enfant mais dès que l’on est en histoire, il est difficile de définir les mots « duc » ou « consul », spécifiques des textes à visée historique. Ainsi, à la question « qu’est-ce qu’un duc ?» (« Il établit l’autorité royale face à de nombreux adversaires, en particulier le duc de Bourgogne, Charles le Téméraire. »), plus de la moitié des élèves de CM1 (61 %) explique que « c’est comme un roi mais plus qu’un roi, le chef en gros », « c’est une personne qui est très proche du roi qui va commander les armées » ou encore « c’est un roi ». De même, à la question « qu’est-ce qu’un consul ? » (« Premier Consul de la République, il poursuit ses campagnes victorieuses contre presque tous les pays d’Europe. »), 42% des élèves de CM2 indiquent que « c’est un empereur je crois », « c’est comme quelqu’un qui dirige un pays », « c’est un général » ou encore « c’est un peu comme un président, le chef de l’état ». On peut supposer que la présence de « premier » (Premier Consul) ait aidé les élèves a donné au personnage une position hiérarchique élevée puisque les réponses ont été : « général, président, chef », même si ces définitions ont été données approximativement (emploi de « c’est comme », « c’est un peu comme », ROUBAUD 1989).

e) Synthèse

Un mot isolé peut être défini ou explicité de différentes manières : en recourant à une approximation, en le découpant en morphèmes, en repérant une syllabe ou encore en le renvoyant à l’univers de référence de l’enfant. Mais ces stratégies sont peu rentables car elles n’amènent pas les élèves à comprendre le sens du mot. Même si peu d’élèves y ont eu recours (moins de la moitié des élèves et parfois quelques-uns seulement), on ne peut les ignorer car elles sont des indices du fonctionnement de l’élève à un certain moment.

La prise en compte du mot isolé pour mesurer la lisibilité est donc réductrice : le contexte a son importance et certains élèves s’en servent pour comprendre le sens des mots opaques dans les textes des manuels d’histoire.

3.2. La compréhension du mot dans son contexte

D’autres élèves s’appuient sur le mot pris dans son contexte pour répondre à la question posée.

a) La prise en compte de la temporalité

Pour donner la définition d’un mot, certains élèves prennent en compte la temporalité présente dans le texte.

La temporalité peut être contenue dans des lexèmes comme « mort ». Ainsi, dans le texte destiné au CM1, pour définir le mot héritier (dans la phrase : « Le roi de France, Charles IV, est mort sans héritier. »), 28% des élèves semblent s’appuyer sur le lexème « mort » dans le contexte immédiat du mot héritier. En effet, les réponses sont : « c’est son fils qui va être roi après lui », « c’est quelqu’un qui va le succéder, le roi, et qui va prendre tout ce qu’il avait », « c’est celui qui est après le roi, si le roi meurt son fils c’est l’héritier », « c’est celui qui va le remplacer quand il sera mort ». Si « mort » implique un arrêt dans le temps, il suppose aussi un successeur pour le trône de France d’où l’emploi dans les réponses de « après lui », « succéder », « remplacer ».

Cette notion de temporalité, très présente dans les manuels d’histoire, peut donc être une aide pour comprendre le sens d’un mot. Cela n’est toutefois pas toujours le cas, car une expression comme la guerre de Cent Ans (titre de l’extrait du CM1) a posé problème. En effet, près de 40% ne saisissent pas la durée du conflit. Certains datent le début de la guerre : pour eux, elle a commencé il y a cent ans (« il y a 100 ans, il y a eu une guerre et les pays se sont fait la guerre », « c’est la guerre qui a été faite il y a 100 ans »). D’autres comptabilisent les guerres : « avant dans la préhistoire, il y avait beaucoup de guerres, il y avait presque 100 guerres avant ». Nous mesurons ici l’une des limites d’utilisation des listes de fréquence lexicale pour l’étude de la lisibilité car les mots simples qui constituent cette locution (ou ce terme complexe, dans le sens de Cabré 1998), sont tous considérés comme faciles et ne correspondent à aucun niveau d’opacité. En réalité, il faut se demander comment sont utilisés les mots : de manière symbolique ou iconique ? La guerre de Cent Ans en est un bel exemple : symboliquement elle marque la fin de la féodalité et exprime une durée ; de manière iconique, elle est aussi une représentation d’un période historique que l’on peut situer sur une frise chronologique. Cela soulève des questions sur le contexte de création des locutions : les expressions historiques sont apparues dans des contextes particuliers, avec des motivations uniques, qu’il convient de connaître et de comprendre afin d’assimiler parfaitement le sens de ces locutions. Dans le cas contraire on ne serait pas à l’abri de contresens ou d’approximations malvenues.

b) La prise en compte de l’environnement syntaxique

Pour les deux niveaux de classe, une question sur les noms propres était posée : en CM1 « qu’est-ce que Crécy ? » et en CM2, « qu’est-ce qu’Austerlitz ? ». Les phrases étaient : « Les armées royales françaises subissent de graves défaites à Crécy en 1346. » et « Il remporte la bataille d’Austerlitz le 2 décembre 1805. ». Les réponses, quand elles sont données, indiquent bien un lieu : « c’est une ville », « un pays », « un endroit » (22% pour les CM1, 61% pour les CM2), même s’ils ne les connaissent pas. Alors comment arrivent-ils à comprendre qu’il s’agit bien d’un lieu ? Il est probable que la construction verbale (« subir des défaites quelque part », « remporter la bataille à un certain endroit ») les a aidés à comprendre la signification du mot.

Un autre cas est à signaler : celui du verbe « aspirer ». Ce verbe a posé problème aux élèves de CM2, la phrase étant : « Après de nouvelles victoires, le peuple aspire à la paix. ». Ce verbe exprime une intention future, une envie, ce n’est pas un terme spécifique de l’historien. On voit ici que se pose le problème du choix des mots dans les manuels scolaires car ce verbe est très polysémique. Toutefois les élèves ont saisi la notion de temporalité présente dans la phrase (avec « après »), tout en étant partagés sur le moment où la paix va se faire. La majorité (58%) pense que le verbe implique un moment présent : « on leur demande de faire la paix », « il règne la paix », « il est en paix ». Une minorité (15%) comprend que c’est un fait passé : « pendant longtemps, il y a eu la paix », « ils ont fait la paix », « Ils ont eu de la paix pendant 5 ans ». Seulement un quart des élèves saisissent cette notion de futur qu’implique le verbe aspirer à : « ils veulent faire la paix ». On peut aussi se demander si le recours aux verbes « être » ou « faire » dans les réponses n’est pas un moyen de saisir de façon approximative le sens du verbe « aspirer » et ainsi d’éviter la précision.

c) Le recours au glossaire

Les élèves devaient au CM2 expliciter coup d’État dans la phrase : « […] il prend le pouvoir après le coup d’État du 18 Brumaire […] ». Cette expression était située en bas de page dans le glossaire9 avec cette explication : « prise du pouvoir suprême d’un pays par un moyen illégal ». La majorité des élèves (85%) a donné une définition qui est celle du glossaire, parfois au mot près. On peut donc émettre l’hypothèse qu’ils se sont aidés du glossaire pour expliquer cette expression, mais ont-ils compris ce que cela voulait dire ? Il est possible que le fait que Coup d’État soit une expression imagée ait été une aide pour les élèves. L’un d’entre eux a même reformulé l’idée : « ça veut dire qu’il a fait des trucs pas bien ». Le recours aux expressions imagées peut donc être une aide à la compréhension des textes.

De la même façon, au CM2, les élèves devaient définir abdiquer, la phrase était : « Napoléon Ier doit abdiquer en avril 1814. ». Le glossaire indiquait « renoncer à régner ». Il n’y a que 50% des élèves qui ont réutilisé la définition et 12% ont reformulé l’idée de perte : « céder son poste », « s’enlever d’être le chef du pays », « battre en retraite ».

Ce recours au glossaire au CM2 est variable. L'avantage, par rapport au dictionnaire, est qu’il cible les définitions en rapport avec le sujet traité (contexte), favorisant ainsi un sens du mot. Cependant, tous les chercheurs ne sont pas convaincus de son efficacité. La consultation du glossaire implique des stratégies complexes de recherche et de traitement de l'information. Selon Chartrand (2009 : 46), l'élève doit : « arrêter sa lecture, chercher le glossaire, puis le mot à l’intérieur de ce dernier, lire la définition et la comprendre, puis retourner au texte, actualiser et vérifier sa compréhension ». On peut donc se demander si le glossaire est réellement une aide à la lisibilité des textes.

d) Synthèse

Ce sont parfois quelques éléments du contexte (glossaire) ou quelques liens (temporalité, environnement syntaxique) que les élèves rétablissent qui les aident à comprendre le sens du mot sur lequel ils sont interrogés. Les stratégies utilisant le contexte sont plus efficaces et donnent de meilleures réponses que le traitement d’un mot pris isolément.

La prise en compte du contexte pour mesurer la lisibilité est donc rentable car l’opacité des mots (surtout dans le cas des polysémiques) a un lien avec son environnement textuel.

4. Conclusion

La plupart des mots choisis ont été difficiles à appréhender, à l’image de notre échelle d’opacité. La dernière question posée aux élèves sur leur ressenti (« Qu’est-ce qui te gêne le plus dans le texte pour le comprendre ? ») met en avant les problèmes lexicaux : dans les deux niveaux de classes, les élèves pensent qu’il y a trop de mots difficiles dans les textes (88% des élèves au CM1 et 77% au CM2). Pour répondre aux questions, on s’aperçoit que, soit les élèves considèrent le mot isolément mais sa compréhension n’est pas assurée, soit ils s’appuient sur le contexte, ce qui donne de meilleurs résultats. C’est surtout le cas pour les lexèmes polysémiques comme campagne ou aspirer qui doivent être considérés en contexte obligatoirement.

Se pencher sur la compréhension met en avant des problèmes de lisibilité : la prise en compte de critères formels est trop réductrice, il faut se tourner vers la textualité. Néanmoins, l’utilisation des listes de fréquence lexicales pour classer les mots opaques est intéressante, puisque tous les mots extraits se sont avérés être d’une réelle difficulté. Les formules de lisibilité sont un premier indice de travail, mais une vraie étude lexico-syntaxique doit être menée sur un corpus plus large, afin de comprendre où se situent les difficultés de compréhension. Il serait alors possible de proposer des pistes, des aides, aux enseignants pour aborder ces textes : ils pourront alors former les élèves à s’appuyer sur le contexte plus ou moins éloigné du mot, à utiliser les aides extérieures, etc.

Étudier la lisibilité n’a pas pour but de préconiser une simplification des textes des manuels d’histoire, puisque l’un des objectifs de l’enseignement est de faire apprendre de nouvelles notions et de nouveaux mots. Il n’en demeure pas moins que les mots opaques doivent être inscrits dans un contexte susceptible d’éclairer leur compréhension.

Références bibliographiques

APOTHÉLOZ, Denis, La construction du lexique français, Paris, France, Ophrys, 2002.

BEACCO, Jean-Claude, MOIRAND, Sophie, Autour des discours de transmission des connaissances, Langages, n. 117, 1995, p. 32–53.

BROSSARD, Michel, « Concepts quotidiens/concepts scientifiques : réflexions de travail », Carrefours de l’éducation, n. 26, 2008, p. 67-82.

BRUNET, Etienne, « Le vocabulaire français de 1789 à nos jours : d’après le « Trésor de la langue française », Genève, Slatkine, 2002 (liste de fréquence disponible sur : http://eduscol.education.fr/cid50486/liste-de-frequence-lexicale.html).

CABRÉ, Maria Teresa, La terminologie, Ottawa, Canada, Presses de l’université, 1998.

CHARTRAND, Suzanne-G., « Compétences à mobiliser pour la compréhension et l’interprétation de manuels du secondaire au Québec », Revue des sciences de l’éducation, n. 2, 35, 2009, p. 37-58.

CHARTRAND, Suzanne-G. et al., Caractéristiques de 50 genres pour développer les compétences langagières en français. Québec, Canada, Didactica, 2015.

CUSIN-BERCHE, Fabienne, Les mots et leurs contextes, Paris, France, Presses Sorbonne Nouvelle, 2003.

DALE, Edgar, CHALL, Jeanne, « A Formula for predicting readability: instructions », Educational research Bulletin, n. 2, 27, 1948, p. 37-54.

DE LANDSHEERE, Gilbert, « Pour une application des tests de lisibilité de Flesch à la langue française », Le travail humain, n. 1-2, 26, 1963, p. 141-154.

DUBAY, William. H, The Principles of Readability. Online Submission, 70 pages. 2004.

FLESCH, Rudolf. F., The art of readable writing, New York, NY, USA: Harper & Brothers, 1949.

GOUGENHEIM, Georges, et al., L’élaboration du français fondamental, Paris, Editions Didier, 1964.

GRAY, William S., LEARY, Bernice E, What Makes a Book Readable: With Special Reference to Adults of Limited Reading Ability, Chicago, IL, USA, University of Chicago Press, 1935.

HALLIDAY, Michael A. K., Spoken and Written Language, Oxford, Oxford University Press, 1985.

HENRY, Georges, Comment mesurer la lisibilité, Paris, Nathan, 1975.

KANDEL, Liliane, MOLES, Abraham, Application de l’indice de Flesch à la langue française, The journal of Educational Research, n. 21, 1958, p. 283–287.

LABASSE, Bertrand, « Les déterminants cognitifs et sociaux de l’adéquation communicationnelle », in BEAUDET, Céline, REY, Véronique (éd.), Écritures expertes en questions, Aix en Provence, Presses Universitaires de Provence, 2015.

LAPARRA, Marceline, « Problèmes de lecture posés par l’écriture des textes historiques à visée didactique », Pratiques, n. 69, 1991, p. 97-124.

LÉTÉ, Bernard, « Manulex : une base de données du lexique écrit adressé aux élèves », in CALAQUE, Elizabeth, DAVID, Jacques (éd.), Didactique du lexique : contextes, démarches, supports, Bruxelles, De Boeck, 2004.

LEROY, Michel, Les manuels scolaires : situation et perspectives (Rapport No 2012-036). Inspection Générale de l’Éducation Nationale, Paris, 2012.

LIVELY, Bertha, PRESSEY, Sidney, « A method for measuring the vocabulary burden of textbooks », Educational administration and supervision, n. 7, 9, 1923, p. 389-398.

MASSERON, Caroline, « L’analyse linguistique des écrits scolaires », Pratiques, n. 149/150, 2011, p. 129-162.

NONNON, Elisabeth, « La didactique du français et l’enseignement du vocabulaire, dans vingt ans de revues de didactique du Français langue première », Repères, n. 46, 2012, p. 33-72.

RICHAUDEAU, François, La lisibilité, Paris, Denoël Gonthier, 1969.

RICHAUDEAU, François, Ce que révèlent leurs phrases, Paris, Retz, 1988.

ROUBAUD, Marie-Noëlle, « Sur la piste du locuteur en pleine approximation lexicale », Reflet, n. 31, 1989, p. 12-13.

SAGER, Juan C., A practical course in terminology processing, Philadelphia, PA, USA : John Benjamins Publishing Company, 1990.

SARDIER, Anne, « Effets de la prise en compte de la dimension syntagmatique du lexique sur le développement de la compétence lexicale en début de collège », in SHS Web of conferences, Actes du 5e congrès mondial de linguistique française, 2016.

SPIEZIA, Raffaele, La lisibilité entre théorie et pratique, Paris, Alain Baudry & Cie, 2007.

TAYLOR, Wilson L., « Cloze procedure: a new tool for measuring readability », Journalism & mass communication quarterly, n. 4 (30), 1953, p. 415-433.

TLFi : Trésor de la langue Française informatisé, http://www.atilf.fr/tlfi, ATILF - CNRS & Université de Lorraine.

VYGOTSKI, Lev, Pensée et Langage, Paris, La Dispute, 1934 (réédition de 1997).

Annexes


BAILLAT, Gilles, ROUFFIGNAC, Jean-Claude. & DEMOTIER, Alain, « La guerre de Cent Ans », Histoire, géographie, éducation civique, cycle 3, niveau 2, (CM1), Paris, Nathan, 1996, p. 43.

elola annexe 1


BENDJEBBAR, André, MURACCIOLE, Jean & GREGOIRE, Isabelle, « Napoléon Bonaparte », Histoire, géographie, sciences. CM2, Paris, Istra, 2004, p. 28.

elola annexe 2

1
Maude Elola, L’étude de la lisibilité linguistique des manuels scolaires d’histoire pour des élèves de 9 à 11 ans. Thèse de doctorat, Sciences du Langage, Aix-Marseille Université, en cours.

2
Un lemme est une chaîne de signes formant une unité sémantique et pouvant constituer une entrée de dictionnaire (exemple : les formes « a, avait, aura… » sont regroupées sous le lemme « avoir »). Il s’oppose à la forme orthographique, qui est l’actualisation du lemme dans le discours et qui peut prendre plusieurs formes.

3
Base développée par Raffaele Spiezia et présentée lors de la conférence du 14 octobre 2016 à l’université d’Aix-Marseille.

4
Locutions : en outre, en effet, aux dépens de

5
Appelés aussi lexèmes.

6
Mots fonctionnels comme les pronoms, les prépositions, les conjonctions, les adverbes, etc.

7
BAILLAT, G. et al. (1996), extrait p. 43. (cf. Annexes).

8
BENDJEBBAR, A. et al. (2004), extrait p. 28 (cf. Annexes).

9
Le glossaire n’était présent que pour le texte du CM2.

Per citare questo articolo:

Maude ELOLA, Marie-Noëlle ROUBAUD, La compréhension du lexique dans les manuels scolaires d’histoire : Un exemple de recherche en lisibilité linguistique., Repères DoRiF n. 16 - LITTÉRATIE ET INTELLIGIBILITÉ : POINTS DE VUE SUR LA COMMUNICATION EFFICACE EN CONTEXTE PLURILINGUE, DoRiF Università, Roma novembre 2018, http://dorif.it/ezine/ezine_articles.php?id=405

Ritorna alla Barra di Navigazione