Print Friendly, PDF & Email

Marie-Claude L’HOMME

 

Le DiCoEnviro : découverte et représentation de structures terminologiques dans le domaine de l’environnement

 

 

 

Marie-Claude L’Homme
Université de Montréal – OLST
mc.lhomme@umontreal.ca


Abstract
The design of terminology resources in a field such as the environment raises several difficulties and is based on different choices made by their designers. In this article, we address the issue of considering the linguistic aspects of terms (as opposed to the dominant approach in terminology, which focuses on the conceptual level). We describe some theoretical choices and the broad outlines of a method guiding the development of DiCoEnviro, Dictionnaire fondamental de l’environnement (2023). We also suggest ways of uncovering the terminological structure of the field and connecting the linguistic and conceptual levels, based on Frame Semantics (FILLMORE 1982; FILLMORE and BAKER 2010; RUPPENHOFER et al. 2016).

Résumé
La conception de ressources terminologiques dans un domaine comme l’environnement soulève un certain nombre de difficultés et repose sur différents choix faits par leurs concepteurs. Dans le présent article, nous abordons la question de la prise en compte des aspects linguistiques des termes (par opposition à l’approche dominante en terminologie qui se focalise sur le plan conceptuel). Nous décrivons quelques choix théoriques et les grandes lignes d’une méthode guidant l’élaboration du DiCoEnviro, Dictionnaire fondamental de l’environnement (2023). Nous proposons également des pistes afin de mettre au jour la structure terminologique du domaine et de connecter les plans linguistique et conceptuel en nous appuyant sur la Sémantique des cadres (FILLMORE 1982 ; FILLMORE et BAKER 2010 ; RUPPENHOFER et al. 2016).


 

1. Introduction

Le domaine de l’environnement est multiforme et soulève de nombreux défis pour qui souhaite en faire une description terminologique. Une partie de ces défis, rappelés brièvement ci-dessous, est évoquée dans la littérature. D’abord, le domaine de l’environnement est extrêmement vaste et fait appel aux concepts de disciplines différentes. Selon la perspective adoptée, le domaine peut mobiliser des concepts de la climatologie, de la chimie, de la biologie, de la glaciologie, mais il emprunte également à l’économie et à la démographie. Par ailleurs, le domaine fédère de multiples thématiques : les changements climatiques, les énergies renouvelables, les espèces menacées, l’agriculture durable et beaucoup d’autres. La multitude de thématiques et leur variété rendent difficile un découpage en « sous-domaines ». Delavigne (2022) souligne cette difficulté dont on peut prendre la réelle mesure en observant la diversité des découpages effectués par des organismes chargés de gérer la terminologie, dont celle de l’environnement[1].

Une autre difficulté soulevée par la terminologie de l’environnement est liée au fait que le domaine interpelle des interlocuteurs dont les profils donnent lieu à des perspectives parfois peu compatibles : des scientifiques, bien entendu, mais également des militants, des politiques et des communautés touchées par certains phénomènes environnementaux ou des projets de développement ayant un impact sur le territoire. Ceci donne lieu à des textes dont le niveau de spécialisation change d’échelle et dans lesquels les choix terminologiques diffèrent (BOTTA 2013 ; LEDOUBLE 2019). Enfin, l’environnement, comme d’autres domaines spécialisés, évolue et ces changements ont forcément un impact sur les termes utilisés ou leur sens (DURY 1999).

Les textes et autres outils de diffusion des connaissances reliés à l’environnement sont forcément teintés par les facteurs que nous venons d’évoquer. L’impact de ces facteurs sur les choix terminologiques est abordé dans un numéro spécial de la revue Neologica (2022), consacré à l’environnement.

Dans le présent article, nous nous penchons sur une autre question relative à la description des termes de l’environnement dans les ressources terminologiques. Il s’agit du choix opéré entre deux perspectives descriptives importantes pour la terminologie, à savoir la prise en compte du lien entre les termes et les connaissances du domaine ou la description des termes dans leur fonctionnement linguistique. La plupart des ressources existantes mettent l’accent sur les connaissances du domaine et accordent peu de place aux propriétés linguistiques des termes. Ainsi les utilisateurs à la recherche de renseignements linguistiques doivent souvent se tourner vers d’autres ressources pour trouver des réponses à leurs questions.

Nous présentons le DiCoEnviro, Dictionnaire fondamental de l’environnement (2023) qui offre une description des aspects lexico-sémantiques des termes. L’élaboration de ce type de ressource repose sur certains choix théoriques et méthodologiques qui diffèrent sensiblement de ceux à l’origine de ressources comme les thésaurus, les ontologies et les bases de connaissances terminologiques (section 2). Nous passons en revue une partie de ces choix (section 3) et nous les illustrons au moyen de termes associés à la thématique des espèces menacées. Nous examinons également la possibilité de connecter une description linguistique à une perspective conceptuelle qui permet de ne pas perdre pas de vue les liens entre ces deux plans descriptifs (section 4). Notre méthode permet de découvrir la structure terminologique du domaine de l’environnement et de la présenter dans des formats différents à l’utilisateur. Nous concluons (section 5) en résumant les apports de ce type de démarche appliquée à la description des termes.

2. Décrire des concepts ou des termes ?

Nous avons déjà eu l’occasion de souligner l’écart entre les perspectives linguistique et conceptuelle selon lesquelles on peut aborder les termes dans les domaines spécialisés (L’HOMME ET BERNIER-COLBORNE 2012 ; L’HOMME 2020a). Sans reprendre ici l’ensemble des caractéristiques propres aux ressources se focalisant sur le plan conceptuel, rappelons qu’elles cherchent principalement à expliquer les concepts (exprimés par des termes) et que ces explications passent par une représentation de la place occupée par le concept dans la structure conceptuelle du domaine incarnée par des réseaux ou par une définition analytique.

Appliquées à une thématique comme celle des espèces menacées, ces ressources peuvent mettre en évidence la liste des espèces, leurs habitats ou les menaces qui pèsent sur elles (voir, par exemple, l’ontologie Wildlife Ontology 2022) (L’HOMME 2018). L’information linguistique, lorsqu’on en trouve, se réduit souvent à une liste de synonymes et de variantes, d’équivalents interlinguistiques et à l’indication de la partie du discours. En outre, les méthodes guidant l’élaboration de ces ressources se traduisent sur le plan linguistique par une prise en compte quasi-exclusive de termes de nature nominale, par la grande place accordée aux termes complexes et par un découpage des concepts donnant l’impression qu’il y a peu ou pas de polysémie.

Les ressources conceptuelles sont utiles, certes, mais l’examen de termes dans les textes portant sur l’environnement soulève de nombreuses questions auxquelles ces ressources apportent peu de réponses. Par exemple :

  1. Que faire de termes appartenant à des parties du discours différentes, notamment ceux qui n’appartiennent pas à la partie du discours du nom : par exemple, les termes exprimant les statuts des espèces (vulnérable, en danger, menacé), leurs activités (consommer, fréquenter, se reproduire, migrer) ; les activités humaines ayant un impact sur les espèces (déranger, fragmenter, réintroduire, braconner) ?
  2. Comment décrire des termes ayant des fonctionnements linguistiques différents (ce qu’une ressource devra faire si elle retient des termes de nature variée) ?
  3. Comment rendre compte des liens existant entre les termes de nature nominale, verbale et adjectivale ? Comment, par exemple, relier les noms des espèces et les noms donnés aux lieux où elles vivent (tortue molle à épines ; habitat, site et territoire) ? ; les noms donnés aux espèces et les termes exprimant leurs activités (tortue ; fréquenter, alimentation et se reproduire) ou les événements qu’elles subissent (tortue molle à épines ; disparaître, extinction) ? ; les noms donnés aux humains et les termes exprimant les activités ayant un impact sur les espèces, etc. (braconnier; décimer et capturer) ? Comment reconnaître, regrouper et distinguer les termes de sens voisin (éteindre, extinction, éteint; vulnérable, en péril ; habitat, site, environnement) ?

 3. Prendre en compte le plan linguistique

Dans ce qui suit, nous présentons quelques réponses apportées aux trois questions précédentes en décrivant les choix théoriques et méthodologiques qui sous-tendent la conception du DiCoEnviro Dictionnaire fondamental de l’environnement[2] (2023). En se focalisant sur les propriétés lexico-sémantiques des termes, le DiCoEnviro se présente comme une ressource complémentaire aux ressources adhérant à un programme conceptuel. Mais cette complémentarité assumée repose, comme nous le verrons, sur des principes qui sortent des cadres habituels de la terminologie.

Nous illustrons notre propos au moyen des termes reliés à la thématique des espèces menacées qui sont décrits dans la ressource (qui répertorie également des termes associés à d’autres thématiques comme celles des changements climatiques, de l’électrification des transports, de l’agriculture durable, etc.). Cet article se focalise sur la version française du DiCoEnviro, mais la même démarche est appliquée à la description de termes appartenant à d’autres langues (anglais, espagnol, italien, portugais et chinois[3]). Chaque langue est abordée séparément et les liens d’équivalence sont établis lorsque les articles sont suffisamment développés.

3.1. Que faire de termes qui appartiennent à des parties du discours différentes ?

Le choix des termes devant figurer dans la nomenclature du DiCoEnviro repose sur une méthode de sélection à partir du contenu de corpus spécialisés. Les corpus sont soumis à un extracteur de termes (TermoStat, DROUIN 2003) (dans les langues où c’est possible) en précisant les termes simples appartenant aux parties du discours du nom, du verbe, de l’adjectif et de l’adverbe. Un travail de validation est ensuite réalisé par des terminologues chargés de passer en revue les termes candidats proposés par l’extracteur et d’ajouter les termes véritables à la nomenclature du DiCoEnviro. Ici, les terminologues ont recours à un premier critère extralinguistique (lien avec le domaine) combiné à trois critères lexico-sémantiques (nature des arguments, parenté morphologique, lien paradigmatique) (L’Homme 2020a). Voici quelques exemples d’application de ces critères :

  • Lien avec le domaine : Ce critère est plus facilement applicable à des noms désignant des entités (ex. espèce, habitat).
  • Nature des arguments : Ce critère permet d’évaluer le statut terminologique des unités prédicatives (ex. menacer: beaucoup d’espèces et de populations sont déjà très menacées par la fragmentation de leurs habitats).
  • Parenté morphologique : La parenté morphologique est nécessairement accompagnée d’une parenté sémantique (ex. extinction: éteindre, éteint).
  • Relation paradigmatique : Les différentes relations paradigmatiques partagées par un terme avec d’autres termes déjà validés peuvent être prises en compte : la synonymie, l’antonymie, l’hyperonymie, la méronymie, etc. (habitat ; environnement, territoire, site, refuge).

La méthode combinant un extracteur de termes et une validation humaine permet de faire émerger du corpus des termes de nature différente : des noms, bien entendu, mais également des verbes et des adjectifs. Les adverbes potentiellement intéressants sont plus rares et correspondent souvent à des adverbes en –ment (ou –ly en anglais). La méthode permet donc de retenir des termes de nature différente (dont une partie est rarement répertoriée dans les ressources se focalisant sur le plan conceptuel) :

  • termes dénotant des entités : espèce, animal, tortue, site ;
  • termes dénotant des activités, des états et des propriétés : s’éteindre, hiberner, vulnérable, migrer.

Ces termes se répartissent dans les trois groupes suivants dont les deux derniers renferment des termes dont le sens fait appel à des arguments :

  • unités non prédicatives (ex. animal, tortue) ;
  • unités prédicatives (ex. extinction de X ; X est vulnérable, X migre de Y à Z) ;
  • unités quasi-prédicatives (POLGUÈRE 2012) (site de Y utilisé par X ; X est une espèce)

On aura peut-être remarqué que la méthode que nous venons de décrire ne prend pas en charge en amont les termes complexes. Comme le DiCoEnviro n’inclut que les termes complexes dont le sens n’est pas compositionnel (ex. effet de serre, tortue géographique), leur nombre est relativement peu élevé par rapport à ce qui s’observe dans la plupart des ressources terminologiques. Les terminologues doivent donc découvrir les termes complexes à ajouter à la nomenclature lors du processus de validation des termes. Par exemple, la consultation des contextes renfermant l’unité tortue, permettra aux terminologues de découvrir les noms de différentes espèces de tortues (ex. tortue géographique, tortue molle à épines, tortue des bois)[4].

3.2. Comment décrire les termes ayant des fonctionnements linguistiques différents ?

La prise en compte de termes de nature différente (parties du discours diverses, nature prédicative ou non) soulève rapidement la question de leur fonctionnement linguistique et de la description de ce fonctionnement dans une ressource terminologique. Le DiCoEnviro propose différentes manières d’en rendre compte.

D’abord, la distinction entre unités prédicatives, unités non prédicatives et unités quasi-prédicatives est rendue explicite dans les articles de la manière suivante : les termes prédicatifs et quasi-prédicatifs sont accompagnés d’une structure argumentale ; les termes non prédicatifs (moins nombreux que le précédents) ne sont accompagnés que d’une indication de leur partie du discours. La figure 1 montre comment fréquenter (terme prédicatif), site (terme quasi-prédicatif) et tortue molle à épines (terme non prédicatif) sont décrits dans les premières parties des articles qui leur sont consacrés[5]. On remarquera également la différence de format des structures argumentales de fréquenter et de site. Les structures argumentales de termes quasi-prédicatifs lient les arguments au terme au moyen de périphrases.

En ce qui concerne les termes prédicatifs et quasi-prédicatifs, les terminologues formulent une première version de la structure argumentale à partir de la consultation de contextes dans lesquels un terme apparaît. Cette version est ensuite validée au moyen d’une annotation détaillée des contextes dont la méthode s’inspire largement de celle développée dans le cadre du projet FrameNet (RUPPENHOFER et al. 2016).

Les résultats de l’annotation sont présentés dans différents formats aux utilisateurs : 1. mise en évidence du terme, de ses arguments et des circonstants dans les contextes ; 2. tableau récapitulatif des rôles sémantiques, des groupes et des fonctions syntaxiques des arguments et circonstants ; 3. tableau de valence synthétisant les combinaisons possibles entre le terme et ses arguments et circonstants (la figure 2 montre ces trois formats pour le verbe hiberner).

Figure 1 – Fréquenter, site et tortue molle à épines dans le DiCoEnviro (2023).

Figure 2 – Contextes annotés, tableau récapitulatif et tableau de valence pour hiberner dans le DiCoEnviro (2023).

3.3. Comment rendre compte des liens existant entre termes de nature variée ?

La découverte et la représentation des relations entre concepts ou entre termes sont au cœur de nombreux projets de terminologie et une ressource se focalisant sur les propriétés lexico-sémantiques ne fait pas exception. Toutefois, la prise en compte de termes appartenant à quatre parties du discours mène forcément à la découverte de relations qui diffèrent de celles décrites dans les ressources d’obédience conceptuelle, l’antonymie, la quasi-synonymie, les relations syntagmatiques, notamment. Le DiCoEnviro fait appel à trois méthodes afin de mettre en évidence les relations entre termes. Deux d’entre elles sont abordées dans cette section ; la troisième fait l’objet d’une section à part entière (section 4).

Les relations paradigmatiques et syntagmatiques qu’un terme partage avec d’autres unités du lexique (à l’exception des synonymes exacts apparaissant dans une rubrique qui leur est réservée ; voir dans la figure 1 l’article consacré à tortue molle à épines) sont décrites dans une longue rubrique intitulée Liens lexicaux (voir la figure 3 présentant une partie des liens observés pour tortue). En plus de dresser une liste des unités reliées aux termes faisant l’objet d’un article, les terminologues formulent une courte explication. Par ailleurs, si l’unité reliée est elle-même répertoriée dans le DiCoEnviro, l’utilisateur peut y accéder en suivant l’hyperlien.

Figure 3 – Liens lexicaux répertoriés pour tortue dans le DiCoEnviro (2023).

On remarque également que certaines relations sont mises en évidence dans la structure argumentale. Par exemple, comme on peut le voir dans la figure 1, le terme prédicatif fréquenter est relié à espèce et à milieu, espèce représentant le premier argument de fréquenter ; milieu, le second. Par ailleurs, d’autres réalisations d’arguments apparaissent en sélectionnant le symbole + placé à la droite d’espèce (ex. baleine boréale, caribou, rapace, tortue serpentine) ou celui placé à la droite de milieu (ex. eaux, forêt, habitat, lac). Ces réalisations sont toutes extraites des corpus thématiques utilisés lors de l’analyse des termes. Les listes sont également enrichies à un stade ultérieur lorsque de nouveaux termes sont ajoutés à la nomenclature.

Les relations argumentales, paradigmatiques et syntagmatiques décrites dans l’article au moyen des deux méthodes décrites ci-dessus sont également affichées dans un graphe. La figure 4 met en évidence des relations syntagmatiques repérées entre espèce et d’autres unités lexicales, faisant ressortir différentes activités dont les espèces font l’objet (ex. protection, rétablir). Les utilisateurs peuvent avoir accès aux explications accompagnant les relations en parcourant les arcs. Ils peuvent également générer de nouveaux graphes à partir des nœuds pleins et ainsi accéder à des relations associées à un nouveau terme. Ces différents parcours sont conçus pour faire découvrir graduellement les réseaux terminologiques dans lesquels s’inscrivent les termes.

Figure 4 – Parties des relations répertoriées pour espèces dans le NeoVisual (2023).

4. Connecter les plans linguistique et conceptuel ?

La section 3 a porté sur quelques méthodes qui permettent de tenir compte des aspects lexico-sémantiques des termes dans une ressource terminologique consacrée à l’environnement. Ces méthodes sont utiles, car elles permettent : 1. de décrire des termes de nature différente ; 2. de mettre en évidence la structure argumentale de termes prédicatifs et quasi-prédicatifs ; 3. de donner accès au fonctionnement des termes dans les contextes extraits de corpus spécialisés ; et 4 de découvrir une partie de la structure terminologique du domaine, à savoir les relations argumentales, paradigmatiques et syntagmatiques.

Toutefois, ces méthodes ne permettent pas de rendre explicite l’organisation des connaissances chère aux concepteurs de ressources terminologiques. Cette organisation et sa structure restent implicites dans les rubriques proposées (dans les contextes annotés, les liens lexicaux, la structure argumentale, notamment) et doivent être inférée par les utilisateurs. Ainsi, la consultation du DiCoEnviro ne permet pas d’obtenir directement des réponses à des questions comme les suivantes (des regroupements pouvant être faits à partir de termes prédicatifs, non prédicatifs et quasi-prédicatifs décrits dans le DiCoEnviro sont illustrés à la figure 5) :

  • Quels sont les différents termes désignant des espèces menacées ?
  • Quels sont les termes désignant les différents états des espèces ?
  • Quels sont les différents termes désignant les stades de vie des espèces ?
  • Quels termes désignent les endroits où habitent les espèces ?
  • Et ainsi de suite.

Figure 5 – Regroupements possibles de termes apparentés.

Pour rendre ces regroupements plus immédiatement accessibles, nous avons exploré une piste s’inspirant de la Sémantique des cadres (FILLMORE 1982 ; FILLMORE, BAKER 2010) et de son implémentation dans la ressource FrameNet (2023, RUPPERNHOFER 2016). La mise en œuvre de cette solution dans le DiCoEnviro a été facilitée par le fait que les terminologues s’appuient déjà, comme nous l’avons expliqué, sur la méthode FrameNet pour l’annotation des contextes.

Rappelons d’abord que la Sémantique des cadres est un modèle de linguistique cognitive qui tient pour acquis que le sens des unités lexicales se construit à partir de « connaissances d’arrière-plan » (expériences, croyances, conventions sociales, etc.). Autrement dit, la compréhension des unités lexicales mobilise des paramètres situationnels plus globaux, comme des participants et des présuppositions. La ressource FrameNet (2023) cherche à décrire les connexions entre les unités lexicales et les situations que ces unités évoquent. Elle rend compte de situations prototypiques et des différents éléments cognitifs et linguistiques qui servent à la caractériser. Dans la description, les aspects cognitifs sont reliés à des réalisations linguistiques afin de valider l’interconnexion entre ces deux plans descriptifs.

Nous tenons pour acquis que les regroupements de termes significatifs contiennent des termes évoquant une même situation au sens où l’entend la Sémantique des cadres. Les terminologues du DiCoEnviro s’appuient donc sur les critères de RUPPENHOFER et al. (2016) afin de valider leurs intuitions quant à ces regroupements. Ces critères sont les suivants :

  • Même nombre d’arguments : Ce critère permet, par exemple, de réunir les termes se nourrir, s’alimenter, consommer, alimentation et consommation puisqu’ils ont tous deux arguments.

Le critère permet également de distinguer deux ensembles de termes dénotant des lieux où vivent les espèces animales. Habitat, environnement, résidence n’ont qu’un argument réalisé par des termes dénotant des espèces animales (ex. habitat de la tortue molle à épines). En revanche, aire, frayère, site et territoire ont deux arguments : le premier est également réalisé par des termes désignant des espèces animales, mais le second renvoie à une activité spécifique pour laquelle le lieu est utilisé (ex. site de reproduction de la tortue molle à épines).

  • Même type d’arguments : Ce critère permet, par exemple, de réunir les termes disparaître, éteindre et extinction, puisque l’argument de tous ces termes est un organisme vivant qui subit un changement.

Ce critère permet également de distinguer les termes occuper et vivre des termes distribution, répartition et se répartir. Bien que tous ces termes aient deux arguments et que les premiers soient réalisés par des termes dénotant des espèces, les seconds arguments des termes occuper et vivre sont réalisés par des termes désignant des lieux (forêt, habitat, milieu, etc.), alors que ceux des termes distribution, répartition et se répartir dénotent, soit un lieu, soit un ordre de grandeur associé à un lieu (mondial, global, local, dans les eaux, etc.).

  • Circonstants similaires : Les annotations mettent au jour des circonstants qui peuvent être partagés par les termes. Par exemple, les contextes contenant disparaître, éteindre et extinction renferment des circonstants exprimant la durée, le lieu ou le degré.

Appliqués aux deux séries de termes occuper et vivre et distribution, répartition et se répartir, des circonstants exprimant la durée s’observent pour les termes de la première série, mais pas pour les termes de la seconde. Ceci fournit un indice supplémentaire que les termes occuper et vivre, d’une part, et distribution, répartition et se répartir, d’autre part, évoquent deux situations distinctes.

L’observation des contextes annotés permet de mettre en œuvre ces premiers critères. Ensuite, les terminologues établissent si les termes dénotent la même situation. Par exemple, la situation évoquée par les termes disparaître, disparition, éteindre et extinction se distingue d’une situation évoquée par vulnérable, en danger et en péril puisque les premiers termes impliquent une fin imminente, alors que les seconds évoquent un statut précaire, certes, mais sans fin assurée. De même, les termes disparaître, disparition, éteindre et extinction évoquent un changement d’état alors que d’autres termes comme abattage, abattre, décimer ou tuer engagent une cause ou un agent à l’origine de ce changement d’état.

Cette analyse doit tenir compte du fait qu’une même forme lexicale peut évoquer plus d’un cadre sémantique. Par exemple, les acceptions que nous avons définies jusqu’ici pour le verbe consommer permettent de l’associer à trois situations environnementales (décrites dans trois cadres distincts) :

  • une activité à laquelle se livrent les espèces qui ingèrent des aliments (Au Québec, le risque de contamination par le plomb peut s’avérer inquiétant, car l’aigle royal consomme fréquemment de la sauvagine).
  • une activité à laquelle se livrent les êtres humains qui utilisent des ressources pour leurs propres fins (25 % des habitants de la planète consomment 75 % de l’énergie commerciale) ;
  • une activité associée à des véhicules qui utilisent une forme d’énergie pour fonctionner (En prenant pour hypothèse qu’un véhicule électrique rechargeable moyen consommerait 2 900 kWh et éviterait l’émission de 3,4 t de CO2 par année).

Les situations évoquées par les termes sont par la suite décrites dans une ressource complémentaire au DiCoEnviro, à savoir le Framed DiCoEnviro. Par exemple, la situation évoquée par les termes s’alimenter, alimentation, se nourrir, consommer et consommation est décrite dans un cadre sémantique appelé Ingestion (inspiré d’un cadre présent dans la ressource FrameNet) (figure 6). Dans le Framed DiCoEnviro, les termes appartenant aux différentes langues sur lesquelles nous travaillons sont également ajoutés. Les critères énumérés ci-dessus sont appliqués uniformément aux termes décrits dans les autres langues.

La description d’un cadre comprend les éléments suivants :

  • Une définition du cadre (de la situation évoquée) ;
  • Des exemples dans différentes langues provenant des corpus spécialisés ;
  • Des liens vers la ressource FrameNet lorsqu’il s’agit d’un cadre s’inspirant de l’un de ceux décrits dans cette ressource (nous consultons la version originale anglaise de FrameNet) ;
  • La liste des participants obligatoires ;
  • La liste des participants optionnels ;
  • Des termes évoquant ce cadre dans différentes langues avec des hyperliens vers les articles décrivant ces termes dans le DiCoEnviro (des hyperliens vers le Framed DicoEnviro sont également proposés à partir du DicoEnviro).
  • Des relations entre cadres sur lesquelles nous revenons ci-dessous.

Figure 6 – Cadre Ingestion dans le Framed DicoEnviro (2023).

L’association de termes et de toutes leurs propriétés linguistiques décrites dans le DiCoEnviro à des cadres conceptuels est une première méthode permettant de mettre au jour la contribution de ces termes à des situations environnementales. Mais nous pouvons aller plus loin en connectant les cadres afin de représenter des scénarios propres au domaine de l’environnement. Ici, encore, nous nous inspirons de la ressource FrameNet dans laquelle de multiples relations entre cadres sont dégagées, mais nous nous focalisons sur des réalités propres aux différentes thématiques de l’environnement sur lesquelles nous travaillons.

La figure 7 montre que la situation Ingestion est connectée à toute une série de situations décrivant les activités auxquelles se livrent les espèces menacées. Un cadre générique appelé Species_activities fédère des cadres décrivant des situations spécifiques : Ingestion (figure 6), mais également Residence (évoqué par les termes occuper et vivre), Self_motion (évoqué par les termes déplacement, déplacer, migration et migrer) ; Hunting (évoqué par les termes chasser, chasser et prédation), et ainsi de suite.

Figure 7 – Quelques relations entre cadres dans le Framed DicoEnviro (2023).

 5. Conclusion

Dans cet article, nous nous sommes attachée à présenter quelques repères théoriques et méthodologiques conçus pour rendre compte des propriétés lexico-sémantiques des termes dans les ressources terminologiques. Cette démarche est déployée dans une ressource portant sur le domaine de l’environnement (le DiCoEnviro) où elle a permis de construire des entrées très riches décrivant des termes appartenant aux parties du discours du nom, du verbe, de l’adjectif et de l’adverbe. Elle est également utilisée pour décrire des termes reliés à des langues différentes. Le travail de description se poursuit : de nouveaux articles sont ajoutés dans le DiCoEnviro ; de nouveaux cadres sont définis dans le Framed DiCoEnviro et des relations sont établies entre ces cadres.

La ressource se présente comme un complément utile (et nécessaire, à notre avis) aux ressources comme les ontologies, les thésaurus et les bases de connaissances terminologiques qui cherchent à expliquer le lien entre les termes et les connaissances du domaine et qui, ce faisant, doivent soit mettre les renseignements linguistiques en arrière-plan, soit en faire abstraction.

Les rubriques du DiCoEnviro proposent aux utilisateurs des portraits du comportement linguistique des termes dans les textes spécialisés : 1. un accès à de nombreux contextes et à des contextes annotés mettant en évidence les réalisations d’arguments et de circonstants ; et 2. une liste de relations argumentales, paradigmatiques et syntagmatiques accompagnées d’explications et présentées sous forme de texte ou de graphe permettant de mettre au jour des réseaux terminologiques. Ce travail de description fait appel à des compétences linguistiques mais également à des connaissances spécialisées dans le domaine à décrire. Une partie de ces connaissances sont accessibles dans les corpus analysés, mais, invariablement, les terminologues doivent se tourner vers des experts pour obtenir des compléments d’information ou confirmer des éléments extraits du corpus.

Nous proposons également de rendre compte de la contribution des termes à l’expression des connaissances du domaine en connectant les articles du DiCoEnviro à une ressource complémentaire appelée Framed DiCoEnviro. Cette dernière décrit des situations environnementales et montre quels termes évoquent ces différentes situations. Le modèle théorique choisi et la méthodologie qui en découlent ont le mérite de tenir compte de termes peu décrits dans les ressources terminologiques (des verbes, des adjectifs, des termes prédicatifs et quasi-prédicatifs) et de faire converger les aspects linguistiques et conceptuels dans une description terminologique.

Références bibliographiques

BOTTA, Mariana, « La terminologie de l’environnement en vulgarisation scientifique : la famille lexicale de la régénération des forêts en portugais », Équivalences n. 40, 2013, pp. 277-298.

CRUSE, Alan D., Lexical Semantics, Cambridge, Cambridge University Press, 1986.

CRUSE, Alan D., « Polysemy and Related Phenomena from a Cognitive Linguistics Viewpoint », in SAINT-DIZIER, Patrick et VIEGAS, Evelyn (éds.), Computational Lexical Semantics, Cambridge, Cambridge University Press, 1995, p. 33-49.

DELAVIGNE, Valérie, « La notion de domaine en question. À propos de l’environnement », Neologica, n. 16, 2022, p. 27-60.

DiCoEnviro. Dictionnaire fondamental de l’environnement (http://olst.ling.umontreal.ca/cgi-bin/dicoenviro/search_enviro.cgi). Consulté le 16 juin 2022.

DROUIN, Patrick, « Term extraction using non-technical corpora as a point of leverage », Terminology, n. 1, 9, 2003, p. 99-117.

DURY, Pascaline, « Étude comparative et diachronique des concepts ecosystem et écosystème », Meta, n. 3, 44, 1999.

EuroVoc (https://eur-lex.europa.eu/browse/eurovoc.html). Consulté le 19 juin 2023.

FILLMORE, Charles, « Frame Semantics », in THE LINGUISTIC SOCIETY OF KOREA (éd.), Linguistics in the Morning Calm, Seoul, Hanshin Publishing Company, 1982, p. 111-137.

FILLMORE, Charles, BAKER, Collin, « A Frames Approach to Semantic Analysis », in HEINE Bernd, NARROG, Heiko (éds.), The Oxford Handbook of Linguistic Analysis, Oxford, Oxford University Press, 2010, p. 313-339.

Framed DiCoEnviro. A Framed Version of DiCoEnviro (http://olst.ling.umontreal.ca/dicoenviro/framed/index.php). Consulté le 15 octobre 2022.

Grand dictionnaire terminologique, dans la Vitrine linguistique (https://vitrinelinguistique.oqlf.gouv.qc.ca/). Consulté le 19 juin 2023.

L’HOMME, Marie-Claude, « Maintaining the balance between knowledge and the lexicon in terminology: a methodology based on Frame Semantics », in PETERS, Pam et al., (éds.), Medical Lexicography and Terminology, Lexicography Asialex, n. 1, 4, 2018, p. 3-21.

L’HOMME, Marie-Claude, Lexical Semantics for Terminology, Amsterdam/Philadelphia : John Benjamins. , 2020a.

L’HOMME, Marie-Claude, « Revisiting Polysemy in Terminology », in GAVRIILIDOU, Zoe et al. (éds.), Proceedings of XIX EURALEX Congress: Lexicography for Inclusion, Democritus University of Thrace, 1, 2020b, p. 415-424.

L’HOMME, Marie-Claude, « Managing polysemy in terminological resources », Terminology, 2024, à paraître.

L’HOMME, Marie-Claude, BERNIER-COLBORNE, Gabriel, « Terms as labels for concepts, terms as lexical units : A comparative analysis in ontologies and specialized dictionaries », Applied Ontology, n. 4, 7, 2012, p. 387-400.

L’HOMME, Marie-Claude et al., « Building Multilingual Specialized Resources Based on FrameNet : Application to the Field of the Environment », in TORRENT, Tiago et al. (éds), International FrameNet Workshop 2020. Towards a Global, Multilingual FrameNet., LREC 2020, 2020, p. 85-92.

LAMBERTI ARRAES, Flavia, « Lexicon-driven approach for Terminology: specialized resources on the environment in Brazilian Portuguese », in COSTA, Rute et al., Proceedings of the Workshop on Terminology in the 21st century : many faces, many places, Marseille, LREC 2022, 2022, p. 1-7.

LEDOUBLE, Hélène, « Vulgarisation scientifique et médiatisation de la science : instabilité terminologique dans le domaine de la lutte biologique », Terminology, n. 1, 25, 2019, p. 60-92.

MEL’ČUK, Igor et al., Introduction à la lexicologie explicative et combinatoire, Louvain-la-Neuve, Duculot, 1995.

Neologica (2022). Numéro spécial intitulé « Néologie et environnement », 16.

NeoVisual. Discover the terminological structure of the field of the environnement (olst.ling.umontreal.ca/dicoenviro/neovisual). Consulté le 26 juin 2023.

POLGUÈRE, Alain, « Propriétés sémantiques et combinatoires des quasi-prédicats sémantiques », Scolia, n. 26, 2012.

RUPPENHOFER, Josef, FrameNet II : Extended Theory and Practice, Berkeley, International Computer Science Institute, 2016, (https://framenet.icsi.berkeley.edu/fndrupal/index.php?q=the_book).

Termium Plus® (https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra). Consulté le 19 juin 2023.

Wildlife Ontology (http://www.bbc.co.uk/ontologies/wo). Consulté le 10 novembre 2022.

ZHENG, Ying, Frame Semantics for the Field of Climate Change: Discovering Frames based on Chinese and English Terms, Montréal, Université de Montréal, 2022.

 


[1] Par exemple, EuroVoc (2023), Termium Plus® (2023) et le Grand dictionnaire terminologique (2023) proposent des découpages différents pour l’environnement.

[2] Nous ne pouvons donner ici l’ensemble des choix théoriques et méthodologiques effectués pour la compilation du DiCoEnviro. Des descriptions plus détaillées sont données dans L’Homme (2018) et L’Homme et al. (2020).

[3] Les versions italienne et portugaise sont réalisées dans le cadre de collaborations avec Maria Francesca Bonadonna et Flávia Lamberti Arraes (LAMBERTI ARRAES 2022), respectivement. La version chinoise a été réalisée par Zheng (2022).

[4] Le choix des termes et l’analyse des contextes dans lesquels ils apparaissent comprend également un travail d’analyse des sens et, le cas échéant, de distinction de sens multiples. Bien que le DiCoEnviro ne décrive que les sens reliés au domaine de l’environnement, il arrive assez souvent que certaines formes lexicales aient plus d’un sens relié au domaine, L’HOMME 2020b, 2024, à paraître.

[5] Dans le DiCoEnviro, les arguments sont représentés au moyen de termes typiques pour la consultation. Les termes typiques sont ceux qui sont censés être les plus représentatifs d’une position argumentale donnée. D’autres réalisations sont proposées en sélectionnant le + placé à la droite des termes typiques. Les arguments sont également étiquetés au moyen de rôles sémantiques (Agent, Patient, Destination) que les utilisateurs peuvent faire afficher s’ils le souhaitent.

 


Per citare questo articolo:

Marie-Claude L’HOMME, « Le DiCoEnviro : découverte et représentation de structures terminologiques dans le domaine de l’environnement », Repères DoRiF, n. 30 – Variations terminologiques et innovations lexicales dans le domaine de la biodiversité et du changement climatique, DoRiF Università, Roma, giugno 2024, https://www.dorif.it/reperes/marie-claude-lhomme-le-dicoenviro-decouverte-et-representation-de-structures-terminologiques-dans-le-domaine-de-lenvironnement/

ISSN 2281-3020

Quest’opera è distribuita con Licenza Creative Commons Attribuzione – Non commerciale – Non opere derivate 3.0 Italia.