La description du lexique (Freesette)

De CRPE

Décalage important entre la compétence passive (les mots que l'on comprend) et la compétence active (les mots que l'on sait utiliser).

Lexique et vocabulaire sont utilisés avec des valeurs différentes en linguistique. Le lexique comprend l'ensemble des mots au moyen desquels les membres d'une communauté linguistique communiquent entre eux. Le vocabulaire désigne un domaine du lexique qui se prête à un inventaire et à une description. Le lexique est donc divisible en strates diversifiées selon la fréquence et les domaines d'expérience.


Perspective diachronique

Les mots dont nous nous servons sont apparus pour la plupart, il y a bien longtemps. L'étymologie fournit des éléments précieux sur l'origine et l'évolution des formes. On peut classer les informations qu'apportent les recherches historiques en trois rubriques :

  • les aspects chronologiques : permettent d'indiquer à quel moment une forme est apparue tout du moins dans un texte écrit.
  • les changements de formes phonétiques : elles aident à suivre l'évolution, les transformations que subissent les formes. Ce travail se fait sur des séries de mots qui permettent de mettre à jour des lois phonétiques régulières.
  • les changements lexicaux : l'évolution du sens (perte d'une unité lexicale, ajout...) reflète aussi des évolutions dans la société. Le domaine technique est celui qui connaît les plus profonds bouleversements avec un renouvellement rapide des termes.

Pour les mots latins, on distingue l'évolution populaire et l'évolution savante. La première suit le cours de l'histoire et se traduit généralement par une usure, une érosion du mot. La formation savante résulte d'un emprunt tardif (après le VIème s.) au latin classique. Il n'y a donc pas de modifications importantes par rapport au latin. Les sciences continuent ce type d'emprunt.

Perspective synchronique

Un certain nombres de notions existent pour décrire le lexique. 2 grands axes descriptifs possibles :

  • la fabrication des mots (c'est de la morphologie lexicale)
  • le sens des unités (c'est de la sémantique)

La morphologie lexicale

On parle de morphologie lexicale pour spécifier sur quels éléments vont porter les règles de construction. Le premier souci est de définir les unités de travail. A priori le mot est l'unité de base idéale, mais il n'est pas si simple à identifier.

La dérivation

Les linguistes travaillent avec une unité mieux cernée, le morphème (unité minimale de signification). "Jardin" = un morphème / "Jardinier" = 2.

  • Comment identifier les morphèmes ? : on procède par commutation. On cherche à repérer le plus petit segment porteur de signification et l'élément invariant. Media: Ex. de commutation.jpg. L'absence du "e" final peut poser question. Il aura tendance à disparaître quand on décrira un morphème qui entre dans la composition d'une unité plus vaste.
  • Termes et notions utilisées pour rendre compte de la fabrication des unités : si on reprend l'ex. de "jardinier". On parle de morphème libre pour jardin- (qui possède une existence autonome) et de morphème lié pour -ier (qui n'apparaît jamais à l'état isolé et a donc besoin de s'accrocher à un autre élément). Cette terminologie est générale. Elle peut être affinée quand on utilise les notions de base et d'affixes dérivationnels. Toute unité peut être présenté ainsi (entre parenthèses, élément facultatif) :
   (préfixe) affixe additionnel + base + (suffixe) affixe dérivationnel

On peut rencontrer : une base à l'état brut (dur), une base + un suffixe (durable), un préfixe + une base (bimensuel), un préfixe + une base + un suffixe (alunissage).

  • La base est le support où vont se greffer les morphèmes dérivationnels. Terme plus intéressant que la racine ou le radical. Possibilité de plus d'analogies avec d'autres mots. Ex : blanchisseur. Le radical est "blanc". Aucune analogie possible (pas de commutation). Si on prend la base "blanchiss" + suffixe (-eur), on peut faire des analogies avec "coureur". Dans les deux cas, "-eur" signifie "celui qui fait ce qu'indique la base.
  • Le terme d'affixe dérivationnel sert à désigner aussi bien les préfixes que les suffixes. Les préfixes se placent devant la base et ne modifient en général pas la catégorie de la base. Les suffixes se placent derrière la base. Ces sont des catégoriseurs grammaticaux, c'est-à-dire qu'ils indiquent la catégorie de l'unité et cela sans tenir compte de celle de la base. De nombreux suffixes provoquent un changement de catégories : Media: Exemples suffixes.jpg. On étiquette les suffixes selon la catégorie qu'ils permettent d'obtenir. Les suffixes nominaux servent à fabriquer des noms et les suffixes verbaux, des verbes.
  • Distinction entre flexion et dérivation : le premier se rattache à la morphologie flexionnelle (concerne donc la grammaire) ; le second à la morphologie dérivationnelle (donc traité dans la partie sur le lexique). On parle de flexions, dans "nous chantons", "chiens". Il s'agit de marques grammaticales dont les unités appartiennent à un inventaire très réduit. Les éléments fabriqués ne sont pas placés dans un dictionnaire. On peut discuter le statut de la marque "er" de l'infinitif, tantôt considérée comme un suffixe, tantôt comme une marque de flexion.
  • Quand une unité est formée par l'ajout simultanée d'un préfixe et d'un suffixe, on parle de parasynthétique comme dans "appauvri". Cas où on ne peut pas faire autrement. A partir de la base "pauvr-", on ne peut pas seulement mettre un préfixe ou un suffixe.
  • Dérivation impropre (ou de conversion) : désigne un changement de classe grammaticale. En français, on peut assez facilement fabriquer un nom en mettant un déterminant devant des éléments très variés : le vrai, le savoir, des on-dit...

La composition

A côté de la dérivation, il existe un autre procédé qui intervient dans la fabrication des unités du lexique : la composition. Ce procédé fait intervenir plusieurs bases (en général 2) et parfois des éléments de liaison comme dans "rouge-gorge". La nouvelle forme peut se présenter différemment graphiquement : Soit les différents éléments restent séparés (chemin de fer), soit ils sont reliés par un trait d'union (arc-en-ciel), soit ils sont soudés (bonhomme). 2 grands types de composition se distinguent :

  • La composition savante : pour identifier les éléments le locuteur dispose de deux stratégies : soit il connaît le latin ou le grec, soit il peut insérer l'unité dans une série et ainsi s'appuyer sur l'analogie. Quand on découpe un mot formé par composition savante, on précise en général la langue d'origine. On peut trouver 2 éléments d'origine latine, 2 d'origine grecque ou 2 éléments hybrides. Cette dernière composition a été longtemps évitée. Ce n'est plus le cas de nos jours. Ces mots formés peuvent être à leur tour dérivé (sociologie, sociologique, sociologisme...). Les bases n'ont pas toujours une place imposée dans un composé (différence avec les affixes).
  • La composition non savante : unités dans lesquelles le locuteur est à même d'identifier assez facilement les composés. On utilise l'expression mots composés pour indiquer que même si l'on reconnaît des unités qui peuvent être utilisées de façon autonome, même si graphiquement les mots sont isolés (ou reliés par un trait d'union), on se retrouve devant un bloc qui possède de nouvelles propriétés : le 2ème nom n'a pas de déterminant ; il est impossible de modifier séparément les éléments (changer leur place) ; la reformulation est souvent impossible pour les adjectifs ; on ne peut pas remplacer un mot composé par un équivalent. Pour classer les mots composés, on peut tenir compte de la nature du résultat obtenu et de celles des composés : on a ainsi les noms composés (la grande majorité), les adjectifs composés et les verbes composés (qui sont en fait plutôt des locutions).

Assemblages principalement utilisés : Media: assemblages mots composés.jpg

Les adjectifs composés peuvent être formés à partir d'un adjectif et d'un nom / d'un adjectif et d'un adjectif comme "aigre-doux" et les composés à partir de nationalité. Pour les verbes, on parle le plus souvent de "locutions" que de verbes composés pour désigner des blocs tels que "avoir faim", "prendre racine", "porter plainte"...
La présence d'un trait d'union assure en général aux mots composés une entrée autonome dans le dictionnaire. Pour ceux formés d'unités graphiquement séparées, il faut souvent les chercher à l'intérieur des articles dans la rubrique "locutions".


En conclusion de ce point, on peut dire que l'approche morphologique conduit à séparer le lexique en deux grands ensembles : les mots simples et les mots construits. La morphologie apporte beaucoup dans les mots construits qui sont considérés comme motivés (et non arbitraires comme les mots simples). Par ex., on ne peut pas expliquer la formation de chat (mot simple), mais bien celle de chaton (mot construit). La morphologie permet donc de former des familles de mots.

La description sémantique

Directions complémentaires prises par les analyses sémantiques :

  • des sous-ensembles d'unités ont été constitués autour d'une notion (la joie, la connaissance...). Ce découpage permet de collecter des lexèmes liés à cette notion et de constituer un champ associatif.
  • le champ associatif peut ensuite être découpé en champs sémantiques : des unités de la même classe grammaticale apparentées à un thème commun.

Il est intéressant de décomposer les unités lexicales en atomes de sens (les sèmes) qui vont permettre dès lors des comparaisons plus structurées.

Le signe et la réalité

La relation entre les deux est complexe. Le concept correspond au signifié et l'image accoustique au signifiant. L'association de ces deux composantes est arbitraire. Ce caractère arbitraire (ou immotivé) est pondéré par la nécessité pour tous les locuteurs d'une langue donnée de faire le même choix. le triangle qui accorde une place à la réalité extralinguistique comprend : le Nom, la Chose, le Sens (Ogden et Richard, 1923 puis Ullmann, 1952). Dans cette représentation, sens renvoie à signifié, nom à signifiant et chose à référent.

Le signe n'est pas la réalité. "Le mot chien ne mord pas"... Il y a d'un côté la réalité (animal avec caractéristiques propres), et de l'autre le signe linguistique pourvu d'un signifiant (une forme sonore et graphique) et d'un signifié (un sens, une représentation mentale). Mais chaque langue découpe le monde à sa façon et donne aux locuteurs qui la parlent un cadre de pensée et des catégorisations spécifiques. De nombreux signes possèdent en outre de multiple sens : ours peut désigner l'animal et l'encadré de présentation d'une équipe de collaborateurs dans un journal.

Ces points sont à l'origine de multiples difficultés qui surgissent dans l'analyse sémantique : décrit-on la réalité ou la langue ? Les approches actuelles accordent un peu moins d'importance à ce débat (notamment la lexicologie cognitive).

2 termes peuvent servir à exprimer ce lien entre la réalité et la langue :

  • la dénotation : c'est la capacité qu'a un lexème (= morphème lexical) de désigner potentiellement une sorte d'être particulier.
  • la référence : vise à appliquer une expression linguistique à une entité particulière.

Ex : chien peut servir à dénoter toute une classe d'animaux qui présentent un certain nombre de caractéristiques (comme le fait d'aboyer) alors que l'acte de référence sert à expliquer dans quelles conditions l'énoncé "il est à toi ce chien ?" peut être employé et fonctionner de façon satisfaisante en contexte.

La dénotation fonctionne en couple avec la connotation qui désigne des valeurs secondaires qui viennent s'ajouter au sens dénotatif. Ces valeurs peuvent être communes à un groupe ou plus spécifiques à un locuteur.

Cela explique pourquoi on ne travaille pas en général sur des unités isolées, mais 1/ à l'intérieur d'un ensemble, 2/ dans un contexte déterminé.

Les relations lexicales

Les unités lexicales ne sont pas considérées comme un simple catalogue, un classement alphabétique. Il existe diverses relations entre elles. Celles-ci s'exercent en général qu'entre les unités qui appartiennent à un même champ sémantique. On s'en sert notamment quand on veut définir un lexème : on recourt alors soit à un mot proche, soit à un terme contraire, soit à une catégorie plus générale. La plupart de ces relations se présentent sous forme de couples.

  • Les relations liées à l'identité :

Il y a tout d'abord le cas de l'identité du signifiant : homonymie, terme général. Lorsque l'identité concerne la forme orale, on utilise le terme d'homophonie. Les homographes sont des mots de forme écrite semblable. Les homonymes complets concernent des mots à la fois homophones et homographes.
Quand 2 éléments possèdent la même forme sonore et graphique et des sens distincts, on peut quand même se demander s'il s'agit d'homonymes complets ou de termes polysémiques (un terme qui possède plusieurs sens distincts) comme "voler". Quand deux unités ont une forme proche et des sens différents, on parle de paronymie : "collision" et "collusion" par ex. sont des paronymes.

Il y a aussi le cas de l'identité du signifié : synonymie et antonymie. La synonymie concerne le sens des unités. Deux unités synonymes sont considérées comme interchangeables. La relation d'équivalence est très souvent partielle. Elle intervient dans un nombre limité de contextes. A mettre en relation avec la différence entre sens propre et sens figuré. Les unités peuvent aussi se différencier par le niveau de langue. Pour toutes ces raisons, on considère qu'il n'y a quasiment pas de véritables synonymes. On parle parfois de synonymie partielle.
L'antynomie est en quelque sorte la propriété inverse. Relation d'opposition, de contraire. Mêmes contraintes que la synonymie. Il faut disposer d'un cadre pour permettre la comparaison. Il existe plusieurs sortes d'antonymes : 1/ les termes complémentaires, couple dans lequel l'un exclut l'autre (graçon / fille) ; 2/ les termes graduels, scalaires qui s'opposent mais laissent possible l'expression d'autres termes entre eux (blanc/noir - gris) ; 3/ les réciproques , on peut retourner la relation en changeant de terme (Pierre est le mari de Sophie / Sophie est la femme de Pierre).

  • Les relations hiérarchiques entre les termes :

La relation d'inclusion se présente sous deux aspects complémentaires : l'hypéronyme désigne le terme englobant, l'hyponyme désigne le terme englobé. L'hypéronyme est un terme qui a une valeur plus générale que l'hyponyme : "véhicule" et "voiture". Pour un terme, il peut exister plusieurs hypéronymes. Dans un texte, l'ordre d'apparition des deux n'est pas libre, mais doit se plier à certaines contraintes générales. En première mention, on évite, sauf choix stylistique, d'utiliser un hypéronyme.

  • La relation de transfert est décrite à travers la notion de métonymie : on parle de métonymie pour identifier une relation de transfert entre deux termes : "boire un verre". Verre ne désignant pas le contenant, mais le liquide contenu.
  • La relation entre une totalité et ses parties constituantes : elle est identifiée à travers le couple holonymie (tout / parties) et méronymie (parties / tout). Ce sont des relations que l'on trouve entre chapitre et livre ou couplets et chansons ou "manche" et "marteau". Pour vérifier, on les remet dans la phrase suivante : le manche est une partie du marteau... etc.

Les analyses en traits

Comment décrire le sens des unités lexicales ? Aucune description systématique n'a encore abouti.

L'analyse sémique : elle essaie de reproduire la méthode utilisée en phonologie. Pour chaque unité, un certain nombre de traits sont dégagés. On appelle sèmes ces atomes de signification. Pour chat, on peut envisager [+félin], [+mâle], [+domestique]...Le travail le plus connu est celui de Pottier (1963) sur divers sièges : Media: Tableau de Pottier.jpg.
Les traits communs sont les sèmes génériques. Les traits particuliers sont appelés sèmes spécifiques. Des critiques sont portés sur le choix des sèmes : comment sont-ils identifiés ? Chaque sous-ensemble de termes conduit-il à créer une nouvelle série de sèmes ?

La notion de prototype

On considère qu'à chaque classe correspond un individu, c'est-à-dire le meilleur représentant de la classe, celui qui en présente les caractéristiques principales. En français, moineau est le prototype de la classe oiseau. Propriétés objectives et représentations culturelles. Le contour de la classe présente un certain flou, ce qui explique que certains individus comme les autruches et les pingouins puissent être appelés oiseaux. La théorie des prototypes introduit une part de souplesse que l'analyse sémique ne permet pas. Cette notion est actuellement développée dans le cadre de la sémantique cognitive où elle sert à décrire les réseaux qui interviennent dans la construction mentale des catégories.

L'analyse de type distributionnel

Part de l'hypothèse que maîtriser l'emploi d'un mot c'est possèder les contextes dans lesquels il apparaît. L'unité ne prend tout son sens dans un contexte et le nombre de contextes dans lesquels elle entre sont plus ou moins réduits. Ce type d'analyse est particulièrement adapté aux verbes.


La création lexicale

Une langue a besoin de créer de nouveaux mots pour répondre à l'évolution des techniques, aux changements dans la société. Mais la création originale (ou primitive) des mots est extrêmement rare. La plupart des nouveautés peuvent être considérées comme des recyclages.

  • l'un des procédés est l'emprunt à d'autres langues.
  • On trouve aussi des phénomènes de calque avec l'utilisation d'un mot existant pour désigner une nouvelle chose.
  • Les sigles : très productifs en français.
  • Métaphores.