CHWP B.10 Leroy-Turcan, "L'informatisation du Dictionnaire Étymologique de G. Ménage"

2. Fonctionnement du DEOLF: les modalités significatives

2.1. Le cadre formel

739 pages (725+14) de deux colonnes de 67 lignes, soit 1478 colonnes, donc 99.026 lignes. Ce qui donne 4.654.222 signes, en se fondant sur la fourchette haute du nombre de caractères par ligne.[13]

Les différents caractères utilisés: grand romain, petit romain, italique, droit, caractères grecs et hébraïques. Pour l'arabe, Ménage donne généralement[14] des formes translittérées (s.v. Lyon, p. 461, coran et cornard), alors que pour le syriaque et l'hébreu il donne successivement les deux formes, en langue d'origine et translittérées, que la forme translittérée soit postposée (comme s.v. abbé "syriaque ***: Abba" et abricot[15] "hébreu *** saked du verbe *** sakad"), ou qu'elle précède la forme en caractère hébraïque (s.v. abri: "il y a dans Solomoch, abriel ***").

L'italique est utilisée pour toute citation de mots ou de textes, pour le sens d'un mot donné dans une langue étrangère, ou comme équivalent dans une même langue, pour les occurrences d'emplois d'expressions françaises, etc.

Le nombre d'entrées par colonne est très variable: Ménage pratique l'irrégularité extrême, en rédigeant des articles qui s'étendent sur trois ou quatre colonnes (s.v. vers Alexandrins), ou qui se limitent à l'étymon (s.v. lobes du foyes, loger, logis, loin...)[16] ou à un renvoi (s.v. aumelette, bal, balet, balot...), parfois précédé d'une définition générique (s.v. heouse) ou non (s.v. balise)!

2.2. Vedettes, sous-vedettes, doubles vedettes, vedettes alternatives

Les vedettes sont en grand romain majuscule, les sous-vedettes en petit romain majuscule; certaines vedettes et sous-vedettes sont 'allongées' par des précisions notées en caractères minuscules qui ne font pas forcément partie de la vedette, mais ont un rôle définitoire permettant de distinguer soit des acceptions particulières d'un même lexème, soit des formes homonymiques. Ainsi pour le premier cas, les entrées AGACER les dents et AGACER quelqu'un; AUBE du jour et AUBE de prestre; GANDS de frangipane et GANDS de Néroli, etc., pour le second les entrées QUEUE d'aronde, de rat, etc.

On relève relativement peu d'articles en sous-vedette dans le DEOLF[17] et ils correspondent presque toujours à des faits d'homographie pure; mais en contre-exemple on relève des faits d'homographie sans sous-vedette. Pour le corpus des entrées de A, la proportion de sous-vedettes est faible: 12 sur un total de 504 entrées, soit 2,4%. Cette situation est comparable pour le reste du DEOLF: en attendant l'informatisation, un simple échantillon pour d'autres lettres de l'alphabet suffit à montrer qu'on ne peut pas se contenter de corpus trop limités.

On observe en général que la sous-vedette, loin de mettre en évidence un lien dérivationnel, permet de marquer une autonomie sémantique beaucoup plus qu'un statut de dépendance sémantique (dérivation sémantique) ou étymologique. Mais comme pour tout ce qui relève de l'organisation, le lecteur du DEOLF reste face à la fantaisie formelle, sans pouvoir en toute rigueur déterminer de système. Ainsi, la plupart du temps le grand romain de la vedette permet-il de marquer le statut indépendant pour tous les composés qui impliquent un sémantisme distinct de la base lexicale: cf. les articles avant, avant-garde et avant-propos, les mots formés sur la base de gorge et de gourmand, gris et gros, etc.

Pour les faits d'homographie sans sous-vedette,[18] la détermination fait bien partie de la vedette même si elle est en minuscules, puisque c'est elle qui justifie la mise en vedette à part entière et non en sous-vedette. Pour balise, on observe que la présence d'une sous-vedette exclut la mise en double vedette du verbe baliser, alors que Ménage pratique assez souvent la double vedette dérivationnelle (cf. infra): il privilégie ainsi plutôt la sous-vedette (donc l'homographie), malgré le contenu minimal de l'article réduit au renvoi à balzan!

La pratique des vedettes distinctes et des sous-vedettes invite à poser la question de la polysémie parallèlement à l'homophonie: quelle conscience linguistique Ménage avait-il? L'aide informatique nous offrirait rapidement les éléments pour une étude exhaustive des faits présents dans le DEOLF.

Les vedettes doubles sont dérivationnelles. Nous les avons étudiées sur les corpus de A et G: elles[19] marquent la plupart du temps un lien dérivationnel (base --> dérivé, notamment déadjectival et dénominal), et dans ce cas elles annoncent l'étude conjointe des deux termes mis en même temps en vedette;[20] les deux mots mis en vedette correspondent parfois (rarement) à une simple variante morphologique (masculin/féminin; singulier/pluriel: s.v. avoir.avoirs);[21] très rarement elles équivalent à une vedette alternative (variante de graphie/prononciation: s.v. goujart.goujat "on prononce aujourd'hui goujat").

Ces associations étroites de termes liés étymologiquement manifestent donc une certaine conscience linguistique de la dérivation sur une base lexicale autonome, même si, malgré cela, on ne trouve que peu de regroupements par familles et si Ménage se trompe d'étymon ou reconstruit abusivement des étymons par reconstruction interne.

Inversement, l'absence de mise en sous-vedette de termes homographes prend bien en compte la distinction des étymoms: ainsi pour Loir, l'animal (glis, gliris), et pour Loir, le cours d'eau (ledus). Le cas des trois vedettes distinctes pour loge, loger et logis est révélateur puisque Ménage propose trois étymons totalement différents, tous erronés: pour loge, l'italien loggia à la place de l'étymon vieux-bas-francique *laubja, pour loger, le latin locare et pour logis le grec logion latinisé en logium pour former une base logicium; alors qu'il lui était impossible de reconstruire le vieux-bas-francique, il pouvait saisir la dérivation en français!

Peut-on dégager une sémiotique de la typographie?[22] La double vedette balafre: balafré avec la séparation des deux points correspond à deux étymologies inconnues; or, dans les autres cas relevés, la double vedette comporte la virgule (s.v. avis, aviser) ou le point.

Les vedettes avec alternative associent deux formes proches d'un même mot, reliées par la conjonction ou: l'alternative n'est pas toujours absolue, et il est fréquent qu'au ou de la vedette corresponde dans l'article un et. Ces vedettes manifestent soit une hésitation dans la graphie, soit le rappel d'une graphie utilisée dans la vedette donnée en 1650, avec cependant le choix pour une graphie plus moderne; la forme retenue ne semble pas marquée par sa place dans l'énoncé alternatif.[23]

[Retour à la table des matières] [Suite]


Notes

[13] Selon les caractères (italique ou droit, grand romain minuscule ou majuscule, grecs ou autres), entre 44 et 47. Une majuscule en grand romain compte deux caractères. Les blancs entre les mots comptent un caractère. Il paraît d'autant plus difficile et vain d'évaluer le nombre de caractères que dans le cas de citations d'inscriptions (en latin comme s.v. Arles, p. 47 ou en grec, s.v. Arsenac, p. 51 ou s.v. avant, p. 57) ou de textes en vers, une ligne peut ne comporter qu'un seul mot: cf. p. 459 longue citation en vers italiens; p. 426-7 et 428-9; p. 397 alexandrins dépassant la ligne, d'où rejet d'un mot sur une autre ligne.

[14] Cf. Les Origines 1650, s.v. alcove et alcoran, alzan et algèbre, anforges: les mots en caractères arabes sont suivis de la translittération.

[15] La fin de l'article abricot réunit plusieurs formes en langues étrangères.

[16] Situation plus fréquente en 1650 qu'en 1694.

[17] Ménage ne semble pas pratiquer la mise en sous-vedette dans les Origines: les sous-vedettes correspondent à l'enrichissement du corpus. Il y a déjà plusieurs cas d'homographie dans 1650, parfois distincts dans les entrées, le plus souvent associés dans un même article -- comme s.v. gigot en 1650 où l'on a la base de trois articles de 1694; cf. aussi gouge: l'ordre dans lequel ont été donnés les deux sens en 1650 correspond à la 'hiérarchie' vedette (= sens 1), sous-vedette (= sens 2). Il serait intéressant d'étudier l'importance des sous-vedettes homographes préparées dans les notes manuscrites de l'exemplaire sur lequel Ménage a préparé l'édition de 1694 (BN Rés X.923).

[18] Comme à AILE d'oiseau / AILE d'église et AIR de chanson / du bel AIR, AIRE d'oiseau / AIRE (ville de Gascogne), GALION (bateau) / GALION (plante), QUEUE (5 entrées en grand romain), GANDS, GANDS de Frangipane et GANDS de Néroli.

[19] Ménage pratique dès 1650 les vedettes doubles; on peut relever des cas de vedettes simples en 1650 avec cependant étude de deux dérivés sous une même entrée et modification en 1694 avec vedette double: cf. avoutrie en 1650 --> avoutrie-avoutre dans 1694.

[20] Par exemple, on en trouve la preuve explicite s.v. gelinotte où Ménage renvoie à l'article geline.gelinotte.

[21] Il faut ici poser la question de conscience linguistique des faits de dérivation impropre avec changement de catégorie grammaticale et des faits de dérivation sémantique.

[22] Nous avons relevé suffisamment de corrections manuscrites de Ménage lui-même sur la ponctuation pour y accorder une attention particulière. Seule une étude assistée par ordinateur nous permettra de déterminer s'il y a bien dans le DEOLF une pertinence sémiotique de la police de caractères et de la mise en page; certains cas nous invitent à poser, indépendamment de la question de conscience linguistique, celle de conscience sémiotique de la typographie (cf. l'utilisation plus ou moins conventionnelle de l'italique).

[23] À noter que certains mots ainsi signalés ont parfois déjà été étudiés dans les Observations (polémiques sur le lien graphie/usage).