CHWP B.10 | Leroy-Turcan, "L'informatisation du Dictionnaire Étymologique de G. Ménage" |
739 pages (725+14) de deux colonnes de 67 lignes, soit 1478 colonnes, donc 99.026 lignes. Ce qui donne 4.654.222 signes, en se fondant sur la fourchette haute du nombre de caractères par ligne.[13]
Les différents caractères utilisés: grand romain, petit romain, italique, droit, caractères grecs et hébraïques. Pour l'arabe, Ménage donne généralement[14] des formes translittérées (s.v. Lyon, p. 461, coran et cornard), alors que pour le syriaque et l'hébreu il donne successivement les deux formes, en langue d'origine et translittérées, que la forme translittérée soit postposée (comme s.v. abbé "syriaque ***: Abba" et abricot[15] "hébreu *** saked du verbe *** sakad"), ou qu'elle précède la forme en caractère hébraïque (s.v. abri: "il y a dans Solomoch, abriel ***").
L'italique est utilisée pour toute citation de mots ou de textes, pour le sens d'un mot donné dans une langue étrangère, ou comme équivalent dans une même langue, pour les occurrences d'emplois d'expressions françaises, etc.
Le nombre d'entrées par colonne est très variable: Ménage pratique l'irrégularité extrême, en rédigeant des articles qui s'étendent sur trois ou quatre colonnes (s.v. vers Alexandrins), ou qui se limitent à l'étymon (s.v. lobes du foyes, loger, logis, loin...)[16] ou à un renvoi (s.v. aumelette, bal, balet, balot...), parfois précédé d'une définition générique (s.v. heouse) ou non (s.v. balise)!
Les vedettes sont en grand romain majuscule, les sous-vedettes en petit romain majuscule; certaines vedettes et sous-vedettes sont 'allongées' par des précisions notées en caractères minuscules qui ne font pas forcément partie de la vedette, mais ont un rôle définitoire permettant de distinguer soit des acceptions particulières d'un même lexème, soit des formes homonymiques. Ainsi pour le premier cas, les entrées AGACER les dents et AGACER quelqu'un; AUBE du jour et AUBE de prestre; GANDS de frangipane et GANDS de Néroli, etc., pour le second les entrées QUEUE d'aronde, de rat, etc.
On relève relativement peu d'articles en sous-vedette dans le DEOLF[17] et ils correspondent presque toujours à des faits d'homographie pure; mais en contre-exemple on relève des faits d'homographie sans sous-vedette. Pour le corpus des entrées de A, la proportion de sous-vedettes est faible: 12 sur un total de 504 entrées, soit 2,4%. Cette situation est comparable pour le reste du DEOLF: en attendant l'informatisation, un simple échantillon pour d'autres lettres de l'alphabet suffit à montrer qu'on ne peut pas se contenter de corpus trop limités.
On observe en général que la sous-vedette, loin de mettre en évidence un lien dérivationnel, permet de marquer une autonomie sémantique beaucoup plus qu'un statut de dépendance sémantique (dérivation sémantique) ou étymologique. Mais comme pour tout ce qui relève de l'organisation, le lecteur du DEOLF reste face à la fantaisie formelle, sans pouvoir en toute rigueur déterminer de système. Ainsi, la plupart du temps le grand romain de la vedette permet-il de marquer le statut indépendant pour tous les composés qui impliquent un sémantisme distinct de la base lexicale: cf. les articles avant, avant-garde et avant-propos, les mots formés sur la base de gorge et de gourmand, gris et gros, etc.
Pour les faits d'homographie sans sous-vedette,[18] la détermination fait bien partie de la vedette même si elle est en minuscules, puisque c'est elle qui justifie la mise en vedette à part entière et non en sous-vedette. Pour balise, on observe que la présence d'une sous-vedette exclut la mise en double vedette du verbe baliser, alors que Ménage pratique assez souvent la double vedette dérivationnelle (cf. infra): il privilégie ainsi plutôt la sous-vedette (donc l'homographie), malgré le contenu minimal de l'article réduit au renvoi à balzan!
La pratique des vedettes distinctes et des sous-vedettes invite à poser la question de la polysémie parallèlement à l'homophonie: quelle conscience linguistique Ménage avait-il? L'aide informatique nous offrirait rapidement les éléments pour une étude exhaustive des faits présents dans le DEOLF.
Les vedettes doubles sont dérivationnelles. Nous les avons étudiées sur les corpus de A et G: elles[19] marquent la plupart du temps un lien dérivationnel (base --> dérivé, notamment déadjectival et dénominal), et dans ce cas elles annoncent l'étude conjointe des deux termes mis en même temps en vedette;[20] les deux mots mis en vedette correspondent parfois (rarement) à une simple variante morphologique (masculin/féminin; singulier/pluriel: s.v. avoir.avoirs);[21] très rarement elles équivalent à une vedette alternative (variante de graphie/prononciation: s.v. goujart.goujat "on prononce aujourd'hui goujat").
Ces associations étroites de termes liés étymologiquement manifestent donc une certaine conscience linguistique de la dérivation sur une base lexicale autonome, même si, malgré cela, on ne trouve que peu de regroupements par familles et si Ménage se trompe d'étymon ou reconstruit abusivement des étymons par reconstruction interne.
Inversement, l'absence de mise en sous-vedette de termes homographes prend bien en compte la distinction des étymoms: ainsi pour Loir, l'animal (glis, gliris), et pour Loir, le cours d'eau (ledus). Le cas des trois vedettes distinctes pour loge, loger et logis est révélateur puisque Ménage propose trois étymons totalement différents, tous erronés: pour loge, l'italien loggia à la place de l'étymon vieux-bas-francique *laubja, pour loger, le latin locare et pour logis le grec logion latinisé en logium pour former une base logicium; alors qu'il lui était impossible de reconstruire le vieux-bas-francique, il pouvait saisir la dérivation en français!
Peut-on dégager une sémiotique de la typographie?[22] La double vedette balafre: balafré avec la séparation des deux points correspond à deux étymologies inconnues; or, dans les autres cas relevés, la double vedette comporte la virgule (s.v. avis, aviser) ou le point.
Les vedettes avec alternative associent deux formes proches d'un même mot, reliées par la conjonction ou: l'alternative n'est pas toujours absolue, et il est fréquent qu'au ou de la vedette corresponde dans l'article un et. Ces vedettes manifestent soit une hésitation dans la graphie, soit le rappel d'une graphie utilisée dans la vedette donnée en 1650, avec cependant le choix pour une graphie plus moderne; la forme retenue ne semble pas marquée par sa place dans l'énoncé alternatif.[23]
[Retour à la table des matières] [Suite]
[15] La fin de l'article abricot réunit plusieurs formes en langues étrangères.