CHWP B.9 | Wooldridge, Ikse-Vitols, Nadasdi, "Le Projet CopuLex" |
Dans tout dictionnaire, il convient d'opposer ce qui relève du système utilisé par le lexicographe et ce qui revient à la compétence du consulteur, cette dernière devant compléter ce que le premier ne donne pas explicitement ou ne peut pas donner. Avant Féraud, on peut parler d'un manque de systématisation; par la suite, d'une limite pratique. Nous allons maintenant examiner de près deux situations qui demandent une interprétation des données du texte. Dans le premier cas (Trévoux 1743), il s'agit d'ambiguïté; dans le second (Lexis 1975), de structures implicites.
Notre étude se propose d'examiner la mise en paragraphes comme outil de structuration des informations. Le but précis de cette analyse est de voir comment cette technique peut être employée pour améliorer la consultabilité d'un dictionnaire. Après avoir examiné quelques emplois possibles de la mise en paragraphes, nous passerons à l'examen d'un dictionnaire en particulier, le Trévoux de 1743, afin de voir s'il respecte des règles régissant l'emploi efficace d'une division en paragraphes. Nous tiendrons surtout compte des contradictions entre la mise en paragraphes et l'information que ces segments contiennent.
Le choix du Trévoux se motive par le fait qu'à l'époque où ce dictionnaire a été réalisé, les outils typographiques exploités dans l'articulation des unités d'un dictionnaire étaient peu nombreux. Bien qu'on y trouve l'italique et même deux tailles de majuscules, le Trévoux n'a aucun système pour indiquer les divisions importantes à part la mise en paragraphes. Ainsi, l'utilisateur du Trévoux se trouve obligé de se fier aux seules divisions en paragraphes. Ceci fait qu'une mise en paragraphes cohérente de la matière lexicale du Trévoux serait primordiale pour la consultation de ce dictionnaire.
Passons maintenant à ce qui constitue une mise en paragraphes cohérente. Après avoir amassé toutes les informations relatives à un mot-vedette donné, le lexicographe se trouve devant un bloc de données qu'il est censé organiser. Pour que le dictionnaire puisse être considéré comme un ouvrage de consultation, ce bloc doit être organisé systématiquement de sorte que l'usager puisse accéder facilement à l'information qu'il cherche. L'avantage d'une mise en paragraphes cohérente est qu'en principe elle permet à l'usager de prévoir la structure de chaque article. Ainsi, l'utilisateur pourra éviter les sections non pertinentes et aller directement à ce qui l'intéresse. Par contre, si la structure n'est pas cohérente, il sera obligé de lire chaque paragraphe, ce qui alourdira sa tâche.
Examinons d'abord quelques mises en paragraphes ayant une structure prévisible, c'est-à-dire qui améliore la consultabilité d'un dictionnaire. La Figure 1 présente trois exemples d'une mise en paragraphes bien structurée.
Le modèle A démontre qu'on peut se servir d'un changement de paragraphe pour indiquer qu'on traite d'une nouvelle occurrence d'un même type de structure complexe; il s'agit notamment de traiter des sens différents d'un même mot-vedette dans des paragraphes distincts. Dans ce type de structure, les exemples, les synonymes, l'étymologie, etc. se trouveraient, éventuellement, à l'intérieur de chaque paragraphe pour un sens donné. On peut dire que la structure A augmente la consultabilité d'un dictionnaire parce qu'elle permet à l'usager de prévoir où il trouvera les différentes parties du traitement sémantique du mot-vedette.
Dans B, la division en paragraphes sert à séparer des catégories d'information différentes; par exemple, traitement sémantique, syntagmes, synonymes, étymologie, emplois figurés, etc. Pour que ce genre de mise en paragraphes fonctionne bien, il faut que dans chaque article le même ordre soit respecté; chaque paragraphe doit aussi être étiqueté (genre "Syntagmes"), pour qu'une éventuelle absence de catégorie (synonymes, emploi figurés, par exemple) soit évidente.
La mise en paragraphes du modèle C démontre qu'on peut avoir une combinaison des deux premières structures, à condition qu'il y ait une filiation logique entre les paragraphes; c'est-à-dire qu'on peut avoir une suite de paragraphes tous reliés à un même traitement sémantique, suivie d'autres groupes de paragraphes fonctionnant de la même manière. L'avantage d'une telle organisation est qu'elle permet à l'utilisateur de trouver des groupes d'informations qui forment une unité.
Les trois types de mise en paragraphes que nous venons de décrire peuvent être employés pour favoriser la consultation d'un dictionnaire parce qu'ils sont tous systématiques et récurrents. Ils permettent à l'usager de trouver les informations particulières sans avoir à tout lire. Il est vrai que l'usager doit prendre le temps de s'y habituer, mais une fois habitué au système établi il pourra prévoir la structure de chaque article. Dans le Trévoux, on trouve des traits de chacune de ces structures, sans qu'aucune ne soit respectée systématiquement, c'est-à-dire qu'elles ne sont pas récurrentes. Ceci fait que l'utilisateur ne peut pas s'y fier pour prévoir la structure de paragraphe d'un article donné.
Examinons trois articles du Trévoux: GAGNER (20 paragraphes), LOIN (6) et QUE (5). La Figure 2, la Figure 3 et la Figure 4 donnent le texte intégral,[3] avec les numéros d'ordre des paragraphes et, en fin de paragraphe, des codes indiquant la nature du composant global de chaque paragraphe et son appartenance à la microstructure.[4] Dans les codes, le point d'interrogation signifie que le statut d'un paragraphe est particulièrement difficile à cerner.
Chacune des structures A, B et C est violée, ce qui mène à des contradictions entre la mise en paragraphes et l'information que ces paragraphes contiennent. Cela peut s'expliquer comme étant une contradiction entre la lecture verticale (où l'oeil s'arrête) et la lecture horizontale (ce qu'on y trouve). Nous allons distinguer ici trois contradictions principales. Chaque contradiction correspond à une violation des structures des modèles présentés à 4.1.1.
Comme nous l'avons déjà dit, la mise en paragraphes peut améliorer la consultabilité d'un dictionnaire si on se sert de ces coupures pour indiquer des acceptions différentes d'une même vedette. Nous constatons que, bien que cette technique soit exploitée par le Trévoux -- par exemple les paragraphes 4 et 5 de GAGNER présentent des sens nouveaux --, son utilisation est occasionnelle et donc imprévisible. Chaque paragraphe d'un article présente des informations variables: un sens précis (par exemple, G#1, G#4, G#5, G#11);[5] des informations étymologiques (G#2); une qualification d'emploi (G#10, G#12); une sous-vedette (G#3, G#17, G#19); une division grammaticale (L#3, L#6; Q#2, Q#3) ou bien un simple syntagme (G#13, G#16).
De plus, deux paragraphes successifs du Trévoux peuvent correspondre non seulement à deux sous-ensembles discrets (deux sens, deux emplois syntaxiques, etc.), mais aussi à deux parties du traitement d'un même sous-ensemble. Prenons à titre d'exemple le passage de G#8 à G#9. Bien qu'on trouve ici deux paragraphes distincts, le contenu nous révèle qu'il s'agit d'un même sens: "GAGNER, s'emploie aussi neutralement en ce sens". Le passage à la ligne correspond, dans ce cas, non à un changement sémantique, mais à un changement de fonctionnement syntaxique. De même, le traitement du syntagme que si, que non est réparti sur deux paragraphes (Q#4 et Q#5), le second servant à introduire un emploi nouveau ("est aussi un substantif").
Prenons l'étymologie et les emplois dits proverbiaux. Dans l'article GAGNER, l'étymologie est donnée dans le deuxième paragraphe, comme c'est le cas pour d'autres articles, tels que BEC, LONG, LOYAL. Sa place varie cependant d'un article à l'autre: troisième paragraphe pour LOT, quatrième et cinquième pour BANDE, absente d'un grand nombre d'articles, dont LOIN et QUE. Les emplois proverbiaux de gagner sont regroupés dans le dernier paragraphe consacré à la forme gagner (G#18); en revanche, dans l'article LOIN la rubrique "On dit proverbialement" est placée dans l'avant-dernier paragraphe consacré à la forme loin.
Le troisième type d'incohérence vient d'un manque d'enchaînement logique des paragraphes. Si les syntagmes de G#6 se rattachent clairement au traitement sémantique de G#7, les syntagmes gagner les devans (G#13) et gagner sa vie à filer/chanter (G#16) n'ont aucun lien avec les paragraphes (G#12, G#15) qui précèdent leur présentation. Le passage de G#8 à G#9 offre un exemple d'une filiation sémantique explicite: "s'emploie aussi neutralement en ce sens"; cependant, la charnière de filiation sémantique se réduit le plus souvent, soit à une formule énumérative -- type "se dit aussi pour", "on dit aussi" --, soit à une formule à valeur connective zéro -- type "on dit", "se dit en parlant du temps".
En fait, il est évidemment vain de faire ce genre d'exercice anachronique, de vouloir superposer sur un système venu en droite ligne des compilations cumulatives des siècles antérieurs une matrice d'organisation qui ne commence à se définir, dans la lexicographie française, qu'avec le Dictionaire critique de l'abbé Féraud. Dans le Trévoux, le paragraphe a encore la même fonction simple que dans la prose non métalinguistique, celle de former une certaine unité de pensée et de composition. Le 'sens' des articles du Trévoux est à chercher dans la genèse du dictionnaire; sur les vingt paragraphes de l'article GAGNER, par exemple, #1, #5, #8, #10, #11, #12, #13, #14, #15, #18, #19 et #20 correspondent, à quelques modifications près, aux douze paragraphes de l'article GAGNER-GAGNÉ de Furetière 1690, ouvrage duquel les différentes éditions du Trévoux constituent la continuation, et dans le même ordre.
L'exemple d'emploi a pour rôle principal d'illustrer le mot-adresse; comme tel, il est le prédicat d'un énoncé lexicographique dont le sujet est le mot-adresse:
Les choses ne sont pas aussi simples dans Lexis. Dans les sections des quatre macro-articles GAGNER correspondant aux emplois contemporains transitifs, intransitifs et pronominaux du verbe gagner, il y a quelques 81 séquences imprimées en italique et présentées comme actualisations du mot en contexte. Sept séquences sont marquées, étant des exemples signés de noms d'auteurs; toutes les autres ont été forgées par le lexicographe. Malgré l'absence d'étiquettes ou de distinctions typographiques, on peut constater que ces séquences forgées se situent à différents points de l'axe discours <--> langue: phrase libre (Cette nouvelle mise en pages nous fait gagner un paragraphe.), phrase lexicalisée (Il l'a bien gagné.), syntagme canonique concret (gagner un lot), syntagme canonique virtuel (gagner quelque chose). Exemples donc autant potentiels que réels. Qu'ils soient unités de langue ou unités de discours, ils sont le plus souvent suivis de compléments d'information -- marques de niveau de langue, paraphrases ou synonymes; par exemple:
À un premier niveau (cycle 1), l'exemple/syntagme est prédicat d'énoncé:
À un deuxième niveau (cycle 2), l'exemple/syntagme passe du côté du sujet ou adresse d'énoncé:
Ce qui peut être représenté de la façon suivante:
En fait, B ne change pas de côté; c'est un élément de B -- B' -- qui acquiert la fonction de sujet d'énoncé. Reprenons les items 1-7 en dégageant cette fois l'élément de l'exemple/syntagme qui correspond à l'adresse de l'énoncé définitoire ou synonymique du cycle 2.
Pour extraire B' de B, le consulteur doit faire preuve d'une compétence métalinguistique et linguistique sophistiquée. Il ne lui suffit pas de déterminer quelle partie de B correspond au sujet de C; il doit aussi dans beaucoup de cas tenir compte de différents types de transformation. Pour les exemples/ syntagmes de gagner dans Lexis, nous avons trouvé les types de transformations syntaxiques suivants.
Remarquons: pour l'item 18, que se aussi est une reprise anaphorique du sujet de verbe virtuel; pour 19, que y est anaphorique dans le texte potentiel d'où est extrait y gagner; pour 20, que l' est une anaphore lexicalisée, donc vide sur le plan syntaxique.
Remarquons: que dans 23, l'analyse est compliquée par la négation.
Considérons les séquences suivantes:
Dans chacun de ces items, le cycle 2 se réalise en deux temps:
Il y d'abord une mise en équivalence entre "quelque chose" et un complément de verbe plus spécifique représentant une restriction sémantique (moyen de subsistance, récompense, compétition, lutte, maladie, événement fâcheux): "gagner quelque chose, quand quelque chose = moyen de subsistance ou récompense", etc. Dans le cycle 2a, B' est plus petit que B: B' < B. "Gagner quelque chose" ayant été qualifié dans le cycle 2a, il est ensuite défini dans le cycle 2b: "gagner quelque chose, c'est-à-dire gagner un moyen de subsistance, gagner une récompense, signifie 'l'acquérir par son travail'", etc. Dans le cycle 2b, B" est plus grand que B: B" > B.
Si l'on a opposé de façon théorique une lecture verticale à une lecture horizontale du texte dictionnairique pour décrire la tendance du consulteur à faire une lecture plus ou moins rapide, il convient ici de postuler un phénomène que l'on pourrait appeler la lecture cyclique, qui serait une lecture hyperhorizontale. Nous avons vu cinq types d'analyse syntaxique que le consultateur doit pouvoir faire pour arriver à l'information désirée. Il est nécessaire de considérer qu'ici déjà la lecture horizontale est plus qu'une tendance. Mais c'est surtout dans le cycle complexe qu'il faut abandonner l'idée qu'en dégageant l'information ainsi présentée la lecture pourrait retenir un élément vertical quelconque. L'information acquise à une première étape dans la réalisation du deuxième cycle (B --> B') doit être réappliquée par le consulteur dans la réalisation de la deuxième étape (B --> B").
[Retour à la Table des Matières] [Suite]
[5] G#1 = GAGNER, para. 1; L#1 = LOIN, para. 1; Q#1 = QUE, para. 1.