CHWP B.6 | Caron, Dagenais, Gonfroy, "L'informatisation du Dictionaire de Féraud (1787)" |
Après plusieurs années de travaux et de publications sur l'oeuvre lexicographique de l'abbé Jean-François Féraud, le GEHLF (Groupe d'Étude en Histoire de la Langue Française), le TELMOO (Textes Lyriques Médiévaux d'Oc et d'Oïl) et l'équipe de recherche Morin-Dagenais (Université de Montréal) ont décidé de s'associer en vue d'informatiser le Dictionaire critique de la langue française (Marseille: Mossy, 1787).
La communication énumérera brièvement les raisons qui militent en faveur de cette entreprise ainsi que les limites pratiques auxquelles elle se heurte. Puis elle présentera une typologie du DC de façon à faire apparaître les grandes régularités de sa syntaxe et le profit qu'on peut en tirer pour créer un système de référence motivé. Elle dira dans quelle mesure l'original en termes de polices, de corps typographiques et d'auxiliaires de mise en pages sera respecté et justifiera les choix faits.
Elle donnera un aperçu des attentes qu'on peut avoir face à ce dictionnaire et, corrélativement, des codages que les responsables du programme comptent généraliser dès la première saisie, tout en ne la surchargeant pas au point de multiplier les risques d'erreur potentiels.
Elle posera pour finir la question très délicate d'un éventuel codage ultérieur des marques d'usage -- en quoi consiste principalement l'intérêt du DC -- et essaiera de montrer qu'étant donné leurs réalisations textuelles variées, la seule solution réaliste semble plutôt d'aider l'utilisateur à les rechercher selon ses besoins que d'exposer un matériau verbal extrêmement flexible à un réseau rigide de balises dont l'enchevêtrement ne serait sans doute pas probant ni adapté à des supports verbaux parfois discontinus.
After several years of research work and publications on the lexicographic output of Abbé Jean-François Féraud, GEHLF (Groupe d'Étude en Histoire de la Langue Française), TELMOO (Textes Lyriques Médiévaux d'Oc et d'Oïl), and the Morin-Dagenais research team (University of Montreal) joined together to create a database of the Dictionaire critique de la langue française (Marseille: Mossy, 1787).
This paper first briefly mentions the reasons motivating this project and the practical limits to which it is subjected. It then sets out a typology of the DC revealing the main syntactic regularities of its entries and showing how these regularities allow us to create a motivated reference system. It also discusses the problems of reproducing typographic characteristics of the original (such as italics, capitals, etc.) and justifies the choices made for the purposes of the project.
Results that can be expected from the computerized version of the dictionary are then briefly examined, as well as the system of codes to be keyed in along with the capture of the text. In the latter regard, a choice was made not to overburden the input operation in order to minimize the risk of typing errors.
Finally, the problems raised by the encoding of the DC's usage labels and notes, which constitute the dictionary's main interest, are discussed. It is shown that because these notes are not standardized, the provision of a search tool enabling the user to explore, according to individual needs, the extremely variable and often discontinuous formulations used by Féraud is a more realistic approach than trying to force the text to fit a rigid encoding scheme.