CHWP B.12 | Lancashire, "English Renaissance Knowledge Base" |
The Renaissance Knowledge Base is a computer-searchable kernel library of electronic texts, a text database for literary and historical studies, for the period 1485-1640. It consists of literature by major authors as well as prose 'reference' books including scripture, sermons, chronicles, encyclopedias, legal works and dictionaries. The five principal bilingual dictionaries will be John Palsgrave's Lesclarcissement de la langue francoyse (1530), Sir Thomas Elyot's first Latin-English dictionary (1538), Thomas Thomas' Dictionarium linguæ latinæ et anglicanæ (1587), Randle Cotgrave's A Dictionarie of the French and English tongues (1611) and John Florio's Italian-English A worlde of wordes (1611). The tagging system employed derives from the Text Encoding Initiative guidelines of 1990 (ed. Michael Sperberg-McQueen and Lou Burnard), which are based on SGML (Standard Generalized Markup Language), an ISO standard. In this paper I describe some differences between COCOA-style encoding and TEI/SGML-style encoding, specifically as these relate to the tagging of Palsgrave's and Cotgrave's texts, and to the kind of text-retrieval inquiries that the tagging system will facilitate.
La "Renaissance Knowledge Base" est une archive-noyau de textes électroniques, une base de données textuelles littéraires et historiques de la période 1485-1640. Elle comprend des oeuvres littéraires majeures ainsi que des ouvrages en prose relevant des genres de l'Écriture sainte, le sermon, la chronique, l'encyclopédie, le traité de droit et le dictionnaire. Les cinq dictionnaires bilingues principaux sont: John Palsgrave, Lesclarcissement de la langue francoyse (1530); le premier dictionnaire latin-anglais de Sir Thomas Elyot (1538); Thomas Thomas, Dictionarium linguæ latinæ et anglicanæ (1587); Randle Cotgrave, A Dictionarie of the French and English tongues (1611); l'italien-anglais A worlde of wordes de John Florio (1611). Le système de codage est issu des lignes directrices de la "Text Encoding Initiative" (éd. Michael Sperberg-McQueen et Lou Burnard, 1990), lesquelles sont basées sur SGML (Standard Generalized Markup Language), norme ISO. La présente communication comprend une description de quelques-unes des différences entre un codage de type COCOA et un codage de type TEI/SGML, particulièrement dans le contexte des textes de Palsgrave et de Cotgrave; elle donne aussi une idée des types de questions que permettra de poser à la base le système de codage élaboré pour le projet.