Partenaires

Logo tutelle Logo tutelle



Rechercher

Sur ce site

Sur le Web du CNRS

17 rue de la Sorbonne
75005 Paris

Partenaires

Logo tutelle

Accueil du site > Champs de recherche > Livres - textes - langages > Systèmes graphiques du français > Systèmes graphiques du français

Systèmes graphiques du français

Responsable : Fabrice Jejcic

 1. Histoire des systèmes graphiques du français

Base de données « Horloge Graphique » (S. Baddeley / F. Jejcic). Constitution puis mise en ligne (sur le site internet de Orthographe [www.vjf.cnrs.fr/orthographe]) d’une base de données graphique historique recensant, dans un premier temps, des corpus numérisés datant du XVIe siècle. Cette base, qui sera alimentée et affinée progressivement par des données des périodes en amont et en aval du XVIe s., pourra ensuite permettre aux chercheurs (historiens du livre, archivistes, bibliographes) de dater ou d’identifier des textes anonymes à partir de leur graphie.

 2. Écriture des variétés de français

Systèmes graphiques vernaculaires, variation et système : pratiques et théories, structures et fonctionnements (F. Jejcic)
Système graphique du français acadien d’après la Causerie memramcookienne, Pierrichon et Marichette par Pascal Poirier (1852-1933), étude linguistique à partir de l’édition critique de Pierre M. Gérin (Université de Moncton, Canada, 1990) et des textes originaux parus dans la presse acadienne à la fin du XIXe s. Les premiers résultats de ces travaux on fait l’objet d’une communication au 133e Colloque national des sociétés historiques et scientifiques (Canada, Québec, 31 mai - 7 juin 2008), et vont paraître dans les Actes. Mais, au-delà, de ces résultats ponctuels qui consolident la théorie de la variation graphique pour l’écriture de variantes dialectales extra-hexagonales, les retombées de cette analyse permettront aussi des améliorations et des simplifications en matière d’analyse informatisée de corpus textuels, en particulier en ce qui concerne le traitement de la segmentation variable des mots et l’analyse lexicale des variations de registres. Ces nouvelles hypothèses de travail devraient être développées dans deux directions :
-d’une part, du point de vue théorique, par une terminologie sociolinguistique adaptée, qui non seulement tienne compte des unités graphiques opérationnelles dans les textes dialectaux (graphies diatopiques, graphies diastratiques et graphies standard), mais qui rende aussi compte de leur organisation contextuelle (fluctuation graphique des formes et interaction avec le système graphique usuel). Il semble qu’au-delà des écritures dialectales et de la mise en écrit de vernaculaires sans tradition écrite fixée, l’ensemble de ces phénomènes de variation correspondent à des pratiques d’écriture relativement universelles, qui peuvent être rapprochées des mises en écrit de vernaculaires qui sont devenus de grandes langues de tradition écrite, telle la longue transition historique du latin via le roman au contact du germanique jusqu’au français ;
-d’autre part, du point de vue de la méthodologie informatisée, par le développement d’un codage "transparent" pour le traitement des segmentations graphiques particulières et des locutions, et l’emploi de la couleur pour la démarcation des registres différents. L’ensemble de ces opérations, facilitant la reconnaissance des différentes entités graphiques, permet de faire l’économie d’un système de balisage qui devient trop lourd et trop complexe pour des textes présentant d’importants phénomènes de variation graphique de ses unités. Avant de généraliser cette méthode à nos corpus, un échantillon bien choisi, et connu pour ses difficultés, devrait aider à finaliser la méthode en la rendant plus fiable (édition de textes dialectaux et édition de manuscrits).

Édition de textes dialectaux (C. Fondet, F. Jejcic, M. Merlin, A. Morin, M.-R. Simoni-Aurembou)
L’édition critique du manuscrit d’Arsène Vincent (1831-1881), Recherches historiques sur le canton de Thiron-Gardais, 700 pages composées aux alentours de 1870, se poursuit. La nature des textes qu’il contient, ainsi que l’importance de son volume, nécessitent un long travail de mise au point, cf. F. Jejcic, 2004,« Les orthographes d’Arsène Vincent, chroniqueur et copiste (1831-1881) ». Ce travail éditorial a pour ambition d’essayer de définir un « standard informatique » pour la saisie et le traitement de manuscrits modernes comportant de nombreux phénomènes de variation linguistique et graphique.
Pour la première fois nous disposons du corpus complet des « Lettres d’un paysan de Louis Boussenard (1847-1910) », qui avaient été publiées à Montargis dans l’hebdomadaire Le Gâtinais entre 1902 et 1910. Ces textes pamphlétaires, écrits en parler du Gâtinais, présentent un grand intérêt du point de vue de la dialectologie et de l’histoire locale, leur édition est envisagée.

Glossaire des glossaires du domaine d’oïl central (C. Fondet, F. Jejcic, M.-R. Simoni-Aurembou)
L’intérêt de la région centrale est lié au fait que son caractère dialectal y est le moins marqué. Les variétés de français, qu’elles soient phoniques, sémantiques ou graphiques, nécessitent de distinguer ce qui est dialectal de ce qui est historique ou social, mais non argotique. Ce projet a pour but d’actualiser ou de revaloriser des ressources existantes (archives, manuscrits, presse, ouvrages, etc.) ; sa finalité est d’en faire la synthèse par un Glossaire des glossaires. Envisagée sous forme de base de données, la structure du Glossaire des glossaires sera inspirée par la combinaison d’éléments d’ouvrages de référence : le Dictionnaire historique de l’orthographe française (1995), le Trésor du parler percheron (1996, 1979 1re éd.) et le Dictionnaire suisse romand (1997). Une première maquette de ce projet est prévue à partir d’un inventaire limité de formes lexicographiques avec toutes leurs variantes graphiques. Au-delà des aspects matériels concrets, cette mise en chantier devrait apporter de nouveaux éléments de connaissance sur les rapports de la langue française avec ses variétés dialectales les plus proches.

 3. Politique linguistique

Listes orthographiques de base rectifiées (N. Catach †, F. Jejcic, avec la collaboration de S. Baddeley et X.-G. Blary) : base de données des mots les plus fréquents et de leurs formes fléchies les plus fréquentes (4936 mots, 8006 formes). À la suite de l’inscription de l’orthographe rectifiée dans le Bulletin officiel de l’Éducation nationale (n° 5 du 12/04/2007), la mise au point de cette base de données à des fins didactiques s’avère utile pour développer une pédagogie de l’orthographe fondée sur les formes graphiques les plus fréquentes de la langue écrite.