Partenaires

Logo tutelle Logo tutelle



Rechercher

Sur ce site

Sur le Web du CNRS

17 rue de la Sorbonne
75005 Paris

Partenaires

Logo tutelle

Accueil du site >

AOUINI Mourad

Doctorant à l’Université de Besançon, dans le cadre de ED 38 - Langage, espace, temps, société

Mourad Aouini prépare une thèse intitulée « L’analyse automatique des textes médiévaux », sous la direction de Max Silberztein (Université de Besançon et Jean-Philippe Genet (Paris 1) [depuis le 01-10-2012].

Cette thèse présente une approche d’analyse des textes non-standardisé qui consiste à modéliser une chaine de traitement permettant la fouille de donnée Text Mining et de l’appliquer massivement sur une grande masse de données en utilisant des outils de Big Data afin de pouvoir visualiser les informations pertinentes. Dans ce contexte, nous présentons un système d’analyse des langues médiévales qui sont en pleine évolution dont l’orthographe, le système flexionnel et la syntaxe ne sont pas stables. Les textes médiévaux se singularisent principalement par l’absence d’orthographe normalisée et par la variabilité tant géographique que chronologique des lexiques médiévaux. L’objectif est de mettre en évidence un système dédié à la construction de ressources linguistiques, notamment la construction des dictionnaires électroniques, se basant sur des règles de morphologie. Ensuite, nous présenterons les instructions que nous avons menées pour construire un étiqueteur morphosyntaxique qui vise à produire automatiquement des analyses contextuelles sur des quantités de données médiévales. Finalement, nous retracerons le chemin qui nous a conduits à construire un étiqueteur sémantique permettant de retrouver les entités nommées et à identifier les différentes relations entre elles. De ce fait, nous avons été amenés à constituer un corpus regroupant des textes médiévaux en moyen français et en moyen anglais apparus entre le XIIème et XVIème siècle.

Thèmes de recherche : Traitement automatique des langues, linguistique de corpus, textes médiévaux, Text Mining, Big Data, visualisation d’information, fouille de données, recherche d’information, extraction d’information, moteur de recherche

Activités scientifiques :
- De octobre 2010 à mars 2014 : Ingénieur d’étude en traitement automatique des langues (Lamop/Université Paris 1) chargé de développement de la Plateforme d’Analyse Linguistique Médiévale (PALM) http://palm.huma-num.fr/PALM/.
- De avril 2014 à aujourd’hui : Ingénieur d’étude en développement d’application (LLACAN/CNRS) chargé de développement des outils pour l’analyse des langues à tradition orale.


Envoyer un message