Dans le cadre du 5ème appel à projets du Fonds Interministeriel de
Soutien aux Projets de Recherche & Développement Collaboratifs des
Pôles de Compétitivité, le projet SCRIBO [1], auquel participe le
LRDE, a été soutenu par le pôle de compétitivité System@tic
Paris-Région [2], et retenu pour financement par l'État. SCRIBO
s'inscrit dans le nouveau Groupe Thématique Logiciel Libre de ce pôle.
System@tic Paris-Région a pour objectif de faire de l'Île-de-France un
territoire visible au niveau mondial sur le thème de la conception, de
la réalisation et de la maîtrise des systèmes complexes. Le Groupe
Thématique Logiciel Libre (GTLL) a pour vocation de traiter des sujets
de R&D spécifiques au logiciel libre, de contribuer à la structuration
et au développement de l'offre en la matière et d'accompagner
l'organisation de l'innovation qui en est issue.
SCRIBO (Semi-automatic and Collaborative Retrieval of Information
Based on Ontologies) a pour but la mise au point d'algorithmes et
d'outils collaboratifs pour l'extraction de connaissances à partir de
textes et d'images. Il se distingue de l'état de l'art par son
ambition de combiner les approches sémantiques et statistiques dans le
traitement du langage naturel, par la prise en compte d'une dimension
collaborative dans la définition et le paramétrage de règles
d'extraction semi-automatique de structures, et par l'accent mis sur
l'élaboration (ou le perfectionnement lorsqu'ils existent) de
standards de traitement du langage naturel. SCRIBO a l'objectif de
concevoir des services d'extraction d'ontologies (systèmes de
représentation des connaissances) à partir de corpus de documents,
d'extraction de structures dans des documents numériques et
d'acquisition de connaissances en mettant en oeuvre des ontologies.
Le LRDE contribuera principalement au sous-projet d'extraction de
structures dans des documents numérisés. Les autres partenaires du
projet, piloté par XPertNet, sont l'AFP, le CEA-LIST, le LRDE,
l'INRIA, Mandriva, Nuxeo, Proxem, Tagmatica et Xwiki.
Le LRDE a déjà été amené à travailler sur des problématiques de
gestion électronique de documents (GED) et de « dématérialisation » de
documents papier au cours d'une collaboration de plusieurs années avec
l'éditeur de logiciels EMC Captiva (ex-SWT). Le projet SCRIBO
permettra d'enrichir la bibliothèque de traitement d'images libre
Olena [3] (sous licence GNU GPL) et d'intégrer de nouveaux services
dans les outils de GED du LRDE.
Notes :
[1] SCRIBO :
http://scribo.xwiki.com/
[2] System@tic Paris-Région :
http://www.systematic-paris-region.org/
[3] Olena :
http://olena.lrde.epita.fr
--
Roland Levillain - LRDE/EPITA - A2SI/ESIEE/UMLV-Paris Est
Laboratoire de Recherche et de Développement de l'EPITA (LRDE)
14-16, rue Voltaire - 94276 Le Kremlin-Bicêtre Cedex
Tél. : 01 53 14 59 45 - Fax : 01 53 14 59 22 -
www.lrde.epita.fr