Séminaire IMAGE mer. 15/03 : Parsing 2D pour l'analyse de documents (B. Coüasnon) - Annonce

8 Mar 2023


      Bonjour à tous,
je suis heureux de vous inviter au séminaire du mercredi 15 mars
prochain, qui aura lieu de 11h à 12h en amphi 0 (Paris, KB).
Bertrand était mon encadrant de doctorat et j'ai travaillé sur le
système qu'il présentera (qui a bien évolué depuis).
Je pense qu'il pourra intéresser les curieux de l'équipe automates
aussi, pour l'usage assez extrême des compilateurs et des grammaires
qui est fait (grammaire bi-dimensionnelles avec un analyseur codé en
lambda prolog qui a la capacité de déplacer non linéairement sa tête de
lecture sur la surface à analyser en fonction du contexte passé).
Si la récursion gauche ne vous fait pas peur, venez jeter un œil.
Je pense qu'il pourrait aussi intéresser les curieux côté IA car ma
motivation derrière cette invitation est de démarrer un travail visant
à bricoler l'architecture des décodeurs de transformeurs pour
améliorer les deep parsers dont les premiers résultats sont assez
époustouflants.
Et bien entendu, pour ceux qui s'intéressent à l'analyse d'images (de
documents), ce système est un cas d'école.
Lien Teams pour celles et ceux à distance :
https://teams.microsoft.com/l/meetup-join/19%3apzIZ9vVKzWORw57NZInOVyAH2uKqr...
En espérant vous voir nombreux,
Joseph
=======================================================================
Invité : Bertrand Coüasnon (INSA Rennes/IRISA)
Titre :
DMOS-PI : un système complet d’analyse interactive de collections de
documents
Résumé :
DMOS-PI est un système de reconnaissance de collections de documents
qui s’appuie sur une description visuelle des documents grâce à des
grammaires bidimensionnelles, combinées à des méthodes d’apprentissage
profond. Il permet également la modélisation de collections de
documents, une formalisation d’interactions asynchrones entre l’analyse
des pages et les saisies manuelles, et une transformation des
informations unitaires rencontrées dans les pages en des séquences de
ces informations unitaires, le tout étant intégré progressivement par
une analyse itérative des pages. Cette combinaison produit une
fiabilisation des informations reconnues s’appuyant sur les redondances
rencontrées dans les collections de documents et permet d’envisager la
construction de systèmes auto-adaptatifs.
Ce système a été validé sur une très grande variété de documents : des
formulaires administratifs anciens, de la presse ancienne, des
documents récents dégradés, des listes de cotations boursières du XIXe
et XXe siècle, des partitions musicales anciennes… 
=======================================================================