Bonjour,
je vous rappelle que nous vous attendons nombreux⋅ses demain de 11h à
12h en amphi 0 ou sur le lien Teams ci-après pour le séminaire de B.
Coüasnon (détails ci-après).
Bonne journée,
Joseph
On Wed, 8 Mar 2023 19:13:37 +0100
Joseph Chazalon <joseph.chazalon(a)lrde.epita.fr> wrote:
Bonjour à tous,
je suis heureux de vous inviter au séminaire du mercredi 15 mars
prochain, qui aura lieu de 11h à 12h en amphi 0 (Paris, KB).
Bertrand était mon encadrant de doctorat et j'ai travaillé sur le
système qu'il présentera (qui a bien évolué depuis).
Je pense qu'il pourra intéresser les curieux de l'équipe automates
aussi, pour l'usage assez extrême des compilateurs et des grammaires
qui est fait (grammaire bi-dimensionnelles avec un analyseur codé en
lambda prolog qui a la capacité de déplacer non linéairement sa tête
de lecture sur la surface à analyser en fonction du contexte passé).
Si la récursion gauche ne vous fait pas peur, venez jeter un œil.
Je pense qu'il pourrait aussi intéresser les curieux côté IA car ma
motivation derrière cette invitation est de démarrer un travail visant
à bricoler l'architecture des décodeurs de transformeurs pour
améliorer les deep parsers dont les premiers résultats sont assez
époustouflants.
Et bien entendu, pour ceux qui s'intéressent à l'analyse d'images (de
documents), ce système est un cas d'école.
Lien Teams pour celles et ceux à distance :
https://teams.microsoft.com/l/meetup-join/19%3apzIZ9vVKzWORw57NZInOVyAH2uKq…
En espérant vous voir nombreux,
Joseph
=======================================================================
Invité : Bertrand Coüasnon (INSA Rennes/IRISA)
Titre :
DMOS-PI : un système complet d’analyse interactive de collections de
documents
Résumé :
DMOS-PI est un système de reconnaissance de collections de documents
qui s’appuie sur une description visuelle des documents grâce à des
grammaires bidimensionnelles, combinées à des méthodes d’apprentissage
profond. Il permet également la modélisation de collections de
documents, une formalisation d’interactions asynchrones entre
l’analyse des pages et les saisies manuelles, et une transformation
des informations unitaires rencontrées dans les pages en des
séquences de ces informations unitaires, le tout étant intégré
progressivement par une analyse itérative des pages. Cette
combinaison produit une fiabilisation des informations reconnues
s’appuyant sur les redondances rencontrées dans les collections de
documents et permet d’envisager la construction de systèmes
auto-adaptatifs.
Ce système a été validé sur une très grande variété de documents : des
formulaires administratifs anciens, de la presse ancienne, des
documents récents dégradés, des listes de cotations boursières du XIXe
et XXe siècle, des partitions musicales anciennes…
=======================================================================