Bonjour à tous,
je suis heureux de vous inviter au séminaire du mercredi 15 mars prochain, qui aura lieu de 11h à 12h en amphi 0 (Paris, KB).
Bertrand était mon encadrant de doctorat et j'ai travaillé sur le système qu'il présentera (qui a bien évolué depuis).
Je pense qu'il pourra intéresser les curieux de l'équipe automates aussi, pour l'usage assez extrême des compilateurs et des grammaires qui est fait (grammaire bi-dimensionnelles avec un analyseur codé en lambda prolog qui a la capacité de déplacer non linéairement sa tête de lecture sur la surface à analyser en fonction du contexte passé). Si la récursion gauche ne vous fait pas peur, venez jeter un œil.
Je pense qu'il pourrait aussi intéresser les curieux côté IA car ma motivation derrière cette invitation est de démarrer un travail visant à bricoler l'architecture des décodeurs de transformeurs pour améliorer les deep parsers dont les premiers résultats sont assez époustouflants.
Et bien entendu, pour ceux qui s'intéressent à l'analyse d'images (de documents), ce système est un cas d'école.
Lien Teams pour celles et ceux à distance : https://teams.microsoft.com/l/meetup-join/19%3apzIZ9vVKzWORw57NZInOVyAH2uKqr...
En espérant vous voir nombreux, Joseph
======================================================================= Invité : Bertrand Coüasnon (INSA Rennes/IRISA)
Titre : DMOS-PI : un système complet d’analyse interactive de collections de documents
Résumé : DMOS-PI est un système de reconnaissance de collections de documents qui s’appuie sur une description visuelle des documents grâce à des grammaires bidimensionnelles, combinées à des méthodes d’apprentissage profond. Il permet également la modélisation de collections de documents, une formalisation d’interactions asynchrones entre l’analyse des pages et les saisies manuelles, et une transformation des informations unitaires rencontrées dans les pages en des séquences de ces informations unitaires, le tout étant intégré progressivement par une analyse itérative des pages. Cette combinaison produit une fiabilisation des informations reconnues s’appuyant sur les redondances rencontrées dans les collections de documents et permet d’envisager la construction de systèmes auto-adaptatifs.
Ce système a été validé sur une très grande variété de documents : des formulaires administratifs anciens, de la presse ancienne, des documents récents dégradés, des listes de cotations boursières du XIXe et XXe siècle, des partitions musicales anciennes… =======================================================================
Bonjour, je vous rappelle que nous vous attendons nombreux⋅ses demain de 11h à 12h en amphi 0 ou sur le lien Teams ci-après pour le séminaire de B. Coüasnon (détails ci-après).
https://teams.microsoft.com/l/meetup-join/19%3apzIZ9vVKzWORw57NZInOVyAH2uKqr...
Bonne journée, Joseph
On Wed, 8 Mar 2023 19:13:37 +0100 Joseph Chazalon joseph.chazalon@lrde.epita.fr wrote:
Bonjour à tous,
je suis heureux de vous inviter au séminaire du mercredi 15 mars prochain, qui aura lieu de 11h à 12h en amphi 0 (Paris, KB).
Bertrand était mon encadrant de doctorat et j'ai travaillé sur le système qu'il présentera (qui a bien évolué depuis).
Je pense qu'il pourra intéresser les curieux de l'équipe automates aussi, pour l'usage assez extrême des compilateurs et des grammaires qui est fait (grammaire bi-dimensionnelles avec un analyseur codé en lambda prolog qui a la capacité de déplacer non linéairement sa tête de lecture sur la surface à analyser en fonction du contexte passé). Si la récursion gauche ne vous fait pas peur, venez jeter un œil.
Je pense qu'il pourrait aussi intéresser les curieux côté IA car ma motivation derrière cette invitation est de démarrer un travail visant à bricoler l'architecture des décodeurs de transformeurs pour améliorer les deep parsers dont les premiers résultats sont assez époustouflants.
Et bien entendu, pour ceux qui s'intéressent à l'analyse d'images (de documents), ce système est un cas d'école.
Lien Teams pour celles et ceux à distance : https://teams.microsoft.com/l/meetup-join/19%3apzIZ9vVKzWORw57NZInOVyAH2uKqr...
En espérant vous voir nombreux, Joseph
======================================================================= Invité : Bertrand Coüasnon (INSA Rennes/IRISA)
Titre : DMOS-PI : un système complet d’analyse interactive de collections de documents
Résumé : DMOS-PI est un système de reconnaissance de collections de documents qui s’appuie sur une description visuelle des documents grâce à des grammaires bidimensionnelles, combinées à des méthodes d’apprentissage profond. Il permet également la modélisation de collections de documents, une formalisation d’interactions asynchrones entre l’analyse des pages et les saisies manuelles, et une transformation des informations unitaires rencontrées dans les pages en des séquences de ces informations unitaires, le tout étant intégré progressivement par une analyse itérative des pages. Cette combinaison produit une fiabilisation des informations reconnues s’appuyant sur les redondances rencontrées dans les collections de documents et permet d’envisager la construction de systèmes auto-adaptatifs.
Ce système a été validé sur une très grande variété de documents : des formulaires administratifs anciens, de la presse ancienne, des documents récents dégradés, des listes de cotations boursières du XIXe et XXe siècle, des partitions musicales anciennes… =======================================================================