Bonjour à tous⋅tes,
si jamais ça vous intéresse, je co-organise un petit séminaire demain
midi autour de l'extraction de données structurées dans les documents
anciens. On y parlera de la technique la plus performante à ce jour
pour lire des tableaux manuscrits, à ma connaissance. Il y a un lien
zoom pour y assister à distance.
Bonne journée,
Joseph
Begin forwarded message:
Date: Wed, 27 Mar 2024 10:18:15 +0100
From: Joseph Chazalon <joseph.chazalon(a)lrde.epita.fr>
To: ner-for-historical-docs(a)groupes.renater.fr
Subject: [ner-for-historical-docs] Rappel et lien visio pour séminaire
S. Tarride demain (28 mars 2024)
Chères et chers membres de la liste,
Nous vous rappelons que nous aurons le plaisir d'écouter Solène Tarride
(TEKLIA) demain (jeudi 28 mars) de 12:00 à 13:00.
Voici un résumé des informations pratiques importantes :
Date et heure : jeudi 28 mars de 12:00 à 13:00
Lieu : Maison de la Recherche de Sorbonne Université, 28 rue Serpente,
75006 Paris Salle : S001 au rez de chaussée.
Merci d'indiquer votre présence via ce formulaire pour éviter les
problèmes d'accès :
https://evento.renater.fr/survey/ner-for-historical-docs-participation-au-s…
Visio :
https://univ-eiffel.zoom.us/j/82108329996
Mot de passe : 9SrAWc4b
Déjeuner : le déjeuner n'est PAS pris en charge pour cette séance
Titre et résumé de l'intervention :
"Extraction d'informations structurées dans des documents historiques"
Dans cette présentation, TEKLIA partagera son expérience pratique sur
l'utilisation du modèle DAN (vision encodeur-décodeur) pour
l'extraction d'informations à partir de documents historiques. Je
présenterai des cas d'usage sur des formulaires (PSE-RYZ), des tableaux
(Socface, CICR) et des registres (Esposalles). Nous discuterons des
aspects techniques sur toute la chaîne : l'annotation et la
représentation des documents, les stratégies d'entraînement,
l'estimation de scores de confiance, la prédiction des informations et
de leur localisation grâce au mécanisme d'attention. Enfin, nous
aborderons également les limites de telles architectures, notamment les
hallucinations et les difficultés liées aux mises en page complexes.
En espérant vous recevoir nombreux⋅ses,
Joseph, pour le comité d'organisation
______________________
Current mailing list -- current(a)ml.lre.epita.fr
https://lists.lrde.epita.fr/postorius/lists/current.ml.lre.epita.fr//
______________________
Doctorants mailing list -- doctorants(a)ml.lre.epita.fr
https://lists.lrde.epita.fr/postorius/lists/doctorants.ml.lre.epita.fr//
______________________
Docs mailing list -- docs(a)ml.lre.epita.fr
https://lists.lrde.epita.fr/postorius/lists/docs.ml.lre.epita.fr//
______________________
Docs.toulouse mailing list -- docs.toulouse(a)ml.lre.epita.fr
https://lists.lrde.epita.fr/postorius/lists/docs.toulouse.ml.lre.epita.fr//