Bonjour,
nous avons le plaisir de vous inviter au séminaire des étudiants-chercheurs du
LRDE. Il aura lieu le mercredi 3 juillet 2013 à partir de 9h30 en Amphi 3 (KB).
Et notez d'ores et déjà la date du jeudi 11 juillet où les étudiants CSI 2014
présenteront leurs
travaux.
-----------------------------------------------------------------------
Au programme du 3 juillet 2013 :
OLENA
* 09h30 : Analyse structurelle haut-niveau de document dans le module Scribo d’Olena --
Christophe Escobar
* 10h00 : Détection de logotypes et autres invariants caractéristiques -- Anthony Seure
SPEAKER ID
* 10h30 : Les Machines de Boltzmann dans la reconnaissance du locuteur -- Jean-Luc
Bounthong
* 11h00 : Approximation de la distance entre i-vecteurs par Perceptron Multi-Couches --
Jimmy Yeh
CLIMB
* 11h45 : Maintenance automatique des symboles exportés dans les packages de Common Lisp –
Christophe Vermorel
VAUCANSON
* 12h15 : Améliorer l’architecture de Vaucanson 2 -- Guillaume Sanchez
* 12h45 : Transducteurs dans Vaucanson 2 – Victor Santet
Les Résumés des exposés :
**************************
OLENA
* 09h30 : Analyse structurelle haut-niveau de document dans le module Scribo d’Olena --
Christophe Escobar
L’extraction de structures dans un document numérisé se base sur la mise en place d’une
chaîne de traitements constituée de briques élémentaires. L’analyse haut-niveau d’un
document nécessite des informations structurelles sur celui-ci et se basera donc sur cette
chaîne de traitements. Elle consistera à extraire des informations plus abstraites de
nature structurelle sur un document, pour obtenir des "indices" sur sa
structure. À l’aide de ces indices et de schémas de structure, il est ensuite possible de
réaliser des traitements de haut-niveau tels que l’identification du flot de lecture,
l’extraction d’éléments spécifiques ou la reconstruction d’un document dans un autre
format.
* 10h00 : Détection de logotypes et autres invariants caractéristiques -- Anthony Seure
La détection de logotypes et d’invariants dans une image a pour but de trouver parmi une
ou plusieurs images un élément graphique qui caractérise une marque, entreprise, etc. De
tels éléments peuvent se retrouver dans de nombreuses images naturelles mais également
dans des images publicitaires. L’intérêt de l’intégration d’un tel outil dans Olena et
Terra Rush permettrait de mieux indexer les contenus mais également d’invalider des zones
de l’image dans d’autres chaînes de traitement. Nous expliquerons principalement une
méthode générique permettant de localiser les points-clés invariants d’une image : les
descripteurs SIFT.
SPEAKER ID
* 10h30 : Les Machines de Boltzmann dans la reconnaissance du locuteur -- Jean-Luc
Bounthong
L’espace Total Variability (TV) représente actuellement l’état de l’art dans le domaine de
la vérification du locuteur. Des progrès significatifs ont été réalisés grâce aux
nouvelles méthodes de classification comme l’Analyse discriminante linéaire probabiliste
(PLDA) ou la Distance Cosinus (CD). Dans cette étude, nous explorons une nouvelle méthode
pour déterminer la distance entre deux i-vecteurs en utilisant une variante des Machines
de Boltzmann, ces nouvelles approches ont montré des résultats satisfaisants dans le
domaine du traitement d’images. Nous allons aussi comparer les performances en terme de
fiabilité avec les méthodes classiques comme PLDA ou CD.
* 11h00 : Approximation de la distance entre i-vecteurs par Perceptron Multi-Couches --
Jimmy Yeh
Actuellement, l’espace des i-vecteurs est la représentation standard des paramètres de la
parole dans les systèmes de reconnaissance du locuteur. Le calcul du score est
généralement basé sur la distance cosinus, ou sur l’analyse discriminante linéaire
probabiliste. Le but de ce sujet est de remplacer ces approches par un Perceptron
Multi-Couches (PMC). Le PMC a montré en effet de bonnes performances pour approximer des
fonctions non linéaires. L’idée principale étant de trouver une meilleure fonction que la
distance cosinus. Les performances du PMC seront comparées aux autres méthodes comme la
distance cosinus ou encore la machine de Boltzmann.
CLIMB
* 11h45 : Maintenance automatique des symboles exportés dans les packages de Common Lisp
-- Christophe Vermorel
Les "packages" de Common Lisp offrent une fonctionnalité analogue aux espaces de
noms présents dans des langages comme le C++. Ceux-ci permettent d’encapsuler des symboles
qui peuvent être exportés ou privés. Les symboles exportés peuvent être explicitement
déclarés lors de la définition du package. Cette liste de symboles est fastidieuse à
maintenir lors du développement de projets de grosse envergure. Dans ce rapport, nous
étudions des techniques de maintenance automatiques de cette liste. Plusieurs alternatives
sont présentées et comparées.
VAUCANSON
* 12h15 : Améliorer l’architecture de Vaucanson 2 -- Guillaume Sanchez
Vaucanson 2 est la suite de Vaucanson, la plate-forme de manipulation d’automates finis.
Ce redémarrage à zéro a été fortement encouragé par quelques problèmes de conception.
Vaucanson 2 entend apprendre des erreurs de son prédecesseur, et dans ce but, un vrai
travail de conception doit être fait. Les templates doivent être utilisés pour la
performance (évitant un usage abusif de fonctions virtuelles) afin de pouvoir préférer la
généricité plutôt que la généralité, tout en conservant une flexibilité lors de
l’exécution. Vaucanson 2 prétendra aussi à une compilation dynamique de code (types
d’automates et algorithmes) et de le charger en tant que bibliothèque dynamique. Ces
simples problèmes amènent à des architectures de distribution complexes et d’effacement de
type, qui doivent être testés dans un environnement simulé.
* 12h45 : Transducteurs dans Vaucanson 2 -- Victor Santet
Le projet Vaucanson 2 tient à offrir à ses utilisateurs une large variété de types
d’automates, notamment les transducteurs. Ce rapport propose une implémentation de
transducteurs génériques, qui peuvent accepter des automates étiquetés par des n-uplets de
langages.
--
Daniela Becker
Responsable administrative du LRDE