
Bonjour, nous avons le plaisir de vous inviter au séminaire des étudiants-chercheurs du LRDE. Il aura lieu le mercredi 3 juillet 2013 à partir de 9h30 en Amphi 3 (KB). Et notez d'ores et déjà la date du jeudi 11 juillet où les étudiants CSI 2014 présenteront leurs travaux. ----------------------------------------------------------------------- Au programme du 3 juillet 2013 : OLENA * 09h30 : Analyse structurelle haut-niveau de document dans le module Scribo d’Olena -- Christophe Escobar * 10h00 : Détection de logotypes et autres invariants caractéristiques -- Anthony Seure SPEAKER ID * 10h30 : Les Machines de Boltzmann dans la reconnaissance du locuteur -- Jean-Luc Bounthong * 11h00 : Approximation de la distance entre i-vecteurs par Perceptron Multi-Couches -- Jimmy Yeh CLIMB * 11h45 : Maintenance automatique des symboles exportés dans les packages de Common Lisp – Christophe Vermorel VAUCANSON * 12h15 : Améliorer l’architecture de Vaucanson 2 -- Guillaume Sanchez * 12h45 : Transducteurs dans Vaucanson 2 – Victor Santet Les Résumés des exposés : ************************** OLENA * 09h30 : Analyse structurelle haut-niveau de document dans le module Scribo d’Olena -- Christophe Escobar L’extraction de structures dans un document numérisé se base sur la mise en place d’une chaîne de traitements constituée de briques élémentaires. L’analyse haut-niveau d’un document nécessite des informations structurelles sur celui-ci et se basera donc sur cette chaîne de traitements. Elle consistera à extraire des informations plus abstraites de nature structurelle sur un document, pour obtenir des "indices" sur sa structure. À l’aide de ces indices et de schémas de structure, il est ensuite possible de réaliser des traitements de haut-niveau tels que l’identification du flot de lecture, l’extraction d’éléments spécifiques ou la reconstruction d’un document dans un autre format. * 10h00 : Détection de logotypes et autres invariants caractéristiques -- Anthony Seure La détection de logotypes et d’invariants dans une image a pour but de trouver parmi une ou plusieurs images un élément graphique qui caractérise une marque, entreprise, etc. De tels éléments peuvent se retrouver dans de nombreuses images naturelles mais également dans des images publicitaires. L’intérêt de l’intégration d’un tel outil dans Olena et Terra Rush permettrait de mieux indexer les contenus mais également d’invalider des zones de l’image dans d’autres chaînes de traitement. Nous expliquerons principalement une méthode générique permettant de localiser les points-clés invariants d’une image : les descripteurs SIFT. SPEAKER ID * 10h30 : Les Machines de Boltzmann dans la reconnaissance du locuteur -- Jean-Luc Bounthong L’espace Total Variability (TV) représente actuellement l’état de l’art dans le domaine de la vérification du locuteur. Des progrès significatifs ont été réalisés grâce aux nouvelles méthodes de classification comme l’Analyse discriminante linéaire probabiliste (PLDA) ou la Distance Cosinus (CD). Dans cette étude, nous explorons une nouvelle méthode pour déterminer la distance entre deux i-vecteurs en utilisant une variante des Machines de Boltzmann, ces nouvelles approches ont montré des résultats satisfaisants dans le domaine du traitement d’images. Nous allons aussi comparer les performances en terme de fiabilité avec les méthodes classiques comme PLDA ou CD. * 11h00 : Approximation de la distance entre i-vecteurs par Perceptron Multi-Couches -- Jimmy Yeh Actuellement, l’espace des i-vecteurs est la représentation standard des paramètres de la parole dans les systèmes de reconnaissance du locuteur. Le calcul du score est généralement basé sur la distance cosinus, ou sur l’analyse discriminante linéaire probabiliste. Le but de ce sujet est de remplacer ces approches par un Perceptron Multi-Couches (PMC). Le PMC a montré en effet de bonnes performances pour approximer des fonctions non linéaires. L’idée principale étant de trouver une meilleure fonction que la distance cosinus. Les performances du PMC seront comparées aux autres méthodes comme la distance cosinus ou encore la machine de Boltzmann. CLIMB * 11h45 : Maintenance automatique des symboles exportés dans les packages de Common Lisp -- Christophe Vermorel Les "packages" de Common Lisp offrent une fonctionnalité analogue aux espaces de noms présents dans des langages comme le C++. Ceux-ci permettent d’encapsuler des symboles qui peuvent être exportés ou privés. Les symboles exportés peuvent être explicitement déclarés lors de la définition du package. Cette liste de symboles est fastidieuse à maintenir lors du développement de projets de grosse envergure. Dans ce rapport, nous étudions des techniques de maintenance automatiques de cette liste. Plusieurs alternatives sont présentées et comparées. VAUCANSON * 12h15 : Améliorer l’architecture de Vaucanson 2 -- Guillaume Sanchez Vaucanson 2 est la suite de Vaucanson, la plate-forme de manipulation d’automates finis. Ce redémarrage à zéro a été fortement encouragé par quelques problèmes de conception. Vaucanson 2 entend apprendre des erreurs de son prédecesseur, et dans ce but, un vrai travail de conception doit être fait. Les templates doivent être utilisés pour la performance (évitant un usage abusif de fonctions virtuelles) afin de pouvoir préférer la généricité plutôt que la généralité, tout en conservant une flexibilité lors de l’exécution. Vaucanson 2 prétendra aussi à une compilation dynamique de code (types d’automates et algorithmes) et de le charger en tant que bibliothèque dynamique. Ces simples problèmes amènent à des architectures de distribution complexes et d’effacement de type, qui doivent être testés dans un environnement simulé. * 12h45 : Transducteurs dans Vaucanson 2 -- Victor Santet Le projet Vaucanson 2 tient à offrir à ses utilisateurs une large variété de types d’automates, notamment les transducteurs. Ce rapport propose une implémentation de transducteurs génériques, qui peuvent accepter des automates étiquetés par des n-uplets de langages. -- Daniela Becker Responsable administrative du LRDE