
Bonjour, nous avons le plaisir de vous inviter au séminaire des étudiants du LRDE. Il aura lieu le lundi 4 juillet 2011 à 9h30 - 17h15 en Amphi Masters (KB). ----------------------------------------------------------------------- Au programme: *CLIMB, SCRIBO, TIGER, SPOT, SPEAKER ID et VAUCANSON* http://publis.lrde.epita.fr/Seminar-2011-07-04 CLIMB * 09h30 : Arbres de composantes et opérateurs de chaînage -- Christopher Chedeau * 10h00 : Ecriture d'algorithmes de traitement d'images génériques -- Simon Guillot * 10h30 : Implémentation de voisinages pondérés -- Laurent Senta SCRIBO * 11h15 : Analyse de la mise en page d'un document dans SCRIBO -- Julien Marquegnies * 11h45 : Extraction du texte en inverse video dans SCRIBO -- Coddy Levi * 12h15 : Désambiguïsation de la superposition de lignes -- Sylvain Lobry TIGER * 14h00 : Optimisations dans le compilateur Tiger -- Félix Abecassis SPOT * 14h30 : Amélioration de la dégénéralisation dans Spot -- Pierre Parutto * 15h00 : Réductions basées sur la bisimulation appliquées aux TGBA -- Thomas Badie SPEAKER ID * 15h45 : Speaker ID - Détection de voix -- Victor Lenoir VAUCANSON * 16h15 : Avancées vers Vaucanson 1.4 et 2.0 -- Guillaume Fiette * 16h45 : Implémentation du semi-anneau rationnel -- David Moreira ----------------------------------------------------------------------- Les Résumés des exposés : ************************** CLIMB 09h30 : Arbres de composantes et opérateurs de chaînage -- Christopher Chedeau Climb est une bibliothèque de traitement d'images générique ayant pour objectif le prototypage rapide. L’implémentation de deux algorithmes d’arbre de composantes impacte Climb de plusieurs façons : la définition des valeurs est étendue, de nouveaux ensembles de sites sont ajoutés et les outils de développement sont améliorés. Un détour est pris afin de comprendre le patron de conception de chaînage popularisé par la bibliothèque jQuery. La méthode est modifiée afin de s’adapter au traitement d’images ainsi qu’à Common Lisp. Elle est également étendue via une notation parallèle ainsi qu’avec une meilleure gestion du fil d’exécution. 10h00 : Ecriture d'algorithmes de traitement d'images génériques -- Simon Guillot Climb est une bibliothèque générique de traitement d'images en Lisp. L'étude de l'implémentation d'un algorithme de segmentation par ligne de partage des eaux permet de faire état des possibilités offertes par un langage dynamique tel que Lisp allié à une modélisation générique des images. Cette étude de cas permet d'aborder les concepts de base de la manipulation d'images au sein de Climb tels que les sites, les ensembles de sites et les accumulateurs. L'utilisation de l'ensemble de ces notions reposent sur l'aspect dynamique et fonctionnel de Lisp. 10h30 : Implémentation de voisinages pondérés -- Laurent Senta Climb est une bibliothèque de traitement d’images générique développée en Lisp. Les voisinages sont representés sous la forme d’ensemble de sites (site-set) pour permettre des manipulations génériques sur de multiples types d’images. En parallèle de ces concepts, une étude des voisinages pondérés est effectuée, expliquant différents moyens d’étendre le concept d’une écriture unique des algorithmes pour les exécuter sur différents types de paramètres. Trois implémentations sont proposées, décrites et comparées au niveau de leur généricité et de leur expressivité. SCRIBO 11h15 : Analyse de la mise en page d'un document dans SCRIBO -- Julien Marquegnies L’extraction des différentes structures d’un document numérisé se base sur la mise en place d’une chaîne de traitement constituée d’un certain nombre d’étapes primordiales afin d’optimiser la qualité du rendu final. L’étude de la mise en page du document, à savoir la localisation des lignes de texte et des paragraphes, constitue le coeur même de la chaîne puisque le rendu obtenu est étroitement corrélé avec les zones de texte données en entrée à l’OCR. Ainsi, nous présenterons une méthode hybride d’analyse de mise en page développée dans le cadre du projet SCRIBO. 11h45 : Extraction du texte en inverse video dans SCRIBO -- Coddy Levi L'extraction du texte d'images de document intervient dans le processus plus général de compréhension de documents que propose le projet SCRIBO. Le texte peut être présent dans deux formes : foncé sur fond clair ou clair sur fond foncé, appelé Inverse Video. Cette présentation explique les problématiques liées à l’extraction du texte en inverse video dans SCRIBO en utilisant la chaîne de traitement déjà existante, les problèmes ainsi introduits et les pistes explorées pour l’amélioration des résultats. 12h15 : Désambiguïsation de la superposition de lignes -- Sylvain Lobry Lorsque l'on essaye d'extraire du texte en inverse vidéo (couleur claire sur fond fonce), nous verrons lors de la présentation de Coddy Levi que de nombreux problèmes surgissent. Le plus courant d'entre eux est la superpositions entre ce texte en inverse vidéo, et celui en couleur foncée sur clair. Nous montrerons donc lors de cette présentation comment faire un choix entre ces lignes en superposition, en considérant différents critères et en les pondérant. TIGER 14h00 : Optimisations dans le compilateur Tiger -- Félix Abecassis Le compilateur Tiger est un projet éducatif jouant un rôle central dans le cursus de la troisième année de l’EPITA. Ce projet est l’occasion d’enseigner aux étudiants des bonnes pratiques de développement logiciel comme les design patterns ainsi que l’importance des tests et de la documentation. L’ère de l’informatique séquentielle étant terminée, la programmation parallèle, autrefois reléguée aux universités et aux laboratoires de recherche est maintenant devenue incontournable dans tout cursus d’informatique, pour cette raison nous aimerions introduire du parallèlisme dans le projet. Dans ce rapport nous étudions les possibilités de parallélisation dans le compilateur Tiger en utilisant la bibliothèque Intel Threading Building Blocks (TBB). Nous avons également diagnostiqué et corrigé plusieurs soucis de performance dans l’algorithme d’allocation de registres. SPOT 14h30 : Amélioration de la dégénéralisation dans Spot -- Pierre Parutto Spot est une bibliothèque de model checking developée au LRDE. Sa force est d’utiliser les Automates de Büchi Generalisés basés sur les transitions (TGBA), plutôt que les Automates de Büchi basés sur les Transitions (TBA) très utilisés dans les autres model checkers. Les TGBA nous permettent de produire des automates très petits représentant une formule rendant toutes les étapes suivantes du model checking plus rapide. Comme Spot met l’accent sur l’utilisabilité et la personnalisation des outils, une attention particulière est portée sur l’interfaçage avec d’autres programmes. La capacité de transformer un TGBA en TBA (appelé dégénéralisation) sans perdre en performance est donc centrale. Cette présentation a pour but de montrer une analyse des outils de dégénéralisation présents dans Spot et de proposer des moyens pour les améliorer. 15h00 : Réductions basées sur la bisimulation appliquées aux TGBA -- Thomas Badie Spot est une bibliothèque C++ de model checking utilisant l’approche par automates. Pour représenter les propriétés à vérifier, nous utilisons des formules LTL qui sont traduites en automates. Dans Spot, ces automates sont des Automates de Büchi généralisés basés sur les transitions (TGBA). Un enjeu pour tout model checker, est d’être rapide. Une manière de faire est de rendre les automates aussi petit que possible. La littérature scientifique propose de nombreux algorithmes pour arriver à notre but. La bisimulation et la simulation réduisent des automates qui reconnaissent des mots infinis. Ce rapport montre comment adapter ces algorithmes pour des TGBA ainsi que le gain apporté par l’implémentation de la bisimulation, ce qui souligne l’importance d’implémenter la simulation pour réduire les TGBA. SPEAKER ID 15h45 : Speaker ID - Détection de voix -- Victor Lenoir La détection de voix a de nombreuses applications. C'est par exemple une étape obligatoire avant de faire de la reconnaissance du locuteur. Ce rapport présente deux différents types d'algorithmes pour la détection de voix (VAD) : un utilisant des seuils et le second utilisant des mélanges de gaussiennes (GMM). Les algoritmes proposés utilisent des caractéristiques calculées sur des petits intervalles de temps comme par exemple l'énergie, la monotonie spectrale ou les Mel-Frequency Cepstral Coefficients (MFCC). Les différents algorithmes de détection de voix sont comparés dans différentes conditions de bruit afin de mettre en évidence leur robustesse aux bruits. VAUCANSON 16h15 : Avancées vers Vaucanson 1.4 et 2.0 -- Guillaume Fiette Vaucanson est une plateforme de manipulation d’automates finis et de transducteurs. Après plusieurs années de developpement, il fût constaté que l’interface mise en place pour manipuler les automates était trop complexe. Des travaux furent donc entrepris pour résoudre ce problème, amenant ainsi à l’introduction des "label kinds". Deux versions de la plateforme sont donc en developpement aujourd’hui : Vaucanson 1.4, qui vise à terminer et compléter le travail effectué avant l’introduction des kinds et Vaucanson 2.0, dernière version de la plateforme, pour le moment incomplète. Ce rapport a pour but de présenter une nouvelle fonctionnalité de Vaucanson 1.4, les semi-anneaux Z/nZ, ainsi que le travail en cours sur Vaucanson 2.0. 16h45 : Implémentation du semi-anneau rationnel -- David Moreira Vaucanson est une plateforme de manipulation d’automates finis et de transducteurs dont l’interface s’est montrée trop complexe. Pendant les deux dernières années, des travaux ont étés entrepris afin d’introduire le concept de kind d’un automate dans la bibliothèque. Aujourd’hui, une partie de la nouvelle interface a été implémentée et le travail sur le cœur a laissé Vaucanson 1.4 dans un état instable. Ce rapport montrera dans un premier temps le travail effectué pour Vaucanson 1.4, puis sur les travaux entrepris afin de rendre stable Vaucanson 2.0. -- Daniela Becker