Bonjour,
nous avons le plaisir de vous inviter au séminaire des étudiants du
LRDE. Il aura lieu le lundi 4 juillet 2011 à 9h30 - 17h15 en Amphi
Masters (KB).
-----------------------------------------------------------------------
Au programme:
*CLIMB, SCRIBO, TIGER, SPOT, SPEAKER ID et VAUCANSON*
http://publis.lrde.epita.fr/Seminar-2011-07-04
CLIMB
* 09h30 : Arbres de composantes et opérateurs de chaînage -- Christopher
Chedeau
* 10h00 : Ecriture d'algorithmes de traitement d'images génériques --
Simon Guillot
* 10h30 : Implémentation de voisinages pondérés -- Laurent Senta
SCRIBO
* 11h15 : Analyse de la mise en page d'un document dans SCRIBO -- Julien
Marquegnies
* 11h45 : Extraction du texte en inverse video dans SCRIBO -- Coddy Levi
* 12h15 : Désambiguïsation de la superposition de lignes -- Sylvain Lobry
TIGER
* 14h00 : Optimisations dans le compilateur Tiger -- Félix Abecassis
SPOT
* 14h30 : Amélioration de la dégénéralisation dans Spot -- Pierre Parutto
* 15h00 : Réductions basées sur la bisimulation appliquées aux TGBA --
Thomas Badie
SPEAKER ID
* 15h45 : Speaker ID - Détection de voix -- Victor Lenoir
VAUCANSON
* 16h15 : Avancées vers Vaucanson 1.4 et 2.0 -- Guillaume Fiette
* 16h45 : Implémentation du semi-anneau rationnel -- David Moreira
-----------------------------------------------------------------------
Les Résumés des exposés :
**************************
CLIMB
09h30 : Arbres de composantes et opérateurs de chaînage -- Christopher
Chedeau
Climb est une bibliothèque de traitement d'images générique ayant pour
objectif le prototypage rapide. L’implémentation de deux algorithmes
d’arbre de composantes impacte Climb de plusieurs façons : la définition
des valeurs est étendue, de nouveaux ensembles de sites sont ajoutés et
les outils de développement sont améliorés. Un détour est pris afin de
comprendre le patron de conception de chaînage popularisé par la
bibliothèque jQuery. La méthode est modifiée afin de s’adapter au
traitement d’images ainsi qu’à Common Lisp. Elle est également étendue
via une notation parallèle ainsi qu’avec une meilleure gestion du fil
d’exécution.
10h00 : Ecriture d'algorithmes de traitement d'images génériques --
Simon Guillot
Climb est une bibliothèque générique de traitement d'images en Lisp.
L'étude de l'implémentation d'un algorithme de segmentation par ligne de
partage des eaux permet de faire état des possibilités offertes par un
langage dynamique tel que Lisp allié à une modélisation générique des
images. Cette étude de cas permet d'aborder les concepts de base de la
manipulation d'images au sein de Climb tels que les sites, les ensembles
de sites et les accumulateurs. L'utilisation de l'ensemble de ces
notions reposent sur l'aspect dynamique et fonctionnel de Lisp.
10h30 : Implémentation de voisinages pondérés -- Laurent Senta
Climb est une bibliothèque de traitement d’images générique développée
en Lisp. Les voisinages sont representés sous la forme d’ensemble de
sites (site-set) pour permettre des manipulations génériques sur de
multiples types d’images. En parallèle de ces concepts, une étude des
voisinages pondérés est effectuée, expliquant différents moyens
d’étendre le concept d’une écriture unique des algorithmes pour les
exécuter sur différents types de paramètres. Trois implémentations sont
proposées, décrites et comparées au niveau de leur généricité et de leur
expressivité.
SCRIBO
11h15 : Analyse de la mise en page d'un document dans SCRIBO -- Julien
Marquegnies
L’extraction des différentes structures d’un document numérisé se base
sur la mise en place d’une chaîne de traitement constituée d’un certain
nombre d’étapes primordiales afin d’optimiser la qualité du rendu final.
L’étude de la mise en page du document, à savoir la localisation des
lignes de texte et des paragraphes, constitue le coeur même de la chaîne
puisque le rendu obtenu est étroitement corrélé avec les zones de texte
données en entrée à l’OCR. Ainsi, nous présenterons une méthode hybride
d’analyse de mise en page développée dans le cadre du projet SCRIBO.
11h45 : Extraction du texte en inverse video dans SCRIBO -- Coddy Levi
L'extraction du texte d'images de document intervient dans le processus
plus général de compréhension de documents que propose le projet SCRIBO.
Le texte peut être présent dans deux formes : foncé sur fond clair ou
clair sur fond foncé, appelé Inverse Video. Cette présentation explique
les problématiques liées à l’extraction du texte en inverse video dans
SCRIBO en utilisant la chaîne de traitement déjà existante, les
problèmes ainsi introduits et les pistes explorées pour l’amélioration
des résultats.
12h15 : Désambiguïsation de la superposition de lignes -- Sylvain Lobry
Lorsque l'on essaye d'extraire du texte en inverse vidéo (couleur claire
sur fond fonce), nous verrons lors de la présentation de Coddy Levi que
de nombreux problèmes surgissent. Le plus courant d'entre eux est la
superpositions entre ce texte en inverse vidéo, et celui en couleur
foncée sur clair. Nous montrerons donc lors de cette présentation
comment faire un choix entre ces lignes en superposition, en considérant
différents critères et en les pondérant.
TIGER
14h00 : Optimisations dans le compilateur Tiger -- Félix Abecassis
Le compilateur Tiger est un projet éducatif jouant un rôle central dans
le cursus de la troisième année de l’EPITA. Ce projet est l’occasion
d’enseigner aux étudiants des bonnes pratiques de développement logiciel
comme les design patterns ainsi que l’importance des tests et de la
documentation. L’ère de l’informatique séquentielle étant terminée, la
programmation parallèle, autrefois reléguée aux universités et aux
laboratoires de recherche est maintenant devenue incontournable dans
tout cursus d’informatique, pour cette raison nous aimerions introduire
du parallèlisme dans le projet. Dans ce rapport nous étudions les
possibilités de parallélisation dans le compilateur Tiger en utilisant
la bibliothèque Intel Threading Building Blocks (TBB). Nous avons
également diagnostiqué et corrigé plusieurs soucis de performance dans
l’algorithme d’allocation de registres.
SPOT
14h30 : Amélioration de la dégénéralisation dans Spot -- Pierre Parutto
Spot est une bibliothèque de model checking developée au LRDE. Sa force
est d’utiliser les Automates de Büchi Generalisés basés sur les
transitions (TGBA), plutôt que les Automates de Büchi basés sur les
Transitions (TBA) très utilisés dans les autres model checkers. Les TGBA
nous permettent de produire des automates très petits représentant une
formule rendant toutes les étapes suivantes du model checking plus
rapide. Comme Spot met l’accent sur l’utilisabilité et la
personnalisation des outils, une attention particulière est portée sur
l’interfaçage avec d’autres programmes. La capacité de transformer un
TGBA en TBA (appelé dégénéralisation) sans perdre en performance est
donc centrale. Cette présentation a pour but de montrer une analyse des
outils de dégénéralisation présents dans Spot et de proposer des moyens
pour les améliorer.
15h00 : Réductions basées sur la bisimulation appliquées aux TGBA --
Thomas Badie
Spot est une bibliothèque C++ de model checking utilisant l’approche par
automates. Pour représenter les propriétés à vérifier, nous utilisons
des formules LTL qui sont traduites en automates. Dans Spot, ces
automates sont des Automates de Büchi généralisés basés sur les
transitions (TGBA). Un enjeu pour tout model checker, est d’être rapide.
Une manière de faire est de rendre les automates aussi petit que
possible. La littérature scientifique propose de nombreux algorithmes
pour arriver à notre but. La bisimulation et la simulation réduisent des
automates qui reconnaissent des mots infinis. Ce rapport montre comment
adapter ces algorithmes pour des TGBA ainsi que le gain apporté par
l’implémentation de la bisimulation, ce qui souligne l’importance
d’implémenter la simulation pour réduire les TGBA.
SPEAKER ID
15h45 : Speaker ID - Détection de voix -- Victor Lenoir
La détection de voix a de nombreuses applications. C'est par exemple une
étape obligatoire avant de faire de la reconnaissance du locuteur. Ce
rapport présente deux différents types d'algorithmes pour la détection
de voix (VAD) : un utilisant des seuils et le second utilisant des
mélanges de gaussiennes (GMM). Les algoritmes proposés utilisent des
caractéristiques calculées sur des petits intervalles de temps comme par
exemple l'énergie, la monotonie spectrale ou les Mel-Frequency Cepstral
Coefficients (MFCC). Les différents algorithmes de détection de voix
sont comparés dans différentes conditions de bruit afin de mettre en
évidence leur robustesse aux bruits.
VAUCANSON
16h15 : Avancées vers Vaucanson 1.4 et 2.0 -- Guillaume Fiette
Vaucanson est une plateforme de manipulation d’automates finis et de
transducteurs. Après plusieurs années de developpement, il fût constaté
que l’interface mise en place pour manipuler les automates était trop
complexe. Des travaux furent donc entrepris pour résoudre ce problème,
amenant ainsi à l’introduction des "label kinds". Deux versions de la
plateforme sont donc en developpement aujourd’hui : Vaucanson 1.4, qui
vise à terminer et compléter le travail effectué avant l’introduction
des kinds et Vaucanson 2.0, dernière version de la plateforme, pour le
moment incomplète. Ce rapport a pour but de présenter une nouvelle
fonctionnalité de Vaucanson 1.4, les semi-anneaux Z/nZ, ainsi que le
travail en cours sur Vaucanson 2.0.
16h45 : Implémentation du semi-anneau rationnel -- David Moreira
Vaucanson est une plateforme de manipulation d’automates finis et de
transducteurs dont l’interface s’est montrée trop complexe. Pendant les
deux dernières années, des travaux ont étés entrepris afin d’introduire
le concept de kind d’un automate dans la bibliothèque. Aujourd’hui, une
partie de la nouvelle interface a été implémentée et le travail sur le
cœur a laissé Vaucanson 1.4 dans un état instable. Ce rapport montrera
dans un premier temps le travail effectué pour Vaucanson 1.4, puis sur
les travaux entrepris afin de rendre stable Vaucanson 2.0.
--
Daniela Becker