[Lrde Annonce] [Séminaire des étudiants CSI] lundi 4 juillet 2011 - Amphi Masters

28 Jun 2011

      Bonjour,

nous avons le plaisir de vous inviter au séminaire des étudiants du 
LRDE. Il aura lieu le lundi 4 juillet 2011 à 9h30 - 17h15 en Amphi 
Masters (KB).

-----------------------------------------------------------------------

Au programme:

*CLIMB, SCRIBO, TIGER, SPOT, SPEAKER ID et VAUCANSON*

http://publis.lrde.epita.fr/Seminar-2011-07-04

CLIMB

* 09h30 : Arbres de composantes et opérateurs de chaînage -- Christopher 
Chedeau

* 10h00 : Ecriture d'algorithmes de traitement d'images génériques -- 
Simon Guillot

* 10h30 : Implémentation de voisinages pondérés -- Laurent Senta

SCRIBO

* 11h15 : Analyse de la mise en page d'un document dans SCRIBO -- Julien 
Marquegnies

* 11h45 : Extraction du texte en inverse video dans SCRIBO -- Coddy Levi

* 12h15 : Désambiguïsation de la superposition de lignes -- Sylvain Lobry

TIGER

* 14h00 : Optimisations dans le compilateur Tiger -- Félix Abecassis

SPOT

* 14h30 : Amélioration de la dégénéralisation dans Spot -- Pierre Parutto

* 15h00 : Réductions basées sur la bisimulation appliquées aux TGBA -- 
Thomas Badie

SPEAKER ID

* 15h45 : Speaker ID - Détection de voix -- Victor Lenoir

VAUCANSON

* 16h15 : Avancées vers Vaucanson 1.4 et 2.0 -- Guillaume Fiette

* 16h45 : Implémentation du semi-anneau rationnel -- David Moreira

-----------------------------------------------------------------------

Les Résumés des exposés  :
**************************

CLIMB
09h30 : Arbres de composantes et opérateurs de chaînage -- Christopher 
Chedeau

Climb est une bibliothèque de traitement d'images générique ayant pour 
objectif le prototypage rapide. L’implémentation de deux algorithmes 
d’arbre de composantes impacte Climb de plusieurs façons : la définition 
des valeurs est étendue, de nouveaux ensembles de sites sont ajoutés et 
les outils de développement sont améliorés. Un détour est pris afin de 
comprendre le patron de conception de chaînage popularisé par la 
bibliothèque jQuery. La méthode est modifiée afin de s’adapter au 
traitement d’images ainsi qu’à Common Lisp. Elle est également étendue 
via une notation parallèle ainsi qu’avec une meilleure gestion du fil 
d’exécution.

10h00 : Ecriture d'algorithmes de traitement d'images génériques -- 
Simon Guillot

Climb est une bibliothèque générique de traitement d'images en Lisp. 
L'étude de l'implémentation d'un algorithme de segmentation par ligne de 
partage des eaux permet de faire état des possibilités offertes par un 
langage dynamique tel que Lisp allié à une modélisation générique des 
images. Cette étude de cas permet d'aborder les concepts de base de la 
manipulation d'images au sein de Climb tels que les sites, les ensembles 
de sites et les accumulateurs. L'utilisation de l'ensemble de ces 
notions reposent sur l'aspect dynamique et fonctionnel de Lisp.

10h30 : Implémentation de voisinages pondérés -- Laurent Senta

Climb est une bibliothèque de traitement d’images générique développée 
en Lisp. Les voisinages sont representés sous la forme d’ensemble de 
sites (site-set) pour permettre des manipulations génériques sur de 
multiples types d’images. En parallèle de ces concepts, une étude des 
voisinages pondérés est effectuée, expliquant différents moyens 
d’étendre le concept d’une écriture unique des algorithmes pour les 
exécuter sur différents types de paramètres. Trois implémentations sont 
proposées, décrites et comparées au niveau de leur généricité et de leur 
expressivité.

SCRIBO

11h15 : Analyse de la mise en page d'un document dans SCRIBO -- Julien 
Marquegnies

L’extraction des différentes structures d’un document numérisé se base 
sur la mise en place d’une chaîne de traitement constituée d’un certain 
nombre d’étapes primordiales afin d’optimiser la qualité du rendu final. 
L’étude de la mise en page du document, à savoir la localisation des 
lignes de texte et des paragraphes, constitue le coeur même de la chaîne 
puisque le rendu obtenu est étroitement corrélé avec les zones de texte 
données en entrée à l’OCR. Ainsi, nous présenterons une méthode hybride 
d’analyse de mise en page développée dans le cadre du projet SCRIBO.

11h45 : Extraction du texte en inverse video dans SCRIBO -- Coddy Levi

L'extraction du texte d'images de document intervient dans le processus 
plus général de compréhension de documents que propose le projet SCRIBO. 
Le texte peut être présent dans deux formes : foncé sur fond clair ou 
clair sur fond foncé, appelé Inverse Video. Cette présentation explique 
les problématiques liées à l’extraction du texte en inverse video dans 
SCRIBO en utilisant la chaîne de traitement déjà existante, les 
problèmes ainsi introduits et les pistes explorées pour l’amélioration 
des résultats.

12h15 : Désambiguïsation de la superposition de lignes -- Sylvain Lobry

Lorsque l'on essaye d'extraire du texte en inverse vidéo (couleur claire 
sur fond fonce), nous verrons lors de la présentation de Coddy Levi que 
de nombreux problèmes surgissent. Le plus courant d'entre eux est la 
superpositions entre ce texte en inverse vidéo, et celui en couleur 
foncée sur clair. Nous montrerons donc lors de cette présentation 
comment faire un choix entre ces lignes en superposition, en considérant 
différents critères et en les pondérant.

TIGER

14h00 : Optimisations dans le compilateur Tiger -- Félix Abecassis

Le compilateur Tiger est un projet éducatif jouant un rôle central dans 
le cursus de la troisième année de l’EPITA. Ce projet est l’occasion 
d’enseigner aux étudiants des bonnes pratiques de développement logiciel 
comme les design patterns ainsi que l’importance des tests et de la 
documentation. L’ère de l’informatique séquentielle étant terminée, la 
programmation parallèle, autrefois reléguée aux universités et aux 
laboratoires de recherche est maintenant devenue incontournable dans 
tout cursus d’informatique, pour cette raison nous aimerions introduire 
du parallèlisme dans le projet. Dans ce rapport nous étudions les 
possibilités de parallélisation dans le compilateur Tiger en utilisant 
la bibliothèque Intel Threading Building Blocks (TBB). Nous avons 
également diagnostiqué et corrigé plusieurs soucis de performance dans 
l’algorithme d’allocation de registres.

SPOT

14h30 : Amélioration de la dégénéralisation dans Spot -- Pierre Parutto

Spot est une bibliothèque de model checking developée au LRDE. Sa force 
est d’utiliser les Automates de Büchi Generalisés basés sur les 
transitions (TGBA), plutôt que les Automates de Büchi basés sur les 
Transitions (TBA) très utilisés dans les autres model checkers. Les TGBA 
nous permettent de produire des automates très petits représentant une 
formule rendant toutes les étapes suivantes du model checking plus 
rapide. Comme Spot met l’accent sur l’utilisabilité et la 
personnalisation des outils, une attention particulière est portée sur 
l’interfaçage avec d’autres programmes. La capacité de transformer un 
TGBA en TBA (appelé dégénéralisation) sans perdre en performance est 
donc centrale. Cette présentation a pour but de montrer une analyse des 
outils de dégénéralisation présents dans Spot et de proposer des moyens 
pour les améliorer.

15h00 : Réductions basées sur la bisimulation appliquées aux TGBA -- 
Thomas Badie

Spot est une bibliothèque C++ de model checking utilisant l’approche par 
automates. Pour représenter les propriétés à vérifier, nous utilisons 
des formules LTL qui sont traduites en automates. Dans Spot, ces 
automates sont des Automates de Büchi généralisés basés sur les 
transitions (TGBA). Un enjeu pour tout model checker, est d’être rapide. 
Une manière de faire est de rendre les automates aussi petit que 
possible. La littérature scientifique propose de nombreux algorithmes 
pour arriver à notre but. La bisimulation et la simulation réduisent des 
automates qui reconnaissent des mots infinis. Ce rapport montre comment 
adapter ces algorithmes pour des TGBA ainsi que le gain apporté par 
l’implémentation de la bisimulation, ce qui souligne l’importance 
d’implémenter la simulation pour réduire les TGBA.

SPEAKER ID

15h45 : Speaker ID - Détection de voix -- Victor Lenoir

La détection de voix a de nombreuses applications. C'est par exemple une 
étape obligatoire avant de faire de la reconnaissance du locuteur. Ce 
rapport présente deux différents types d'algorithmes pour la détection 
de voix (VAD) : un utilisant des seuils et le second utilisant des 
mélanges de gaussiennes (GMM). Les algoritmes proposés utilisent des 
caractéristiques calculées sur des petits intervalles de temps comme par 
exemple l'énergie, la monotonie spectrale ou les Mel-Frequency Cepstral 
Coefficients (MFCC). Les différents algorithmes de détection de voix 
sont comparés dans différentes conditions de bruit afin de mettre en 
évidence leur robustesse aux bruits.

VAUCANSON

16h15 : Avancées vers Vaucanson 1.4 et 2.0 -- Guillaume Fiette

Vaucanson est une plateforme de manipulation d’automates finis et de 
transducteurs. Après plusieurs années de developpement, il fût constaté 
que l’interface mise en place pour manipuler les automates était trop 
complexe. Des travaux furent donc entrepris pour résoudre ce problème, 
amenant ainsi à l’introduction des "label kinds". Deux versions de la 
plateforme sont donc en developpement aujourd’hui : Vaucanson 1.4, qui 
vise à terminer et compléter le travail effectué avant l’introduction 
des kinds et Vaucanson 2.0, dernière version de la plateforme, pour le 
moment incomplète. Ce rapport a pour but de présenter une nouvelle 
fonctionnalité de Vaucanson 1.4, les semi-anneaux Z/nZ, ainsi que le 
travail en cours sur Vaucanson 2.0.

16h45 : Implémentation du semi-anneau rationnel -- David Moreira

Vaucanson est une plateforme de manipulation d’automates finis et de 
transducteurs dont l’interface s’est montrée trop complexe. Pendant les 
deux dernières années, des travaux ont étés entrepris afin d’introduire 
le concept de kind d’un automate dans la bibliothèque. Aujourd’hui, une 
partie de la nouvelle interface a été implémentée et le travail sur le 
cœur a laissé Vaucanson 1.4 dans un état instable. Ce rapport montrera 
dans un premier temps le travail effectué pour Vaucanson 1.4, puis sur 
les travaux entrepris afin de rendre stable Vaucanson 2.0.

-- 
Daniela Becker