Bonjour,
nous avons le plaisir de vous inviter au 2e séminaire des étudiants-chercheurs du
LRDE de ce mois de juillet. Il aura lieu le jeudi 11 juillet 2013 à partir de 9h30 en Amphi 3 (KB).
-----------------------------------------------------------------------
Au programme du 11 juillet 2013 :
OLENA
* 09h30 : Réduire les ressources utilisées par une chaîne de traitement complexe -- Raphaël Boissel
* 10h00 : À propos du calcul de l'arbre des formes sur des images n-dimensionnelles en temps quasi-linéaire -- Sébastien Crozet
SPEAKER ID
* 10h30 : Projection non-linéaire pour l'attribution de score selon la distance en cosinus
dans le contexte des systèmes de vérification du locuteur à base d'i-vectors -- Benjamin Roux
CLIMB
* 11h00 : La programmation orientée contexte appliquée au traitement d'images -- François Ripault
Les Résumés des exposés :
********************************
OLENA
* 09h30 : Réduire les ressources utilisées par une chaîne de traitement complexe -- Raphaël Boissel
Même si la précision du système de localisation de texte développé par le laboratoire a aujourd'hui
grandement augmentée, un des principaux problèmes demeure la vitesse. En effet, si l'on souhaite
être en mesure de l'utiliser pour extraire du texte dans des vidéos ou s'il doit être embarqué dans des
appareils aux ressources limitées tel que des téléphones portables, la consommation de ressources
mémoire et CPU doit être réduite. Pour parvenir à cet objectif, plusieurs méthodes permettant de réduire
l'impact mémoire et CPU des étapes les plus coûteuses peuvent être utilisées. Cependant, toutes n'offrent
pas les mêmes résultats en fonction de l'image d'entrée et certaines peuvent même dégrader le résultat
final produit par le système. L'objectif est de présenter ces méthodes, d'observer leurs résultats et de
déterminer dans quelles situations elles sont applicables.
* 10h00 : À propos du calcul de l'arbre des formes sur des images n-dimensionnelles en temps quasi-linéaire -- Sébastien Crozet
L’arbre des formes est une transformée d’image utile pour les traitements d’images discrètes de façon
auto-duale. Dans un récent article nous avons présenté un nouvel algorithme de calcul de cet arbre en
n-dimensions. Cependant, aucune preuve ni étude de performances n’a été décrite. De plus, utilisé tel quel,
l’algorithme nécessite une multiplication de la taille de l’image traitée telle que l’occupation mémoire et les
temps de calculs sont très importants. Nous étudierons la preuve de l’algorithme ainsi que les détails
d’initialisations. Nous apportons aussi une amélioration afin de réduire son occupation mémoire et ses
temps de calcul lorsqu’il est appliqué à des images bidimensionnelles.
SPEAKER ID
* 10h30 : Projection non-linéaire pour l'attribution de score selon la distance en cosinus
dans le contexte des systèmes de vérification du locuteur à base d'i-vectors -- Benjamin Roux
À l’heure actuelle, l’espace des i-vectors est considéré comme le modèle standard pour la représentation
d’information vocale dans le contexte des systèmes de vérification du locuteur. De récents progrès ont pu
être accomplis grâce à ce modèle qui permet de représenter les données dans un nombre réduit de
dimensions et également grâce à l’utilisation de nouvelles méthodes de classification comme l’Analyse
Discriminante Linéaire Probabiliste (PLDA) ou encore le classifieur à base de distance cosinus (CD).
L’idée du scoring avec le CD est de projetter les caractéristiques évoluant dans un nombre de dimensions
élevé sur une hypersphère de dimension plus faible. Aujourd’hui, tous les sytèmes utilisent d’abord une
Analyse Discriminante Linéaire (LDA) classique afin de trouver la meilleure projection dans l’espace de
dimension inférieure avant de projetter sur l’hypersphère. Le but de ce travail est de proposer une projection
non linéaire directement de l’espace des i-vectors vers une hypersphère en minimisant la corrélation inter-classe
tout en maximisant la correlation intra-classe. Il sera question de comparer les résultats obtenus avec d’autres
solutions comme : le CD classique, le PLDA et l’approximation de mesure de distance avec le perceptron
multicouche et les machines de Bolzmann.
CLIMB
* 11h00 : La programmation orientée contexte appliquée au traitement d'images -- François Ripault
La programmation orientée contexte est un paradigme permettant de prendre en compte les problématiques
transverses et les variations de comportement d'un programme dépendantes du contexte. Ce paradigme
permet ainsi d'exprimer des aspects du comportement d'un programme qui sont orthogonaux à sa modélisation
objet, tout en maintenant son abstraction et sa modularité. Dans le domaine du traitement d'images, par exemple,
la programmation orientée contexte peut être utilisée pour prendre en compte des aspects qui traitent à la fois
de la structure de l'image, de son contenu, ou encore sa représentation mémoire.
Nous présentons la programmation orientée contexte, puis nous analysons ensuite les problématiques transverses
présentes dans Climb, une bibliothèque de traitement d'images écrite en Common Lisp. Nous expliquons ensuite
comment la programmation orientée contexte permet de résoudre ces problématiques. Enfin, nous analysons les
avantages de la programmation orientée contexte dans le domaine du traitement d'images.
--
Daniela Becker
Responsable administrative du LRDE