Bonjour,
nous avons le plaisir de vous inviter au 2e séminaire des étudiants-chercheurs du
LRDE de ce mois de juillet. Il aura lieu le jeudi 11 juillet 2013 à partir de 9h30 en
Amphi 3 (KB).
-----------------------------------------------------------------------
Au programme du 11 juillet 2013 :
OLENA
* 09h30 : Réduire les ressources utilisées par une chaîne de traitement complexe --
Raphaël Boissel
* 10h00 : À propos du calcul de l'arbre des formes sur des images n-dimensionnelles en
temps quasi-linéaire -- Sébastien Crozet
SPEAKER ID
* 10h30 : Projection non-linéaire pour l'attribution de score selon la distance en
cosinus
dans le contexte des systèmes de vérification du locuteur à base d'i-vectors --
Benjamin Roux
CLIMB
* 11h00 : La programmation orientée contexte appliquée au traitement d'images --
François Ripault
Les Résumés des exposés :
********************************
OLENA
* 09h30 : Réduire les ressources utilisées par une chaîne de traitement complexe --
Raphaël Boissel
Même si la précision du système de localisation de texte développé par le laboratoire a
aujourd'hui
grandement augmentée, un des principaux problèmes demeure la vitesse. En effet, si
l'on souhaite
être en mesure de l'utiliser pour extraire du texte dans des vidéos ou s'il doit
être embarqué dans des
appareils aux ressources limitées tel que des téléphones portables, la consommation de
ressources
mémoire et CPU doit être réduite. Pour parvenir à cet objectif, plusieurs méthodes
permettant de réduire
l'impact mémoire et CPU des étapes les plus coûteuses peuvent être utilisées.
Cependant, toutes n'offrent
pas les mêmes résultats en fonction de l'image d'entrée et certaines peuvent même
dégrader le résultat
final produit par le système. L'objectif est de présenter ces méthodes, d'observer
leurs résultats et de
déterminer dans quelles situations elles sont applicables.
* 10h00 : À propos du calcul de l'arbre des formes sur des images n-dimensionnelles en
temps quasi-linéaire -- Sébastien Crozet
L’arbre des formes est une transformée d’image utile pour les traitements d’images
discrètes de façon
auto-duale. Dans un récent article nous avons présenté un nouvel algorithme de calcul de
cet arbre en
n-dimensions. Cependant, aucune preuve ni étude de performances n’a été décrite. De plus,
utilisé tel quel,
l’algorithme nécessite une multiplication de la taille de l’image traitée telle que
l’occupation mémoire et les
temps de calculs sont très importants. Nous étudierons la preuve de l’algorithme ainsi que
les détails
d’initialisations. Nous apportons aussi une amélioration afin de réduire son occupation
mémoire et ses
temps de calcul lorsqu’il est appliqué à des images bidimensionnelles.
SPEAKER ID
* 10h30 : Projection non-linéaire pour l'attribution de score selon la distance en
cosinus
dans le contexte des systèmes de vérification du locuteur à base d'i-vectors --
Benjamin Roux
À l’heure actuelle, l’espace des i-vectors est considéré comme le modèle standard pour la
représentation
d’information vocale dans le contexte des systèmes de vérification du locuteur. De récents
progrès ont pu
être accomplis grâce à ce modèle qui permet de représenter les données dans un nombre
réduit de
dimensions et également grâce à l’utilisation de nouvelles méthodes de classification
comme l’Analyse
Discriminante Linéaire Probabiliste (PLDA) ou encore le classifieur à base de distance
cosinus (CD).
L’idée du scoring avec le CD est de projetter les caractéristiques évoluant dans un nombre
de dimensions
élevé sur une hypersphère de dimension plus faible. Aujourd’hui, tous les sytèmes
utilisent d’abord une
Analyse Discriminante Linéaire (LDA) classique afin de trouver la meilleure projection
dans l’espace de
dimension inférieure avant de projetter sur l’hypersphère. Le but de ce travail est de
proposer une projection
non linéaire directement de l’espace des i-vectors vers une hypersphère en minimisant la
corrélation inter-classe
tout en maximisant la correlation intra-classe. Il sera question de comparer les résultats
obtenus avec d’autres
solutions comme : le CD classique, le PLDA et l’approximation de mesure de distance avec
le perceptron
multicouche et les machines de Bolzmann.
CLIMB
* 11h00 : La programmation orientée contexte appliquée au traitement d'images --
François Ripault
La programmation orientée contexte est un paradigme permettant de prendre en compte les
problématiques
transverses et les variations de comportement d'un programme dépendantes du contexte.
Ce paradigme
permet ainsi d'exprimer des aspects du comportement d'un programme qui sont
orthogonaux à sa modélisation
objet, tout en maintenant son abstraction et sa modularité. Dans le domaine du traitement
d'images, par exemple,
la programmation orientée contexte peut être utilisée pour prendre en compte des aspects
qui traitent à la fois
de la structure de l'image, de son contenu, ou encore sa représentation mémoire.
Nous présentons la programmation orientée contexte, puis nous analysons ensuite les
problématiques transverses
présentes dans Climb, une bibliothèque de traitement d'images écrite en Common Lisp.
Nous expliquons ensuite
comment la programmation orientée contexte permet de résoudre ces problématiques. Enfin,
nous analysons les
avantages de la programmation orientée contexte dans le domaine du traitement
d'images.
--
Daniela Becker
Responsable administrative du LRDE
Show replies by date