[Séminaire des étudiants CSI 2014 du LRDE] le jeudi 11 juillet 2013 - Amphi 3

Bonjour, nous avons le plaisir de vous inviter au 2e séminaire des étudiants-chercheurs du LRDE de ce mois de juillet. Il aura lieu le jeudi 11 juillet 2013 à partir de 9h30 en Amphi 3 (KB). ----------------------------------------------------------------------- Au programme du 11 juillet 2013 : OLENA * 09h30 : Réduire les ressources utilisées par une chaîne de traitement complexe -- Raphaël Boissel * 10h00 : À propos du calcul de l'arbre des formes sur des images n-dimensionnelles en temps quasi-linéaire -- Sébastien Crozet SPEAKER ID * 10h30 : Projection non-linéaire pour l'attribution de score selon la distance en cosinus dans le contexte des systèmes de vérification du locuteur à base d'i-vectors -- Benjamin Roux CLIMB * 11h00 : La programmation orientée contexte appliquée au traitement d'images -- François Ripault Les Résumés des exposés : ******************************** OLENA * 09h30 : Réduire les ressources utilisées par une chaîne de traitement complexe -- Raphaël Boissel Même si la précision du système de localisation de texte développé par le laboratoire a aujourd'hui grandement augmentée, un des principaux problèmes demeure la vitesse. En effet, si l'on souhaite être en mesure de l'utiliser pour extraire du texte dans des vidéos ou s'il doit être embarqué dans des appareils aux ressources limitées tel que des téléphones portables, la consommation de ressources mémoire et CPU doit être réduite. Pour parvenir à cet objectif, plusieurs méthodes permettant de réduire l'impact mémoire et CPU des étapes les plus coûteuses peuvent être utilisées. Cependant, toutes n'offrent pas les mêmes résultats en fonction de l'image d'entrée et certaines peuvent même dégrader le résultat final produit par le système. L'objectif est de présenter ces méthodes, d'observer leurs résultats et de déterminer dans quelles situations elles sont applicables. * 10h00 : À propos du calcul de l'arbre des formes sur des images n-dimensionnelles en temps quasi-linéaire -- Sébastien Crozet L’arbre des formes est une transformée d’image utile pour les traitements d’images discrètes de façon auto-duale. Dans un récent article nous avons présenté un nouvel algorithme de calcul de cet arbre en n-dimensions. Cependant, aucune preuve ni étude de performances n’a été décrite. De plus, utilisé tel quel, l’algorithme nécessite une multiplication de la taille de l’image traitée telle que l’occupation mémoire et les temps de calculs sont très importants. Nous étudierons la preuve de l’algorithme ainsi que les détails d’initialisations. Nous apportons aussi une amélioration afin de réduire son occupation mémoire et ses temps de calcul lorsqu’il est appliqué à des images bidimensionnelles. SPEAKER ID * 10h30 : Projection non-linéaire pour l'attribution de score selon la distance en cosinus dans le contexte des systèmes de vérification du locuteur à base d'i-vectors -- Benjamin Roux À l’heure actuelle, l’espace des i-vectors est considéré comme le modèle standard pour la représentation d’information vocale dans le contexte des systèmes de vérification du locuteur. De récents progrès ont pu être accomplis grâce à ce modèle qui permet de représenter les données dans un nombre réduit de dimensions et également grâce à l’utilisation de nouvelles méthodes de classification comme l’Analyse Discriminante Linéaire Probabiliste (PLDA) ou encore le classifieur à base de distance cosinus (CD). L’idée du scoring avec le CD est de projetter les caractéristiques évoluant dans un nombre de dimensions élevé sur une hypersphère de dimension plus faible. Aujourd’hui, tous les sytèmes utilisent d’abord une Analyse Discriminante Linéaire (LDA) classique afin de trouver la meilleure projection dans l’espace de dimension inférieure avant de projetter sur l’hypersphère. Le but de ce travail est de proposer une projection non linéaire directement de l’espace des i-vectors vers une hypersphère en minimisant la corrélation inter-classe tout en maximisant la correlation intra-classe. Il sera question de comparer les résultats obtenus avec d’autres solutions comme : le CD classique, le PLDA et l’approximation de mesure de distance avec le perceptron multicouche et les machines de Bolzmann. CLIMB * 11h00 : La programmation orientée contexte appliquée au traitement d'images -- François Ripault La programmation orientée contexte est un paradigme permettant de prendre en compte les problématiques transverses et les variations de comportement d'un programme dépendantes du contexte. Ce paradigme permet ainsi d'exprimer des aspects du comportement d'un programme qui sont orthogonaux à sa modélisation objet, tout en maintenant son abstraction et sa modularité. Dans le domaine du traitement d'images, par exemple, la programmation orientée contexte peut être utilisée pour prendre en compte des aspects qui traitent à la fois de la structure de l'image, de son contenu, ou encore sa représentation mémoire. Nous présentons la programmation orientée contexte, puis nous analysons ensuite les problématiques transverses présentes dans Climb, une bibliothèque de traitement d'images écrite en Common Lisp. Nous expliquons ensuite comment la programmation orientée contexte permet de résoudre ces problématiques. Enfin, nous analysons les avantages de la programmation orientée contexte dans le domaine du traitement d'images. -- Daniela Becker Responsable administrative du LRDE
participants (1)
-
Daniela Becker