
Bonjour, nous avons le plaisir de vous inviter au Séminaire des étudiants du LRDE. Il aura lieu le mardi 31 janvier 2017 à partir de 10h30 en L0 au LRDE (KB). -------------------------------------------- Au programme : OLENA — TRAITEMENT D’IMAGES GÉNÉ- RIQUE ET PERFORMANT 10h30 : Détection automatique de zones de textes sur des pièces d’identité – ANNE-CLAIRE BERTHET On cherche à détecter les zones de textes sur tout type de pièces d’identité, pouvant provenir de n’importe quel pays et filmées par des caméras de smartphones. Par conséquent, on peut être amené à segmenter des lettres latines, cyrilliques ou des idéogrammes. Par ailleurs, certains papiers d’identité possèdent des filigranes et/ou un fond utilisant des lettres comme motif, qui doivent être filtrés. De plus, le contexte de la prise de vue (luminosité, fond...) doit être pris en compte afin, qu’une fois l’image binarisée, le nombre de composantes à filtrer soit minimal. Ainsi, le pré-traitement proposé permet, à l’aide de filtres morphologiques, de détecter le texte efficacement en limitant le nombre de composantes à traiter. VCSN — BIBLIOTHÈQUE DE MANIPULATION D’AUTOMATES 11h00 : K plus courts chemins dans Vcsn – SÉBASTIEN PIAT Le calcul des K plus courts chemins dans un automate peut être très coûteux, surtout sur des automates énormes comme ceux utilisés en linguistique. Ainsi, après avoir implémenté l’une des solutions considérée comme l’état de l’art (appelée l’algorithme de Yen) dans Vcsn, l’étape suivante était l’implémentation de la meilleure solution pour ce calcul sur des automates avec des cycles : Eppstein. Ce travail va décrire nos différentes implementations et comparer leurs performances. VÉRIFICATION DU LOCUTEUR 11h30 : Modèle du monde à base de réseaux de neurones à délai temporel pour la reconnaissance du locuteur – VALENTIN IOVENE Dans le domaine de la reconnaissance du locuteur, les réseaux de neurones profonds (DNN) ont récemment été montrés plus efficaces pour collecter des statistiques Baum-Welch utilisables pour l’extraction d’i-vector que les modèles de mélanges gaussiens traditionnels. Cependant, ce type d’architecture peut être trop lent au moment de l’évaluation, demandant l’utilisation d’un processeur graphique pour atteindre des performances "temps-réel". Nous montrons que les statistiques produites par a réseau de neurones à délai temporel (TDNN) peuvent être utilisées pour construire un GMM supervisé plus léger servant de modèle du monde (UBM) dans un système i-vector classique. L’erreur obtenue avec cette approche est comparée à celles obtenues avec des modèles du monde basés sur des GMM classiques -- Daniela Becker Responsable administrative du LRDE