Bonjour,
nous avons le plaisir de vous inviter au Séminaire des étudiants du LRDE.
Il aura lieu le mardi 31 janvier 2017 à partir de 10h30 en L0 au LRDE (KB).
--------------------------------------------
Au programme :
OLENA — TRAITEMENT D’IMAGES GÉNÉ-
RIQUE ET PERFORMANT
10h30 : Détection automatique de zones de textes sur des
pièces d’identité – ANNE-CLAIRE BERTHET
On cherche à détecter les zones de textes sur tout type de pièces
d’identité, pouvant provenir de n’importe quel pays et filmées
par des caméras de smartphones. Par conséquent, on peut être
amené à segmenter des lettres latines, cyrilliques ou des idéogrammes.
Par ailleurs, certains papiers d’identité possèdent
des filigranes et/ou un fond utilisant des lettres comme motif,
qui doivent être filtrés. De plus, le contexte de la prise de
vue (luminosité, fond...) doit être pris en compte afin, qu’une
fois l’image binarisée, le nombre de composantes à filtrer soit
minimal. Ainsi, le pré-traitement proposé permet, à l’aide de
filtres morphologiques, de détecter le texte efficacement en limitant
le nombre de composantes à traiter.
VCSN — BIBLIOTHÈQUE DE MANIPULATION
D’AUTOMATES
11h00 : K plus courts chemins dans Vcsn –
SÉBASTIEN PIAT
Le calcul des K plus courts chemins dans un automate peut être
très coûteux, surtout sur des automates énormes comme ceux
utilisés en linguistique. Ainsi, après avoir implémenté l’une
des solutions considérée comme l’état de l’art (appelée l’algorithme
de Yen) dans Vcsn, l’étape suivante était l’implémentation
de la meilleure solution pour ce calcul sur des automates
avec des cycles : Eppstein. Ce travail va décrire nos différentes
implementations et comparer leurs performances.
VÉRIFICATION DU LOCUTEUR
11h30 : Modèle du monde à base de réseaux de neurones à
délai temporel pour la reconnaissance du locuteur
– VALENTIN IOVENE
Dans le domaine de la reconnaissance du locuteur, les réseaux
de neurones profonds (DNN) ont récemment été montrés plus
efficaces pour collecter des statistiques Baum-Welch utilisables
pour l’extraction d’i-vector que les modèles de mélanges gaussiens
traditionnels. Cependant, ce type d’architecture peut être
trop lent au moment de l’évaluation, demandant l’utilisation
d’un processeur graphique pour atteindre des performances
"temps-réel". Nous montrons que les statistiques produites par
a réseau de neurones à délai temporel (TDNN) peuvent être
utilisées pour construire un GMM supervisé plus léger servant
de modèle du monde (UBM) dans un système i-vector
classique. L’erreur obtenue avec cette approche est comparée
à celles obtenues avec des modèles du monde basés sur des
GMM classiques
--
Daniela Becker
Responsable administrative du LRDE
Show replies by date