[Lrde Annonce] [Séminaire des étudiants CSI] Mercredi 20 janvier 2016 - Amphi 3

12 Jan 2016

      Bonjour, 

nous avons le plaisir de vous inviter au Séminaire des étudiants du LRDE. 
Il aura lieu le mercredi 20 janvier 2016 à partir de 10h30 en Amphi 3 (KB). 

-------------------------------------------- 

Au programme :

VÉRIFICATION DU LOCUTEUR

* 10h30 : La Segmentation du Locuteur Basée
sur les Coefficients Cepstraux sur l’échelle de Mel – FANNY RIOLS

La séparation du locuteur est un sujet important dans le domaine
de la recherche. Il s’agit de savoir qui parle à quel
moment dans un enregistrement audio, c’est-à-dire que nous
aimerions connaître les intervalles de temps durant lesquels
chaque locuteur parle. En calculant les Coefficients Cepstraux
sur l’échelle de Mel (MFCC) de notre enregistrement audio, et
en utilisant l’Analyse en Composantes Principales (ICA), nous
pouvons avec l’aide de chaînes de Markov cachées (HMM),
segmenter l’enregistrement. Nous utiliserons cet algorithme
pour la segmentation du locuteur dans le système de vérification
du locuteur, avec des enregistrements audio où plusieurs
personnes parlent, comme dans les enregistrements d’entretiens
ou bien les enregistrements microphone de l’évaluation
de reconnaissance du locuteur de NIST.

SPOT — BIBLIOTHÈQUE DE MODEL
CHECKING

* 11h00 : Améliorer la determinisation
d’automates de Büchi – ALEXANDRE LEWKOWICZ

L’algorithme de Safra permet de construire des automates
de Rabin déterministes à partir d’automates de Büchi nondéterministes.
Il existe une variante à cette méthode qui permet
de construire des automates à parités déterministes. Cependant,
ces méthodes produisent des automates avec 2O(n log n)
états. Il existe des améliorations qui permettent de réduire le
nombre d’états dans beaucoup de cas. Nous présentons deux
nouvelles stratégies pour aider à réduire le nombre d’états final.
La première stratégie utilise les composantes fortement
connexes et utilise cette information pour suivre des chemins
de Safra différents. La deuxième stratégie utilise l’information
retournée par la bisimulation pour retirer des états équivalents.
Ceci permet d’éviter de parcourir plusieurs chemins équivalents
et ainsi de réduire le nombre d’états final. On montre que
nos stratégies permettent souvent de construire des automates
déterministes avec moins d’états et que ces automates reconnaissent
toujours le même language. On donne des benchmarks
pour voir le gain apporté par nos stratégies et on utilise
un outil appelé ltl2dstar qui produit des automates de Rabin
déterministes à partir de formules LTL pour comparer nos
résultats.

VCSN — BIBLIOTHÈQUE DE MANIPULATION
D’AUTOMATES

* 11h30 : Génération aléatoire d’automates
et de chemins dans Vcsn – ANTOINE PIETRI

Ce rapport présente l’implémentation d’une façon générique et
performante pour générer des automates aléatoires pondérés.
Pour ce faire, nous utilisons des relations déjà établies entre des
ensembles connus et l’ensemble des DFA de taille n. En étendant
ces relations dans le cas pondéré, nous généralisons l’algorithme
présenté et nous montrons une implémentation dans
la plateforme Vcsn.

* 12h00 : Vcsn et la linguistique – SÉBASTIEN
PIAT

La théorie des automates étant utilisée pour représenter et manipuler
des langages, la linguistique en est un des domaines
d’application. La bibliothèque Vcsn n’a pas encore été utilisée
pour de telles applications. La récente implémentation d’une
méthode efficace de composition a rendu possible la création
d’un traducteur utilisant des transducteurs. Nous présenterons
les différentes étapes de l’implémentation d’un traducteur
de language SMS ("bjr") vers le français ("bonjour") en utilisant
Vcsn, et le pipeline du processus de traduction utilisant des automates.
Nous verrons également les difficultés qu’a amenées
son implémentation : de l’absence de certains algorithmes dans
Vcsn aux mauvaises performances d’autres.

* 12h30 : Composition Efficace de Transducteurs
dans Vcsn – VALENTIN TOLMER

Les transducteurs sont utilisés dans beaucoup de contextes,
comme la reconnaissance de parole ou le calcul de la similitude
entre protéines. Un des algorithmes fondamentaux pour
les manipuler est la composition. Ce travail présente l’algorithme
basique de composition, puis son extension à des transducteurs
à transitions spontanées. Une adaptation paresseuse
de l’algorithme est ensuite proposée, à la fois pour la composition
et pour le pré-traitement (insplitting). Nous montrons ensuite
que la version naïve de la composition variadique ne réduit
pas la quantité de calculs nécessaires. Enfin, des mesures
de performances comparent l’implémentation de la composition
dans Vcsn à celle d’OpenFST.

-- 
Daniela Becker 
Responsable administrative du LRDE