
Bonjour, nous avons le plaisir de vous inviter au Séminaire des étudiants du LRDE. Il aura lieu le mercredi 20 janvier 2016 à partir de 10h30 en Amphi 3 (KB). -------------------------------------------- Au programme : VÉRIFICATION DU LOCUTEUR * 10h30 : La Segmentation du Locuteur Basée sur les Coefficients Cepstraux sur l’échelle de Mel – FANNY RIOLS La séparation du locuteur est un sujet important dans le domaine de la recherche. Il s’agit de savoir qui parle à quel moment dans un enregistrement audio, c’est-à-dire que nous aimerions connaître les intervalles de temps durant lesquels chaque locuteur parle. En calculant les Coefficients Cepstraux sur l’échelle de Mel (MFCC) de notre enregistrement audio, et en utilisant l’Analyse en Composantes Principales (ICA), nous pouvons avec l’aide de chaînes de Markov cachées (HMM), segmenter l’enregistrement. Nous utiliserons cet algorithme pour la segmentation du locuteur dans le système de vérification du locuteur, avec des enregistrements audio où plusieurs personnes parlent, comme dans les enregistrements d’entretiens ou bien les enregistrements microphone de l’évaluation de reconnaissance du locuteur de NIST. SPOT — BIBLIOTHÈQUE DE MODEL CHECKING * 11h00 : Améliorer la determinisation d’automates de Büchi – ALEXANDRE LEWKOWICZ L’algorithme de Safra permet de construire des automates de Rabin déterministes à partir d’automates de Büchi nondéterministes. Il existe une variante à cette méthode qui permet de construire des automates à parités déterministes. Cependant, ces méthodes produisent des automates avec 2O(n log n) états. Il existe des améliorations qui permettent de réduire le nombre d’états dans beaucoup de cas. Nous présentons deux nouvelles stratégies pour aider à réduire le nombre d’états final. La première stratégie utilise les composantes fortement connexes et utilise cette information pour suivre des chemins de Safra différents. La deuxième stratégie utilise l’information retournée par la bisimulation pour retirer des états équivalents. Ceci permet d’éviter de parcourir plusieurs chemins équivalents et ainsi de réduire le nombre d’états final. On montre que nos stratégies permettent souvent de construire des automates déterministes avec moins d’états et que ces automates reconnaissent toujours le même language. On donne des benchmarks pour voir le gain apporté par nos stratégies et on utilise un outil appelé ltl2dstar qui produit des automates de Rabin déterministes à partir de formules LTL pour comparer nos résultats. VCSN — BIBLIOTHÈQUE DE MANIPULATION D’AUTOMATES * 11h30 : Génération aléatoire d’automates et de chemins dans Vcsn – ANTOINE PIETRI Ce rapport présente l’implémentation d’une façon générique et performante pour générer des automates aléatoires pondérés. Pour ce faire, nous utilisons des relations déjà établies entre des ensembles connus et l’ensemble des DFA de taille n. En étendant ces relations dans le cas pondéré, nous généralisons l’algorithme présenté et nous montrons une implémentation dans la plateforme Vcsn. * 12h00 : Vcsn et la linguistique – SÉBASTIEN PIAT La théorie des automates étant utilisée pour représenter et manipuler des langages, la linguistique en est un des domaines d’application. La bibliothèque Vcsn n’a pas encore été utilisée pour de telles applications. La récente implémentation d’une méthode efficace de composition a rendu possible la création d’un traducteur utilisant des transducteurs. Nous présenterons les différentes étapes de l’implémentation d’un traducteur de language SMS ("bjr") vers le français ("bonjour") en utilisant Vcsn, et le pipeline du processus de traduction utilisant des automates. Nous verrons également les difficultés qu’a amenées son implémentation : de l’absence de certains algorithmes dans Vcsn aux mauvaises performances d’autres. * 12h30 : Composition Efficace de Transducteurs dans Vcsn – VALENTIN TOLMER Les transducteurs sont utilisés dans beaucoup de contextes, comme la reconnaissance de parole ou le calcul de la similitude entre protéines. Un des algorithmes fondamentaux pour les manipuler est la composition. Ce travail présente l’algorithme basique de composition, puis son extension à des transducteurs à transitions spontanées. Une adaptation paresseuse de l’algorithme est ensuite proposée, à la fois pour la composition et pour le pré-traitement (insplitting). Nous montrons ensuite que la version naïve de la composition variadique ne réduit pas la quantité de calculs nécessaires. Enfin, des mesures de performances comparent l’implémentation de la composition dans Vcsn à celle d’OpenFST. -- Daniela Becker Responsable administrative du LRDE