Roland Badeau (roland.badeau_at_telecom-paristech.fr)
Descriptif
La synthèse de la parole permet de vocaliser un texte. Ce module permet de réaliser un synthétiseur complet par concaténation d’éléments pré-enregistrés (e.g. les diphones) et permet ainsi de synthétiser n’importe quel mot. Pour la partie de « transcription graphème-phonème » (e.g. conversion du texte en suite de phonèmes), on utilisera un phonétiseur distribué librement (LIAPhon) qu’il s’agira de comprendre. Pour un système de synthèse à vocabulaire limité, on pourra se contenter de prophétiser manuellement les différents mots du vocabulaire.
dans un système où une information textuelle doit être vocalisée, ou dans le cadre d’une interface Homme-Machine
Résultats attendus
connaissances : Compréhension de l’algorithme de synthèse par concaténation de diphones, connaissances sur le traitement de la parole, Traitement du signal pour la concaténation de sons élémentaires
compétence : à l’issue de ce module vous aurez écrit en Java un programme qui synthétise un texte à vocabulaire ouvert. Vous aurez aussi interfacé votre programme avec un phonétiseur distribué librement.
livrable 1: Interfaçage avec le phonétiseur du LIA (LIAPhon) ou constitution d’un dictionnaire de mots phonétisés
livrable 2: pseudo-code du programme de synthèse par concaténation de diphones
livrable 3: code java + tests d’évaluation et d’intélligibilité sur des textes simples.
Volume
12 TH programmées pour un binôme (avec intégration du phonétiseur LIAPhon)
6 TH pour un système à vocabulaire limité (sans intégration du phonétiseur LIAPhon).