Module: Descripteurs audio « chromas » |
proposé par :
- Geoffroy Peeters (geoffroy.peeters_at_telecom-paristech.fr)
- Roland Badeau (roland.badeau_at_telecom-paristech.fr)
|
Descriptif |
La représentation en chromas permet de répartir l’intensité d’un son complexe, potentiellement polyphonique sur une échelle musicale tempérée ramené sur un octave. Les chromas peuvent être calculés sur un signal audio avec différentes résolutions (sixième de ton, demi-ton, ..). Ils peuvent aussi être calculés sur partition (la résolution est automatiquement en demi-tons) mais différentes précisions en nombres d’harmoniques (1, 3, ..) peuvent être utilisées. Par exemple, pour un do4 sur la partition, le chroma théorique correspondant pour une résolution d’une harmonique est le vecteur C=(1,0,0,0,0,0,0,0,0,0,0,0) où les composantes représentent les valeurs de chromas pour les différentes notes (C, C#, D, .., B) . |
Ressources dont le module dépend |
|
Exemples d’utilisation du module |
- dans un système simple de reconnaissance des accords
- dans un système simple d’alignement entre musique et partition
|
Résultats attendus |
- connaissances : Compréhension de la représentation en chromas, Compréhension de son utilisation en reconnaissance d’accords ou de tonalité
- compétence : à l’issue de ce module vous aurez écrit en Java un programme qui calcule la représentation en chromas à partir d’un signal audio
- PAN 1: description du module, et du rôle des chromas
- PAN 2: étude biblio, pseudo-code, savoir expliquer avec ses propres mots le fonctionnement et le principe des chromas. Calcul de chromas théoriques à partir d’une représentation MIDI ou partition en utilisant une résolution à 1 ou 3 harmonique(s) (à l’aide de JAVA ou matlab/octave)
- PAN 3: mise en œuvre sur des données audio. Représentation en chromagramme (par analogie au spectrogramme) pour un segment musical simple
|
Volume |
- 4TH programmées pour un binôme
|
Le Web sémantique et les données liées |
proposé par :
- Jean-Claude Moissinac, bureau 5D34, jean-claude.moissinac@telecom-paris.fr
|
Descriptif |
Internet donne accès à de grandes quantités de données; cette caractéristique s’amplifie avec l’ouverture des données publiques et le mouvement de l’Open Data. Afin d’affiner la façon d’accéder à ces données par des machines pour composer de nouveaux services, de nouvelles approches se sont développées connues sous la dénomination générique de Web Sémantique.Ce module vise à faire acquérir les bases de compréhension et des outils nécessaires pour exploiter des possibilités du web sémantique et de l’Open Data. |
Objectifs Pédagogiques |
- Graphes de connaissances : comprendre la représentation de connaissances dans des graphes, représentés à partir de triplets (sujet, prédicat, objet)
- Compréhension des principes de l’exploitation de graphes de connaissances: de RDFa aux raisonneurs dans les ontologies; les bases de l’utilisation de ce type d’approche dans le projet devront être clairement posées
- Interrogation d’un graphe de connaissances: des librairies RDFa au langage SPARQL
- Application: savoir expliquer comment les connaissances acquises sont mise en place dans le code
|
Résultats attendus (A affiner selon vos besoins) |
- PAN1 :
- Décrire les connaissances à représenter et/ou exploiter pour le prototype
- Expliquer comment ces connaissances sont exploitées.
- PAN2 :
- Expliquer précisément d’un point de vue technique les principes d’exploitation des connaissances utilisées
- Livrable: implémentation d’un service créant ou consommant des connaissances
- PAN3 :
- Expliquer les problèmes réels ou potentiels des services retenus pour le prototype
- Décrire le fonctionnement et l’intégration des connaissances dans le prototype allégé; présenter les processus informatiques mis en oeuvre
- Livrable : à préciser d’ici au PAN2
- PAN4 :
- Analyser comment le module est intégré dans le prototype, quelles pistes d’améliorations seraient à envisager (performance, simplicité,)
- livrable biblio : les principes de fonctionnement, l’intérêt et les limites de l’exploitation du Web Sémantique dans votre projet
|
Codage correcteur linéaire |
Proposé par Olivier Rioul |
Descriptif |
Tout transmission d’information sous forme binaire, en présence de distorsion ou de bruit provoque certains types d’erreur qu’il est possible de réduire/contrôler par des techniques de codage utilisant des codes linéaires binaires de faible longueur. Leur description utilise les notations de matrice génératrice et de contrôle ce parité et on peut concevoir différents algorithmes de codage (systématique ou non) et de décodage (typiquement par « syndrome ») suivant le type d’erreurs en présence (erreurs isolées, en rafale, effacements) ou la stratégie adoptée (compromis détection/compression en présence ou non d’une voie de retour, etc). Les performances en termes de probabilité d’erreur et de rendement peuvent être comparés à la capacité de Shannon. |
Ressources dont le module dépend |
|
Exemples d’utilisation |
- Tout système de transmission d’information binaire en présence de bruit/d’erreurs bit.
|
Résultats attendus (à adapter en fonction des besoins) |
- Connaissances : codes correcteurs linaires, capacité de correction, codage systématique, décodage par syndrôme, stratégies FEC/ARQ, capacité, théorème de Shannon.
- Compétence : comprendre et mettre en oeuvre.
- Livrable : pseudo-code / code commenté et structuré de manière à être lisible; tests sur des flux binaires.
|
Quantification scalaire |
Proposé par Olivier Rioul |
Descriptif |
Tout traitement devant être représenté sur une précision finie (avec un nombre fini de bits) nécessite une quantification. La quantification scalaire est une technique très simple où chaque échantillon de signal est quantifié de façon optimisée par rapport à sa distribution statistique afin d’obtenir une puissance de bruit minimale. Un algorithme optimal optimise à la fois le quantificateur (choix de cellules de quantification) et le déquantificateur (choix d’un dictionnaire). Une optimisation alternée (algorithme de Lloyd-Max I ou II) n’est optimal que pour certaines catégories de distributions (appelées log-concaves). Une optimisation conjointe à un codeur entropique implique (à résolution suffisamment haute) une quantification optimale uniforme. Les performances en termes de rapport signal à bruit fonction du taux de codage peuvent être comparées à la fonction taux-distortion optimale de Shannon. |
Ressources dont le module dépend |
|
Exemples d’utilisation |
- Tout système de traitement numérique de signaux (son, parole, image, vidéo)
|
Résultats attendus (à adapter en fonction des besoins) |
- Connaissances : quantification de Lloyd-Max, quantification non-uniforme optimisée, calcul de performances haute-résolution en présence ou non d’un codeur entropique, fonction taux-distorsioon et théorème de Shannon.
- Compétence : comprendre la problématique de la quantification et plus généralement du codage avec distortion et être capable de mettre en oeuvre un algorithme de quantification optimisée.
- Livrable : pseudo-code / code commenté et structuré de manière à être lisible; tests sur des sources gaussiennes.
|
Compression entropique |
Proposé par Olivier Rioul |
Descriptif |
La compression sans pertes ou codage entropique désigne un ensemble de méthodes de mathématiques discrètes pour réduire le volume occupé par des données (par exemple un fichier de texte) en réduisant la redondance statistique présente dans les données. La méthode la plus utilisée consiste à utiliser des représentations codées à longueur variable, le code étant d’autant plus court que l’élément à coder est fréquent. Cette technique s’applique directement aux fichiers de données que l’on veut comprimer sans erreur mais elle peut aussi s’appliquer en s’ajoutant à des techniques de compression avec perte (compression de son, d’images, de vidéo) de façon à améliorer les performances. La mesure théorique de compression s’effectue à l’aide d’un outil de théorie de l’information appelé l’entropie qui représente le taux minimum en deçà duquel on ne plus comprimer l’information sans perte. Les algorithmes standard de compression utilisent trois techniques fondamentales: codage de Huffman, codage de Lempel-Ziv, codage arithmétique. |
Ressources dont le module dépend |
|
Exemples d’utilisation |
- Tout système de traitement numérique de signaux (son, parole, image, vidéo)
|
Résultats attendus (à adapter en fonction des besoins) |
- Connaissances : codage à longueur variable, codes de Fano-Shannon, codes de Huffman, codage de Lemel-Ziv, codage arithmétique, entropie et théorème de Shannon.
- Compétence : comprendre la problématique de la compression sans pertes et et être capable de mettre en oeuvre un algorithme de codage adaptatif à longueur variable.
- Livrable : pseudo-code / code commenté et structuré de manière à être lisible; tests sur des sources académiques avec ou sans mémoire.
|
Le site pédagogique de PACT