Vidéo 3D |
proposé par :
- Marco Cagnazzo (cagnazzo@telecom-paristech.fr)
|
Descriptif |
La Vidéo 3D est un mode de communication immersive, qui donne à l’utilisateur l’impression de plus en plus réaliste « d’être dans la scène ». Cela peut être obtenu avec la vidéo stéréoscopique (deux vues), multi-vues (N>2 vues), et MVD (multi-vues plus profondeur, ou depth).Ce module permettra de connaître les formats les plus communs pour la vidéo 3D. |
Ressources dont le module dépend |
|
Exemples d’utilisation du module |
- Utilisation : vidéo 3D
- Vidéo conférence 3D, appels vidéo 3D
- TNT 3D
- Blu-ray Discs 3D
|
Résultats attendus |
- Connaissances : Formats de vidéo 3D
- Compétence : Capacité de lire et manipuler des vidéo dans les formats 3D
- Livrable : Synthèse de points de vue virtuels
|
Représentation et compression de la vidéo |
proposé par :
- Marco Cagnazzo (cagnazzo@telecom-paristech.fr)
Experts :
|
Descriptif |
L’estimation de mouvement est un outil dont l’objectif est de donner une description robuste et précise du mouvement qui existe dans une vidéo numérique.Exemples :
- Match de tennis : mouvement des joueurs et de la balle
- Film : mouvement des personnages, du fond, des objets, …
Cette définition est intuitive, mais vague. Pour avoir des algorithmes utilisables en pratique, il est nécessaire donner une formalisation mathématique au problème.
En représentant les images d’une vidéo numérique comme des matrices de nombres (qui définissent la couleur de chaque pixel), les principales méthodes d’estimation du mouvement sont basée sur le « block-matching » (BM), c’est-à-dire sur la correspondance de blocs de pixels de deux images.
Les algorithmes BM, améliorés avec des contraintes de régularisation, sont à la base de beaucoup de technique d’estimation de mouvement, et permettent d’avoir des bons (souvent très bons) résultats, pour une complexité raisonnable.
Le résultat d’une opération de estimation de mouvement est un champ de vecteur de mouvement, c’est-à-dire une fonction qui associe à chaque position de l’image un vecteur, qui décrit le mouvement de l’objet en cette position.

|
Ressources dont le module dépend |
|
Exemples d’utilisation du module |
- Compression vidéo
- Analyse vidéo
- Surveillance
|
Résultats attendus |
- Connaissances : Techniques d’estimation, compromis entre qualité, débit et complexité
- Compétence : capacité de comprendre et mettre en place des algorithmes d’estimation de mouvement
- Livrable : Code java pour l’estimation de mouvement par block-matching
|
Représentation et compression de la vidéo |
proposé par :
- Marco Cagnazzo (cagnazzo@telecom-paristech.fr)
|
Descriptif |
Comme pour les images numériques, la vidéo aussi peut être représentée sous des formats variés:
- Formats non compressés (YUV 4:4:4, YUV 4:2:0, …)
- Formats compressés (MPEG-1, MPEG-2, MPEG-4, H.264, …)
- Résolutions et débits d’images différents
Les formats non-compressés n’ont pas de dégradation de qualité, mais leur taille est énorme : 1 heure de vidéo non-compressée à résolution HD nécessite de environ 400 Go.
Des nombreux formats existent, permettant de gérer les compromis entre plusieurs critères importants :
- La qualité de la vidéo (subjective ou objective)
- Le débit (c’est-à-dire la taille en octets)
- La complexité de la technique de codage
- La robustesse par rapport aux pertes de données
- Le retard imposé par le système de codage/décodage
Ce module permettra de connaître les éléments de base des techniques de compression, ainsi que les formats vidéo les plus communs. Un autre module est proposé pour les problématiques liées à l’estimation du mouvement dans une vidéo. |
Ressources dont le module dépend |
- A. Bovik. Handbook of Image and Video Processing. Academic Press
- Gonzales, Woods. Digital Image Processing. Prentice Hall.
- Module de représentation des images
- Cours de compression dans l’UE SI350
- Librairies Java
|
Exemples d’utilisation du module |
- Utilisation : en tout module portant sur la vidéo
- Vidéo conférence, appels vidéo
- Streaming vidéo
- TNT
- DVD, Blu-ray Discs
|
Résultats attendus |
- Connaissances : Formats MPEG, H.264, compromis entre qualité, taille, robustesse, complexité, retard
- Compétence : capacité de lire et manipuler des vidéo dans les formats les plus communs
- Livrable : Code java pour la lecture/écriture de la vidéo en formats différents (transcoding)
|
Expert : Béatrice Pesquet Popescu
Une vidéo peut être restreinte à une séquence d’images. L’analyse de la scène imagée comprend la détection, l’identification et la caractérisation des objets présents et de leurs mouvements. La caméra induit elle-aussi un mouvement des objets d’une image à l’autre dans la séquence. Dans ce mini-cours d’introduction, Béatrice Pesquet propose une initiation à l’analyse du mouvement.
Le site pédagogique de PACT