Archives par mot-clé : vidéo

Module : Vidéo 3D

Vidéo 3D
proposé par :

  • Marco Cagnazzo (cagnazzo@telecom-paristech.fr)

 

Descriptif
La Vidéo 3D est un mode de communication immersive, qui donne à l’utilisateur l’impression de plus en plus réaliste « d’être dans la scène ». Cela peut être obtenu avec la vidéo stéréoscopique (deux vues), multi-vues (N>2 vues), et MVD (multi-vues plus profondeur, ou depth).Ce module permettra de connaître les formats les plus communs pour la vidéo 3D.
Ressources dont le module dépend

 

Exemples d’utilisation du module
  • Utilisation : vidéo 3D
  • Vidéo conférence 3D, appels vidéo 3D
  • TNT 3D
  • Blu-ray Discs 3D

 

Résultats attendus
  • Connaissances : Formats de vidéo 3D
  • Compétence : Capacité de lire et manipuler des vidéo dans les formats 3D
  • Livrable : Synthèse de points de vue virtuels

Module : Estimation du mouvement

Représentation et compression de la vidéo
proposé par :

  • Marco Cagnazzo (cagnazzo@telecom-paristech.fr)

Experts :

  • Li Wang, Marco Cagnazzo

 

Descriptif
L’estimation de mouvement est un outil dont l’objectif est de donner une description robuste et précise du mouvement qui existe dans une vidéo numérique.Exemples :

  •     Match de tennis : mouvement des joueurs et de la balle
  •     Film : mouvement des personnages, du fond, des objets, …

Cette définition est intuitive, mais vague. Pour avoir des algorithmes utilisables en pratique, il est nécessaire donner une formalisation mathématique au problème.

En représentant les images d’une vidéo numérique comme des matrices de nombres (qui définissent la couleur de chaque pixel), les principales méthodes d’estimation du mouvement sont basée sur le « block-matching » (BM), c’est-à-dire sur la correspondance de blocs de pixels de deux images.

Les algorithmes BM, améliorés avec des contraintes de régularisation, sont à la base de beaucoup de technique d’estimation de mouvement, et permettent d’avoir des bons (souvent très bons) résultats, pour une complexité raisonnable.

Le résultat d’une opération de estimation de mouvement est un champ de vecteur de mouvement, c’est-à-dire une fonction qui associe à chaque position de l’image un vecteur, qui décrit le mouvement de l’objet en cette position.

Ressources dont le module dépend

 

Exemples d’utilisation du module
  • Compression vidéo
  • Analyse vidéo
  • Surveillance
Résultats attendus
  • Connaissances : Techniques d’estimation, compromis entre qualité, débit et complexité
  • Compétence : capacité de comprendre et mettre en place des algorithmes d’estimation de mouvement
  • Livrable : Code java pour l’estimation de mouvement par block-matching

Module : Représentation et compression de la vidéo

Représentation et compression de la vidéo
proposé par :

  • Marco Cagnazzo (cagnazzo@telecom-paristech.fr)

 

Descriptif
Comme pour les images numériques, la vidéo aussi peut être représentée sous des formats variés:

  • Formats non compressés (YUV 4:4:4, YUV 4:2:0, …)
  • Formats compressés (MPEG-1, MPEG-2, MPEG-4, H.264, …)
  • Résolutions et débits d’images différents

Les formats non-compressés n’ont pas de dégradation de qualité, mais leur taille est énorme : 1 heure de vidéo non-compressée à résolution HD nécessite de environ 400 Go.

Des nombreux formats existent, permettant de gérer les compromis entre plusieurs critères importants :

  • La qualité de la vidéo (subjective ou objective)
  • Le débit (c’est-à-dire la taille en octets)
  • La complexité de la technique de codage
  • La robustesse par rapport aux pertes de données
  • Le retard imposé par le système de codage/décodage

Ce module permettra de connaître les éléments de base des techniques de compression, ainsi que les formats vidéo les plus communs. Un autre module est proposé pour les problématiques liées à l’estimation du mouvement dans une vidéo.

Ressources dont le module dépend
  • A. Bovik. Handbook of Image and Video Processing. Academic Press
  • Gonzales, Woods. Digital Image Processing. Prentice Hall.
  • Module de représentation des images
  • Cours de compression dans l’UE SI350
  • Librairies Java

 

Exemples d’utilisation du module
  • Utilisation : en tout module portant sur la vidéo
  • Vidéo conférence, appels vidéo
  • Streaming vidéo
  • TNT
  • DVD, Blu-ray Discs

 

Résultats attendus
  • Connaissances : Formats MPEG, H.264, compromis entre qualité, taille, robustesse, complexité, retard
  • Compétence : capacité de lire et manipuler des vidéo dans les formats les plus communs
  • Livrable : Code java pour la lecture/écriture de la vidéo en formats différents (transcoding)

Mini-Cours : Le mouvement

Expert : Béatrice Pesquet Popescu

Une vidéo peut être restreinte à une séquence d’images. L’analyse de la scène imagée comprend la détection, l’identification et la caractérisation des objets présents et de leurs mouvements. La caméra induit elle-aussi un mouvement des objets d’une image à l’autre dans la séquence.  Dans ce mini-cours d’introduction, Béatrice Pesquet propose une initiation à l’analyse du mouvement.