Version 12 - Historique - P14AB08 Implantation d'un encodeur vidéo MJPEG sur RX64M - Polytech Projets Ge - Forge Polytech

P14AB08 Implantation d'un encodeur vidéo MJPEG sur RX64M » Historique » Version 12

Anonyme, 07/04/2021 11:56

-Anonyme
+h1=. P14AB08 Implantation d'un encodeur vidéo MJPEG sur RX64M
 p=. !https://forge.clermont-universite.fr/attachments/download/16158/P14AB08_renesas82_20140409101105_20140409101131.jpeg!
 ---
 *Projet GE2-GE3 2014*
 *Entreprise / Client* : Renesas Electronics/ Sébastien Walger
 *Auteurs* : Clément Leyssene / Geoffrey Raynal
 *Responsable Projet* : Michel James
 *Tuteur industriel* : Isabelle Goi
-Anonyme
+h1=.  Sommaire
 Anonyme
 [[1. Résumé]]
 [[2. Abstract]]
 [[3. Introduction]]
 [[4. Présentation du Sujet]]
 p(((. [[1. Renesas]]
 [[2. Le projet]]
 [[5. Cahier des Charges]]
 [[6. Developpement]]
 p(((. [[1. Problématiques]]
         [[2. Faisabilité]]
         [[3. Etude Théorique]]
         [[4. Solutions]]
 [[7. Gestion de Projet]]
 p(((. [[1. W.B.S.]]
 [[2. Gantt]]
 [[8. Notes d'application]]
 p(((. [[1. sujet 1]]
 [[2. sujet 2]]
 [[9. Bilan]]
 p(((. [[1. Etat d'avancement]]
 [[2. Analyse Critique]]
 [[3. Perspectives]]
-Anonyme
+[[10. Bibliographie]]
 Anonyme
 ---
 h1=. Résumé
 Ce projet concerne la réalisation d'un encodeur vidéo de type Motion-JPEG sur un microcontrôleur Renesas, le RX64M. Cette entreprise souhaite la réalisation d’un tel projet afin de démontrer les performances de leur nouveau microcontrôleur et pouvoir proposer au client des applications fonctionnelles.
 Pour ce projet nous disposons d'une carte possédant le microcontrôleur, qui sera relié d'un côté à une caméra et de l'autre à un ordinateur.
 L’objectif sera d’envoyer un flux vidéo de la caméra vers le microcontrôleur qui traitera les données et les encodera, puis ce dernier enverra ces données vers un ordinateur qui affichera la vidéo à l’écran.
 *Mots clés:
 RX64M
 MJPEG
 Encodage JPEG*
 ---
 h1=. Abstract
 This project involves the implementation of a video encoder type Motion-JPEG on a Renesas microcontroler, the RX64M. The company wants the realization of such a project to demonstrate the performance of their new microcontroller and to be able to offer the customer functional applications.
 In this project we have a board with the RX64M microcontroller, which is connected on one side to a camera and a computer to the other.
 The objective is to send a video stream from the camera to the microcontroller, which will process the data and encode, then it will send the data to a computer that displays the video on the screen.
 *Key words:
 RX64M
 MJPEG
 JPEG Encoding*
 ---
 h1=. Introduction
 En 1 heure, 6000h de vidéo sont postées sur le site YouTube?. Une heure de vidéo non compressée en haute définition sans son a une taille de 625 Gio, soit 78 DVD. Le problème est donc de pouvoir réaliser des vidéos qui puissent être stockées sur des supports tels que les CD, les DVD, ou plus récemment, dans nos téléphones portables. C'est dans cette problématique que les encodages vidéos sont apparus, certains sont utilisés pour que la qualité de la vidéo soit excellente et d'autres pour réduire au maximum la taille du fichier.
 Dans le cadre de la formation de Génie électrique à Polytech, les étudiants ingénieurs ont l'opportunité de réaliser un projet industriel, répartie en deux phases. La première étape se déroule lors de la quatrième année pendant une durée de 48H, qui consiste en une phase d'étude avec la faisabilité, la gestion de projet et les recherches liées au projet. Par la suite, lors de la cinquième et dernière année, une phase de 250h permet de concrétiser le travail de quatrième année et de réaliser ce qui a été demandé dans le cahier des charges. Ces projets industriels permettent aux étudiants de se confronter au monde de l'entreprise à leur futur travail d'ingénieur, mais en restant encadré par des enseignants du milieu génie électrique ainsi que par des tuteurs industriels.
 La société Renesas Electronics, représentée par notre client Sébastien Walger, a récemment développé un nouveau microcontrôleur, le RX64M et souhaite pouvoir présenter à ses clients des applications fonctionnelles de cette nouvelle cible, afin de démontrer les performances de leur microcontrôleur. C'est dans cette perspective que Renesas a confié à Polytech le projet de réaliser cette application. Notre objectif est d’implanter sur cette cible Renesas RX64M des algorithmes d’encodage MJPEG en utilisant un flux vidéo provenant d’une caméra, puis de l'envoyer sur un ordinateur qui décodera et affichera à l'écran le résultat.
 L’enjeu de ce projet est de réussir à implanter un encodeur complexe et volumineux sur une cible beaucoup moins puissante qu’un ordinateur.
 h1=. Présentation du Sujet
 *%{color:red}+1. Renesas+%*
 Anonyme
 p<. !https://forge.clermont-universite.fr/attachments/download/16159/P14AB08_Renesas_blue_20140401171140_20140401171202.png!
 Renesas Electronics est une entreprise japonaise basée à Tokyo créé en novembre 2002 de la fusion d’HITACHI Ltd et de MITSUBISHI ELECTRIC CORPORATION et compte près de 28500 salariés à travers le monde. Cette société est le leader mondial des fournisseurs de microcontrôleurs et est un fournisseur de solutions de semi-conducteurs avancés. Il assure également la conception, fabrication, vente et service après-vente des systèmes de semi-conducteurs pour la téléphonie mobile, l’automobile, l’électronique de puissance, les mémoires, les LCD, les circuits intégrés RF et système sur puce.
 *%{color:red}+2. Le projet+%*
 Notre projet est d'utiliser le microcontrôleur fourni par Renesas, le RX64M, pour encoder le flux vidéo provenant d'une caméra en MJPEG, puis de le transférer via liaison filaire sur un ordinateur qui décompressera la vidéo pour l'afficher à l'écran
-Anonyme
+*%{color:#00008B}+2.1 Synoptique général du sujet+%*
 p<. !https://forge.clermont-universite.fr/attachments/download/16160/P14AB08_synoptique_20140401173233_20140404082959.png!
 *%{color:#00008B}+2.2 Pourquoi encoder?+%*
 Nous pouvons nous poser de ce besoin d'encoder, en effet pourquoi ne pas envoyer tout simplement le flux vidéo de la caméra vers l'ordinateur ?
 En regardant les spécifications de la caméra, nous nous rendons compte qu'elle a une résolution de 640*480 pixels, de trois couleurs pour chaque pixel réparti sur 8 bits avec un débit maximal de 30 images par seconde.
 Nous obtenons donc un flux de 640*480*3*8*30=221184000 bits/s= 221,2 Mbit/s, ce flux sature le protocole USB.2 qui est limité à 175Mbits/s, d'où cette nécessité de réduire la taille du flux vidéo en le compressant. Nous allons par la suite présenter la méthode d'encodage que nous devons utiliser.
 *%{color:#00008B}+2.3 Définition des termes du sujet+%*
 *+2.2.1 Le MJPEG+*
 Motion JPEG (M-JPEG ou MJPEG) est un format vidéo dans lequel chaque image vidéo ou une séquence vidéo numérique est compressé séparément comme une image JPEG. Initialement développé pour les applications PC multimédias, M-JPEG est maintenant utilisé par les appareils de capture vidéo, tels que des appareils photo numériques, caméras IP, et des webcams. Nous allons donc nous intéresser lors de ce projet au fonctionnement de l'encodage JPEG.
 *+2.2.2 L'encodage JPEG+*
 JPEG est l’acronyme de Joint Photographic Experts Group. Il a été développé par un comité d'expert qui édite des normes de compression pour l’image fixe durant les années 1978 à 1980. Le groupe JPEG a spécifié la norme en 1991. La norme officielle et définitive a été adoptée en 1992.
 La compression JPEG permet de réaliser des compressions d'image avec ou sans perte: -avec pertes ou compression irréversibles. C’est le JPEG « classique ». Il permet des taux de compression de 3 à 100.
 -sans pertes ou compression réversible. Il n’y a pas de pertes d’information et il est donc possible de revenir aux valeurs originales de l’image. Les gains en termes de compression sont alors plus modestes, avec un taux de compression de l’ordre de 2 à 8.
 Pour les besoins du projet, nous allons utiliser la première méthode afin de réduire au maximum la taille des images et donc de la vidéo.
 Voici comment s'organise le processus de compression et de décompression d'une image JPEG:
 Anonyme
 p=. !https://forge.clermont-universite.fr/attachments/download/16161/P14AB08_organigramme_compression_20140404090556_20140404090606.png!
 Les différentes étapes de cet algorithme seront expliquées plus en détail dans la partie étude théorique.
 ---
 h1=. Cahier des Charges
 - Réaliser un encodeur JPEG sur un microcontrôleur RX64M
 - Récupérer le flux vidéo d’une caméra via une liaison parallèle
 - Transférer le flux compressé du RX64M vers un ordinateur via liaison filaire
 - Afficher la vidéo en utilisant la fonction streaming de VLC
 - Si le temps le permet, remplacer la liaison filaire par un protocole Ethernet
 Anonyme
 p=. !https://forge.clermont-universite.fr/attachments/download/16162/P14AB08_cahier_des_charges_20140424152344_20140424152415.png!
 ---
 h1=. Développement
 ---
 h2<. Problématique
 Le projet comporte deux aspects importants, le transport de données d’un point à un autre et l’implémentation d’un algorithme complexe dans un appareil beaucoup moins puissant qu’un microprocesseur d’ordinateur.
 D’une part il s’agit de transférer une vidéo ou une suite d’image de la carte du microcontrôleur vers l’ordinateur à une vitesse suffisante pour que l’image retransmise ne soit pas saccadée.
 D’autre part l’encodeur d’image JPEG est un code complexe qui existe depuis environ 30 ans et qui a été optimisé depuis pour être utilisé principalement sur les ordinateurs. Il y a donc une réelle difficulté à adapter ce code sur la cible qui nous est fournie.
 ---
 h2<. Faisabilité
 Après réflexion, nous avons pensé que le projet serait réalisable si le transfert de donnée par liaison filaire suffit, si ce dernier est saturé nous devrons utiliser le protocole Ethernet, il est clair que le projet ne pourrait pas être terminé si nous avons à mettre en place un tel protocole, mais il aurait des chances d'être terminé si le client nous fournit les codes permettant d'utiliser le protocole Ethernet.
 ---
 h2<. Etude Théorique
 Comme dit précédemment, pour réaliser l'encodage MJPEG, il faut traiter le flux vidéo comme une succession d'images JPEG.
 Pour cela, il faut décomposer les différentes étapes de ce processus. Dans un premier temps, il s’agit de séparer l'image en blocs de 8x8 pixels. La caméra a une résolution de 640x480 pixel, ce qui nous donne 4800 blocs à traiter. Les parties transformations des couleurs et sous échantillonnage sont déjà réalisées par la caméra qui envoie le flux vidéo en YCbCr, le signal Y correspond à la luminance (noir et blanc), plus deux informations de chrominance : Cb (bleu moins Y) et Cr (rouge moins Y), le signal Y est composé de la somme des couleurs rouge, bleu et vert.
 p(((. P14AB08_YCbCr.jpeg?
 Des équations permettent de calculer les YCbCr à partir des couleurs RVB:
 Y= 0,299*R + 0,587*G + 0,114*B
 Cb= -0,1687*R - 0,3314*G + 0,5*B +128
 Cr= 0,5*R - 0,4187*G - 0,0813*B +128
 Pour la suite, nous allons utiliser la matrice 8x8 suivante qui correspond à un bloc d'une image:
-Anonyme
+p=. !https://forge.clermont-universite.fr/attachments/download/16163/P14AB08_matrice_initiale_20140411111753_20140411111805.png!
 h3<. +La DCT+
 L'étape suivante est la DCT (Discrete Cosine Transform, en français, transformé en cosinus discret), qui permet de supprimer les variations d'intensité dans une image comme sur la figure 4, l’image de droite est avant la DCT, il y a sur son spectre de nombreuses variations, après la transformation DCT, les variations sur le spectre sont nettement plus atténués, sans causé de différence notable avec l’image initiale. Cette transformation numérique est appliquée à chaque bloc.
 Anonyme
 p=. !https://forge.clermont-universite.fr/attachments/download/16164/P14AB08_DCT_20140409112347_20140409112359.png!
 La transformée DCT s’exprime mathématiquement par :
 Anonyme
 p=. !https://forge.clermont-universite.fr/attachments/download/16165/P14AB08_DCT_calcul_20140409112347_20140409112414.png!
 Anonyme
 p=. !https://forge.clermont-universite.fr/attachments/download/16166/P14AB08_DCT_calcul_1_20140409112347_20140409112429.png!
 Et N = nombre de pixel, ici N=8.
 On écrit ensuite dans un nouveau tableau de la même taille que N, les amplitudes de chacun des cosinus composant le signal. Ils sont classés en faisant apparaître les hautes fréquences vers le coin inférieur droit du tableau. La DCT est une opération théoriquement sans perte d'informations, mais étant donné que nous n'utilisons pas les fonctions cosinus pour nos calculs, mais des approximations de ces valeurs, il en résulte une certaine perte d'information.
 Ce qui nous permet d'obtenir en utilisant la matrice initiale:
 Anonyme
 p=. !https://forge.clermont-universite.fr/attachments/download/16167/P14AB08_matrice_DCT_20140411111753_20140411111824.png!
 La 1re valeur à l'indice (0,0) est le coefficient continu, elle correspond à une valeur "moyenne'' de la grandeur d'ensemble de la matrice d'entrée, en effet elle représente un nombre proportionnel à la somme de toutes les valeurs du signal. Les autres valeurs de la DCT représentent des écarts par rapport à cette moyenne. On remarque que les valeurs de la matrice à s'approcher de 0 lorsqu'on s'éloigne du coin supérieur gauche, c'est-à-dire lorsqu'on monte dans les plus hautes fréquences. Cela traduit le fait que l'information d'une image est concentrée dans les basses fréquences.
 NB : Comme un pixel est un bloc de 8x8 avec 3 composantes (Y, Cb, Cr), la DCT est appliquée séparément à trois blocs de 8x8:
 Le premier bloc est le bloc 8x8 qui contient la luminance.
 Le second bloc 8x8 est le bloc qui contient la valeur Cb.
 Et de même, le troisième bloc de 8x8 contient les valeurs Cr.
 Tandis que la DCT convertit l'image dans son domaine de fréquence et élimine une certaine variation, elle produit plus d'informations qu'elle en élimine: les valeurs du domaine spatial sont de -128 à 128, les valeurs de la matrice après DCT sont de -1024 à 1024. Un second procédé de compression, la quantification, est utilisé pour éliminer l'excès de ces informations.
 h3<. +La quantification+
 Après la DCT, l'image est décrite dans le domaine fréquentiel dans les moindres détails, cependant, l’œil humain ne peut pas remarquer les différents changements très lumineux ou de couleurs très sombres. La quantification permet de diminuer la précision du stockage des entiers de la matrice DCT en supprimant les hautes fréquences, ce qui permet de réduire le nombre de bits occupés par chaque entier.
 C'est l'étape où se produit le plus de perte d'information, la diminution de précision doit être plus forte dans les hautes fréquences. La perte de précision va donc être de plus en plus grande lorsqu'on s'éloigne de la position (0,0).
 Une matrice de quantification est utilisée pour cette étape, soit Q cette matrice, elle sera définie, la plupart du temps par :
 Q(i,j)= 1+K .(1+i+j ), avec i l'indice de ligne, j l'indice de colonne et K le facteur de qualité (choisi entre 1 et 25).
 On choisit une matrice de quantification avec un facteur de qualité = 2 :

Projet

Général

Profil

Polytech Projets Ge

P14AB08 Implantation d'un encodeur vidéo MJPEG sur RX64M » Historique » Version 12