00.Research.tex 4.5 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960
  1. \section{La base de données d'images}
  2. Cette partie sera consacrée à la présentation des différents travaux réalisés dans le cadre de la première année de thèse. La majorité des travaux ne donnant pas de résultats unanime, chaque approche sera donc détaillée pour mettre en avant ses avantages, ses inconvénients, les raisons pour lesquelles l'approche n'est pas forcément concluante pour enfin s'ouvrir à de nouveaux axes et méthodes d'applications.
  3. \vspace{2mm}
  4. \noindent
  5. Pour l'ensemble des travaux réalisés durant cette première année, l'image de taille $800 \times 800$ a été decoupée en 16 zones de $200 \times 200$ (voir Fig. \ref{03_Research_00__image_noise_process}). C'est ensuite une zone qui est traitée pour extraction des informations caractérisant le bruit présent dans le celui-ci. La première partie de la thèse porte donc sur cette étape du processus de classification.
  6. \begin{figure}
  7. \centering
  8. \includegraphics[width=\linewidth]{03.Research/00.Research/image_noise_process.png}
  9. \caption[Découpage de l'image d'une scène pour traitement]{Découpage de l'image d'une scène pour extraction des caractéristiques des zones de celle-ci}
  10. \label{03_Research_00__image_noise_process}
  11. \end{figure}
  12. \vspace{2mm}
  13. \noindent
  14. Une base de données d'images a été développée, elle contient 9 scènes ainsi que les seuils perceptifs prelevés lors d'expérience pour chaque zone d'une scène. Chaque sujet de l'expérience devait partir de l'image la plus bruitée augmenter la qualité (nombre d'échantillons) de chaque zone pour se rapprocher au maximum de l'image de référence (image obtenue avec le plus grand nombre d'échantillons). La Fig. \ref{03_Research_00__database_construction} présente la manière dont chaque zone des différentes images (nombre d'échantillons) sont labelisés.
  15. \begin{figure}
  16. \centering
  17. \includegraphics[width=\linewidth]{03.Research/00.Research/database_construction.png}
  18. \caption[Extraction de seuil perceptif pour une zone de la scène]{Le seuil perceptif est identifié par la moyenne des scores obtenus sur les sujets de l'expérience. Les images situées avant ce seuil perceptif sont considérées comme bruitées, celles situés après, comme non bruitées.}
  19. \label{03_Research_00__database_construction}
  20. \end{figure}
  21. \vspace{2mm}
  22. \noindent
  23. Dans le cadre de ses premières expériences, uniquement les scènes issues du moteur de rendu Maxwell ont été selectionnées :
  24. \begin{itemize}
  25. \item Appart1opt02
  26. \item Bureau1
  27. \item SdbCentre
  28. \item SdbDroite
  29. \end{itemize}
  30. \vspace{2mm}
  31. \noindent
  32. Le processus de génération des données utilisées pour création des bases d'apprentissage, de validation et de test pour le modèle mathématique choisi est détaillé dans la Fig. \ref{03_Research_00__dataset_generation}. Ce processus vient de l'hypothèse que chaque zone est traitée indépendamment de la scène. Plutôt que d'utiliser 3 scènes en apprentissage et une en test, la sélection de $z$ zones pour former la base d'apprentissage sont réalisées aléatoirement avec $z \in [4, 6, 8, 10, 12]$. Les zones restantes seront alors utilisées pour les bases de validation et de test du modèle.
  33. \begin{figure}
  34. \centering
  35. \includegraphics[width=0.8\linewidth]{03.Research/00.Research/dataset_generation.png}
  36. \caption[Processus de génération des bases d'apprentissage, de validation et de test]{Dans cet exemple, 6 zones ont été sélectionnées pour la base d'apprentissage. Un équilibrage des classes est réalise pour ne pas biaiser le modèle lors de l'apprentissage puis la répartition des différentes bases est effectuée.}
  37. \label{03_Research_00__dataset_generation}
  38. \end{figure}
  39. \vspace{2mm}
  40. \noindent
  41. Afin de mesurer l'importance de la séparabilité des données à partir du seuil, 3 manières de construire les données finales ont été abordées :
  42. \begin{itemize}
  43. \item \textbf{all} : consitant à prendre l'ensemble des données.
  44. \item \textbf{center} : consistant à ne prendre que les images à échantillons proche de 150 du seuil estimé de la zone.
  45. \item \textbf{split} : les données non sélectionnées par la seconde (données fortement extérieur au seuil).
  46. \end{itemize}
  47. \vspace{2mm}
  48. \noindent
  49. Enfin, la comparaison des performances de modèles se fera via le score AUC - ROC (Area Under The Curve Receiver Operating Characteristics) sur la base de test. Il permet de mesurer la performance d'un modèle pour un problème de classification, plus particulièrement à quel point il arrive a bien séparer les classes du problème.