il y a 3 ans · 5ace7f1247
--- a/README.md
+++ b/README.md
@@ -12,31 +12,6 @@ pip install -r requirements.txt
 
																 ## Project structure
															
 
																-### Link to your dataset
															
 
																-
															
 
																-You have to create a symbolic link to your own database which respects this structure:
															
 
																-
															
 
																-- dataset/
															
 
																-  - Scene1/
															
 
																-    - zone00/
															
 
																-    - ...
															
 
																-    - zone15/
															
 
																-      - seuilExpe (file which contains threshold samples of zone image perceived by human)
															
 
																-    - Scene1_00050.png
															
 
																-    - Scene1_00070.png
															
 
																-    - ...
															
 
																-    - Scene1_01180.png
															
 
																-    - Scene1_01200.png
															
 
																-  - Scene2/
															
 
																-    - ...
															
 
																-  - ...
															
 
																-
															
 
																-Create your symbolic link:
															
 
																-
															
 
																-```
															
 
																-ln -s /path/to/your/data dataset
															
 
																-```
															
 
																-
															
 
																 ### Code architecture description
															
 
																 - **modules/\***: contains all modules usefull for the whole project (such as configuration variables)
															
@@ -127,34 +102,6 @@ All scripts named **prediction/predict_seuil_expe\*.py** are used to simulate mo
 
																 Once you have simulation done. Checkout your **threshold_map/%MODEL_NAME%/simulation\_curves\_zones\_\*/** folder and use it with help of **display_simulation_curves.py** script.
															
 
																-
															
 
																-## Use with Calculco (OAR service)
															
 
																-
															
 
																-The `oar.example.sh` is an example of script to run in OAR platform.
															
 
																-
															
 
																-```
															
 
																-oarsub -S oar.sh
															
 
																-```
															
 
																-
															
 
																-Check your JOB_ID
															
 
																-```
															
 
																-oarstat
															
 
																-```
															
 
																-
															
 
																-**Note:** Not forget to create symbolic link where it's necessary to logs results
															
 
																-
															
 
																-```
															
 
																-ln -s /where/to/store/you/data data
															
 
																-ln -s /where/to/store/you/results/ results
															
 
																-ln -s /where/to/store/you/models_info models_info
															
 
																-ln -s /where/to/store/you/saved_models saved_models
															
 
																-```
															
 
																-
															
 
																-or simply use this script:
															
 
																-```
															
 
																-bash generate_symlinks.sh /where/to/store/you
															
 
																-```
															
 
																-
															
 
																 ## License
															
 
																 [MIT](https://github.com/prise-3d/Thesis-NoiseDetection-CNN/blob/master/LICENSE)
															
--- a/cnn_models.py
+++ b/cnn_models.py
@@ -2,11 +2,12 @@
 
																 import sys
															
 
																 # model imports
															
 
																-from keras.preprocessing.image import ImageDataGenerator
															
 
																+# from keras.preprocessing.image import ImageDataGenerator
															
 
																 from keras.models import Sequential, Model
															
 
																 from keras.layers import Conv2D, MaxPooling2D, AveragePooling2D, Conv3D, MaxPooling3D, AveragePooling3D
															
 
																 from keras.layers import Activation, Dropout, Flatten, Dense, BatchNormalization
															
 
																-from keras.applications.vgg19 import VGG19
															
 
																+from tensorflow.keras import regularizers
															
 
																+# from keras.applications.vgg19 import VGG19
															
 
																 from keras import backend as K
															
 
																 import tensorflow as tf
															
@@ -35,35 +36,37 @@ def generate_model_2D(_input_shape):
 
																     model.add(Flatten())
															
 
																-    model.add(Dense(140))
															
 
																-    model.add(Activation('relu'))
															
 
																     model.add(BatchNormalization())
															
 
																     model.add(Dropout(0.5))
															
 
																+    model.add(Activation('relu'))
															
 
																-    # model.add(Dense(120))
															
 
																-    # model.add(Activation('sigmoid'))
															
 
																-    # model.add(BatchNormalization())
															
 
																-    # model.add(Dropout(0.5))
															
 
																+    model.add(Dense(256, 
															
 
																+        kernel_regularizer=regularizers.l1_l2(l1=1e-5, l2=1e-4),
															
 
																+        bias_regularizer=regularizers.l2(1e-4),
															
 
																+        activity_regularizer=regularizers.l2(1e-5)))
															
 
																-    model.add(Dense(80))
															
 
																-    model.add(Activation('relu'))
															
 
																     model.add(BatchNormalization())
															
 
																     model.add(Dropout(0.5))
															
 
																-
															
 
																-    model.add(Dense(40))
															
 
																     model.add(Activation('relu'))
															
 
																-    model.add(BatchNormalization())
															
 
																-    model.add(Dropout(0.5))
															
 
																-    model.add(Dense(20))
															
 
																-    model.add(Activation('relu'))
															
 
																+    model.add(Dense(64, 
															
 
																+        kernel_regularizer=regularizers.l1_l2(l1=1e-5, l2=1e-4),
															
 
																+        bias_regularizer=regularizers.l2(1e-4),
															
 
																+        activity_regularizer=regularizers.l2(1e-5)))
															
 
																+
															
 
																     model.add(BatchNormalization())
															
 
																     model.add(Dropout(0.5))
															
 
																+    model.add(Activation('relu'))
															
 
																+
															
 
																+    model.add(Dense(20, 
															
 
																+        kernel_regularizer=regularizers.l1_l2(l1=1e-5, l2=1e-4),
															
 
																+        bias_regularizer=regularizers.l2(1e-4),
															
 
																+        activity_regularizer=regularizers.l2(1e-5)))
															
 
																     model.add(Dense(2))
															
 
																     model.add(Activation('softmax'))
															
 
																-    model.compile(loss='categorical_crossentropy',
															
 
																+    model.compile(loss='binary_crossentropy',
															
 
																                   optimizer='adam',
															
 
																                   #metrics=['accuracy', metrics.auc])
															
 
																                   metrics=['accuracy'])
															
@@ -77,45 +80,47 @@ def generate_model_3D(_input_shape):
 
																     print(_input_shape)
															
 
																-    model.add(Conv3D(200, (1, 3, 3), input_shape=_input_shape))
															
 
																+    model.add(Conv3D(60, (1, 3, 3), input_shape=_input_shape))
															
 
																     model.add(Activation('relu'))
															
 
																     model.add(MaxPooling3D(pool_size=(1, 2, 2)))
															
 
																-    model.add(Conv3D(100, (1, 3, 3)))
															
 
																+    model.add(Conv3D(40, (1, 3, 3)))
															
 
																     model.add(Activation('relu'))
															
 
																     model.add(MaxPooling3D(pool_size=(1, 2, 2)))
															
 
																-    model.add(Conv3D(40, (1, 3, 3)))
															
 
																+    model.add(Conv3D(20, (1, 3, 3)))
															
 
																     model.add(Activation('relu'))
															
 
																     model.add(MaxPooling3D(pool_size=(1, 2, 2)))
															
 
																     model.add(Flatten())
															
 
																-    model.add(Dense(256))
															
 
																-    model.add(Activation('relu'))
															
 
																     model.add(BatchNormalization())
															
 
																     model.add(Dropout(0.5))
															
 
																-
															
 
																-    model.add(Dense(128))
															
 
																     model.add(Activation('relu'))
															
 
																-    model.add(BatchNormalization())
															
 
																-    model.add(Dropout(0.5))
															
 
																-    model.add(Dense(64))
															
 
																-    model.add(Activation('relu'))
															
 
																+    model.add(Dense(64, 
															
 
																+        kernel_regularizer=regularizers.l1_l2(l1=1e-5, l2=1e-4),
															
 
																+        bias_regularizer=regularizers.l2(1e-4),
															
 
																+        activity_regularizer=regularizers.l2(1e-5)))
															
 
																+        
															
 
																     model.add(BatchNormalization())
															
 
																     model.add(Dropout(0.5))
															
 
																-
															
 
																-    model.add(Dense(20))
															
 
																     model.add(Activation('relu'))
															
 
																+
															
 
																+    model.add(Dense(20, 
															
 
																+        kernel_regularizer=regularizers.l1_l2(l1=1e-5, l2=1e-4),
															
 
																+        bias_regularizer=regularizers.l2(1e-4),
															
 
																+        activity_regularizer=regularizers.l2(1e-5)))
															
 
																+        
															
 
																     model.add(BatchNormalization())
															
 
																     model.add(Dropout(0.5))
															
 
																+    model.add(Activation('relu'))
															
 
																     model.add(Dense(2))
															
 
																     model.add(Activation('sigmoid'))
															
 
																-    model.compile(loss='categorical_crossentropy',
															
 
																-                  optimizer='rmsprop',
															
 
																+    model.compile(loss='binary_crossentropy',
															
 
																+                  optimizer='adam',
															
 
																                   #metrics=['accuracy', metrics.auc])
															
 
																                   metrics=['accuracy'])
															
@@ -123,7 +128,7 @@ def generate_model_3D(_input_shape):
 
																 # using transfer learning (VGG19)
															
 
																-def generate_model_3D_TL(_input_shape):
															
 
																+'''def generate_model_3D_TL(_input_shape):
															
 
																     # load pre-trained model
															
 
																     model = VGG19(weights='imagenet', include_top=False, input_shape=_input_shape)
															
@@ -134,7 +139,7 @@ def generate_model_3D_TL(_input_shape):
 
																     for layer in model.layers[:5]:
															
 
																         layer.trainable = False
															
 
																-    '''predictions_model = Sequential(model)
															
 
																+    predictions_model = Sequential(model)
															
 
																     predictions_model.add(Flatten(model.output))
															
@@ -164,7 +169,7 @@ def generate_model_3D_TL(_input_shape):
 
																     predictions_model.add(Dropout(0.5))
															
 
																     predictions_model.add(Dense(1))
															
 
																-    predictions_model.add(Activation('sigmoid'))'''
															
 
																+    predictions_model.add(Activation('sigmoid'))
															
 
																     # adding custom Layers 
															
 
																     x = model.output
															
@@ -191,16 +196,16 @@ def generate_model_3D_TL(_input_shape):
 
																                 #   metrics=['accuracy', metrics.auc])
															
 
																                   metrics=['accuracy'])
															
 
																-    return model_final
															
 
																+    return model_final'''
															
 
																 def get_model(n_channels, _input_shape, _tl=False):
															
 
																-    if _tl:
															
 
																-        if n_channels == 3:
															
 
																-            return generate_model_3D_TL(_input_shape)
															
 
																-        else:
															
 
																-            print("Can't use transfer learning with only 1 channel")
															
 
																+    # if _tl:
															
 
																+    #     if n_channels == 3:
															
 
																+    #         return generate_model_3D_TL(_input_shape)
															
 
																+    #     else:
															
 
																+    #         print("Can't use transfer learning with only 1 channel")
															
 
																     if n_channels == 1:
															
 
																         return generate_model_2D(_input_shape)
															
--- a/custom_config.py
+++ b/custom_config.py
@@ -1,9 +1,5 @@
 
																-from modules.config.cnn_config import *
															
 
																-
															
 
																 import os
															
 
																-# store all variables from cnn config
															
 
																-context_vars = vars()
															
 
																 # Custom config used for redefined config variables if necessary
															
@@ -16,8 +12,8 @@ output_zones_learned            = os.path.join(output_data_folder, 'learned_zone
 
																 output_models                   = os.path.join(output_data_folder, 'saved_models')
															
 
																 output_results_folder           = os.path.join(output_data_folder, 'results')
															
 
																-## noisy_folder                    = 'noisy'
															
 
																-## not_noisy_folder                = 'notNoisy'
															
 
																+noisy_folder                    = 'noisy'
															
 
																+not_noisy_folder                = 'notNoisy'
															
 
																 backup_model_folder             = os.path.join(output_data_folder, 'models_backup')
															
 
																 # file or extensions
															
@@ -30,7 +26,7 @@ results_filename                = 'results.csv'
 
																 perf_train_header_file          = "model_name;global_train_size;global_test_size;filtered_train_size;filtered_test_size;f1_train;f1_test;recall_train;recall_test;presicion_train;precision_test;acc_train;acc_test;roc_auc_train;roc_auc_test;\n"
															
 
																 perf_prediction_header_file    = "data;data_size;model_name;accucary;f1;recall;precision;roc;\n"
															
 
																-features_choices_labels         = ['static', 'svd_reconstruction', 'fast_ica_reconstruction', 'ipca_reconstruction', 'min_diff_filter', 'sobel_based_filter','nl_mean_noise_mask']
															
 
																+features_choices_labels         = ['static', 'svd_reconstruction', 'svd_reconstruction_dyn', 'fast_ica_reconstruction', 'ipca_reconstruction', 'min_diff_filter', 'sobel_based_filter','nl_mean_noise_mask', 'gini_map']
															
 
																 # parameters
															
@@ -39,4 +35,8 @@ keras_epochs                    = 30
 
																 ## keras_batch                     = 32
															
 
																 ## val_dataset_size                = 0.2
															
 
																-keras_img_size                  = (200, 200)
															
 
																+keras_img_size                  = (200, 200)
															
 
																+
															
 
																+# parameters
															
 
																+scene_image_quality_separator     = '_'
															
 
																+scene_image_extension             = '.png'
															
--- a/generate/generate_dataset.py
+++ b/generate/generate_dataset.py
@@ -1,265 +0,0 @@
 
																-#!/usr/bin/env python3
															
 
																-# -*- coding: utf-8 -*-
															
 
																-"""
															
 
																-Created on Wed Jun 19 11:47:42 2019
															
 
																-
															
 
																-@author: jbuisine
															
 
																-"""
															
 
																-
															
 
																-# main imports
															
 
																-import sys, os, argparse
															
 
																-import numpy as np
															
 
																-import random
															
 
																-
															
 
																-# images processing imports
															
 
																-from PIL import Image
															
 
																-from ipfml.processing.segmentation import divide_in_blocks
															
 
																-
															
 
																-# modules imports
															
 
																-sys.path.insert(0, '') # trick to enable import of main folder module
															
 
																-
															
 
																-import custom_config  as cfg
															
 
																-from modules.utils import data as dt
															
 
																-from modules.classes.Transformation import Transformation
															
 
																-
															
 
																-# getting configuration information
															
 
																-zone_folder             = cfg.zone_folder
															
 
																-learned_folder          = cfg.learned_zones_folder
															
 
																-min_max_filename        = cfg.min_max_filename_extension
															
 
																-
															
 
																-# define all scenes values
															
 
																-scenes_list             = cfg.scenes_names
															
 
																-scenes_indices          = cfg.scenes_indices
															
 
																-dataset_path            = cfg.dataset_path
															
 
																-zones                   = cfg.zones_indices
															
 
																-seuil_expe_filename     = cfg.seuil_expe_filename
															
 
																-
															
 
																-features_choices        = cfg.features_choices_labels
															
 
																-output_data_folder      = cfg.output_data_folder
															
 
																-
															
 
																-generic_output_file_svd = '_random.csv'
															
 
																-
															
 
																-def generate_data_model(_filename, _transformations, _scenes_list, _nb_zones = 4, _random=0):
															
 
																-
															
 
																-    output_train_filename = _filename + ".train"
															
 
																-    output_test_filename = _filename + ".test"
															
 
																-
															
 
																-    if not '/' in output_train_filename:
															
 
																-        raise Exception("Please select filename with directory path to save data. Example : data/dataset")
															
 
																-
															
 
																-    # create path if not exists
															
 
																-    if not os.path.exists(output_data_folder):
															
 
																-        os.makedirs(output_data_folder)
															
 
																-
															
 
																-    zones_indices = zones
															
 
																-
															
 
																-    train_file_data = []
															
 
																-    test_file_data  = []
															
 
																-
															
 
																-    scenes = os.listdir(dataset_path)
															
 
																-    # remove min max file from scenes folder
															
 
																-    scenes = [s for s in scenes if min_max_filename not in s]
															
 
																-
															
 
																-    # go ahead each scenes
															
 
																-    for folder_scene in _scenes_list:
															
 
																-
															
 
																-        scene_path = os.path.join(dataset_path, folder_scene)
															
 
																-
															
 
																-        # shuffle list of zones (=> randomly choose zones)
															
 
																-        # only in random mode
															
 
																-        if _random:
															
 
																-            random.shuffle(zones_indices)
															
 
																-
															
 
																-         # store zones learned
															
 
																-        learned_zones_indices = zones_indices[:_nb_zones]
															
 
																-
															
 
																-        # write into file
															
 
																-        folder_learned_path = os.path.join(learned_folder, _filename.split('/')[1])
															
 
																-
															
 
																-        if not os.path.exists(folder_learned_path):
															
 
																-            os.makedirs(folder_learned_path)
															
 
																-
															
 
																-        file_learned_path = os.path.join(folder_learned_path, folder_scene + '.csv')
															
 
																-
															
 
																-        with open(file_learned_path, 'w') as f:
															
 
																-            for i in learned_zones_indices:
															
 
																-                f.write(str(i) + ';')
															
 
																-
															
 
																-        for id_zone, index_folder in enumerate(zones_indices):
															
 
																-
															
 
																-            index_str = str(index_folder)
															
 
																-            if len(index_str) < 2:
															
 
																-                index_str = "0" + index_str
															
 
																-            
															
 
																-            current_zone_folder = "zone" + index_str
															
 
																-            zone_path = os.path.join(scene_path, current_zone_folder)
															
 
																-
															
 
																-            # custom path for interval of reconstruction and metric
															
 
																-
															
 
																-            features_path = []
															
 
																-
															
 
																-            for transformation in _transformations:
															
 
																-                
															
 
																-                # check if it's a static content and create augmented images if necessary
															
 
																-                if transformation.getName() == 'static':
															
 
																-                    
															
 
																-                    # {sceneName}/zoneXX/static
															
 
																-                    static_metric_path = os.path.join(zone_path, transformation.getName())
															
 
																-
															
 
																-                    # img.png
															
 
																-                    image_name = transformation.getParam().split('/')[-1]
															
 
																-
															
 
																-                    # {sceneName}/zoneXX/static/img
															
 
																-                    image_prefix_name = image_name.replace('.png', '')
															
 
																-                    image_folder_path = os.path.join(static_metric_path, image_prefix_name)
															
 
																-                    
															
 
																-                    if not os.path.exists(image_folder_path):
															
 
																-                        os.makedirs(image_folder_path)
															
 
																-
															
 
																-                    features_path.append(image_folder_path)
															
 
																-
															
 
																-                    # get image path to manage
															
 
																-                    # {sceneName}/static/img.png
															
 
																-                    transform_image_path = os.path.join(scene_path, transformation.getName(), image_name) 
															
 
																-                    static_transform_image = Image.open(transform_image_path)
															
 
																-
															
 
																-                    static_transform_image_block = divide_in_blocks(static_transform_image, cfg.sub_image_size)[id_zone]
															
 
																-
															
 
																-                    dt.augmented_data_image(static_transform_image_block, image_folder_path, image_prefix_name)
															
 
																-
															
 
																-                else:
															
 
																-                    metric_interval_path = os.path.join(zone_path, transformation.getTransformationPath())
															
 
																-                    features_path.append(metric_interval_path)
															
 
																-
															
 
																-            # as labels are same for each metric
															
 
																-            for label in os.listdir(features_path[0]):
															
 
																-
															
 
																-                label_features_path = []
															
 
																-
															
 
																-                for path in features_path:
															
 
																-                    label_path = os.path.join(path, label)
															
 
																-                    label_features_path.append(label_path)
															
 
																-
															
 
																-                # getting images list for each metric
															
 
																-                features_images_list = []
															
 
																-                    
															
 
																-                for index_metric, label_path in enumerate(label_features_path):
															
 
																-
															
 
																-                    if _transformations[index_metric].getName() == 'static':
															
 
																-                        # by default append nothing..
															
 
																-                        features_images_list.append([])
															
 
																-                    else:
															
 
																-                        images = sorted(os.listdir(label_path))
															
 
																-                        features_images_list.append(images)
															
 
																-
															
 
																-                # construct each line using all images path of each
															
 
																-                for index_image in range(0, len(features_images_list[0])):
															
 
																-                    
															
 
																-                    images_path = []
															
 
																-
															
 
																-                    # get information about rotation and flip from first transformation (need to be a not static transformation)
															
 
																-                    current_post_fix =  features_images_list[0][index_image].split(cfg.post_image_name_separator)[-1]
															
 
																-
															
 
																-                    # getting images with same index and hence name for each metric (transformation)
															
 
																-                    for index_metric in range(0, len(features_path)):
															
 
																-
															
 
																-                        # custom behavior for static transformation (need to check specific image)
															
 
																-                        if _transformations[index_metric].getName() == 'static':
															
 
																-                            # add static path with selecting correct data augmented image
															
 
																-                            image_name = _transformations[index_metric].getParam().split('/')[-1].replace('.png', '')
															
 
																-                            img_path = os.path.join(features_path[index_metric], image_name + cfg.post_image_name_separator + current_post_fix)
															
 
																-                            images_path.append(img_path)
															
 
																-                        else:
															
 
																-                            img_path = features_images_list[index_metric][index_image]
															
 
																-                            images_path.append(os.path.join(label_features_path[index_metric], img_path))
															
 
																-
															
 
																-                    if label == cfg.noisy_folder:
															
 
																-                        line = '1;'
															
 
																-                    else:
															
 
																-                        line = '0;'
															
 
																-
															
 
																-                    # compute line information with all images paths
															
 
																-                    for id_path, img_path in enumerate(images_path):
															
 
																-                        if id_path < len(images_path) - 1:
															
 
																-                            line = line + img_path + '::'
															
 
																-                        else:
															
 
																-                            line = line + img_path
															
 
																-                    
															
 
																-                    line = line + '\n'
															
 
																-
															
 
																-                    if id_zone < _nb_zones:
															
 
																-                        train_file_data.append(line)
															
 
																-                    else:
															
 
																-                        test_file_data.append(line)
															
 
																-
															
 
																-    train_file = open(output_train_filename, 'w')
															
 
																-    test_file = open(output_test_filename, 'w')
															
 
																-
															
 
																-    random.shuffle(train_file_data)
															
 
																-    random.shuffle(test_file_data)
															
 
																-
															
 
																-    for line in train_file_data:
															
 
																-        train_file.write(line)
															
 
																-
															
 
																-    for line in test_file_data:
															
 
																-        test_file.write(line)
															
 
																-
															
 
																-    train_file.close()
															
 
																-    test_file.close()
															
 
																-
															
 
																-def main():
															
 
																-
															
 
																-    parser = argparse.ArgumentParser(description="Compute specific dataset for model using of metric")
															
 
																-
															
 
																-    parser.add_argument('--output', type=str, help='output file name desired (.train and .test)')
															
 
																-    parser.add_argument('--features', type=str, 
															
 
																-                                     help="list of features choice in order to compute data",
															
 
																-                                     default='svd_reconstruction, ipca_reconstruction',
															
 
																-                                     required=True)
															
 
																-    parser.add_argument('--params', type=str, 
															
 
																-                                    help="list of specific param for each metric choice (See README.md for further information in 3D mode)", 
															
 
																-                                    default='100, 200 :: 50, 25',
															
 
																-                                    required=True)
															
 
																-    parser.add_argument('--size', type=str, 
															
 
																-                                  help="Size of input images",
															
 
																-                                  default="100, 100")
															
 
																-    parser.add_argument('--scenes', type=str, help='List of scenes to use for training data')
															
 
																-    parser.add_argument('--nb_zones', type=int, help='Number of zones to use for training data set', choices=list(range(1, 17)))
															
 
																-    parser.add_argument('--random', type=int, help='Data will be randomly filled or not', choices=[0, 1])
															
 
																-
															
 
																-    args = parser.parse_args()
															
 
																-
															
 
																-    p_filename = args.output
															
 
																-    p_features  = list(map(str.strip, args.features.split(',')))
															
 
																-    p_params   = list(map(str.strip, args.params.split('::')))
															
 
																-    p_scenes   = args.scenes.split(',')
															
 
																-    p_size     = args.size # not necessary to split here
															
 
																-    p_nb_zones = args.nb_zones
															
 
																-    p_random   = args.random
															
 
																-
															
 
																-    # create list of Transformation
															
 
																-    transformations = []
															
 
																-
															
 
																-    for id, feature in enumerate(p_features):
															
 
																-
															
 
																-        if feature not in features_choices:
															
 
																-            raise ValueError("Unknown metric, please select a correct metric : ", features_choices)
															
 
																-
															
 
																-        transformations.append(Transformation(feature, p_params[id], p_size))
															
 
																-
															
 
																-    if transformations[0].getName() == 'static':
															
 
																-        raise ValueError("The first transformation in list cannot be static")
															
 
																-
															
 
																-    # Update: not use of renderer scenes list
															
 
																-    # getting scenes from indexes user selection
															
 
																-    scenes_selected = []
															
 
																-
															
 
																-    for scene_id in p_scenes:
															
 
																-        index = scenes_indices.index(scene_id.strip())
															
 
																-        scenes_selected.append(scenes_list[index])
															
 
																-
															
 
																-    # create database using img folder (generate first time only)
															
 
																-    generate_data_model(p_filename, transformations, scenes_selected, p_nb_zones, p_random)
															
 
																-
															
 
																-if __name__== "__main__":
															
 
																-    main()
															
--- a/generate/generate_dataset_sequence_file.py
+++ b/generate/generate_dataset_sequence_file.py
@@ -18,26 +18,8 @@ from ipfml.processing.segmentation import divide_in_blocks
 
																 # modules imports
															
 
																 sys.path.insert(0, '') # trick to enable import of main folder module
															
 
																-import custom_config  as cfg
															
 
																-from modules.utils import data as dt
															
 
																-from modules.classes.Transformation import Transformation
															
 
																-
															
 
																-# getting configuration information
															
 
																-zone_folder             = cfg.zone_folder
															
 
																-learned_folder          = cfg.learned_zones_folder
															
 
																-min_max_filename        = cfg.min_max_filename_extension
															
 
																-
															
 
																-# define all scenes values
															
 
																-scenes_list             = cfg.scenes_names
															
 
																-scenes_indices          = cfg.scenes_indices
															
 
																-dataset_path            = cfg.dataset_path
															
 
																-zones                   = cfg.zones_indices
															
 
																-seuil_expe_filename     = cfg.seuil_expe_filename
															
 
																-
															
 
																-features_choices        = cfg.features_choices_labels
															
 
																-output_data_folder      = cfg.output_datasets
															
 
																-
															
 
																-generic_output_file_svd = '_random.csv'
															
 
																+import config  as cfg
															
 
																+from transformations import Transformation
															
 
																 def generate_data_model(_filename, _transformations, _dataset_folder, _selected_zones, _sequence):
															
--- a/generate/generate_reconstructed_data.py
+++ b/generate/generate_reconstructed_data.py
@@ -1,232 +0,0 @@
 
																-#!/usr/bin/env python3
															
 
																-# -*- coding: utf-8 -*-
															
 
																-"""
															
 
																-Created on Wed Jun 19 11:47:42 2019
															
 
																-
															
 
																-@author: jbuisine
															
 
																-"""
															
 
																-
															
 
																-# main imports
															
 
																-import sys, os, argparse
															
 
																-import numpy as np
															
 
																-
															
 
																-# images processing imports
															
 
																-from PIL import Image
															
 
																-from ipfml.processing.segmentation import divide_in_blocks
															
 
																-
															
 
																-# modules imports
															
 
																-sys.path.insert(0, '') # trick to enable import of main folder module
															
 
																-
															
 
																-import custom_config as cfg
															
 
																-from modules.utils.data import get_scene_image_quality
															
 
																-from modules.classes.Transformation import Transformation
															
 
																-
															
 
																-# getting configuration information
															
 
																-zone_folder             = cfg.zone_folder
															
 
																-min_max_filename        = cfg.min_max_filename_extension
															
 
																-
															
 
																-# define all scenes values
															
 
																-scenes_list             = cfg.scenes_names
															
 
																-scenes_indices          = cfg.scenes_indices
															
 
																-path                    = cfg.dataset_path
															
 
																-zones                   = cfg.zones_indices
															
 
																-seuil_expe_filename     = cfg.seuil_expe_filename
															
 
																-
															
 
																-features_choices        = cfg.features_choices_labels
															
 
																-output_data_folder      = cfg.output_data_folder
															
 
																-
															
 
																-generic_output_file_svd = '_random.csv'
															
 
																-
															
 
																-def generate_data(transformation, _scenes, _replace):
															
 
																-    """
															
 
																-    @brief Method which generates all .csv files from scenes
															
 
																-    @return nothing
															
 
																-    """
															
 
																-
															
 
																-    scenes = os.listdir(path)
															
 
																-    # remove min max file from scenes folder
															
 
																-    scenes = [s for s in scenes if min_max_filename not in s]
															
 
																-
															
 
																-    # go ahead each scenes
															
 
																-    for id_scene, folder_scene in enumerate(scenes):
															
 
																-
															
 
																-        if folder_scene in _scenes:
															
 
																-            print(folder_scene)
															
 
																-            scene_path = os.path.join(path, folder_scene)
															
 
																-
															
 
																-            # construct each zones folder name
															
 
																-            zones_folder = []
															
 
																-            features_folder = []
															
 
																-            zones_threshold = []
															
 
																-
															
 
																-            # get zones list info
															
 
																-            for index in zones:
															
 
																-                index_str = str(index)
															
 
																-                if len(index_str) < 2:
															
 
																-                    index_str = "0" + index_str
															
 
																-
															
 
																-                current_zone = "zone"+index_str
															
 
																-                zones_folder.append(current_zone)
															
 
																-                zone_path = os.path.join(scene_path, current_zone)
															
 
																-
															
 
																-                with open(os.path.join(zone_path, cfg.seuil_expe_filename)) as f:
															
 
																-                    zones_threshold.append(int(f.readline()))
															
 
																-
															
 
																-                # custom path for feature
															
 
																-                feature_path = os.path.join(zone_path, transformation.getName())
															
 
																-
															
 
																-                if not os.path.exists(feature_path):
															
 
																-                    os.makedirs(feature_path)
															
 
																-
															
 
																-                # custom path for interval of reconstruction and feature
															
 
																-                feature_interval_path = os.path.join(zone_path, transformation.getTransformationPath())
															
 
																-                features_folder.append(feature_interval_path)
															
 
																-
															
 
																-                if not os.path.exists(feature_interval_path):
															
 
																-                    os.makedirs(feature_interval_path)
															
 
																-
															
 
																-                # create for each zone the labels folder
															
 
																-                labels = [cfg.not_noisy_folder, cfg.noisy_folder]
															
 
																-
															
 
																-                for label in labels:
															
 
																-                    label_folder = os.path.join(feature_interval_path, label)
															
 
																-
															
 
																-                    if not os.path.exists(label_folder):
															
 
																-                        os.makedirs(label_folder)
															
 
																-
															
 
																-            # get all images of folder
															
 
																-            scene_images = sorted([os.path.join(scene_path, img) for img in os.listdir(scene_path) if cfg.scene_image_extension in img])
															
 
																-            number_scene_image = len(scene_images)
															
 
																-
															
 
																-            # for each images
															
 
																-            for id_img, img_path in enumerate(scene_images):
															
 
																-
															
 
																-                current_img = Image.open(img_path)
															
 
																-                img_blocks = divide_in_blocks(current_img, cfg.sub_image_size)
															
 
																-
															
 
																-                current_quality_index = int(get_scene_image_quality(img_path))
															
 
																-
															
 
																-                for id_block, block in enumerate(img_blocks):
															
 
																-
															
 
																-                    ##########################
															
 
																-                    # Image computation part #
															
 
																-                    ##########################
															
 
																-
															
 
																-                    label_path = features_folder[id_block]
															
 
																-
															
 
																-                    # get label folder for block
															
 
																-                    if current_quality_index > zones_threshold[id_block]:
															
 
																-                        label_path = os.path.join(label_path, cfg.not_noisy_folder)
															
 
																-                    else:
															
 
																-                        label_path = os.path.join(label_path, cfg.noisy_folder)
															
 
																-
															
 
																-                    # check if necessary to compute or not images
															
 
																-                    # Data augmentation!
															
 
																-                    rotations = [0, 90, 180, 270]
															
 
																-
															
 
																-                    #img_flip_labels = ['original', 'horizontal', 'vertical', 'both']
															
 
																-                    img_flip_labels = ['original', 'horizontal']
															
 
																-
															
 
																-                    output_images_path = []
															
 
																-                    check_path_exists = []
															
 
																-                    # rotate and flip image to increase dataset size
															
 
																-                    for id, flip_label in enumerate(img_flip_labels):
															
 
																-                        for rotation in rotations:
															
 
																-                            output_reconstructed_filename = img_path.split('/')[-1].replace('.png', '') + '_' + zones_folder[id_block] + cfg.post_image_name_separator
															
 
																-                            output_reconstructed_filename = output_reconstructed_filename + flip_label + '_' + str(rotation) + '.png'
															
 
																-                            output_reconstructed_path = os.path.join(label_path, output_reconstructed_filename)
															
 
																-
															
 
																-                            if os.path.exists(output_reconstructed_path):
															
 
																-                                check_path_exists.append(True)
															
 
																-                            else:
															
 
																-                                check_path_exists.append(False)
															
 
																-
															
 
																-                            output_images_path.append(output_reconstructed_path)
															
 
																-
															
 
																-                    # compute only if not exists or necessary to replace
															
 
																-                    if _replace or not np.array(check_path_exists).all():
															
 
																-                        # compute image
															
 
																-                        # pass block to grey level
															
 
																-                        output_block = transformation.getTransformedImage(block)
															
 
																-                        output_block = np.array(output_block, 'uint8')
															
 
																-                        
															
 
																-                        # current output image
															
 
																-                        output_block_img = Image.fromarray(output_block)
															
 
																-
															
 
																-                        horizontal_img = output_block_img.transpose(Image.FLIP_LEFT_RIGHT)
															
 
																-                        #vertical_img = output_block_img.transpose(Image.FLIP_TOP_BOTTOM)
															
 
																-                        #both_img = output_block_img.transpose(Image.TRANSPOSE)
															
 
																-
															
 
																-                        #flip_images = [output_block_img, horizontal_img, vertical_img, both_img]
															
 
																-                        flip_images = [output_block_img, horizontal_img]
															
 
																-
															
 
																-                        # rotate and flip image to increase dataset size
															
 
																-                        counter_index = 0 # get current path index
															
 
																-                        for id, flip in enumerate(flip_images):
															
 
																-                            for rotation in rotations:
															
 
																-
															
 
																-                                if _replace or not check_path_exists[counter_index]:
															
 
																-                                    rotated_output_img = flip.rotate(rotation)
															
 
																-                                    rotated_output_img.save(output_images_path[counter_index])
															
 
																-
															
 
																-                                counter_index +=1
															
 
																-
															
 
																-                print(transformation.getName() + "_" + folder_scene + " - " + "{0:.2f}".format(((id_img + 1) / number_scene_image)* 100.) + "%")
															
 
																-                sys.stdout.write("\033[F")
															
 
																-
															
 
																-            print('\n')
															
 
																-
															
 
																-    print("%s_%s : end of data generation\n" % (transformation.getName(), transformation.getParam()))
															
 
																-
															
 
																-
															
 
																-def main():
															
 
																-
															
 
																-    parser = argparse.ArgumentParser(description="Compute and prepare data of feature of all scenes using specific interval if necessary")
															
 
																-
															
 
																-    parser.add_argument('--features', type=str, 
															
 
																-                                     help="list of features choice in order to compute data",
															
 
																-                                     default='svd_reconstruction, ipca_reconstruction',
															
 
																-                                     required=True)
															
 
																-    parser.add_argument('--params', type=str, 
															
 
																-                                    help="list of specific param for each feature choice (See README.md for further information in 3D mode)", 
															
 
																-                                    default='100, 200 :: 50, 25',
															
 
																-                                    required=True)
															
 
																-    parser.add_argument('--size', type=str, 
															
 
																-                                help="specific size of image", 
															
 
																-                                default='100, 100',
															
 
																-                                required=True)
															
 
																-    parser.add_argument('--scenes', type=str, help='List of scenes to use for training data')
															
 
																-    parser.add_argument('--replace', type=int, help='replace previous picutre', default=1)
															
 
																-
															
 
																-    args = parser.parse_args()
															
 
																-
															
 
																-    p_features  = list(map(str.strip, args.features.split(',')))
															
 
																-    p_params    = list(map(str.strip, args.params.split('::')))
															
 
																-    p_size      = args.size
															
 
																-    p_scenes    = args.scenes.split(',')
															
 
																-    p_replace   = bool(args.replace)
															
 
																-
															
 
																-    # getting scenes from indexes user selection
															
 
																-    scenes_selected = []
															
 
																-
															
 
																-    for scene_id in p_scenes:
															
 
																-        index = scenes_indices.index(scene_id.strip())
															
 
																-        scenes_selected.append(scenes_list[index])
															
 
																-
															
 
																-    # list of transformations
															
 
																-    transformations = []
															
 
																-
															
 
																-    for id, feature in enumerate(p_features):
															
 
																-
															
 
																-        if feature not in features_choices or feature == 'static':
															
 
																-            raise ValueError("Unknown feature, please select a correct feature (`static` excluded) : ", features_choices)
															
 
																-
															
 
																-        transformations.append(Transformation(feature, p_params[id], p_size))
															
 
																-
															
 
																-    print("Scenes used", scenes_selected)
															
 
																-    # generate all or specific feature data
															
 
																-    for transformation in transformations:
															
 
																-        generate_data(transformation, scenes_selected, p_replace)
															
 
																-
															
 
																-if __name__== "__main__":
															
 
																-    main()
															
--- a/generate/generate_reconstructed_folder.py
+++ b/generate/generate_reconstructed_folder.py
@@ -13,20 +13,21 @@ import numpy as np
 
																 # images processing imports
															
 
																 from PIL import Image
															
 
																 from ipfml.processing.segmentation import divide_in_blocks
															
 
																+from transformations import Transformation
															
 
																 # modules imports
															
 
																 sys.path.insert(0, '') # trick to enable import of main folder module
															
 
																-import custom_config as cfg
															
 
																-from modules.utils.data import get_scene_image_quality
															
 
																-from modules.classes.Transformation import Transformation
															
 
																+import config as cfg
															
 
																+zones = np.arange(16)
															
 
																-# getting configuration information
															
 
																-zone_folder             = cfg.zone_folder
															
 
																+def get_scene_image_quality(img_path):
															
 
																-# define all scenes values
															
 
																-zones                   = cfg.zones_indices
															
 
																-features_choices        = cfg.features_choices_labels
															
 
																+    # if path getting last element (image name) and extract quality
															
 
																+    img_postfix = img_path.split('/')[-1].split(cfg.scene_image_quality_separator)[-1]
															
 
																+    img_quality = img_postfix.replace(cfg.scene_image_extension, '')
															
 
																+
															
 
																+    return int(img_quality)
															
 
																 '''
															
 
																 Display progress information as progress bar
															
@@ -195,8 +196,8 @@ def generate_data(transformation, _dataset_path, _output, _human_thresholds, _re
 
																                         filename_parts = filename.split('_')
															
 
																                         # get samples : `00XXX`
															
 
																-                        n_samples = filename_parts[2]
															
 
																-                        del filename_parts[2]
															
 
																+                        n_samples = filename_parts[-1]
															
 
																+                        del filename_parts[-1]
															
 
																                         # `p3d_XXXXXX`
															
 
																                         output_reconstructed = '_'.join(filename_parts)
															
@@ -259,8 +260,8 @@ def main():
 
																     for id, feature in enumerate(p_features):
															
 
																-        if feature not in features_choices or feature == 'static':
															
 
																-            raise ValueError("Unknown feature {0}, please select a correct feature (`static` excluded) : {1}".format(feature, features_choices))
															
 
																+        if feature not in cfg.features_choices_labels or feature == 'static':
															
 
																+            raise ValueError("Unknown feature {0}, please select a correct feature (`static` excluded) : {1}".format(feature, cfg.features_choices_labels))
															
 
																         transformations.append(Transformation(feature, p_params[id], p_size))
															
--- a/generate/transformations.py
+++ b/generate/transformations.py
@@ -0,0 +1,278 @@
 
																+# main imports
															
 
																+import os
															
 
																+import numpy as np
															
 
																+
															
 
																+# image processing imports
															
 
																+from ipfml.processing import transform, compression
															
 
																+from ipfml.processing import reconstruction
															
 
																+from ipfml.filters import convolution, kernels
															
 
																+from ipfml import utils
															
 
																+import cv2
															
 
																+from skimage.restoration import denoise_nl_means, estimate_sigma
															
 
																+
															
 
																+from PIL import Image
															
 
																+
															
 
																+
															
 
																+def remove_pixel(img, limit):
															
 
																+    
															
 
																+    width, height = img.shape
															
 
																+    
															
 
																+    output = np.zeros((width, height))
															
 
																+    
															
 
																+    for i in range(width):
															
 
																+        for j in range(height):
															
 
																+            
															
 
																+            if img[i,j] <= limit:
															
 
																+                output[i,j] = img[i,j]
															
 
																+                
															
 
																+    return output
															
 
																+
															
 
																+
															
 
																+def get_random_value(distribution):
															
 
																+    rand = random.uniform(0, 1)
															
 
																+    prob_sum = 0.
															
 
																+    
															
 
																+    for id, prob in enumerate(distribution):
															
 
																+        
															
 
																+        prob_sum += prob
															
 
																+        
															
 
																+        if prob_sum >= rand:
															
 
																+            return id
															
 
																+        
															
 
																+    return len(distribution) - 1
															
 
																+
															
 
																+
															
 
																+def distribution_from_data(data):
															
 
																+    
															
 
																+    occurences = np.array([data.count(x) for x in set(data)])
															
 
																+    max_occurences = sum(occurences)
															
 
																+    
															
 
																+    return occurences / max_occurences
															
 
																+
															
 
																+
															
 
																+def fill_image_with_rand_value(img, func, value_to_replace):
															
 
																+    
															
 
																+    width, height = img.shape
															
 
																+    
															
 
																+    output = np.zeros((width, height))
															
 
																+    
															
 
																+    for i in range(width):
															
 
																+        for j in range(height):
															
 
																+            
															
 
																+            if img[i,j] == value_to_replace:
															
 
																+                output[i, j] = func()
															
 
																+            else:
															
 
																+                output[i, j] = img[i, j]
															
 
																+                
															
 
																+    return output
															
 
																+
															
 
																+def _compute_relative_error(ref_sv, k_sv):
															
 
																+    ref = np.sqrt(np.sum(np.square(ref_sv)))
															
 
																+    k = np.sqrt(np.sum(np.square(k_sv)))
															
 
																+
															
 
																+    return k / ref
															
 
																+
															
 
																+def _find_n_components(block, e=0.1):
															
 
																+
															
 
																+    s = transform.get_LAB_L_SVD_s(block)
															
 
																+    
															
 
																+    errors = []
															
 
																+    found = False
															
 
																+    k_components = None
															
 
																+    
															
 
																+    for i in range(len(s)):
															
 
																+        
															
 
																+        #Ak = reconstruction.svd(img, [0, i])
															
 
																+        #error = compute_relative_error_matrix(A, Ak)
															
 
																+        error = _compute_relative_error(s, s[i:])
															
 
																+        errors.append(error)
															
 
																+        
															
 
																+        if error < e and not found:
															
 
																+            k_components = (i + 1)
															
 
																+            found = True
															
 
																+            
															
 
																+    return (k_components, errors)
															
 
																+
															
 
																+# Transformation class to store transformation method of image and get usefull information
															
 
																+class Transformation():
															
 
																+
															
 
																+    def __init__(self, _transformation, _param, _size):
															
 
																+        self.transformation = _transformation
															
 
																+        self.param = _param
															
 
																+        self.size = _size
															
 
																+
															
 
																+    def getTransformedImage(self, img):
															
 
																+
															
 
																+        if self.transformation == 'svd_reconstruction':
															
 
																+            begin, end = list(map(int, self.param.split(',')))
															
 
																+            h, w = list(map(int, self.size.split(',')))
															
 
																+            img_reconstructed = reconstruction.svd(img, [begin, end])
															
 
																+            data_array = np.array(img_reconstructed, 'uint8')
															
 
																+
															
 
																+            img_array = Image.fromarray(data_array)
															
 
																+            img_array.thumbnail((h, w))
															
 
																+
															
 
																+            data = np.array(img_array)
															
 
																+
															
 
																+        if self.transformation == 'svd_reconstruction':
															
 
																+            begin, end = list(map(int, self.param.split(',')))
															
 
																+            h, w = list(map(int, self.size.split(',')))
															
 
																+            img_reconstructed = reconstruction.svd(img, [begin, end])
															
 
																+            data_array = np.array(img_reconstructed, 'uint8')
															
 
																+
															
 
																+            img_array = Image.fromarray(data_array)
															
 
																+            img_array.thumbnail((h, w))
															
 
																+
															
 
																+            data = np.array(img_array)
															
 
																+
															
 
																+        if self.transformation == 'ipca_reconstruction':
															
 
																+            n_components, batch_size = list(map(int, self.param.split(',')))
															
 
																+            h, w = list(map(int, self.size.split(',')))
															
 
																+            img_reconstructed = reconstruction.ipca(img, n_components, batch_size)
															
 
																+            data_array = np.array(img_reconstructed, 'uint8')
															
 
																+            
															
 
																+            img_array = Image.fromarray(data_array)
															
 
																+            img_array.thumbnail((h, w))
															
 
																+
															
 
																+            data = np.array(img_array)
															
 
																+
															
 
																+        if self.transformation == 'fast_ica_reconstruction':
															
 
																+            n_components = self.param
															
 
																+            h, w = list(map(int, self.size.split(',')))
															
 
																+            img_reconstructed = reconstruction.fast_ica(img, n_components)
															
 
																+            data_array = np.array(img_reconstructed, 'uint8')
															
 
																+            
															
 
																+            img_array = Image.fromarray(data_array)
															
 
																+            img_array.thumbnail((h, w))
															
 
																+
															
 
																+            data = np.array(img_array)
															
 
																+
															
 
																+        if self.transformation == 'gini_map':
															
 
																+            # kernel size
															
 
																+            k_w, k_h = list(map(int, self.param.split(',')))
															
 
																+            h, w = list(map(int, self.size.split(',')))
															
 
																+
															
 
																+            lab_img = transform.get_LAB_L(img)
															
 
																+            img_mask = convolution.convolution2D(lab_img, kernels.gini, (k_w, k_h))
															
 
																+
															
 
																+            # renormalize data
															
 
																+            data_array = np.array(img_mask * 255, 'uint8')
															
 
																+
															
 
																+            img_array = Image.fromarray(data_array)
															
 
																+            img_array.thumbnail((h, w))
															
 
																+
															
 
																+            data = np.array(img_array)
															
 
																+
															
 
																+        if self.transformation == 'sobel_based_filter':
															
 
																+            k_size, p_limit = list(map(int, self.param.split(',')))
															
 
																+            h, w = list(map(int, self.size.split(',')))
															
 
																+
															
 
																+            lab_img = transform.get_LAB_L(img)
															
 
																+
															
 
																+            weight, height = lab_img.shape
															
 
																+
															
 
																+            sobelx = cv2.Sobel(lab_img, cv2.CV_64F, 1, 0, ksize=k_size)
															
 
																+            sobely = cv2.Sobel(lab_img, cv2.CV_64F, 0, 1,ksize=k_size)
															
 
																+
															
 
																+            sobel_mag = np.array(np.hypot(sobelx, sobely), 'uint8')  # magnitude
															
 
																+            sobel_mag_limit = remove_pixel(sobel_mag, p_limit)
															
 
																+
															
 
																+            # use distribution value of pixel to fill `0` values
															
 
																+            sobel_mag_limit_without_0 = [x for x in sobel_mag_limit.reshape((weight*height)) if x != 0]  
															
 
																+            distribution = distribution_from_data(sobel_mag_limit_without_0)
															
 
																+            min_value = int(min(sobel_mag_limit_without_0))
															
 
																+            l = lambda: get_random_value(distribution) + min_value
															
 
																+            img_reconstructed = fill_image_with_rand_value(sobel_mag_limit, l, 0)
															
 
																+            
															
 
																+            img_reconstructed_norm = utils.normalize_2D_arr(img_reconstructed)
															
 
																+            img_reconstructed_norm = np.array(img_reconstructed_norm*255, 'uint8')
															
 
																+            sobel_reconstructed = Image.fromarray(img_reconstructed_norm)
															
 
																+            sobel_reconstructed.thumbnail((h, w))
															
 
																+        
															
 
																+            data = np.array(sobel_reconstructed)
															
 
																+
															
 
																+        if self.transformation == 'nl_mean_noise_mask':
															
 
																+            patch_size, patch_distance = list(map(int, self.param.split(',')))
															
 
																+            h, w = list(map(int, self.size.split(',')))
															
 
																+
															
 
																+            img = np.array(img)
															
 
																+            sigma_est = np.mean(estimate_sigma(img, multichannel=True))
															
 
																+    
															
 
																+            patch_kw = dict(patch_size=patch_size,      # 5x5 patches
															
 
																+                            patch_distance=patch_distance,  # 13x13 search area
															
 
																+                            multichannel=True)
															
 
																+
															
 
																+            # slow algorithm
															
 
																+            denoise = denoise_nl_means(img, h=0.8 * sigma_est, sigma=sigma_est,
															
 
																+                                    fast_mode=False,
															
 
																+                                    **patch_kw)
															
 
																+            
															
 
																+            denoise = np.array(denoise, 'uint8')
															
 
																+            noise_mask = np.abs(denoise - img)
															
 
																+            
															
 
																+            data_array = np.array(noise_mask, 'uint8')
															
 
																+            
															
 
																+            img_array = Image.fromarray(data_array)
															
 
																+            img_array.thumbnail((h, w))
															
 
																+
															
 
																+            data = np.array(img_array)
															
 
																+            
															
 
																+        if self.transformation == 'static':
															
 
																+            # static content, we keep input as it is
															
 
																+            data = img
															
 
																+
															
 
																+        return data
															
 
																+    
															
 
																+    def getTransformationPath(self):
															
 
																+
															
 
																+        path = self.transformation
															
 
																+
															
 
																+        if self.transformation == 'svd_reconstruction':
															
 
																+            begin, end = list(map(int, self.param.split(',')))
															
 
																+            w, h = list(map(int, self.size.split(',')))
															
 
																+            path = os.path.join(path, str(begin) + '_' + str(end) + '_S_' + str(w) + '_' + str(h))
															
 
																+        
															
 
																+        if self.transformation == 'gini_map':
															
 
																+            k_w, k_h = list(map(int, self.param.split(',')))
															
 
																+            w, h = list(map(int, self.size.split(',')))
															
 
																+            path = os.path.join(path, str(k_w) + '_' + str(k_h) + '_S_' + str(w) + '_' + str(h))
															
 
																+
															
 
																+        if self.transformation == 'ipca_reconstruction':
															
 
																+            n_components, batch_size = list(map(int, self.param.split(',')))
															
 
																+            w, h = list(map(int, self.size.split(',')))
															
 
																+            path = os.path.join(path, 'N' + str(n_components) + '_' + str(batch_size) + '_S_' + str(w) + '_' + str(h))
															
 
																+
															
 
																+        if self.transformation == 'fast_ica_reconstruction':
															
 
																+            n_components = self.param
															
 
																+            w, h = list(map(int, self.size.split(',')))
															
 
																+            path = os.path.join(path, 'N' + str(n_components) + '_S_' + str(w) + '_' + str(h))
															
 
																+
															
 
																+        if self.transformation == 'min_diff_filter':
															
 
																+            w_size, h_size, stride = list(map(int, self.param.split(',')))
															
 
																+            w, h = list(map(int, self.size.split(',')))
															
 
																+            path = os.path.join(path, 'W_' + str(w_size) + '_' + str(h_size) + '_Stride_' + str(stride) + '_S_' + str(w) + '_' + str(h))
															
 
																+
															
 
																+        if self.transformation == 'sobel_based_filter':
															
 
																+            k_size, p_limit = list(map(int, self.param.split(',')))
															
 
																+            h, w = list(map(int, self.size.split(',')))
															
 
																+            path = os.path.join(path, 'K_' + str(k_size) + '_L' + str(p_limit) + '_S_' + str(w) + '_' + str(h))
															
 
																+
															
 
																+        if self.transformation == 'nl_mean_noise_mask':
															
 
																+            patch_size, patch_distance = list(map(int, self.param.split(',')))
															
 
																+            h, w = list(map(int, self.size.split(',')))
															
 
																+            path = os.path.join(path, 'S' + str(patch_size) + '_D' + str(patch_distance) + '_S_' + str(w) + '_' + str(h))
															
 
																+
															
 
																+        if self.transformation == 'static':
															
 
																+            # param contains image name to find for each scene
															
 
																+            path = self.param
															
 
																+
															
 
																+        return path
															
 
																+
															
 
																+    def getName(self):
															
 
																+        return self.transformation
															
 
																+
															
 
																+    def getParam(self):
															
 
																+        return self.param
															
 
																+
															
 
																+    def __str__( self ):
															
 
																+        return self.transformation + ' transformation with parameter : ' + self.param
															
--- a/modules
+++ b/modules
@@ -1 +0,0 @@
 
																-Subproject commit 270de3a969ff3121e68f435cc6a3b570ba5b9d69
															
--- a/oar.example.sh
+++ b/oar.example.sh
@@ -1,15 +0,0 @@
 
																-#!/bin/sh
															
 
																-
															
 
																-#OAR --array-param-file params.txt
															
 
																-#OAR -l /nodes=1,walltime=6:00:00
															
 
																-#OAR -p host="orval02"
															
 
																-#OAR -t besteffort
															
 
																-#OAR --notify mail:jerome.buisine@univ-littoral.fr
															
 
																-#OAR -O /nfs/home/lisic/jbuisine/projects/launchers/logs/Thesis-NoiseDetection-CNN.%jobid%.out
															
 
																-#OAR -E /nfs/home/lisic/jbuisine/projects/launchers/logs/Thesis-NoiseDetection-CNN.%jobid%.err
															
 
																-
															
 
																-# Activiate venv used by python
															
 
																-. ~/opt/venvs/thesis-venv/bin/activate
															
 
																-
															
 
																-# run command
															
 
																-python ~/projects/Thesis-NoiseDetection-CNN/generate/generate_reconstructed_data.py $@
															
--- a/prediction/estimate_thresholds_lstm.py
+++ b/prediction/estimate_thresholds_lstm.py
@@ -91,11 +91,7 @@ def main():
 
																     # 2. load model and compile it
															
 
																     # TODO : check kind of model
															
 
																-    model = joblib.load(p_model)
															
 
																-    model.compile(loss='binary_crossentropy',
															
 
																-                  optimizer='rmsprop',
															
 
																-                  metrics=['accuracy'])
															
 
																-    # model = load_model(p_model)
															
 
																+    model = load_model(p_model)
															
 
																     # model.compile(loss='binary_crossentropy',
															
 
																     #               optimizer='rmsprop',
															
 
																     #               metrics=['accuracy'])
															
--- a/train_lstm_weighted.py
+++ b/train_lstm_weighted.py
@@ -5,6 +5,7 @@ import pandas as pd
 
																 import os
															
 
																 import ctypes
															
 
																 from PIL import Image
															
 
																+import cv2
															
 
																 from keras import backend as K
															
 
																 import matplotlib.pyplot as plt
															
@@ -50,7 +51,7 @@ def write_progress(progress):
 
																     sys.stdout.write("\033[F")
															
 
																-def build_input(df, seq_norm):
															
 
																+def build_input(df, seq_norm, p_chanels):
															
 
																     """Convert dataframe to numpy array input with timesteps as float array
															
 
																     Arguments:
															
@@ -76,10 +77,15 @@ def build_input(df, seq_norm):
 
																             seq_elems = []
															
 
																             # for each element in sequence data
															
 
																-            for img_path in column:
															
 
																-                img = Image.open(img_path)
															
 
																+            for i, img_path in enumerate(column):
															
 
																+
															
 
																                 # seq_elems.append(np.array(img).flatten())
															
 
																-                seq_elems.append(np.array(img) / 255.)
															
 
																+                if p_chanels[i] > 1:
															
 
																+                    img = cv2.imread(img_path)
															
 
																+                else:
															
 
																+                    img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)
															
 
																+                
															
 
																+                seq_elems.append(np.array(img, 'float32') / 255.)
															
 
																             #seq_arr.append(np.array(seq_elems).flatten())
															
 
																             seq_arr.append(np.array(seq_elems))
															
@@ -154,9 +160,11 @@ def create_model(_input_shape):
 
																     model.add(Dropout(0.5))
															
 
																     model.add(Flatten())
															
 
																-    model.add(Dense(512, activation='sigmoid'))
															
 
																+    model.add(Dense(512, activation='relu'))
															
 
																+    model.add(BatchNormalization())
															
 
																     model.add(Dropout(0.5))
															
 
																-    model.add(Dense(128, activation='sigmoid'))
															
 
																+    model.add(Dense(128, activation='relu'))
															
 
																+    model.add(BatchNormalization())
															
 
																     model.add(Dropout(0.5))
															
 
																     model.add(Dense(1, activation='sigmoid'))
															
 
																     model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
															
@@ -176,6 +184,7 @@ def main():
 
																     parser.add_argument('--train', type=str, help='input train dataset', required=True)
															
 
																     parser.add_argument('--test', type=str, help='input test dataset', required=True)
															
 
																     parser.add_argument('--output', type=str, help='output model name', required=True)
															
 
																+    parser.add_argument('--chanels', type=str, help="given number of ordered chanels (example: '1,3,3') for each element of window", required=True)
															
 
																     parser.add_argument('--epochs', type=int, help='number of expected epochs', default=30)
															
 
																     parser.add_argument('--batch_size', type=int, help='expected batch size for training model', default=64)
															
 
																     parser.add_argument('--seq_norm', type=int, help='normalization sequence by features', choices=[0, 1], default=0)
															
@@ -185,6 +194,7 @@ def main():
 
																     p_train        = args.train
															
 
																     p_test         = args.test
															
 
																     p_output       = args.output
															
 
																+    p_chanels     = list(map(int, args.chanels.split(',')))
															
 
																     p_epochs       = args.epochs
															
 
																     p_batch_size   = args.batch_size
															
 
																     p_seq_norm     = bool(args.seq_norm)
															
@@ -234,11 +244,11 @@ def main():
 
																     # split dataset into X_train, y_train, X_test, y_test
															
 
																     X_train_all = final_df_train.loc[:, 1:].apply(lambda x: x.astype(str).str.split('::'))
															
 
																-    X_train_all = build_input(X_train_all, p_seq_norm)
															
 
																+    X_train_all = build_input(X_train_all, p_seq_norm, p_chanels)
															
 
																     y_train_all = final_df_train.loc[:, 0].astype('int')
															
 
																     X_test = final_df_test.loc[:, 1:].apply(lambda x: x.astype(str).str.split('::'))
															
 
																-    X_test = build_input(X_test, p_seq_norm)
															
 
																+    X_test = build_input(X_test, p_seq_norm, p_chanels)
															
 
																     y_test = final_df_test.loc[:, 0].astype('int')
															
 
																     input_shape = (X_train_all.shape[1], X_train_all.shape[2], X_train_all.shape[3], X_train_all.shape[4])
															
@@ -305,12 +315,13 @@ def main():
 
																     # train_score, train_acc = model.evaluate(X_train, y_train, batch_size=1)
															
 
																     # print(train_acc)
															
 
																-    y_train_predict = model.predict_classes(X_train)
															
 
																-    y_val_predict = model.predict_classes(X_val)
															
 
																-    y_test_predict = model.predict_classes(X_test)
															
 
																+    y_train_predict = model.predict(X_train, batch_size=1, verbose=1)
															
 
																+    y_val_predict = model.predict(X_val, batch_size=1, verbose=1)
															
 
																+    y_test_predict = model.predict(X_test, batch_size=1, verbose=1)
															
 
																-    print(y_train_predict)
															
 
																-    print(y_test_predict)
															
 
																+    y_train_predict = [ 1 if l > 0.5 else 0 for l in y_train_predict ]
															
 
																+    y_val_predict = [ 1 if l > 0.5 else 0 for l in y_val_predict ]
															
 
																+    y_test_predict = [ 1 if l > 0.5 else 0 for l in y_test_predict ]
															
 
																     auc_train = roc_auc_score(y_train, y_train_predict)
															
 
																     auc_val = roc_auc_score(y_val, y_val_predict)
															
@@ -338,11 +349,11 @@ def main():
 
																     model_history = os.path.join(cfg.output_results_folder, p_output + '.png')
															
 
																     plt.savefig(model_history)
															
 
																-    # save model using joblib
															
 
																+    # save model using keras API
															
 
																     if not os.path.exists(cfg.output_models):
															
 
																         os.makedirs(cfg.output_models)
															
 
																-    dump(model, os.path.join(cfg.output_models, p_output + '.joblib'))
															
 
																+    model.save(os.path.join(cfg.output_models, p_output + '.h5'))
															
 
																     # save model results
															
 
																     if not os.path.exists(cfg.output_results_folder):
															
--- a/train_model.py
+++ b/train_model.py
@@ -56,7 +56,7 @@ def main():
 
																     parser.add_argument('--tl', type=int, help='use or not of transfer learning (`VGG network`)', default=0, choices=[0, 1])
															
 
																     parser.add_argument('--batch_size', type=int, help='batch size used as model input', default=64)
															
 
																     parser.add_argument('--epochs', type=int, help='number of epochs used for training model', default=30)
															
 
																-    parser.add_argument('--chanels', type=int, help="given number of chanels if necessary", default=0)
															
 
																+    parser.add_argument('--chanels', type=str, help="given number of ordered chanels for each input images (example: '1,3,3')", required=True)
															
 
																     parser.add_argument('--size', type=str, help="Size of input images", default="100, 100")
															
 
																     parser.add_argument('--val_size', type=float, help='percent of validation data during training process', default=0.3)
															
@@ -68,7 +68,7 @@ def main():
 
																     p_tl          = args.tl
															
 
																     p_batch_size  = args.batch_size
															
 
																     p_epochs      = args.epochs
															
 
																-    p_chanels     = args.chanels
															
 
																+    p_chanels     = list(map(int, args.chanels.split(',')))
															
 
																     p_size        = args.size.split(',')
															
 
																     p_val_size    = args.val_size
															
@@ -94,10 +94,7 @@ def main():
 
																     print("--Reading all images data...")
															
 
																     # getting number of chanel
															
 
																-    if p_chanels == 0:
															
 
																-        n_chanels = len(dataset_train[1][1].split('::'))
															
 
																-    else:
															
 
																-        n_chanels = p_chanels
															
 
																+    n_chanels = sum(p_chanels)
															
 
																     print("-- Number of chanels : ", n_chanels)
															
 
																     img_width, img_height = [ int(s) for s in p_size ]
															
@@ -145,44 +142,30 @@ def main():
 
																     final_df_train = dataset_train
															
 
																     final_df_test = dataset_test
															
 
																-    
															
 
																-    def load_multiple_greyscale(x):
															
 
																-        # update progress
															
 
																-        global n_counter
															
 
																-        n_counter += 1
															
 
																-        write_progress(n_counter / float(total_samples))
															
 
																-        return [cv2.imread(path, cv2.IMREAD_GRAYSCALE) for path in x.split('::')]
															
 
																-    def load_greyscale(x):
															
 
																+    def load_images(x):
															
 
																         # update progress
															
 
																         global n_counter
															
 
																         n_counter += 1
															
 
																         write_progress(n_counter / float(total_samples))
															
 
																-        return cv2.imread(x, cv2.IMREAD_GRAYSCALE)
															
 
																-    def load_rgb(x):
															
 
																-        # update progress
															
 
																-        global n_counter
															
 
																-        n_counter += 1
															
 
																-        write_progress(n_counter / float(total_samples))
															
 
																-        return cv2.imread(x)
															
 
																+        images = []
															
 
																+        for i, path in enumerate(x.split('::')):
															
 
																+            if p_chanels[i] > 1:
															
 
																+                img = cv2.imread(path)
															
 
																+            else:
															
 
																+                img = cv2.imread(path, cv2.IMREAD_GRAYSCALE)
															
 
																+            images.append(img)
															
 
																+
															
 
																+        return images
															
 
																     print('---- Loading dataset.... ----')
															
 
																     print('-----------------------------\n')
															
 
																     # check if specific number of chanels is used
															
 
																-    if p_chanels == 0:
															
 
																-        # `::` is the separator used for getting each img path
															
 
																-        if n_chanels > 1:
															
 
																-            final_df_train[1] = final_df_train[1].apply(lambda x: load_multiple_greyscale(x))
															
 
																-            final_df_test[1] = final_df_test[1].apply(lambda x: load_multiple_greyscale(x))
															
 
																-        else:
															
 
																-            final_df_train[1] = final_df_train[1].apply(lambda x: load_greyscale(x))
															
 
																-            final_df_test[1] = final_df_test[1].apply(lambda x: load_greyscale(x))
															
 
																-    else:
															
 
																-        final_df_train[1] = final_df_train[1].apply(lambda x: load_rgb(x))
															
 
																-        final_df_test[1] = final_df_test[1].apply(lambda x: load_rgb(x))
															
 
																+    final_df_train[1] = final_df_train[1].apply(lambda x: load_images(x))
															
 
																+    final_df_test[1] = final_df_test[1].apply(lambda x: load_images(x))
															
 
																     # reshape array data
															
 
																     final_df_train[1] = final_df_train[1].apply(lambda x: np.array(x).reshape(input_shape))
															
@@ -238,7 +221,8 @@ def main():
 
																     if len(backups) > 0:
															
 
																         last_backup_file = backups[-1]
															
 
																-        model = load_model(last_backup_file)
															
 
																+        last_backup_file_path = os.path.join(model_backup_folder, last_backup_file)
															
 
																+        model = load_model(last_backup_file_path)
															
 
																         # get initial epoch
															
 
																         initial_epoch = int(last_backup_file.split('_')[-1].replace('.h5', ''))
															
@@ -254,22 +238,22 @@ def main():
 
																     # prepare train and validation dataset
															
 
																     X_train, X_val, y_train, y_val = train_test_split(x_data_train, y_dataset_train, test_size=p_val_size, shuffle=False)
															
 
																-    y_train = to_categorical(y_train)
															
 
																-    y_val = to_categorical(y_val)
															
 
																-    y_test = to_categorical(y_dataset_test)
															
 
																+    y_train_cat = to_categorical(y_train)
															
 
																+    y_val_cat = to_categorical(y_val)
															
 
																+    y_test_cat = to_categorical(y_dataset_test)
															
 
																     print('-----------------------------')
															
 
																     print("-- Fitting model with custom class_weight", class_weight)
															
 
																     print('-----------------------------')
															
 
																-    model.fit(X_train, y_train, 
															
 
																-        validation_data=(X_val, y_val), 
															
 
																+    model.fit(X_train, y_train_cat, 
															
 
																+        validation_data=(X_val, y_val_cat), 
															
 
																         initial_epoch=initial_epoch, 
															
 
																         epochs=p_epochs, 
															
 
																         batch_size=p_batch_size, 
															
 
																         callbacks=callbacks_list, 
															
 
																         class_weight=class_weight)
															
 
																-    score = model.evaluate(X_val, y_val, batch_size=p_batch_size)
															
 
																+    score = model.evaluate(X_val, y_val_cat, batch_size=p_batch_size)
															
 
																     print("Accuracy score on val dataset ", score)
															
@@ -280,21 +264,23 @@ def main():
 
																     model_output_path = os.path.join(cfg.output_models, p_output + '.h5')
															
 
																     model.save(model_output_path)
															
 
																+    print('Begin of prediction score on the whole dataset:')
															
 
																     # Get results obtained from model
															
 
																-    y_train_prediction = model.predict(X_train)
															
 
																-    y_val_prediction = model.predict(X_val)
															
 
																-    y_test_prediction = model.predict(x_dataset_test)
															
 
																+    y_train_prediction = model.predict(X_train, verbose=1)
															
 
																+    y_val_prediction = model.predict(X_val, verbose=1)
															
 
																+    y_test_prediction = model.predict(x_data_test, verbose=1)
															
 
																     y_train_prediction = np.argmax(y_train_prediction, axis=1)
															
 
																     y_val_prediction = np.argmax(y_val_prediction, axis=1)
															
 
																+    y_test_prediction = np.argmax(y_test_prediction, axis=1)
															
 
																     acc_train_score = accuracy_score(y_train, y_train_prediction)
															
 
																     acc_val_score = accuracy_score(y_val, y_val_prediction)
															
 
																-    acc_test_score = accuracy_score(y_test, y_test_prediction)
															
 
																+    acc_test_score = accuracy_score(y_dataset_test, y_test_prediction)
															
 
																     roc_train_score = roc_auc_score(y_train, y_train_prediction)
															
 
																     roc_val_score = roc_auc_score(y_val, y_val_prediction)
															
 
																-    roc_test_score = roc_auc_score(y_test, y_val_prediction)
															
 
																+    roc_test_score = roc_auc_score(y_dataset_test, y_test_prediction)
															
 
																     # save model performance
															
 
																     if not os.path.exists(cfg.output_results_folder):
	`@@ -1 +0,0 @@`
	`-Subproject commit 270de3a969ff3121e68f435cc6a3b570ba5b9d69`