il y a 5 ans · 7b3768132f
--- a/.gitignore
+++ b/.gitignore
@@ -14,3 +14,4 @@ saved_models
 
				 # data
			
 
				 learned_zones
			
 
				 dataset
			
 
				+models_info
			
--- a/README.md
+++ b/README.md
@@ -18,13 +18,24 @@ Generate custom dataset from one reconstructed method or multiples (implemented
 
				 python generate_dataset.py -h
			
 
				 ```
			
 
				 
			
 
				-
			
 
				+### Reconstruction parameter
			
 
				+
			
 
				+List of expected parameter by reconstruction method:
			
 
				+- **svd:** Singular Values Decomposition
			
 
				+  - Param definition: *interval data used for reconstruction (begin, end)*
			
 
				+  - Example: *"100, 200"*
			
 
				+- **ipca:** Iterative Principal Component Analysis
			
 
				+  - Param definition: *number of components used for compression and batch size*
			
 
				+  - Example: *"50, 32"*
			
 
				+- **fast_ica:**  Fast Iterative Component Analysis
			
 
				+  - Param definition: *number of components used for compression*
			
 
				+  - Example: *"50"*
			
 
				 
			
 
				 ## Modules
			
 
				 
			
 
				 This project contains modules:
			
 
				 - **modules/utils/config.py**: *Store all configuration information about the project and dataset information*
			
 
				-- **modules/utils/data.py**: *Usefull methods used for data generation*
			
 
				+- **modules/utils/data.py**: *Usefull methods used for dataset*
			
 
				 
			
 
				 All these modules will be enhanced during development of the project
			
 
				 
			
--- a/generate_dataset.py
+++ b/generate_dataset.py
@@ -19,7 +19,8 @@ from skimage import color
 
				 from modules.utils import config as cfg
			
 
				 from modules.utils import data as dt
			
 
				 
			
 
				-from preprocessing_functions import svd_reconstruction
			
 
				+from transformation_functions import svd_reconstruction
			
 
				+from modules.classes.Transformation import Transformation
			
 
				 
			
 
				 # getting configuration information
			
 
				 config_filename         = cfg.config_filename
			
@@ -40,7 +41,7 @@ output_data_folder      = cfg.output_data_folder
 
				 
			
 
				 generic_output_file_svd = '_random.csv'
			
 
				 
			
 
				-def generate_data_model(_scenes_list, _filename, _interval,  _metric, _scenes, _nb_zones = 4, _random=0):
			
 
				+def generate_data_model(_scenes_list, _filename, _transformation, _scenes, _nb_zones = 4, _random=0):
			
 
				 
			
 
				     output_train_filename = _filename + ".train"
			
 
				     output_test_filename = _filename + ".test"
			
@@ -58,7 +59,6 @@ def generate_data_model(_scenes_list, _filename, _interval,  _metric, _scenes, _
 
				     scenes = os.listdir(path)
			
 
				     # remove min max file from scenes folder
			
 
				     scenes = [s for s in scenes if min_max_filename not in s]
			
 
				-    begin, end = _interval
			
 
				 
			
 
				     # go ahead each scenes
			
 
				     for id_scene, folder_scene in enumerate(_scenes_list):
			
@@ -96,16 +96,13 @@ def generate_data_model(_scenes_list, _filename, _interval,  _metric, _scenes, _
 
				             current_zone_folder = "zone" + index_str
			
 
				             zone_path = os.path.join(scene_path, current_zone_folder)
			
 
				 
			
 
				-            # custom path for metric
			
 
				-            metric_path = os.path.join(zone_path, _metric)
			
 
				-
			
 
				             # custom path for interval of reconstruction and metric
			
 
				-            metric_interval_path = os.path.join(metric_path, str(begin) + "_" + str(end))
			
 
				+            metric_interval_path = os.path.join(zone_path, _transformation.getTranformationPath())
			
 
				 
			
 
				             for label in os.listdir(metric_interval_path):
			
 
				                 label_path = os.path.join(metric_interval_path, label)
			
 
				 
			
 
				-                images = os.listdir(label_path)
			
 
				+                images = sorted(os.listdir(label_path))
			
 
				 
			
 
				                 for img in images:
			
 
				                     img_path = os.path.join(label_path, img)
			
@@ -144,7 +141,7 @@ def main():
 
				                                     help="metric choice in order to compute data (use 'all' if all metrics are needed)", 
			
 
				                                     choices=metric_choices,
			
 
				                                     required=True)
			
 
				-    parser.add_argument('--interval', type=str, help="interval choice if needed by the compression method", default='"100, 200"')
			
 
				+    parser.add_argument('--param', type=str, help="specific param for metric (See README.md for further information)")
			
 
				     parser.add_argument('--scenes', type=str, help='List of scenes to use for training data')
			
 
				     parser.add_argument('--nb_zones', type=int, help='Number of zones to use for training data set', choices=list(range(1, 17)))
			
 
				     parser.add_argument('--renderer', type=str, help='Renderer choice in order to limit scenes used', choices=cfg.renderer_choices, default='all')
			
@@ -154,13 +151,16 @@ def main():
 
				 
			
 
				     p_filename = args.output
			
 
				     p_metric   = args.metric
			
 
				-    p_interval = list(map(int, args.interval.split(',')))
			
 
				+    p_param    = args.param
			
 
				     p_scenes   = args.scenes.split(',')
			
 
				     p_nb_zones = args.nb_zones
			
 
				     p_renderer = args.renderer
			
 
				     p_random   = args.random
			
 
				 
			
 
				-        # list all possibles choices of renderer
			
 
				+    # create new Transformation obj
			
 
				+    transformation = Transformation(p_metric, p_param)
			
 
				+
			
 
				+    # list all possibles choices of renderer
			
 
				     scenes_list = dt.get_renderer_scenes_names(p_renderer)
			
 
				     scenes_indices = dt.get_renderer_scenes_indices(p_renderer)
			
 
				 
			
@@ -172,8 +172,7 @@ def main():
 
				         scenes_selected.append(scenes_list[index])
			
 
				 
			
 
				     # create database using img folder (generate first time only)
			
 
				-    generate_data_model(scenes_list, p_filename, p_interval,  p_metric, scenes_selected, p_nb_zones, p_random)
			
 
				-
			
 
				+    generate_data_model(scenes_list, p_filename, transformation, scenes_selected, p_nb_zones, p_random)
			
 
				 
			
 
				 if __name__== "__main__":
			
 
				     main()
			
--- a/generate_reconstructed_data.py
+++ b/generate_reconstructed_data.py
@@ -17,7 +17,7 @@ from ipfml import processing, metrics, utils
 
				 from skimage import color
			
 
				 
			
 
				 from modules.utils import config as cfg
			
 
				-from preprocessing_functions import svd_reconstruction
			
 
				+from modules.classes.Transformation import Transformation
			
 
				 
			
 
				 # getting configuration information
			
 
				 config_filename         = cfg.config_filename
			
@@ -37,18 +37,15 @@ output_data_folder      = cfg.output_data_folder
 
				 
			
 
				 generic_output_file_svd = '_random.csv'
			
 
				 
			
 
				-def generate_data_svd(data_type, interval):
			
 
				+def generate_data(transformation):
			
 
				     """
			
 
				     @brief Method which generates all .csv files from scenes
			
 
				-    @param data_type,  metric choice
			
 
				-    @param interval, interval choice used by reconstructed method
			
 
				     @return nothing
			
 
				     """
			
 
				 
			
 
				     scenes = os.listdir(path)
			
 
				     # remove min max file from scenes folder
			
 
				     scenes = [s for s in scenes if min_max_filename not in s]
			
 
				-    begin, end = interval
			
 
				 
			
 
				     # go ahead each scenes
			
 
				     for id_scene, folder_scene in enumerate(scenes):
			
@@ -84,13 +81,13 @@ def generate_data_svd(data_type, interval):
 
				                 zones_threshold.append(int(f.readline()))
			
 
				 
			
 
				             # custom path for metric
			
 
				-            metric_path = os.path.join(zone_path, data_type)
			
 
				+            metric_path = os.path.join(zone_path, transformation.getName())
			
 
				 
			
 
				             if not os.path.exists(metric_path):
			
 
				                 os.makedirs(metric_path)
			
 
				 
			
 
				             # custom path for interval of reconstruction and metric
			
 
				-            metric_interval_path = os.path.join(metric_path, str(begin) + "_" + str(end))
			
 
				+            metric_interval_path = transformation.getTransformationPath()
			
 
				             metrics_folder.append(metric_interval_path)
			
 
				 
			
 
				             if not os.path.exists(metric_interval_path):
			
@@ -128,7 +125,7 @@ def generate_data_svd(data_type, interval):
 
				                 ##########################
			
 
				                 # Image computation part #
			
 
				                 ##########################
			
 
				-                output_block = svd_reconstruction(block, [begin, end])
			
 
				+                output_block = transformation.getTransformedImage(block)
			
 
				                 output_block = np.array(output_block, 'uint8')
			
 
				                 
			
 
				                 # current output image
			
@@ -156,7 +153,7 @@ def generate_data_svd(data_type, interval):
 
				 
			
 
				 
			
 
				             start_index_image_int = int(start_index_image)
			
 
				-            print(data_type + "_" + folder_scene + " - " + "{0:.2f}".format((current_counter_index - start_index_image_int) / (end_counter_index - start_index_image_int)* 100.) + "%")
			
 
				+            print(transformation.getName() + "_" + folder_scene + " - " + "{0:.2f}".format((current_counter_index - start_index_image_int) / (end_counter_index - start_index_image_int)* 100.) + "%")
			
 
				             sys.stdout.write("\033[F")
			
 
				 
			
 
				             current_counter_index += step_counter
			
@@ -164,7 +161,7 @@ def generate_data_svd(data_type, interval):
 
				 
			
 
				         print('\n')
			
 
				 
			
 
				-    print("%s_%s : end of data generation\n" % (data_type, interval))
			
 
				+    print("%s_%s : end of data generation\n" % (transformation.getName(), transformation.getParam()))
			
 
				 
			
 
				 
			
 
				 def main():
			
@@ -172,25 +169,21 @@ def main():
 
				     parser = argparse.ArgumentParser(description="Compute and prepare data of metric of all scenes using specific interval if necessary")
			
 
				 
			
 
				     parser.add_argument('--metric', type=str, 
			
 
				-                                    help="metric choice in order to compute data (use 'all' if all metrics are needed)", 
			
 
				+                                    help="metric choice in order to compute data", 
			
 
				                                     choices=metric_choices,
			
 
				                                     required=True)
			
 
				 
			
 
				-    parser.add_argument('--interval', type=str, 
			
 
				-                                    help="interval choice if needed by the compression method", 
			
 
				-                                    default='"100, 200"')
			
 
				+    parser.add_argument('--param', type=str, help="specific param for metric (See README.md for further information)")
			
 
				 
			
 
				     args = parser.parse_args()
			
 
				 
			
 
				     p_metric   = args.metric
			
 
				-    p_interval = list(map(int, args.interval.split(',')))
			
 
				+    p_param    = args.param
			
 
				+
			
 
				+    transformation = Transformation(p_metric, p_param)
			
 
				 
			
 
				     # generate all or specific metric data
			
 
				-    if p_metric == 'all':
			
 
				-        for m in metric_choices:
			
 
				-            generate_data_svd(m, p_interval)
			
 
				-    else:
			
 
				-        generate_data_svd(p_metric, p_interval)
			
 
				+    generate_data(transformation)
			
 
				 
			
 
				 if __name__== "__main__":
			
 
				     main()
			
--- a/modules/classes/Transformation.py
+++ b/modules/classes/Transformation.py
@@ -0,0 +1,53 @@
 
				+import os
			
 
				+
			
 
				+from transformation_functions import svd_reconstruction, fast_ica_reconstruction, ipca_reconstruction
			
 
				+
			
 
				+# Transformation class to store transformation method of image and get usefull information
			
 
				+class Transformation():
			
 
				+
			
 
				+    def __init__(self, _transformation, _param):
			
 
				+        self.transformation = _transformation
			
 
				+        self.param = _param
			
 
				+
			
 
				+    def getTransformedImage(self, img):
			
 
				+
			
 
				+        if self.transformation == 'svd_reconstruction':
			
 
				+            begin, end = list(map(int, self.param.split(',')))
			
 
				+            data = svd_reconstruction(img, [begin, end])
			
 
				+
			
 
				+        if self.transformation == 'ipca_reconstruction':
			
 
				+            n_components, batch_size = list(map(int, self.param.split(',')))
			
 
				+            data = ipca_reconstruction(img, n_components, batch_size)
			
 
				+
			
 
				+        if self.transformation == 'fast_ica_reconstruction':
			
 
				+            n_components = self.param
			
 
				+            data = fast_ica_reconstruction(img, n_components)
			
 
				+
			
 
				+        return data
			
 
				+    
			
 
				+    def getTransformationPath(self):
			
 
				+
			
 
				+        path = self.transformation
			
 
				+
			
 
				+        if self.transformation == 'svd_reconstruction':
			
 
				+            begin, end = list(map(int, self.param.split(',')))
			
 
				+            path = os.path.join(path, str(begin) + '_' + str(end))
			
 
				+
			
 
				+        if self.transformation == 'ipca_reconstruction':
			
 
				+            n_components, batch_size = list(map(int, self.param.split(',')))
			
 
				+            path = os.path.join(path, 'N' + str(n_components) + '_' + str(batch_size))
			
 
				+
			
 
				+        if self.transformation == 'fast_ica_reconstruction':
			
 
				+            n_components = self.param
			
 
				+            path = os.path.join(path, 'N' + str(n_components))
			
 
				+
			
 
				+        return path
			
 
				+
			
 
				+    def getName(self):
			
 
				+        return self.transformation
			
 
				+
			
 
				+    def getParam(self):
			
 
				+        return self.param
			
 
				+
			
 
				+    def __str__( self ):
			
 
				+        return self.transformation + ' transformation with parameter : ' + self.param
			
--- a/modules/classes/__init__.py
+++ b/modules/classes/__init__.py
--- a/modules/utils/config.py
+++ b/modules/utils/config.py
@@ -38,8 +38,8 @@ cycle_scenes_indices            = ['E', 'I']
 
				 normalization_choices           = ['svd', 'svdn', 'svdne']
			
 
				 zones_indices                   = np.arange(16)
			
 
				 
			
 
				-metric_choices_labels           = ['all', 'svd_reconstruction']
			
 
				+metric_choices_labels           = ['all', 'svd_reconstruction', 'fast_ica_reconstruction', 'ipca_reconstruction']
			
 
				 
			
 
				-keras_epochs                    = 100
			
 
				+keras_epochs                    = 1
			
 
				 keras_batch                     = 32
			
 
				 val_dataset_size                = 0.2
			
--- a/modules/utils/data.py
+++ b/modules/utils/data.py
@@ -1,6 +1,6 @@
 
				 from ipfml import processing, metrics, utils
			
 
				 from modules.utils.config import *
			
 
				-from preprocessing_functions import svd_reconstruction
			
 
				+from transformation_functions import svd_reconstruction
			
 
				 
			
 
				 from PIL import Image
			
 
				 from skimage import color
			
@@ -22,17 +22,6 @@ _scenes_indices_prefix = '_scenes_indices'
 
				 context_vars = vars()
			
 
				 
			
 
				 
			
 
				-def get_data(data_type, block, interval=(100, 200)):
			
 
				-    """
			
 
				-    Method which returns the data type expected
			
 
				-    """
			
 
				-
			
 
				-    if data_type == 'svd_reconstruct':
			
 
				-        begin, end = interval
			
 
				-        data = svd_reconstruction(block, [begin, end])
			
 
				-
			
 
				-    return data
			
 
				-
			
 
				 def get_renderer_scenes_indices(renderer_name):
			
 
				 
			
 
				     if renderer_name not in renderer_choices:
			
--- a/preprocessing_functions.py
+++ b/preprocessing_functions.py
@@ -1,23 +0,0 @@
 
				-from numpy.linalg import svd
			
 
				-from PIL import Image
			
 
				-from scipy import misc
			
 
				-
			
 
				-import time
			
 
				-
			
 
				-import numpy as np
			
 
				-from ipfml import metrics
			
 
				-
			
 
				-def svd_reconstruction(img, interval):
			
 
				-    
			
 
				-    begin, end = interval
			
 
				-    lab_img = metrics.get_LAB_L(img)
			
 
				-    lab_img = np.array(lab_img, 'uint8')
			
 
				-    
			
 
				-    U, s, V = svd(lab_img, full_matrices=True)
			
 
				-    
			
 
				-    # reconstruction using specific interval
			
 
				-    smat = np.zeros((end-begin, end-begin), dtype=complex)
			
 
				-    smat[:, :] = np.diag(s[begin:end])
			
 
				-    output_img = np.dot(U[:, begin:end],  np.dot(smat, V[begin:end, :]))
			
 
				-        
			
 
				-    return output_img
			
--- a/run.sh
+++ b/run.sh
@@ -2,6 +2,9 @@
 
				 
			
 
				 erased=$1
			
 
				 
			
 
				+# file which contains model names we want to use for simulation
			
 
				+file_path="models_info/models_comparisons.csv"
			
 
				+
			
 
				 if [ "${erased}" == "Y" ]; then
			
 
				     echo "Previous data file erased..."
			
 
				     rm ${file_path}
			
@@ -12,26 +15,84 @@ if [ "${erased}" == "Y" ]; then
 
				     echo 'model_name; global_train_size; global_test_size; filtered_train_size; filtered_test_size; f1_train; f1_test; recall_train; recall_test; presicion_train; precision_test; acc_train; acc_test; roc_auc_train; roc_auc_test;' >> ${file_path}
			
 
				 fi
			
 
				 
			
 
				-metric="svd_reconstruction"
			
 
				+renderer="maxwell"
			
 
				+scenes="A, D, G, H"
			
 
				 
			
 
				-# file which contains model names we want to use for simulation
			
 
				-comparisons_models="models_info/models_comparisons.csv"
			
 
				+svd_metric="svd_reconstruction"
			
 
				+ipca_metric="ipca_reconstruction"
			
 
				+fast_ica_metric="fast_ica_reconstruction"
			
 
				+
			
 
				+# First compute svd_reconstruction
			
 
				 
			
 
				 for begin in {80,85,90,95,100,105,110}; do
			
 
				   for end in {150,160,170,180,190,200}; do
			
 
				 
			
 
				-    # python generate_reconstructed_data.py --metric ${metric} --interval "${begin}, ${end}"
			
 
				+    python generate_reconstructed_data.py --metric ${svd_metric} --param "${begin}, ${end}"
			
 
				 
			
 
				     for zone in {6,8,10,12}; do
			
 
				-      OUTPUT_DATA_FILE="${metric}_nb_zones_${zone}_B${begin}_E${end}"
			
 
				+      OUTPUT_DATA_FILE="${svd_metric}_nb_zones_${zone}_B${begin}_E${end}"
			
 
				 
			
 
				-      if grep -xq "${OUTPUT_DATA_FILE}" "${comparisons_models}"; then
			
 
				+      if grep -xq "${OUTPUT_DATA_FILE}" "${file_path}"; then
			
 
				         
			
 
				-        echo "Run simulation for model ${OUTPUT_DATA_FILE}"
			
 
				+        echo "SVD model ${OUTPUT_DATA_FILE} already generated"
			
 
				+      
			
 
				+      else
			
 
				+      
			
 
				+        echo "Run computation for SVD model ${OUTPUT_DATA_FILE}"
			
 
				 
			
 
				-        python generate_dataset.py --output data/${OUTPUT_DATA_FILE} --metric ${metric} --renderer "maxwell" --scenes "A, D, G, H" --interval "${begin}, ${end}" --nb_zones ${zone} --random 1
			
 
				+        python generate_dataset.py --output data/${OUTPUT_DATA_FILE} --metric ${svd_metric} --renderer ${renderer} --scenes ${scenes} --param "${begin}, ${end}" --nb_zones ${zone} --random 1
			
 
				         
			
 
				-        python train_model.py --data data/${OUTPUT_DATA_FILE} --output ${OUTPUT_DATA_FILE}
			
 
				+        python train_model_2D.py --data data/${OUTPUT_DATA_FILE} --output ${OUTPUT_DATA_FILE}
			
 
				+      fi
			
 
				     done
			
 
				   done
			
 
				 done
			
 
				+
			
 
				+
			
 
				+# computation of ipca_reconstruction
			
 
				+ipca_batch_size=25
			
 
				+
			
 
				+for component in {50,60,70,80,90,100,110,120,130,140,150,160,170,180,190,200}; do
			
 
				+  python generate_reconstructed_data.py --metric ${ipca_metric} --param "${component},${ipca_batch_size}"
			
 
				+
			
 
				+  for zone in {6,8,10,12}; do
			
 
				+    OUTPUT_DATA_FILE="${ipca_metric}_nb_zones_${zone}_N${component}_BS${ipca_batch_size}"
			
 
				+
			
 
				+    if grep -xq "${OUTPUT_DATA_FILE}" "${file_path}"; then
			
 
				+      
			
 
				+      echo "IPCA model ${OUTPUT_DATA_FILE} already generated"
			
 
				+    
			
 
				+    else
			
 
				+    
			
 
				+      echo "Run computation for IPCA model ${OUTPUT_DATA_FILE}"
			
 
				+
			
 
				+      python generate_dataset.py --output data/${OUTPUT_DATA_FILE} --metric ${ipca_metric} --renderer ${renderer} --scenes ${scenes} --param "${component},${ipca_batch_size}" --nb_zones ${zone} --random 1
			
 
				+      
			
 
				+      python train_model_2D.py --data data/${OUTPUT_DATA_FILE} --output ${OUTPUT_DATA_FILE}
			
 
				+    fi
			
 
				+  done
			
 
				+done
			
 
				+
			
 
				+
			
 
				+# computation of fast_ica_reconstruction
			
 
				+
			
 
				+for component in {50,60,70,80,90,100,110,120,130,140,150,160,170,180,190,200}; do
			
 
				+  python generate_reconstructed_data.py --metric ${fast_ica_metric} --param "${component}"
			
 
				+
			
 
				+  for zone in {6,8,10,12}; do
			
 
				+    OUTPUT_DATA_FILE="${fast_ica_metric}_nb_zones_${zone}_N${component}"
			
 
				+
			
 
				+    if grep -xq "${OUTPUT_DATA_FILE}" "${file_path}"; then
			
 
				+      
			
 
				+      echo "Fast ICA model ${OUTPUT_DATA_FILE} already generated"
			
 
				+    
			
 
				+    else
			
 
				+    
			
 
				+      echo "Run computation for Fast ICA model ${OUTPUT_DATA_FILE}"
			
 
				+
			
 
				+      python generate_dataset.py --output data/${OUTPUT_DATA_FILE} --metric ${fast_ica_metric} --renderer ${renderer} --scenes ${scenes} --param "${component}" --nb_zones ${zone} --random 1
			
 
				+      
			
 
				+      python train_model_2D.py --data data/${OUTPUT_DATA_FILE} --output ${OUTPUT_DATA_FILE}
			
 
				+    fi
			
 
				+  done
			
 
				+done
			
--- a/train_model.py
+++ b/train_model.py
@@ -81,7 +81,7 @@ def generate_model(_input_shape):
 
				     model.add(Activation('sigmoid'))
			
 
				 
			
 
				     model.compile(loss='binary_crossentropy',
			
 
				-                  optimizer='adam',
			
 
				+                  optimizer='rmsprop',
			
 
				                   metrics=['accuracy', auc])
			
 
				 
			
 
				     return model
			
@@ -112,6 +112,9 @@ def main():
 
				     dataset_train = pd.read_csv(p_data_file + '.train', header=None, sep=";")
			
 
				     dataset_test = pd.read_csv(p_data_file + '.test', header=None, sep=";")
			
 
				 
			
 
				+    print("Train set size : ", len(dataset_train))
			
 
				+    print("Test set size : ", len(dataset_test))
			
 
				+
			
 
				     # default first shuffle of data
			
 
				     dataset_train = shuffle(dataset_train)
			
 
				     dataset_test = shuffle(dataset_test)
			
@@ -164,13 +167,16 @@ def main():
 
				 
			
 
				     print("End of loading data..")
			
 
				 
			
 
				+    print("Train set size (after balancing) : ", final_df_train_size)
			
 
				+    print("Test set size (after balancing) : ", final_df_test_size)
			
 
				+
			
 
				     #######################
			
 
				     # 2. Getting model
			
 
				     #######################
			
 
				 
			
 
				     model = generate_model(input_shape)
			
 
				     model.summary()
			
 
				-
			
 
				+ 
			
 
				     model.fit(x_data_train, y_dataset_train.values, validation_split=p_val_size, epochs=p_epochs, batch_size=p_batch_size)
			
 
				 
			
 
				     score = model.evaluate(x_data_test, y_dataset_test, batch_size=p_batch_size)
			
@@ -189,9 +195,12 @@ def main():
 
				     model.save_weights(model_output_path.replace('.json', '.h5'))
			
 
				 
			
 
				     # Get results obtained from model
			
 
				-    y_train_prediction = model.predict(x_data_test)
			
 
				+    y_train_prediction = model.predict(x_data_train)
			
 
				     y_test_prediction = model.predict(x_data_test)
			
 
				 
			
 
				+    y_train_prediction = [1 if x > 0.5 else 0 for x in y_train_prediction]
			
 
				+    y_test_prediction = [1 if x > 0.5 else 0 for x in y_test_prediction]
			
 
				+
			
 
				     acc_train_score = accuracy_score(y_dataset_train, y_train_prediction)
			
 
				     acc_test_score = accuracy_score(y_dataset_test, y_test_prediction)
			
 
				 
			
@@ -204,7 +213,7 @@ def main():
 
				     pres_train_score = precision_score(y_dataset_train, y_train_prediction)
			
 
				     pres_test_score = precision_score(y_dataset_test, y_test_prediction)
			
 
				 
			
 
				-    roc_train_score = roc_auc_score(y_dataset_test, y_train_prediction)
			
 
				+    roc_train_score = roc_auc_score(y_dataset_train, y_train_prediction)
			
 
				     roc_test_score = roc_auc_score(y_dataset_test, y_test_prediction)
			
 
				 
			
 
				     # save model performance
			
@@ -214,11 +223,13 @@ def main():
 
				     perf_file_path = os.path.join(cfg.models_information_folder, cfg.csv_model_comparisons_filename)
			
 
				 
			
 
				     with open(perf_file_path, 'a') as f:
			
 
				-        line = p_output + ';' + len(dataset_train) + ';' + len(dataset_test) + ';' + final_df_train_size + ';' + final_df_test_size + ';' + acc_train_score + ';' + acc_test_score + ';' \
			
 
				-                        + f1_train_score + ';' + f1_test_score + ';' \
			
 
				-                        + recall_train_score + ';' + recall_test_score + ';' \
			
 
				-                        + pres_train_score + ';' + pres_test_score + ';' \
			
 
				-                        + roc_train_score + ';' + roc_test_score + '\n'
			
 
				+        line = p_output + ';' + str(len(dataset_train)) + ';' + str(len(dataset_test)) + ';' \
			
 
				+                        + str(final_df_train_size) + ';' + str(final_df_test_size) + ';' \
			
 
				+                        + str(acc_train_score) + ';' + str(acc_test_score) + ';' \
			
 
				+                        + str(f1_train_score) + ';' + str(f1_test_score) + ';' \
			
 
				+                        + str(recall_train_score) + ';' + str(recall_test_score) + ';' \
			
 
				+                        + str(pres_train_score) + ';' + str(pres_test_score) + ';' \
			
 
				+                        + str(roc_train_score) + ';' + str(roc_test_score) + '\n'
			
 
				         f.write(line)
			
 
				 
			
 
				 if __name__== "__main__":
			
--- a/transformation_functions.py
+++ b/transformation_functions.py
@@ -0,0 +1,43 @@
 
				+from numpy.linalg import svd
			
 
				+from sklearn.decomposition import FastICA, IncrementalPCA
			
 
				+
			
 
				+import numpy as np
			
 
				+
			
 
				+from ipfml import metrics
			
 
				+
			
 
				+def svd_reconstruction(img, interval):
			
 
				+    
			
 
				+    begin, end = interval
			
 
				+    lab_img = metrics.get_LAB_L(img)
			
 
				+    lab_img = np.array(lab_img, 'uint8')
			
 
				+    
			
 
				+    U, s, V = svd(lab_img, full_matrices=True)
			
 
				+    
			
 
				+    # reconstruction using specific interval
			
 
				+    smat = np.zeros((end-begin, end-begin), dtype=complex)
			
 
				+    smat[:, :] = np.diag(s[begin:end])
			
 
				+    output_img = np.dot(U[:, begin:end],  np.dot(smat, V[begin:end, :]))
			
 
				+        
			
 
				+    return output_img
			
 
				+
			
 
				+
			
 
				+def fast_ica_reconstruction(img, components):
			
 
				+
			
 
				+    ica = FastICA(n_components = 50)
			
 
				+    # run ICA on image
			
 
				+    ica.fit(img)
			
 
				+    # reconstruct image with independent components
			
 
				+    image_ica = ica.fit_transform(img)
			
 
				+    restored_image = ica.inverse_transform(image_ica)
			
 
				+
			
 
				+    return restored_image
			
 
				+
			
 
				+
			
 
				+def ipca_reconstruction(img, components, _batch_size=25):
			
 
				+
			
 
				+    transformer = IncrementalPCA(n_components=components, batch_size=_batch_size)
			
 
				+
			
 
				+    transformed_image = transformer.fit_transform(img) 
			
 
				+    restored_image = transformer.inverse_transform(transformed_image)
			
 
				+
			
 
				+    return restored_image