6 years ago · 76bc58bdfa
--- a/generateAndTrain_maxwell.sh
+++ b/generateAndTrain_maxwell.sh
@@ -37,7 +37,7 @@ for counter in {0..4}; do
 
																         end=$(($size))
															
 
																     fi
															
 
																-    for nb_zones in {4,6,8,10,12,14}; do
															
 
																+    for nb_zones in {4,6,8,10,12}; do
															
 
																         echo $start $end
															
--- a/generateAndTrain_maxwell_custom.sh
+++ b/generateAndTrain_maxwell_custom.sh
@@ -37,7 +37,7 @@ for counter in {0..4}; do
 
																         end=$(($size))
															
 
																     fi
															
 
																-    for nb_zones in {4,6,8,10,12,14}; do
															
 
																+    for nb_zones in {4,6,8,10,12}; do
															
 
																         echo $start $end
															
--- a/runAll_maxwell.sh
+++ b/runAll_maxwell.sh
@@ -12,7 +12,7 @@ if [ "${erased}" == "Y" ]; then
 
																     touch ${file_path}
															
 
																     # add of header
															
 
																-    echo 'model_name; vector_size; start; end; nb_zones; metric; mode; tran_size; val_size; test_size; train_pct_size; val_pct_size; test_pct_size; train_acc; val_acc; test_acc; all_acc; F1_train; F1_val; F1_test; F1_all' >> ${file_path}
															
 
																+    echo 'model_name; vector_size; start; end; nb_zones; metric; mode; tran_size; val_size; test_size; train_pct_size; val_pct_size; test_pct_size; train_acc; val_acc; test_acc; all_acc; F1_train; recall_train; roc_auc_train; F1_val; recall_val; roc_auc_val; F1_test; recall_test; roc_auc_test; F1_all; recall_all; roc_auc_all;' >> ${file_path}
															
 
																 fi
															
--- a/runAll_maxwell_custom.sh
+++ b/runAll_maxwell_custom.sh
@@ -0,0 +1,24 @@
 
																+#! bin/bash
															
 
																+
															
 
																+# erase "models_info/models_comparisons.csv" file and write new header
															
 
																+file_path='models_info/models_comparisons.csv'
															
 
																+
															
 
																+erased=$1
															
 
																+
															
 
																+if [ "${erased}" == "Y" ]; then
															
 
																+    echo "Previous data file erased..."
															
 
																+    rm ${file_path}
															
 
																+    mkdir -p models_info
															
 
																+    touch ${file_path}
															
 
																+
															
 
																+    # add of header
															
 
																+    echo 'model_name; vector_size; start; end; nb_zones; metric; mode; tran_size; val_size; test_size; train_pct_size; val_pct_size; test_pct_size; train_acc; val_acc; test_acc; all_acc; F1_train; recall_train; roc_auc_train; F1_val; recall_val; roc_auc_val; F1_test; recall_test; roc_auc_test; F1_all; recall_all; roc_auc_all;' >> ${file_path}
															
 
																+
															
 
																+fi
															
 
																+
															
 
																+for size in {"4","8","16","26","32","40"}; do
															
 
																+
															
 
																+    for metric in {"lab","mscn","mscn_revisited","low_bits_2","low_bits_3","low_bits_4","low_bits_5","low_bits_6","low_bits_4_shifted_2"}; do
															
 
																+        bash generateAndTrain_maxwell_custom.sh ${size} ${metric}
															
 
																+    done
															
 
																+done
															
--- a/save_model_result_in_md_maxwell.py
+++ b/save_model_result_in_md_maxwell.py
@@ -1,6 +1,6 @@
 
																 from sklearn.utils import shuffle
															
 
																 from sklearn.externals import joblib
															
 
																-from sklearn.metrics import accuracy_score, f1_score
															
 
																+from sklearn.metrics import accuracy_score, f1_score, recall_score, roc_auc_score
															
 
																 from sklearn.model_selection import cross_val_score
															
 
																 from sklearn.model_selection import train_test_split
															
@@ -194,9 +194,18 @@ def main():
 
																     test_accuracy = accuracy_score(y_test, y_test_model)
															
 
																     y_train_model = model.predict(x_dataset_train)
															
 
																+
															
 
																     train_f1 = f1_score(y_dataset_train, y_train_model)
															
 
																+    train_recall = recall_score(y_dataset_train, y_train_model)
															
 
																+    train_roc_auc = roc_auc_score(y_dataset_train, y_train_model)
															
 
																+
															
 
																     val_f1 = f1_score(y_val, y_val_model)
															
 
																+    val_recall = recall_score(y_val, y_val_model)
															
 
																+    val_roc_auc = roc_auc_score(y_val, y_val_model)
															
 
																+
															
 
																     test_f1 = f1_score(y_test, y_test_model)
															
 
																+    test_recall = recall_score(y_test, y_test_model)
															
 
																+    test_roc_auc = roc_auc_score(y_test, y_test_model)
															
 
																     # stats of all dataset
															
 
																     all_x_data = pd.concat([x_dataset_train, X_test, X_val])
															
@@ -205,6 +214,8 @@ def main():
 
																     all_y_model = model.predict(all_x_data)
															
 
																     all_accuracy = accuracy_score(all_y_data, all_y_model)
															
 
																     all_f1_score = f1_score(all_y_data, all_y_model)
															
 
																+    all_recall_score = recall_score(all_y_data, all_y_model)
															
 
																+    all_roc_auc_score = roc_auc_score(all_y_data, all_y_model)
															
 
																     # stats of dataset sizes
															
 
																     total_samples = final_df_train_size + val_set_size + test_set_size
															
@@ -224,9 +235,20 @@ def main():
 
																     model_scores.append(all_accuracy)
															
 
																     model_scores.append(train_f1)
															
 
																+    model_scores.append(train_recall)
															
 
																+    model_scores.append(train_roc_auc)
															
 
																+
															
 
																     model_scores.append(val_f1)
															
 
																+    model_scores.append(val_recall)
															
 
																+    model_scores.append(val_roc_auc)
															
 
																+
															
 
																     model_scores.append(test_f1)
															
 
																+    model_scores.append(test_recall)
															
 
																+    model_scores.append(test_roc_auc)
															
 
																+
															
 
																     model_scores.append(all_f1_score)
															
 
																+    model_scores.append(all_recall_score)
															
 
																+    model_scores.append(all_roc_auc_score)
															
 
																     # TODO : improve...
															
 
																     # check if it's always the case...