import pandas as pd
from RAISING.hp_tune_select import *

df = pd.read_csv("sim1.csv")

X_data = df.iloc[:,14:]
X_data.columns = ["X" + str(i) for i in range(1, X_data.shape[1]+1)]

y_data = df.iloc[:,1:11]
print(X_data.head())
print(y_data.head())

Bayesian_tune_model = hp_optimization(input_data=X_data, output_data=y_data, objective_fun="val_loss", output_class="continuous",
                                      algorithm = "Bayesian",model_file = "Bayesian_NN_architecture_HP.keras", max_trials=30)

print(Bayesian_tune_model.summary())

RS_tune_model = hp_optimization(input_data=X_data, output_data=y_data, objective_fun="val_loss", output_class="continuous",
                                algorithm = "RandomSearch",model_file = "RS_NN_architecture_HP.keras", max_trials=50)

print(RS_tune_model.summary())

RSLM_tune_model = hp_optimization(input_data=X_data, output_data=y_data, objective_fun="val_loss", output_class="continuous",
                                  algorithm = "RSLM",model_file = "RSLM_NN_architecture_HP.keras", max_trials=50)

print(RSLM_tune_model.summary())

Hyperband_tune_model = hp_optimization(input_data=X_data, output_data=y_data, objective_fun="val_loss", output_class="continuous",
                                       algorithm = "Hyperband",model_file = "Hyperband_NN_architecture_HP.keras", max_epochs=20)

print(Hyperband_tune_model.summary())

Bayesian_CV_tune_model = hp_optimization(input_data=X_data, output_data=y_data, objective_fun="val_loss", output_class="continuous",
                                         algorithm = "Bayesian",model_file = "Bayesian_CV_NN_architecture_HP.keras", 
                                         cross_validation = True,max_trials=20)

Bayesian_US_tune_model = hp_optimization(input_data=X_data, output_data=y_data, objective_fun="val_loss", output_class="continuous",
                                         algorithm = "Bayesian",model_file = "Bayesian_US_NN_architecture_HP.keras",max_trials=20,
                                        config_file = "hyperparameter_config.json")

import matplotlib.pyplot as plt
import numpy as np

actual_pos = [101,111,121,131,141,151,161,171,181,191]

def minmaxscale(vec):
        return((vec - min(vec))/(max(vec) - min(vec)))

def plot_feature_importance(GenFeat_df,actual_pos):
    GenFeat_df["scaled_feat"] = minmaxscale(vec = GenFeat_df["envir2"])
    GenFeat_df["loci_index"] = GenFeat_df.index+1
    plt.figure(figsize=(10, 6))
    plt.plot(GenFeat_df['loci_index'], GenFeat_df['scaled_feat'], marker='o', linestyle='-', color='b')
    highlight_df = GenFeat_df[GenFeat_df['loci_index'].isin(actual_pos)]
    plt.scatter(highlight_df['loci_index'], highlight_df['scaled_feat'], color='red', zorder=5)
    plt.title('Line Plot of Scaled Features by Loci corresponding to linear environment')
    plt.xlabel('Loci Index')
    plt.ylabel('Scaled Feature')
    plt.grid(True)
    plt.show()

DeepFeatImp_df = feature_importance(input_data=X_data, output_data=y_data, feature_set=X_data.columns.to_list(),iteration=1, 
                                    feature_method="DeepFeatImp",model_file = "Bayesian_NN_architecture_HP.keras")

plot_feature_importance(GenFeat_df=DeepFeatImp_df.copy(),actual_pos = actual_pos)

DeepFeatImp_df = feature_importance(input_data=X_data, output_data=y_data, feature_set=X_data.columns.to_list(),iteration=5, 
                                    feature_method="DeepFeatImp",model_file = "Bayesian_NN_architecture_HP.keras")

plot_feature_importance(GenFeat_df=DeepFeatImp_df.copy(),actual_pos = actual_pos)

DeepExplainer_df = feature_importance(input_data=X_data, output_data=y_data, feature_set=X_data.columns.to_list(), iteration=5, 
                                      feature_method="DeepExplainer",model_file = "Bayesian_NN_architecture_HP.keras")

plot_feature_importance(GenFeat_df=DeepExplainer_df.copy(),actual_pos = actual_pos)

KernelExplainer_df = feature_importance(input_data=X_data, output_data=y_data, feature_set=X_data.columns.to_list(), iteration=1, 
                                        feature_method="KernelExplainer",nsamples=10,model_file = "Bayesian_NN_architecture_HP.keras")

plot_feature_importance(GenFeat_df=KernelExplainer_df.copy(),actual_pos = actual_pos)

from sklearn.datasets import load_breast_cancer

X_data, y_data = load_breast_cancer(return_X_y=True, as_frame=True)
y_data = pd.DataFrame(y_data)

Bayesian_tune_model_binary = hp_optimization(input_data=X_data, output_data=y_data, objective_fun="val_loss", output_class="binary",
                                      algorithm = "Bayesian",model_file = "Bayesian_binary_NN_architecture_HP.keras", max_trials=20)

print(Bayesian_tune_model_binary.summary())

DeepFeatImp_df_binary = feature_importance(input_data=X_data, output_data=y_data, feature_set=X_data.columns.to_list(),iteration=10, 
                                    output_class = "binary",feature_method="DeepFeatImp",
                                    model_file = "Bayesian_binary_NN_architecture_HP.keras")

DeepFeatImp_df_binary["scaled_feat"] = minmaxscale(vec = DeepFeatImp_df_binary["target"])
DeepFeatImp_df_binary = DeepFeatImp_df_binary.sort_values(by='target', ascending=False)

plt.figure(figsize=(10, 6))
plt.barh(DeepFeatImp_df_binary['features'], DeepFeatImp_df_binary['target'], color='skyblue')
plt.xlabel('Feature Importance')
plt.gca().invert_yaxis()  # Invert y-axis to have the highest importance at the top
plt.show()

RAISING demonstration¶

Import required libraries¶

Load simulated data¶

Hyperparameter tuning methods implementation¶

1) Hyperparameter tuning using Bayesian optimization¶

2) Hyperparameter tuning using RandomSearch¶

3) Hyperparameter tuning using RSLM¶

4) Hyperparameter tuning using Hyperband¶

5) Hyperparameter tuning using Bayesian optimization with cross-validation¶

5) Hyperparameter tuning using Bayesian optimization with user-defined hyperparameter space¶

Creating a function to generate the plots of feature importance estimates¶

Feature Selection methods implementation on architecture obtained using Bayesian optimization¶

1) DeepFeatImp method¶

2) DeepExplainer method¶

3) KernelExplainer method¶

Binary classification example with Bayesian optimization method and DeepFeatImp¶