the-assignment/classifier/visualization/visualization.py

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

dataset = pd.read_pickle('../preprocessing/dataset.pkl')
target = dataset.pop('target')

# Feature evaluation
from sklearn.ensemble import ExtraTreesClassifier
from sklearn.feature_selection import SelectFromModel

clf = ExtraTreesClassifier(n_estimators=1000)
clf = clf.fit(dataset, target)

model = SelectFromModel(clf, prefit=True, max_features = 6)
print('Retaining features:')
print(dataset.columns.values[model.get_support()])
reducedDataset = pd.DataFrame(model.transform(dataset),
	columns = dataset.columns.values[model.get_support()])

# Every combination of the 6 best features with length equal to 4 features
import itertools
featureCombinations = itertools.combinations(range(6), 4)

for plotIndex, subset in enumerate(featureCombinations):
	featurePlot = sns.pairplot(data=(reducedDataset.iloc[:, list(subset)]).assign(target=target),
		hue='target', palette='Set1', vars=reducedDataset.columns.values[list(subset)]);
	featurePlot.fig.savefig("output/figure_" + str(plotIndex+1) + ".png")

# sns.relplot(x="4HzMod", y="Flat", data=dataset[["4HzMod", "Flat"]], hue = target, style = target)
# sns.jointplot(x="SLAtt", y="ZCR", data=dataset[["SLAtt", "ZCR"]]);
# plt.show()
Init visualization, Add compined wav test file 6 years ago			`import numpy as np`
			`import pandas as pd`
			`import matplotlib.pyplot as plt`
			`import seaborn as sns`
			`sns.set()`

Migrate structures to pandas DataFrame, Complete visualization, Minor fixes and improvements 6 years ago			`dataset = pd.read_pickle('../preprocessing/dataset.pkl')`
			`target = dataset.pop('target')`
Init visualization, Add compined wav test file 6 years ago
Migrate structures to pandas DataFrame, Complete visualization, Minor fixes and improvements 6 years ago			`# Feature evaluation`
			`from sklearn.ensemble import ExtraTreesClassifier`
			`from sklearn.feature_selection import SelectFromModel`
Init visualization, Add compined wav test file 6 years ago
Migrate structures to pandas DataFrame, Complete visualization, Minor fixes and improvements 6 years ago			`clf = ExtraTreesClassifier(n_estimators=1000)`
			`clf = clf.fit(dataset, target)`

			`model = SelectFromModel(clf, prefit=True, max_features = 6)`
			`print('Retaining features:')`
			`print(dataset.columns.values[model.get_support()])`
			`reducedDataset = pd.DataFrame(model.transform(dataset),`
			`columns = dataset.columns.values[model.get_support()])`

			`# Every combination of the 6 best features with length equal to 4 features`
			`import itertools`
			`featureCombinations = itertools.combinations(range(6), 4)`

			`for plotIndex, subset in enumerate(featureCombinations):`
			`featurePlot = sns.pairplot(data=(reducedDataset.iloc[:, list(subset)]).assign(target=target),`
			`hue='target', palette='Set1', vars=reducedDataset.columns.values[list(subset)]);`
			`featurePlot.fig.savefig("output/figure_" + str(plotIndex+1) + ".png")`

			`# sns.relplot(x="4HzMod", y="Flat", data=dataset[["4HzMod", "Flat"]], hue = target, style = target)`
			`# sns.jointplot(x="SLAtt", y="ZCR", data=dataset[["SLAtt", "ZCR"]]);`
			`# plt.show()`