2016-10-20 3 views
1

Я запускаю алгоритм решений из SciKit Learn, и я хочу получить вектор Feature_importance вместе с именами функций, чтобы я мог определить, какие функции являются доминирующими в процессе маркировки , Не могли бы вы помочь мне? Спасибо.Feature_importance vector в деревьях принятия решений в SciKit Учиться вместе с именами функций

+0

Опубликовать хотя бы то, что вы пробовали. Более того, документация API «sklearn' действительно понятна – MMF

ответ

2

Предположит, что у вас есть образцы в строках pandas.DataFrame:

from pandas import DataFrame 
features = DataFrame({'f1': (1, 2, 2, 2), 'f2': (1, 1, 1, 1), 'f3': (3, 3, 1, 1)}) 
labels = ('a', 'a', 'b', 'b') 

, а затем использовать дерево или лес классификатором:

from sklearn.tree import DecisionTreeClassifier 
classifier = DecisionTreeClassifier() 
classifier.fit(features, labels) 

Тогда важности информации должны соответствовать каркасным колоннам:

for name, importance in zip(features.columns, classifier.feature_importances_): 
    print(name, importance) 

# f1 0.0 
# f2 0.0 
# f3 1.0 
+0

Большое вам спасибо! – AlK