2016-11-16 2 views
0

Здравствуйте, у меня есть подготовленные и проверенные данные. Я пытаюсь использовать функцию привязки склеарна Seelct K Best, чтобы выбрать соответствующие функции и нарисовать гистограмму после. Однако я получаю эту ошибку:Значение: Ошибка Не удалось преобразовать строку в float при использовании Sklearn. Релевантность

ValueError: could not convert string to float: B 

Но я начинаю думать, что у меня есть столбец в моем наборе данных, глядя, как это, которое может быть вопрос:

CancellationCode: 
A 
B 
C 
D 

Если этот столбец вызывает проблему как устранить эту ошибку Вот мой код ниже:

import numpy as np 
from sklearn.feature_selection import SelectKBest, f_classif 
import matplotlib.pyplot as plt 

selector = SelectKBest(f_classif, k=13) 
selector.fit(X_train, y_train) 

scores_select = selector.pvalues_ 
print scores_select 


# Plotting the bar Graph to visually see the weight of each feature 
plt.bar(range(len(scores_select)), scores_select, align='center') 
plt.xticks(range(len(features_columns)), features_columns, rotation='vertical') 
plt.show() 

ответ

2

Вы должны преобразовать категориальные переменные к соскам.

df = pd.get_dummies(df)