Учитывая это простой файл CSV:RandomForestClassfier.fit(): ValueError: не удалось преобразовать строку плавать
A,B,C
Hello,Hi,0
Hola,Bueno,1
Очевидно, что реальный набор данных является гораздо более сложным, чем это, но это один воспроизводит ошибку. Я пытаюсь построить случайный лесной классификатор для него, например, так:
cols = ['A','B','C']
col_types = {'A': str, 'B': str, 'C': int}
test = pd.read_csv('test.csv', dtype=col_types)
train_y = test['C'] == 1
train_x = test[cols]
clf_rf = RandomForestClassifier(n_estimators=50)
clf_rf.fit(train_x, train_y)
Но я получаю это отслеживающий при вызове годных():
ValueError: could not convert string to float: 'Bueno'
scikit учиться версии 0.16.1 ,
Спасибо. В итоге я нашел решение с помощью DictVectorizer. Я немного удивлен, что нет лучшей документации для решения таких проблем. Я бы поднял голову, если бы у меня было достаточно кармы. – nilkn