Я пытаюсь использовать LibSVM в Weka. В моем наборе данных .arff у меня есть @attribute attr1 String. Но когда я проверил возможности LibSVM, я понял, что LibSVM не поддерживает атрибуты String. Есть ли способ преобразовать строку в числовое значение, поэтому я могу сохранить ее в своем наборе данных.Строковые атрибуты в файле .arff для LibSVM, Weka.
1
A
ответ
3
Если это действительно строка (а не номинальное значение), вы можете использовать StringToWordVector
Преобразование строки атрибутов в набор атрибутов, представляющих вхождение слова (в зависимости от Tokenizer) информацию из текста, содержащегося в строках. Набор слов (атрибутов) определяется первой периодической фильтрацией (обычно данными обучения).
Это действительно зависит от того, что вы хотите выбраться из строки. Если это не «нормальный» текст, а что-то вроде последовательности ДНК, вам нужно что-то совершенно другое.
Спасибо. Я решил отказаться от текстовой функции из моей учебной модели. Но в любом случае спасибо – star2014
Из интереса, какой он атрибут строки? Мне любопытно – Sentry
Я работаю над проектами с открытым исходным кодом, я хотел использовать описание ошибки из системы отслеживания ошибок как одну из особенностей модели поезда :) – star2014