0

Я пытаюсь сделать классификацию текста используя weka 3.7 explorer. Я преобразовал 2 текстовых файла (разделенных на два класса dir class1 и class2) в arff с помощью текстового загрузчика. Прежде чем это сделать, я стандартизовал случай, чтобы опустить. Теперь, когда я загружаю файл в weka и применяю фильтр stringtowordvector (например, стоп-слова, usewordcount, usestoplist, stemmer - snowballstemmer), я не вижу никаких изменений в моем списке переменных. Все переменные (слова) задаются как 1 или 0 для каждого класса.weka 3.7 explorer не может классифицировать текст

Пожалуйста, помогите мне.

Вот моя команда фильтра

weka.filters.unsupervised.attribute.StringToWordVector -R первый-последний -W 1000 -prune скорости -1,0 -C -N 0 -S -stemmer weka.core.stemmers .SnowballStemmer -M 1 -tokenizer "weka.core.tokenizers.WordTokenizer -delimiters \" \ r \ n \ t.,;: \\ '\\ "()?! \" "

ответ

0

Это случилось со мной когда я хотел прочитать из .csv и использовать вектор StringToWord.

Моя проблема заключалась в том, что текстовый атрибут имел тип номинальный, а не String. Я использовал класс «NominalToString», использовал его для изменения значений в String и то это сработало.

 Смежные вопросы

  • Нет связанных вопросов^_^