Я пытаюсь сделать классификацию текста используя weka 3.7 explorer. Я преобразовал 2 текстовых файла (разделенных на два класса dir class1 и class2) в arff с помощью текстового загрузчика. Прежде чем это сделать, я стандартизовал случай, чтобы опустить. Теперь, когда я загружаю файл в weka и применяю фильтр stringtowordvector (например, стоп-слова, usewordcount, usestoplist, stemmer - snowballstemmer), я не вижу никаких изменений в моем списке переменных. Все переменные (слова) задаются как 1 или 0 для каждого класса.weka 3.7 explorer не может классифицировать текст
Пожалуйста, помогите мне.
Вот моя команда фильтра
weka.filters.unsupervised.attribute.StringToWordVector -R первый-последний -W 1000 -prune скорости -1,0 -C -N 0 -S -stemmer weka.core.stemmers .SnowballStemmer -M 1 -tokenizer "weka.core.tokenizers.WordTokenizer -delimiters \" \ r \ n \ t.,;: \\ '\\ "()?! \" "