2015-04-27 5 views
3

Я пытаюсь создать многоуровневый классификатор с scikit-learn для текстов. Я новичок в изучении scikit, и я не знаю, можно ли создать классификатор для текста. Мое намерение состоит в использовании многоуровневой SVM, но не знаю, нужно ли мне адаптировать тексты для обучения классификатора, иначе вы можете работать непосредственно с текстами. Кто-нибудь знает какую-либо документацию по этому вопросу?многослотовая классификация для текста с scikit learn

ответ

4

Вы можете обратиться к этому примеру: Classification of text documents using sparse features

, который может дать вам обличитель не только мультиклассирую, но и основная горнодобывающий текст деталь:

  • векторизатора и хэширование
  • выбор признаков
  • Обработка разреженных данных
  • Сравнение различных основных моделей
+0

Спасибо, это именно то, что мне нужно для начала. – Blunt

 Смежные вопросы

  • Нет связанных вопросов^_^