Я пытаюсь создать многоуровневый классификатор с scikit-learn для текстов. Я новичок в изучении scikit, и я не знаю, можно ли создать классификатор для текста. Мое намерение состоит в использовании многоуровневой SVM, но не знаю, нужно ли мне адаптировать тексты для обучения классификатора, иначе вы можете работать непосредственно с текстами. Кто-нибудь знает какую-либо документацию по этому вопросу?многослотовая классификация для текста с scikit learn
3
A
ответ
4
Вы можете обратиться к этому примеру: Classification of text documents using sparse features
, который может дать вам обличитель не только мультиклассирую, но и основная горнодобывающий текст деталь:
- векторизатора и хэширование
- выбор признаков
- Обработка разреженных данных
- Сравнение различных основных моделей
Спасибо, это именно то, что мне нужно для начала. – Blunt