1

Я хочу классифицировать текстовые документы с использованием представлений doc2vec и моделей scikit-learn.scikit-learn классификация с использованием представления doc2vec

Моя проблема в том, что я потерял начало работы. может кто-нибудь объяснить общие шаги, которые обычно принимаются, чтобы использовать doc2vec с scikit-learn?

ответ

1

Существует большой учебник here для двоичной классификации с помощью scikit-learn + doc2vec. Короче говоря:

  • Использование gensim для обучения/загрузки модели doc2vec.
  • Текст ввода будет преобразован в вектор фиксированного размера поплавков (то же измерение, что и вложение). Это фактические функции ввода.
  • Теперь не стесняйтесь использовать любой классификатор в scikit-learn.

 Смежные вопросы

  • Нет связанных вопросов^_^