2016-06-03 2 views
-2

У меня около 100000 документов различной длины слова. Я также подготовил модель word2vec для всего корпуса. Теперь, как мне перейти от этого слова-вектора к созданию функций одного измерения для каждого отдельного документа?Как создать функции документа из word-векторов?

Мне известно о нескольких методах, как это можно сделать, нужно взять простое среднее векторов всех слов в документе, а другое - кластеризация k-средних.

Можете ли вы предложить другой способ выполнения этой задачи?

ответ