У меня около 100000 документов различной длины слова. Я также подготовил модель word2vec для всего корпуса. Теперь, как мне перейти от этого слова-вектора к созданию функций одного измерения для каждого отдельного документа?Как создать функции документа из word-векторов?
Мне известно о нескольких методах, как это можно сделать, нужно взять простое среднее векторов всех слов в документе, а другое - кластеризация k-средних.
Можете ли вы предложить другой способ выполнения этой задачи?