У меня есть dataframe под названием статьиКак я конвертировать искры dataframe в РДУ и получить мешок слов
+--------------------+
| processed_title|
+--------------------+
|[new, relictual, ...|
|[once, upon,a,time..|
+--------------------+
Я хочу, чтобы сгладить его, чтобы получить его как мешок слов. Как я могу достичь этого, используя текущую ситуацию. Я пробовал код ниже, который, кажется, дает мне проблему несоответствия типа.
val bow_corpus = article.select("processed_title").rdd.flatMap(y => y)
В конечном итоге я хочу использовать этот bow_corpus для обучения модели word2vec.
Благодаря