Я хочу запустить молоток, используя опцию --use-ngrams true, но не могу заставить его работать. Я импортировал свои данные с помощью: ./bin/mallet import-dir --input path --output topic-input.mallet -
Я пытаюсь получить список тем из большого корпуса новостных статей, я планирую использовать gensim для извлечения распределения тем для каждого документа с помощью LDA. Я хочу знать формат обработанны
Я попытался запустить этот code from github (после 1-2-3 шагов), который идентифицирует 30 тем в 14 500 сообщениях Сара Пэлина. Темы, обнаруженные автором, - here. Тем не менее, Stanford Theme Modelin
Я изучил модели LDA и темы в течение нескольких недель. Но из-за моей плохой математической способности я не могу полностью понять ее внутренние алгоритмы. Я использовал реализацию GibbsLDA, ввел мног
Я создал термин векторов, как указано here так: ~/Scripts/Mahout/trunk/bin/mahout seqdirectory --input /home/ben/Scripts/eipi/files --output /home/ben/Scripts/eipi/mahout_out -chunk 1
~/Scripts/Mahou