2012-02-02 9 views
0

Я прошел через jama и colt (код в java). Оба они ожидают, что я буду использовать массивы так, чтобы количество строк было больше, чем количество coloumns.Проблемы с svd в java

Но в случае латентного семантического анализа (LSA) у меня есть 5 книг, и есть всего 1000 нечетных слов. Когда я использую матрицу терминов, я получаю матрицу 5 * 1000.

Поскольку это не работает, я вынужден переносить матрицу. При транспозиции я использую 1000 * 5. С 1000 * 5, когда я выполняю svd, я получаю S-матрицу с 5 * 5. Для выполнения уменьшения размерности матрица 5 * 5 выглядит маленькой.

Что можно сделать?

ответ

0

Размер текстового сегмента, который вы используете, слишком велик. Документ (столбец) должен представлять собой страницу или несколько страниц текста, возможно, главу на самом большом. Я также видел размер абзаца.

 Смежные вопросы

  • Нет связанных вопросов^_^