2016-10-05 9 views
0

Недавно я прочитал word2vec. Я хотел разобраться в CBOW (Непрерывная сумка Word Model) полностью. Для этого я прочитал лекционные заметки и получил некоторое понимание, а затем решил удалить некоторые недочеты из кода, если имеется хорошая реализация. Я нашел код Google для word2vec. У него есть .sh-файлы, что означает, что он будет работать на linux и .c файлы также даны, но есть , что очень не комментирует код. Также я не нашел никакой документации до сих пор, чтобы понять код в хорошем смысле.CBOW (Непрерывная сумка слова) Понятный код

Затем я прошел через another implementation, который находится в Java, но имеют свои собственные проблемы, как знаменитая, DEBUG org.reflections.Reflections - не может сканировать файл (имя файла) в URL-адрес баночке: Файл:

ли существует ли какая-либо другая реализация, видя, что лучше понять CBOW лучше в окнах вместо linux? Если кто-нибудь может мне помочь, я буду благодарен вам.

ответ

0

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: Это ссылка на мой собственный код на GitHub.

Я недавно написал реализацию C# GPU от CBOW Word2Vec и опубликован на GitHub здесь: https://github.com/robosoup/Athena

Он реализует все функции, как указано в статье Томаса Mikolov в 2013 - в том числе подвыборки частых терминов, динамический размер окна и отрицательный выбор.

Если вы знакомы с C#, это должно быть довольно легко понять.

 Смежные вопросы

  • Нет связанных вопросов^_^