Я хочу создать текстовый файл, который по существу является словарем, причем каждое слово сопряжено с его векторным представлением через word2vec. Я предполагаю, что процесс должен состоять в том, чтобы сначала подготовить word2vec, а затем просмотреть каждое слово из моего списка и найти его представление (а затем сохранить его в новом текстовом файле)?Как получить векторы для списка слов с помощью Word2Vec?
Я новичок в word2vec, и я не знаю, как это сделать. Я прочитал несколько основных сайтов и несколько вопросов о Stack, но пока не нашел хорошего учебника.
Это довольно просто. Я сделал это в прошлом. Вы хотите использовать какой-либо конкретный язык? Вы можете напрямую использовать код автора (на C++) для обучения и извлечения векторов. Это просто 600-700 строк оптимизированного кода. Я могу помочь с точными аргументами, если вы этого потребуете. – Naman
Я бы предпочел Java, но все, что мне действительно нужно сделать, это сделать словарь на любом языке, а затем загрузить этот текстовый файл в мою программу Java, поэтому любой язык, вероятно, будет работать – jonbon
https://code.google.com/p/ word2vec/является исходным авторским кодом. Это очень просто тренироваться. Единственное, что выводит вектор в двоичный файл. Вы можете легко преобразовать его в текстовый файл. – Naman