Объект Word2Vec в gensim
имеет параметр null_word
, который не поясняется в документах.Что такое параметр «null_word» в gensim Word2Vec?
класс gensim.models.word2vec.Word2Vec (предложения = нет, размер = 100, альфа = 0,025, окна = 5, min_count = 5, max_vocab_size = нет, образец = 0,001, семян = 1, рабочие = 3 , min_alpha = 0,0001, SG = 0, Hs = 0, отрицательное значение = 5, cbow_mean = 1, hashfxn =, ITER = 5, null_word = 0, trim_rule = нет, sorted_vocab = 1, batch_words = 10000)
Что такое параметр null_word
?
Проверка кода на https://github.com/RaRe-Technologies/gensim/blob/develop/gensim/models/word2vec.py#L680, говорится:
if self.null_word:
# create null pseudo-word for padding when using concatenative L1 (run-of-words)
# this word is only ever input – never predicted – so count, huffman-point, etc doesn't matter
word, v = '\0', Vocab(count=1, sample_int=0)
v.index = len(self.wv.vocab)
self.wv.index2word.append(word)
self.wv.vocab[word] = v
Что такое "concatenative L1"?