Я делаю классификацию текста с помощью нейронной сети свертывания. В примере MNIST у них есть 60 000 изображений примеров рукописных цифр, каждое изображение имеет размер 28 x 28 и 10 меток (от 0 до 9). Таким образом, размер вес будет 784 * 10 (28 * 28 = 784)Функция стоимости для нейронной сети свертки
Вот их код:
x = tf.placeholder("float", [None, 784])
W = tf.Variable(tf.zeros([784,10]))
b = tf.Variable(tf.zeros([10]))
В моем случае, я применил word2vec кодировать документы. Результат «размер словаря» встраивания слов - 2000, а размер внедрения - 128. Существует 45 меток. Я попытался сделать то же, что и в примере, но это не сработало. Вот что я сделал: я обрабатывал каждый документ так же, как изображение. Например, документ может быть представлен как матрица 2000 x 128 (для слов, отображаемых в документе I, добавлено значение слова «Вектор» для этого столбца и оставлено другим равным нулю. У меня возникли проблемы с созданием W и x, так как мои входные данные NumPy массив 2000 х 128, а x = tf.placeholder("float", [None, 256000])
. размер не соответствует.
Может NAY один предложить любые советы?
Благодарности
Спасибо, но я до сих пор не понимаю, почему мы должны установить None, так как я ничего не видел о пакете. Прошлой ночью я подумал о матричном умножении, и у меня был идеал, который я мог бы установить W [128, 10], поэтому, когда мы умножаем W [128, 10] и x [2000, 128], получаем выходную матрицу [2000, 10]. Что вы думаете об этом? – ngoduyvu
'None' устанавливается, когда мы не хотим размер жесткого кода, таким образом, партия может иметь переменный размер. В примере [MNIST] (https://github.com/tensorflow/tensorflow/blob/r0.10/tensorflow/examples/tutorials/mnist/mnist_softmax.py) партии имеют размер 100 (см. Строку 52). Поэтому в вашем случае 'x' имеет размер' [None, 256000] ', поэтому' W' должен иметь размер '[256000, 10]' где '10' - количество выходов уровня. –
Привет, я сожалею о том, что вы используете borther, но я пытаюсь передать свои данные в свертку нейронной сети как [пример кода] [1], но действительно застрял в функции стоимости. Не могли бы вы предложить, как должен быть размер моей стоимости? [1]: https: //github.com/dennybritz/cnn-text-classification-tf/blob/master/text_cnn.py – ngoduyvu