Я пытаюсь классифицировать цифры (0-9), используя LeNet.caffe.io.Transformer для использования в классификации LeNet
Я читал изображения размера 28x28, транспонировал их и отправлял один цветный канал в сеть.
bild = mpimg.imread('pathToImg')
bild = np.transpose(bild,(2,0,1))
И получить предсказания, которые не имеют никакого смысла. Я вижу, что у PyCaffe есть Трансформатор, который выполняет эту работу, но я не знаю, как использовать его для LeNet.
Я использую сеть от Caffe/примеры/mnist (надеюсь, что ответы, какие данные чистые ожидает).
Единственное, что отличается тем, что вход в настоящее время:
input_shape {
dim: 1
dim: 1
dim: 28
dim: 28
}
какой ввод ожидает ваша сеть? 'float32' в диапазоне [0..255], диапазон [0..1]? ваша сеть вычитает среднее значение изображения? почему бы вам не перейти на серый? как были обработаны материалы во время обучения сети? – Shai
Обновлен вопрос –