Как использовать vgg-net при загрузке vgg16_weights.h5?

Я использую VGG-16 Net by keras. Это detail Как использовать vgg-net при загрузке vgg16_weights.h5?

Моя проблема заключается в том, как использовать эту сеть для точной настройки, и должен ли я использовать размер изображения 224 * 224 для этой сети? И я должен использовать 1000 классов, когда использую эту сеть? , если я не использую 1000 классов, это может вызвать ошибку

Exception: Layer shape (4096L, 10L) not compatible with weight shape (4096, 1000).

обратиться за помощью, спасибо!

источник

2016-04-11 sky

Я отправил подробный ответ in this issue, если вы хотите взглянуть. Следующий фрагмент кода поможет вам с размером вашего последнего слоя:

from keras.models import Sequential, Graph 
from keras.layers import Convolution2D, ZeroPadding2D, MaxPooling2D 
import keras.backend as K 

img_width, img_height = 128, 128 

# build the VGG16 network with our input_img as input 
first_layer = ZeroPadding2D((1, 1), input_shape=(3, img_width, img_height)) 

model = Sequential() 
model.add(first_layer) 
model.add(Convolution2D(64, 3, 3, activation='relu', name='conv1_1')) 
model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(64, 3, 3, activation='relu', name='conv1_2')) 
model.add(MaxPooling2D((2, 2), strides=(2, 2))) 

model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(128, 3, 3, activation='relu', name='conv2_1')) 
model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(128, 3, 3, activation='relu', name='conv2_2')) 
model.add(MaxPooling2D((2, 2), strides=(2, 2))) 

model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(256, 3, 3, activation='relu', name='conv3_1')) 
model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(256, 3, 3, activation='relu', name='conv3_2')) 
model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(256, 3, 3, activation='relu', name='conv3_3')) 
model.add(MaxPooling2D((2, 2), strides=(2, 2))) 

model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(512, 3, 3, activation='relu', name='conv4_1')) 
model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(512, 3, 3, activation='relu', name='conv4_2')) 
model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(512, 3, 3, activation='relu', name='conv4_3')) 
model.add(MaxPooling2D((2, 2), strides=(2, 2))) 

model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(512, 3, 3, activation='relu', name='conv5_1')) 
model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(512, 3, 3, activation='relu', name='conv5_2')) 
model.add(ZeroPadding2D((1, 1))) 
model.add(Convolution2D(512, 3, 3, activation='relu', name='conv5_3')) 
model.add(MaxPooling2D((2, 2), strides=(2, 2))) 

# get the symbolic outputs of each "key" layer (we gave them unique names). 
layer_dict = dict([(layer.name, layer) for layer in model.layers]) 

# load the weights 

import h5py 

weights_path = 'vgg16_weights.h5' 

f = h5py.File(weights_path) 
for k in range(f.attrs['nb_layers']): 
    if k >= len(model.layers): 
     # we don't look at the last (fully-connected) layers in the savefile 
     break 
    g = f['layer_{}'.format(k)] 
    weights = [g['param_{}'.format(p)] for p in range(g.attrs['nb_params'])] 
    model.layers[k].set_weights(weights) 
f.close() 
print('Model loaded.') 

# Here is what you want: 

graph_m = Graph() 
graph_m.add_input('my_inp', input_shape=(3, img_width, img_height)) 
graph_m.add_node(model, name='your_model', input='my_inp') 
graph_m.add_node(Flatten(), name='Flatten', input='your_model') 
graph_m.add_node(Dense(4096, activation='relu'), name='Dense1',  input='Flatten') 
graph_m.add_node(Dropout(0.5), name='Dropout1', input='Dense1') 
graph_m.add_node(Dense(4096, activation='relu'), name='Dense2', input='Dropout1') 
graph_m.add_node(Dropout(0.5), name='Dropout2', input='Dense2') 
graph_m.add_node(Dense(10, activation='softmax'), name='Final', input='Dropout2') 
graph_m.add_output(name='out1', input='Final') 
sgd = SGD(lr=0.1, decay=1e-6, momentum=0.9, nesterov=True) 
graph_m.compile(optimizer=sgd, loss={'out1': 'categorical_crossentropy'})

Обратите внимание, что вы могли бы заморозить подготовку слоев извлечения признаков и только тонкую настройку последние полностью связанные слои. Из doc вы должны добавить trainable = False, чтобы заморозить тренировку слоя. Ex заморожена:

... 
model.add(Convolution2D(512, 3, 3, activation='relu', name='conv5_1', trainable=False)) 
...

Ex обучаемого:

... 
model.add(Convolution2D(512, 3, 3, activation='relu', name='conv5_1',  trainable=True)) 
...

trainable является True по умолчанию, так что что-то произойдет, если вы не знаете об этой функции ...

источник

2016-04-11 21:31:10

Спасибо очень много !! В вашем коде вы означаете, что мне просто нужно отредактировать последний уровень для моего номера классов? и если весь слой, который я устанавливаю trainable = False, означает, что значение по умолчанию в файле h5 не может быть обновлено? – sky

Точно, и это будет намного быстрее, чтобы обучить сеть вашей проблеме. –

Обратите внимание, что вместо графической модели вы можете использовать вторую последовательную модель. –

Как использовать vgg-net при загрузке vgg16_weights.h5?

ответ

Смежные вопросы