2017-02-06 11 views
1

Мне интересно записать вывод данного слоя Caffe в файл. Я хотел бы сделать это для нескольких изображений, поэтому я внес некоторые изменения в код уровня выходного уровня HDF5, чтобы создать файл для каждого изображения, который содержит функции для каждого изображения. Вот модифицированная функция SaveBlobs:Почему выходной слой HDF5 Output Caffe записывает данные, по-видимому, неправильные размеры?

template <typename Dtype> void HDF5OutputLayer<Dtype>::SaveBlobs() {        
    LOG(INFO) << "Saving HDF5 file " << file_name_ << "ds: " << ds_iter_; 
    CHECK_EQ(data_blob_.num(), label_blob_.num()) <<      
     "data blob and label blob must have the same batch size";   

    // Open hdf5 file to write this blob         
    file_name_ = this->layer_param_.hdf5_output_param().file_name();   
    ostringstream appender;             
    appender << "_" << ds_iter_ << ".h5";         
    file_name_.append(appender.str());          
    file_id_ = H5Fcreate(file_name_.c_str(), H5F_ACC_TRUNC, H5P_DEFAULT, 
         H5P_DEFAULT);          
    CHECK_GE(file_id_, 0) << "Failed to open HDF5 file" << file_name_;   

    // Write the data and label            
    hdf5_save_nd_dataset(file_id_, HDF5_DATA_DATASET_NAME, data_blob_);  
    hdf5_save_nd_dataset(file_id_, HDF5_DATA_LABEL_NAME, label_blob_);   
    LOG(INFO) << "Successfully saved " << data_blob_.num() << " rows";   
    LOG(INFO) << "SAVEBLOB - Data size is: " << data_blob_.shape_string(); 
    LOG(INFO) << "SAVEBLOB - Label size is: " << label_blob_.shape_string(); 

    // Close the file              
    herr_t status = H5Fclose(file_id_);          
    CHECK_GE(status, 0) << "Failed to close HDF5 file " << file_name_;   

    // Update iterator for next image          
    ds_iter_++;                
} 

Код почти отлично работает, так как я могу успешно создать файлы для каждого изображения, которые делают на самом деле содержат данные. К сожалению, похоже, что записываются неправильные данные, так как указаны как размеры, отображаемые в журнале, так и в результирующем выходном файле. Вот где я указываю мой выходной слой (в сети прототекст):

layer {                 
    name: "conv5_3"               
    type: "Convolution"              
    bottom: "conv5_2"              
    top: "conv5_3"               
    param {                 
    lr_mult: 1               
    decay_mult: 1               
    }                  
    param {                 
    lr_mult: 2               
    decay_mult: 0               
    }                  
    convolution_param {              
    num_output: 512              
    pad: 1                
    kernel_size: 3              
    }                  
}                   
layer {                 
    name: "relu5_3"               
    type: "ReLU"               
    bottom: "conv5_3"              
    top: "conv5_3"               
}                   

#===== Data Logging =======            

layer {                 
    type: "HDF5Output"              
    name: "hdf5output"              
    bottom: "conv5_3" #             
    bottom: "conv5_3" #             
    hdf5_output_param {             
    # File name is only a base           
    file_name: "./test_features/image"         
    }                  
} 

Моя причина полагать, что неправильно данные сохраняются, потому что, когда я наблюдаю настройки сети, размеры для верхней части conv5_3 являются представлены следующим образом:

I0206 23:07:44.815330 7630 layer_factory.hpp:77] Creating layer conv5_3_relu5_3_0_split 
I0206 23:07:44.815343 7630 net.cpp:106] Creating Layer conv5_3_relu5_3_0_split 
I0206 23:07:44.815348 7630 net.cpp:454] conv5_3_relu5_3_0_split <- conv5_3 
I0206 23:07:44.815356 7630 net.cpp:411] conv5_3_relu5_3_0_split -> conv5_3_relu5_3_0_split_0 
I0206 23:07:44.815366 7630 net.cpp:411] conv5_3_relu5_3_0_split -> conv5_3_relu5_3_0_split_1 
I0206 23:07:44.815372 7630 net.cpp:411] conv5_3_relu5_3_0_split -> conv5_3_relu5_3_0_split_2 
I0206 23:07:44.815382 7630 net.cpp:411] conv5_3_relu5_3_0_split -> conv5_3_relu5_3_0_split_3 
I0206 23:07:44.815459 7630 net.cpp:150] Setting up conv5_3_relu5_3_0_split 
I0206 23:07:44.815467 7630 net.cpp:157] Top shape: 1 512 14 14 (100352) 
I0206 23:07:44.815474 7630 net.cpp:157] Top shape: 1 512 14 14 (100352) 
I0206 23:07:44.815479 7630 net.cpp:157] Top shape: 1 512 14 14 (100352) 
I0206 23:07:44.815484 7630 net.cpp:157] Top shape: 1 512 14 14 (100352) 
I0206 23:07:44.815495 7630 net.cpp:165] Memory required for data: 116006912 
I0206 23:07:44.815500 7630 layer_factory.hpp:77] Creating layer hdf5output 
I0206 23:07:44.815511 7630 net.cpp:106] Creating Layer hdf5output 
I0206 23:07:44.815515 7630 net.cpp:454] hdf5output <- conv5_3_relu5_3_0_split_0 
I0206 23:07:44.815521 7630 net.cpp:454] hdf5output <- conv5_3_relu5_3_0_split_1 
I0206 23:07:44.815527 7630 net.cpp:150] Setting up hdf5output 
I0206 23:07:44.815531 7630 net.cpp:165] Memory required for data: 116006912 

так здорово, я ожидаю получить данные измерений 1 512 14 14. к сожалению, когда я бегу умозаключение на модели, которую я вижу в моем журнале, что неправильные размеры обнаруживаются:

I0206 23:07:46.108660 7630 hdf5_output_layer.cpp:31] Saving HDF5 file ds: 0 
I0206 23:07:46.115536 7630 hdf5_output_layer.cpp:48] Successfully saved 1 rows 
I0206 23:07:46.115557 7630 hdf5_output_layer.cpp:49] SAVEBLOB - Data size is: 1 512 54 38 (1050624) 
I0206 23:07:46.115566 7630 hdf5_output_layer.cpp:50] SAVEBLOB - Label size is: 1 512 54 38 (1050624) 
I0206 23:07:46.316557 7630 hdf5_output_layer.cpp:31] Saving HDF5 file ./test_features/image_0.h5ds: 1 
I0206 23:07:46.322437 7630 hdf5_output_layer.cpp:48] Successfully saved 1 rows 
I0206 23:07:46.322456 7630 hdf5_output_layer.cpp:49] SAVEBLOB - Data size is: 1 512 56 38 (1089536) 
I0206 23:07:46.322463 7630 hdf5_output_layer.cpp:50] SAVEBLOB - Label size is: 1 512 56 38 (1089536) 
I0206 23:07:46.457828 7630 hdf5_output_layer.cpp:31] Saving HDF5 file ./test_features/image_1.h5ds: 2 
I0206 23:07:46.463618 7630 hdf5_output_layer.cpp:48] Successfully saved 1 rows 
I0206 23:07:46.463636 7630 hdf5_output_layer.cpp:49] SAVEBLOB - Data size is: 1 512 38 50 (972800) 
I0206 23:07:46.463644 7630 hdf5_output_layer.cpp:50] SAVEBLOB - Label size is: 1 512 38 50 (972800) 
I0206 23:07:46.594746 7630 hdf5_output_layer.cpp:31] Saving HDF5 file ./test_features/image_2.h5ds: 3 

Это показывает, что не только размеры выходного сигнала неверны, но также различаются между итерациями (изображениями)! Размеры, отображаемые в журнале, соответствуют размерам данных, записанных в файлы h5, поэтому журнал точно описывает поведение кода. Мой вопрос: почему это может быть так? Казалось бы, я все правильно установил, но должно быть что-то, чего мне не хватает ...

+0

Вы уверены, что все входные изображения, которые вы передаете в сеть, имеют одинаковый размер? – hbaderts

+0

Спасибо за ответ! Изображения JPEG имеют разный размер, однако уровень входных данных задается как 1 x 3 x 224 x 224. Таким образом, похоже, что в отношении всей сети все изображения имеют тот же размер, что и размеры этих входных размеров , – Kantthpel

+1

Позвольте мне угадать: ваше первое изображение - 864x608 пикселей, второе - 896x608 пикселей, а третье - 608x800 пикселей? Можете ли вы показать, как вы загружаете изображения в сеть? То есть какой уровень данных у вас есть, и как вы управляете caffe? Я думаю, что ваш модифицированный уровень HDF5 прекрасен, и проблема с загрузкой данных. – hbaderts

ответ

0

Как @hbaderts помог мне разобраться, выясняется, что уровень HDF5 правильный и выводит данные из правильные размеры. Моя путаница с измерениями была связана с кажущимся статическим определением размеров ввода в тестовой версии сетевого прототекста. Оказывается, что, поскольку я загружаю данные с помощью функции pycaffe net.forward (** forward_kwargs), сверточные слои масштабируются, чтобы соответствовать различным входным размерам моих входных изображений. Это объясняет как размерность, чем ожидалось, так и тот факт, что они различаются между изображениями.