1

Im с использованием SDK для глубокого обучения Intel (на основе Caffe).
Я хочу скомпоновать набор фотографий для распознавания монет.
В SDK ожидает набор данных в следующем формате:Глубокое обучение/распознавание образов. Как составить набор данных для одного распознавания категории.

Root 
    --> category a 
    --> photos 
    --> category b 
    --> photos 
    ... 

И это необходимо иметь минимум 2 категории.
Любая идея?

ответ

0

В вашем случае у вас должна быть категория «монеты» и категория «не монеты».
Ваша сеть должна видеть изображения «не монеты», чтобы отличить их от «монетных» изображений.

Вы могли бы рассмотреть обучение поэтапно (он же "жесткий отрицательный добычи"):

(1) model_0 <- training with cons/non-coins images 
(2) for k = 1..K iterations do: 
(2.1) use model_{k-1} to classify additional training images 
(2.2) add images wrongly classified by model_{k-1} to training set 
(2.3) model_k <- training with extended training set 
(3) output model_K