2015-09-03 2 views
1

У меня есть некоторые вопросы о том, как на самом деле взаимодействовать с предварительно обученной моделью Caffe. В моем случае я использую модель для scene recognition.Как использовать предварительно подготовленную модель Caffe?

В репозитории caffe git есть примеры кода в Python и C++ для реализации классификаторов изображений. Тем не менее, это не относится к моему варианту использования (поскольку они только классифицируют входное изображение как ОДИН класс).

Моя цель - приложение, которое принимает входное изображение (jpg) и выводит наивысшую прогнозируемую метку класса для каждого пикселя на входном изображении (например, индексы для неба, пляжа, дороги, автомобиля).

Может ли кто-нибудь дать мне несколько указаний о том, как действовать?

Там уже существуют реализации для этого. Эта демонстрация (http://places.csail.mit.edu/demo.html) - это то, что я что.

Спасибо!

+0

Возможный дубликат [Может ли Caffe классифицировать пиксели изображения напрямую?] (Http://stackoverflow.com/questions/30198926/can-caffe-classify-pixels-of-an-image-directly) – Shai

+0

Я могу порекомендовать работа группы Torr Vision: https://github.com/torrvision/crfasrnn. Используя прилагаемый руководство по установке, я легко работал. Обратите внимание: если вы уже установили Caffe, возможно, вам придется быть осторожным с включенной версией Caffe, так как упомянутая работа использует специальный Caffe, который включен. –

ответ

1

Что вы ищете, а не классификация изображений, а скорее Семантическая сегментация.

Недавняя работа Джонатана Лонга, Эвана Шелхамера и Тревора Даррелла основана на Caffe, и их можно найти here. Он использует полностью сверточную сеть, то есть сеть без слоев только со сверточных слоев, что позволяет создавать выходы разных размеров для разных размеров входов.

+0

Спасибо, что направили меня в правильном направлении! Я создал Caffe (будущая ветвь) и успешно запускаю концепцию [FCN-32s Fully Convolutional Semantic Segmentation on PASCAL-Context] (https://gist.github.com/shelhamer/80667189b218ad570e82/). Однако я не могу создавать с ним четкие помеченные изображения. Результаты: [Входное изображение] (http://www.cs.stanford.edu/~roozbeh/pascal-context/2008_001997.jpg), [хороший результат вывода, но другая модель] (http: //www.cs.stanford .edu/~ roozbeh/pascal-context/2008_001997L.png), [Мой результат вывода] (http://i.imgur.com/YWspltp.png). Любая идея о том, где я ошибаюсь? – irri

+1

@irri похоже на проблему с разрешением. вы можете опубликовать это как новый вопрос, чтобы привлечь к этому больше внимания. – Shai