2016-10-25 10 views
1

Я пытаюсь сделать LMDB для обучения/проверки, установленным для использования с цифрами NVIDIA, но я не могу найти хороших примеров/учебников.Создание обучения/проверки LMDB для NVIDIA Цифры в Python

Я понимаю, как создать базу данных LMDB, но я не уверен, как правильно форматировать данные. Я получаю, как создать изображение с помощью caffe_pb2 Datum, установив каналы/ширину/высоту/данные и сохраните их.

Но как создать ярлыки LMDB? Я все еще использую Caffe Datum? Если да, то каким образом я устанавливаю каналы/ширину/высоту? Будет ли это работать, если у меня есть единая метка значения?

Благодаря

+0

вы смотрели на [ 'convert_imageset'] (http://stackoverflow.com/questions/31427094/guide-to-use-convert-imageset-cpp/31431716#31431716)? – Shai

+0

У меня нет. Прямо сейчас я использую изображения; однако это в основном для тестирования, чтобы убедиться, что все работает. Моя фактическая работа в будущем будет не на изображениях, а на другом объекте, поэтому я хотел бы понять, как все работает в процессе подготовки! – AdmiralJonB

ответ

1

ЦИФРЫ только действительно поддерживает данные в LMDBs на данный момент. Каждое значение в LMDB ключ/валь магазин должен быть Caffe Datum, что ограничивает число измерений до 3.

Даже если Caffe Геодезические позволяют одной числовой метки (datum.label), при загрузке скомпилированную LMDB к цифрам, которые нужно для указания отдельной базы данных для этикеток. Это неэффективно, если у вас есть только одна цифровая метка (поскольку вы могли бы сделать все это в одном БД), но она более универсальна и масштабируема для других типов меток.

Извините, вы правы, что это не задокументировано очень хорошо прямо сейчас. Вот некоторые исходные файлы можно просматривать на вдохе, если вы так склонны:

+0

Почему не поддерживают данные HDF5? – Shai

+1

Потому что (1) поддержка HDF5 от Caffe в лучшем случае несерьезна и (2) не потребовалось слишком много работы, чтобы позволить факелу читать LMDB. Поскольку мы добавляем больше фреймворков, поддержка LMDB + caffe.datum для каждой структуры делает все меньше и меньше смысла, и мы постараемся выбрать формат, который по умолчанию будет использовать каждая из фреймворков, отличных от Caffe. –