2016-11-22 9 views
3

У меня есть два вопроса о том, как загрузить данные Imagenet. Я загрузил наборы для проверки ILSVRC2012 (слишком большие комплекты обучения) , но у меня есть две проблемы.Как я могу найти метки данных Imagenet?

  1. Я не могу понять, как узнать метки. Есть только файлы jpeg с именами файлов, например «ILSVRC2012_val_00000001.JPEG», но нет ярлыков. Как я могу их найти?

  2. Как мне известно, Imagenet использует 224 * 224 пиксельное изображение, и проблема в том, что это просто «классификация», а не «обнаружение», но наборы ILSVRC2012 имеют гораздо больше и разных размеров пикселей. Итак, как я могу получить правильные поля для 224 * 224 пикселей?

+0

Я не загружал набор данных, поэтому не могу ответить на первую часть, но, конечно же, есть файлы, которые могут указывать номер класса. в отношении вашего второго вопроса большинство статей, которые я прочитал до сих пор, указывают, что они выбрали свой вход 224. с другим размером изображения не проблема, если вы можете избавиться от слоев FC или даже изменить размер ввода или скользя по вашему входу – Feras

+0

См. Также: [Где я могу получить ярлыки для небольшого ImageNet?] (Http://datascience.stackexchange.com/q/13438/8820) –

+0

Возможно, вы сможете ответить [Как я могу использовать используемые данные ImageNet ILSVRC 2012 для задачи классификации?] (http://datascience.stackexchange.com/q/13864/8820) –

ответ

0

Убедитесь, что вы загружаете из here и распаковки каждого файла .tar в папке с synsent числа каждого из классов. Это лучший способ, чтобы вы не смешивали фотографии.

0

Это в комплект развития (Задача 1 & 2) Имя файла под названием «ILSVRC2012_validation_ground_truth.txt»

1
  1. Вы скачать три смоляные архивы: один для подготовки данных, один для данных проверки, и один для тестовых данных. Данные обучения содержатся в 1000 папках, по одной папке для каждого класса (каждая папка должна содержать 1300 изображений JPEG). Данные проверки - это одна папка с 50-кратным JPEG-изображением, найдите соответствующий файл ILSVRC2012_validation_ground_truth.txt (как упоминалось в darren1231, его необходимо загрузить отдельно в составе DevKit). Тестируемые данные аналогичны данным проверки, но у них нет меток (ярлыки не предоставляются вам, потому что вам необходимо представить свои предсказанные ярлыки для них в рамках конкурса).

  2. Изображения ImageNet имеют переменное разрешение, 482x415 в среднем, и все зависит от вас, как вы хотите обработать их для обучения вашей модели. Большинство людей обрабатывают его следующим образом: сначала уменьшайте каждое изображение так, чтобы его более короткая сторона составляла 256 пикселей. Затем обрезайте случайный патч 224x224. Используйте эти патчи для обучения (вы будете получать разные урожаи каждую эпоху). Во время теста сделайте то же самое, но извлеките патч 224x224 центра и используйте его для оценки точности классификации. Некоторые люди также используют несколько патчей для тестирования. Опять же, это зависит от вас, и вы можете использовать более высокое разрешение, если хотите.

 Смежные вопросы

  • Нет связанных вопросов^_^