2017-02-16 8 views

ответ

5

Вам придется использовать двоичную версию наборов данных. Описание на странице CIFAR совершенно ясно:

Первый байт - это метка первого изображения, которое является числом в диапазоне 0-9. Следующие 3072 байта представляют собой значения пикселей изображения. Первые 1024 байта - это значения красного канала, а в следующем 1024 - зеленый, а последний 1024 - синий. Значения хранятся в строчном порядке, поэтому первые 32 байта представляют собой значения красного канала для первой строки изображения.

Вы не указали каким-либо образом как вы хотите импортировать набор данных, вот что я думаю, что будет иметь смысл:

  • Извлечение 6 серий из .tar.gz файла
  • Для каждого партия:
  • Создать двоичный считыватель
  • Прочитайте байт, который содержит метку
  • инстанцировать System.Drawing.Bitmap размера 32 х 32
  • цикла по строкам и столбцам изображений, прочитать байты из файла, установить его в красном канале изображение
  • повторить, что с зеленым и синим каналом.
  • Магазин в вашем окончательном формате (например, каталог с отдельными файлами PNG)
+0

Спасибо. Я постараюсь сделать это как можно скорее. –

+0

Чтобы сэкономить время, я преобразовал файл MAT в CSV (метка, pixel0, pixel1, pixel2, ...., pixel3071) Спасибо за совет. –