Я пытаюсь импортировать набор данных CIFAR-10 «https://www.cs.toronto.edu/~kriz/cifar.html» в F #, есть три формата; python, matlab (MAT) и двоичный (bin), соответственно. Пожалуйста, не стесняйтесь комментировать, как импортировать набор данных?Импорт CIFAR-10 Набор данных в F #
0
A
ответ
5
Вам придется использовать двоичную версию наборов данных. Описание на странице CIFAR совершенно ясно:
Первый байт - это метка первого изображения, которое является числом в диапазоне 0-9. Следующие 3072 байта представляют собой значения пикселей изображения. Первые 1024 байта - это значения красного канала, а в следующем 1024 - зеленый, а последний 1024 - синий. Значения хранятся в строчном порядке, поэтому первые 32 байта представляют собой значения красного канала для первой строки изображения.
Вы не указали каким-либо образом как вы хотите импортировать набор данных, вот что я думаю, что будет иметь смысл:
- Извлечение 6 серий из
.tar.gz
файла - Для каждого партия:
- Создать двоичный считыватель
- Прочитайте байт, который содержит метку
- инстанцировать
System.Drawing.Bitmap
размера 32 х 32 - цикла по строкам и столбцам изображений, прочитать байты из файла, установить его в красном канале изображение
- повторить, что с зеленым и синим каналом.
- Магазин в вашем окончательном формате (например, каталог с отдельными файлами PNG)
Спасибо. Я постараюсь сделать это как можно скорее. –
Чтобы сэкономить время, я преобразовал файл MAT в CSV (метка, pixel0, pixel1, pixel2, ...., pixel3071) Спасибо за совет. –