2015-07-20 2 views
0

У меня есть 10000 изображений. Я хочу преобразовать их в формат «train-images-idx3-ubyte». Этот формат исходит от here. Я хочу, чтобы использовать глубокие методы обучения, описанные hereКак изменить набор данных изображений на train-images-idx3-ubyte format

Я признателен за любую помощь

ответ

1

Взгляните на то, как эти файлы загружаются here.

Использование numpy.fromfile указывает, что данные просто сохраняются как необработанные байты определенного типа dtype. Вы можете достичь этого, используя numpy.tofile.

Однако убедитесь, что это действительно то, что вы хотите сделать. Если вы хотите использовать определенные сети на других изображениях, эти изображения, вероятно, должны быть одинакового размера. В учебники стоит поучаствовать - через некоторое время упростится перенос на другие наборы данных.

+0

Спасибо. Какими будут параметры 'np.tofile' – mar

+0

Байт-значения ваших изображений. Если 'images.shape == (10000, 28, 28)' и 'images.dtype.name == 'uint8'', то вы можете просто написать' np.tofile (images.ravel()), я думаю. Хотя, если вы внимательно посмотрите на код для загрузки, вам может потребоваться компенсировать это двумя байтами. ОДНАКО: У меня все еще есть догадка, что это может быть необязательно для того, что вы на самом деле хотите сделать. – eickenberg

+0

Еще раз спасибо. На самом деле я хочу применить сценарий 5_convolutional_net.py к своему собственному набору данных. Набор данных, который у меня есть, представляет собой массив numpy с двумя размерами, первый размер - это изображения, а второй - метки. – mar

 Смежные вопросы

  • Нет связанных вопросов^_^