0

Я довольно новичок в azure blobs, и у меня есть эта проблема. У меня есть блок blob с 10 + csv файлами того же формата (те же заголовки и т. Д.). Я хочу присоединиться к ним вместе, чтобы рабочее пространство Azure Machine Learning читало их как один набор данных. Они являются единственными файлами в блоке blob, и все они являются csv.Как присоединиться к csv из разных блоков blob, которые нужно прочитать при обучении Azure?

Как присоединиться к этим большим файлам csv вместе в blob, не имея ML «join» для каждого файла, поскольку он динамически растет?

+0

У вас есть 10 + отдельные блочные капли или блок-блок? Если они все в одном блобе (что, кажется, так), как они еще не слиты? –

+0

Они находятся в одном блоке, и я загрузил несколько csvs через C# в тот же блок blob. Но в будущем мы будем сбрасывать несколько CSV на один и тот же blob, чтобы переучивать модель по мере продвижения. Мне было интересно, как динамически получить доступ ко всем блокам blob и использовать все эти данные сразу, без необходимости делать считыватель на блок blob. – Kat

ответ

1

Если вы всегда добавляете данные в конец blob, вам следует рассмотреть возможность использования добавленных blob. Эти капли специально оптимизированы для этого варианта использования и проще использовать для сценария только для добавления.

Похоже, что из вашего разъяснения вы хотите получить все данные в блочном блобе. Простой «GET» на blob должен получить полный blob и все его CSV - в C# lib есть множество вариантов загрузки, так как вы упомянули о том, что используете. Для загрузки блочных блобов блоки не важны, и данные рассматриваются как одна большая вещь. Блоки - это больше единицы для загрузки.

 Смежные вопросы

  • Нет связанных вопросов^_^