2016-02-16 1 views
3

Для разработчиков,Azure Лейк Магазин Ориентиры данных

Я делаю тесты для Лазурного озера данных и я вижу около ~ 7,5 MB/S для чтения в качестве ADL магазина и записи на виртуальный жесткий диск все в том же область. Это случай для PowerShell и C# с кодом взяты из следующих примеров:

PowerShell код составляет от https://azure.microsoft.com/en-us/documentation/articles/data-lake-store-get-started-powershell/ C# код от https://azure.microsoft.com/en-us/documentation/articles/data-lake-store-get-started-net-sdk/

ли вышеуказанные примеры кода приемлемы для эталонного теста или будет новый Будет доставлен SDK, который увеличит пропускную способность? Также ожидаются ли пропускные номера, когда ADL Store становится общедоступным?

Спасибо, Марк

+0

Поскольку услуги Azure озера данные все еще находится в предварительном просмотре, я не думаю, что любые тесты доставят достоверные результаты. В любом случае это изменится и сейчас. Существуют также механизмы кэширования, которые будут искажать ваши результаты. Как только сервисы будут GA, я был бы счастлив, если бы были тесты, например, с тех, с которых вы начали. –

+0

Вам также необходимо учитывать, что аналитические службы смогут одновременно извлекать несколько блоков. –

+0

@SaschaDittmann Я не согласен с вашей предпосылкой, но я до сих пор считаю, что вопрос OP действителен. Вопрос OP заключается в том, достоин ли связанный код для использования в контексте сравнительного анализа. Создание пути справедливого контрольного теста всегда нетривиально и требует беспокойства относительно того, обеспечивает ли код точное представление или вводящее в заблуждение представление о производительности. –

ответ

0

Я начал писать Azure Data Lake Storage Throughput Analyzer и поставить первые биты кода на GitHub.

Вы должны запустить этот инструмент на Azure VM, чтобы не измерить подключение к Интернету.

Пожалуйста, не стесняйтесь добавлять свои мысли и кодовые вклады в мой репозиторий GitHub.

Надеюсь, это поможет.

+0

Sascha, Спасибо, попробуем. С уважением, Марк – user1154422

2

Код, приведенный в документации, может использоваться для создания контрольных тестов. SDK будет проходить через несколько выпусков и обновлений до того, как Azure Data Lake будет в целом доступным. Они будут включать улучшения производительности в дополнение к функциям.

По вопросу о контрольных показателях производительности наше общее руководство заключается в следующем. Услуги Azure Data Lake в настоящее время находятся в предварительном просмотре. Мы постоянно работаем над улучшением услуг, включая производительность на этом этапе предварительного просмотра. По мере приближения к общей доступности мы рассмотрим возможность предоставления дополнительных указаний по типу ожидаемых результатов. Результаты работы в значительной степени зависят от многих факторов, таких как топология тестирования, конфигурация и рабочая нагрузка. Поэтому трудно комментировать ваши наблюдения, не изучая их всех. Если вы можете связаться с нами в автономном режиме с подробностями, мы будем рады взглянуть.

Amit Кулкарня (руководитель программы - Лазурное озеро данные)