В предыдущей версии Бота, был вспомогательный класс с именем HiveStep
, который сделал это легко построить шаг потока работы для выполнения улой работы. Однако в Boto3 подход изменился, и классы генерируются во время выполнения из AWS REST API. В результате такой вспомогательный класс не существует. Если посмотреть на исходный код HiveStep
, https://github.com/boto/boto/blob/2d7796a625f9596cbadb7d00c0198e5ed84631ed/boto/emr/step.py, то это подкласс Step
, который является классом со свойствами jar
args
и mainclass
, очень похожим на требования в Boto3.
Оказалось, что все шаги потока работ по EMR, включая Hive, все равно должны быть созданы из JAR. Поэтому вы можете выполнить шаги Hive через Boto3, но нет вспомогательного класса, чтобы упростить построение определения.
Рассматривая подход, использованный HiveStep
в предыдущей версии Boto, вы можете построить правильное определение потока заданий.
Или вы можете вернуться к использованию предыдущей версии Boto.
Что бы пример улья шага с использованием Boto3? Кажется, я не могу найти никаких примеров или указателей. Я предпочел бы использовать последнюю метку выпуска (4.0). – intl
Не знаете, что вы имеете в виду под номером выпуска 4.0? – mattinbits
Это последняя версия emr 4.0. Это передано в качестве аргумента из CLI. – intl