Я установил boto3
на свою локальную машину, а затем я запускал искру-отправку в локальном режиме, в то время как был пропущен путь к каталогу boto3
. Оставив меня с следующая команда:Spark не может импортировать модуль pip после установки pip
spark-submit --conf spark.driver.extraClassPath=/Library/Python/2.7/site-packages app.py
А потом, когда import boto3
в моем app.py
, он бросает страшную module not found
ошибку.
Правильно ли это, чтобы добавить зависимую от python зависимость от python к заданию на поставку spark-submit?
У вас есть 'boto3' для всех остальных узлов кластера, если они есть? –
@ cricket_007 нет других узлов в кластере. это локальный режим с одним узлом. на локальном настольном компьютере. – Kristian
И вы можете запустить этот файл самостоятельно вне PySpark? –