Я импортировал файл excel в базу данных pandas и завершил процесс поиска и очистки данных.Пишите Python Dataframe в CSV-файл непосредственно в Azure Datalake
Теперь я хочу записать очищенный файл данных в файл csv обратно в Azure DataLake, не сохраняя его сначала как локальный файл. Я использую панды 3.
Мой код выглядит следующим образом:
token = lib.auth(tenant_id = '',
client_secret ='',
client_id = '')
adl = core.AzureDLFileSystem(token, store_name)
with adl.open(path='Raw/Gold/Myfile.csv', mode='wb') as f:
**in_xls.to_csv(f, encoding='utf-8')**
f.close()
я получаю следующее дамп в заявлении выделены жирным шрифтом.
TypeError: требуется байт-подобный объект, а не 'ул'
Я тоже пытался, но без удачи
with adl.open(path='Raw/Gold/Myfile.csv', mode='wb') as f:
with io.BytesIO(in_xls) as byte_buf:
byte_buf.to_csv(f, encoding='utf-8')
f.close()
Я получаю ошибку ниже:
TypeError: a bytes-like object is required, not 'DataFrame'
Любые идеи/советы будут очень благодарны
Работает ли он без режима 'b'? то есть. 'adl.open (path = 'Raw/Gold/Myfile.csv', mode = 'w')' – EdChum
Нет, только «w» не поддерживается в Python 3. Только двоичный файл ... –
Я спросил нашего премьер-министра SDK для контроля. Однако можете ли вы рассказать мне, почему вы хотите использовать скрипты Python на стороне клиента, которые загружают данные из ADLS, а затем загружают данные снова вместо использования U-SQL (возможно, с расширением Python), который работает непосредственно с данными в облаке? –