Выполнить следующий код в противном случае пустой ячейки:
%%storage read --object <path-to-gcs-bucket>/my_pickle_file.pkl --variable test_pickle_var
Затем запустите следующий код:
from io import BytesIO
pickle.load(BytesIO(test_pickle_var))
Я использовал код ниже, чтобы загрузить pandas DataFrame в Google Cloud Storage в виде маринованного файла и зачитал его обратно:
from datalab.context import Context
import datalab.storage as storage
import pandas as pd
from io import BytesIO
import pickle
df = pd.DataFrame(data=[{1,2,3},{4,5,6}],columns=['a','b','c'])
# Create a local pickle file
df.to_pickle('my_pickle_file.pkl')
# Create a bucket in GCS
sample_bucket_name = Context.default().project_id + '-datalab-example'
sample_bucket_path = 'gs://' + sample_bucket_name
sample_bucket = storage.Bucket(sample_bucket_name)
if not sample_bucket.exists():
sample_bucket.create()
# Write pickle to GCS
sample_item = sample_bucket.item('my_pickle_file.pkl')
with open('my_pickle_file.pkl', 'rb') as f:
sample_item.write_to(bytearray(f.read()), 'application/octet-stream')
# Read Method 1 - Read pickle from GCS using %storage read (note single % for line magic)
path_to_pickle_in_gcs = sample_bucket_path + '/my_pickle_file.pkl'
%storage read --object $path_to_pickle_in_gcs --variable remote_pickle_1
df_method1 = pickle.load(BytesIO(remote_pickle_1))
print(df_method1)
# Read Alternate Method 2 - Read pickle from GCS using storage.Bucket.item().read_from()
remote_pickle_2 = sample_bucket.item('my_pickle_file.pkl').read_from()
df_method2 = pickle.load(BytesIO(remote_pickle_2))
print(df_method2)
Примечание: есть known issue, где команда %storage
не работает, если это первая строка в ячейке. Поместите комментарий или код python в первую строку.
спасибо. Я попытался использовать хранилище %% с нагрузкой на рассол. Как-то это не сработало для меня. Это сработало для вас? Альтернатива тоже хороша - допустимое обходное решение. –
Я не уверен, что проблема связана с самим рассолом. Когда я пытаюсь читать из ведра через средства python - все работает. Хотя я использую BytesIO. Тем не менее, когда я пытаюсь создать предложение хранения - ничего не происходит –
Не могли бы вы попробовать образец кода, предоставленный (StringIO), чтобы подтвердить, что он работает на вашем конце? Пожалуйста, поделитесь фрагментом кода, который не работает, как ожидается, чтобы помочь в устранении неполадок. –