Заимствование из similar question, один из вариантов получения полного списка ключей объектов из префикса bucket + используется для использования рекурсии с помощью метода list_objects_v2.
Этот метод будет рекурсивно извлекать список ключей объектов по 1000 ключей за раз.
В каждом запросе list_objects_v2
используется аргумент StartAfter
, чтобы продолжить перечисление ключей после последнего ключа из предыдущего запроса.
import boto3
if __name__ == '__main__':
client = boto3.client('s3',
aws_access_key_id = 'access_key',
aws_secret_access_key = 'secret_key'
)
def get_all_object_keys(bucket, prefix, start_after = '', keys = []):
response = client.list_objects_v2(
Bucket = bucket,
Prefix = prefix,
StartAfter = start_after
)
if 'Contents' not in response:
return keys
key_list = response['Contents']
last_key = key_list[-1]['Key']
keys.extend(key_list)
return get_all_object_keys(bucket, prefix, last_key, keys)
object_keys = get_all_object_keys('your_bucket', 'prefix/to/files')
print(len(object_keys))