Мне нужно обработать на пике 100 с записей в секунду. Эти записи являются простыми органами JSON, и их следует собирать, а затем обрабатывать/преобразовывать в базу данных.Является ли Kinesis правильным инструментом для моих нужд? (& другие сортированные вопросы)
Несколько вопросов ...
1) Является ли Kinesis право на это? Или SQS лучше подходит?
2) При использовании кинези я хочу использовать примеры python, как показано здесь: https://aws.amazon.com/blogs/big-data/snakes-in-the-stream-feeding-and-eating-amazon-kinesis-streams-with-python/ или мне следует внедрить моего производителя и потребителя в KCL? Какая разница?
3) Предоставляет ли Kinesis что-либо руководству потребителей, или я просто запускаю их на экземплярах EC2 и самостоятельно управляю ими?
4) Какая правильная модель для доступа к данным - я не могу позволить пропустить какие-либо записи, поэтому я предполагаю, что я буду получать записи из «TRIM_HORIZON», а не «ПОСЛЕДНИЕ». Если да, как мне управлять дубликатами? Другими словами, как мои потребители получают записи из потока и обрабатывают потребителей, и т. Д., И всегда знают, что они извлекают все записи?
Спасибо!
какой вид обработки вы планируете сделать? вы заботитесь о сообщениях, поддерживающих их порядок? –
Эй - сообщения не должны поддерживать порядок, и единственная обработка, которую я буду делать с потребителем, преобразуется в другой формат и переадресуется на другую услугу. –