ФонAmazon Kinesis аналитика для данных архивных
Я обнаружил, что Amazon Kinesis Analytics, можно использовать для потоковой передачи данных, а также данных, присутствующих в S3 ведро.
Однако, есть некоторые упоминания в документации, которые ставят меня в дилемму, относительно того, можно ли использовать Amazon Kinesis Analytics для огромного количества существующих данных в ведро S3. Код
Authoring Применение
Мы рекомендуем следующее:
• В вашем SQL заявления, мы рекомендуем вам не указать окно времени на основе, которая больше, чем один час по следующим причинам:
- Если приложение необходимо перезапустить, либо из-за того, что вы обновили приложение, либо по внутренним причинам Amazon Kinesis Analytics, все данные, включенные в окно, должны быть снова прочитаны из источника данных потоковой передачи. Это займет некоторое время, прежде чем Amazon Kinesis Analytics сможет выпустить вывод для этого окна.
- Если приложение необходимо перезапустить, либо из-за того, что вы обновили приложение, либо по внутренним причинам Amazon Kinesis Analytics, все данные, включенные в окно, должны быть снова прочитаны из источника данных потоковой передачи. Это займет некоторое время, прежде чем Amazon Kinesis Analytics сможет выпустить вывод для этого окна.
- Amazon Kinesis Analytics должна поддерживать все, что связано с состоянием приложения, включая соответствующие данные, на время. Это потребует значительных блоков обработки данных Amazon Kinesis Analytics.
Запрос
Любые мысли, будет ли Amazon Kinesis Analytics хорошо для этой задачи.
Amazon Athena запущен в ноябре 2016 года, поэтому я также посмотрю на это: https://aws.amazon.com/athena/ – RyanN