Я прочитал, что бегун для проводника Google Cloud Dataflow для запуска на Spark, а также Data Artisans adapted, он запускается на Flink. Неясно, реализовал ли Cloudera как пакетную, так и оконную потоковую передачу, в одном сообщении сказано «нет», но другие сообщения, похоже, не упоминают об этом, как будто он включен, а Data Artisans четко указывает, что для Flink работает потоковая поддержка.Альтернативные конвейеры для Google Cloud Dataflow
Есть ли страница от Google или другого сопровождающего потока данных, в котором перечислены все существующие альтернативные конвейеры? Вместо этого кто-нибудь захочет сохранить канонический маркированный список реализаций? Похоже, что Google Cloud Platform еще не хочет использовать не-Google-реализации, возможно потому, что это делает синхронизацию внешнего репозитория с внутренней версией более прямой.