Пытается использовать Google DataFlow Java SDK, но для моих учетных записей мои входные файлы являются .parquet файлами.Google DataFlow & Reading Parquet файлы
Не удалось найти какие-либо функциональные возможности для чтения паркета в конвейере DataFlow в качестве источника ограниченных данных. Как я понимаю, я могу создать кодер и/или потопить немного как AvroIO на основе Parquet Reader.
Кто-нибудь может посоветовать, как наилучшим образом его реализовать? или указать мне ссылку на How-to \ examples?
Цените свою помощь!
-А