Существует IngiteRDD
, который может отражать изменения в базовом кеше, которые в некоторых случаях очень приятны для преодоления недостатка неизменности Spark 'RDD.Как работает Ignite с помощью Spark из представления интеграции
Метод IgniteRDD.sql
, который работает ANSI sql (not spark sql)
, этот метод возвращает DataFrame, который является концепцией искрового sql. Когда я получу этот объект DataFrame, могу ли я использовать его как обычный DataFrame, который мне не нужно думать, что он из мира Ignite? То есть, я могу зарегистрировать временную таблицу, а затем распределить соединение с другим DataFrame. Когда выполняется sql как распределенное соединение, использует ли Ignite Spark SQL Engine или Ignite Engine для запуска sql?
Спасибо @Valentin за пояснение. Если данные будут получены со стороны драйвера, я бы подумал, что данные должны быть достаточно малыми ... что делает 'IgniteRDD.sql' пригодным только для небольшого набора данных? – Tom
Весь набор данных не передается драйверу, а только результирующий набор. Сам запрос выполняется в масштабируемом распределенном кеше, который может хранить гигабайты данных. –