2016-12-13 4 views
0

Существует IngiteRDD, который может отражать изменения в базовом кеше, которые в некоторых случаях очень приятны для преодоления недостатка неизменности Spark 'RDD.Как работает Ignite с помощью Spark из представления интеграции

Метод IgniteRDD.sql, который работает ANSI sql (not spark sql), этот метод возвращает DataFrame, который является концепцией искрового sql. Когда я получу этот объект DataFrame, могу ли я использовать его как обычный DataFrame, который мне не нужно думать, что он из мира Ignite? То есть, я могу зарегистрировать временную таблицу, а затем распределить соединение с другим DataFrame. Когда выполняется sql как распределенное соединение, использует ли Ignite Spark SQL Engine или Ignite Engine для запуска sql?

ответ

0

После выполнения запроса вы можете использовать API Dataframe, но в этом случае он не будет распространен. То есть он будет работать с локальным набором результатов, уже выбранным драйвером.

Полная поддержка Dataframe в Ignite будет доступна в следующем году.

+0

Спасибо @Valentin за пояснение. Если данные будут получены со стороны драйвера, я бы подумал, что данные должны быть достаточно малыми ... что делает 'IgniteRDD.sql' пригодным только для небольшого набора данных? – Tom

+0

Весь набор данных не передается драйверу, а только результирующий набор. Сам запрос выполняется в масштабируемом распределенном кеше, который может хранить гигабайты данных. –

 Смежные вопросы

  • Нет связанных вопросов^_^