Я пытаюсь выполнить следующую команду в Цеппелин:Спарк Sql ИЛИ команда не возвращающие результаты
SELECT duration FROM voip where duration = 17 or duration = 1
Это не возвращает никаких результатов, но во время работы их там собственные результаты возвращает запрос. Я также пытаюсь запустить аналогичный код в Scala, но он не работает.
df.where(df("duration").===(1) || df("duration").===(2)).limit(10)
Я могу написать что-то, что просто делает каждый запрос и объединяет все кадры данных, но я беспокоюсь о производительности. Есть идеи?
Неясно, работает ли версия scala или нет? Если это работает, похоже, что вы сравниваете строки в scala, но ints в SQL. Что такое схема? – ImDarrenG
Извините, не могу опубликовать схему, мне пришлось изменить значения, которые я искал для публикации. Нитье работает и игнорирует байты вокруг версии Scala, они не должны быть там – user3920235