Я пытаюсь реализовать запрос в моем коде Scala, который использует regexp на Spark Column
, чтобы найти все строки в столбце, которые содержат определенное значение:Использование rlike в org.apache.spark.sql.Column
column.rlike(".*" + str + ".*")
str
является строка, которая может быть что угодно (кроме null
или empty
).
Это отлично подходит для основных запросов, которые я тестирую. Однако, будучи новичком в Spark/Scala, я не уверен, есть ли какие-либо особые случаи, которые могут нарушить здесь код, который мне нужно позаботиться. Есть ли какие-нибудь символы, которые мне нужно ускользать или специальные случаи, о которых мне нужно беспокоиться?