2016-07-06 9 views
2

Мы находимся на версии TD 14, и я родом из фона Netezza/Postgre (Redshift). Мне было предложено извлечь данные для входа из журналов аудита, чтобы узнать записи/транзакции, где тот же ip передает похожие поисковые имена с небольшими изменениями. например, Samir -> Samr -> Amir и т. д. Для захвата фишинговой активности. В POstgres у нас есть нечеткие строковые функции, такие как «%», например ColA% ColB (где оператор% эквивалентен аналогичному) Soundex, Metaphone, levenshtein и т. Д. В Teradata, однако, я только что столкнулся или мне удалось найти только Soundex , Есть ли такие возможности встроенной функции/метода с Teradata версии 14 для достижения вышеуказанного приближения строк.Teradata SQL для извлечения записей на основе приблизительного соответствия строк

ответ

0

Teradata 14.x поддерживает алгоритм расстояния от Damerau-Levenshtein с помощью функции EDITDISTANCE() и сопоставления n-граммов с помощью функции NGRAM().

Вы можете найти информацию о функции EDITDISTANCE here и функции NGRAM() here.