2015-10-20 8 views
-1

Моя цель - написать код SQL или использовать построитель запросов SAS, который будет выполнять поиск нечеткой логики по числовой переменной.SQL/SAS fuzzy Логика для целочисленной переменной

В качестве примера; изображение ниже имеет две переменные. Первой переменной является конкатенация нескольких разных переменных. Используя первую переменную в качестве подмножества, я хочу использовать нечеткую логику для идентификации чисел, выделенных в переменной 2. Весь набор данных будет иметь миллионы строк данных, а число подмножеств переменной переменной будет на десятки тысяч.

Я также рассмотрел возможность создания новой переменной, которая включает в себя переменную два & и выполнение поиска нечеткой логики для этой новой переменной. Этот метод может приводить к нежелательным совпадениям, поэтому мой предпочтение является первым методом.

Data snip

я буквально не знаю, с чего начать на этом. В настоящее время все, что мне удалось сделать, это идентифицировать функции, которые выполняют поиск нечеткой логики на символьных переменных (например, SPEDIS и SOUNDEX) & не на числовые переменные.

Кто-нибудь знает функцию, которая будет выполнять поиск нечеткой логики на целочисленной переменной? У вас есть образец кода?

Я новичок в SAS/SQL, но быстро учащийся. :)

Заранее спасибо

Paul

(после редактирования в ответ на комментарии ниже)

+0

Каков пример вашей нечеткой логики? – Reeza

+0

Reeza, спасибо за ваш вопрос. Ничто не осложняло список финансовых значений до двух знаков после запятой. Например: 1001,34 и 2341,78 и 4432,78 и 7896,90 и так далее. – Paul

+0

Ваш вопрос будет более ясным, если бы вы включили некоторые типичные ожидаемые входы и выходы и все, что вы пробовали до сих пор, чтобы достичь желаемого результата. – user667489

ответ

0

Я думаю, что Роб поставил вас на правильном пути. Преобразуйте числа в текст, затем вы можете использовать декартовое соединение в proc sql с функциями COMPGED или COMPLEV для сравнения пар значений с одинаковым идентификатором и предоставления оценки сходства для каждой пары. Затем вы можете решить, какова оценка обрезания, чтобы что-то считалось совпадением.