2013-06-03 4 views
0

Я анализирую файлы журналов с различными именами доменов. Я хочу исключить/проигнорировать из выходного отчета любой домен, который имеет слово «macys». Ниже приведен пример вывода:Игнорирование выходов в каскадировании

l.macys.com 87516

www.google.com 3016

search.yahoo.com 584

www.bing.com 166

macys-L0135874392.htm 1

Я хотел бы иметь и выводить файл, я бы не видел ни одного домена со словом «macys».

Любые идеи?

Спасибо,

ответ

0

Это звучит как идеальный вариант использования для каскадных Filter

Вы бы установить это с RegexFilter:

Pipe pipe = new Pipe(incomingPipe, new Fields("UrlColumn"), 
    new RegexFilter(".*macys.*", true), Fields.All); 

Tailor регулярного выражения для вашего использования соответствующего случаю. Один из них удалит все кортежи (строки), которые содержат слово «macys»

 Смежные вопросы

  • Нет связанных вопросов^_^