Я пытался использовать Tokenize
для поиска IP-адрес с номером портаКак получить регулярные выражения в RapidMiner?
но, видимо, он использует регулярное выражение для определения маркеров разделителя, то есть он возвращает текст между IP-адресами. Можно ли сами получить адреса?
UPDATE
У меня есть один большой файл журнала текстуальное в качестве входных данных. Он содержит строки, строки содержат сообщения о IP-адресах. Я хотел бы принять все адреса, которые они подсчитывают.
Возможно ли это с помощью RapidMiner?
У меня есть один файл. Это «документ»? Пожалуйста, объясните, как ваш метод может работать? –
В операторе «Документы процесса» задайте параметр «Вектор Creation» как «Term Occurrences». Это будет считать количество раз, когда атрибут появляется в одном документе. – awchisholm
Для информации имеется оператор 'Keep Document Parts', который позволяет сохранять контент, представляющий интерес, до отметки. – awchisholm