Я извлек источник html с веб-страницы и задавался вопросом, как извлекать тексты, такие как адреса электронной почты из этого источника. Im мышления использования jsoup как
Извлечь адрес электронной почты из источника html
public static String html2text(String html) {
return Jsoup.parse(html).text();
}
, но это дало бы мне много нежелательных текста, а также.
Вы используете java, я думаю, но вы не отметили его в вопросе. Можете ли вы также использовать javascript/jquery? Это довольно прямолинейно, используя регулярное выражение, но я не уверен в Java. – elclanrs
Я использую java. забыл упомянуть об этом. – SoH