static String AdrPattern="http://www.([^&]+)\\.com\\.*";
static Pattern WebUrlPattern = Pattern.compile (AdrPattern);
static Matcher WebUrlMatcher;
WebUrlMatcher = WebUrlPattern.matcher ("keyword");
if(WebUrlMatcher.matches())
String extractedPath = WebUrlMatcher.group (1);
Учитывая приведенные выше коды, моя цель - извлечь доменное имя из URL-адреса и убрать остальные. Но проблема в том, что, прежде всего, если URL-адрес имеет более глубокий путь, он не будет игнорировать его, а во-вторых, он не работает для всех URL-адресов с расширением .com
.Использование Matcher для извлечения URL-адреса домена
Например, если URL-адрес равен http://www.lego.com/en-us/technic/?domainredir=technic.lego
, результат не будет lego
, но lego.com/en-us/technic/?domainredir=technic.lego
.
, что является правильным. есть еще один вопрос, который вы можете помочь. Если я хочу сделать каждый более глубокий путь для извлечения, я должен переименовывать 'matcher.group (i)'? – lonesome
Не могли бы вы показать пример ввода? –
Рассматривая пример вопроса, 'http: //www.lego.com/en-us/technic/? Domainredir = technic.lego' Я хочу иметь доступ к' technic' или даже '? Domainredir = technic.lego ' – lonesome