2016-10-06 2 views
2

Я хочу разделить структуру URL-адресов и интересуюсь только последним разделом. для напримерФункция Hive Split для выбора последней группы

www.example.com/subdirect/mainpage.aspx 
www.example.com/mainpage4.aspx 
www.example.com/subdirect/subdiret/subdirect2/mainpage2.aspx 

здесь я хочу только страницы ASPX, а не материал до этого, т.е. я хочу вернуть только текст ниже

mainpage.aspx 
mainpage4.aspx 
mainpage2.aspx 

Я попытался с помощью раскола, но я не уверен, как динамически возвращать только последний раздел структуры URL. Есть идеи? Это сценарий, я пытался

select split(URL,'/')[MAX] from URLlist 

ответ

0

Вот решение, использующее regexp_extract

select regexp_extract(URL, '.*/([^/]+)$', 1) from URLlist 

Это будет соответствовать и захватить все, что следует за последний / характер

 Смежные вопросы

  • Нет связанных вопросов^_^