Я пытаюсь извлечь содержимое между двумя сломанными в URL-адресе, и для этого я использую функцию stringr
str_match
.круглые скобки в str_match меняют совпадение
library(stringr)
test <- "http://www.lefigaro.fr/flash-actu/2014/04/08/97001-20140408FILWWW00162-ump-cope-defend-sa-gestion-financiere.php"
мне удается извлечь полную строку:
str_match(test, "http://.*?/.*?/")
[,1]
[1,] "http://www.lefigaro.fr/flash-actu/"
Но когда я добавить скобки, чтобы извлечь матч в строке, то результат меняется неожиданно:
str_match(test, "http://.*?/(.*?)/")
[,1] [,2]
[1,] "http://www.lefigaro.fr/flash-actu/2014/" "2014"
должен быть вопрос о том, как круглые скобки интерпретируются в регулярном выражении. Любая подсказка?
Кажется, что-то не так с библиотекой 'stringr'. –
http://regex101.com/r/bD7yR0/1 –