У меня есть фрейм данных, как показано ниже. Это набор выборки данные с равномерными ищут модели, но все данными не очень неравномерны:извлечение разделенных запятыми строк
locationid address
1073744023 525 East 68th Street, New York, NY 10065, USA
1073744022 270 Park Avenue, New York, NY 10017, USA
1073744025 Rockefeller Center, 50 Rockefeller Plaza, New York, NY 10020, USA
1073744024 1251 Avenue of the Americas, New York, NY 10020, USA
1073744021 1301 Avenue of the Americas, New York, NY 10019, USA
1073744026 44 West 45th Street, New York, NY 10036, USA
Мне нужно найти название города и страны с этого адреса. Я попытался следующие:
1) strsplit Это дает мне список, но я не могу получить доступ к последним или третий последний элемент из этого.
2) Регулярные выражения найти страну легко
str_sub(str_extract(address, "\\d{5},\\s.*"),8,11)
, но для города
str_sub(str_extract(address, ",\\s.+,\\s.+\\d{5}"),3,comma_pos)
Я не могу найти comma_pos
как это снова приводит меня к одной и той же проблемы. Я считаю, что есть более эффективный способ решить эту проблему, используя любой из вышеперечисленных.
sapply (ss, tail, 1) работает, но sapply (ss, tail, 2) дает мне ошибку: Ошибка: неправильный размер результата (12), ожидаемый 6 или 1 – Cagg
Спасибо. Это потрясающе, и обновление действительно решило проблему !!! – Cagg