Мое регулярное выражение похоже, что оно должно работать, но возвращает неожиданные результаты.regex для времени захвата, не получая две цифры перед двоеточием, только один
Я использую R. Если вы не пользуетесь этим, не беспокойтесь, я думаю, что это очень похоже на некоторые другие ароматы регулярных выражений. и в документации по R говорится, что синтаксис {n, m} должен работать: "{n, m} Предыдущий элемент сопоставляется не менее n раз, но не более m раз."
re <- ".*\\s*(\\d{1,2}:\\d{2}\\s*[APM]{2})\\s*\\s*([Aa]lbuterol|[Pp]rednison).*(per order[s]*)\\s*.*"
Я хочу захватить время (например, 10:47 AM, 3:04 AM) препарат был получен из некоторых бесплатных текстовых заметок.
Я получаю 3:04 утра, но в 10:47 утра я получаю 0:47 утра вместо этого. Сейчас я попробовал несколько разных вещей и по какой-то причине не могу получить эту первую цифру. Любые идеи, что я делаю неправильно?
Просьба привести несколько примеров вместе с ожидаемым выходом. –
Я бы '[AP] M', а не' [APM] {2} ', чтобы избежать ложных совпадений (AA) –