Я пытаюсь разделить строку, ограниченную несколькими пространствами т.е.с использованием регулярного выражения для разделения строки с несколькими пробелами.
string1 = "abcd efgh a. abcd b efgh"
print re.findall(r"[\w.]+")
, как и ожидалось, результаты:
['abcd', 'efgh', 'a.', 'abcd', 'b', 'efgh']
Однако, я хотел бы группа «а. ' и «abcd» в одну группу, а «b» и «efgh» - в одну группу. Так что результат я хочу, будет выглядеть примерно так:
['abcd', 'efgh', 'a. abcd', 'b efgh']
Мой подход в настоящее время является создание двух типов выражения. Первый имеет дело с регулярным выражением без пространства, то есть «abcd» и «efgh». Второй - иметь дело с одним пространством. то есть «а». + 'abcd'.
Так что если г '[\ ш] + может иметь дело с первым типом, и г' [\ ш] + [\ ш] + может иметь дело со вторым типом. Но я не знаю, как объединить их в одно и то же выражение, используя '|'.
Как всегда, любые другие подходы приветствуются. И спасибо за ваше время!
Split by '\ s \ s +' – gukoff