Я пытаюсь разбить строку на слова и знаки препинания, добавив пунктуацию в список, созданный разделом.Разбиение строки на слова и пунктуацию
Например:
>>> c = "help, me"
>>> print c.split()
['help,', 'me']
То, что я действительно хочу список, чтобы выглядеть как это:
['help', ',', 'me']
Итак, я хочу строковое раскол в пробельных с расколом пунктуации со слов.
Я пытался разобрать строку первой, а затем запустить раскол:
>>> for character in c:
... if character in ".,;!?":
... outputCharacter = " %s" % character
... else:
... outputCharacter = character
... separatedPunctuation += outputCharacter
>>> print separatedPunctuation
help , me
>>> print separatedPunctuation.split()
['help', ',', 'me']
Это дает результат я хочу, но крайне медленно на больших файлах.
Есть ли способ сделать это более эффективно?
Для этого примера (а не общий случай) `c.replace (' ' '') раздел (',')` – 2016-11-21 08:59:51