мне нужно регулярное выражение, чтобы удалить знаки препинания из строки, но сохранить акценты и URL. Я также должен хранить упоминания и хэштеги из этой строки.
Я пробовал с кодом выше, но, к сожалению, он заменяет символы акцентами, но я хочу сохранить акценты.
import unicodedata
if __name__ == "__main__":
text = "Apenas um teste com acentuação. Para pontuação também! #python @stackoverflow http://xyhdhz.com.br"
text = unicodedata.normalize('NFKD', text).encode('ascii','ignore')
print text
Выход на следующий текст "Apenas гм Teste ком acentuação. Para pontuação também! #python @stackoverflow http://xyhdhz.com.br" должен быть "Apenas гм Teste ком acentuação Para pontuação também #python @stackoverflow http://xyhdhz.com.br"
Как я мог это сделать?
Вы должны предоставить код, что вы пробовали, один или два примера ввода и вывода желаемого для них. – trincot
@trincot Спасибо. Я отредактировал главный пост. –