2016-09-22 6 views
0

у меня есть такого рода результаты:Python REGEX игнорировать регистр в начале предложения и принять остальное

ª!è[008:58:049]HTTP_CLI:0 - Line written in... 

И я хочу, чтобы игнорировать все начальные символы, такие как ª!è и получить только: HTTP_CLI:0 - Line written in... но в простая регулярная линия.

Я попытался это: ^[\W0-9]* но принимает расширенные символы ASCII плюс время и не игнорируя его, делает наоборот ...

Любая помощь?

Спасибо!

+0

Как вы попробовали? (покажите нам некоторый код ..) – thebjorn

+0

Используйте 're.sub (r '^ [^ a-zA-Z] +', '', s)'. –

+0

Я пробовал это:^[^ \ W0-9] * HTTP_CLI: 0 - Строка написана. * – Sergi

ответ

2

Если вы хотите, чтобы получить все, что после закрывающей квадратной скобки, независимо от того, что, и пропустить все до того, что вы можете пойти с match как это:

s = "ª!è[008:58:049]HTTP_CLI:0 - Line written in..." 
m = re.match(r'^.*?]([\S\s]*)', s) 
print(m.group(1)) 

Принт 'HTTP_CLI:0 - Line written in...'

Это выражение взглядов через произвольное количество символов перед закрывающей скобкой и после этого соответствует всем. Соответствующая группа доступна с m.group(1)