Я добытые строкой из веб ползать сценарий следующим образом:Python, как декодировать Юникод с шестигранными символами
u'\xe3\x80\x90\xe4\xb8\xad\xe5\xad\x97\xe3\x80\x91'
Я хочу, чтобы декодировать u'\xe3\x80\x90\xe4\xb8\xad\xe5\xad\x97\xe3\x80\x91'
с UTF-8. С http://ddecode.com/hexdecoder/, я вижу, что результат '【中字】'
Я пробовал использовать следующий синтаксис, но не смог.
msg = u'\xe3\x80\x90\xe4\xb8\xad\xe5\xad\x97\xe3\x80\x91'
result = msg.decode('utf8')
Ошибка:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python27\lib\encodings\utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-11: ordi
nal not in range(128)
Могу ли я спросить, как правильно декодировать строку?
Спасибо за помощь.
Строка, которую вы получаете, закодирована в двойном порядке. Он отлично работает без 'u' перед строкой. Вы должны проверить скрипт сканирования. –