У меня есть текстовый файл, который заполняется символами unicode как "\ud83d\udca5"
, но python, похоже, им не нравится.
Но если я заменил его на u'\U0001f4a5'
, который, кажется, является его стилем побега на питоне (Charbase), он работает.Как преобразовать « uxxxx uxxxx» в u ' Uxxxxxxxx'?
Есть ли решение для преобразования всех их в формат вывода u"\Uxxxxxxxx"
, чем может понять python?
Спасибо.
Это потому, что это UTF-16, а не UTF-8. – Joey
@Joey: Это не целая точка. Существует фундаментальное различие между объектом Unicode и кодированной последовательностью байтов (кодируется UTF-16, UTF-8 или любым другим). –
Да, я так думаю, но у меня есть символы UTF-16 в файле UTF-8. В этом проблема. – DasFranck