У меня есть якобы юникод строку, как это:Python - преобразовать юникод и шестигранник в юникод
и '\ xc3 \ XA3 \ xc6 \ u2019 \ xc2 \ xA9 \ xc3 \ XA3 \ xc6 \ u2019 \ XE2 \ u20ac \ u201c \ xc3 \ XA3 \ xc6 \ u2019 \ xc2 \ xA9 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ xa4 \ xc3 \ XA3 \ xc6 \ u2019 \ XE2 \ u20ac \ u201c \ xc3 \ XAF \ xc2 \ XBC \ xc2 \ x81 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ xb9 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ XAF \ xc3 \ XA3 \ xc6 \ u2019 \ xc2 \ XBC \ xc3 \ XA3 \ xc6 \ u2019 \ xc2 \ Xab \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ xa2 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ xa4 \ xc3 \ XA3 \ xc6 \ u2019 \ XE2 \ u20ac \ XB0 \ xc3 \ XA3 \ xc6 \ u2019 \ xc2 \ Xab \ xc3 \ XA3 \ xc6 \ u2019 \ XE2 \ u20ac \ xa2 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ xa7 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ xb9 \ xc3 \ XA3 \ xc6 \ u2019 \ XE2 \ u20ac \ xa0 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ XA3 \ xc3 \ XA3 \ xc6 \ u2019 \ xc2 \ x90 \ xc3 \ XA3 \ xc6 \ u2019 \ xc2 \ Xab \ xc3 \ XAF \ xc2 \ XBC \ х центибар \ u2020 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ xb9 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ XAF \ xc3 \ XA3 \ xc6 \ u2019 \ XE2 \ u20ac \ xa2 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ xa7 \ xc3 \ XA3 \ XE2 \ u20ac \ u0161 \ xc2 \ xb9 \ xc3 \ XAF \ xc2 \ XBC \ XE2 \ u20ac \ XB0'
Как получить правильный unicode string из этого? Я думаю, фактическое значение unicode равно ラブライブ!スクールアイドルフェスティバル(スクフェス)
Это кракозябры. Как вы получили эту ценность? Он неправильно декодирован. –
Вы путаетесь в значении «строки Unicode». –
Еще лучше, это было искажено ** дважды **. UTF-8, декодируется как CP1252, затем снова закодирован как UTF-8, а затем снова декодируется как CP1252. Довольно подвиг! –