2017-01-23 19 views
2

Я работаю над файлом Python, который вводит в него текстовый файл с японскими символами (UTF-8), принимает некоторые из текста, и записывает его в новый текстовый файл UTF-8.Символ, отображаемый как знак вопроса о знаком только в конце строки (Python> Text)

Проблема, с которой я сталкиваюсь, заключается в том, что по какой-либо причине, когда японский символ だ появляется в конце строки в исходном входном файле, он появляется в виде символьного вопроса в выходном файле.

Экземпляры от だ до конца строки отлично читаются, и исходный файл ввода читает его отлично, даже если он находится в конце строки.

+0

с использованием python 2.7 или 3.x? python 3.x имеет гораздо лучшую поддержку unicode – Aaron

+0

здесь объяснение для Java, но оно также имеет значение здесь http://stackoverflow.com/a/24009294/1530987 – crowchirp

+0

Просьба поделиться фрагментом кода. – ZdaR

ответ

1

Как вы не поделили какой-либо фрагмент кода, я бы порекомендовал вам общий способ чтения и записи utf-8 файлов с помощью codecs модуль, как:

# Reading utf-8 encoded file 
with codecs.open("in.txt", "r", encoding="utf-8") as input_data: 
    data = input_data.read() 

# Write utf-8 encoded file 
with codecs.open("out.txt", "w", encoding="utf-8") as output_data: 
    output_data.write(data) 

И КСТАТИ Я проверил это на данном характере だ и он работает очень хорошо.

 Смежные вопросы

  • Нет связанных вопросов^_^