Я пытаюсь прочитать файл txt с корейским и английским в нем.
Пример: :
52:15 Поздравления. 안녕하십니까.Чтение файла Txt в Python 3.5 с корейскими и английскими символами в нем
Мой код:
# Read a line and Split into tokens
f = open(infile, 'r')
for line in f:
if(matchObj = re.match(r"(\d\d:\d\d)\t([^\t]+)\t(.*)$", line)
startTC, englishSubtitle, foreignSubtitle = matchObj.group(1), matchObj.group(2), matchObj.group(3)
else:
SyntaxError(line)
Когда я прочитал это в Python (3.5) на 2012 Macbook Pro работает El Capitan, я получаю сообщение об ошибке (в нижней части).
Сообщение об ошибке:.
python3 *.py
Traceback (most recent call last):
File "txtToSrt.py", line 48, in <module>
readFileData("Korean.txt")
File "txtToSrt.py", line 26, in readFileData
for line in f:
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/codecs.py", line 321, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfe in position 0: invalid start byte
Не могли бы вы подсказать, как прочитать в
'0xfe' - это может быть [BOM] (https://en.wikipedia.org/wiki/Byte_order_mark) – furas