У меня есть файл с большим количеством записей о Нобелевских премиях. Я чем преобразовать этот файл в список, как это:Специальные символы в python
file = open(path, 'r')
file.readline()
content = []
for line in file:
line = line.replace('\n', '')
content.append(line.split(';'))
content = check(content, 'röntgen')
После этого у меня есть функция, которая принимает этот список и другой аргумент и проверяет, содержит ли список этот аргумент. Однако, если аргумент принимает особый характер как Ö он doen't работу, потому что, когда файл читается питон сохраняет его любит: ö
def check(content, attr):
reducedList = []
for i in range(len(content)):
curr = content[i][4]
if curr.find(attr) != -1:
reducedList.append(content[i])
return reducedList
с:
curr = 'voor hun verdiensten op het gebied van de analyse van de kristalstructuur door middel van röntgenstraling'
attr = 'röntgen'
Я попытался преобразовать его с utf-8, но это, похоже, не помогает. у кого-нибудь есть решение?
попробуйте кодировку iso-8859-1 – Chedy2149
Являются ли ваши файлы python и ваш текстовый файл закодированным с использованием UTF-8? – Guillaume
Файл python кодируется с помощью # - \ * - кодирования: utf-8 - \ * - , а текстовый файл кодируется в utf-8 –