2016-02-16 3 views
0

Я использую python 3.5.1 как на окнах 10, так и на ubuntu 14.04 LTS. У меня есть список, содержащий более миллиона строковых элементов. Элементы являются строками unicode турецких слов. Я проверяю существование некоторых строк в этом списке с помощью оператора in. Большинство ответов верны. Однако некоторые строки возвращают False, даже если они существуют в списке. Я пробовал те же самые cehecks после преобразования списка в набор. Но ничего не изменилось. Что можно сделать для получения правильных результатов. Спасибо.в операторе, не работающем над большим списком

Я использую кодировки utf-8 всюду.

Related codes are here

+0

Пожалуйста, включите ваш код в вопрос. – bwegs

+0

Вы сравниваете строки с разными кодировками? – CasualDemon

+0

Мои коды: https://github.com/ahmetax/trderlem/blob/master/kokKelimeler.py –

ответ

0

Проблема решена. Но это не проблема списка. Чтобы подготовить список, я читал связанный файл по строкам, снимая его и добавляя в список. В этом процессе некоторые элементы теряются. Я еще не знаю причины. Но следующие строки создают точный список без каких-либо потерь:

с открытым ("./ Вери/dertop.txt" кодирование = "UTF-8"), как плавник: dertop = fin.read () .splitlines()

 Смежные вопросы

  • Нет связанных вопросов^_^