в операторе, не работающем над большим списком

Я использую python 3.5.1 как на окнах 10, так и на ubuntu 14.04 LTS. У меня есть список, содержащий более миллиона строковых элементов. Элементы являются строками unicode турецких слов. Я проверяю существование некоторых строк в этом списке с помощью оператора in. Большинство ответов верны. Однако некоторые строки возвращают False, даже если они существуют в списке. Я пробовал те же самые cehecks после преобразования списка в набор. Но ничего не изменилось. Что можно сделать для получения правильных результатов. Спасибо.в операторе, не работающем над большим списком

Я использую кодировки utf-8 всюду.

Related codes are here

источник

2016-02-16 Ahmet Aksoy

Пожалуйста, включите ваш код в вопрос. – bwegs

Вы сравниваете строки с разными кодировками? – CasualDemon

Мои коды: https://github.com/ahmetax/trderlem/blob/master/kokKelimeler.py –

Проблема решена. Но это не проблема списка. Чтобы подготовить список, я читал связанный файл по строкам, снимая его и добавляя в список. В этом процессе некоторые элементы теряются. Я еще не знаю причины. Но следующие строки создают точный список без каких-либо потерь:

с открытым ("./ Вери/dertop.txt" кодирование = "UTF-8"), как плавник: dertop = fin.read () .splitlines()

источник

2016-02-17 10:10:14

в операторе, не работающем над большим списком

ответ

Смежные вопросы