Японский язык, я считаю, имеет более чем один порядок сортировки, эквивалентный алфавитному порядку на английском языке.Какие японские заказы сортировки/сортировки поддерживаются ICU/CLDR/UCA?
Я считаю, что есть хотя бы один, основанный на произношении (я думаю, что кана использовала два ордера исторически) и один, основанный на числе радикалов + инсульта. У китайцев также есть несколько заказов с одним, основанным на радикале/ударе, но из-за Unicode Han Unification у одного и того же персонажа может быть другой счетчик хода для китайцев и японцев.
Поскольку я считаю, что стандарт для порядка сортировки в Юникоде - это CLDR для данных с UCA для алгоритма, а эталонная реализация - ICU.
Реализации, как правило, отстают от стандартов, и эта информация трудно отследить до канонических источников.
Если я установил колпак со спецификатором языка ja
, какой порядок сортировки я должен использовать?
Если несколько доступны для японцев или планируется в какой-то момент, какие спецификаторы должны использоваться для них? Например, спецификатор для традиционного алфавитного порядка испанского языка - es-u-co-trad
.
Проблема с Кандзи покрыта [здесь довольно хорошо] (http://www.localizingjapan.com/blog/2011/02/13/sorting-in-japanese-%E2%80%94-an-unsolved- проблема /). –
Да, я уверен, что с препятствиями нет идеального решения, но я все еще хочу знать, сколько решений «хорошо, как мы можем», стандартизированы и названы и какие конкретные ограничения у каждого есть. – hippietrail