2016-10-27 6 views
1

Я разрабатываю программу, которая дает правильный формат текста, например, если я пишу سلام так что это даст FEB3, FEE0, FE8E and FEE2 ведьму являются Юникодом س, ل, ا, م, а затем, если я пишу ټول есть Unicode для символа ټ которого 067C, но не Unicode для символа ټ, который Первоначальная контекстная форма.Юникод для контекстных форм ټ, ګ, ځ, څ, ڼ, ښ, ډ, ۍ, ړ, ې в языке пушту

Так что я нашел Unicode для изоляции от ټ, ګ, ځ, څ, ڼ, ښ, ډ, ۍ, ړ, ې в Wikipedia, но я не могу найти Unicode контекстных форм ,

Например Unicode из ټ, ټ, ټ.

Я жду ответа, если кто-нибудь знает решение этой проблемы. спасибо ...

+1

[Спецификация] (http://www.unicode.org/versions/Unicode9.0.0/ch09.pdf#G37489) не помогает ...? – deceze

ответ

2

Символ Юникода предназначен для абстрактного в том смысле, что у него нет конкретной формы представления. Предпочтительным способом отображения курсовых сценариев, таких как арабский, является сохранение стандартных, неконтекстных форм и преобразование их в их скоростные формы во время отображения, то есть в качестве одного из заключительных этапов системы отображения текста в операционной системе или текстовый редактор.

Курсовые формы обычно предоставляются в виде глифов в шрифте и выбираются с использованием информации в таблицах в файле шрифта, содержащего контекстные правила.

Юникод хранит довольно большое количество арабских контекстуальных форм, но только для совместимости со старыми кодировками и с традиционным металлическим типом, для которого может быть предоставлено только конечное число физических глифов. К сожалению, для ваших целей эти контекстуальные формы не охватывают все расширенные символы, используемые на языках, отличных от арабского, например, пример, который вы даете, это U + 067C ARABIC LETTER TEH WITH RING, используемое в Pashto.

Очень маловероятно, что, по-моему, добавятся дополнительные контекстуальные арабские формы. Поэтому предлагаемая вами программа не может работать, по крайней мере, в соответствии с ее нынешним дизайном.