2011-12-14 5 views
-1

Мои друзья и я разрабатываем приложение для iphone и Android. Нам нужно работать с транскрипцией слов. Какую кодировку (или даже специальный шрифт) мы должны выбрать для отображения правильной транскрипции слов в наших приложениях?Какую кодировку я должен выбрать для транскрипции?

ОБНОВЛЕНИЕ (14 декабря 2011 г.): Я хотел бы предоставить дополнительную информацию. Я пытаюсь прочитать некоторые транскрипции из словаря Muller (http://sourceforge.net/projects/xdxf/files/dicts-XDXF/sdict05/comn_sdict_axm05_mueller24.tar.bz2/download) и возникли проблемы с некоторыми символами. проверить словарь кодировки файла с enca

~/mueller24 % enca dict.xdxf               
Universal transformation format 8 bits; UTF-8 

Одним из проблемного слова является «художником». Когда я открываю файл словаря в Emacs Я вижу:

enter image description here

С данными работает наш скрипт, написанный на Ruby. Он анализирует эту транскрипцию из словаря и сохраняет в базе данных. И после этого он взял эту транскрипцию из базы данных и записал ее как json в файлы (utf-8). Если открыть этот файл в текстовом редакторе я вижу, как эта строка \u0445peInt\u255a

И если я разобрать его в моем приложении и показать на экране кажется так:

enter image description here

Где ошибка? Я предполагаю, что проблема в парсинге файла словаря. Чем правильно его разобрать?

+1

возможно UTF-16? – aroth

+0

Как перевод слов отличается от другого текста? – SLaks

+0

, пожалуйста, см. Мое подробное обновление. спасибо – yas375

ответ

1

UTF-8 (компактный и обратный совместимый)

+0

, пожалуйста, см. Мое подробное обновление. thanks – yas375

+1

Этот файл явно UTF-8 (в заголовке XML). С вашего снимка экрана данные для художника выглядят неправильно, я ожидаю, что он будет соответствовать картине (peɪntə). Я думаю, у вас есть сочетание диакритики. –

+0

Да, вы правы. Мы пытаемся открыть этот файл в приложении StarDict и транскрипциях, чтобы слова были хорошими. Чем я просто скопировал строки транскрипции оттуда в мои файлы с помощью json, проанализируйте его в приложении iphone, и он отобразится правильно. Я пойду глубже в наш синтаксический скрипт в рубине. Спасибо за ответ! – yas375