2014-03-22 5 views
2

Я провел некоторое исследование и не могу найти способ транслитерации японского языка.Как транслитерировать японский текст в ASCII (Ruby)

Stringex был бы лучшим выбором, но это known issue, что он относится к японцам как к мандаринцу. Я проверил это, даже когда есть очевидные японские символы (например, kana). То же самое для Unidecoder.

Я понимаю, что это сложная проблема, поскольку фонетика Кандзи неоднозначна, но это для клонов URL, поэтому она не должна быть идеальной.

+0

Нужно ли вообще транслитерировать? В наши дни UTF-8 должен быть в хорошем состоянии. –

+0

В чем вопрос? – sawa

+0

@muistooshort Возможно, вы правы, мне нужно проверить общую совместимость. Я все же хотел бы сделать это по другим причинам, например, по предложению имени пользователя. – mahemoff

ответ

2

Я никогда не пробовал, но вы можете попробовать это:

https://github.com/makimoto/romaji

«Romaji» в основном название системы сами японцы используют, чтобы писать Roman/латинские символы. Я не уверен, что транслитерации, нацеленные на ромаджи для японских ораторов, будут тем, что вам нужно, если вы нацеливаете неяпонских ораторов, но похоже, что это может быть хорошо.

Знаете ли вы, что вы можете попробовать romaji в своем поиске в Google, вот что я сделал. Поскольку рубин, конечно, возник в Японии, я подумал, что для этого будет что-то.