2013-07-27 2 views
0

Предпосылки: Я попытаюсь составить список наиболее часто используемых слов/кандзи на разных досках сообщений на 2ch.net, чтобы японские ученики могли участвовать в онлайн-обсуждении и, таким образом, мотивировались на продолжение.Отдельные японские слова в python, javascript или java?

Я ищу способ разделить слова, но это не так просто, как на английском. Слова могут быть либо кандзи, либо состоять из нескольких, таких как «巨人» (гигант) или «人» (человек), и нет никаких пробелов.

Поэтому мне, вероятно, нужна библиотека японского языка для обработки текстов, и я знаю только python, javascript и java. (Я предпочитаю питона)

+0

@lattyware Это не так просто, как разбиение символов, потому что слово может состоять из нескольких символов, а также быть в одиночестве. – Alexander

+0

Да, если вы прочтете ответы на сообщение, которое я связал, люди говорят о том, чтобы разделить японцев на слова. –

ответ

 Смежные вопросы

  • Нет связанных вопросов^_^