Предпосылки: Я попытаюсь составить список наиболее часто используемых слов/кандзи на разных досках сообщений на 2ch.net, чтобы японские ученики могли участвовать в онлайн-обсуждении и, таким образом, мотивировались на продолжение.Отдельные японские слова в python, javascript или java?
Я ищу способ разделить слова, но это не так просто, как на английском. Слова могут быть либо кандзи, либо состоять из нескольких, таких как «巨人» (гигант) или «人» (человек), и нет никаких пробелов.
Поэтому мне, вероятно, нужна библиотека японского языка для обработки текстов, и я знаю только python, javascript и java. (Я предпочитаю питона)
@lattyware Это не так просто, как разбиение символов, потому что слово может состоять из нескольких символов, а также быть в одиночестве. – Alexander
Да, если вы прочтете ответы на сообщение, которое я связал, люди говорят о том, чтобы разделить японцев на слова. –