2016-09-01 2 views
-6

Как я могу разделить одно слово на санскрите? Например. Есть два санскрит ниже:Как разделить одно слово в python?

Here below i upload example of split word

+1

Я не верю, что какие-либо встроенные библиотеки способны это сделать, и как это сделать, используя 'nltk' и/или' numpy', вероятно, слишком широка для вопроса. В любом случае, что пытались до сих пор? –

+0

Английский текст трудно разбить таким образом. С другой стороны, текст Девнагари довольно прост. Вот проект, который разбивает текст Непала (Devnagari) на морфемы, основанные на «Swar» и «Barnas». https://github.com/PraveshKoirala/nepali_morpheme_splitter – Prasanna

+0

Два из ваших трех примеров - это не простые строковые разбиения либо – Andrew

ответ

1

Вы можете построить функцию hypenation, это просто необходимо знать закономерности языка. Вот один для санскрита: http://pkgs.fedoraproject.org/repo/pkgs/hyphen-sa/hyph-sa.tex/28571068f3c55c8df8859e8e6ad12192/hyph-sa.tex

Однако, если вы хотите разбить на корневые слова, нет общего алгоритма. Вместо этого вам просто нужно выполнить поиск в предварительно вычисленном словаре.

+0

спасибо за предложения, я проверю его ... –