Как я могу разделить одно слово на санскрите? Например. Есть два санскрит ниже:Как разделить одно слово в python?
-6
A
ответ
1
Вы можете построить функцию hypenation, это просто необходимо знать закономерности языка. Вот один для санскрита: http://pkgs.fedoraproject.org/repo/pkgs/hyphen-sa/hyph-sa.tex/28571068f3c55c8df8859e8e6ad12192/hyph-sa.tex
Однако, если вы хотите разбить на корневые слова, нет общего алгоритма. Вместо этого вам просто нужно выполнить поиск в предварительно вычисленном словаре.
+0
спасибо за предложения, я проверю его ... –
Я не верю, что какие-либо встроенные библиотеки способны это сделать, и как это сделать, используя 'nltk' и/или' numpy', вероятно, слишком широка для вопроса. В любом случае, что пытались до сих пор? –
Английский текст трудно разбить таким образом. С другой стороны, текст Девнагари довольно прост. Вот проект, который разбивает текст Непала (Devnagari) на морфемы, основанные на «Swar» и «Barnas». https://github.com/PraveshKoirala/nepali_morpheme_splitter – Prasanna
Два из ваших трех примеров - это не простые строковые разбиения либо – Andrew