1.) Для аббревиатур вы можете украсть у нас: https://github.com/diasks2/pragmatic_segmenter/blob/master/lib/pragmatic_segmenter/abbreviation.rb. Что касается сокращений, список может быть бесконечным, так что это действительно зависит от того, что вы пытаетесь сделать. Вы можете попробовать регулярное выражение для извлечения сокращений.
2.) Не уверен, вы должны быть более конкретными в отношении того, что вы пытаетесь выполнить.
3.) Используйте драгоценный камень lingua и ознакомьтесь с этим tutorial.
4.) Проверьте engtagger, библиотеку Tagger of Ruby Party Of Speech.
5.) Я не знаю ни одной библиотеки, которая может автоматически определять правильные ошибки грамматики/пунктуации (так как было бы много случаев, когда нет четкого правильного ответа). Однако я сделал драгоценный камень, где человек может исправить предложение, и драгоценный камень автоматически покажет разницу между неправильным предложением и правильным предложением, включая количество ошибок, тип ошибок и т. Д. Он называется Chat Correct.
6.) Проверьте драгоценный камень под названием verbs.
Благодарим вас за этот задумчивый ответ. Кажется, мне могут понадобиться разные инструменты для разных характеристик. –