Я пытаюсь использовать драгоценный камень ffi-aspell для проверки орфографии текста. Для этого мне кажется, что я должен сам извлечь эти слова. Я пытаюсь сделать это, применив String#scan
к тексту с регулярным выражением, но это не кажется простым.Классы символов, используемые в ffi-aspell
Что является самым простым способом определения класса символов, который может появиться в словаре ffi-aspell на каком-либо языке? Я хочу сделать его доступным не только для английского языка, поэтому такие вещи, как /[a-zA-Z']/
для персонажа (или /[a-zA-Z']+/
слово), не работают. /[[:word:]]/
, похоже, захватывает символы, которые не находятся в словаре, такие как цифры, и, кроме того, не соответствует апострофе (одинарная кавычка), который часто используется в слове. Есть ли какая-либо документация, которая определяет набор символов, используемый в словаре ffi-aspell?
Не было бы проще сначала сканировать 'ffi_aspell' _dictionary_ для записей и просто любоваться' Regexp # union' uniques? – mudasobwa
@mudasobwa Я думаю, что это даст идеальное решение. Это было бы гибким и давало точный набор, который я хочу. Можете ли вы превратить это в ответ? – sawa