Я загрузил пакет aspell для поддержки словаря на бенгальском языке. Из tarball я смог изолировать файл bn.wl, который представляет собой список из 100 000 слов, по одному в каждой строке.Получение списка слов из словаря GNU aspell
Проблема в том, что кодировка, по-видимому, is13194-bn, и любой текстовый редактор, который я открываю файл, показывает мусор (одно мусорное слово в строке). Вероятно, он ожидает utf8 или что-то в этом роде.
Как преобразовать этот файл в удобочитаемую форму? Я пробовал использовать iconv, но, по-видимому, он не может распознать кодировку.