2016-05-11 6 views
0

Я использую PyEnchant для написания сценариев орфографии/грамматики. Я заметил это поведение на моем Mac:PyEnchant странное поведение для чисел

>>> import enchant 
>>> d = enchant.Dict('en_us') 
>>> d.suggest('50') 
['W', 'Y', 'w', 'y', 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'X', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'x', 'z'] 
>>> enchant.__version__ 
'1.6.6' 

Однако, он работает более предсказуем на моей Linux машине (тот же версию pyenchant)

>>> import enchant 
>>> d = enchant.Dict('en_us') 
>>> d.suggest('50') 
['5', '0', '50s'] 

ответ

0

Это связанно с основным поставщиком. На Ubuntu у меня есть словарь en_US, установленный как для myspell, так и для aspell. Если я переключаю поставщиков, я получаю разные результаты. Например. с таким скриптом:

import enchant 

b = enchant.Broker() 
b.set_ordering("en_US","myspell,aspell") 
print b.describe() 
d=b.request_dict("en_US") 
print d.provider 
s = '50' 
print d.suggest(s) 

b = enchant.Broker() 
b.set_ordering("en_US","aspell,myspell") 
print b.describe() 
d=b.request_dict("en_US") 
print d.provider 
s = '50' 
print d.suggest(s) 

Я получаю следующий выход.

[<Enchant: Aspell Provider>, <Enchant: Ispell Provider>, <Enchant: Myspell Provider>, <Enchant: Hspell Provider>] 
<Enchant: Myspell Provider> 
['5', '0', '50s'] 
[<Enchant: Aspell Provider>, <Enchant: Ispell Provider>, <Enchant: Myspell Provider>, <Enchant: Hspell Provider>] 
<Enchant: Aspell Provider> 
['W', 'Y', 'w', 'y', 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'X', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'x', 'z'] 

Первый набор предложений - это то, что вы видите в Linux, но я использую Myspell Provider. Второе - это то, что вы видите на своем Mac, и я использую поставщик Aspell.