Экстрактор функции sklearn's Featurehasher
имеет несколько преимуществ по сравнению с его встречной частью DictVectorizer
, благодаря использованию хеширующего трюка.sklearn FeatureHasher parallelized
Одно из преимуществ, которое кажется труднее выявить, - его способность работать параллельно.
Мой вопрос: как я могу легко сделать FeatureHasher
работать параллельно?
Я думаю parallelising DictVectorizer гораздо сложнее? – eleanora
На самом деле я думаю, что тот же код должен работать? – maxymoo
DictVectorizer принимает список словарей в массив numpy. Любой параллельный метод должен обеспечить, чтобы он был согласован между разбиениями. Как вы могли бы обеспечить эту последовательность? – eleanora