Модель LogisticRegression от Sklearn отказывается работать параллельно. Я установил n_jobs = -1, а также попытался n_jobs = 4. Не повезло - занято только одно ядро. Я запускаю другие модели sklearn параллельно, например, RandomForestClassifier и XGBoostClassifier.Как включить многоядерную обработку с помощью sklearn LogisticRegression?
Я запускаю Python 2.7.12 с sklearn 0.18 на Ubuntu 14.04.
Другие люди задали один и тот же вопрос (например, here), до сих пор не получая никаких многообещающих ответов. Я надеюсь, что моя удача будет лучше.
что вы пытаетесь запустить? AFAIK 'LogisticRegression' не поддерживает параллелизм – maxymoo
Существует много возможных причин. Но, к счастью, это не так важно. Во всех разумных ml-задачах вы будете использовать перекрестную проверку, а sklearns [LogisticRegressionCV] (http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegressionCV.html) легко параллельны. – sascha
@sascha - это большой вызов, часто один разделенный по времени раздробление более уместен, чем перекрестная проверка n-кратной, а в производственных приложениях вам просто нужно как можно быстрее обучить модель. – maxymoo