Я сталкиваюсь с проблемой, что гиперпараметры моего svm.SVC()
слишком широкие, так что GridSearchCV()
никогда не будет завершен! Одна из идей заключается в том, чтобы вместо этого использовать RandomizedSearchCV()
. Но опять же, мой набор данных относительно большой, чтобы 500 итераций занимали около 1 часа!Что такое хороший диапазон значений для гиперпараметров svm.SVC() для изучения через GridSearchCV()?
Вопрос в том, что такое хорошая настройка (с точки зрения диапазона значений для каждого гиперпараметра) в GridSearchCV (или RandomizedSearchCV), чтобы прекратить тратить ресурсы?
Другими словами, как решить, действительно ли или нет. C
Значения выше 100 имеют смысл и/или шаг 1 не являются ни большими не маленькими? Любая помощь очень ценится. Это установка я в настоящее время с помощью:
parameters = {
'C': np.arange(1, 100+1, 1).tolist(),
'kernel': ['linear', 'rbf'], # precomputed,'poly', 'sigmoid'
'degree': np.arange(0, 100+0, 1).tolist(),
'gamma': np.arange(0.0, 10.0+0.0, 0.1).tolist(),
'coef0': np.arange(0.0, 10.0+0.0, 0.1).tolist(),
'shrinking': [True],
'probability': [False],
'tol': np.arange(0.001, 0.01+0.001, 0.001).tolist(),
'cache_size': [2000],
'class_weight': [None],
'verbose': [False],
'max_iter': [-1],
'random_state': [None],
}
model = grid_search.RandomizedSearchCV(n_iter = 500,
estimator = svm.SVC(),
param_distributions = parameters,
n_jobs = 4,
iid = True,
refit = True,
cv = 5,
verbose = 1,
pre_dispatch = '2*n_jobs'
) # scoring = 'accuracy'
model.fit(train_X, train_Y)
print(model.best_estimator_)
print(model.best_score_)
print(model.best_params_)
Вы предлагаете здесь неразумно смешивать непрерывные и дискретные параметры в случайном поиске? Почему это и как обычно вы ищете параметры, когда они смешиваются для одного алгоритма? –
Это было не то, что я имел в виду. Я рекомендую использовать списки для фактически непрерывных параметров, см. Документ: https://encrypted.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0CB4QFjAA&url=http% 3A% 2F% 2Fwww.jmlr.org% 2Fpapers% 2Fvolume13% 2Fbergstra12a% 2Fbergstra12a.pdf & е = -bpkVf839bWxBJ_Lg4gJ & USG = AFQjCNFKAQbDd5l0Q7WH36ejee4ahKlZQg & Sig2 = ftE5PnFHyIvTKvIGGTS4xw & BVM = bv.93990622, d.cWc Смешивание непрерывных и дискретных нормально. –
Вы также можете ознакомиться со средней частью моей беседы: https://www.youtube.com/watch?v=0wUF_Ov8b0A –