У меня есть программа python, которая создана в ноутбуке Jupter. Из-за используемого множителя данных и оптимизационного алгоритма 4-кратная пользовательская перекрестная проверка в некотором диапазоне занимает около 30 минут.Как я могу ускорить свою программу, созданную в Jupyter Notebook?
Окружающая среда компьютера: CPU i5 3,3 ГГц, 8 ГБ оперативной памяти DDR3, SSD.
Я задаюсь
Если можно развернуть его на какой-то сервер и может сделать скорость немного быстрее? (Файл данных составляет всего около 30 МБ, я думаю, что можно загружать данные и программу). И это также может помочь другим, кто хочет использовать программу.
Могу ли я сделать что-нибудь, чтобы ускорить проверку креста? Это добрый ручный процесс. Я использую
sklearn.cross_validation.KFold
для извлечения поезда и тестового набора. Затем я прокручиваю каждую складку, чтобы построить модель и проверить ее результат. Я не уверен, возможно ли инкапсулировать мой метод построения модели и выполнить проверку перекрестных ссылок в parrallel?
Не могли бы вы использовать эту функцию? cross_validation.cross_val_score (clf, X_digits, y_digits, cv = kfold, n_jobs = -1). Тогда n_jobs будет параметром для указания количества используемых процессов/cpus. – Ohumeronen
@Ohumeronen, но этот пользовательский 'clf' довольно сложно сделать. В моей пользовательской перекрестной проверке он включает в себя KDE, алгоритм оптимизации и некоторые другие. – cqcn1991
Итак, вы используете свой собственный классификатор, который не будет принят для параметра clf? Для вашего первого вопроса я предлагаю арендовать или настроить сервер и ознакомиться с SSH. Возможно, с параметром -X для визуального взаимодействия с сервером. – Ohumeronen