2016-11-17 4 views
0

Я наблюдал за этим video от знаменитого курса Intro to Stat Learning по перекрестной проверке при выборе функции.Перекрестная проверка является функцией, выбранной в классификации

Профессора сказали, что мы должны сформировать складки перед тем, как выполнить установку модели и функцию. Они также сказали, что в каждом расколе мы можем получить другой набор «лучших предикторов»

Вопрос, если это так, как мы можем определить общие наилучшие предсказатели для будущего использования. Другими словами, если у меня есть новый набор данных, как узнать, какие предиктора я должен использовать?

+0

Добро пожаловать в SO! Этот вопрос не о программировании, так что это не подходит для этого сайта. Вам будет лучше спросить у [Cross Validated] (http://stats.stackexchange.com) – Tchotchke

ответ

0

Хороший вопрос для новичков. Ответ на ваш вопрос заключается в том, что использовать тот же набор функций для будущего использования. Да, есть компромисс, который выбранные функции могут меняться со временем. Но обычно они идут с функциями, выбранными ранее. Но важно то, что исходные данные, используемые для выбора функции, должны быть достаточно хорошими с достаточным количеством выборок, чтобы отображать почти все случаи проблемы. Если это так, как правило, выбранные функции не так сильно изменили и для новых тестовых данных.