Я работаю с набором данных, который требует много предварительных операций, и чтобы предотвратить переобучение, я сам создал перекрестные проверки. Итак, у меня есть набор данных, где первые k записей принадлежат fold 1 (у меня также есть столбец fold_number, чтобы указать склад, к которому принадлежит запись). Второй k записей принадлежит слою 2 и т. Д. Я хочу использовать пакет caret и использовать кросс-валидацию для настройки параметров, но я не могу понять, как я могу передать идентификаторы для каждой сгибы функции trainControl(), а не просто позволить R перекрестно проверять для меня. У кого-нибудь есть идеи?Как передать указанные пользователем индексы в traint trainControl?
2
A
ответ
3
Вы ищете index
и indexOut
аргументы trainControl
. Это четко определено в документации ??trainControl
...
index a list with elements for each resampling iteration.
Each list element is the sample rows used for training
at that iteration.
indexOut a list (the same length as index) that dictates which sample
are held-out for each resample. If NULL, then the unique set
of samples not contained in index is used.
...
Это также адрес в списке рассылки here.