2015-04-16 4 views
2

Я работаю с набором данных, который требует много предварительных операций, и чтобы предотвратить переобучение, я сам создал перекрестные проверки. Итак, у меня есть набор данных, где первые k записей принадлежат fold 1 (у меня также есть столбец fold_number, чтобы указать склад, к которому принадлежит запись). Второй k записей принадлежит слою 2 и т. Д. Я хочу использовать пакет caret и использовать кросс-валидацию для настройки параметров, но я не могу понять, как я могу передать идентификаторы для каждой сгибы функции trainControl(), а не просто позволить R перекрестно проверять для меня. У кого-нибудь есть идеи?Как передать указанные пользователем индексы в traint trainControl?

ответ

3

Вы ищете index и indexOut аргументы trainControl. Это четко определено в документации ??trainControl

... 
index  a list with elements for each resampling iteration. 
      Each list element is the sample rows used for training 
      at that iteration. 

indexOut a list (the same length as index) that dictates which sample 
      are held-out for each resample. If NULL, then the unique set 
      of samples not contained in index is used. 
... 

Это также адрес в списке рассылки here.

 Смежные вопросы

  • Нет связанных вопросов^_^