Я работаю над набором данных Titanic. Я пытаюсь заполнить пробелы в столбце CABIN. Я извлек первую букву из значений столбца CABIN, а затем разместил их в столбце CABIN_NEW. После этого я использую rpart
для прогнозирования, но как-то каждый раз, когда я запускаю код ниже, R занимает много времени (еще не закончил один раз, каждый раз, я должен его прекратить).rpart исполнение в R Studio
DATAset имеет 1309 строк, а столбцы, которые я использую, приведены ниже в коде. Система Я использую работает на 4 Гб оперативной памяти, процессор i5 и Window 7.
combifit <- rpart(Cabin_New ~ Pclass + Sex + Age + SibSp + Parch + Fare + Embarked + Title
+ FamilySize + Surname + FamilyID,
data = combi[!is.na(combi$Cabin_New),], method = 'class')