2016-11-14 4 views
1

Я использую пакет randomForestSRC в R для создания леса выживания. У меня есть наборы данных обучения и Tesing. Используя набор учебных материалов, растут деревья (Random Forest) и с помощью набора Testing, производится прогнозирование.Как найти точность анализа выживания с использованием пакета RandomForestSRC в R

Теперь я хотел получить точность прогнозируемого выхода выживания. Я могу получить параметр частоты ошибок из выходного сигнала прогнозирования. Но не знаю, является ли это правильностью модели, или нам нужно рассчитать точность от нее.

Когда я искал то же самое, я мог видеть, что точность для обычного случайного леса может быть рассчитана с использованием матрицы замешательства. Но не уверен, как рассчитать точность выживания.

Пожалуйста, дайте мне знать, как рассчитать точность модели выживания RandomForest.

ответ

0

В RandomForest вам не нужно разделить его на учебные и тестовые данные, как вы бы вычислили ошибку OOB. Проводка несколько ссылок, которые должны быть полезны

OOB Error explained - Quora

How OOB Estimation Works - Breiman*

OOB Explained quite well - ETH

[Лео Бреймана и Адель Катлер - оценка неработающей-мешок (OOB) ошибка В случайных лесах, там не требуется перекрестная проверка или отдельный набор тестов для получения несмещенной оценки ошибки тестового набора. Внутренний расчет во время пробега оценивается следующим образом:

Каждое дерево построено с использованием другого образца бутстрапа из исходных данных. Примерно одна треть случаев исключена из образца бутстрапа и не используется при построении k-го дерева.

Поместите каждый случай в конструкцию k-го дерева вниз по k-му дереву, чтобы получить классификацию. Таким образом, для каждого случая получается классификация тестового набора примерно в одной трети деревьев. В конце прогона возьмите j, чтобы быть классом, который получил большинство голосов каждый раз, когда n был oob. Доля раз, когда j не равна истинному классу n, усредненному по всем случаям, является оценкой ошибки oob. Это доказало свою непредвзятость во многих тестах.] 4

 Смежные вопросы

  • Нет связанных вопросов^_^