Я довольно новичок в decision trees
и немного беспокоюсь, интерпретируя их, когда я двигаюсь вниз по ветвям. У меня есть несколько вопросов относительно сюжета, который был сделан на R. Ответная переменная: Survived
(Yes
/No
), которая должна быть указана по возрасту, стоимости проезда, количеству братьев и сестер и числу родителей. Я приложил дерево решений ниже, используя Kaggle's Titanic
набор данных.Толкование дерева решений (данные Titanic)
- Что означают разные цвета зеленого/синего?
- Как интерпретировать листовые узлы?
- Я понимаю, что самый верхний узел inteprets до 38% выжил, 62% сделал не выжить, и 100% населения находится в этом ведре. Если я переместил вправо ... как бы я интерпретировал Bucket # 3? И если я продолжаю идти, Ведро # 6? И т.д. и т.п. ...
Действительно полезно, спасибо. Будет ли эта интерпретация Века № 3 действительной? 1) 74% выжили, если они были женщинами (в пределах 35% от данных) 2) 26% не выдержали, если они были женщинами (в пределах 35% от данных) –
да, абсолютно. –