Вы знаете, как создать модели прогнозирования для Ensemble методов классификаторов, в частности, которые являются R стилем:Как создать прогностическую модель в Python R стиле с использованием нескольких категориальных переменными
ded.fit(formula="X ~ Y + Z**2", data=fed)
В настоящее время код выглядит примерно так это:
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(n_estimators=100, min_samples_leaf=10,
random_state=1)
model.fit(x_train, y_train)
Вопрос: Вы можете спросить, почему мне это нужно?
- Мне нужно это, чтобы добавить больше переменных, а не только X и Y Мне нужны Z и P и Q и R.
я должен видеть и эксперимент, как я в R, если добавление экспонента или умножения или деления значения для конкретной увеличивается переменной или уменьшает точность прогнозирования, как показано ниже формулой:
X ~ Y + Z^2" or "X ~ Y + Z + (P*2) + Q**2
Любые ответы будут высоко оценены. Спасибо заранее.
Scikit-learn не имеет никакого интерфейса в стиле формулы. Вы можете иметь несколько предикторов, включив их в качестве столбцов в свои X-данные. – BrenBarn
Спасибо @BrenBarn Не могли бы вы привести пример, который действительно поможет в том, как включить несколько столбцов, нужно ли нам это делать, разделив на X_Train и Y_Train? –
Есть тонны scikit изучают учебные пособия и вопросы, показывающие, как это сделать. Осмотреться. – BrenBarn