У меня есть набор данных с 70 переменными, и я хочу попробовать полиномиальную регрессию. Если число столбцов было три/четыре, я мог бы просто рука коды что-то вроде этого -Как смоделировать полиномиальную регрессию в R?
model <- lm(y ~ poly(var1,3) + poly(var2,3) + poly(var4,4)
Как бы мы идти об этом, если у нас есть 70 переменных? Должны ли мы вводить вручную имена всех переменных или есть более простой метод?
У вас есть какие-либо предварительные знания (например, от бизнеса) о степени полинома, который должен быть установлен для каждой переменной? в общем случае полиномиальная регрессия имеет тенденцию к переобучению и менее обобщаема. –
Здесь я знаю, что означает каждая переменная, но не имеет понятия об их степени полинома. Простая линейная модель дает очень низкие значения Rsquared (около 0,02). И я хочу знать, как мы моделируем полиномиальную регрессию вообще ... –
Ваш первый вопрос: «Как мы будем это делать, если у нас есть 70 переменных?» можно рассматривать как вопрос программирования, если это означает, как мы производим это автоматизированным способом по многим переменным. Ваш второй вопрос не соответствует теме SO и нашел бы лучший дом на [CV] (http://stats.stackexchange.com/). Если, как следует из вашего комментария, ваш основной вопрос относится к статистическому моделированию, я бы исключил этот вопрос и поставил вопрос о CV, подчеркивая этот момент. – lmo