2012-06-29 1 views
3

Я не уверен, что это лучшее место, чтобы спросить об этом, но вы, ребята, были полезны с большим количеством моей домашней работы в CS в прошлом, поэтому я думаю, что я сделаю это.алгоритм для объединения данных для линейной подгонки?

Я ищу алгоритм слепо объединить несколько зависимых переменных в индекс, который дает наилучшую линейную привязку с внешней переменной. В принципе, он будет комбинировать зависимые переменные с использованием разных математических операторов, включать или не включать в себя каждый и т. Д. До тех пор, пока не будет разработан индекс, который лучше всего соотносится с моей внешней переменной.

Кто-нибудь видел или слышал что-то подобное раньше? Даже если вы могли бы указать мне в правильном направлении или в нужное место, чтобы спросить, я был бы признателен. Благодарю.

+0

Звучит немного как [Кусочно-линейная функция] (http://en.wikipedia.org/wiki/Piecewise_linear_function) или какая-либо другая форма [подгонка кривой] (http://en.wikipedia.org/wiki/Curve_fitting). –

+0

Вы, честно говоря, лучше спрашиваете об этом на http://math.stackexchange.com, это очень сложный вопрос. –

+0

Конечно, я отдам. Что касается некоторого контекста, я разрабатываю индекс, который коррелирует концентрацию отдельных химических соединений с температурой воздуха. Я работал с ручным регрессионным анализом, но подумал, что что-то, что могло бы слепо сочетать переменные, было бы интересным местом для просмотра. – BoldlyBold

ответ

0

Похоже, вы пытаетесь сделать многомерную линейную регрессию или множественную регрессию. Простейший метод (Read: less exact), чтобы сделать это, - это индивидуально вычислить линейные линии регрессии каждой из переменных компонента, а затем выполнить средневзвешенное значение для каждой из строк. Кроме того, я боюсь, что я мало помогу.

0

Это, по-видимому, простая линейная регрессия с использованием нескольких объясняющих переменных. Поскольку здесь подразумевается, что вы используете вычислительный подход, вы можете сделать что-то простое применение линейной модели к вашим данным с помощью каждой возможной комбинации ваших объясняющих переменных, которые у вас есть (хотите ли вы включить эффекты взаимодействия на ваш выбор) , выберите меру пригодности (R^2 - всего лишь один пример) и используйте это, чтобы ранжировать подгонку каждой модели, которую вы вписываете? Качество модели также несколько субъективно во многих областях - вы можете отклонить модель, содержащую 15 переменных, если она только умеренно улучшает соответствие более далекой модели, содержащей только 3 переменные. Если вы его еще не прочитали, я не сомневаюсь, что вы найдете много полезных предложений в следующем тексте:

Draper, N.R. и Smith, H. (1998). Прикладной регрессионный анализ Wiley Series по вероятности и статистике

Вы также можете попробовать сделать google для метода выбора модели LASSO.

0

Вещь, о которой вы просите, в основном состоит из regression analysis.

Это то, что делает линейная регрессия, и это хорошая часть того, что делает «машинное обучение» (машинное обучение в основном просто название для более сложных алгоритмов регрессии и классификации). Существуют сотни или тысячи различных подходов с различными компромиссами, но базовые часто работают достаточно хорошо.

Если вы хотите узнать больше, курьера course на машинное обучение - отличное место, чтобы получить более глубокое понимание этого.

 Смежные вопросы

  • Нет связанных вопросов^_^