2017-01-20 10 views
1

У меня есть данные банка около 4 лет разных ветвей. Я пытаюсь предсказать количество строк в ежедневном и ежечасном уровнях. У меня есть issue_datetime (год, месяц, день, час) как важные функции. Я применил различные методы регрессии (линейные, деревья решений, случайный лес, xgb), используя графическую лабораторию, но не смог получить лучшую точность. Я также думал установить порог, основанный на прошлых данных, например, принимать средние значения в дневном, месячном уровне после удаления выбросов и устанавливать это как порог. Каков наилучший подход?Прогнозировать количество строк, используя Машину Learnnig

+3

Потому что «Какой лучший подход?» Не может быть удовлетворительным. И даже если кто-то попытается, ответ будет весьма спекулятивным. В общем, вне темы для stackoverflow. – cel

+0

Я согласен с @cel. Но я думаю, прежде чем пытаться сделать предсказания, пытаясь избавиться от ваших моделей сезонности, может помочь улучшить ваш прогноз. – Shobeir

+0

Я открыт для предложений, также как есть другой способ достичь этой задачи? – user1584253

ответ

1

Поскольку у вас есть данные по 1-му временному ряду, должно быть относительно легко отображать данные и искать интересные образцы.

После того, как вы установили, что к вашим данным есть некоторые нестационарные аспекты, класс моделей, которые вы, вероятно, хотите проверить, сначала авторегрессивные модели, возможно, с сезонными дополнениями. Модели ARIMA довольно стандартизированы для данных временных рядов. http://www.seanabu.com/2016/03/22/time-series-seasonal-ARIMA-model-in-python/

 Смежные вопросы

  • Нет связанных вопросов^_^