Я программист, который заинтересован в обработке и анализе данных временных рядов. Я знаю основную статистику и математику, но я боюсь, что все.
Можете ли вы, пожалуйста, рекомендовать хорошие книги и/или статьи, которые не требуется. чтобы понять их?
Что касается моих конкретных задач - я хочу видеть тренды, устранять выбросы, иметь возможность делать прогнозы и вычислять статистику по целому ряду значений. У нас довольно много событий, происходящих из наших систем.
Я начал читать «Введение в временные ряды и прогнозирование» Броквелла и Дэвиса, и я полностью потерял математику.
обновление по выбросам выбросами Я имею в виду точки данных, которые не обязательно имеют смысл. например обменный курс составляет 1,5 $ (+ - 10 центов) за фунт в среднем, но парень за углом предлагает 1.09 $ и говорит, что он полностью прав.
Введение в ряды временных рядов для программиста
ответ
Я нашел справочник NIST Engineering Statistics Handbook's chapter on time series, чтобы быть простым и понятным введением в основное моделирование временных рядов. В нем обсуждается экспоненциальное сглаживание, авторегрессивное, скользящее среднее и, наконец, моделирование временных рядов ARMA. Они могут использоваться для анализа тенденций и, возможно, прогнозирования при условии проверки.
Обнаружение извне/аномалия - это совсем другая задача; в книге NIST этого мало. Было бы полезно узнать, какие выбросы вы пытаетесь обнаружить.
Я обновил вопрос – chester89
Я прошел через многочисленные книги и статьи, и вот мои выводы. Может быть, они помогут другим, как я.
Что касается теории - я нашел статью An Introductory Study on Time Series Modeling and Forecasting очень хорошо написанную. Это не значит, что я понял все его содержание, но это действительно хороший обзор доступных моделей временных рядов.
Если вы похожи на меня и хотели бы увидеть фактический код - есть article series on QuantStart. Примеры в R, но я думаю, что многие из них переносимы на Python.
Я очень рекомендую QuantStart blog от Michael Halls-Moore, я нашел статьи легко читаемыми, и автор проделал большую работу, пытаясь не подавить читателя математикой. Я также читаю Майкла first book, и он хороший для новичка в пространстве, как я.
Учебники по этой теме чрезвычайно трудно читать. Я пробовал Time Series Analysis by Hamilton, но не получил далеко.
Что касается обнаружения выбросов, о котором я упоминал - я нашел this question on SO и its stats counterpart. По внешнему виду, это не то, что вы можете изучить и реализовать в пару вечеров, по крайней мере, не для меня.
Можете ли вы объяснить голоса, чтобы закрыть? может быть, есть вопрос, который я не нашел? – chester89