0

Я читал книгу «Введение в статистическое обучение». В книге говорится, что:Значение ошибки Срок e

В общем случае предположим, что мы наблюдаем количественный отклик Y и набор предикторных переменных X1, X2, .... Xn.

Мы предполагаем, что существует некоторая связь между Y и X (X1, X2, ... Xn), которые могут быть записаны в очень общем виде:

Y = F (X) + е

Здесь f - некоторая фиксированная, но неизвестная функция X, а e - случайный член ошибки, который не зависит от X и имеет средний ноль.

Я хочу знать, что значит означать нуль?

+1

Похоже, что e по существу является шумом (например, в измерении), так как число наблюдений стремится очень велико/к бесконечности, e будет выровняться до нуля. – StuartLC

ответ

1

Я хочу знать, что значит означать нуль?

Это означает, что e, рассматривается как случайная величина ожидало значение 0. Другими словами, если вы вычислить среднее значение этих ошибок, то с набором образцов растет до бесконечности - он будет стремиться к нулю.

В более практическом плане это просто означает, что ваш шум не изменяет вашу функцию f (x), но если вы наблюдаете некоторый «положительный» шум, то была точно такая же вероятность наблюдения «негативного» шума того же прочность. Обратите внимание, что если у вас есть e со средним m это означало бы, что

E[f(x) + e] = E[f(x)] + E[e] = E[f(x)] + m 

, таким образом, для каждой точки «х» можно было бы ожидать, чтобы наблюдать значение п (х) + м, а не только е (х). Таким образом, было бы таким же, как моделирование

g(x) + e' 

где

g(x) = f(x) + m 

и e' теперь нулевым средним случайного шума. Таким образом, вся статистическая установка по-прежнему действительна для ненулевого среднего шума, но тогда ваша задача (решение ML) заключается не в модели «f», а «g».

0

Предположим, что ваши ошибки обычно распространяются, так как во вводных настройках мы часто делаем это предположение. Если вы согласны принять это, то другой способ мышления о нулевой средней ошибке состоит в том, чтобы сказать, что ваша конечная переменная Y сама является случайной величиной, которая распределяется подобно N (f (X), sigma^2). Другими словами, результат похож на случайную ничью с некоторой вероятностью, распределенной по центру f (X). Обратите внимание, что если у вас есть разные Xs для каждого Y, то вы увидите, что значение f (X) изменяется, и поэтому нормальное распределение, которое генерирует каждый наблюдаемый результат Y, тоже изменяется. Тем не менее, все наблюдения связаны этим основным правилом (f) о том, как функции (т. Е. Ваши X-данные) были привязаны к распределениям, которые генерировали ваши результаты.