Я надеюсь, что кто-то с гораздо большим знанием машинного обучения может помочь мне здесь. Я читал примеры регрессии и классификации, и я всегда возвращаюсь к вопросу: «Какая разница между тем, что делает этот алгоритм, и что будет делать стандартный статистический анализ».Что такое «прогностический» элемент машинного обучения
В частности, ни один из примеров, которые я прочитал, по-видимому, не обсуждает прогностический элемент. Например, при рассмотрении линейной регрессии статьи обычно объясняют концепцию создания «наилучшего соответствия» - комбинации линейного уравнения, а затем итерации функции стоимости до тех пор, пока она не достигнет минимума. Разумеется, во многих случаях акцент делается на «наборе учебных данных». Нет проблем ... но обычно это заканчивается. В этот момент я не вижу разницы между указанным выше и стандартным способом проведения статистического анализа в наборе данных, который предположительно имел бы линейную зависимость. Предположительно, будущие значения здесь «предсказаны» из уравнения, которое было получено, когда функция стоимости сходилась на минимуме - опять же, похоже, здесь не так много «обучения», как это именно то, что было бы сделано в обычном случае ,
После долгого вдумчивого введения ... то, что я пытаюсь спросить, как алгоритм узнал из исходных данных обучения? и как этот набор учебных пособий помогает с будущими наборами данных? (опять же, это то, где я немного теряюсь - мне кажется, что вы бы дали ему новый набор данных и выполнили ту же задачу минимизации функции затрат, однако на этот раз у вас есть лучший «исходный» момент, но все ваши знания действительно исходят из того, что вы уже «знали» о наборе данных, то есть о том, что вы принимали линейную зависимость).
Надеюсь, это имеет смысл - это, безусловно, недостаток понимания, но я надеюсь, что кто-то может засунуть меня в правильном направлении.
Спасибо!
Основной момент состоит в том, что большинство алгоритмов не просто аппроксимируют линейную функцию, а некоторую общую функцию. Некоторым подходам даже не нужна параметрируемая функция (например, деревья регрессии). В конце концов, машинное обучение * - это статистический анализ. Однако из-за пространственного функционального пространства основные подходы обычно не работают. –
Конечно, но для меня это звучит как численное решение. Я не совсем уверен, откуда берется аспект обучения. Как будущее предсказание зависит от данных обучения, которым оно подвергалось: i.e, если я использую 15 различных наборов тренировок, а не 1, улучшает ли это предсказуемость моего алгоритма, если да, то как это сделать? Единственный способ, которым я могу себе представить, что это лучше, состоит в том, что если все наборы данных имеют хороший стандарт, то каждый раз, когда вы используете обучающий набор, вы можете начать с лучшего набора начальных условий для следующего набора (ближе к глобальная мин.) - оптимизация. –
«Обучение» в машинном обучении - это то, что статистик назвал бы выводом. Основное различие между дисциплинами является скорее философским: практикующие компьютерные практики больше заботятся о прогностической точности (см., Например, глубокие нейронные сети), статистиков гораздо больше беспокоит интерпретируемость, проверка модели и т. Д. Многие методы идентичны –