В линейной регрессии с 1 переменной я могу четко видеть линию предсказания сюжета, и я вижу, правильно ли она соответствует данным тренировки. Я просто создать сюжет с 1 переменными и выводом и построить линию прогнозирования на основе найденных значений Theta 0 и Theta 1. Таким образом, это выглядит следующим образом:
Как проверить, правильно ли сходится градиентный спуск с несколькими переменными?
Но как я могу проверить достоверность градиента результаты спуска выполняются по нескольким переменным/функциям. Например, если число функций равно 4 или 5. Как проверить правильность работы и найдены ли значения всех тэтов? Должен ли я полагаться только на функцию стоимости, построенную по количеству выполненных итераций?
Стоит отметить, что на практике производная редко бывает нулевой на практике (как и любое другое значение - достижение какого-либо определенного значения имеет почти нулевую вероятность в непрерывных функциях), кроме того, в арифметике точности «нуля» довольно странный термин. Обычно используются аппроксимации, такие как предположение, что 10е-20 равно нулю, что ** не означает, что оно сходится **, это означает только, что «поверхность ошибки настолько плоская, наша арифметика не проходит дальше» – lejlot