неправильных весов с использованием пакетного градиентного спуска в matlab

Я работаю над линейной регрессией с двумерными данными, но я не могу получить правильные веса для линии регрессии. Возможно, возникла проблема со следующим кодом, потому что рассчитанные весы для линии регрессии рассчитаны не так, как . Использование слишком больших значений данных, около 80000 для x, приводит к NaN для весов. Масштабирование данных от 0 до 1 приводит к неправильным весам, потому что линия регрессии не соответствует данным.неправильных весов с использованием пакетного градиентного спуска в matlab

function [w, epoch_batch, error_batch] = batch_gradient_descent(x, y) 

% number of examples 
q = size(x,1); 

% learning rate 
alpha = 1e-10; 

w0 = rand(1); 
w1 = rand(1); 

curr_error = inf; 
eps = 1e-7; 

epochs = 1e100; 
epoch_batch = 1; 
error_batch = inf; 
for epoch = 1:epochs 
    prev_error = curr_error; 
    curr_error = sum((y - (w1.*x + w0)).^2); 
    w0 = w0 + alpha/q * sum(y - (w1.*x + w0)); 
    w1 = w1 + alpha/q * sum((y - (w1.*x + w0)).*x); 
    if ((abs(prev_error - curr_error) < eps)) 
     epoch_batch = epoch; 
     error_batch = abs(prev_error - curr_error); 
     break; 
    end 
end 

w = [w0, w1];

Не могли бы вы сказать мне, где я сделал ошибку, потому что для меня это кажется правильным после нескольких часов попыток.

данные:

Вот код для построения данных:

figure(1) 
% plot data points 
plot(x, y, 'ro'); 
hold on; 
xlabel('x value'); 
ylabel('y value'); 
grid on; 

% x vector from min to max data point 
x = min(x):max(x); 
% calculate y with weights from batch gradient descent 
y = (w(1) + w(2)*x); 
% plot the regression line 
plot(x,y,'r');

Веса для немасштабированного набора данных может быть найден с использованием меньшей скорости обучения alpha = 1e-10. Однако при масштабировании данных от 0 до 1 у меня все еще есть проблемы, чтобы получить соответствующие веса.

scaled_x =

scaled_y_en =

источник

2016-03-07 evolved

Можете ли вы дать некоторые выборочные данные для вызова fucntion? –

Я добавил немасштабированные данные, которые приводят к значениям NaN для весов. Масштабирование от 0 до 1 путем деления максимального значения возвращает неверные веса, которые не соответствуют данным. – evolved

Вы пытаетесь минимизировать функцию? –

Проблема с w1, как вы даете ему слишком большой вес. Вы не должны давать w0 и w1 одинаковый шаг обучения, так как один не умножается на x.

Если я заменяю alpha/q по alpha^4/q (потому что случайный выбор), то она сходится:

источник

2016-03-07 13:58:55

Спасибо за вашу помощь! Я изменил w1 = w1 + alpha^4/q * sum ((y - (w1. * X + w0)). * X); используя альфа^4, но это не имеет никакого значения. Еще NaN для весов. – evolved

Что относительно 'alpha/q^2' для случая' w1'? –

@evolved он работает для меня .... Я просто скопировал ваш код, чтобы он работал. oh, 'alpha = 0.001' –

неправильных весов с использованием пакетного градиентного спуска в matlab

ответ

Смежные вопросы