Эта формула ничего не значит без контекста. Казалось бы, вывод частной производной Е р относительно у чр, который оказывается отрицательным из суммы произведений δ ор и ш ро, с о в диапазоне от 1 до N о:
def partial_of_E_wrt_y(p):
acc = 0
for o in range(1, No):
acc = acc + delta[p][o] * w[p][o]
return -acc
Е, у и δ может быть tensors из-за использованием надстрочных индексов. Это также означает, что δ op w po может быть тензорным продуктом. Или может быть, что автор просто любит использовать индексы надстрочного индекса без какой-либо ассоциации с тензорами, соглашение, которое я видел в некоторых текстах по компьютерному обучению. Если δ не было дано никакой другой интерпретации, то это может означать Kronecker delta, что будет означать δ op = 1 если o = p и 0 в противном случае.
Прежде всего, для программиста математика - это инструмент. это отношение не является заместителем! Интересно, как вы программируете алгоритмы без понимания математики. –
Существует разница между знанием алгоритмов и возможностью читать приведенные выше выражения. –
По крайней мере, мы согласны с тем, что формулы связаны с кодом. Хорошо. Позвольте мне снова задать свой вопрос: будучи программистом, как вы научитесь читать это? –