Как было сказано, математическое выражение вы опубликовали это функция стоимости, в то время как фрагмент кода вы показать, градиент.
Однако суммирование не пропущено. Давайте сломаем его.
Градиент функции стоимости по отношению к j-го параметра 
С X * theta
вы получаете вектор, который содержит скалярное произведение всех точек данных и вашего вектора параметров.
С помощью sigmoid(X * theta)
вы оцениваете сигмоид каждого из этих точечных продуктов.
С помощью X * theta)-y
вы получаете вектор, содержащий различия между всеми вашими прогнозами и фактическими ярлыками.
С помощью sigmoid(X * theta)-y)' * X
вы переносите вектор сигмоидных оценок и вычисляете его точечный продукт с каждым из столбцов вашего набора данных (т. Е. Каждый из x_j для каждой точки данных).
Подумайте об этом на секунду, и вы увидите, как именно это суммирование в выражении, но оценивается для всех записей вашего параметра, а не только j
.
Сумма не пропущена. Знак суммирования в левой квадратной скобке применяется ко всем членам. – duffymo