0зной
1ответ
2зной
1ответ
Это ошибка в SARSA λ теме книги RL Sutton & Barto?
7зной
1ответ
Обновление старой системы Q-обучения с помощью Neural Networks
1зной
1ответ
0зной
1ответ
Как описать оптимальную политику (pi *) уравнения звонящего?
1зной
1ответ
ArrayIndexOutOfBoundsException: -1
0зной
2ответ
Простой интерфейс для обучения арматуре