1зной
1ответ
ε-жадная политика с уменьшающейся скоростью исследования
0зной
1ответ
разведка и эксплуатация в Q-обучении
0зной
1ответ
1зной
2ответ
Почему моя нейронная сеть Q-ученик не изучает tic-tac-toe
0зной
1ответ
итерации и награды в q-learning
0зной
1ответ
В Q Learning, как вы можете получить значение Q? Разве Q (s, a) не будет продолжаться вечно?
2зной
1ответ
Обучение только одному выходу сети в Keras