0зной
1ответ
Проблемы в обучении арматуре: ошибка, настройка параметров и период обучения
0зной
1ответ
Как повысить производительность сети с прямыми линиями в качестве аппроксиматора функции q-value?
11зной
1ответ
Обучение в области углубленного обучения или обучения в арсенале
3зной
3ответ
Усиление обучения и динамическое программирование
1зной
1ответ
Q-learning с аппроксимацией функции, где каждое состояние не имеет одинакового набора действий.
0зной
1ответ
может помочь учебному агенту по обучению разделить дискретное распределение
0зной
1ответ
Выполняет ли предварительная обработка при глубоком Q/усилении обучения?