на основе моего последнего question Я построил 3D-игру, в которой два робота оружия играют в настольный теннис друг с другом. У роботов шесть степеней свободы.
В состоянии состоит из:Предложение для нейронной сети для настольного теннисного робота
- х, у и г-положение мяча
- 6 углов робота
Все значения нормированы, так что они принимают значение между [-1,1]. С 4 последовательными кадрами я получаю полный ввод 37 параметров.
Награды
- +0,3, когда игрок ударяет мяч
- +0.7, когда игрок выигрывает матч
- -0.7, когда игрок проигрывает матч
Выход
Каждый из шести соединений робота может перемещаться с помощью определенная скорость, поэтому каждый сустав имеет возможность двигаться в положительном направлении, оставаться или двигаться в отрицательном направлении. В результате получается 3^6 = 729 выходов.
С помощью этих настроек нейронная сеть должна изучить обратную кинематику робота и играть в настольный теннис. Моя проблема в том, что моя сеть сходится, но, похоже, застряла в локальном минимуме и в зависимости от конфигурации, после этого начинает сходиться. Я сначала попробовал сети с двумя и тремя скрытыми слоями с 1000 узлами, и через несколько эпох сеть начала сходиться. Я понял, что 1000 узлов слишком много и опустили их до 100, в результате сеть ведет себя так, как описано, она сначала сходится, а затем немного расходится. Поэтому я решил добавить скрытые слои. В настоящее время я пытаюсь создать сеть с 6 скрытыми слоями, по 80 узлов. Текущие потери выглядят так:
Так что, как вы думаете, опытные специалисты по компьютерному обучению? Вы видите какие-либо проблемы с моей конфигурацией? Какой тип сети вы бы выбрали?
Я рад за каждое предложение.
Большое спасибо за ваш ответ, это помогает. Учитывая комбинаторный взрыв, мой подход состоял бы в том, чтобы добавить больше вознаграждений, например, за расстояние между возможной позицией удара и положением весла или, во-первых, показать сети некоторые ходы хорошего игрока и позволить ей учиться потом. Почему, по-вашему, бумага фиктивная? Я довольно новичок в этой области и хотел бы услышать ваше мнение. Было бы здорово, если бы вы напишите мне сообщение или пришлите мне статью, в которой выражается ваше мнение. – Koanashi