Я пишу нейронную сеть, которая может играть в tic-tac-toe. Сеть имеет 9 входных нейронов, которые описывают состояние платы (1 - для сетевых перемещений, 1,5 - для противников, 0 - для пустых ячеек) и 9 выходных нейронов (выходной нейрон с самым высоким значением указывает на лучшее действие в данной государство). В сети нет скрытого слоя. Активационная функция - сигмовидная. Метод обучения - Q learning + backpropagation.Нейронная сеть для tic-tac-toe
Сеть тренируется, но плохо (продолжает шагать по занятым ячейкам). Поэтому я решил добавить скрытый слой. И я хотел бы спросить:
Какое количество нейронов в скрытом слое использовать и какие функции активации лучше использовать для скрытых и выходных слоев?
Мне нравится проект, если вы разместите его на Github, это принесет пользу всем. К сожалению, неясно, как нам ответить на вопрос. Ваш вопрос звучит так, будто у вас есть ошибка для меня (шаг на занятых ячейках), чем вопрос для машинного обучения. – SmallChess