-3

Извините за плохой заголовок,Machine Learning, GA + BP или GA с огромным NN?

В настоящее время я изучаю ML, и я хочу сосредоточиться на проблеме с помощью набора инструментов, который я приобрел, что исключает обучение подкреплению.

Я хочу создать NN, который занимает простой 2D-уровень игры (подумайте о марио в простейшем случае, простоте функции фитнеса, простых элементах управления и простом выборе функций) и выводит последовательность клавиш.

Поскольку мы не знаем, правильный ключевой последовательности (Кз), я вижу 2 варианта,

1) Я считаю, что с использованием генетического алгоритма и использовать backprop или аналогичные алгоритмы, чтобы связать уровни с ключевыми последовательностями и предсказать KS для нового уровня

2-) Я строю огромный NN и использую генетический алгоритм для решения всей его внутренней структуры.

Каковы плюсы и минусы каждого подхода? Почему я должен использовать один вместо другого? Пожалуйста, помните, что я довольно новичок в этой теме и хочу решить эту проблему с тем, что я узнал до сих пор, основы действительно.

+0

Не очень хороший вопрос для SO. почему бы вам не попробовать обоих и рассказать нам, что вы узнали? Я не вижу, что генетический алгоритм будет делать для вас здесь. Пройдите через NN и посмотрите, что он вам дает. – duffymo

+0

@duffymo Я попробую оба, но в настоящее время я реализую часть обработки изображений. Я надеялся, что кто-то может раскрыть случаи, в которых тот или другой был бы выгоден. Случаи, которые не ограничиваются этим вопросом. –

ответ

0

Что вы предлагаете, это, по сути, обучение усилению, например. пробуя «полу-случайные» комбинации, а затем используя вознаграждения, чтобы узнать сеть. Первый подход - это классическое обучение подкреплению, а другое - обучение усилению с использованием нейронной сети.

Если вы хотите решить эту тему, есть много учебных пособий и репозиторий github, которые помогут вам решить эту проблему, с помощью простого поиска в Google.