0

Conveyor layout. A and B entry points and C and D exit points. There is a crossroad at position XКак реализовать обнаружение пути и обнаружение перегрузок с нейронной сетью?

Это конвейерная система. Коробки вводят систему в положение A и перемещаются в направлении C, где они выходят из системы. То же самое касается B-> D.

Коробки на пути A-> C имеют более высокий приоритет, чем коробки B-> D. Коробки могут останавливаться и ждать на каждом квадрате. Если на A2 есть коробка, а также на B2, то из A2 следует сначала пройти через X.

Если есть коробки на C2, C1, A2 и B2, то коробка из B2 должна проходить через X и поле на A2 shuold ждать, пока C1 не будет пустым. В противном случае он блокировал бы путь B-> D.

Как решить эту проблему с помощью нейронных сетей? Итак, для каждого поворота я хотел бы ввести текущее состояние каждого блока, и в результате я хотел бы перейти от того места, где должен двигаться следующий ящик.

Например: состояния системы: BOX присутствует на A1 Результат: A1, A2

Я не знаю, нейронные сети являются хорошим инструментом для решения этой проблемы, но я просто любопытно , Спасибо за ввод :)

ответ

1

Что вы ищете, это политика, которая отображает состояние в действие.

Хотя вы можете использовать нейронную сеть для хранения вашей политики, вам необходимо каким-то образом взаимодействовать с окружающей средой для сбора данных.

То, что вы описываете, является типичной проблемой обучения арфингам. Я бы посоветовал вам взглянуть на Q-обучение. Для размера пространства состояний вы можете легко сохранить свою политику в таблице, но если хотите, нейронную сеть также легко сочетать с Q-обучением (хотя при использовании схем нелинейной аппроксимации конвергенция не обеспечивается).

 Смежные вопросы

  • Нет связанных вопросов^_^