Я хотел бы улучшить свой маленький робот с машинным обучением.Использование машинного обучения для простого управления роботом
До настоящего времени он использует простые, а если тогда решения в его основной функции действуют как робот для газонокосилки.
Моя идея - использовать SKLearn для этой цели.
Пожалуйста, помогите мне найти правильные первые шаги.
у меня есть несколько датчиков, которые говорят о мире otside:
Мир = {рыскания, панорамирование, наклон, distance_to_front_obstacle, ground_color}
У меня есть вектор состояния
State = {left_motor , right_motor, cutter_motor}
, который контролирует 3 действующих лиц робота.
Я хотел бы построить набор данных входных и выходных значений, чтобы научить sklearn желаемому поведению, после чего входные значения должны давать правильные выходные значения для участников.
Один пример: если двигатели включены, и робот должен двигаться вперед, но измеритель расстояния сообщает о постоянных значениях, робот, по-видимому, заблокирован. Теперь он должен решить отступить и повернуться и перейти в другое направление.
Прежде всего, как вы думаете, это возможно с помощью sklearn и второго, как мне начать?
My (простой) управление роботом код здесь: http://github.com/bgewehr/RPiMower
Пожалуйста, помогите мне с первыми шагами!
Спасибо! Задача решения лабиринта - это четкое совпадение с подходом Q-обучения. Но как я научу роботу корреляцию между «моими колесами поворачиваются» и «я не двигаюсь», чтобы понять, что он заблокирован каким-то «невидимым» препятствием? Это не проблема Q-Learning, верно? Вопрос о самосознании, не так ли? –
Вы должны установить все с точки зрения вознаграждения. Если робот пытается идти в сторону препятствия, вы даете плохую награду. Если робот идет туда, где вы хотите, то вы дадите хорошую награду. –
Я попробую попробовать, нужно глубже мыслить! –