Для обучения нейросети игре в понг можно использовать следующий подход: stackoverflow.com
- Отслеживать все значения, передаваемые сети во время воспроизведения игры. stackoverflow.com Позже можно обучить сеть, используя исходные состояния игры и фактическое местоположение, в котором оказался мяч. stackoverflow.com Так сеть получит данные со всех точек игры и сможет тренироваться, даже когда успешно блокирует мяч. stackoverflow.com
- Использовать базовый алгоритм, который мгновенно определяет точку попадания шарика и начинает движение к этой точке. yandex.ru Сначала нужно использовать «тупой» алгоритм, а когда человек начинает выигрывать, переключаться на «умный» вариант. yandex.ru При этом в зависимости от счёта можно варьировать точность «умного» алгоритма, вводя случайные погрешности в решение: чем больше проигрывает компьютер, тем меньше погрешность. yandex.ru
Также существует пример, как нейросеть для игры в понг может работать на базе живых нейронов. engineer.yadro.com dzen.ru В исследовании системы DishBrain клетки мозга мыши и человека, взятые из стволовых клеток, вырастили поверх матрицы электродов с высокой плотностью. engineer.yadro.com Электроды сообщали нейронам, с какой стороны находится мяч, и клетки учились отбивать его так, как если бы сами были ракеткой. engineer.yadro.com