Роботы лучше обучаются за вознаграждение
В дрессировке собак и других животных используют методику подкрепления, суть которой заключается в выдаче награды за успешное выполнение тех или иных действий. Как оказалось, этот способ эффективен и для роботов, позволяя ускорить обучение в несколько раз по сравнению с обычными алгоритмами. Исследователи предположили, что если предложить роботу поощрение за выполнение удачных...
подробнее ›