约翰·霍普金斯大学研究团队最近发表的一篇论文探讨了通过积极强化来学习的可能性,题为“好机器人”。关键是要奖励机器人做得正确的事情。如果做错了,您将不会受到惩罚,使用评分方法的机器人将获得奖励。如果您以工作游戏化的形式正确地进行工作,那么它会为您提供积分。
论文说这种方法可以减少训练时间。机器人希望获得高分并快速学习正确的动作,因为它们可以获得最佳的回报。到目前为止,如果机器人花了一个月的时间才能完成100%的准确工作,则可以减少到两天。
机器人学习领域对该行业具有巨大的潜力。这就是为什么机器人采取许多不同的方法来发现秘密,以便他们可以从头开始学习的原因之一。当然,它仍然只是诸如积累红眼或玩视频游戏之类的基本任务,但是预计在将来,将有可能执行更复杂的,实用的任务。相关信息可以在这里找到。