因此,如果机器人能够拥有这种能力,它们就能够根据实时获取的数据和案例自动生成新的行为模式。这种能力表现为明显的智力,称为行为智力。
最近,中国科学院沈阳自动化研究所的研究员开发了一种新方法,开发了一种提高机器人行为智能的新方法,相关结果发表在《IEEE认知与发展系统汇刊》上。
提出了一种基于q -学习和自适应核线性(AKL)模型的增量学习方法框架。该框架允许机器人学习新的行为而不忘记以前的行为。该方法通过自主学习和模仿学习的方法对机器人的行为进行评价,并采用一种新的l2 -范数核递归最小二乘(L2-KRLS)算法实时改变模型结构和参数。
此外,他们还进行了两个实验来验证新方法的性能。结果表明,该框架能够在不同的环境中逐步学习行为。基于局部贪婪策略的q -学习比现有的q -学习算法更快。目前,该成果已应用于机器人自主导航领域。
(转载:www.idcew.com)