特稿 >

科技快讯 >

增强学习丰富运动行为 DeepMind教AI学习跑酷

增强学习丰富运动行为 DeepMind教AI学习跑酷

Xtecher编译 丨 科技快讯

13992
2022

2017-07-11

  大琴

Xtecher特稿作者

关注

科技圈从来就是处于一个不断更新迭代的过程当中,不断跟上最新的AI研究可能是一个“很奇怪”的经历。一方面,随着科技前沿论文的发布,科学研究方法最终应用到科技革命当中去,您会意识到您正在进行前沿的试验。另一方面,在不断跟进最新AI研究成果当中,您会发现一些很多很有意思的事情。

 

Google的AI子公司DeepMind最近发表了一篇新论文,论文的题——《Emergence of locomotionbehaviours in rich environments》(在丰富的环境中产生运动行为)。该研究探索了如何使用增强学习或RL来教计算机在不熟悉的、复杂的环境中进行导航。这是我们现在在虚拟世界中进行测试的一种最基本的人工智能研究,未来的某一天,该技术能够帮助特定的机器人导航到您家门口,如果您不相信的话,我们来看下下面这个视频:


 

视频里面的各种动作都是机器人通过增强学习来进行自我学习的。所有的这些动作都是计算机将自己设计为从A到B的最佳行为方式。所有DeepMind的程序员已经完成了给代理的一组虚拟的传感器,在AI传感器的帮助下,该模拟人体的智能体可以知道自己是否走得笔直,然后继续向前前进。该计算机还会让自己不断工作学习,尝试和吸取之前的错误经验来作出不同的移动方式。

 

该研究的新奇之处在于,研究人员正在探索如何让人工智能机器人在复杂的环境下进行复杂且稳健的动作。强化学习产生的行为很脆弱,从一个熟悉的环境到一个不熟悉的环境中,往往很难适应。比如一个会在家里爬楼梯的婴儿,却无法自己学会乘坐电梯。这项研究表明,增强学习产生的运动行为不总是脆弱的,还可以用RL来教复杂的运动。

 

以下是DeepMind官网的一些动作展示:


333.gif

模拟的步行者反复尝试爬过墙

 

444.gif

模拟蚂蚁在木板之间精确跳跃、移动


原文链接:https://www.theverge.com/tldr/2017/7/10/15946542/deepmind-parkour-agent-reinforcement-learning

所有版权属于原作者,本文仅出于传播资讯目的翻译转载。

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机