特稿 >

行业洞察 >

OpenAI 开源集成自驾开发环境 Universe+GTA V

OpenAI 开源集成自驾开发环境 Universe+GTA V

Xtecher原创 丨 行业洞察

12764
903

2017-01-12

飞哥独霸天下

Xtecher特稿作者

关注

由 Craig Quite 的 DeepDrive 项目搭建和维护的、加入了 Grand Theft Auto V 的 Universe(OpenAI 的人工智能训练平台)现在开源了。


要使用这一平台,你将只需要购买一个复制版的 GTA V,然后你的 Universe 代理将能够在一个高保真度的虚拟环境中开始加速汽车上路。


在 Universe 中,GTA V 能让AI 代理进入一个丰富的 3D 世界。下面这段视频展示了,喂给代理的帧(人工减速到8FP,左上),对代理的诊断以及环境(左下),以及人性化的自由摄像头视角(右)。在 GTA V 中,用于纠偏的人类行为都是非暴力(non-violent)的。


本次开源发布的内容包括:


GTA V环境的源代码和AMI;


一个预训练的驱动代理,具有Caffe和TensorFlow实现。


集成以上两者能够支持选择摄像机和视场偏移,还包括通过强化学习训练实现奖赏功能,能够让代理学会避免碰撞,计算目的地距离和停留在路上。


现在,游戏能够在云中的Windows虚拟机上运行,并通过 websockets 和 VNC 与 Universe 通信。因此,Universe 代理可以在 Linux 或 Mac 上运行,并且可以在任何 ML 框架中编写。


GTA V 给研究人员提供了一个用于测试和开发 AI丰 富多样的世界。GTA V 的岛屿设置几乎相当于五分之一个洛杉矶,还可以访问各种场景来测试系统。除此之外,系统提供 257 种不同的汽车、7 种类型的自行车和 14 种天气,在单个模拟器里使用这些数据进行排列组合,可以实现大量不同的虚拟场景。


至于这次发布版本中包括的基础代理,是通过模仿学习 21 小时(约 60 万图像)游戏画面进行驾驶训练的 AI (内置的游戏 AI 是很好的初始目标:它的性能优于一个典型的人,因为它可以访问内部游戏状态,虽然 AI 仍然会犯错误,如在高速公路上进行U转弯)。基准代理可以驱动各种不同的天气条件,对交通作出反应并保持其车道。


OpenAI 研究员表示,这个预训练代理只是一个开始,他们邀请全球开发人员一起改进这个代理。


GTA V 与 Universe的集成自动继承了 Universe 为了可比性和共享性而提供的所有工具和语义,能够很简单地对 GTA V 上的代理进行性能基准测试。


Universe+GAT V 可以单独使用,也可以作为使用 Universe 代理访问的一个环境。




文章来源:新智元。



打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机