忽然发现,打游戏是人工智能发展的重要推动力
2017/11/9 15:02:41 浅黑科技
上篇我们说到,“吃鸡”游戏其实是邪恶的美帝主义的间谍工具,用来收集各国人民作战方式和习惯。今天再带给大家一个新认知:游戏将成为AI时代的重要生产力……
不过,这回不是开脑洞,因为该观点并非出自我,而是一位 AI 技术大牛……
游戏是人工智能发展的重要推动力;
事实上,以往人工智能发展的关键节点都和游戏有关;
让AI去打王者荣耀排位赛,不仅能训练出一个游戏机器人,对物理世界也有重要意义,甚至可能改变世界。
腾讯全球合作伙伴大会上,一位演讲嘉宾的观点更让听众大跌眼镜:
讲真,一开始我觉得这是一本正经地胡说八道,打个游戏还能改变世界?倔强青铜还真的倔强了?
不过,毕竟这是个5万人规模的科技大会,台下坐着几千听众,演讲嘉宾:刘晗,腾讯 AI Lab 机器学习中心负责人。
得知他的 title,我决定重新审视一下演讲标题,并开始认真思考:游戏AI真的能改变世界吗?
各位读者还请看完后自行分辨。
“我们最想强调的,是游戏AI研究的奥义——远不止于游戏本身。这是一个富有挑战而令人振奋的研究课题,研究当中累积的经验、方法与结论,能在更广大深远的范围被利用。首先是打通虚拟与现实世界的藩篱,从而赋能物理世界,比如无人车和机器人的发展;其次,游戏中对话智能的研究,或能成为通向强人工智能的重要路径;第三,研究游戏中人、智能体和环境的交互,能让智慧城市这样复杂而意义深远的项目受益。”
打游戏才是 AI 时代第一生产力
文|谢幺
1
“以往的重要AI技术发展都和游戏有关”
先安利一条游戏知识,游戏可大致分为这两类:
PVP(Player VS Player 人对抗人)
PVE(Player VS Environment 人对抗环境)
篮球、足球、象棋、围棋都是典型的 PVP 游戏,王者农药、DOTA、撸啊撸同样。玩家对战。
打怪升级、闯关类游戏大多都是 PVE,比如魂斗罗、马里奥系列、赛车、打飞机、植物大战僵尸等。人对抗变化的环境。
现在把时间拉回到 1950年,人工智能的重要概念“图灵测试”首次出现。
稍稍一想,你会发现其实图灵测试本身就是个模仿对抗游戏,AI 模仿人说句话,人类分辨来自 AI 还是人类,两者相互对抗。
图灵测试示意图 ↑
再把时间拉到 1997 年,当时象棋AI“深蓝”战胜国际象棋大师卡斯特罗,震惊全球。
象棋也是个 PVP 游戏,深蓝 AI 运行在一个名叫“象棋”的模拟游戏环境里。
深蓝战胜象棋大师 ↑
再到 2013年,谷歌公司宣布利用 Deepmind 深度学习技术攻破了 Atari 游戏,人们开始广泛关注深度学习技术。
Atari 是什么?名字听着陌生,样子你一定熟悉:
如果这类游戏你没玩过,打砖块总见过吧?
没错,谷歌在研究深度学习的早期就用游戏来训练AI了。
据浅黑科技谢幺了解,在阿法狗出现之前,谷歌公司也一直都是用 Atari 游戏训练 AI 。
而后 2016 年阿法狗横扫全球棋手,其实它也是运行在一个游戏里,这个游戏叫围棋,地图是19x19的格子。
至此,你会发现,整个 AI 技术发展史本就嵌套于游戏发展史之中。
既然围棋象棋的游戏能帮助研究 AI 技术,按照这个逻辑,同为游戏的王者荣耀、“吃鸡” 甚至斗地主又有何不可?
2
所以打游戏到底怎么提升AI技术的呢?
AI 有三项能力很重要:感知、判断、对话。
阿法狗看起来很聪明,但其实在它的世界,围棋棋盘就是个 2D 图像数据,它把每一个落子折射在棋局胜率中,从而“感知”每个落子的含义。棋盘上的棋子越来越多,感知环境越复杂。
刘晗在现场用游戏《毁灭战士》(一款FPS枪战)举了个例子。
让 AI 来玩这个游戏,它感知到的就是一个 2D 游戏画面,面对画面,它需要感知环境里的每个要素对提高胜率的意义。
只不过这个游戏环境,比阿法狗面对的 19X19 棋盘复杂得多得多。
《毁灭战士》游戏截图 ↑
这也更接近物理世界。
现实生活当中,无人车的物体识别,摄像头感知到的其实无非也就是一张二维图片。因此,游戏场景里的物体如果和现实非常相似,就能通用。
找个《侠盗猎车手》这类的模拟生活游戏,让 AI 控制男主角,便能训练它的认知能力,为 AI 创造一个世界观。
听起来是不是有点扯,像一本正经的胡说八道?
不好意思,无人车的先驱特斯拉,真的用专门设计的虚拟训练场来不断练习AI,让它在短时间内获得准确识别各种物体和突发情况的能力。
巴塞罗那电脑视觉中心专门设计的自动驾驶练车场 ↑
甚至,马斯克创立的人工智慧实验室 OpenAI 去年真的开源了一套通过《侠盗猎车手》学习的自动驾驶系统。
据称,只需要一部电脑、购买一套正版游戏,人人都可以开发出自动驾驶系统!
没错,真的就是那个我们曾玩过的那个侠盗飞车,没想到吧。
AI 通过游戏能学会感知,AI 决策也是同样道理。
在真实世界里,无人车需要即时依照感知来做出决策,左转还是右转,加速或刹车。这种逻辑放在游戏里同样成立,面对复杂的游戏环境,AI 需要时时刻刻做出决策,以确保游戏胜利。
假如把 AI 放进王者荣耀里,它时刻都需要感知将当前游戏状况,对下一步进行决策,走还是停,进攻或撤退,放哪个技能,往哪放。
除了感知和决策,对话也是 AI 技术应用的重要能力,而这些同样能通过游戏来提升。
比如在著名的电影《Her》里,和男主角相爱的人工智能,其实本身就是个对话类游戏。
电影《Her》片段 ↑
刘晗告诉浅黑科技,利用游戏 AI 内的人机对话,甚至直接将 AI 放入模拟人生、虚拟女友这类对话型游戏里。可以帮助研究和理解人类自然语言的产生原理。
虚拟女友游戏 ↑
3
然而,游戏AI也面临一些挑战
刘晗说,目前通过游戏研究 AI 技术,主要存在三个难点:
一是状态空间过大。这不难理解,围棋游戏的状态空间是19 x 19 的方格子,把王者荣耀地图看做棋盘,状态空间的复杂程度远远超过围棋。其他任何一款稍复杂的游戏也基本如此。
王者荣耀地图全局俯瞰图像个复杂型象棋盘↑
二是多智能体协调问题。在一局 5V5 的王者荣耀里,控制一个 AI 不算太难,但如果是 5 个 AI 协作比较困难。
打过星际争霸、DOTA、魔兽等游戏的人多半知道,游戏操作分为微操和宏观操作,微操就是在极短的时间里进行细腻的指令操作,两个角色的技能配合其实并不容易,但这个对 AI 来说并不难,因为它们本身没有思考反应延迟。(和人类相比)
但宏观操作,也就是通俗来说的“大局观”,多个 AI 就很难协同,什么时候抱团推进?什么时候集合打龙?AI 之间也可能争执,如果AI之间能对话,说不定也骂猪队友。
三是虚拟世界和现实世界的差异。赛车游戏确实能训练无人车 AI,虚拟女友游戏确实能用来研究人类自然语言的产生。然而,游戏和现实终究还是有差别。
且不说 3D 模拟环境和真实世界在视觉上的诸多差别。一个只在游戏环境里训练的自动驾驶系统,你敢用吗?恐怕还是心虚。
在虚拟环境里试错成本极低,翻车、开到沟里并没什么影响,现实世界试错成本极高,虚拟女友里你可以随意调戏,现实世界试试?虚拟世界随意翻车,现实世界翻车一次或许就送命。
不过在刘晗看来,这些问题并非无法解决。
比如将模仿学习(模拟人类游戏行为)和强化学习(机器自我博弈,最新的阿法元就主要用这个方法训练),用某种算法整合到一起,能解决状态空间过大和多个 AI 协作问题。
利用贝叶斯升级算法、反向强化学习方法,结合一些动态的探索机制,也有办法让游戏 AI 应用于物理世界时的花费降到最低……
总之无论如何,研究游戏 AI 存在难度,但并非不可能。研究游戏 AI 也不是为了制作更厉害的游戏外挂,而是利用游戏环境来研究任何环境体的复杂交互关系,未来这些研究成果可能用于物理世界的方方面面,将是基础,也是长远的。
谢幺后记
其实仔细想想,对于 AI 来说,我们的物理世界对它来说又不是一个游戏呢?
“自动驾驶游戏”的胜利条件是到达目的地且不出事故;
“围棋游戏”里胜利条件是确保胜率超过对手;
“人机对话游戏”的胜利条件是让人类分不出人和AI……
诶?对人类来说,“世界”不也是我们人脑正在玩的复杂游戏吗?菩提本无树,明镜亦非台,本来无一物,何处惹尘埃……阿弥陀佛,给施主讲完游戏AI ,我该去打把王者荣耀改变世界了。?
-完-
本文作者谢幺,试图让科技更易被读懂。个人微信号:dexter0,欢迎各类勾搭。
http://weixin.100md.com
返回 浅黑科技 返回首页 返回百拇医药