本篇文章3954字,读完约10分钟


研究表明,许多美国人担心ai会代替他们的工作,包括uber和lyft司机、快递员、接待员和软件工程师。 在今天精彩的表演赛中,另一组也表示应该为自己的“饭碗”担心。 那就是职业电竞选手。

deepmind开发的新ai系统alphastar在《星际争霸2》中与多位玩家对决,令人惊讶的展示了ai的能力发展到了什么程度。 《星际迷航》是一款多而复杂的战术游戏,要求玩家在任意时间内考虑上百种选择,在漫长的征战基础上做出盈利能力最高的战术选择,在新闻不完全的快速变化的环境中操作。 每天有20万次以上的“星际迷航”比赛。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

deepmind的ai比赛通过youtube和twitch进行现场直播,自周二发表视频以来,不仅是游戏玩家,ai爱好者也寄予了很大的期待。 令人惊讶的是,alphastar以10比1的战绩压倒了人类玩家。 alphastar的成功震惊了关注者。 当然,我犯了一点错误。 有些很明显,有些很奇怪,但取得了最后的胜利。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

虽然ai系统有时会利用计算机的天然特征——更快的反应时间和每分钟越来越多的操作,但deepmind团队想要在一定程度上限制ai的能力,alphastar的反应时间实际上比人类慢,每分钟的操作也比专家少。 相反,alphastar通过运用多种战略取胜,展现出对游戏中秘密行动和侦察的理解,有特点时加大攻势,战局不利时立即撤退。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

对于担心失业的电视游戏玩家来说,这不仅仅是大信息。 它还展现了现代机器学习技术的非凡力量,证明了deepmind以惊人的新方法应用这些技术引领着人类。 《星际争霸2》是一个比国际象棋复杂得多的游戏。 虽然alphastar没有和世界上最好的游戏玩家竞争,但是ibm的“深蓝”和加里·卡斯帕罗夫( garry kasparov )之间的国际象棋比赛有很多相似之处,后者改变了我们所知道的计算机的功能。 这再次提醒我们,先进的ai正在到来。 我们有必要考虑如何安排所有的部门。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

那些游戏不受ai的影响吗?

三年前,ai初创公司deepmind凭借神经网络alphago在全世界引起了广泛关注。 后来被谷歌收购,现在是谷歌母公司alphabet的独立子公司。 alphago展现出了超越全人类围棋专家,让职业围棋选手惊叹、喜爱的围棋战略。 一年后,deepmind又推出了alphazero。 这是一个改进的ai系统,可以了解两个个人正在玩的游戏,并通过训练学习具有类似属性的游戏,如围棋和国际象棋。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

国际象棋和围棋都有几个特殊的地方,可以直接采用同样的机器学习技术了。 两个人玩的有完美新闻的游戏。 也就是说,任何玩家都不需要隐藏新闻。 在每场对决中,棋手只需要做出一个决定。 国际象棋中,玩家需要决定移动哪个棋子。 围棋中,在哪里放新棋子?

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

在现代竞争电子游戏,如《星际迷航》中,更是纷繁复杂。 一般来说,要求玩家一次做出很多决策,例如决策将观察力集中在哪里等。 他们一般都含有不完整的消息,不知道对方在做什么,也不知道你接下来会面对什么。

大型ai研究机构openai的ai工程师唐杰(音译)表示:“作为现代ai研究的基准任务,这种实时战术游戏真的很感兴趣。 这有两个原因。 玩家需要管理长期的尺度,也就是从做出决策到看到收益率的长度。 在国际象棋和围棋中,一般在棋局移动后马上判断这种回报,检查棋局是否更容易获胜。 ”。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

唐杰还表示,像《星际迷航》(或他正在玩的《dota》)这样的游戏,需要在一小时内每秒做出10个决定,因此需要考虑千万的动向。 因此,“我为什么能赢得这场比赛? ”考虑的时候。 等待要素的时候,这真是个难题。

这些特点使这些游戏成为非常适合ai的测试平台。 深度学习系统就像deepmind擅长开发一样,为了迅速发展他们的能力需要大量的数据,同时拥有大量关于人们如何玩游戏的数据。 对《星际迷航》和《星际迷航2》来说,人们已经在网上玩了20年了。 对ai来说,它代表着比国际象棋、围棋等游戏更大的挑战,但现有的数据足以克服这一挑战。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

因此,ai研究所对用网络游戏测试他们的创作越来越感兴趣。 唐杰从事的openai是“dota”游戏,始终是利用ai系统与职业玩家对决。 deepmind从去年开始与暴雪娱乐企业( blizzard entertainment )合作,在《星际迷航》等游戏中推出了培训ai系统的工具。 现在,我们看到了这种努力的结果。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

《星际迷航》有不同的游戏模式,但竞技模式是双人游戏。 每个玩家都有基本的资源。 他们建立自己的基地,派出侦察兵,等他们准备好了,就出兵攻击敌人的基地。 谁先摧毁敌人所有的建筑物,谁就是赢家? 有些“星际争霸”游戏迅速结束,所以可以早点组建军队,在对方准备好之前将其派出,在5分钟内摧毁。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

其他游戏模式可能会持续一个多小时。 我们看了阿尔法斯特使用迅速积极的早期战略的比赛,也看了持续时间明显较长的比赛,双方都派出了庞大的军队,制造了先进的武器。 但是,在这些比赛中,没有持续30分钟以上的游戏。 也就是说,我们没有机会看到alphastar如何解决“星际迷航”后期的战斗。 但那是因为没有人能防止alphastar持续足够久。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

今天,deepmind发布了alphastar和玩家在过去几个月秘密进行的10场游戏对决视频,在最新版的alphastar和排名靠前的职业选手之间直播了比赛。 alphastar前五场比赛的人类对手是职业选手tlo。 在这些比赛中,deepmind对一系列的ai进行了一周的实时训练(在这期间,ai相当于获得了《星际迷航》200年的游戏时间)。 每次训练的重点略有不同。 然后,选择最好的ai与人类对战。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

在拥有200年的经验之后,alphastar仍然犯了几个明显的错误。 在难忘的比赛中,alphastar穿梭于“瓶颈”,毫无意义地准备反击。 评论家表示了深深的困惑。 alphastar没有采用所有可以采用的工具。 尽管如此,它依然赢得了所有的比赛。 其战略特点足以弥补弱点。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”


alphastar和下一个高级别的职业玩家格里格·Comins ( Grzegorz )是? komincz,绰号mana )对决,不像tlo,mana那样操纵他最喜欢的人种(星际争霸有三个人种,而且很多职业玩家都专门练习不同人种)。 即使mana没有犯明显的错误,他依然被打败了。 这得益于ai分裂和操作其单位的能力,其协调性与任何人都没有太大差别。 alphastar再次赢得了所有的比赛。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

唐杰说:“这真的很感兴趣,印象深刻。 比我找的更高层次的东西是战术和机制。 也就是说,ai是擅长提出游戏的大方向,还是只需要巧妙地执行不好的战略就能取胜? alphastar在这两个方面都很好。 其高水平的战略与职业玩家水平的人类玩家非常相似,完美的机制可以遵循。 ”。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

之后,deepmind又回到了平板电脑上。 在这10场比赛中,ai拥有个人玩家所没有的一大特点。 可以看到地图上所有可以看到的部分,人类玩家不操作照相机就看不到。 deepmind必须训练新版本的alphastar,自己操作照相机。 然后在200年的训练中,从自我对决中选出了最好的ai特工。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

在之后的现场直播比赛中,这个新的alphastar ai似乎输给了mana,受到了需要操作摄像头的严重阻碍,没有像早期游戏其他版本的alphastar采取的那样多的惊人战略。 对deepmind来说,这次失利可能是失望的结局,但这个ai只训练了7天。 如果有机会接受进一步的训练,似乎有可能重新开始比赛。 deepmind发现,管理摄像头的ai只是稍微弱一点,就在强势追赶。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

现在的alphastar模式当然有弱点。 事实上,早期alphastar ai的许多缺陷让人想起deepmind alphago的早期比赛。 初期发表的alpha go一般获胜,但人类能识别的错误经常发生。 deepmind团队一直在改善,但现在alphazero不会犯人类可能观察到的错误。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

很明显,alphastar在“星际旅行”方面还有待改善空之间。 对人的战术特征在很大程度上来源于作为计算机更擅长微观管理这一事实。 它的军队擅长侧翼包围和智取,部分原因是它能指挥五支军队,这是任何人类都做不到的。

在这些游戏中,广泛应用于职业游戏的策略很少。 ai的成功不是因为首先考虑到人类的极限而打败了人类,而是因为找到了融入自己特征的战略。 从技术上讲,ai的每分钟操作和反应时间都在人类的控制范围内,但由于精度更高,似乎还是有特点的。 更公平的方法可能是进一步限制阿尔法星的能力。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

人类在许多方面仍然具有比最好的ai更大的特征。 例如,mana可能会根据alphastar的前五场比赛调整自己对alphastar的反应,在直播比赛中取得特征。 alphastar不能做这个。 我们不太了解让ai在一个游戏中学到很多东西,在下一个游戏中应用这些经验的训练方法。

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

尽管如此,解说员还是反复强调,alphastar在许多方面与人类惊人地相似。 知道如何假装攻击,如何发动初始攻击,如何应对伏击,如何在地形上导航。 唐杰挣扎着向电脑发出指令的时候,正在为游戏开发ai。 从那以后,我们在现代ai和现代强化学习中能够做出的各种决策方面取得了很大的进步,这一点让人印象深刻。”

“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

在alphastar输掉的比赛中,我有时不知道该怎么办。 那是一场“好比赛”。 如果对比赛绝望,那就像人类玩家一样认输。 下次看到它的时候,它可能会明白这些道理,不再需要这些指导了。

(选择: vox作者: kelsey piper编译:本技术参与:小)

来源:安莎通讯社

标题:“玩转《星际争霸》?谷歌AI碾压人类职业玩家”

地址:http://www.a0bm.com/new/19096.html