尤其值得一提的是,WeKick足球队的战斗表现和战斗精神都可圈可点,最后一场比赛中,在落后两球的不利情况下,他们连进三球,最终实现了大逆转。
接下来,就让我们看看这场比赛,以及AI足球队是如何踢球的。
连进三球,成功逆转
这场「AI操控足球的对抗」,是借助Google Research Football的平台进行的。这个平台,其实就是足球控制类游戏,长这样:
比赛中,我国的WeKick是红色一方,对手SaltyFish是蓝色一方,他们背后的数字,代表的是控制球员的球衣号码,而足球,则是那个白色字母B。
好的,比赛开始,让我们回到比赛现场。
对阵的双方,分别是WeKick和SaltyFish 。在派出的队员上,对阵的双方数值一样,是无差别的。此外,双方也都没有替补队员。
开场第一次进攻,SaltyFish通过三脚「传球」,便攻破了WeKick的球门。这进球,来得也太快了。
那么,问题来了,这个如此强大的WeKick,又是何方神圣?这个WeKick,究竟是个啥?
实不相瞒,这个WeKick的真面目,其实就是:「绝悟」。是的,不用怀疑,就是王者荣耀里面的那个AI绝悟。
简单理解的话,「绝悟」,是AI的一种底层架构与方法。在王者荣耀的数据去训练的话,就是王者荣耀里的那个全英雄池的「绝悟完全体」,而如果用足球的数据去训练,就是这次比赛的「WeKick」。
(图源:腾讯AI Lab微信)
在赛后总结中,「绝悟」的研究团队向大家揭秘了这个AI背后的秘密。它的出现,一共可以分为三步:
首先,是通过强化学习和自博弈(Self-Play),从零开始训练模型。
利用这个方法进行模型训练,是很常见的操作,本届比赛中的多数参赛球队,都采取了这个方法。
不过,对于足球运动,如果只由进球与否来决定成败的话,其实并不利于模型的训练。于是,「绝悟」的研究团队在价值估计(奖励模式)上,进一步进行细化。
比如:将拦截、出界、越位、过人、控球、传球等各方面都纳入考量,当然,进球这个最重要的评价标准也在其中。
研究者认为:基于 League 的多风格强化学习和基于 GAIL 的风格学习方法,是保证 WeKick 最终获胜的两大关键秘籍。总而言之,这个来自中国的AI足球队,夺得了世界挑战赛的冠军,这一消息让关注中国足球的各路网友沸腾了。真人不行AI来凑,对此,国足表示,已退出直播间。
共有 条评论