相对于AlphaGo战胜李世石的新闻,可能很多人都不知道,腾讯AILab研发的围棋人工智能“绝艺(FineArt)”,自年4月入驻中国国家围棋队后,帮助中国国家围棋队6次斩获世界冠*。
腾讯AILab一直是智能体研究的先行者。自年起,腾讯研发的围棋AI“绝艺”,担任中国国家围棋队训练专用AI,并在年成功续约。年,王者荣耀与腾讯AILab共同研发了基于游戏测试环境的MOBA策略协作型AI“绝悟”,年达到职业电竞水平。腾讯还在射击类顶级AI竞赛VizDoom夺冠。
国内市值第一的腾讯,尽管业务多元,但游戏盈利占比巨大,加之腾讯不但注重基础技术研究而且一直在积极持续地布局生态,以及腾讯对技术的进步较为低调,所以一些人就说腾讯“只知道赚钱”、“腾讯没有梦想”,虽然不够客观,但也并非事出无因。
可话说回来,能赚钱,无论是过去、现在还是将来,不都是一件很好的事吗?更何况,在以“绝悟”为代表的腾讯游戏里,一样能够看到腾讯人的星辰大海、诗和远方。
算力:从未止步、迭代更新
为腾讯AI游戏加持算力的腾讯云,其实起源于农场偷菜游戏,成名于服务斗鱼游戏直播。
年夏,上海一家小公司的农场偷菜游戏,因负担不了海量数据的压力,经腾讯添置台服务器补台,游戏才得以正常运行,这让腾讯发现商机,开始发力腾讯云。年,面对已使用别人云服务的头部平台斗鱼,腾讯靠算力和更优惠的措施,拿下斗鱼这个服务大单,之后,虎牙、快手等陆续接入腾讯云,腾讯云开始向直播行业提供可服务数十个T超高宽带的CDN服务,腾讯云CDN业务有了第一波客户。
据新华网、观察者网介绍,在腾讯全球数字生态大会上,腾讯云总裁邱跃鹏表示,腾讯目前已经迈入“双百时代”,腾讯全网服务器总数量突破万台,带宽峰值突破T。
年,腾讯算力弹性资源池达万核,每日分析任务数达1万,每日实时计算次数超过40万亿,能支持超过一万亿维度的数据训练。同时,腾讯云宣布推出全新升级的第五代算力产品,产品涵盖弹性云主机、基于智能网卡的裸金属黑石服务器。
强大的算力,推动腾讯游戏向云端转进,打造START云游戏。这是腾讯面向未来的跨终端游戏平台,在腾讯算力支撑下,通过云游戏技术,让玩家在电视、手机、电脑等任何设备随时随地畅玩大型游戏,为玩家提供与本地游戏设备一致的游戏体验,感受AAA游戏(Anytime、Anywhere、Anydevice)的魅力。
除了发挥自身作用,腾讯还注重与其他公司合作。年12月腾讯游戏和NVIDIA宣布一项将电脑游戏带入云端的合作,NVIDIA的GPU技术为腾讯游戏的START云游戏服务赋力。NVIDIA和腾讯游戏还宣布成立游戏联合创新实验室,共同探索AI在游戏、游戏引擎优化和新光照技术中的应用。
为了开辟新的游戏端口,腾讯借助云端算力,打造TV版云游戏。年12月12日,腾讯START云游戏携手TCL、海信、长虹、康佳、苏宁等几大电视厂商、销售平台,正式上线TV版云游戏。腾讯《NBA2KONLINE2》作为受众最广的国内篮球竞技类网络游戏,成为TV版云游戏的首发游戏。继移动端之后,NBA2KOL2在拓宽游戏端口上再立新功。腾讯先游云游戏运营总监操伟指出,腾讯已经在做原生云游戏的一些研究了,目前正在引入体感外设,将体感游戏云化,同时引入社交玩法,共同打造客厅社交新娱乐。
在基础建设方面,腾讯云与AMD、英特尔等厂商都有多年的合作关系,并持续构建自研技术体系,为游戏等内容提供越来越高的应用负载和算力保障。
在游戏领域,腾讯云的市场覆盖率全球第一,这是腾讯深耕游戏行业多年的结果。
算法:钻之弥深、愈算愈奇
年11月28日,腾讯宣布:由腾讯AILab与王者荣耀联合研发的策略协作型AI“绝悟”推出升级版本,掌握的英雄数从1个增加到+个,实现了王者荣耀英雄池的完全解禁,此版本因此得名“绝悟完全体”。升级后的“绝悟”AI不但掌握王者荣耀所有英雄的全部技能,能应对高达10的15次方的英雄组合数变化,还“自带*师”,能够做出最佳的英雄博弈策略选择,并综合自身技能与对手情况等多重因素,派出最优英雄组合。这标志着腾讯策略协作型AI的算法达到国际领先水平。
为了追求更为高级的算法效果,腾讯提出了一套整合了模型、算法、计算体系结构的解决方案,叫做腾讯机器大脑,核心是使用深度神经网络来建模超大规模的状态空间。针对“绝悟完全体”的主要做法有三个:一是打造一个最佳AI模型。综合利用大量机器学习基本组件的优势,让模型适配MOBA类任务,表达能力强,还能对英雄操作精细建模。二是推行CSPL的渐进学习方法(CurriculumSelf-PlayLearning,课程自对弈学习),让AI能从易到难、一步一步掌握所有英雄能力。三是依托腾讯开悟强化AI训练。腾讯开悟是腾讯训练AI游戏的大规模训练平台,具有丰富的算法经验,能够为AI训练所需的大规模运算保驾护航。“绝悟”自年12月面世以来,依托“观察-行动-奖励”的深度强化学习模型,从白板学习(TabulaRasa)开始,让AI自己与自己对战,一天的训练强度相对于人类年。
为提高训练效果,腾讯还设计了一种全新的跨智能体沟通机制,用队友的注意力标签来训练AI,让它学会预测队友要往哪走,并据此做出决策。这也是一种算法上的“沟通”机制,腾讯称之为模仿跨智能体沟通(ImitatedCrossagentsCommunication)。
在提高计算效率上,腾讯也有创新。腾讯AILab科学家刘霁及团队打破传统桎梏,提出了一系列异步并行算法,解决了“快机等慢机”这一传统同步并行算法的瓶颈问题,大幅提升计算并行效率。同时,他们还解决了异步并行的深度学习算法的开放性问题——关于异步SGD算法正确性和效率保证,该异步SGD并行算法已经广泛运用于各种主流的机器学习平台,例如Google的Tensorflow、微软的CNTK。
刘霁
此外,腾讯也注重在合作中强化算法实现。当前,游戏语音面临着来自外界噪音、游戏内背景音的干扰,语音与游戏声音之间不够平衡,对此,vivo、腾讯游戏、高通展开了深层次技术合作,高通从芯片底层进行技术优化,腾讯游戏将深入软件算法优化,而链路末端的vivo将在终端设备算法上深度优化,合力让算法改善游戏语音。
数据:海纳百川、有容乃大
腾讯的AI技术,并不局限于服务腾讯,而是开源分享,与各行各业实体应用相结合,一方面让腾讯AI技术价值得到发挥,另一方面,腾讯也能获得海量数据。这种开放格局,不仅让腾讯“科技向善”理念落到实处,也是腾讯注重创新、并非到处复制的最好证明。
腾讯互娱(IEG)就曾开源了一款名为GAMEAISDK的自动化测试平台,该平台主要包括AISDK、AIClient、SDKTool等工具,供开发者使用,目前支持的游戏类型有跑酷类、吃鸡类、射击类、MOBA类等。实际上,年,腾讯就尝试发布了第一个开源项目:构建系统BLADE。
腾讯还把平台面向高校开放,依托腾讯AILab和王者荣耀在算法、数据(脱敏)、算力方面的核心优势,为学术研究人员和算法开发者开放国内领先、国际一流的研究与应用探索平台,并提供评估工具、计算平台以及其他研究支持服务,以测试并提升AI在复杂对战游戏场景下的多维度决策水平。
据不完全统计,截止到年,腾讯已经在GitHub上放出百余个项目,覆盖腾讯游戏、腾讯AI等相关领域。
近年来,腾讯比较注重在实战对抗中收集和检验数据。从早期的斗地主,到现在很流行的王者荣耀,都是如此。比如斗地主运营的时间比较长,腾讯获得海量用户数据,不仅能够利用模仿学习的方法,解决牌类游戏问题,也可以为改进其他游戏打下基础。
年4月28日至4月30日,腾讯王者荣耀AI“绝悟”对主播等部分人员开放“绝悟”挑战,就是国内玩家组队,与“绝悟”进行游戏对战。在随后的5月1日至5月4日,腾讯王者荣耀对全体玩家开放“绝悟”挑战。
从年11月28日至30日,腾讯“绝悟”升级版——“绝悟完全体”,限时三天对公众开放体验,只要是荣耀*金I及以上段位,都能跟AI正面PK。
这些对抗,从顶级玩家到各路高手,纷纷上场组团对战,但在“绝悟”及其升级版面前,基本都是铩羽而归。腾讯游戏在夺得荣誉彩头的同时,其天然就具备的用户信息收集能力,将各类参赛数据统统收入麾下,以便更好使用。格局决定成败,腾讯深信不疑。
服务:注重体验、玩家至上
腾讯游戏官方网站成立于年,是中国最大的网络游戏社区,也是全球用户最多的数字娱乐平台,每天有数亿人次的用户在畅享腾讯游戏产品。
腾讯游戏之所以能够受到如此广泛的人群喜爱,不光是其趣味性、娱乐性、竞技性特点突出,更主要的是腾讯游戏注重玩家体验,能够根据玩家需求不断改进游戏。在腾讯AI的加持下,这种注重玩家体验的色彩就更浓厚了。
腾讯游戏“知几”就是在这样的背景下产生的。“知几”基于腾讯AI的语音识别、自然语言处理和大数据推荐能力,以玩家伴侣身份,在游戏各个阶段向玩家提供拟人化的游戏陪伴服务。玩家有任何关于游戏的问题,都可以及时向“知几”反馈,“知几”则能迅速有效进行解答。
此外,腾讯AI有时也扮演玩家角色,替代临时掉线的玩家参与到游戏中。一些王者荣耀的玩家就能体验到,如果有人在对战中掉线,腾讯AI就会及时补位,让AI替玩家去打。岂曰无衣,与子同袍。腾讯为玩家想的很周到。
由于“知几”能够及时解决玩家与设计者之间的互动,不仅节省玩家的时间成本,更能大大提高玩家的舒适度,甚至还能结合玩家游戏实际,帮助玩家策划设计一系列更有趣的玩法,进一步增大玩家的游戏获得感。综合来看,“知几”就是腾讯为每个玩家提供的免费“网管”和游戏辅导员,现已服务于腾讯几十款游戏,玩家满意度接近90%。
为使“知几”更好地服务玩家,腾讯内部配备了专业的AI机器人训练师,能够依托几十款游戏带来的数据积累,通过深度学习等技术措施,对“知几”进行深度打磨,使“知几”与玩家的服务匹配度联系紧密,玩家舒适度与日俱增,自然给腾讯带来高额利润回报。
追求:星辰大海、诗和远方
当前,腾讯游戏已拥有休闲游戏、大型网游、中型休闲游戏、桌面游戏、对战平台五大类逾六十款游戏(数据来源:搜狐网、搜狗百科)。在MOBA类、MMO类、棋牌类、益智休闲类、格斗类、射击类等领域都有自己的王牌大作,而在SLG、休闲竞技等领域也开始更大的布局和投入,腾讯游戏还向独立游戏、电竞等市场迈进,国内游戏“一哥”地位日益巩固。
仓廪实而知礼节。当腾讯不再为生存而徘徊时,在游戏里探索AI的潜力边界,拓宽用户对AI的认知使用,就成为腾讯发展游戏的重要因素。而这也必将使腾讯由一个普通的互联网科技公司向一个伟大公司迈进。
决定一个公司是否伟大,绝不是其体量、盈利或排名,而是其追求。这里为腾讯插播一条广告:其实腾讯多次荣登慈善排行榜第一,公益善款一点都不比其他同行少,甚至有过之而无不及,但腾讯比较低调,并不热衷将此用于公关宣传。孔子说,巧言令色,鲜矣仁。内敛仁怀的腾讯对AI游戏的探索,并非如外人看到的那样“只知道赚钱”,腾讯AI游戏其实也有三重境界:
当前阶段,可以给游戏行业、电竞行业带来直接的推动和帮助,直接体现就是玩家的广泛性和盈利的巨大化。游戏AI是腾讯AI应用层的第一板块,主要包括制造流程、玩家体验以及电竞等,致力于让游戏世界每个角色都可以自己思考、自我发展,给予玩家更好的游戏体验。为了让更多受众感受腾讯游戏,年11月,腾讯在海南组织“TGC腾讯数字文创节”,其中游戏是主角,有“电竞潮流场”、“明日博物馆游戏Spark馆”等主题参与,这是在腾讯“新文创”战略指导下,集结腾讯游戏、腾讯电竞等多领域旗舰IP和优质数字文创内容,让大众感受以数字化科技化互动为核心的大型数字文创体验盛宴。
中长时期,腾讯AI游戏的研究成果将会应用到教育、医疗、农业、制造业等更多行业。腾讯试图探索设计一个完善的多智能体AI,把强化学习的价值网络与描述宏观战略的行为树进行互操作,并使其融合,寻求突破,谋求AI代替人类去赋能物理世界。比如在围棋游戏场景,通过感知棋盘全局表达状态决定在哪落子,而现实中的机器人、无人驾驶车辆,同样可以通过视觉、激光雷达的感知,对方向盘、刹车等动作做出决策。此外,每当AI游戏取得重大技术进步时,腾讯还会发表相关科研论文、申请相关专利。腾讯探索AI游戏其实是在下很大一盘棋,虽然缓慢且低调,但每一步都很有价值。
长远来看,腾讯AI在朝着通用人工智能(AGI)进行探索突破,意图打破“数字鸿沟”,让AI造福人类社会。腾讯针对游戏AI的三个核心能力,即感知、决策、对话,集中发力,试图通过PvP(人类对人类)、PvE(人类对环境),探索在虚拟世界模仿人类大脑(左脑、右脑、后脑)解决人、智能体、环境三者之间的复杂交互关系。如果腾讯AI能在如此复杂的虚拟环境中,学会像人一样实时感知、分析、理解、推理、决策和行动,就能够在现实世界更多变、更复杂的真实环境中发挥更大作用,让诸如智慧城市这样复杂而意义深远的项目更多更好地出现并服务人类。
当然,也有人指责腾讯靠代理国外游戏赚钱、靠投资爆款或潜爆款游戏公司获利,并不是完全彻底的独立自主研发创新游戏。对于这种道学先生的迂言大论,似乎也不必过于纠结,他们不明白“以战养战”的道理。即便强大如腾讯,也需要持续盈利,以实现梦想。而腾讯与其他公司的主要区别就是:腾讯拥有面包之后,会继续朝着星辰大海、诗和远方前进。
文:赵长春/数据猿