“就目前的一级市场情况而言,做大模型‘融不到钱’,早就不是新闻了。”
对雷峰网说出这句话的,是一个曾经的“明星创业者”——拥有多家大厂经历、在顶会顶刊发表数十篇论文,且拥有七十余项专利。去年年初大模型正火的时候,他甚至也一度成为资本市场的“宠儿”,被看作是最有前途的科学家创业者之一。
一年多过去,市场终究捧起了一群明星,但在明星的光芒背后,却是深不见底的黑暗——“我们的项目,投资人看了都说好,言之凿凿,但最终term都签不成。”说起这事,这位曾经的“明星创业者”甚至有些神伤。
“实在不行,就去做AI游戏吧。”他向雷峰网坦言,“如今的科技行业,能挣大钱、快钱的行业,也就是游戏了。”
01
游戏和AI,资本市场上的“难兄难弟”
一个被称为“互联网下个世代的钥匙”,另一个被称为“第九艺术”——生成式AI与游戏,两个看似没有交集的赛道,却在资本市场遭遇了相似的命运。
另一位游戏行业投资人向雷峰网透露,自去年Q3的大模型应用层热潮结束之后,整个投资环境迅速变冷,用“急转直下”形容也并不过分。
可以作为论据的是,在新近爆出的智谱获投沙特的4亿美金中,据坊间传闻,实际投资规模可能在几千万美金左右,主打一个“重在参与”。而智谱AI一个千亿模型的价格,大约在400万人民币左右,相较其研发成本,“基本骨折价”。
如果说将目前KIMI、文心一言的“会员订阅”“Token计费”也算作一个商业模型,那么类比互联网产品,大模型产品的边际成本其实一直居高不下——“如果大模型公司将自己定义成应用型公司,可能根本上不了市。”某基金的投资经理如是分析道。
而当一群尚存热血的制作人们走出大厂,想要独立制作一款原生AI游戏时,他们将遇到的融资难度,将会是两个赛道“1+1>2”的级别。
谈到 AI 游戏,大多数玩家心中的总能想起《逆水寒》的 AI NPC,玩家可以和生成式 AI 驱动的游戏人物谈天说地、自由交流。
这种,本质上是“游戏+AI”——厂商在传统游戏架构的基础上,添加AI玩法。目前不少一线游戏大厂们都在探索,但 AI 对游戏的加成并不明显。
但在目前为止,无论是腾讯、网易等传统游戏大厂,抑或是以上海四小龙为代表的“内容向”新生代厂商,对于游戏的AI化探索,到目前为止仍然有限。一位在国内大厂多年的游戏制作人告诉雷峰网,对于这些拥有相当体量的大厂而言,AI部门由于目前来说仍然是成本中心,因而不具备独立开展业务的可能性。所有的AI相关探索,必然会被带上“产生价值”的紧箍咒。(关于国内大厂的AI相关探索,欢迎添加作者微信FernandeZ-D交流)
以网易AI部门[伏羲]为例 ,自2017年至今,伏羲在网易游戏中落地的AI玩法并不算少。譬如《逆水寒》 中的 AI 照片捏脸、智能养育、大宋头条、UGC剧组模式;《永劫无间》端游中基于强化学习技术的噩梦人机玩法等等。
如果放到腾讯,其AI Lab团队在《*荣耀国际服》上发布了GiiNEX,这是全球*个在手机端侧落地的AI私人游戏教练,旨在用生成式AI的能力,让新人玩家更快熟悉和上手游戏。
但上述玩法能够实现的一个重要前提,上面谈到的几个项目,已经是头部大厂的头部产品,但游戏 + AI并未颠覆游戏的架构,创造新的商业模式;谨慎地进行 AI 创新,也无法增加用户的“付费深度”,这给开发商的动力也略显不足。
伏羲在《逆水寒》等项目中的地位,更像一个技术中台,其目的是将AI技术尽可能产生商业回报,对其更有开创性的技术探索,实际上有诸多限制。这也是游戏+AI商业上被低估的重要原因。
如果用过去十年和近两年的AI项目实际情况,不少人得出了这样的结论:以目前的技术水平,AI项目的落地范围有限,在大多数时间里,它被市场高估了——哪怕与游戏结合,以目前大厂和独立团队的探索深度,仍然难以做出革命性的产品。
如果“游戏+AI”的天花板就是如此,似乎游戏和 AI 的结合之路前景相当暗淡。
然而,要是决心用 AI“掀”了游戏的“桌子”,把游戏的常识全部颠覆呢?
02
“游戏+AI”≠“AI+游戏”
如果说,现在用 AI 给游戏锦上添花,在游戏上面做更多的新功能,是“游戏+AI”;而 AI +游戏则是完全不同的路子:从游戏的底层架构开始,用生成式AI的能力加以构建。
一位AI游戏创业者这样向雷峰网描述了二者的区别:“你把AI生成的功能拿掉,看看这个项目还能不能独立运行,或者还能不能叫‘游戏’,如果能,那就是AI+游戏,如果不能,那就是原生AI游戏。”而后者随着AI模型能力的增加,在单个游戏项目中的比重,是在逐年增加的。
早在去年,类似的AI游戏,其实已经有了雏形。从技术路径来看,最早一批的AI游戏,工程水平可以称得上“原始”——它们通常基于通用语言大模型的通用数据库, 根据玩家输入的具体指令生成对应的反馈内容。
以雷峰网在去年某场开发者大会见到的“文字拳皇”游戏为例,该项目的主要玩法是,玩家在对话框中输入对应的招式,文心一言将作为裁判来判断该招式对对手产生的伤害,进而给出结果。
就游戏类型而言,它的形态停留在文字对话阶段,更接近类似galgame、MUD等文字网游。根据雷峰网的现场实测结果,在没有限制模型参数和预训练的情况下,文心一言对招式威力的判断,只能根据现有文字描述的“华丽”程度来进行。
甚至当雷峰网输入拳皇经典角色——七枷社的“暗黑地狱极乐落”的时候,由于不在文心一言的数据库里,作为一款“拳皇AI游戏”居然无法判定其威力水平。
这已经是2023年末的事情了——彼时不管是小参数模型,还是多模态的模型生成,均处于尚未明朗的阶段,换言之,开发者即便有很多想法,在*技术的限制下,也难以有发挥的空间。
即便如此,这款尚处原始阶段的“文字拳皇”,已经完全具备了AI原生游戏的构成要件——基于文字、图片、音频、视频等多模态生成的AI大模型,开始成为玩家与游戏交互的核心。以往通过预设参数、预设剧本进行游玩的游戏体验,或许可以被完全颠覆。(关于国内AI游戏发展的相关情况,欢迎添加作者微信FernandeZ-D交流)
而在7个月之后,AI行业的进化,以及新的多模态生成技术,已经让部分开发者拥有了足够用来“烹调”的食材——换句话说,不到一年的时间里,AI游戏玩家所能获得的反馈,已经从单一的文字形态,进入到了文字、图像、音频兼具的视频时代。
而在互联网时代,同样程度的模态进化,耗费的时间是接近三十年。
需要注意的是,在互联网时代,不管什么模态,其内容的生产,几乎都是靠纯人力来进行。数字资产的累积效率,通常也呈线性的增长态势。而在AI大模型的助力之下,只要拥有足够多的玩家和想象力,其游戏内容的提供,已经几乎从开发者一方,转移到玩家一方,内容增长速度,和体验的迭代速度也将是指数级的。
纵观过去几十年的科技发展史,每一次产品交互的变革,都带来了万亿美元规模的行业革新。无论是可视化操作系统的微软、个人电脑和智能手机的苹果,抑或是去中心化社交媒体的脸书,他们在每一次技术浪潮中,都抓住了改变人机交互的契机。
03
从“小众”到不再小众
即便AI原生游戏,在不到两年内取得了突破性的进展,但对于掌握大部分行业资源的游戏大厂而言,仍然是一个试错成本高但回报未知的“鸡肋”。这反过来,给了诸多独立开发团队新的机会。
在此之前,他们仍然需要解决一个极为实际的问题——基于生成式AI大模型游戏的玩法同质化。
一个很简单的例子是,在前述雷峰网参与的开发者大会上,无论是“文字拳皇”,还是号称“开放世界”的孤岛探险预习项目,按传统游戏类别划分,均未能走出文字游戏的窠臼,大厂AI团队开发的“AI伴侣”类型的应用,同样如此。后来的AI游戏,大多没有偏离这条路线太远。
大多数玩家在游玩这些游戏时,除了开头半小时或许能有一些“尝鲜感”,后续如果接触了其他厂商的同类型项目,也很难有更新奇的体验。
在拥有卡普空、EA、科乐美、2K等多家主机游戏公司从业经历、[Mindcraft]项目制作人常楠看来,目前AI游戏最热门的领域,大多数会在游戏NPC上做文章,并与现行的MMORPG游戏做深度结合,《逆水寒》即是如此。
另一种方向,则是类似《动物之森》的AI智能体。但核心问题在于,在这些探索中,AI在交互中的比重有多大?AI比重的大小,能否与用户体验的增加形成正相关?
常楠团队的解法是, 先避开卷成红海的热门赛道,从一些看似冷门,但玩家群体稳定、付费能力在线的题材入手。譬如基于龙与地下城规则(下称 DND)的桌面角色扮演游戏——这是世界上第1个商业化的桌上角色扮演游戏。玩家扮演不同种族、不同阵营的角色,在奇幻的世界中进行冒险。严格意义上说,这是目前市面上所有角色游戏的鼻祖。目前最接近 DND 的 3A 类型游戏,是《博德之门》系列。
在一场线下或者线上连麦 DND 中,玩家手中没有可视化的画面,只有一个背景设定和人物属性,剩下的游戏体验,几乎通过自己想象中的未知开放世界,和游戏 GM(主持人、裁判)来提供。很显然,基于生成式大模型的 AI,天然能提供这样的体验。
以往的线上和线下 DND,即便有 GM 的存在,玩家仍然要花费时间去熟悉规则书和背景设定,即便相对目前较重度的游戏而言,这也是极其不低的学习门槛,更重要的是,以目前主流的碎片化游玩方式,即便是线上 DND,也需要花费大块时间,这对于有付费能力的中产及以上群体而言,是较为奢侈的。
有基于此,常楠的思考则是,通过AI大模型机器学习的形式,把学习成本降下来,降下来之后,用户规模也能随之扩大。具体操作方法是,把 DND 的规则书输入大模型,让大模型做 DND 游戏的主持人。
在此之后,玩家只需要做的,则是提供一个想要的游戏背景,AI驱动的DM为你生成更精细的世界观、地图和随机事件。在此之后,曾经需要近10人、固定场地、大块时间的DND游戏,或许一个人、一部手机就能随时启动,随时游玩。
或许对于国内的游戏投资人而言,DND 赛道是一个过于生僻和冷门的赛道。但需要指出的是,通常这些冷门赛道的玩家,“游戏婆罗门”含量极高,对应的付费能力和创作能力也极为丰富。
这里以另一个冷门游戏类型——4X历史模拟游戏为例,《欧陆风云》、《十字军*》的玩家群体相对整体玩家大盘,占比极少,但其用户粘性和创作者生态极为丰富。
譬如《欧陆风云4》的上市时间是2011年,但至今仍然在更新 DLC,付费玩家和第三方 MOD 创作者仍然在贡献扩展内容。《十字军*》、《钢铁雄心》的生态也同样如此。而这样一群死忠玩家的存在,也让母公司 Paradox Interactive 得以在纳斯达克成功上市。
欧陆风云4在发售的14年间,发布DLC30多个,一个老玩家如果要完整体验游戏内容,总花费大致在2200元以上
与之相对,DND 游戏,在海外同样拥有这样一批充满热情的“婆罗门”,一旦通过AI去降低“入坑”门槛,就有机会让更多拥有丰富想象力的轻度玩家,能够享受到这个游戏类型的乐趣。在常楠看来,如果是非常大众的赛道,那么必然挤满了高技术力和大资本的大厂,创业机会不大。
但押注类似 DND 或者 SCP 这类的小众亚文化,反而有潜在扩圈的可能性——在海外论坛,譬如 reddit和 discord,对此的讨论已经很多,但没有很好的产品,因而在商业上或许很有机会。
[Mindcraft]的技术路径,也沿袭了一般AI游戏的演化路线,在最开始的时候,其体验与一般 MUD 游戏无异,都是纯文字生成体验,但在文生图技术成熟之后,常楠团队测试发现,其体验相比纯文字,上升了数倍;再加入实时动画生成的体验之后,体验在此基础上,又上升了数倍。不过,这只是对开发者而言,用户实际体验如何,还需到端测之后才能知晓。
而通过AI生成开放世界之后,常楠会把自己的硬件资产(算力,研发等等),全数投入 story telling和 DM 的智能体层面。在一般NPC的投入可能就要少一些。核心是在一个完全自由的世界(类比GTA5)和一个完全不自由的世界(类比纯线性关卡)之间寻找一个平衡。至于如何考量,其一是成本,其二是体验,目标是比现在所有图形化的游戏开放一个数量级,体验比现有游戏好一个数量级,就足够了。而在基于AI无限生成的能力,这是完全可以做到的。
一个更性感的想法是,在 AI 生成 DND 开放世界渐趋成熟之后,这完全可以成为一个模板,套用于泛二次元这类同人玩家聚集的赛道。
玩家可以根据自己的想象力,为自己热爱的二次元角色构建一个未知的异想世界,并吸引足够多的同好进行游玩。作为开发者,只需提供足够好用的开发套件和底层技术力即可。并借此完成从PGC(机构创造内容)到 PUGC(专业用户创造内容)乃至UGC(用户创造内容)的转型。
在二次元领域,从一个恋爱文字冒险游戏衍生成动画、音乐等二创内容,并形成稳定亚文化受众群体的案例,同样存在,如《东方project》。
由此也能发现,AI时代的游戏开发者,完全有可能将一个原本是产品的生意,做成一个平台生意——两者在商业上的天花板差距,移动互联网时代已经无数次地向市场完成了证明。
而基于大模型在底层交互的革新,曾经苦于商业化的生成式AI,完全可以通过游戏,这一受众面*的互联网产品,*程度地发挥其技术价值和商业价值。以常楠为代表的大厂出身独立AI游戏制作人,正在身体力行地证明这一点。