一笔融资留给VC圈深刻印象。
投资界获悉,潞晨科技近日完成数亿元A++轮融资,投资方阵容豪华——北京市人工智能产业投资基金、石溪资本、Capstone Capital、领沨资本参与投资。值得一提的是,这已是潞晨科技成立三年来的第5轮融资。
这匹AI黑马有何来头?背后的掌舵者是一位90后教授——尤洋,他毕业于清华大学,后在UC Berkeley攻读博士,并成为新加坡国立大学计算机系首位获得“校长青年教授”殊荣的华人。2021年,他选择回国创业,进军AI Infra领域,三年时间带领潞晨科技估值增长大约40倍。
这无疑是中国AI时代最生动的一抹写照。
90后,从清华到大学教授
投身AI创业潮
潞晨科技的故事,要从一位超级学霸说起。
潞晨科技创始人兼董事长 尤洋
90后,尤洋就读于清华大学计算机系时,曾斩获该系数额最高的西贝尔奖学金,还获得清华大学优秀毕业生、北京市优秀毕业生等荣誉。2015年,尤洋完成清华大学硕士学位后决定继续出国深造,来到UC Berkeley(加州大学伯克利分校)攻读博士学位,师从该校电子与计算机学院院长James Demmel院士。
期间,尤洋的论文大奖拿到手软。他是世界上唯一一位35岁以下,在4个顶会(AAAI, ACL, IPDPS, ICPP)上以领导者的身份(第一作者或通讯作者)获得最佳论文/杰出论文的人,其中论文《Imagenet training in minutes》所提出的方法刷新了ImageNet训练速度的世界纪录。
同时,他作为2020年全球高性能计算领域在 Google Scholar 上引用次数最高的博士毕业生,曾被 UC Berkeley 提名为 ACM Doctoral Dissertation Award 候选人,后者在81名博士毕业生中仅选取选2人,可见含金量之高。
博士毕业后,尤洋拿到包括常春藤在内的多个美国大学以及新加坡国立大学的校长青年教授教职offer 。经过一番衡量,他决定在2020年5月加入新加坡国立大学。至此,尤洋成为新加坡国立大学计算机系首位获得“校长青年教授”殊荣的华人。
为何选择创业?尤洋坦言,伯克利计算机系的教授追求产研结合,而AI发展浪潮让他看到了其中的创业机遇。“在这个时代,我们科研人提升自己的最好方式之一,就是创业。”
况且,担任教授的经历也为尤洋创业奠定基础。在他看来,教授和普通科学家并不一样,一方面教授需要高强度的沟通和表达;另一方面也需要具备管理团队的能力,一个教授实验室20到40人的团队很常见,无异于是一家中小公司。
于是在2021年7月,尤洋决定回国创业,在北京正式成立潞晨科技,一家AI Infra(人工智能基础设施)企业。什么是AI Infra?业内有一个形象的说法,“如果把开发AI应用看成建房子,那么AI Infra企业就是提供水泥钢筋的施工队”。
对此尤洋也十分认同,他认为建成房子可以用作商场,酒店,写字楼,会议中心,厂房等等,正如AI模型的应用可以是金融,游戏,社交,电商,能源,制药等等。“AI Infra企业的本质价值就是帮助千千万万行业迅速部署大模型,并用于实际业务或应用中。”
在创立初期,潞晨科技主要面向B端企业提供分布式软件系统,以及企业级云计算解决方案等服务。换言之是做一个云上的插件,应用到阿里云、腾讯云、华为云上,用户付费来使用插件。
但尤洋与团队很快意识到,大型的云厂商更强调一体化配套性,且对中小型企业不太重视。于是潞晨科技快速调整产品形态,转为在垂直云上把所有要素都链接好,再匹配潞晨科技的软件优化能力,做成一个端到端的整体,去服务中小型客户。
回顾这三年创业历程,尤洋感触最深的便是市场和技术变化太快,为了适应 AI时代对于基础设施需求的变化,必须与时俱进,快速调整,“我们团队也得以成长速度很快。”
一匹AI黑马何以炼成?
进入到大模型时代,潞晨科技重点推出潞晨云平台,包含大模型训练推理系统Colossal-AI,致力于帮助企业降低大模型的落地成本,提升训练、推理效率。
在尤洋的构想中,潞晨云更像是算力版的“滴滴出行”,即打造一个自动化的平台,同时发挥出潞晨科技的算力优化能力,让用户用同样的价钱训练或部署AI模型快2至5倍,同样的成本做成10倍参数的模型。“我们要构建一个真正的算力生态平台,让需要算力的企业和开发者最快地找到性价比最高的算力。”
如果要从海外寻找对标公司,Together AI、CoreWeave、Lambda Labs或许可以算在其中,但实际上后者的模式可以看做是“算力链家”,更像是一个配备算力销售的中介,不是一个标准化的产品或平台。
而潞晨科技是将中国民间已有的合法高端算力聚集起来,如各地的智算中心本身不具备优化能力,潞晨科技可以低价收购算力,或是直接放在潞晨云平台上,进行优化之后为各类用户提供服务。
在尤洋看来,潞晨科技要成为算力滴滴出行,最关键的一点在于用户生态,是谁能触达最多的终端客户,而不是谁拥有最多的算力,这是下游决定上游的事情。换言之,算力最终会走向冗余,只有建立一个使用算力的用户生态才能产生长期壁垒。
如此一来,潞晨科技的优势凸显——资料显示,潞晨科技Colossal-AI系统的github生态指标MLSys(机器学习与系统)领域世界第一,开源社区大概有4万到10万量级的开发者在深度使用潞晨科技的产品。
同时,潞晨科技的技术能力已获得一众巨头认可。早在2018年,团队就曾帮助Google在世界上第一个千卡 AI专用集群上,把当时世界上最好的大模型从3天加速到76分钟。除此之外,微软、英伟达、字节跳动等都使用了潞晨科技的关键技术。
视频大模型Open-Sora则是潞晨科技的另一个拳头产品。放眼望去,国内同类型AI Infra企业自身打造大模型的鲜少看见,为何潞晨科技要迈出这一步?尤洋表示,首先潞晨科技有很好的视频大模型技术积累,之前获得AAAI和ACL的杰出论文,并发表了50篇CVPR、ICLR、NeurIPS、ICML等顶尖AI视频大模型会议的论文。
他指出,视频大模型刚刚兴起,国内还未出现领跑者,目前一些大厂推出的APP依赖于大量的短视频数据,并不是因为占据技术优势,而视频大模型模型最终要比拼优质数据质量,因此潞晨科技可以快速赶上。
其次,潞晨科技长期看好这一方向,相信视频大模型比LLM(大语言模型)更具备长期的规模定律。因为视频大模型的训练数据是客观世界的真实写照,而数据的最终制造者是造物主,大模型肯定能发现其内在的规律。LLM的训练数据源自互联网和书籍,数据制造者的水平参差不齐,而且有很多歧义和垃圾信息。
“最重要的是,未来对算力优化要求最高的领域很可能是视频大模型。视频大模型的超级APP最终需要比拼算力效率,这是我们的优势所在。”
中国AI融资竞赛背后
比拼商业化了
一路走来,潞晨科技留给投资人深刻印象。
时间回到2021年,彼时尤洋入选福布斯亚洲的一项榜单,创新工场创始人李开复则是评委之一,在看到尤洋的简历后,就推给创新工场投资经理,双方建立了联系。尤洋回忆,后来到创新工场与李开复老师面聊,很快就达成共识,从见面到打款仅花费了一周的时间。与此同时,真格基金也接触到了尤洋,共同领投了种子轮。
“我当时是孤身一人,只有几篇论文和代码。更让我惊讶的是,那时在投资交易文件中没有任何对赌条款,甚至连回购条款都没有,这让我感受到了他们对于创业者的支持和信任。”尤洋至今记忆犹新。
很快,潞晨科技又在2022年9月完成天使轮融资,由蓝驰创投领投。进入2023年,“百模大战”打响,一时间科技大佬们广发英雄帖,一些大模型厂商也对潞晨科技表达出了收购意愿。
毋庸置疑,这对于尤洋和潞晨科技而言是一个关键节点。但经过深思熟虑之后,尤洋认为AI大模型远没有到达终局,这么早被收购是没有前景的,风险会很大。同时,他也相信潞晨科技具备长期价值,可以独立生存并完成上市,能够成为AI时代的新DataBricks。
于是,潞晨科技最终拒绝了收购,并迅速获得两家知名美元VC的数亿元A轮融资。此后,公司又在2023年年末完成了A+轮融资,由某世界500强科技巨头领投,同时大湾区基金和新加坡电信投资公司 (SingTel Innov8)也参与了投资。
期间,估值也是水涨船高,公司较成立之初已增长约40倍。据悉,目前潞晨科技仍然手握几个投资TS,但公司现金流还比较充足,会谨慎考虑接下来的融资节奏。“我认为要先把业务做起来,把公司提到一个新的高度。如果拿了很多钱,把公司估值顶上去了,但又做不出匹配的业务去支撑估值,到那时就很容易从高处坠落。”
眼下,AI江湖热闹。最新一笔震撼融资诞生——OpenAI在官网宣布,在最新一轮融资中筹集了66亿美元(约460亿人民币),融资后估值达到1570亿美元(超11000亿人民币)。
而将目光拉回至国内,大模型融资同样疯狂。7月底,百川智能宣布完成A轮融资,总融资金额高达50亿人民币。此外,“大模型五虎”中的另外4家企业——月之暗面、智谱AI、Minimax、零一万物也在去年到今年间密集宣布融资,纷纷跻身独角兽行列。
但融资热潮之下,争议也如影随形。此前,Sequoia Capital(红杉资本)投资人公开喊话,当前AI赛道的各家公司为购买英伟达GPU就花费了超500亿美元,但同期产生的收入却仅有30亿美元左右。言外之意,泡沫太大。
显而易见,如何实现商业化落地才是AI创业公司的重中之重,仅仅依靠融资烧钱,不能够自身造血,这条路势必走不通。因此对于潞晨科技等AI Infra企业而言,选对行之有效的商业模式至关重要。
放眼望去,大多数AI Infra企业都采用MaaS模式,但并不适合。众所周知,此类AI Infra企业提供的都是各种开源模型API调用服务,在自主研发的尖端模型方面存在短板,实际是在跟ChatGPT、Kimi、智谱等竞争。而在价格战中,API价格甚至低至100万个token/1毛钱,对应AI Infra公司的MaaS每日token调用量在1亿至10亿,换算成每日收入只有几百元。所以,MasS模式在短时间内很难把营收做上去。
而开源模型在被私有数据微调后能发挥更大价值,同时潞晨云提供的高性能GPU和丰富镜像库,让用户能高效地微调模型满足业务需求,从这点来看,潞晨云商业前景似乎更为明朗。
谈及国产芯片异构集群模式,尤洋认为,在模型训练环节,一个集群搞多种不同芯片,是对资源的浪费。“国产AI训练芯片如果最终能发展起来,一定是符合市场化规律的,或许会像美国市场一样,1到2种厂商的芯片占据了95%以上的市场。”
当然,尤洋也认可异构芯片集群对推理是有帮助的,因为服务不同的批量的用户计算完全可以独立,没有技术难度,但恰恰因为技术门槛低,利润也并不会可观。“我发现声称相对TensorRT/vLLM/SGLang推理加速3倍以上的方案,基本都用了量化/剪枝/蒸馏,实质上是把一个大模型做小,没有太多技术深度。”
行至今日,潞晨科技也交出了一份成绩单——纯软件毛利率达到90%左右,包括4个世界500强企业在内的客户已贡献数千万元营收;潞晨云客户数也预计到年底将达到10000。同时预计到2025年,营收(确收款)将达到1.5亿元人民币。
展望未来,他心中早已设定好目标,“我们会达到10亿至30亿元的收入,然后以300亿到600亿的估值上市。”言语间,中国AI创业潮正值风起云涌,群雄并起。
本文来源投资界,作者:刘博,原文:https://news.pedaily.cn/202410/541010.shtml