在meta、谷歌、亚马逊等科技巨头纷纷官宣自研芯片计划后,行业霸主英伟达有必要感到紧张吗?
风云变幻之间,英伟达仍在低调推进自己的战略布局。从它最新的收购来看,英伟达似乎深谙“居安思危”的哲学。
在传言流出几个月后,英伟达终于在4月底的博客中官宣收购以色列AI初创企业Run:ai。这是一家基于Kubernetes的GPU编排供应商。据媒体报道称,此次收购价格约7亿美元。
同时,英伟达被曝低调买下另一家以色列AI初创企业Deci,但交易金额未知,只有以色列媒体放出消息称价格为3亿美元。
合计10亿美元的收购单,足以确认英伟达在当下最关心的领域:成本优化和效率提升。为了应对日益增长的市场需求和竞争,英伟达正全力打造一个更加高效、可扩展的AI生态系统。
随着AI电耗带来的能源危机日益紧迫,能耗——成为GPU战场毫无争议的核心。那么帮助GPU降本增效,真的能算一门不错的生意吗?
1.GPU生态的不同赛道
上述两家以色列公司都致力于降低人工智能的使用成本,但它们的运作模式有所不同。
据英伟达博客介绍,人工智能部署正变得越来越复杂,客户的工作负载分布在云端、边缘端和本地数据中心基础设施上。管理和编排生成式AI、推荐系统、搜索引擎或者其他工作负载都需要复杂的调度,以便优化系统和底层基础设施的性能。
Run:ai在Kubernetes上构建的开放平台,可以为独立任务汇集GPU或者共享算力——这包括只占用部分GPU,或者运行多个GPU,或行在不同集群上的多个GPU节点的模式。企业客户可以更好地管理数据中心规模的GPU集群,实现更高效的GPU集群资源利用。
这家创业公司成立于2018年。被英伟达收购前,它在2022年3月完成C轮融资,筹集的总资金达到1.18亿美元。
两位创始人欧姆利·盖勒(Omri Geller)和罗宁·达尔(Ronen Dar)在特拉维夫大学电气工程学院学习期间相识。首席执行官盖勒曾在以色列总理办公室技术部门工作,首席技术官达尔曾任职贝尔实验室和苹果公司。
盖勒表示:“自2020年以来,Run:ai一直与英伟达密切合作,我们都热衷于帮助客户充分利用他们的基础设施。”
高性能计算领域专业媒体HPCwire文章指出,英伟达有自己的Kubernetes插件,但Run.ai将为AI容器管理和编排带来更精细的控制。因此,英伟达乐意更多地使用这种工具,而不是完全依赖云供应商的配置。它也可以帮助英伟达提供完整软件堆栈的需求。
今年3月,英伟达还刚刚推出推理微服务(NIM)平台,用于预先配置和优化AI模型的部署。收购Run:ai后,英伟达也可以利用它的Kubernetes编排层管理NIM在其GPU基础设施中的部署。
另一家在报道中被英伟达收入囊中的公司Deci,业务重点是调整AI模型,使其更容易访问和扩展,以便改善构建和部署AI模型的方式。这家成立于四年前的公司迄今为止融资5500万美元。
Deci联合创始人兼首席执行官约纳坦·盖夫曼(Yonatan Geifman)表示:“我们的技术可以自动设计新的神经网络结构,针对我们试图解决的数据和机器学习问题对其进行优化,使其在硬件上运行得更快。”
以色列媒体Globes报道称,微软已将Deci集成到Azure AI Studio中,在那里它不仅要与OpenAI正面对决,还会与meta和法国公司Mistral以及英伟达的模型竞争。
“如今的趋势是软件和硬件的协同集成,”盖夫曼说,“有些公司还希望我们帮助他们设计下一代芯片。他们想了解我们的算法见解将如何改进他们的下一代产品。”
谈到Deci的起源时,盖夫曼回忆起自己学生时代以及在谷歌山景城总部的时光。“在以色列理工学院攻读博士学位期间,我开发了许多深度学习模型。在构建这些模型的过程中,我发现需要进行许多试错迭代,并且每次迭代都需要消耗大量计算资源,才能收敛到一个好的模型解决方案,”他说。后来进入谷歌工作后,他更强烈地感受到考虑模型在生产环境中的可扩展性、运行时间和内存等解决方案的必要性。
类似的公司还有开源人工智能平台Lightning AI。今年3月,它和英伟达合作发布了名为“Thunder”的新一代AI编译器,旨在加速AI模型的训练速度。
“我们发现客户没有充分利用现有的 GPU,而是投入更多 GPU 来解决问题,”Lightning AI 首席技术官卢卡·安蒂加(Luca Antiga)表示。 “Thunder 与Lightning Studios及其他分析工具相结合,使客户在运行更大、更快的模型时有效利用 GPU。随着 AI行业开始训练跨多种模式、能力越来越强的模型,获取*的 GPU 性能变得至关重要。”
芯谋研究的研究总监张彬磊对「甲子光年」总结称,Run:ai实质是跟GPU配合,在GPU里面是做任务分配,协调GPU的资源算力,同时执行多项任务;Deci主要是针对应用端的产品,在索取GPU空间时做衡量与评估。
但这类公司独立的商业化前景不明。张彬磊指出,Run:ai依赖于GPU企业应用,Deci则可能获得更多创业公司的需要。因为未来的软件和目前手机上的小型程序不同,可能都是极为耗电的大型AI模型,对Deci的服务需求更旺盛。
2.英伟达的“购物策略”
可能很多人没有意识到,英伟达可能是当前AI创业领域里最活跃的投资者和卖家,甚至没有之一。风投统计机构Pitchbook数据显示,英伟达在过去一年里投资了30多家初创公司。
另据出席演示会的人士透露,在这两项交易完成之前的几个月,英伟达曾要求至少一家大型风投公司组织12家“有前途的”AI创业企业集中向英伟达高管做演示,CEO黄仁勋也包括在内。
这也不是英伟达*次到以色列“采购”。2019年,英伟达豪掷69亿美元收购以色列芯片制造商Mellanox,成为该公司迄今为止在以色列的*一笔收购。
得益于英特尔1970年代起对以色列的投资,以及当地对工程技术人才的重视,以色列虽然没有广为人知的巨头企业,但在半导体和人工智能领域拥有大量细分赛道的隐形冠军以及良好的人才环境。目前以色列至少拥有超过3000名英伟达员工,约占该公司总人数的10%。Run:ai的员工也会加入英伟达的以色列办公室。
至于对GPU降本增效的追求,或许是英伟达寻找新的收入增长引擎的举措。
此前,英伟达的主要客户是有雄厚财力购买其昂贵GPU的科技巨头。 DA Davidson投资银行分析师吉尔·卢里亚(Gil Luria)表示,2023年下半年,来自微软和meta的订单约占英伟达销售额的四分之一。
但谷歌和meta等大厂已经先后官宣打造自己的AI芯片,希望减少对英伟达的依赖。
New Street Research分析师皮埃尔·费拉古 (Pierre Ferragu) 表示,虽然英伟达去年售出了250万颗芯片,但谷歌花费了20亿至30亿美元打造了大约100万颗自研AI 芯片。亚马逊预计也花费2亿美元生产了10万块芯片。微软也在2023年末表示开始测试其*AI芯片。
研究公司Gartner称,到2027年,人工智能芯片市场预计将增长一倍以上,达到约1400 亿美元。 AMD和英特尔等知名芯片制造商以及Cerebras和SambaNova等初创公司也在制造专门的人工智能芯片。
而收购了上述两家公司后,英伟达便可以更有效地管理计算资源,降低能耗,为客户提供更具性价比的平台,向中小企业市场进发,同时也吸引大客户的驻留。
张彬磊表示:“关键不在于芯片标价有多贵,因为这是一次性的成本。重要的是长期运行的能耗。如果能耗与别人差很多,那么自研对企业来说反而是长期的伤害。在GPU这个赛道里,只有*,没有更好,也就是强者恒强。”
对于其他科技巨头来说,张彬磊表示,做出自己的产品去替代英伟达并不难。但是站在商业成本的角度,采购*的芯片一定是最有性价比的。所以英伟达要做的就是把芯片生态做到*,大大*于其他企业。在能效、生态和应用各个层面为客户提供*的服务,*的成本,*的能耗。其他科技巨头客户就会失去自研GPU的动力。
值得一提的是,4月中旬,英伟达股价曾遭遇明显下挫,引发市场对“AI泡沫破灭”的短暂担忧。
但市场恐慌来得快,去得也快,英伟达股价已从每股750美元快速回升至约900美元。张彬磊指出,在当下的AI浪潮里,英伟达的股市表现与爆款AI产品同频。AI产品发布后,英伟达股价便一路走高。而股票明显下跌,也只是相应的情绪回落。
现阶段英伟达的芯片价格暂时维持在高位,毛利达到70%,净利约50%。张彬磊认为,如果其他科技巨头自研能把性能做上去,自研当然有价值。但话说回来,如果市场上有一些企业的GPU可以达到或者接近英伟达的水平,英伟达还可以打价格战做市场下探,继续保持竞争优势。
4月30日,英伟达的主要对手之一AMD发布了一季度财报,将今年MI300 AI加速器芯片的年销售额预测从年初的35亿美元上调至40亿美元。但投资者仍然对这个数字不满意,因为此前预估达到60-80亿美元。失望情绪导致AMD当日盘后下跌7%。
对此,张彬磊同样认为,能效是非常重要的因素,因为企业考虑长远的支出,如果能耗比别人高,技术水平比别人落后,生态也没有别人完善,销售就很难达到预期。只有芯片价格合适,服务也比竞对完善,才能获得抢占市场的机会。