英伟达最近摊上事了,而且是大事。
一是“外患”,由于“小动作”不断,公司正面临美国司法部的反垄断调查。
二是“内忧”,由于产品设计失误,新款Blackwell芯片出货时间将推迟三个月。
上周,英伟达股价上演过山车——周二,重挫7%;周三,飙升近13%;周四,收跌近7%;周五,盘中跌幅达7%。甚至看波动性,英伟达已经超过了比特币。其30天期权隐含波动率最近从48%飙升至71%,而比特币DVOL指数则从68%下降至49%。
知名对冲基金Elliott告诉投资者:英伟达正处于“泡沫”之中,AI技术也被过度炒作了。该机构称,英伟达*的客户们在开发自己的芯片,并怀疑巨头们是否会继续大量购买英伟达的GPU。泡沫何时破裂?Elliott认为,如果英伟达财报数字不佳,破裂可能就会发生。
不可否认,英伟达正在进入“多事之秋”,但距离“四面楚歌”,尚且为时过早。
1
监管专打英伟达“七寸”,稳准但不狠
7月初,法国打响英伟达反垄断*枪。随后几周,英伟达也被美国司法部盯上了。
The Information报道,美国司法部调查员到英伟达的“对手们”、“客户们”家里跑了个遍,收集大家的指控。
指控一:英伟达威胁客户。当你买了AMD芯片,英伟达可能会对你加价,甚至还会减少原本承诺的GPU出货量。
指控二:英伟达强行配货网线、机架。大苦主有:微软、谷歌、亚马逊........
曾经,为拿到优先出货权,微软咬牙买了英伟达的网线,到2023年初算账时发现,给英伟达交的钱,有1/3都花给了这些“边缘”产品。据悉,英伟达网线销售额增长了三倍以上,达到32亿美元,占其数据中心总收入的14%。
如今,英伟达副总裁Andrew Bell还放话:“谁买架子,谁能优先获得GB200。”
微软在“扯皮”数周后躲过一劫;而亚马逊和Google都迫于淫威,已经答应了。
指控三:英伟达收购 Run:ai。交易于今年4月底官宣,收购价为7亿美元。
Run:ai是一家以色列初创公司,专注于简化GPU上的AI应用程序和工作负载,从而提高AI芯片的效率,反过来有助于减少完成任务所需的英伟达GPU数量。
英伟达将Run:ai的功能整合到现有产品中,不仅“扼杀”其被对手所用的可能性,还增加了其DGX和DGX Cloud的影响力。
老黄造云是“英伟达避免成为思科的一条‘好退路’”。一是云和软件业务每年能够产生数十亿美元。二是英伟达拥有“所有的杠杆”来发展与其芯片互补的服务。
无论是上述“严格分配GPU”、“搞配货强买强卖”、“造云建生态”,均是黄仁勋为长期巩固英伟达帝国做出的“狠招”。毕竟他的目标是,世界上所有的公司……都会在英伟达AI Enterprise上运行。
因此,本次美国司法部的调查可谓“稳准”,打到了英伟达的“七寸”。
但至于“狠不狠”,却要另当别论。毕竟反垄断调查往往会持续多年,政府最终可能不会对目标公司提起诉讼。即使诉讼已发起,案件也可能扯皮多年才能结束。
比如,2020年Google搜索反垄断案,在今年才开庭审理,而负责此案的法官尚未作出裁决。
综上,这次反垄断调查虽然来得又猛又快,但似乎不能伤及GPU帝国的根基。
预计对英伟达产生两处直接影响。
一是,影响未来收购。比如,2021年,FTC以反垄断为由提起诉讼,阻止英伟达斥资400亿美元从软银手中收购Arm。现在看,孙正义能起死回生,应该感谢FTC。
二是,打击“霸王协议”。毕竟已经被盯上,英伟达的“小动作”或许会收敛一点。
2
英伟达一哆嗦,全球AI开发跟着减速
再说回英伟达的产品“内忧”。
据报道,由于设计缺陷,英伟达B100、B200型号取消,之前订货的按照20%的订货量交付,之后升级为B200A,预计明年年中开始交付。
但GB200的进度目前没有推迟。“最强*”GB200不仅是芯片,而是结合了两个B200芯片的强大平台。(1个GB200有1个Grace CPU+2个B200)。
据悉,B100的市场需求本身不大,客户已从B100转向B200(超过45万颗需求)。
从一些机构反馈的情况来看,目前的解决方案是用H200先补位。英伟达三季度将主推出货H200,10-11月再追加部分H200给客户应急,最迟12月全部正常。
此次延期将打乱meta、谷歌和微软等主要客户的部署计划,可能影响依赖英伟达AI芯片产品和服务的开发进度,包括生成式AI、视频处理和其他AI应用。
也就是说,即便分析师高喊“英伟达泡沫”,但英伟达一出事,全球AI开发进程都要跟着减速。
即,如果你想要证明英伟达泡沫即将破裂,或要证明AI泡沫即将破裂;或要证明市场对GPU需求放缓;或要证明英伟达的竞品开始出彩。
但目前,你无法给出一击即中的证据。
3
为何看好英伟达
首先,AI泡沫是否即将破裂?不。
作为最“悲观”的大佬,国际顶刊之神“大龙教授”Daron Acemoglu认为:未来10年内,AI对生产力的提升约为0.53%到0.66%,对GDP的增长约为0.9%。
高盛全球股票研究主管Jim Covello也相当悲观:AI必须能够解决复杂问题,才能收入大于支出,约1万亿美元。而至于AI泡沫,Covello的观点是,可能需要很长时间才能破裂。
同时,摩根士丹利和华尔街“TMT*”Coatue非常看好AI的前景。
大摩认为,当前AI基础设施投资热潮处于初期阶段,尚未达到互联网1999年的泡沫水平。尤其是GPU投资,才刚刚起步。
Coatue认为,AI不是炒作,黄金时代还没有到来;AI不是估值泡沫,但主要是巨头的游戏。
其次,GPU已经管饱了吗?不。
这里便是红杉和a16z的战斗。
红杉“唱衰”GPU,认为供应短缺高峰已过,并算出AI行业因为购买GPU制造的收入缺口达5000亿美元。
a16z则截然相反,不仅斥资数亿美元,囤了数千块GPU;还高调开启“氧计划”,最终计划将GPU集群规模扩大至超过2万块。
实际如何?不如我们转换思路。
常规思路——模型强悍、杀手级应用出现——对算力需求越大——对GPU的需求越高。
但反过来,如果我们将AI时代和互联网时代做类比。可得出:互联网是计算机构成的网络,AI模型是连接网络的计算机。和每个人都有PC、智能手机一样,AI时代会出现五花八门的AI模型,所有的总体将构成一个完整的生态。
因此,AI时代需要更多的算力。但现在算力成本过高,而且稀缺,进一步影响了AI发展的进程。这点从英伟达一哆嗦,全球AI开发减速便可看出。
此外,即便我们不看长期,仅看短期。从训练到推理,均有巨大的、未被满足的算力需求。
引用新皮层x*财经的测算。Omdia统计数据,截至2023年年底,英伟达H100的总出货量达到了120万枚。在截至2024年4月底的4个季度里,英伟达通过AI芯片销售获得658亿美元。按照每一枚H100售价4万美元计算,英伟达过去4个季度销售的H100数量约为164.5万枚。大约相当于整体模型训练市场(即假设全球训练出了100个GPT-3.5级别、50个GPT-4级别、10个GPT-5级别的大语言模型,和10个Midjourney级别的图像生成模型,以及20个Sora级别的视频生成模型)的1/4。
这仅仅只是模型训练的市场需求,推理是更大数量级、且尚未真正开启的市场。如果我们保守地按照每人每月仅生成一条视频来算的话,全球在大模型推理方面的算力需求相当于1040万枚H100芯片,是模型训练的两倍。而如果视频生成技术和市场更成熟,推理需求的算力消耗会飙升到训练需求的数十倍甚至百倍。
谷歌CEO皮查伊表示:“投资不足的风险,远远大于投资过度的风险。”
正如meta CEO扎克伯格表示:“我宁愿过度投资,也不愿通过放慢开发速度来节省资金。”
而微软则称目前AI算力的容量,限制了自己的财务收入,这种状况至少要持续到2025财年的*季度。马斯克更是自研超算挑战英伟达。
最后,英伟达的护城河坚固吗?是。
对于英伟达的未来,Coatue直接亮出观点:如果有泡沫,那也不是估值泡沫,而是利润被拉向前方的泡沫。
那么,谁能挑战英伟达?
一方面,比起前文的三大指控,英伟达有个更大的罪名——软硬件捆绑。
如今,数据中心超95%的处理器要用英伟达GPU,整个云上AI需求仍要依赖CUDA生态,而CUDA只能配合英伟达芯片使用。程序员不想再学习另一门语言,CUDA甚至被认为是英伟达的护城河。
为掀翻英伟达“暴政”,目前谷歌、meta、微软想联手参与OpenAI发起的开源语言项目Triton;英特尔、AMD和高通也想利用Triton挖角英伟达的客户。
尽管Triton可能削弱英伟达的市场份额,但花旗分析师估计,到2030年,英伟达在生成式AI芯片市场的份额仍将高达63%左右,这意味着它在未来多年会依然保持霸主地位。
另一方面,巨头们纷纷下战书,英伟达也在不断奔跑。毕竟前任思科“傲慢惹的祸”,黄仁勋*是铭记于心。
根据半导体“牧本周期”——芯片类型有规律地在通用和定制之间不断交替——在某个特定时期内,通用结构*,但到达一定阶段后,满足特定需求的专用结构会奋起直追。
而目前,英伟达所代表的通用结构时代正处于颠覆。
更何况,今年年初,英伟达建立了一个新的业务部门,专为云计算、5G电信、游戏、汽车等领域客户构建定制芯片。有消息称今年新推出的任天堂Switch,很可能会搭载英伟达的定制芯片。
但英伟达*稳如泰山吗?我想到了一句话:“过程都对,但结果错了。”打个不恰当的比方,如果英伟达的强势议价权推动AI算力成本长期居高不下,从而抑制大范围创新,或许也会出现反噬。
适道交流群已开通,我们会定期分享行业资讯、干货报告,欢迎备注“姓名+职位”添加微信畅所欲言:AIGC114。