“我必须有意去暂时忽略AI带来的潜在威胁,才能睡得好。”
“AI技术的进步速度,比我见过的任何技术都要快得多。”
马斯克最新访谈来了,不仅段子很多,放飞自我飚了粗口,还谈到了不少言论自由以及监管方面的敏感话题。
9月10日,一年一度的All-in峰会如期举行,作为峰会上近几年的常客,马斯克一如既往地成为关注焦点。
特别是谈及了AI之下,类人机器人和自动驾驶未来可能对经济和社会生活带来的深远影响,马斯克认为AI 的美好未来将是一个极度繁荣的时代,物质匮乏将成为历史。
但同时风险也并存,马斯克表示会有20%毁灭的风险,但总得来说是向在场的人们描绘了一幅科技奇迹和*繁荣的未来图景。
以下 enjoy:
01
“天下大同”
“我认为有用的人形机器人,是人类有史以来*的机遇。”
马斯克对于现在难产的Optimus的未来,有着出乎意料的乐观,代替人力来学习各种任务是迟早的事情。
因为在其看来,人类本质上就是“肉体”版的通用机器人,他也在设计Optimus机器人过程中,开始越来越多地了解为什么人类是这种形态的。
比如说:为什么有五根手指,为什么小指比食指短,还发现,手的主要肌肉其实在前臂,手指主要是通过肌腱操作的。
目前的Optimus机器人手只有11个自由度,而人手大约有25个自由度。下一代的Optimus的手已经有了原型,肌肉系统也被移到了前臂,通过像人类手一样的缆线来操作手指,下一代的手有22个自由度。
“我们认为这足以完成几乎所有人类能做的事情。”
另外在成本上,他坚信,任何东西只要量产足够多,其成本就会趋近于其物料成本。也就是说,即便是Optimus这样的类人机器人,其最终规模化的成本会无限逼近其原材料价值,这个时间或许会很久,可能要十年的时间,Optimus的成本将比一辆小型汽车还低。
马斯克还表示,在经过三次重大迭代,达到每年生产百万台的规模后,它的价格可能会在2万美元左右。
如今已经完成了两年的开发周期,后面每个迭代周期会缩短一些,不到两年,也就是说,大概五到六年后,年产量可以达到百万台。
那时候,按照马斯克的说法,地球上的每个人都可以负担得起一个机器人伙伴了。
马斯克还描述了对以后30年的展望,认为未来机器人的数量将远超人类,人形机器人与人的比例或将达到2:1甚至3:1。这样的场景,或许超出了我们这一代人的想象范畴,但对于未来的孩子们而言,这将是他们生活的常态。
想象一下,未来的日子里,可以拥有多个机器人助手,“它可以帮你遛狗、割草、照看孩子,甚至可以教孩子,会有很多你看不见的机器人在生产商品和提供服务。“
还能将机器人运到遥远的火星,开启星际探索与殖民的新篇章,让它们在那里进行殖民所需的工作,在马斯克看来,火星已经是个“机器人星球”了,“那儿有很多机器人,比如探测车和直升机,只有机器人在那里。”
“所以,我认为有用的人形机器人将是地球有史以来*的机遇。”
02
20%毁灭的可能性
谈到AI的发展前景时,马斯克认为AI的发展将会使人类社会进入“黄金时代”。一个物质极大丰富的时代,物资和服务不会再短缺。
每个人都能拥有他们想要的东西,让曾经遥不可及的梦想商品与贴心服务,成为日常生活的寻常之物。
除了那些被人为定义为稀缺的东西,比如某些特殊的艺术品。但是任何制造的商品或提供的服务,在AI加上机器人技术的结合下,成本会无限的趋向于零。
但在目前的阶段,AI仍处于商业化的早期阶段,“AI的投入现在远远超过了收入,但是AI的改进速度是我见过的任何技术中最快的,远远超过以往。”马斯克说道。
就比如,图灵测试曾经是一个AI测试的标准。现在,用一个基础的开源随机大语言模型,然后在一个简单的Raspberry Pi上运行,可能就能通过图灵测试。
不过马斯克也坦言,这样的未来并非完全没有风险,他估计有80%的概率实现极度繁荣,但同时也存在20%的“毁灭”可能性。“我必须有意去暂时忽略AI带来的潜在威胁,才能睡得好。”
值得一提的是,马斯克去年参加All in峰会上也表示过类似的言论:“AI,可能是有史以来人类创造过的最重要的技术,但同时它有可能比核武器更危险。”
即便是有意去暂时忽略AI带来的潜在威胁,有时也难以入眠,在马斯克看来,一个更切实际的问题是“如何在一个AI能够比我们做得更好的世界里找到生活的意义”这才是更大的挑战。
但前提是AI的发展需要突破一些关键性的因素,比如:类人机器人和自动驾驶技术。
“一旦我们拥有这些类人机器人和自动驾驶技术,实际上就能制造任何东西。从理论上讲,经济的规模没有实际的限制。经济本质上是每个人的生产力乘以人口数量。如果人形机器人能够智能地工作,并且数量不受限制,那么经济规模将没有真正的上限。”
也就是说,虽然是有20%毁灭的可能性,但在AI高速发展后所带来的巨大收益相比,不如先去享受它。
03
成为英伟达的对手
刚才也提到,马斯克认为AI的突破离不开两个关键性的技术,类人机器人和自动驾驶技术。
但是这两项技术的核心还是在于芯片以及计算机群的研发上。
在这次All in 峰会上,马斯克就自豪地介绍了旗下xAI打造的 Colossus 计算机集群,将其称之为当今世界上最强大的用于 AI 训练的超级计算机,目前拥有十万张英伟达芯片,而年底即将扩容至二十万张。
正是这样的超级计算机,为自动驾驶系统FSD与类人形机器人提供了坚实的后盾。
有不少人认为,靠卖芯片,AI的经济价值几乎全部流向了英伟达,直到现在特斯拉用的还是英伟达的芯片,不过在不久后,特斯拉就会有替代的方案,那就是特斯拉超级计算机芯片Dojo,主要针对图像和大规模视频处理。
不仅如此,马斯克打算研发出 Dojo 后不仅自己用,还打算出租出去,和英伟达正式打擂台。
“我们在特斯拉有两个项目,一个是Dojo训练计算机,另一个是每辆车里都有的推理计算机。我们目前有Dojo 1,预计明年年底会有Dojo 2投入量产,我们认为Dojo 2可以与现有的一些高端训练系统(如英伟达的B200系统)相媲美。未来有可能把它作为一种服务提供出去。”
不过马斯克认为,任何系统都需要经历过三次重大的技术迭代,才能达到较为理想的效果,今年是*代,明年将迎来第二代(Dojo 2),第三代(Dojo 3)可能会在2026年左右推出,也就是说,Dojo 3 才能知道 Dojo 系列芯片到底有多么优秀。
自信如马斯克,当时也没有十足的把握这事能做成。但无疑,Colossus超级计算机的打造极大提升了Dojo成功的概率。
但放在自动驾驶场景上,特斯拉 Dojo 面临的问题与大语言模型不同,特斯拉的情况是,场景的上下文非常长,有数十亿字节的上下文数据。
比如特斯拉全车有7个摄像头,1个摄像头1分钟的高清视频就有好几GB的数据量,如何压缩这些巨大的上下文数据成为实际重要的像素成了马斯克头疼的问题。
但特斯拉对于FSD的要求是,不仅需要连续收集和处理视觉数据,识别分类车辆周围的物体,还需要有与人类相当的决策速度,这几个步骤是需要像人类一样一气呵成。
FSD的难点在于把车身上装载的多个摄像头采集到的庞大的视频数据,选取其中的关键帧,压缩到几百瓦的车载推理芯片能够处理的范围
“你必须在时间维度和空间维度上都压缩像素,在空间中压缩像素,在时间中压缩像素,然后在一个小型的只需要几百瓦的计算机上完成推断。”
能做到这样,马斯克还小小的骄傲了一下,他认为特斯拉的芯片设计团队非常优秀,特斯拉的推理计算机比从任何供应商那里买到的产品都要好。