
王坚最新演讲曝光:开源正在进入资源时代,AI不能缺席太空,曝近期进展:三体计算星座分享太空! 原创
编辑 | 云昭
出品 | 51CTO技术栈(微信号:blog51cto)
“只有把AI和算力送入太空,人类才有可能真正的走出地球!”
“开源已经进入了开放资源时代!”
“OpenAI闭源并不是一个策略性的错误,而是一个历史的选择。”
一年一度的上海外滩大会上,中国云计算开拓者,阿里云创始人之江实验室主任王坚院士发表了最新的一轮的深刻演讲。
演讲中,王坚院士深度分享了人工智能近半个实际的发展历程,重点讨论了两方面内容:开源AI和计算卫星。
开源头方面,王院士指出:开源人工智能是历史趋势,美国今年以来的出口管制政策(王院士同时指出,这个政策也有一个漏洞)是阻挡不了的,同时提出,现在模型的开放权重,本质上就是对数据和计算资源的开源。
(OpenAI闭源路线)它不是一个策略性的错误,这是一个历史的一个选择。
另一个很激动人心、非常炸裂的重点则是,王院士首次披露了之江实验室在太空中部署完整AI模型的尝试:三体计算星座,并由此给外界一个信号:
几年以后,不是十年以后,就在几年以后把卫星送到太阳轨道。
分享全文从美国出口管制政策聊起,中间穿插了人工智能的起始的两条研究学派以及全球开源的那段动人心魄的历史,再到AI发展上的两个重要的里程碑:人脸识别时代和ScalingLaw时代,再到计算资源开源时代的到来,从而引出用计算卫星来分享太空的重大命题。
可谓洋洋洒洒,娓娓道来。
以下是王坚院士的演讲全文的整理,大家可以自行收藏细读,欢迎转发。
1.2025年,开源是一个绕不开的话题,开源的“源”已经进入资源时代
各位朋友,非常高兴有这么一次机会跟大家分享一下。
在今天的人工智能的背景下,有一个绕不开的话题就是开源开放。所以今天我想把几个可能大家熟悉,但是又比较困惑的事情,从我的角度说一下。
我想,开源这个词其实大家有不同的理解。所以其实我们今天正在经历一个从代码的开放开源到资源的开放开源,一个非常不同的一个革命性的变化。其实最近一年发生了很多事情,所以,2025年注定是一个非常不平凡的一年。
2.美国出口管制的“漏洞”
如果从人工智能角度,所以这是今年年初1月13号的时候,美国公布了对人工智能的出口的管制。可能大家比较熟悉的就是关于芯片、集成电路、半导体的出口管制。但事实上在同一个出口管制上,是第一次那么明确的说出来了,就是说美国要对人工智能模型的权重进行管制。但这个管制出口令有一个非常有意思的事情,也可以讲是一个漏洞。它只是明确的提出了对避免权重的出口管制,而专门强调了开源的权重不在管制之列。我想这边后面有一个非常重要的假设。在当时1月13号,其实也就是大半年以前,那就是当时世界上最好的基础模型都是在美国头部的那几个家公司起来。
当然也有一个很有意思的事情,就是就在1月18号,今年的1月18号,大家都熟悉的Hinton,他也在几个星期以前到过上海。大家都知道它是一个极其反对让人工智能模型开源出来的人,当然他有他自己非常重要的理由(人类安全的考虑)。
3.开源不是战略路线的问题,而是历史的选择
可是就是在1月31号(北京时间),随着DeepSeek的开源。
在1月30号(美时间)Sam Altman就说了一句所有人都很震撼的话。他说,在开源这间这个时刻,OpenAI站在了历史的错误的一边。
我想这句话它背后的含义我就不多说了,它不是一个策略性的错误,这是一个历史的一个选择。所以我觉得2025年很神奇的一件事情,就是一个说不清还倒不明的事情。甚至沿用了在软件时代的一个概念,使得而变成了我们今天AI竞争的一个很关键的变量。我想今天没有人可以绕开这个变量来说下面我要怎么做AI这个变量不是新的,对一个产业,对一个技术。
其实在1998年互联网要起来的时候,大家都知道互联网要起来一个最重要的标志就是浏览器。大家都知道这个NetScape是当时最好最开放,也是改变了这个格局的那个浏览器。其实在互联网时代,NetScape的开源是那个时代的一个分水岭。
所以关于“开放”的话题,不是只有在今天,才重要、才关键。其实在互联网时代就是那个关键的变量。
可能很少人知道,其实是在1998年,就有了“open source”这个词。当然大家知道open source,第一时间就想到的是“open source code”,就是开放源代码。
而“open source”这个词在1998年的四月份才被一批极客固化下来。因为当时有很多不同的叫法,什么自由软件、免费软件。但是open source这个词是在1998年,其实离我们没有多远。但是它开创了我们后来互联网的那个时代。
4.现在的人工智能走的是第二条路径
谈到图灵奖,刚才谈到图灵奖其实很有意思的。2019年,Hinton和那几位开创者得了图灵奖的时候,其实很多事情也只是刚刚的开始。
他们在2018年的的图灵图灵奖,后来Hinton是做过一个演讲的。这个演讲上他说了两个很重要的观点,跟我们今天的开源是有关系的。大家记住,这是20 1819年他给的talk,它里面抢到了这个人工智能的两个最重要的approach。它的方法就是所谓的逻辑(logit)驱动的,或者被逻辑这样的方法来启发的,以及因为大脑或者神经元这样生物学特性来启发的这两种不同的逻辑。因为有第二个方法,就是所谓的用神经元或者生物学方法来驱动的。这样的一个方法论的演进,使得我们有了权重这样的概念。
大家都知道,即使8年以后,Hinton在上个月在好的在上海的人工智能大会上,他其实重复了他八年以前讲的这两句话。但它是有原因的。事实上以生物学作为一个思想的驱动,不是从人工智能已经开始了。
今天看到人工智能开始的,图灵在40年代末就就提到了一个最基本的概念,即,今天神经元基础的东西都有一个很好听的名字叫connectivity。大家看到的我画了红线的地方是非常有意思的事情。他就是觉得是受神经元的启发,跟真正的神经元没有任何关系,所以他打的引号,但是它里面一个很重要的事情就是这样的一个生命源的数量要足够多多到一定程度的时候它就会产生我们今天的智能。这是图灵在18年就说掉了。所以平常讲的第二个路径,其实就是这个路径。当然很有意思的一件事情,很长时间有人在探索这件事情。
5.80年代中期的人工智能圈两大派:心理学家和计算科学家
这篇文章是发表在1986年的自然杂志上。大家看到这篇文章你就会发现它是非常的明确的,就是讲到了权重这样的一件事情,在这样一个模型中的重要性。当然大家也可以看到这篇文章的第三作者,就是得了图灵奖、诺贝尔奖的Hinton。但是他的前面两个作者是当时世界上最著名的心理学家。所以事实上跟神经有关系的这个探讨是在那个时代。
80年代中期,是以心理学家为核心的小组在讨论的。那个时候以计算机科学家为核心的讨论了人工智能逻辑。人工智能的这个方向就是以逻辑作为来驱动的这样的一个方法。如果你在那个时候你真的要做这件事情,事实上就有一本教科书。这是86年以后,我自己接触这个领域所有的教科书,到今天大家都应该不太熟悉,叫做parallel distributed processing。所以就是在上海上次碰见jeff,我跟他说起这套书的时候,他还是蛮激动的。他说那个时候设想的东西今天都变成现实了。当然大家可以看到,这篇文章还是hinton作为第三作者跟几位心理学家一起来完成的。
讲到这件事情也要感谢一下互联网。其实这两本书的背后又专门出了一本书,这本书是本实验手册。这是第一次真正的把所有关于这个理论的代码都开放出来。所以到今天为止,你还可以到我这页PPT上那个连接去下载它的代码。尽管这个代码是运行在dos上的,是运行在最原始的操作系统上的。而这个代码开放的时候还没有开源这个概念。这是1986年开源的一个概念,大家看到是98年才被真正的固化下来。
图片
所以我想说,事实上开放资源这个概念不是因为有开源这样一个说法而带来。事实上在任何的过程中,在科学探索的过程中有很多的先驱他已经做了这样事情。但是我自己觉得很高兴的就是因为最早提出那些以生物学神经元为基础的方法论的这些先行者,为我们做了一个非常好的探索。
6.人脸识别时代,对于资源的概念感知不深
因此,这才有了后面2012年第一次Hinton跟他的两位学生,把数据和模型和算力GPU搞在一起。这带来了那是大家都熟悉的人脸识别的那个时代。但在那个时候,资源这个概念还是没有那么的深入人心。因为它的数据的量不足够大,模型不足够复杂,算力也没有想象那么大。这篇文章发表的时候,他们只用了两块GPU卡,而且两块普通的打游戏的GPU卡,所以远不是我们今天想象的规模。
7.2017年,规模定律的到来
但是这一切在2017年发生了很大的变化。大家都知道在那个时候这几位作者提出了transformer,提出了tokenization,就是我们今天讲的token。大家都知道Tokenization是非常关键的技术,让我们的数据真正的资源化的这是一个里程这是一个里程碑的事情。
同样,你就会发现因为有这两个东西的出现,我们传统意义上的,也就是2012年的时候的数据模型和算力乘上了一个更大的变量,叫做规模。也就是说我们所有东西的规模都是被千倍万变的万倍的增加。而使得我们今天看到的人工智能发生了只不只是原理上的进步,但在事实上的方发生了一次天翻地覆的变化。
图片
8.今天权重的开放,本质是数据和计算资源的开放
当规模到了这个程度的时候,资源就变成了一个非常重要的事情。所以大家可以设想一下,今天事实上模型权重的开放,本质上是数据资源和计算资源的开放。有了模型开放以后,你再也不需要你自己花掉那么多的计算资源,你去重新去做有人替你做掉的事情。所以这里我想说一下,开放以后并不是说计算的资源,大规模的计算不重要了。而事实上只是说作为你个体,你是不需要再重新发挥这么多的资源。因为有人帮你付掉了这笔钱。但是倒过来讲,要做一个更好的模型,它可能需要有有其他人以更多的资源的投入来完成这件事情。
所以我想到了今天这件事,到了今天这个时候,只是开放源代码其实不解决我们过去在软件时代解决的问题。而开放资源,特别是数据和计算资源,事实上是让我们推动这个行业往前走的不能缺失的一个环境。我认为这就是今天人工智能时代说开源的一个非常重要的特点。我更愿意把它叫做这个开源叫做open resource。但是open source和open resource翻译成中文,我觉得都是可以有一个同样的词:开源。
9.今天的AI不能缺失太空
当然这个开源不只是以我们今天的模型,其实太空一直是我们最大的一个资源,在50年以前就是这样。所以我觉得我们今天绝对不是只是把我们的人工智能,只是可以用在我们的手机上用在我们的电脑上。
其实人工智能是不应该缺失太空的。但这里有个障碍就是算力。就当你有三个组合(模型、算力、太空)的时候,所以我想这个时候就让我们有了机会了。就像当年我们重新定义手机作为你的电脑。
第四种卫星:计算卫星
今天我们在有了通讯卫星、导航卫星和遥感卫星以后,因为人工智能的出现,我们就会有第四种卫星,我把它叫做计算卫星。同样因为这个卫星的存在,使得我们有机会把AI送到去。我自己还是蛮幸运的,因为在浙江实验室做这件事情,所以今年的5月14号我们第一次把12颗卫星同时上了天。
而且在这12个卫星组成的星座上,第一次把一个地面上真正意义上的一个8B的AI模型放到太空去了。我再说一遍,这不是用了一个简单的深度学习的算法,做了一个什么处理的小程序放到卫星上,而是一个跟地面上一模一样的完完整整的一个AI的模型。我们把它送到了太空上。
三体计算星座
其实当第一次进去的时候,还是非常的非常的激动的。这让我们第一次感受到:AI是不能缺失太空的。所以这就是这12颗卫星到了太空以后,就会保证在只要卫星到达的地方,你就可以在任何地方在太空完成对所有数据的处理。
大家都知道在这之前,我们所有的卫星在天上是没有任何关系的。我们所有的卫星在天上的卫星只跟地面发生关系,天上的这颗卫星和那颗卫星之间是没有关系的。所以这也是第一次完整的做完了在太空的卫星的互通互联,给人工智能在太空的带来了一次巨大的机会。当然这个很有意思的这件事情,为什么要把它叫了个名字?叫三体计算星座。
大家都知道,可能很这边很多的朋友知道三体这个词,是因为从这本小说(刘慈欣的《三体》)了解到的。事实上,三体这个词是一个彻头彻尾的科学概念,最早是牛顿提出来的,他讲的非常简单一个道理,在太空中如果只有两个物体,假定月亮和地球,它是可以有解析解的。也就是说有一个准确的数学的解决方式来说明这两个物体之间的关系。但是只要还有第三个物体存在,比如说太阳,那么这三个物体之间的关系就没有解析解了,没有一个确定的解了。你要描述他们之间的关系的,一定要假定另外一个物体是固定不动的。这个后来被牛顿称为三体问题。这背后告诉一个我们非常简单的道理,就是我一个人两个人做事情是很容易做的,只要三个人搞在一起就不好做了。这就是我们中国有一句古话叫“三个和尚没有水”。
10.三体计算星座:开放分享太空
但是三体计算星座就是希望我们有N多个主体还是可以完成一件事情的。那我想这是开放资源的情况下必须要做到的事情。所以我想三体计算星座就是希望有无数的主体来共同完成这个星座,来共同分享这个太空。
图片
后来,香港的南华早报,在听到我一个演讲以后,后来写了一篇文章,大家可以去看一下。本质上就是只有这样,我们才能够真正分享太空的,把人工智能送入太空。当然这里边我们会做一个非常有意思的计划,就是真的把每一颗卫星开放给全世界的任何一个人。当然这个里边可以解决很多问题,可持续发生问题我就不多说了。当然也可以为我们想象,我们要往深空去探索。这是一些科学家在设想的。
图片
11.从地球卫星到太阳卫星
几年以后,不是十年以后,就在几年以后把卫星送到太阳轨道。也就是说不只是地球的卫星,而是太阳的卫星。这颗卫星会放在大家看到的L5点,就是拉格拉斯第五点。这个点离地球1.5亿公里,离太阳1.5亿公里。在那个时候,数据几乎是没有办法传回到地面再做处理的。
所以,只有把AI和算力送入太空,人类才有可能真正的走出地球。所以我想下面那个时代还是非常的激动人心,所以我经常讲人类去火星的路上是不能没有计算的陪伴和AI的。这就是下面10年甚至20年的我觉得最激动人心的地方,谢谢大家。
图片
本文转载自51CTO技术栈,作者:云昭
