
中国开发者已是顶尖水平!Linux基金会大佬罕见采访流出:盛赞中国企业,DS不是凭空冒出来的! 原创
编辑 | 云昭
出品 | 51CTO技术栈(微信号:blog51cto)
中国软件产业已经达到了“逃逸速度”!中国开发者已经位居世界顶尖开发者之列!
本周,一年一度的全球开源界的“旗舰级”级盛会在阿姆斯特丹如约举行。今年的主题无疑聚焦在“开源 AI”。
峰会上,平时很少出来接受采访的主办方 Linux 基金会执行董事 Jim Zemlin 罕见地出来对外发声。作为全球开源界的“联合国总部”,Linux 基金会在近3年来的生成是AI爆发的浪潮中,花了很大篇幅称赞了中国企业和中国开发者在开源领域取得的令人惊叹的成绩。
(中国)政府出台了对开源非常友好的政策。
中国的产业巨头——无论是腾讯、阿里巴巴,还是中国移动——都开始大规模使用开源,并派自家开发者参与国际开源社区,和世界上最优秀的开发者一起学习,比如操作系统的Linus Torvalds,或者Kubernetes的核心维护者们(来自谷歌、微软、亚马逊等)。
久而久之,中国的开发者已经处于这些顶尖开发者之列,而这还发生在DeepSeek之前。
可以说,中国软件产业逐渐达到“逃逸速度”,不再只是“拿来主义”,而是开始孕育出自己的原创性创新。
除了高度认可中国开源方面的工作以外,重点探讨了许多业内存在争议且较为敏感的话题(主持人是真的敢问),比如:
- 如今 AI 语境下,Linux 基金会要不要搞一个大一统的AI基金会?
- 如何看待 DeepSeek 等开放权重模型并没有在 Linux 基金会中?
- Linux 基金会这两年是如何保持 AI 模型与工具开源方面的角色的?
- 如何看待 MCP、A2A 等新兴标准?
- 开源软件的风险谁来承担?
可谓是,一个敢问,一个敢答。
众所周知,开源界大佬不太多,即便是大家所熟知的动不动发飙的“开源大帝” Linus,也很少谈及 AI 在开源界的发展和影响。
所以,这一次 Zemlin 的采访就显得极为稀缺。
采访中,Zemlin 非常务实地谈及了“开源模型”(以及开源权重的模型是否算开源)的定义。
开源社区当然希望从数据到模型一切都完全开放,谁不想呢?
但从现实来看,考虑到资本支出和数据获取门槛,我们没必要盯着开源权重模型挑毛病,说它们不够“纯粹”。
我认为开源权重模型的趋势是重要且积极的。最终我们会看到端到端的完全开源模型,从数据到模型全部开放。
Linux 基金会已推出 模型开放性框架(Model Openness Framework),以便更细致地衡量模型的开放程度。
对大多数开发者来说,这种讨论更偏学术。
再比如,主持人提问,现在开源 AI 世界各种独立项目和标准,为什么还没有一个类似 CNCF 的中央基金会来统筹。
Zemlin 从现实开源 AI 技术栈的演进方向解释了这个问题。
现在的 AI 世界逐渐演进出三大块:训练栈(PyTorch、TensorFlow 那一类),推理栈(LLaMA、vLLM、Ray),Agentic 栈(MCP、A2A、Agency)。
早期,大家的兴趣集中在基础模型的构建,以及 PyTorch、TensorFlow 这样的项目。
后来,关注点转向 DeepSeek、Mistral 等公司推动的开源权重模型,如今焦点正在转移到推理栈、智能体(agents)和开放协议。
他补充说,虽然有一个统一的开源 AI 基金会会更方便,但“随着技术演进,这类事情很难预先设定。” 他给出的首要原则是:“当一个开源社区正在形成时,别搞砸它。”
基金会必须避免因规模过大而阻碍创新。“在规模大与保持灵活敏捷之间找到平衡非常重要。我们现在的做法是保持相对放手,让项目自然成长。”
个人方面,Zemlin 坦承自己慢慢变得像Linus了,并犀利的点评了基金会内部在使用的各类AI辅助工具。在他本人看来:
- AI写作工具真的很一般,做研究、结构化思考还不错。
- AI Coding 对 C 语言支持不太友好。所以其他高级语言的开源社区成为了各种AI 生成代码的重灾区。
- AI 辅助设计 Logo 等设计工具提效非常明显,秒成!
总之,这一期的访谈内容可以说非常权威,对于各位正在使用、开发AI工具的朋友们,非常有价值。
话不多说,下面就位大家奉上小编的编译整理。
“我慢慢变得越来越Linus了”
主持人:我们又回到阿姆斯特丹的开源峰会,这次和 Linux 基金会的执行董事 Jim Zemlin 一起。谢谢你,谢谢你接受我们的采访。
——不,当然,我知道你其实并不喜欢做这种采访。我知道的。
Jim Zemlin:(笑)慢慢变得更像 Linus 了。
主持人:可不是写邮件的那种方式。
Jim Zemlin:(笑)你很礼貌。
前沿模型的训练栈:开源是关键支柱
主持人:显然,我们今天的话题是 AI,这是绕不开的。我在想,上一次的大变革是容器和云原生,当时 Linux 基金会和 CNCF(云原生计算基金会)扮演了重要角色。那现在你们在 AI 上做些什么呢?因为感觉现在还很早,项目特别多,而 Linux 基金会又一直在引入各种项目。你们是不是在考虑建立另一个“伞式组织”?还是说,你们怎么看这个问题?
Jim Zemlin:是啊,这是个好问题。AI 技术栈的崛起其实是沿着几个方向的。真正把大家注意力拉到 AI 上的,其实是前沿模型的出现——想想也挺疯狂的,这事儿没多久之前才发生,从 ChatGPT 开始,人们才意识到这项技术有多么惊人、多么具有变革性。
在 AI 进入科技领域短暂的相关期里,大家很长一段时间都把重心放在前沿模型的训练上,也就是机器学习那一套,构建 ML 模型。但现在我们在训练的是这些庞大的模型。从开源的角度来看,训练栈主要是 PyTorch。
主持人:PyTorch。
Jim Zemlin:对,还有 TensorFlow 以及其他技术。前沿模型本身一开始并不是开源的,但训练完全是开源的。PyTorch ——它本身是 Linux 基金会的项目——已经成为训练前沿模型的关键支柱。
然后,今年我们迎来了“DeepSeek 时刻”,也就是突然出现了开放权重(open weight)的模型,这些模型依然是用开源训练栈训练出来的,但在开放模型领域,它们的性能已经接近专有模型。我们看到很多这样的项目在中国涌现,美国这边 OpenAI 也开始回应。
我认为,我们会看到更多来自美国不同公司的开放权重模型。在欧洲,有 Mistral 这样的组织,正在推出一些有意思的开放权重前沿模型。所以开源在 AI 领域真正的基石,就是训练所需的一切:数据整理、标注工具、训练所涉及的整个栈,这些都是大家关心的。
核心推理技术和推理栈也几乎都是开源的
Jim Zemlin:
接着,AI 推理和推理栈也开始兴起。我应该提一下,这些大多数运行在云上,运行在 Kubernetes 世界里。但在推理栈里,你会看到像 LLaMA、vLLM、Ray 这样的开源生态系统出现,它们正在支撑整个领域。当然,上层还有各种专有应用和 UI/UX,但如果看核心推理技术,几乎都是开源的。
再往前,现在我们进入了 Agent 的世界。行业还没确定叫法,是“Agentic AI”还是“Agent Stack”,但确实出现了基于开源和开放协议的 agentic 技术栈。比如 MCP、A2A,Cisco 开放了一些技术,有个项目群叫“Agency”。我们确实看到这个世界正在形成。MCP 显然是 agentic AI 的关键组件,大家也正在逐渐凝聚到这个方向上。但这里还有很多技术需要完善,比如安全性、是否需要统一的参考架构、如何构建 MCP 服务器等等。
AI技术世界三大板块:但底层依然是云编排
Jim Zemlin:
所以我会把现在的 AI 世界分成几个大块:
- 训练栈(PyTorch、TensorFlow 那一类),
- 推理栈(LLaMA、vLLM、Ray),
- Agentic 栈(MCP、A2A、Agency)。
它们的底层依然是云编排层,主要是 CNCF 世界里的一部分。我们在 PyTorch 软件基金会(它隶属于 Linux 基金会)看到越来越多项目加入,不只是 PyTorch 本身,还包括其他相关的开源项目。
要不要搞一个大一统的AI基金会?首要原则:别搞砸了
主持人:不过听起来你们是不是得改个名字了?
Jim Zemlin:(笑)Linux 基金会已经走过 20 年了,总有人这么跟我说。其实我挺喜欢“PyTorch 基金会”这个名字。CNCF 当年也有过激烈争论:到底叫 Kubernetes 基金会,还是云原生基金会?但重点在于,它主要关注训练,以及一部分推理。
我确实认为,未来我们会看到一个更有组织性的 agentic AI 努力出现。但这需要时间,让大家逐渐凝聚出一个统一的技术栈,明确有哪些组件,是 Agent 协议,还是 MCP 之类的东西。目前这个过程已经开始了。
很多人问我:要不要搞一个统一的“大 AI 基金会”,把所有开源 AI 都放进去?听起来确实很方便,大家可以集中资源,开几个大型活动,开发者也能少点出差。但问题是,技术正在快速演进,过早定型并不好。
我觉得重要的有两点:
第一,当有很酷的开源技术出现时,我的首要原则是:别搞砸了。比如 MCP 项目和社区正在做得很好,我们要做的就是给这些项目一个中立治理的平台,让开发者能放心继续创新。
第二,有时事情太大未必好,太小也未必好,要看目标。像 Kubernetes,要推动整个世界从虚拟机切换到容器编排,这需要巨大的资源和全球性的组织。但 agent 技术还处于早期,我们更应该放手让它自然成长。如果未来确实有必要推动整个生态往某个方向靠拢,那我们会支持。
就像 CNCF 早期,Kubernetes 是“太阳”,周围只有几个小“行星”项目。而现在,Kubernetes 已经是一个庞大生态的一部分。我认为 AI 也会走到那一步,但过程需要慢慢来,允许创新自然繁荣。
如何看待DeepSeek等开放模型的生态定位?
主持人:你刚才也提到 DeepSeek 时刻,现在这些开放模型大多运行时还存在争议:到底是“开放权重”还是“开源”。不过我们不需要深入讨论这个。重点是,这些模型大多数并不在基金会里,它们的位置有点模糊。
Jim Zemlin:是的,在生态系统里的定位还不太清晰。
主持人:对,你怎么看这个问题?
Jim Zemlin:前沿模型这个话题比较复杂,我的看法是这样的:
首先,前沿模型的开发几乎就是“王者的游戏”(sport of kings),因为它需要巨额的资本支出才能搭建算力基础设施、网络等等。
在美国,几乎所有大实验室都宣布了大规模资本开支,我记不清具体数字了,但总额已经超过 1000 亿甚至几千亿美元。在中国,也有类似的投资规模,用来建设算力来训练前沿模型。相比之下,开源社区要搞一个类似规模的联合项目,这个数字实在太庞大了。Linux 基金会虽然是全球最大的组织之一,但我们远没到百亿规模。美国的 Allen Institute 最近宣布获得了大约 1.5 亿美元的政府资助,用于研发完全开源的前沿模型,这已经很了不起了,但和大实验室投入的数十亿美元比起来,还是差很多。
其次,训练前沿模型不仅要钱,还需要庞大的数据集。这对开源来说也是个难题。我们有 Common Crawl 等开放数据源,但这些规模还远远不够。
再往后就是训练和权重本身。开放权重模型的免费发布是件好事,大家可以使用。我认为这是积极的趋势。虽然社区希望整个链条都开放——从数据到模型完全开放——但从现实角度看,受限于资金和数据,完全开源暂时很难。
所以我们不应该嫌弃开放权重模型“不够纯粹”,而是应该认可它的重要意义。我相信最终我们会看到从数据到模型完全开放的那一天。
事实上,Linux 基金会已经推出了一个 “模型开放性框架”(Model Openness Framework),帮助大家更细致地理解什么才算是“开放模型”。
一级是最开放的,三级更多只是开放权重。而当我和开发者聊到这个话题时,他们常说:“我只想要一个能下载来玩一玩的模型。”他们并不像AI行业里的人那样要求一切完全开源,也许未来会往那边走。
但他们真正关心的、这点才是关键,是弄清楚到底哪些部分是开放的,哪些不是,有没有限制。这正是“模型开放框架”(Model Openness Framework)想要做的,它并不是规定什么该更开放或更封闭,而是告诉大家:这是最高级别的开放,这是次一级的,让大家清楚自己拿到的是什么——这就是开发者最需要的。
中国开源真的太好了!
主持人:是的。我觉得回到更广义的开源话题,你在大会开幕演讲里谈到“DeepSeek”的时候有一个很有意思的点——它并不是凭空冒出来的。
Jim Zemlin:没错。
主持人:中国其实长期以来一直在投资开源。能不能详细讲讲?
Jim Zemlin:我在中美之间往返已经二十多年了。回到中国软件产业的早期阶段,当时全世界对中国的最大批评就是盗版软件泛滥,这在上世纪90年代和2000年代初确实属实。
后来中国加入世贸组织,就必须确保知识产权得到加强,可以说要“补齐短板”。这时候中国真正开始拥抱开源,因为开源为他们提供了一条路:既能合法共享软件,又能迅速启动本土软件生态。这其实非常惊人——而且不仅中国如此,全世界都是这样,美国也是依靠开源推动了许多产业的创新。
很快,中国人就发现开源太好了,于是开始在此基础上构建。他们当时做了很多Linux操作系统,比如红旗Linux等等。但更有意思的是,政府出台了对开源非常友好的政策,而且中国的产业巨头——无论是腾讯、阿里巴巴,还是中国移动——都开始大规模使用开源,并派自家开发者参与国际开源社区,和世界上最优秀的开发者一起学习,比如操作系统的Linus Torvalds,或者Kubernetes的核心维护者们(来自谷歌、微软、亚马逊等)。
久而久之,中国的开发者已经处于这些顶尖开发者之列,而这还发生在DeepSeek之前。可以说,中国软件产业逐渐达到“逃逸速度”,不再只是“拿来主义”,而是开始孕育出自己的原创性创新,推出全新的开源项目。这些项目不仅在国内发展,还和全球顶尖的开源项目共同演进。今天在Linux基金会里,我们能看到中国开发者和全球最具创新力的软件公司开发者并肩工作。
开源项目的风险评估
主持人:那在当前地缘政治环境下,你觉得这种情况有可能改变吗?
Jim Zemlin:我不认为会改变。我觉得全世界都同意一件事:保持开源开放,让技术尽快扩散,这是非常有益的。历史上,每当有人试图限制技术扩散,结果往往事与愿违。我当然没有看到全球的开源协作有任何减少的迹象。
主持人:现在我们在欧洲。早期一些欧洲的法规似乎对开源开发者可能会带来麻烦。那这方面的情况如何?
Jim Zemlin:是的,欧洲早先推出的《网络韧性法案》(CRA)确实引起了一些担忧。幸好,开源社区及时介入,向监管者解释并施加影响,从而降低了这些政策对开源的不利影响。我认为开源社区和下游用户——那些实现并部署开源技术的公司——正在逐渐学会如何应对这些监管。
Linux基金会正在做的其中一件事就是一个叫 Baseline Project 的项目。它来自我们的开源安全基金会(OpenSSF)。这个工具能对开源项目做风险评估,看它是否符合全球各地的监管要求,不仅是CRA,还有其他复杂的监管体系。
主持人:这些监管确实越来越复杂了。
Jim Zemlin:没错。其实我过去也说过,开源已经太成功、太普及了,以至于监管部门开始关注,这并不奇怪。CRA并不只针对开源,它同样适用于专有软件。但因为开源几乎是所有现代技术的基石,所以合规自然是开源社区必须考虑的问题。关键是要让合规过程尽可能无缝、不打断开源的快速创新。这正是Linux基金会的职责:理解政策,构建工具,帮助维护者和开发者合规——最好他们几乎不用操心,因为我们替他们做好了。
主持人:而且法律里对维护者还有豁免,对吧?
Jim Zemlin:对,这样他们会轻松一些。
AI会改变开源这个行业
主持人:在主题演讲中你还提到过一句话,我觉得挺有意思的:AI可能会改变基金会本身的未来。这是开玩笑,还是认真的?
Jim Zemlin:我是认真的。我经营的是一个大型标准化组织和软件协作组织,所以AI对我们社区开发者的影响,我必须思考。
大家总在说开源对AI的重要性:无论是前沿模型、推理技术还是智能体。但反过来看,AI会如何改变开源行业本身?这才是我觉得值得深思的问题。
你看新闻标题:Salesforce的CEO马克·贝尼奥夫说今年不再招聘软件开发人员,AI就能搞定一切。还有很多悲观报道,说新毕业的学生找不到工作,因为软件开发岗位被AI替代了。那我们就得问:未来的软件开发者会变多还是变少?AI工具能自动化许多过去很耗时的任务,那我们要如何积极拥抱它?
Jim Zemlin:我个人的看法是:开发者不会变少,反而会更多。因为几乎所有开发者都把AI视为生产力工具、倍增器。它不会减少工程师数量,只会让他们能创造更多有趣的软件。
Linux基金会现在也在研究:在软件开发流程的每个阶段,有哪些AI工具可以帮助?比如自动化文档、测试、安全审查。我们希望能把这些可信赖的AI工具提供给社区,让他们更高效。
谈 AI Coding:对C语言支持不好,其他语言维护者一片重灾区
主持人:不过也有人担心,AI生成的代码或问题报告会让维护者收到一堆“垃圾”。
Jim Zemlin:确实。我昨天才和Linux内核开发者们聊过。AI编程工具对C语言支持不好,所以内核团队每周只会收到几条AI生成的问题或代码。但在一些高级语言社区里,就很严重了。很多人可能是出于好意,用AI帮忙提bug或修复,但结果其实是幻觉。于是维护者收到大量无效报告,这对他们是负担。而在AI出现之前,他们就已经很吃力了,比如某个NPM包突然走红,维护者每天都要应对海量需求。现在AI让问题更严重了。
所以很可能还得用AI来过滤这些“噪音”。
主持人:现在几乎所有问题的答案都是“接着用AI解决”。
Jim Zemlin:(笑)确实,很多时候,技术带来的问题最后还是靠新技术解决。在这里,也许真是如此。
“AI写出来的东西确实一般”做研究很给力、帮设计秒出
主持人:那你自己用AI吗?
Jim Zemlin:我不写代码了,但我写很多东西,比如我每周会给Linux基金会员工和董事会写通讯,涵盖开源领域的重要新闻,解释它们的意义。我确实用AI工具来帮忙,但不是让它写,而是用来理清思路、收集资料。
主持人:很好,我很高兴你是这样用的。
Jim Zemlin:是的,我算是写作方面的“完美主义者”。AI写出来的东西确实一般, predictable(可预期)、 decent(过得去),但不够精彩,一眼能看出来。不过它特别擅长结构化思路、帮你做研究。比如OpenAI、Gemini、Claude这类工具在研究上非常好用。开源的AI工具我也在用,比如Mistral等。它们能提供不同视角,让我写得更快更好。
在Linux基金会内部,我们也用AI做很多事,比如给新项目设计Logo——以前很花时间,现在几乎是秒出。这样我们整个组织更高效,就能把更多资源支持给真正的开发者。
主持人:太棒了,非常感谢你今天的分享!那我们到这里就结束吧。
好了,文章到这里就结束了,评论区的大佬们,如何看待开源AI界的发展呢?欢迎评论区一起交流。
参考链接:
https://thenewstack.io/the-linux-foundation-in-the-age-of-ai/
https://www.youtube.com/watch?v=X1c3hGfF_a0
本文转载自51CTO技术栈,作者:云昭
