
麦肯锡 & Mozilla:2025 人工智能时代下的开源技术研究报告
在当今科技飞速发展的宏大背景下,人工智能(AI)无疑是最引人瞩目的驱动力之一,它正以前所未有的速度和深度渗透到各行各业,重塑着商业模式、社会结构乃至人类生活的方方面面。从自动化流程到复杂决策支持,从个性化服务到前沿科学探索,AI的应用场景日益广泛,其战略重要性已成为全球共识。
然而,支撑这场智能化革命的基石,并不仅仅是少数科技巨头所掌握的尖端技术或庞大算力,一股同样强大且日益重要的力量正在其中扮演着关键角色——那就是开源技术。开源软件,以其协作开发、公开透明、自由使用、修改和分发的特性,长久以来一直是软件技术生态系统的重要组成部分。它打破了传统商业软件的封闭模式,降低了创新门槛,促进了技术的普及与迭代。
如今,随着AI技术的蓬勃发展,特别是生成式AI的突破性进展,开源模式再次展现出其独特的价值和强大的生命力。众多企业和开发者不再仅仅依赖于需要高昂许可费用且核心技术不透明的专有AI解决方案,而是将目光投向了日益丰富和成熟的开源AI技术栈。
这份由麦肯锡咨询公司、Mozilla基金会以及帕特里克·J·麦戈文基金会(Patrick J. McGovern Foundation)联合进行的研究报告——《人工智能时代下的开源技术》,正是基于这一时代背景,进行了一次前所未有的大规模、深度调研。
该研究旨在全面、细致地剖析全球范围内企业和开发者在AI领域对开源技术的应用现状、核心驱动因素、感知价值、面临的风险挑战以及未来发展趋势。通过对来自41个国家、超过700位技术领导者和资深开发者的问卷调查(调研时间为2024年12月9日至2025年1月24日),报告首次为我们描绘了一幅关于开源AI在全球企业级应用中的详尽图景。
研究结果清晰地表明,开源AI不再是边缘或补充性的选择,而是正在迅速成为企业构建其AI能力、驱动创新、寻求竞争优势的核心组成部分。从数据处理、模型训练到工具应用,开源技术的身影无处不在,其影响力已深深嵌入现代AI技术栈的各个层面。报告强调,无论是商业领袖还是技术专家,都应充分认识并拥抱开源技术的巨大潜力,否则可能在未来的AI竞争格局中失去一个重要的战略支点。
正如帕特里克·J·麦戈文基金会主席Vilas S. Dhar所言,开源通过将创造工具交到每个人手中,而非仅仅是资金雄厚者,从而将用户转变为建设者,将消费者转变为创造者,它所代表的协作智能和自由流动的专业知识,将是解决人类最紧迫挑战的关键。因此,理解并战略性地运用开源AI,已成为企业在智能化时代生存和发展的必修课。
开源AI的应用现状:广泛渗透与结构性差异
报告深入探讨了开源AI技术在企业实际应用中的普及程度和具体采用模式。研究首先界定了AI技术栈的七个关键领域:数据(用于训练和评估模型)、模型(核心算法及权重)、托管/推理计算(运行模型的服务器或云基础设施)、修改(如微调、适配器等,用于特定场景优化)、API与提示处理(使AI模型可用的接口)、工具(支持开发部署流程,如编排、安全、评估工具)以及用户体验/应用(最终面向用户的AI产品)。
调研结果显示,开源技术在AI技术栈的多个层面都实现了显著的渗透。超过半数的受访者表示,他们在数据、模型和工具这三个核心领域都不同程度地利用了开源技术。这反映出企业在构建其AI能力时,已经广泛接受并采纳了来自社区的开源资源。
特别是在模型层面,诸如Meta的Llama系列、Google的Gemma系列、艾伦人工智能研究所(Allen Institute for Artificial Intelligence)的OLMo系列,乃至Nvidia的NeMo系列、DeepSeek-R1和阿里巴巴的Qwen 2.5-Max等开源或部分开源模型,凭借其快速提升的性能,正在积极追赶甚至在某些基准测试中超越了部分专有模型,成为了企业的重要选择。
然而,开源技术的应用并非在所有层面都均衡分布。在模型修改(如微调、适配器应用)以及托管/推理计算方面,开源技术的采用率相对较低。报告分析认为,这可能与相关领域的开源项目相对较新有关,例如,备受关注的推理引擎vLLM是在2024年4月才由伯克利大学Sky计算实验室开发出来。同时,这也可能意味着企业更倾向于使用内部开发的工具包和专有数据来对模型进行定制化修改,以满足其特定的业务需求和安全合规考量。
在探讨“开放”程度时,报告特别关注了AI模型的复杂性所引发的关于“开源”定义的讨论。Mozilla基金会支持开源促进会(OSI)提出的开源AI定义,该定义要求在数据信息、代码和参数等多个维度都达到开放标准。调研中,符合OSI标准的被视为“开源”,而那些拥有开放组件(如开放权重)但不完全满足OSI标准的(例如存在商业使用限制或未使用OSI批准的开源许可证)则被归类为“部分开放”。
有趣的是,调研发现,受访者最常选择使用的是“部分开放”的模型。这在很大程度上反映了当前的市场格局——许多知名且资源雄厚的模型,如Llama 3和4系列,以及Stable Diffusion等,属于此类。它们虽然在权重上开放,但在数据透明度或使用许可上可能存在限制,但这并未阻碍它们成为企业实践中的热门选项。
报告还揭示了开源AI应用在不同行业和地区之间的显著差异。科技、媒体和电信(TMT)行业是开源AI应用的领头羊,其使用率高达70%。这可能得益于该行业天然的技术基因、对新技术的敏感度以及相对成熟的技术基础设施。
相比之下,其他行业的应用程度虽也普遍,但存在梯度差异。从地域上看,印度(77%)和英国(75%)的受访者报告的开源AI模型使用率最高,美国(62%)、法国(60%)、巴西(63%)等也表现出较高的采用水平。
此外,报告发现,技术成熟度和开发者经验对开源AI的使用有着重要影响。拥有丰富AI开发经验的开发者使用开源技术的可能性要高出40%。这表明,有效地利用开源AI资源,往往需要一定的技术门槛和实践积累。
价值感知与权衡:成本、性能、效率与开发者体验
企业和开发者之所以积极拥抱开源AI,其背后有着多重价值驱动因素。报告对此进行了深入分析,并将其与专有AI解决方案进行了对比。最突出的优势之一是成本效益。高达60%的受访者认为,开源AI的实施成本低于专有方案;46%的受访者认为其维护成本更低;51%的受访者认为相关的软件工具成本也更低。这对于预算有限或希望优化IT支出的企业而言,无疑具有巨大的吸引力。开源模式通常免除了高昂的许可费用,并允许企业根据自身需求灵活调整和部署,从而有效控制总体拥有成本。
除了成本优势,性能和易用性也是用户选择开源AI的重要原因。报告指出,绝大多数受访者对他们使用的开源AI模型表示满意,满意者数量是表示不满意者的近十倍。其中,高性能和易于使用是驱动满意度的首要因素。这表明,许多开源AI项目在技术上已经达到了相当高的水准,能够满足企业在实际应用中的性能要求,并且其接口和文档也越来越友好,降低了开发者的使用门槛。社区驱动的快速迭代和创新,也使得开源模型能够紧跟技术前沿,不断提升能力。
然而,开源AI并非完美无缺。在“价值实现时间”(time to value)方面,专有工具似乎更具优势。有48%的受访者认为专有工具能够更快地带来价值,而仅有33%的受访者认为开源工具在这方面表现更好。这可能与专有解决方案通常提供更完善的集成服务、技术支持以及开箱即用的特性有关,使得企业能够更快地将AI能力部署到业务流程中并产生回报。
相比之下,使用开源工具可能需要企业投入更多的内部资源进行集成、调试和优化。此外,虽然开源工具在用户友好性方面获得了30%受访者的认可,但仍有41%的受访者认为专有工具更易用,这表明开源社区在提升用户体验方面仍有改进空间。
对于开发者而言,开源AI的价值则体现在更深层次的职业发展和工作满意度上。高达81%的开发者表示,拥有开源工具的经验在他们的领域受到高度重视。这意味着掌握和运用开源AI技术已成为提升开发者市场竞争力的重要砝码。
同时,66%的开发者认为,使用开源工具对他们的工作满意度至关重要或非常重要。这反映了开源文化所倡导的开放、协作、共享精神,以及能够直接接触、修改和贡献底层技术的自由度,对技术人员具有强烈的吸引力。他们不仅是技术的使用者,更是社区的参与者和贡献者,这种归属感和成就感是专有技术生态系统难以比拟的。
因此,企业在选择AI技术路径时,需要在开源与专有之间进行审慎的权衡。开源提供了显著的成本优势、有竞争力的性能以及对开发者的强大吸引力,但在价值实现速度和某些情况下的易用性方面可能稍逊一筹。理解这些差异,并结合自身的业务需求、技术能力和风险偏好,做出明智的决策至关重要。
未来展望与风险管理:增长预期、混合策略与安全挑战
展望未来,报告揭示了开源AI持续增长的强劲势头。高达75%的受访者预计,他们的组织将在未来几年内增加对开源AI技术的使用。这一普遍预期反映了市场对开源价值的广泛认可,以及对其未来发展的充足信心。随着开源模型性能的不断提升、工具生态的日益完善以及社区的持续活跃,开源AI有望在更广泛的领域和更深层次的应用中扮演更加核心的角色。
2024年见证了开源AI领域的诸多里程碑事件,例如Meta的Llama 3在基准测试中表现优异,DeepSeek-V3在推理速度上媲美顶级专有系统,苹果(OpenELM)、微软(Phi-3-mini)等巨头也纷纷加大开源力度,这些都为开源AI的未来发展注入了强大动力。
然而,报告同时指出,未来的AI技术格局并非非黑即白的选择,而更可能是一种混合模式的共存。近四分之三(超过70%)的受访者表示,他们在AI技术栈的各个层面都对采用开源或专有技术持开放态度。极少有受访者是纯粹的开源或专有拥护者。这意味着企业将根据不同场景的具体需求,灵活地组合使用开源和专有组件,构建混合式的AI解决方案。
例如,可能会在成本敏感或需要高度定制化的场景中使用开源模型和工具,而在需要快速部署、强力支持或特定高性能要求的场景中选择专有方案。这种“混合云”式的策略,将有助于企业在利用开源优势的同时,弥补其短板,实现整体效益的最大化。正如Mozilla基金会主席Mark Surman所强调的,开源AI的目标是构建像“AI乐高盒子”一样易于使用的工具和技术栈,使其成为更具竞争力、创造力和创新性未来的基础,而非仅仅是封闭系统的替代品。
尽管前景光明,开源AI的发展并非没有隐忧。风险管理是企业在采用开源技术时必须面对的关键课题。报告显示,受访者普遍认为开源AI工具在某些方面比专有AI风险更高。最受关注的风险领域包括:网络安全(62%的受访者表示担忧)、法规遵从性(54%)和知识产权问题(50%)。
这些担忧不无道理。开源软件的开放性可能使其更容易受到恶意攻击或被发现漏洞;复杂的许可证和贡献者协议可能带来合规和IP方面的挑战;模型训练数据的来源和质量问题也可能引发偏见、隐私泄露或版权争议。值得注意的是,不同国家和地区的受访者对风险的感知程度存在差异。例如,巴西受访者更关注网络安全,而印度受访者则对法规遵从性和知识产权侵权的担忧程度显著高于全球平均水平,这可能与其特定的监管环境、风险容忍度和AI成熟度有关。
为了应对这些潜在挑战,企业正在积极采取一系列风险缓解措施。报告中提到了几种关键策略:
一是建立强健的“护栏”(Guardrails),例如使用自动化内容过滤、输入/输出验证、人工监督等机制,确保AI模型的使用符合伦理和法规要求,并控制输出的安全性。诸如Nvidia的NeMo Guardrails、Llama Guard等开源工具本身也提供了这方面的支持。
二是进行第三方评估,通过标准化的基准测试和认证,特别是采用隐私保护的评估方法(如私有基准测试),来确保模型的可靠性和安全性,防止数据污染。
三是加强文档管理和监控,例如使用软件物料清单(SBOM)来跟踪开源组件的版本和已知漏洞,利用通用漏洞评分系统(CVSS)等工具评估风险严重性。
四是强化网络安全实践,包括在可信执行环境(TEE)中运行模型以保护敏感数据,在训练中采用差分隐私和联邦学习技术防止数据记忆,实施严格的访问控制、网络隔离、持续安全监控以及加密哈希验证等。正如安全与技术研究所(Institute for Security and Technology)CEO Philip Reiner所建议的,组织需要回归基本的网络安全原则,重视开源工具可能存在的维护不足和软件过时问题,并设立专门团队负责风险跟踪和更新。
此外,报告还指出了一个值得关注的现象:尽管开源AI的使用日益广泛,但企业对开源项目的贡献率却相对较低。只有13%的受访者表示他们曾为开源项目做出过贡献,而50%的人不确定未来是否会参与。
贡献意愿低可能源于多种因素,包括资源投入、知识产权顾虑以及贡献行为往往更多基于利他主义而非直接商业回报。然而,一个健康繁荣的开源生态系统离不开包括企业、学术机构和基金会在内的多方参与和贡献。缺乏广泛的贡献可能会限制开源技术在某些前沿领域的突破速度,并影响其长期可持续发展。因此,如何激励和促进更广泛的社区参与和企业贡献,将是开源AI未来发展需要思考的重要议题。
结语:将开源AI融入企业核心战略
麦肯锡与Mozilla基金会、帕特里克·J·麦戈文基金会联合发布的这份《人工智能时代下的开源技术》报告,以其详实的数据和深入的分析,为我们揭示了开源AI在全球企业应用中的真实图景及其深远影响。
报告的核心结论是明确而有力的:开源技术已经不再是AI领域的边缘选择或备用方案,而是正在成为驱动创新、降低成本、吸引人才、构建差异化竞争优势的关键要素。企业对开源AI的采纳已相当普遍,覆盖了从数据处理、模型训练到应用工具的整个技术栈,并且未来几年内有望持续增长。开源AI在成本效益、性能表现以及开发者社区吸引力方面展现出显著优势,尽管在价值实现速度和某些风险感知上可能面临挑战。
面对开源AI带来的机遇与挑战,报告为企业决策者和技术领导者提供了清晰的指引。首先,企业应将开源AI视为其整体AI战略不可或缺的一部分,积极评估和拥抱开源技术带来的可能性。其次,应采取务实和灵活的混合策略,根据具体业务需求和场景特点,在开源与专有解决方案之间做出明智的组合与权衡。
再次,必须高度重视并有效管理开源AI相关的风险,特别是网络安全、合规性和知识产权方面,建立完善的风险评估、缓解机制和治理框架。最后,企业也应考虑如何更积极地参与和贡献于开源社区,这不仅有助于提升自身技术能力和品牌形象,更能促进整个生态系统的健康发展,最终惠及自身。
总之,人工智能时代已经到来,而开源正以前所未有的力量塑造着这个时代的科技格局。那些能够深刻理解、战略性运用并有效管理开源AI的企业,无疑将在未来的智能化竞争中占据更有利的位置。这份报告不仅是对现状的一次全面扫描,更是对未来趋势的一次深刻洞察,为所有希望在AI浪潮中乘风破浪的组织提供了宝贵的参考和启示。
本文转载自欧米伽未来研究所,作者:欧米伽未来研究所
