
牛津未来研究院:《将人工智能安全视为全球公共产品的影响、挑战与研究重点》
《将人工智能安全视为全球公共产品的影响、挑战与研究重点》由牛津未来研究院发布,众多机构的专家共同撰写。报告指出,随着 AI 发展,其安全问题成为关键挑战,探讨将 AI 安全视为全球公共产品的意义、挑战与研究方向。
报告分析了全球公共产品的概念,指出 AI 安全在技术、知识和制度层面具有公共产品特性,但面临平衡责任与问责、安全与能力纠缠、发展公平性等问题。不同国际声明对 AI 安全作为全球公共产品的理解存在差异,反映出 AI 发展的复杂性。在应用框架时,需考虑区域、国家和全球治理层面的差异,以及政治现实、权力动态等因素的影响。
为应对这些挑战,报告建议开展深入研究,明确核心需求,完善 AI 安全的公共产品框架,改进治理机制,考量不同利益相关者的反应,建立评估指标,制定技术和经济策略,从而推动 AI 安全发展,确保 AI 造福人。
报告主要内容介绍
人工智能能力的快速提升引发了人们对其潜在益处的期待,同时也引发了对超越传统界限的新兴集体挑战的担忧。虽然人工智能技术有助于应对医疗、气候变化和经济发展等领域的全球挑战,但它们也带来了风险,从当前对算法偏见和隐私的担忧,到有关自主性和安全性的基本问题。这些机遇和挑战在不同地区和社区的表现可能有所不同,因为一些国家在推动人工智能发展的前沿,而另一些国家则在努力构建基础人工智能应用和发展的基础设施。因此,人工智能在地方、区域和全球层面都带来了复杂的治理挑战。技术的快速进步与集体行动的需求相交,引发了不同利益相关者(从主要人工智能强国到新兴经济体)是否以及如何协调人工智能开发、部署和风险管理方法的问题。此外,人工智能能力和资源的差异凸显了平衡全球发展需求与前沿安全考虑的必要性。
近期的国际对话从多个角度探讨了集体行动和公共产品框架,作为应对人工智能发展带来的全球挑战的方法(见附录 A),这表明人们越来越认识到这一概念在人工智能领域的应用值得认真考虑。这些讨论研究了人工智能开发、部署和安全的不同方面如何在从地方到全球的各个层面被理解为公共产品。公共产品的视角揭示了在安全研究和基础设施发展等关键领域的投资不足,以及在协调不同能力和优先事项的利益相关者行动方面的挑战。将人工智能安全视为全球公共产品意味着确保人工智能系统安全的知识、措施和实践应普遍可及、非排他性的,并且对所有人有益,无论个人贡献或地理界限如何。
在迄今为止全球关于人工智能与治理的讨论中,已经讨论了许多潜在的框架。有人认为,人工智能技术本身可能构成全球公共产品,特别是在其应对气候变化、公共卫生和可持续发展等领域集体挑战的潜力方面。这种框架强调,当人工智能能力得到公平开发和部署时,它可以通过增强问题解决能力、改善资源分配和加速科学发现,为人类带来非竞争性(一个国家的拥有不会减少另一个国家的拥有)和非排他性(一个国家无法阻止其他国家拥有)的利益。然而,最近的政策转变,如 2025 年 1 月拜登政府限制国际人工智能技术转让的行政命令,可能挑战了将人工智能视为全球公共产品的观点,因为新兴的保护主义措施实际上创造了排他性机制,可能将世界划分为人工智能 “有者” 和 “无者”。相关地,人工智能系统能力水平的提高和扩散引发了对其开发和部署带来的集体挑战的担忧。其中一些挑战,如算法偏见和隐私问题,已经在当代人工智能系统中出现,而长期问题则涉及如何保持人类的自主性并防止灾难性风险。
因此,确保先进人工智能系统的安全开发,即在保护其益处的同时防范人工智能系统的负面外部性,本身可能构成一项关键的全球公共产品。
本报告探讨公共产品框架如何为管理人工智能相关风险和外部性提供信息,分析全球公共产品框架的理论基础及其实际影响。该分析考虑责任和公平问题,探索这些框架如何帮助解决人工智能发展中的差距,同时确保广泛参与安全工作。我们不主张具体的政策措施,而是寻求制定一个研究议程,为未来的治理工作和国际合作提供信息。
“全球公共产品”:国际进步的基础框架
“全球公共产品”(GPG)的概念在现代经济学和政策讨论中已成为一个有力的分析框架,为应对跨越国界的集体挑战提供了结构化的方法。理解这一框架在拥有先进人工智能的世界中的潜在应用,需要审视其核心特征以及对治理和协调的实际影响。
全球公共产品与传统公共产品的不同之处在于其在全球范围内提供利益,但具有相同的基本特征。“公共产品” 的本质区别如下表所示:
商品类型 | 竞争性 | 排他性 | 示例 |
私人物品 | 是 | 是 | 跨境石油储备 |
俱乐部物品 | 否 | 是 | 卫星网络、学术期刊 |
公共资源 | 是 | 否 | 海洋鱼类资源、南极资源 |
公共物品 | 否 | 否 | 稳定的气候、疾病根除、低风险的全球战争 |
此表突出了全球公共产品的两个特征:非排他性和非竞争性,并指出了它们与其他类型商品的区别。一种具有竞争性和排他性的全球商品将是私人物品,如跨境石油储备;一种具有排他性但非竞争性的商品将是俱乐部物品,如卫星网络或学术期刊;一种具有非排他性但竞争性的商品将是公共资源,如海洋鱼类资源或南极资源。而在国际背景下,非竞争性、非排他性的公共物品的例子包括稳定的气候、疾病根除以及低风险的全球战争,这些利益影响着全球每个人,且一方的享用不会减少其对其他方的可用性。
将某些商品和服务视为 “全球公共产品”,对其在全球范围内的资助、治理和公平分配具有重要意义。
虽然商品在不同分析层面都可以是公共的,包括社区、城市、国家或地区,但由于人工智能预计会产生全球影响以及相关的全球协调挑战,本文将重点放在全球层面。市场可能无法充分提供人工智能安全保障,因为其益处是一种公共产品,单个公司无法完全获取,而安全措施的成本是私人的,直接影响其底线。供应不足的挑战源于在其他全球公共产品背景下观察到的经典搭便车动态。个体行为者,无论是国家、公司还是研究机构,可能会对安全措施投资不足,因为他们知道可以从他人的安全投资中受益而无需承担成本。鉴于安全措施不足可能带来的全球范围潜在危害,这种动态对于人工智能安全来说可能尤其令人担忧。当多个行为者采取这种方法时,对安全的集体投资就会低于社会最优水平,可能导致对系统性风险、偏差或灾难性故障的防范不足。
全球公共产品的概念强调,应对跨国挑战既符合国家利益,也符合全球利益,这可能促使政府投入自身资源,并就市场往往供应不足的共享解决方案展开合作。就像气候变化的情况一样,尽管化石燃料存在负面外部性,但它们仍然占据主导地位;在 COVID-19 疫情中,关键医疗用品和公平的疫苗分配供应不足。
这个框架为协调和治理提供了几个明显的优势:
- 协调合理性:该框架通过展示应对跨国挑战如何与国家和全球利益保持一致,同时表明不协调的行动不太可能产生预期结果,为国际协调提供了经济和政治上的合理性。
- 投资动力:这种框架将突出市场机制或单一国家的国内治理措施单独使用可能导致全球公共产品供应不足,从而为加强公共投资提供论据。
- 制度架构:该框架借鉴气候变化行动和公共卫生等其他领域的先例,为人工智能安全的提供提出了制度安排和资金机制。
- 特权群体动态:国家在某些全球公共产品方面可能充当 “特权群体”,即拥有足够资源、能力和动机来提供公共产品并从中受益的行为者,无论其他方的贡献或参与如何。在追求自身利益时,他们的行动仍可能带来全球利益。这种框架可能会影响大国对待人工智能安全的方式:例如,他们可能会将其作为全球公共产品做出贡献,同时采取独立行动,比如制定和执行主要符合自身利益的标准,同时保持其技术优势。然而,个别大国的单边和不协调决策仍可能通过竞争互动引发进一步的竞赛动态,并减少特权群体单独行动所产生的全球公共产品。
一个关键问题出现了:哪些要素需要作为全球公共产品进行保护或提供?就像清洁空气和气候稳定是环境治理的基本全球公共产品一样,确定人工智能发展中的核心公共产品为建立有效的治理机制和协调框架奠定了基础。
确定人工智能领域的定义性公共产品
已有的全球公共产品,如清洁空气、疾病控制和不存在跨国冲突,已成为集体行动的明确基础。随着人工智能系统变得越来越强大和普及,我们是否必须确定类似的需要集体保护的基本产品?这个问题涵盖了人工智能作为公共产品的潜力以及其开发和部署带来的集体挑战。理解这些要素需要分析人工智能发展和安全的不同方面如何与现有的全球公共产品框架相契合。
先进人工智能中公共产品的多个维度
基本人类需求,如获得清洁空气和免受传染病侵害,在政治领域被如此定义时,激发了对空气污染和流行病的集体应对。然而,多次会议和对话已经确定了在先进人工智能背景下引起类似程度关注的类似要素,涉及技术、社会和治理维度。
本节旨在研究在先进人工智能的特定背景下,社会对获取某些基本资源和环境的需求,以及摆脱极端不利全球状况的需求。下表简要概述了类似的政策领域,区分了核心全球公共产品、相应的社会需求、全球公共产品特征以及促进全球公共产品提供的补充工具。这将帮助我们在下一节中将全球公共产品框架应用于人工智能领域。
确定人工智能发展中基本公共产品的复杂性反映在不同国际行为者应对这一挑战的方式上。近期的国际对话产生了一些重要声明,试图勾勒出与人工智能相关的公共产品,每个声明都突出了集体行动的不同方面和方法(见表 3)。这些声明的重点各不相同,从强调安全协议和验证机制作为潜在的非竞争性、非排他性产品,到共享治理框架的可能益处。迄今为止,最突出的国际对话和声明包括:
- 人工智能安全国际对话(IDAIS)威尼斯声明:主要从技术安全措施的角度探讨基本公共产品的问题。它将安全协议和验证机制本身视为非竞争性、非排他性的益处,类似于清洁空气对气候稳定的基础性公共产品作用。这种框架强调,安全措施一旦开发出来,理论上可以使所有人受益,而不会降低其对任何特定用户的价值。
- 《关于全球包容性科学理解人工智能的曼哈顿宣言》:采取了更广泛的视角,将科学知识本身确定为基本公共产品。这种方法表明,我们对人工智能能力、机遇和风险的集体理解构成了一种共享资源,随着更广泛的参与,其价值会不断增长,类似于医学知识在全球健康框架中作为公共产品的作用。
- 《人工智能安全作为全球公共产品报告》:采用了更全面的视角,将治理能力本身视为基本公共产品。这种方法强调,类似于核安全或航空领域的共享治理框架,可以通过跨境政策学习和协调提供非竞争性益处。它特别强调平衡发展在创建可持续治理结构中的重要性。
- 《联合国人工智能高级别咨询机构报告:为人类治理人工智能》:其建议可能采取了最广泛的视角,确定了人工智能背景下多个相互关联的公共产品层次。这个框架不仅包括技术安全和科学知识,还包括机构能力和发展基础设施,这些都被视为需要集体行动的基本公共产品。
更多详细比较见附录 A。
虽然上述所有声明和报告都认识到将全球公共产品框架应用于人工智能领域的潜在价值,但对这些不同概念化的深入分析,为国内实验室、国家政府和国际机构如何独特地理解人工智能与全球公共产品之间的关系,提供了重要见解。因此,有必要将表 2 中开发的框架应用于这些现有的关于人工智能和全球公共产品的国际声明,以及在本文同行评审期间最近的研讨会上讨论的其他框架。在下表中,我们探索了从先进人工智能角度概念化全球公共产品的可能方式、它们的关键特征,以及支持的工具、资源和流程。
当专门将全球公共产品框架应用于人工智能安全时,分析框架与实施工具之间的区别变得尤为突出。将人工智能安全理解为全球公共产品,揭示了个体行为者对安全措施投资不足时出现的特定市场和协调失灵,而这些安全措施的益处超出了他们的直接控制范围。例如,虽然强大的人工智能安全框架可能在全球产生非竞争性和非排他性的益处,但实现这一结果取决于特定的工具和资源,从技术标准到治理框架,而这些工具和资源本身可能具有排他性或竞争性。这一分析有助于解释为什么将人工智能安全视为全球公共产品的不同框架,可能会强调不同的工具和资源来实现其提供。
人工智能全球公共产品框架 | 核心普遍利益 | 获得 / 提供 | 摆脱 / 不存在 | 非竞争性特征 | 非排他性特征 | 促进全球公共产品的工具 |
技术安全 | 安全且可控的人工智能系统 | 技术安全协议;验证机制;测试框架 | 不受控制的人工智能系统;灾难性故障;系统性风险 | 安全协议对所有用户平等有益;标准随着更广泛的采用而改进 | 技术标准可以全球共享;安全益处跨越国界 | 安全评估框架;验证协议;应急响应系统 |
科学理解 | 对人工智能能力和风险的共享知识 | 研究基础设施;科学合作;知识共享平台 | 信息不对称;碎片化理解;孤立研究 | 科学见解通过共享倍增;研究受益于多样化的投入 | 知识可以公开获取;科学发现使所有人受益 | 研究合作网络;开放科学平台;共享研究基础设施 |
治理能力 | 有效的人工智能治理系统 | 治理框架;政策协调;利益相关者参与 | 治理失败;监管差距;协调失败 | 治理知识使所有各方受益;最佳实践通过共享得到改进 | 跨境政策学习;共享治理益处 | 政策协调平台;多利益相关方框架;治理标准 |
发展基础设施 | 公平的人工智能发展能力 | 技术基础设施;培训资源;开发工具 | 数字鸿沟;能力差距;资源不平等 | 基础设施的益处随着使用而倍增;知识共享提高价值 | 基本人工智能能力对所有人可用;开发资源可公开获取 | 能力建设网络;资源共享平台;发展框架 |
人类能动性 | 人类自主权和尊严 | 有意义的人类选择和控制;决策能动性 | 自动化压迫;人类自主权丧失;算法歧视 | 对能动性的保护对所有人平等有益;保障措施随着更广泛的采用而加强 | 对人类能动性的影响影响所有人;无法排除在受保护自主权的益处之外 | 人类监督机制;能动性保护框架;权利保护工具 |
安全知识共享 | 集体人工智能安全专业知识 | 安全研究;最佳实践;风险评估工具 | 知识差距;安全失败;系统性风险 | 安全知识随着使用而增长;受益于多样化的投入 | 安全见解使所有人受益;无法排除在知识益处之外 | 知识共享平台;协作研究工具;最佳实践库 |
有益的人工智能系统 | 服务于人类利益的人工智能系统 | 安全且有益的人工智能应用;符合公共利益的人工智能工具 | 有害的人工智能应用;目标不一致的系统;负面外部性 | 人工智能应用的益处可以共享;价值随着采用而增长 |
本文转载自欧米伽未来研究所,作者:欧米伽未来研究所
