OpenAI 设立安全团队 Preparedness:评估 AI 风险、防止外界滥用

人工智能
OpenAI 表示,未来的 AI 模型虽然拥有造福全人类的潜力,但也可能带来严重的风险,因此需要建立一个强大的框架来监控、评估、预测及防范这些 AI 模型。

10 月 27 日消息,OpenAI 今日宣布,正建立 Preparedness 团队来评估通用 AI(Artificial General Intelligence,AGI)可能造成的灾难性风险,该团队交由麻省理工学院(MIT)的可部署机器学习中心主任 Aleksander Madry 主导。

Our approach to preparedness

We believe that frontier AI models,which will exceed the capabilities currently present in th most advanced existing models,have the potential to benefit all of humanity.But they also pose increasingly severe risks.Managing the catastrophic risks from frontier AI will require answering questions like:

  • How dangerous are frontier AI systems when put to misuse,both now and in the future?
  • How can we build a robust framework for monitoring,evaluation,prediction,and protection against the dangerous capabilities of frontier AI systems?
  • If our frontier AI model weights were stolen,how might malicious actors choose to leverage them?

OpenAI 表示,未来的 AI 模型虽然拥有造福全人类的潜力,但也可能带来严重的风险,因此需要建立一个强大的框架来监控、评估、预测及防范这些 AI 模型

据悉,OpenAI 设立了 Preparedness 团队,将针对各种 AI 模型进行能力评估及红队测试,以追踪、预测及防范各类别的灾难性风险。

IT之家发现,OpenAI 宣称的相关风险,主要包含以下三大类:

  • 说服人类能力:AI 输出的内容是否会影响人类的行为
  • 生成不当内容:AI 是否会生成有关化学 / 生物 / 放射性 / 核(CBRN)等危险内容
  • 自主复制与适应能力(Autonomous Replication and Adaptation,ARA):AI 是否会在自我迭代中脱离人类的控制

OpenAI 已开始招募不同背景的人才加入 Preparedness 团队,同时推出 AI Preparedness 挑战赛,鼓励参赛者以黑客名义,“破解”Whisper、Voice、GPT-4V、DALLE3 等模型,前 10 名将可获得 OpenAI 所提供的、价值 2.5 万美元(IT之家备注:当前约 18.3 万元人民币)的 API 使用额度。

责任编辑:庞桂玉 来源: IT之家
相关推荐

2023-03-14 13:08:33

微软AI风险评估

2023-10-27 08:41:15

AI安全OpenAI

2023-03-29 21:18:39

2017-06-08 23:02:10

安全代码DevOps

2018-08-20 07:09:22

2020-02-25 14:17:00

AI网络安全人工智能

2020-05-06 11:31:43

安全运营Fortinet

2018-10-09 12:25:00

2014-04-08 13:17:42

2013-02-28 11:58:42

2023-02-26 00:34:52

安全团队工具原子化

2010-03-12 15:07:35

2022-06-21 11:44:57

网络安全团队网络安全

2022-02-08 08:03:01

安全误报SOC

2021-12-31 19:04:32

安全团队网络意识培训网络安全

2021-03-23 11:56:47

安全工程师职业

2012-11-30 16:55:05

2019-07-29 13:55:57

2019-08-07 14:46:52

云计算云安全混合云

2022-09-15 09:49:17

网络安全扩展物联网漏洞
点赞
收藏

51CTO技术栈公众号