DarkBERT:诞生自暗网的AI,全球首个基于暗网训练的AI模型

人工智能
DarkBERT可以研究暗网,以识别和标记潜在的网络安全威胁,包括数据泄露和勒索软件。

5月25日 据外媒报道,韩国研究人员最近开发了一种基于暗网数据训练的大型语言模型DarkBERT。这个AI模型旨在帮助网络安全专业人员从暗网提取有关网络威胁的情报。

DarkBERT可以研究暗网,以识别和标记潜在的网络安全威胁,包括数据泄露和勒索软件。

韩国科学技术院(KAIST)的研究人员与数据情报机构S2W开展合作,开发出生成式AI语言模型DarkBERT,该模型专门针对来自暗网的数据集进行训练。

与ChatGPT或Bard之类的聊天机器人不同,该模型旨在创建一个工具来分析数据集并回答特定的查询。DarkBERT可以验证使用暗网作为数据集是否能让AI工具更好地理解这些环境中使用的语言,从而可以为网络安全专业人员和执法部门提供帮助。

研究人员使用Tor网络训练AI模型

为了优化DarkBert适应暗网上使用的语言,研究小组通过爬行代理Tor网络创建了一个大型数据库。该研究团队还采用重复数据删除、数据过滤和预处理技术,以减轻与暗网内容相关的道德担忧,而暗网内容通常包含大量敏感信息。

该模型在16天内输入了两组数据,其中预处理的数据包括受害组织的名称、泄露数据的详细信息、威胁声明、非法图像等信息。

由于暗网的信息存在潜在风险,DarkBert在短期内不会向公众开放。然而,用户可以提出将这个AI模型用于学术目的的请求。

责任编辑:庞桂玉 来源: 极客网
相关推荐

2023-03-01 15:48:12

2020-12-23 16:08:15

比特币互联网技术

2023-03-01 10:54:37

2024-03-25 14:57:01

2021-01-15 14:17:28

暗网恶意软件网络犯罪

2022-04-06 15:21:53

暗网网络犯罪

2021-01-19 09:40:24

暗网网络安全漏洞

2017-08-01 06:14:49

2016-11-16 09:06:59

2020-05-20 09:44:15

网络安全暗网数据

2019-05-21 06:34:53

暗网网络攻击网络安全

2018-07-31 14:58:08

2023-06-15 12:03:32

2015-04-16 10:27:47

2018-09-29 05:54:48

2018-04-25 10:03:26

网络安全防火墙动态安全

2021-04-06 10:30:49

网络安全暗网互联网

2024-03-11 14:56:10

2018-12-07 13:56:56

AI人工智能AI人才

2019-05-20 09:25:07

点赞
收藏

51CTO技术栈公众号