AI在远古细菌中发现杀灭“超级细菌”的新抗生素 | 了解LLM就能看懂

发布于 2025-8-26 07:07
浏览
0收藏

大家可能听说过(希望没有感受过)“超级细菌”感染的可怕。几年前,我的一个同事讲述其父亲在一个有淤泥的池塘里不小心划伤了腿,最终演变成了对多种抗生素都耐药的“超级细菌”感染。老人因此被送进ICU,与死神搏斗了数周,经历了巨大的煎熬,最终吉人天相。但那段经历的凶险,应该会让身边的人至今心有余悸。

这个故事,正是我们这个时代正面临的一场危机的缩影:抗生素耐药性。曾被视为医学奇迹的抗生素(如青霉素),正逐渐失效。寻找新武器的脚步从未停止,但传统上从细菌和真菌中寻找抗生素的“宝库”似乎已被反复挖掘,新发现越来越少。8月12日发表在顶级期刊《自然-微生物学》上的一篇论文《Deep learning reveals antibiotics in the archaeal proteome》,可能打开了一扇全新的大门,而打开这扇门的钥匙,正是人工智能(AI)。

AI在远古细菌中发现杀灭“超级细菌”的新抗生素 | 了解LLM就能看懂-AI.x社区

图:利用深度学习从古菌中发现抗生素。通过经公开及内部肽数据集训练的多任务深度学习模型,对古菌蛋白质中8-50个氨基酸残基的肽序列进行了抗菌活性预测。根据预测抗菌潜力排名前列的肽段经化学合成后,在体外实验和动物模型中对临床相关病原体进行了全面评估。

科学家发现了一个全新的抗生素家族

科学家们将目光投向了一个长期被忽视的生命领域:古菌(Archaea)。古菌是地球上最古老的生命形式之一,常常生活在火山、深海热泉、盐湖等极端环境中。它们独特的生存方式,让科学家们猜想,其体内是否也隐藏着独特的防御武器?

这项研究给出了肯定的答案。通过一种强大的AI工具,研究团队从数百种古菌的蛋白质中,识别并验证了一类全新的抗菌分子。他们将这类分子命名为 “Archaeasins”(古菌素)。

这些新发现的“古菌素”令人无比兴奋。实验室测试表明,它们对多种当前临床上最棘手的耐药菌都表现出强大的杀菌活性,比如耐甲氧西林金黄色葡萄球菌(MRSA)、铜绿假单胞菌和鲍曼不动杆菌。更重要的是,在小鼠感染模型中,其中一种名为 Archaeasin-73 的分子,展现出了与现有强效抗生素(如多粘菌素B)相媲美的治疗效果,同时对人体细胞的毒性却很低。这意味着,“古菌素”不仅强效,还可能比现有的一些药物更安全,极具成为新一代抗生素的潜力。

这项发现的意义

我认为这项工作的意义很大。它不仅发现了几种新的候选药物,更开辟了一个前所未有的药物发现新大陆。古菌作为一个庞大的生命王国,过去几乎从未被系统性地探索用于抗生素开发。这项研究证明,这里是一座巨大的、有待开采的金矿。

此外,研究还发现,将不同的“古菌素”组合使用时,它们的杀菌效果会变得更强。这种“协同效应”策略,有望成为对抗细菌耐药性发展的一种有效手段。我们不仅找到了新“子弹”,还找到了让“子弹”威力倍增的方法。

AI 如何完成这项任务的

那么,这篇论文是如何从古菌浩如烟海的蛋白质信息中,如此精准地找到这些“宝藏分子”的呢?答案就是深度学习,而其工作原理,对于熟悉大语言模型(LLM)的读者来说会非常容易理解。

我们可以将这项任务与LLM的工作方式进行类比。一个像Qwen3/DeepSeek这样的LLM,是通过学习海量的文本数据,来掌握人类语言的语法、结构和内在逻辑,从而能够生成连贯、有意义的句子。它学会的不是死记硬背,而是语言里蕴含的“概念体系和内在逻辑”。

AI在远古细菌中发现杀灭“超级细菌”的新抗生素 | 了解LLM就能看懂-AI.x社区

图:一种蛋白质的空间结构和氨基酸序列

"MAVWLQAGALLVLLVVSSVSTNPGTPQHLCGSHLVDALYLVCGPTGFFYNPKRDVEPLLGFLPPKSAQETEVADFAFKDHAELIRKRGIVEQCCHKPCSIFELQNYCN"

研究团队开发的 APEX 1.1 模型,就可以被看作是一个专攻“生物化学语言”的LLM。它的任务不是理解英语或中文,而是理解决定一个蛋白质片段(多肽)是否具有抗菌活性的“内在逻辑”。

  1. 学习与训练:首先,研究人员用数万个已知的、具有抗菌活性的多肽序列(就是氨基酸序列,如上面动图展示的胰岛素氨基酸序列) 来训练这个AI模型。这些序列由不同的氨基酸(可以看作是几十个不同的“字母”)组成。APEX 1.1通过分析这些正样本(有效的抗菌肽)和负样本(无效的肽),学习这种“生化语言”的语法:哪些“字母”(氨基酸)的组合是强效的“单词”?这些“单词”如何排列成具有杀菌功能的“句子”(多肽序列)?什么样的“句子结构”(三维空间构象)能最有效地摧毁细菌的细胞膜?
  2. 挖掘与预测:在掌握了这套复杂的“内在逻辑”后,研究人员将233种古菌的全部蛋白质数据“输入”给APEX 1.1。AI高速地扫描了这些对人类来说无比庞大的数据集,并从中精准地预测出了 12,623个 它认为“文法正确”且“语义强大”(即具有高抗菌潜力)的候选“句子”。
  3. 实验验证(最震撼的部分):AI的预测到底准不准?研究团队从这上万个候选中,挑选并合成了80个“古菌素”分子进行实验室测试。结果令人震惊:在这80个分子中,高达93%(即74个)都显示出了不同程度的抗菌活性!

这是一个惊人的命中率。在传统的药物发现流程中,筛选的命中率通常远低于1%。如此高的准确性,强有力地证明了AI不仅仅是在进行模式匹配,而是真正“理解”了抗菌分子的底层生物学逻辑。

附录

  • 论文名称和URL:“Deep learning reveals antibiotics in the archaeal proteome”,​https://www.nature.com/articles/s41564-025-02061-0

本文转载自​​后向传播​​,作者: 张发恩


收藏
回复
举报
回复
相关推荐