游戏背后的AI故事:小样本学习与迁移学习

人工智能
很多人喜欢玩游戏,或许还不知道,人工智能与游戏背后的一些有趣的AI故事,喜欢玩棋牌类与游戏的,可以与东方林语一起深入了解一下。

2019年,一场人与机器的游戏对战——Open AI Five以全面压倒性的表现战胜了Dota2世界冠军战队OG。

[[344878]]

棋类游戏一直被视为顶级人类智力及人工智能的试金石。

人工智能与人类棋手的对抗一直在不断上演中,从三子棋、五子棋、跳棋、象棋、军棋、国际象棋、再到最高水平的围棋类游戏,计算机人工智能程序都已经打败了人类。

[[344879]]

人工智能取得的成绩让人侧目,至少在游戏领域,已经全面压倒人类。

然而在这令人侧目惊叹的表现背后,是人类远远无法企及的大数据训练的结果,以训练Open AI Five为例,看看它的学习过程消耗了多少资源:

12.8万个CPU;

256块P100;

长达数个月的训练……

[[344880]]

如果转化成更容易理解的数据,就是相当于一个游戏选手不分日夜的持续练习45000年的游戏,才能达到同样的战果。

按照人类目前的寿命和思维容量,显然这是一个永远不可能完成的任务。

这就是目前人工智能行业,尤其是深度学习领域,当前面临的最大问题与挑战之一,具体主要包括包括:

大量的数据依赖;

长时间的学习与训练;

高昂的软硬件训练成本……

那么,解决方法是什么呢?

2020年,学术界提出了因果关系的小样本学习的概念。

如何进行小样本学习呢?其实这个概念与几年前杨强教授(现微众银行首席人工智能官)与戴文渊(现第四范式首席执行官)提出的迁移学习概念比较类似。

小样本学习与迁移学习,都可以说是学习模仿人类,看看人类是如何快速学习各种知识的。

以玩游戏为例:

星际争霸系列游戏,涉及人族、神族、虫族三个种族,数十个兵种,从战略到战术,可以演化为成千上万种打法。这个游戏,不到最后一刻,往往很难猜出谁胜谁负。因此,也成为了人工智能重点“练手”的即时策略对战游戏。

游戏背后的AI故事:小样本学习与迁移学习

对于喜欢玩即时策略游戏的人而言,如果会玩星际争霸系列游戏,那么其他的即时策略类游戏,比如:暴雪的魔兽争霸,DOTA2系列;微软的帝国时代系列等等,就很容易上手了。

因为可以运用之前的游戏经验,玩同类型的游戏,其背后的思路方法是类似的,触类旁通,举一反三,就是这个意思。

同样的,对于机器学习而言,在少量样本上快速泛化的核心,就是借助先验知识(类似人类的经验)。

而小样本学习就致力于通过极少的训练数据(1-5个样本/类)来实现模型的泛化(机器学习算法对新鲜样本的适应能力)。

这里面,还要提出一个是指机器学习“预训练”的概念。

具体来说,就是在大型数据集上,学习一个强大的神经网络作为特征提取器,例如:

CV(计算机视觉)里面常见的在ImageNet上预训练的ResNet网络;

NLP(自然语言处理)里面在Wikipedia上预训练的BERT;

都是代表一种特征表达的先验知识,也就是预训练。

迁移学习里面,依据的“库伯学习圈”理论,也是类似的原理。

预训练相当于给了小样本学习一个好的起点,就像一个人在上课前预习了大量的知识点。

当然,如果想获得更好的效果,还要了解一下元学习(meta learning)的概念,简单来说就是通过不断学习,找到更好效果的机器学习方法。

所以,人工智能与机器学习,简单来说,就是不断学习和模仿人类思维的过程。

关注东方林语,一起了解更多人工智能小知识。

附:

NeurIPS 2020接收的小样本学习论文

Interventional Few-Shot Learning,网址如下:

https://arxiv.org/abs/2009.13000

论文的代码在Github上开源网址:

https://github.com/yue-zhongqi/ifsl

 

 

责任编辑:姜华 来源: 今日头条
相关推荐

2022-10-30 15:00:40

小样本学习数据集机器学习

2021-08-19 15:48:05

增量攻击网络安全网络攻击

2021-07-28 11:54:09

阿里云AI自然语言理解

2021-10-19 10:28:06

AI 数据工具

2011-05-06 18:02:32

数据库迁移行业案例DB2

2012-10-17 13:50:25

2022-06-17 11:37:55

模型美团

2023-04-24 16:31:03

计算机模型

2021-12-10 15:46:18

谷歌模型人工智能

2016-08-31 07:02:51

2018-11-06 15:56:25

西门子工业网络智能制造

2013-07-08 10:08:40

海量样本筛选大数据

2011-09-26 14:28:28

水果忍者

2020-12-16 15:56:26

机器学习人工智能Python

2024-03-01 19:26:22

2013-12-02 09:47:06

云迁移项目云迁移计算资源规模扩张

2014-04-14 10:06:22

.Net 开源

2017-01-15 11:01:56

2016-12-12 14:19:59

LLVMClangApple

2023-11-20 10:06:12

人工智能游戏
点赞
收藏

51CTO技术栈公众号