亚当与夏娃:解决深度学习问题的利器

译文
人工智能 深度学习
近年来,深度学习的大潮席卷了互联网的各个角落。从金融科技到电商,从反欺诈到推荐系统,随处都可以见到深度学习的身影。深度学习的本质是神经网络,而由于神经网络的深度较深,如何能够快速高效的进行计算成为了深度学习很重要的课题。

[[242433]]

【51CTO.com快译】近年来,深度学习的大潮席卷了互联网的各个角落。从金融科技到电商,从反欺诈到推荐系统,随处都可以见到深度学习的身影。深度学习的本质是神经网络,而由于神经网络的深度较深,如何能够快速高效的进行计算成为了深度学习很重要的课题。针对训练神经网络的随机梯度下降问题,学者们分别提出了亚当方法(Adam)和夏娃(Eve)方法,成为了解决深度学习问题的利器。

我们先来看一下什么是亚当(Adam)方法: 

Hiroaki Hiyashi , Jayanth Koushik , Graham Neubig 在论文 Eve: A Gradient Based Optimization Method with Locally and Globally Adaptive Learning Rates 中提出了一种改进 Adam (亚当) 算法的方法,命名为 Eve (夏娃)方法。 夏娃方法是在亚当算法的基础上进行了改进,我们先来看一下算法的伪代码:

 

***,在针对数据的稳定性问题和平滑性问题,我们对学习速率进行处理,就得到了***在算法伪代码中展示的步骤。

Adam 算法和 Eve 算法在 CNN 和 RNN 模型的测评结果如下图所示:

可以看到 Eve 算法在 CNN 上取得了比其他算法都要好的效果,而在 RNN 上的效果也表现不错。

机器学习和数据挖掘流行了这么多年,其实离不开统计概率和***化的根基。平常大多数机器学习和数据挖掘的从业者都是在工业界深耕,因此对于数学本身的掌握程度要求没有那么高深。特别是在中国的企业,一般能做到跟进国际***的潮流就可以了。

然而有的时候沉寂下来,用心钻研一下数学对于自己技术上的理解和深造是很有帮助的。Adam 算法和 Eve 算法本身的数学原理并不复杂,用到的唯一的统计学概念是无偏统计量,值得广大从业者认真学习其简单优美的思路。

[[242435]]

汪昊,恒昌利通大数据部负责人/资深架构师,美国犹他大学本科/硕士,对外经贸大学在职MBA。曾在百度,新浪,网易,豆瓣等公司有多年的研发和技术管理经验,擅长机器学习,大数据,推荐系统,社交网络分析等技术。在 TVCG 和 ASONAM 等国际会议和期刊发表论文 8 篇。本科毕业论文获国际会议 IEEE SMI 2008 ***论文奖。

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

责任编辑:庞桂玉 来源: 51CTO
相关推荐

2017-08-16 10:57:52

深度学习TensorFlowNLP

2017-09-28 10:40:10

深度学习多体问题多代理系统

2017-09-23 22:07:24

深度学习N 体问题GAN

2022-10-24 15:51:13

人工智能深度学习发展趋势

2017-09-21 12:29:58

深度学习TensorFlow智能终端

2020-06-23 08:26:43

深度学习气候变化AI

2017-12-05 15:32:44

深度学习语音识别

2018-09-06 08:00:00

深度学习TensorFlowPython

2021-07-27 13:30:25

人工智能机器学习深度学习

2017-02-06 14:12:57

机器停车使用

2017-04-24 14:09:13

深度学习TensorFlow

2021-03-30 13:45:00

人工智能

2018-05-11 14:34:24

人工智能机器学习深度学习

2017-10-24 11:19:16

深度学习机器学习数据

2024-03-01 19:26:22

2022-05-12 08:32:25

JavaArthas阿尔萨斯

2018-03-14 08:10:44

深度学习

2018-08-14 05:05:25

2023-03-03 09:33:45

ArthasJava诊断工具

2021-01-11 07:52:30

系统cpu工具
点赞
收藏

51CTO技术栈公众号