社区编辑申请
注册/登录
自然语言处理(nlp)比计算机视觉(cv)发展缓慢,而且更难!
人工智能 深度学习 自然语言处理
不是说nlp在这波深度学习浪潮下没有进展,而是说突破并没有cv那么巨大。很多文本分类任务,你用一个巨复杂的双向LTSM的效果,不见得比好好做手工feature + svm好多少,而svm速度快、小巧、不需要大量数据、不需要gpu,很多场景真不见得深度学习的模型就比svm、gbdt等传统模型就好用。

 

1. 抢跑的nlp

nlp发展的历史非常早,因为人从计算机发明开始,就有对语言处理的需求。各种字符串算法都贯穿于计算机的发展历史中。伟大的乔姆斯基提出了生成文法,人类拥有的处理语言的最基本框架,自动机(正则表达式),随机上下文无关分析树,字符串匹配算法KMP,动态规划。

nlp任务里如文本分类,成熟的非常早,如垃圾邮件分类等,用朴素贝叶斯就能有不错的效果。20年前通过纯统计和规则都可以做机器翻译了。相比,在cv领域,那时候mnist分类还没搞好呢。

90年代,信息检索的发展提出BM25等一系列文本匹配算法,Google等搜索引擎的发展将nlp推向了高峰。相比CV领域暗淡的一些。

2. 特征抽取困难的cv

cv的前身就有一个领域叫图像处理,研究图片的压缩、滤波、边缘提取,天天摆弄着一个叫lenna的美女。

 

 

早期的计算机视觉领域受困于特征提取的困难,无论是HOG还是各种手工特征提取,都没办法取得非常好的效果。

大规模商业化应用比较困难。而同期nlp里手工特征➕svm已经搞的风生水起了。

3. 深度学习的崛起- 自动特征提取

近些年,非常火爆的深度学习模型简单可以概括为:

深度学习 = 特征提取器➕分类器

一下子解决cv难于手工提取特征的难题,所以给cv带来了爆发性的进展。深度学习的思路就是让模型自动从数据中学习特征提取,从而生成了很多人工很难提取的特征:

 

 

4. nlp的知识困境

不是说nlp在这波深度学习浪潮下没有进展,而是说突破并没有cv那么巨大。很多文本分类任务,你用一个巨复杂的双向LTSM的效果,不见得比好好做手工feature + svm好多少,而svm速度快、小巧、不需要大量数据、不需要gpu,很多场景真不见得深度学习的模型就比svm、gbdt等传统模型就好用。

 

而nlp更大的难题在于知识困境。不同于cv的感知智能,nlp是认知智能,认知就必然涉及到知识的问题,而知识却又是最离散最难于表示的。

责任编辑:庞桂玉 来源: 机器学习算法与自然语言处理
相关推荐

2022-06-24 11:14:00

美团开源

2022-06-30 09:07:52

2022-05-06 16:31:27

人工智能自然语言生物特征识别

2022-06-07 11:01:56

人工智能AI技术大会

2022-05-25 14:10:51

学术数据

2022-06-16 11:33:57

物联网区块链科技

2022-06-20 06:27:58

Meta人工智能AI模型

2022-05-05 21:06:33

人工智能计算机视觉自然语言处理

2022-06-15 17:55:43

IE浏览器Windows微软

2022-05-19 09:53:05

机器学习人工智能算法

2022-06-02 15:31:26

深度学习AI

2022-06-02 15:19:18

加密货币稳定币数字货币

2022-05-17 15:34:08

视觉效果UI 界面设计

2022-04-08 14:52:31

模型谷歌方法

2022-05-19 19:11:07

微软Windows 11

2022-05-13 14:26:04

数据中心自建外包

2022-05-13 23:03:55

Windows 10微软应用程序

2022-04-12 14:12:43

谷歌研究模型

2022-04-26 05:49:45

物联网OTIT

2022-02-28 17:43:27

AI模型训练

编辑推荐

为什么大家都不戳破深度学习的本质?!一文搞懂RNN(循环神经网络)基础篇神经网络训练中,傻傻分不清Epoch、Batch Size和迭代CVPR 2017论文解读:特征金字塔网络FPN超实用的图像超分辨率重建技术原理与应用
我收藏的内容
点赞
收藏

51CTO技术栈公众号