人工智能已经离我们越来越近

人工智能
能够统一地理解语音和文本,是人类能够形成通用语言能力的重要原因。那么,人工智能是否也能如此?

 很久以前科学家们就意识到,语音和文字信号进入大脑后,会共享一部分处理路径,正如你听有歌词的歌时很容易干扰你的阅读。而相关的探索,可以追溯到一百多年前一个年轻人的意外发现。

[[419130]]

1874年,卡尔·韦尼克正在著名神经病理学家西奥多·梅内特手下学习。他记录下两位奇特的病人。他们好像患有某种语言表达障碍,但症状和典型的表达性失语症截然不同:他们说话写字其实都很流畅,但净是些胡言乱语。韦尼克最终将这种症状(现称感觉性失语症)归因于颞叶后部和顶部的脑损伤。它破坏了病人的语言理解能力,所以患者常常说着写着就忘了:“我要说啥来着?现代科学家们在地观察大脑活动的过程中,最后都佐证了大脑中语音-文本“汇合区”的存在,这些区域同时负责着对语音和文本的理解。

在观看外语电影时,我们看着字幕也能很流畅的把电影看完,这里的字幕就涉及语音翻译技术,把源语言的声音翻译成目标语言(如你的母语)的文本。

然而对于计算机而言,语音和文本的表达形式大不相同。文本通常只是几十个符号,但语音都是连续的声音波形,长度可以达到百万之巨。即使是说一个词,由谁来说、在什么环境中、何种语境下说,听起来也会大相径庭。此外,语音与文本的编码方式也不同。文本单词由词根和词缀构成。而语音则包含着一系列的语素,辅以轻重和抑扬顿挫。

对人类来说轻而易举的事情,人工智能来做却可能难上加难。文本和语音的差异之大,在文本处理方面的研究硕果累累时,语音上的表现却落后不少。要想弥合差距,就需要统一理解语音和文本,就像我们的大脑那样。

现在我们研究人工智能时就已经开始从解剖学和神经学中获取灵感来优化模型,人工智能已经离我们越来越近。

责任编辑:华轩 来源: 今日头条
相关推荐

2021-04-28 14:27:16

数字人民币货币金融

2013-08-01 13:21:47

2018-08-23 07:24:40

MEC多接入边缘计算网络边缘

2021-01-19 09:28:07

边缘数据云计算

2014-02-14 16:51:11

Windows 8.1

2021-05-16 15:59:59

数字人民币二维码支付宝

2021-06-09 13:26:27

编程语言PythonTIOBE

2022-12-13 11:13:34

数据传感器

2021-04-15 13:48:08

视频监控视频分析智能安防

2018-08-14 21:13:06

人工智能技术开发语言

2023-12-04 07:21:03

5G6G

2020-10-16 10:27:58

人工智能

2019-01-23 17:48:29

人工智能机器学习技术

2022-07-14 15:21:06

AI技术

2023-11-22 15:53:45

2021-04-23 13:52:22

Web 3.0IPFSHTTP

2020-01-03 14:55:43

人工智能技术机器人

2020-03-23 19:00:48

人工智能AI

2020-03-19 17:39:45

人工智能AI预测

2022-03-22 16:48:04

云技术开源应用云服务
点赞
收藏

51CTO技术栈公众号