概述语音识别技术的发展及其应用

译文
人工智能 语音识别
在我们的生活中交流起着重要的作用。人类从符号开始,然后发展到用语言交流,再后来出现了计算和通信技术。在某些情况下,机器不仅与人类交流,也与机器之间交流。计算机和通信技术创造了互联网世界,正如我们所知的物联网(IoT)。

[[280529]]

【51CTO.com快译】在我们的生活中交流起着重要的作用。人类从符号开始,然后发展到用语言交流,再后来出现了计算和通信技术。在某些情况下,机器不仅与人类交流,也与机器之间交流。计算机和通信技术创造了互联网世界,正如我们所知的物联网(IoT)。下面是涉及机器学习的语音识别技术的发展。

语音识别技术和机器学习的发展

互联网催生了使用数据的新方式,这就是机器学习。我们可以通过训练机器直接或间接地与它们交流。在此之前,我们必须访问计算机来与机器通信。

人们开始研究消除单纯依赖计算机的技术,这种技术称为自动语音识别。基于自然语言处理(NLP),我们可以在很大程度上直接与机器交互。

语音识别领域的初步研究已经取得了成功。从那时起,语音科学家和工程师就致力于优化语音识别引擎。根据实际情况优化机器的交互,从而降低错误率,提高效率。

一些机构已经开始开发微调语音识别技术。十多年来,位于弗吉尼亚州的GoVivace公司一直致力于语音识别技术和解决方案的设计和开发。

自动语音识别及其应用

自动语音识别(ASR)技术是计算机科学和语言学两个不同分支的结合。计算机科学用于设计算法和编写程序;语言学用于创建单词,句子和短语的字典。

生成语音音标

开发的第一个阶段是从语音转录开始的,在这里音频被转换成文本——语音到文本的转换。之后,系统过滤去除不需要的信号或噪声。当我们说一个单词或句子时,我们有不同的语速,因此语音识别模型还需要考虑这些语速的变化。

随后,信号被进一步划分以识别音素。音素是具有相同气流水平的字母,如“b”和“p”。程序会通过与存储在语言学词典中的单词和句子进行比较,来试图匹配准确的单词。

语音识别系统目前有两种类型。

一种类型的系统是通过学习模式来完成的,另一种是作为人的依赖系统来完成的。随着人工智能(AI)和大数据的发展,语音识别技术达到了一个新的水平。一种被称为长短时记忆的特殊神经结构在这一领域取得了显著的进步。在全球范围内,很多机构正在利用不同层次的语言能力来完成各种各样的任务。

语音文本软件可以将音频文件转换到文本文件。

许多国家没有语言嵌入式键盘,大多数人都不知道如何使用特定的语言键盘,尽管他们在语言方面很擅长。在这种情况下,语音转录帮助它们将语音转换成任何语言的文本。

实时字幕系统。

这是一个实时的应用系统。实时翻译技术被称为计算机辅助实时翻译。它基本上是一个实时操作的语音到文本系统。世界各地举办各种会议都会应用。

为了最大限度地吸引全球观众的参与,他们采用了直播字幕系统。实时字幕系统将语音转换为文本并显示在屏幕上。它可以将一种语言的演讲翻译成其他语言的文本,还可以帮助记录会议或演讲。这些系统将语音转换成文本,使听力受限的人也能阅读和理解。

语音生物识别系统

除了语音到文本,该技术还将其分支扩展到生物识别系统,从而为用户身份验证创建了语音生物识别技术。语音生物识别系统分析说话人的声音,这取决于音调、发音和其他因素。

在这些系统中,首先分析语音样本并存储为模板。当用户说出短语或句子时,语音生物识别系统会将其与存储的模板进行比较,并提供身份验证。然而,这些系统面临着许多挑战。我们的声音总是受到身体因素或情绪状态的影响。

生物语音系统的最新发展是通过将短语与样本进行匹配来实现的。然后,结合心理和行为语音信号分析语音模式。此外,语音生物识别技术的发展将有助于那些数据安全备受关注的企业。

使用语音进行分析

分析在语音识别技术的发展中起着至关重要的作用。大数据分析创造了存储语音数据的需求。呼叫中心开始使用电话录音来培训他们的员工。因为客户满意度现在是全球机构的首要关注点。现在,机构希望跟踪和分析主管和客户之间的对话。

使用呼叫分析应用程序,相关机构可以监视和测量呼叫的质量。这种呼叫分析解决方案提高了呼叫中心提供的服务质量。通过分析可以分类他们的客户,可以更好地为客户提供更快和更好的反馈。

语音识别技术还有很长的路要走

语音识别技术的研究任重而道远。到目前为止,程序只能执行指令。人类的交流感觉并不完全存在于机器中。研究人员正试图向机器灌输人类的反应能力。它们在语音识别技术创新方面还有很长的路要走。

研究的主要特点集中在如何使语音识别技术更加准确。对于人类的语言理解,我们需要更多的准确性。例如,一个人提出了一个问题,“我如何改变相机的灯光设置?”这个问题在技术上意味着个人想要调整相机的闪光灯。因此,在回答具体问题之前,要先集中精力理解人类的自由语言。

因此,总的来说,机器学习和语音识别技术已经进入全球范围,并开始提供有效的运用和高效的服务。很快,我们将会看到自动速记员得到普遍提升,并在各大会议演讲中扮演重要的角色。

原文标题:Evolution of Speech Recognition Technology,作者:Sahil Chauhan

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

 

责任编辑:庞桂玉 来源: 51CTO
相关推荐

2021-11-17 10:37:39

语音识别技术人工智能

2022-08-29 10:57:09

语音识苹果频率

2011-05-23 16:04:48

接入ADSLCable Modem

2022-09-08 12:29:37

掌静脉识别应用生物识别

2017-03-19 16:09:00

语音识别

2017-10-27 16:19:23

语音识别CNN

2022-12-01 07:03:22

语音识别人工智能技术

2021-04-14 14:49:47

语音识别技术人工智能

2024-03-11 11:32:38

语音识别

2009-08-21 15:28:23

C#英文

2023-02-28 12:12:21

语音识别技术解码器

2022-07-06 13:21:52

语音识别

2011-08-03 11:10:03

布线管理软件综合布线

2020-09-21 07:00:00

语音识别AI人工智能

2023-09-01 15:37:56

2024-03-12 09:08:36

可穿戴技术人工智能

2023-09-14 15:41:22

2013-11-22 09:43:21

SDN技术影响

2012-10-29 11:33:01

2022-03-30 09:00:00

物联网行为互联网设备
点赞
收藏

51CTO技术栈公众号