AI智能语音识别算法 下篇

人工智能 语音识别 算法

 [[397599]]

一、神经网络

当前常用的语音识别框架如下图

其背后的逻辑是

在特征提取时采用的神经网络里面的DNN技术

DNN技术可以分为两种,一种是CNN模型,一种是RNN模型

二、解码器

解码器信息来源于声学模型、词典、语言模型。框图如下:

2.1 声学模型

常用的声学模型为GMM-HMM,即混合高斯模型-隐马尔科夫模型

HMM模型对时序信息进行建模,在给定HMM的一个状态后,GMM对属于该状态的语音特征向量的概率分布进行建模。

2.2 词典

字典:就是发音字典,中文中就是拼音与汉字的对应,英文中就是音标与单词的对应

用途:

根据声学模型识别出来的音素,在字典中来找到对应的汉字(词)或者单词,用来在声学模型和语言模型建立桥梁,将两者联系起来。

比方如下词语的映射表:

2.3 语言模型

语言模型是针对某种语言建立的概率模型,是用来计算一个句子的概率的概率模型。

划分以下两种:

2.3.1 N元统计语言模型:N-gram模型、平滑化

2.3.2 神经网络语言模型:

与统计语言模型不同的是,神经网络语言模型不通过计数的方法对nn元条件概率进行估计,而是直接通过一个神经网络对其建模求解。

用途:

1、决定哪一个词序列的可能性更大

2、已知若干个词,预测下一个词

例子:

1、I went to a party.

Eye went two a bar tea.

2、你现在在干什么?

责任编辑:梁菲 来源: 互联网
相关推荐

2021-05-06 11:13:06

人工智能语音识别

2021-12-24 10:34:11

鸿蒙HarmonyOS应用

2022-12-01 07:03:22

语音识别人工智能技术

2017-03-20 10:14:03

语音识别匹配算法模型

2023-07-06 08:41:20

TTS​Mac​系统

2022-09-08 19:09:02

人工智能语音命令

2020-09-21 07:00:00

语音识别AI人工智能

2022-09-08 14:19:34

人工智能智能家居智能家电

2019-05-21 09:53:57

机器人

2018-06-14 09:52:03

2011-05-31 16:38:47

Android 实现语音

2016-02-17 10:39:18

语音识别语音合成语音交互

2017-03-20 16:42:00

语音识别数据库人工智能

2021-07-28 21:42:32

人工智能AI

2022-11-03 16:31:08

语音智能语音识别

2011-01-18 11:52:25

Linux语音识别

2009-07-21 15:28:06

Windows Emb

2022-08-30 15:26:07

AI语音识别

2022-09-14 17:53:45

ASR技术领域
点赞
收藏

51CTO技术栈公众号