老河口市建设局网站,网站切换,网站建设广州,深圳高速建设有限公司一、Model
1、将声学特征设为X#xff0c;经过语音识别得到的tokens设为Y#xff0c;目标是找到通过X得到Y的最大概率#xff0c;可以通过概率公式改变为 分为两个概率 2、将tokens序列Y转化为states序列S#xff0c;声学特征分得更细 3、从states到声学特征的过程 二、HM…一、Model
1、将声学特征设为X经过语音识别得到的tokens设为Y目标是找到通过X得到Y的最大概率可以通过概率公式改变为 分为两个概率 2、将tokens序列Y转化为states序列S声学特征分得更细 3、从states到声学特征的过程 二、HMM中从P(X|Y) - P(X|S)
1、Transition Probability从一个state转化为别的state的可能性 2、Emission Probability前提是人在发每一个state时都有固定概率的声音信号 3、最终形态为Subspace GMM所有的state共用一个Gaussian Mixture池 三、alignment
1、用于计算Emission概率 2、穷举所有alignment序列 3、计算 四、DL用于语音识别
1、Tandem语音辨识HMM系统不变唯一变化的是使用DNNstate classifer给我们比较好的state从声学特征到state其他不变 2、DNN-HMM Hybrid
1将Gaussian Mixture Model使用DNN取代掉也就是将得到P(x|a)转化为P(a|x)。 2通过概率公式转化 3train state classifier
a、使用DNN-HMM Hybrid得出state与声学特征对应的最大概率关系 b、有了对应关系可以训练classifierDNN c、如果想要更精确可以使用训练出来的更精确的classifier作为寻找state与声学特征对应关系的Model训练处DNN2。