语音信号数字处理

来自cslt Wiki
2014年8月22日 (五) 11:38Cslt讨论 | 贡献的版本

跳转至: 导航搜索

语音信号数字处理(Speech Signal Digital Processing)

授课对象:研究生选修课(计算机系)

授课老师:郑方

内容简介:

《语音信号数字处理》主要介绍语音信号处理的基本概念及基本方法,内容包括:语音信号处理的基础知识,语音的产生机理与生成模型,线性预测编码,特征提取(包括倒谱系数和线谱对),矢量量化和聚类算法,隐马尔可夫模型(HMM)等,还包括如何利用上述基本知识和方法搭建特定人孤立词识别系统、连续语音识别系统等的方法,以及大词汇连续语音识别中所涉及到的声学模型、语言模型和搜索算法等。


通过对这门课程的学习,学生应该了解语音信号的基本特征和处理方法,能够掌握语音编码和语音识别专业的基础理论知识,了解本专业的最新发展动向,为进一步的专业研究奠定必要的基础知识。

教材及参考书:

(1)杨行峻,迟惠生等,《语音信号数字处理》 ,电子工业出版社,1995年
(2)[美] Thomas F. Quatieri 著,赵胜辉等译,离散时间语音信号处理-原理与应用,电子工业出版社,2004,8
(3)L.R.Rabiner, ”Fundamentals of Speech Recognition” Prentic-Hall,Inc. (影印版,清华大学出版社,1999,8)
(4)J.D. Markel and Jr A.H.Gray,”Linear Prediction of Speech”,Springer-Verlag,1976
(5)姚天任,“数字语音处理”,华中理工大学出版社,1992,4