“语音信号数字处理”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
语音信号数字处理(Speech Signal Digital Processing)(计算机系)
授课老师
 
(3位用户的17个中间修订版本未显示)
第1行: 第1行:
 
== 语音信号数字处理(Speech Signal Digital Processing) ==
 
== 语音信号数字处理(Speech Signal Digital Processing) ==
授课对象:研究生选修课(计算机系)<br/>
 
<br/>
 
授课老师:郑方<br/>
 
<br/>
 
内容简介:<br/>
 
<br/>
 
《语音信号数字处理》主要介绍语音信号处理的基本概念及基本方法,内容包括:语音信号处理的基础知识,语音的产生机理与生成模型,线性预测编码,特征提取(包括倒谱系数和线谱对),矢量量化和聚类算法,隐马尔可夫模型(HMM)等,还包括如何利用上述基本知识和方法搭建特定人孤立词识别系统、连续语音识别系统等的方法,以及大词汇连续语音识别中所涉及到的声学模型、语言模型和搜索算法等。
 
  
== 语音信号数字处理(Speech Signal Digital Processing)(电子工程系) ==
+
===授课对象:研究生选修课(计算机系)===
授课对象:电子信息工程高年级本科生、信号与信息处理专业研究生<br/>
+
 
<br/>
+
===授课老师===
授课老师:肖熙<br/>
+
 
<br/>
+
[http://166.111.134.30/~fzheng 郑方]研究员
学时:32<br/>
+
 
<br/>
+
[http://wangd.cslt.org 王东] 副研究员
学分:2<br/>
+
 
<br/>
+
===内容简介===
选课指导:(1)数字信号处理 信号的短时分析技术;取样Z变换;(2)随机过程 马尔可夫过程。<br/>
+
 
<br/>
+
《语音信号数字处理》主要介绍语音信号处理的基本概念及基本方法,内容包括:语音信号处理的基础知识,语音的产生机理与生成模型,线性预测编码,特征提取(包括倒谱系数和线谱对),矢量量化和聚类算法,隐马尔可夫模型(HMM)等。我们还将讨论语音识别、说话人识别及语音合成方向的前沿方法和技术。
内容简介:<br/>
+
 
<br/>《语音信号数字处理》内容包括介绍语音信号的基本特征和语音的产生模型,重点讲授如何利用数字信号处理技术进行语音特征的分析提取。在此基础上讲授常用的语音编码技术和语音识别技术。通过本课程的学习,学生应<br/>
+
===2018年春季学期课表===
(1)了解语音信号的基本特征和产生原理<br/>
+
 
(2)掌握语音信号分析技术<br/>
+
<pre>
(3)了解掌握语音信号编码技术<br/>
+
周次 日期 主讲 教学内容 备注
(4)了解掌握语音识别技术<br/>
+
1 2018/02/26 郑方 第1章-绪论;第2章-语音产生机理与语音生成模型
<br/>
+
2 2018/03/05 郑方 第3章-语音的线性预测编码; 第4章-倒谱和线谱对
授课进度安排:<br/>
+
3 2018/03/12 王东 第5章-静态语音信号分析(1) PCA, NMF及信号分离
第一章:语音信号的时域及频域特征(2学时)<br/>
+
4 2018/03/19 王东 第6章-静态语音信号分析(2) GMM,SVM及神经网络
第二章:语音信号的产生模型—声管模型(2学时)<br/>
+
5 2018/03/26 郑方 第7章-动态语音信号分析-DTW动态时间匹配;HMM模型基础
第三章:语音信号的同态处理技术(3学时)<br/>
+
6 2018/04/02 郑方 第8章-HMM 高级话题; 孤立词语音识别系统
第四章:语音信号的线性预测编码技术(4学时)<br/>
+
7 2018/04/09 王东 第9章-现代语音识别技术 (1)
第五章:人耳的听觉系统(2学时)<br/>
+
8 2018/04/16 王东 第10章-现代语音识别技术 (2)
第六章:语音信号的波形编码(4学时)<br/>
+
9 2018/04/23 王东 第11章-现代说话人识别技术 (1)
第七章:语音信号的参数编码(4学时)<br/>
+
10 2018/04/30 《五一节假期》
第八章:语音识别技术(8学时)<br/>
+
11 2018/05/07 王东 第12章-现代说话人识别技术 (2)
第九章:总结(3学时)<br/>
+
12 2018/05/14 王东 第13章-现代语音合成技术 (1)
<br/>
+
13 2018/05/21 王东 第14章-现代语音合成技术 (2)
考核评定方法:<br/>
+
14 2018/05/28 外请报告 讲座
<br/>
+
15 2018/06/04 外请报告 讲座
通过对这门课程的学习,学生应该了解语音信号的基本特征和处理方法,能够掌握语音编码和语音识别专业的基础理论知识,了解本专业的最新发展动向,为进一步的专业研究奠定必要的基础知识。<br/>
+
16 2018/06/11 实验一 实验
+
17 2018/06/18 《端午节假期》
教材及参考书:<br/>
+
18 2018/06/25 实验二 实验
<br/>
+
 
(1)杨行峻,迟惠生等,《语音信号数字处理》 ,电子工业出版社,1995年<br/>
+
</pre>
(2)[美] Thomas F. Quatieri 著,赵胜辉等译,离散时间语音信号处理-原理与应用,电子工业出版社,2004,8<br/>
+
 
(3)L.R.Rabiner, ”Fundamentals of Speech Recognition” Prentic-Hall,Inc. (影印版,清华大学出版社,1999,8)<br/>
+
 
(4)J.D. Markel and Jr A.H.Gray,”Linear Prediction of Speech”,Springer-Verlag,1976<br/>
+
===教材及参考书===
(5)姚天任,“数字语音处理”,华中理工大学出版社,1992,4<br/>
+
 
 +
* 现代机器学习技术导论,王东(http://166.111.134.30/mediawiki/index.php/Machine_Learning_Book)
 +
* Spring Handbook of Speech Processing, Ed. Jacob Benesty, M. Mohan Sondhi, Yiteng Huang
 +
* Spoken Language Processing, X.D. Huang,
 +
* Introduction to Digital Signal Processing, Lawrence R. Rabiner and Ronald W. Schafer
 +
* Spring Topics in Signal Processing, Microphone Array Processing, Benesty, J.; Chen, J.; Huang, Y

2022年8月15日 (一) 07:02的最后版本

语音信号数字处理(Speech Signal Digital Processing)

授课对象:研究生选修课(计算机系)

授课老师

郑方研究员

王东 副研究员

内容简介

《语音信号数字处理》主要介绍语音信号处理的基本概念及基本方法,内容包括:语音信号处理的基础知识,语音的产生机理与生成模型,线性预测编码,特征提取(包括倒谱系数和线谱对),矢量量化和聚类算法,隐马尔可夫模型(HMM)等。我们还将讨论语音识别、说话人识别及语音合成方向的前沿方法和技术。

2018年春季学期课表

周次	日期	主讲	教学内容	备注
1	2018/02/26	郑方	第1章-绪论;第2章-语音产生机理与语音生成模型	
2	2018/03/05	郑方	第3章-语音的线性预测编码; 第4章-倒谱和线谱对	
3	2018/03/12	王东	第5章-静态语音信号分析(1) PCA, NMF及信号分离	
4	2018/03/19	王东	第6章-静态语音信号分析(2) GMM,SVM及神经网络	
5	2018/03/26	郑方	第7章-动态语音信号分析-DTW动态时间匹配;HMM模型基础	
6	2018/04/02	郑方	第8章-HMM 高级话题; 孤立词语音识别系统	
7	2018/04/09	王东	第9章-现代语音识别技术 (1)	
8	2018/04/16	王东	第10章-现代语音识别技术 (2)	
9	2018/04/23	王东	第11章-现代说话人识别技术 (1)	
10	2018/04/30		《五一节假期》	
11	2018/05/07	王东	第12章-现代说话人识别技术 (2)	
12	2018/05/14	王东	第13章-现代语音合成技术 (1)	
13	2018/05/21	王东	第14章-现代语音合成技术 (2)	
14	2018/05/28		外请报告	讲座
15	2018/06/04		外请报告	讲座
16	2018/06/11		实验一	实验
17	2018/06/18		《端午节假期》	
18	2018/06/25		实验二	实验


教材及参考书

  • 现代机器学习技术导论,王东(http://166.111.134.30/mediawiki/index.php/Machine_Learning_Book)
  • Spring Handbook of Speech Processing, Ed. Jacob Benesty, M. Mohan Sondhi, Yiteng Huang
  • Spoken Language Processing, X.D. Huang,
  • Introduction to Digital Signal Processing, Lawrence R. Rabiner and Ronald W. Schafer
  • Spring Topics in Signal Processing, Microphone Array Processing, Benesty, J.; Chen, J.; Huang, Y