News-2021-03-12

来自cslt Wiki
跳转至: 导航搜索

近日,清华大学北京信息科学与技术国家研究中心语音和语言技术团队撰写的《语音识别基本法》一书由电子工业出版社出版,张景中院士为该书做序。目前,该书已在京东、当当、天猫等各大网站上架销售。

微信图片 20210313124740.png

全书共256页,约30万字,共13章。本书结合当下使用广泛的Kaldi语音平台,对语音识别的基本概念和流程进行了详细讲解,包括 GMM-HMM、DNN-HMM、端到端等常用结构,并探讨了语音识别在实际应用中的诸多问题,包括说话人自适应、环境鲁棒性、小语种语音识别、关键词识别与嵌入式应用等方面;同时,本书还对语音技术的相关前沿课题进行了介绍,包括说话人识别、语种识别、情绪识别、语音合成等方向。

本书由汤志远博士主笔,王东教授、李蓝天博士、石颖博士等参与撰写,蔡云麒博士和郑方教授指导校正。本书既可以作为语音识别初学者的入门读物,也可以作为相关领域技术人员拓展视野的参考书。