“第二十七章 语音合成”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
第7行: 第7行:
  
 
* AI100问:甜美的导航声音是如何产生的?  [http://aigraph.cslt.org/ai100/AI-100-63-甜美的导航声音是如何产生的.pdf]
 
* AI100问:甜美的导航声音是如何产生的?  [http://aigraph.cslt.org/ai100/AI-100-63-甜美的导航声音是如何产生的.pdf]
 
+
* 维基百科:语音合成 [http://aigraph.cslt.org/courses/27/Speech_synthesis.pdf]
 +
* 维基百科:声码器 [http://aigraph.cslt.org/courses/27/聲碼器.pdf][http://aigraph.cslt.org/courses/27/Vocoder.pdf]
  
 
==视频展示==
 
==视频展示==
第14行: 第15行:
 
* Vocoder 1939 (long) [http://aigraph.cslt.org/courses/27/vocoder-1939.mp4]
 
* Vocoder 1939 (long) [http://aigraph.cslt.org/courses/27/vocoder-1939.mp4]
 
* Vocoder 1939 (short) [http://aigraph.cslt.org/courses/27/vocoder-short.mp4]
 
* Vocoder 1939 (short) [http://aigraph.cslt.org/courses/27/vocoder-short.mp4]
 
+
* Vocal folder [http://aigraph.cslt.org/courses/27/vocalfolder.mp4]
 +
* Vocal tract [http://aigraph.cslt.org/courses/27/vocaltract.mp4]
 +
* Auditory perception [http://aigraph.cslt.org/courses/27/hearing.mp4]
  
 
==演示链接==
 
==演示链接==

2022年8月12日 (五) 03:28的版本

教学资料

扩展阅读

  • AI100问:甜美的导航声音是如何产生的? [2]
  • 维基百科:语音合成 [3]
  • 维基百科:声码器 [4][5]

视频展示

  • 源-滤波器模型 [6]
  • Vocoder 1939 (long) [7]
  • Vocoder 1939 (short) [8]
  • Vocal folder [9]
  • Vocal tract [10]
  • Auditory perception [11]

演示链接

  • Tacotron2 [12]
  • CycleFlow 语音转换 [13]
  • Online demo for TTS and Voice conversion [14]
  • Online TTS demo [15]
  • IBM TTS demo [16]

开发者资源

  • CodePen Web demo for TTS [17]
  • Simple HTML code [18]
  • NVIDIA Tacotron2 [19]


高级读者

  • 汤志远,李蓝天,王东,石颖,蔡云麒,郑方,《语音识别基本法》,清华大学出牌社,2021. [20]
  • Ning Y, He S, Wu Z, et al. A review of deep learning based speech synthesis[J]. Applied Sciences, 2019, 9(19): 4050. [21]
  • Zen H, Tokuda K, Black A W. Statistical parametric speech synthesis[J]. speech communication, 2009, 51(11): 1039-1064. [22]