第二十七章 语音合成

来自cslt Wiki
2022年8月12日 (五) 03:19Cslt讨论 | 贡献的版本

跳转至: 导航搜索

教学资料

扩展阅读

  • AI100问:甜美的导航声音是如何产生的? [2]


视频展示

  • 源-滤波器模型 [3]
  • Vocoder 1939 (long) [4]
  • Vocoder 1939 (short) [5]


演示链接

  • Tacotron2 [6]
  • CycleFlow 语音转换 [7]
  • Online demo for TTS and Voice conversion [8]
  • Online TTS demo [9]
  • IBM TTS demo [10]

开发者资源

  • CodePen Web demo for TTS [11]
  • Simple HTML code [12]
  • NVIDIA Tacotron2 [13]


高级读者

  • 汤志远,李蓝天,王东,石颖,蔡云麒,郑方,《语音识别基本法》,清华大学出牌社,2021. [14]
  • Ning Y, He S, Wu Z, et al. A review of deep learning based speech synthesis[J]. Applied Sciences, 2019, 9(19): 4050. [15]
  • Zen H, Tokuda K, Black A W. Statistical parametric speech synthesis[J]. speech communication, 2009, 51(11): 1039-1064. [16]