“第二十七章 语音合成”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
(以“==教学资料== *教学参考 *[http://aigraph.cslt.org/courses/27/course-27.pptx 课件] *小清爱提问:机器如何实现听音辨人?[h...”为内容创建页面)
 
第2行: 第2行:
 
*[[教学参考-27|教学参考]]
 
*[[教学参考-27|教学参考]]
 
*[http://aigraph.cslt.org/courses/27/course-27.pptx 课件]
 
*[http://aigraph.cslt.org/courses/27/course-27.pptx 课件]
*小清爱提问:机器如何实现听音辨人?[https://mp.weixin.qq.com/s?__biz=Mzk0NjIzMzI2MQ==&mid=2247485682&idx=1&sn=72eeae525de825213a82c944f8c62eb4&chksm=c3080230f47f8b265bc5692059c50cdefe73c5303c022b7cc79707d5ce8cbd6488d0a098a47f&scene=178#rd]
+
*小清爱提问:甜美的导航声音是如何产生的? [https://mp.weixin.qq.com/s?__biz=Mzk0NjIzMzI2MQ==&mid=2247486095&idx=1&sn=e77d712f5810f95c3f02689aea45bf69&chksm=c308004df47f895b2ad764b0c297031f5f1c917cfbedd2c08a8c796823f758fbbe2f3b5ab120&scene=178#rd]
  
 
==扩展阅读==
 
==扩展阅读==
  
* AI100问:机器如何实现听音辨人? [http://aigraph.cslt.org/]
+
* AI100问:甜美的导航声音是如何产生的?  [http://aigraph.cslt.org/ai100/AI-100-63-甜美的导航声音是如何产生的.pdf]
 +
 
  
 
==视频展示==
 
==视频展示==
第17行: 第18行:
 
==演示链接==
 
==演示链接==
  
 
+
* Tacotron2 [https://google.github.io/tacotron/publications/tacotron2/]
 +
* CycleFlow 语音转换 [http://cycleflow.cslt.org]
 +
* Online demo for TTS and Voice conversion [https://candyvoice.com/demos/voice-conversion?lang=en]
 +
* Online TTS demo [https://eeejay.github.io/webspeechdemos/]
 +
* IBM TTS demo [https://www.ibm.com/demos/live/tts-demo/self-service]
  
 
==开发者资源==
 
==开发者资源==
 +
 +
* CodePen Web demo for TTS [https://codepen.io/matt-west/pen/wGzuJ]
 +
* Simple HTML code [https://embed.plnkr.co/WjmlDnxcXX5dqlQI/]
 +
* NVIDIA Tacotron2 [https://github.com/NVIDIA/tacotron2]
  
  
第26行: 第35行:
  
 
* 汤志远,李蓝天,王东,石颖,蔡云麒,郑方,《语音识别基本法》,清华大学出牌社,2021. [https://item.jd.com/13143784.html]
 
* 汤志远,李蓝天,王东,石颖,蔡云麒,郑方,《语音识别基本法》,清华大学出牌社,2021. [https://item.jd.com/13143784.html]
 +
* Ning Y, He S, Wu Z, et al. A review of deep learning based speech synthesis[J]. Applied Sciences, 2019, 9(19): 4050. [https://www.mdpi.com/2076-3417/9/19/4050/pdf]
 +
* Zen H, Tokuda K, Black A W. Statistical parametric speech synthesis[J]. speech communication, 2009, 51(11): 1039-1064. [https://nitech.repo.nii.ac.jp/index.php?action=pages_view_main&active_action=repository_action_common_download&item_id=5432&item_no=1&attribute_id=39&file_no=1&page_id=13&block_id=21]

2022年8月12日 (五) 03:19的版本

教学资料

扩展阅读

  • AI100问:甜美的导航声音是如何产生的? [2]


视频展示

  • 源-滤波器模型 [3]
  • Vocoder 1939 (long) [4]
  • Vocoder 1939 (short) [5]


演示链接

  • Tacotron2 [6]
  • CycleFlow 语音转换 [7]
  • Online demo for TTS and Voice conversion [8]
  • Online TTS demo [9]
  • IBM TTS demo [10]

开发者资源

  • CodePen Web demo for TTS [11]
  • Simple HTML code [12]
  • NVIDIA Tacotron2 [13]


高级读者

  • 汤志远,李蓝天,王东,石颖,蔡云麒,郑方,《语音识别基本法》,清华大学出牌社,2021. [14]
  • Ning Y, He S, Wu Z, et al. A review of deep learning based speech synthesis[J]. Applied Sciences, 2019, 9(19): 4050. [15]
  • Zen H, Tokuda K, Black A W. Statistical parametric speech synthesis[J]. speech communication, 2009, 51(11): 1039-1064. [16]