“第二十五章 语音识别”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
第22行: 第22行:
 
* 在线频谱生成 [https://bvews.jpn.org/materials/online-audio-spectrogram-viewer/]
 
* 在线频谱生成 [https://bvews.jpn.org/materials/online-audio-spectrogram-viewer/]
 
* IBM 在线演示系统 [https://speech-to-text-demo.ng.bluemix.net/]
 
* IBM 在线演示系统 [https://speech-to-text-demo.ng.bluemix.net/]
 
+
* Google [https://www.google.com/intl/en/chrome/demos/speech.html]
  
  

2022年8月11日 (四) 14:28的版本


教学资料

扩展阅读

  • AI100问:语音助手是怎么听懂人说话的 [2]
  • 陈孝良,语音识别简史 [3]

视频展示

  • 洞箫展示[4]
  • ASR on elevator[5]
  • 语音识别那些让人崩溃的瞬间[6]


演示链接

  • 在线频谱生成 [7]
  • IBM 在线演示系统 [8]
  • Google [9]


开发者资源

  • Kaldi语音识别开发工具 [10]
  • SpeechBrain [11]
  • SpeechBrain on Huggingface [12]


高级读者

  • 汤志远,李蓝天,王东,石颖,蔡云麒,郑方,《语音识别基本法》,清华大学出牌社,2021. [13]
  • Dong Yu, Li Deng, Automatic speech recognition, Springer, [14]