“第二十五章 语音识别”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
第17行: 第17行:
  
 
==演示链接==
 
==演示链接==
 +
 +
* 在线频谱生成 [https://bvews.jpn.org/materials/online-audio-spectrogram-viewer/]
 +
* IBM 在线演示系统 [https://speech-to-text-demo.ng.bluemix.net/]
 +
  
  
 
==开发者资源==
 
==开发者资源==
  
 +
* Kaldi语音识别开发工具 [https://github.com/kaldi-asr/kaldi]
 +
* SpeechBrain [https://speechbrain.github.io/]
 +
* Huggingface speech2txt [https://huggingface.co/docs/transformers/model_doc/speech_to_text]
  
  

2022年8月11日 (四) 08:42的版本


教学资料

扩展阅读

  • AI100问:语音助手是怎么听懂人说话的 [2]


视频展示

  • 洞箫展示[3]


演示链接

  • 在线频谱生成 [4]
  • IBM 在线演示系统 [5]


开发者资源

  • Kaldi语音识别开发工具 [6]
  • SpeechBrain [7]
  • Huggingface speech2txt [8]


高级读者

  • 汤志远,李蓝天,王东,石颖,蔡云麒,郑方,《语音识别基本法》,清华大学出牌社,2021. [9]
  • Dong Yu, Li Deng, Automatic speech recognition, Springer, [10]