“第二十五章 语音识别”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
(以“ ==教学资料== *教学参考 *[http://aigraph.cslt.org/courses/25/course-25.pptx 课件] *小清爱提问:深度伪造技术的原理是什...”为内容创建页面)
 
演示链接
 
(相同用户的12个中间修订版本未显示)
第4行: 第4行:
 
*[[教学参考-25|教学参考]]
 
*[[教学参考-25|教学参考]]
 
*[http://aigraph.cslt.org/courses/25/course-25.pptx 课件]
 
*[http://aigraph.cslt.org/courses/25/course-25.pptx 课件]
*小清爱提问:深度伪造技术的原理是什么[https://mp.weixin.qq.com/s?__biz=Mzk0NjIzMzI2MQ==&mid=2247487142&idx=1&sn=d0431d7c5a0b95f6cbe3b77fae835fa7&chksm=c3080464f47f8d72691805bc7578dbbe3a0a8777f2aca07167bcb48cf47d198a8d2d87e1fffe&scene=178#rd]
+
*小清爱提问:语音助手是怎么听懂人说话的?[https://mp.weixin.qq.com/s?__biz=Mzk0NjIzMzI2MQ==&mid=2247485152&idx=1&sn=332824dfc11da7c22149c96a9ad61937&chksm=c3080c22f47f853442100128ff2aec9db579fa944d2a72d64efb2952a5f249765746efe5f9b4&scene=178#rd]
 
+
 
+
  
 
==扩展阅读==
 
==扩展阅读==
  
* AI100问:深度伪造技术的原理是什么[http://aigraph.cslt.org/ai100/AI-100-99-深度伪造.pdf]
+
* AI100问:语音助手是怎么听懂人说话的 [http://aigraph.cslt.org/ai100/AI-100-01-语音助手是怎么听懂人说话的.pdf]
 +
* 陈孝良,语音识别简史 [https://zhuanlan.zhihu.com/p/82872145]
  
 +
==视频展示==
  
==视频展示==
+
* 洞箫展示[http://aigraph.cslt.org/courses/25/洞箫.mp4]
 +
* ASR on elevator[http://aigraph.cslt.org/courses/25/elevator.mp4]
 +
* 语音识别那些让人崩溃的瞬间[http://aigraph.cslt.org/courses/25/anjixing.mp4]
 +
* 吹瓶子为啥会发声?用边棱振荡原理制作风螺报警器 [https://www.163.com/v/video/VQOD0RSD2.html]
  
  
 
==演示链接==
 
==演示链接==
  
 +
* 在线频谱生成 [https://bvews.jpn.org/materials/online-audio-spectrogram-viewer/]
 +
* IBM 在线演示系统 [https://www.ibm.com/demos/live/speech-to-text/self-service/home]
 +
* Google [*][https://www.google.com/intl/en/chrome/demos/speech.html]
 +
* Picovoice [https://picovoice.ai/demos/]
  
 
==开发者资源==
 
==开发者资源==
  
 +
* Kaldi语音识别开发工具 [https://github.com/kaldi-asr/kaldi]
 +
* SpeechBrain [https://speechbrain.github.io/]
 +
* SpeechBrain on Huggingface [https://huggingface.co/speechbrain]
  
  

2023年8月13日 (日) 02:04的最后版本


教学资料

扩展阅读

  • AI100问:语音助手是怎么听懂人说话的 [2]
  • 陈孝良,语音识别简史 [3]

视频展示

  • 洞箫展示[4]
  • ASR on elevator[5]
  • 语音识别那些让人崩溃的瞬间[6]
  • 吹瓶子为啥会发声?用边棱振荡原理制作风螺报警器 [7]


演示链接

  • 在线频谱生成 [8]
  • IBM 在线演示系统 [9]
  • Google [*][10]
  • Picovoice [11]

开发者资源

  • Kaldi语音识别开发工具 [12]
  • SpeechBrain [13]
  • SpeechBrain on Huggingface [14]


高级读者

  • 汤志远,李蓝天,王东,石颖,蔡云麒,郑方,《语音识别基本法》,清华大学出牌社,2021. [15]
  • Dong Yu, Li Deng, Automatic speech recognition, Springer, [16]