“第二十五章语音识别”版本间的差异

2023年8月13日 (日) 02:04的最后版本

教学资料

教学参考
课件
小清爱提问：语音助手是怎么听懂人说话的？[1]

扩展阅读

AI100问：语音助手是怎么听懂人说话的 [2]
陈孝良，语音识别简史 [3]

视频展示

洞箫展示[4]
ASR on elevator[5]
语音识别那些让人崩溃的瞬间[6]
吹瓶子为啥会发声？用边棱振荡原理制作风螺报警器 [7]

演示链接

在线频谱生成 [8]
IBM 在线演示系统 [9]
Google [*][10]
Picovoice [11]

开发者资源

Kaldi语音识别开发工具 [12]
SpeechBrain [13]
SpeechBrain on Huggingface [14]

高级读者

汤志远，李蓝天，王东，石颖，蔡云麒，郑方，《语音识别基本法》，清华大学出牌社，2021. [15]
Dong Yu, Li Deng, Automatic speech recognition, Springer, [16]

@@ 第4行： / 第4行： @@
 *[[教学参考-25|教学参考]]
 *[http://aigraph.cslt.org/courses/25/course-25.pptx 课件]
-*小清爱提问：深度伪造技术的原理是什么[https://mp.weixin.qq.com/s?__biz=Mzk0NjIzMzI2MQ==&mid=2247487142&idx=1&sn=d0431d7c5a0b95f6cbe3b77fae835fa7&chksm=c3080464f47f8d72691805bc7578dbbe3a0a8777f2aca07167bcb48cf47d198a8d2d87e1fffe&scene=178#rd]
+*小清爱提问：语音助手是怎么听懂人说话的？[https://mp.weixin.qq.com/s?__biz=Mzk0NjIzMzI2MQ==&mid=2247485152&idx=1&sn=332824dfc11da7c22149c96a9ad61937&chksm=c3080c22f47f853442100128ff2aec9db579fa944d2a72d64efb2952a5f249765746efe5f9b4&scene=178#rd]
 ==扩展阅读==
-* AI100问：深度伪造技术的原理是什么[http://aigraph.cslt.org/ai100/AI-100-99-深度伪造.pdf]
+* AI100问：语音助手是怎么听懂人说话的 [http://aigraph.cslt.org/ai100/AI-100-01-语音助手是怎么听懂人说话的.pdf]
+* 陈孝良，语音识别简史 [https://zhuanlan.zhihu.com/p/82872145]
+==视频展示==
-==视频展示==
+* 洞箫展示[http://aigraph.cslt.org/courses/25/洞箫.mp4]
+* ASR on elevator[http://aigraph.cslt.org/courses/25/elevator.mp4]
+* 语音识别那些让人崩溃的瞬间[http://aigraph.cslt.org/courses/25/anjixing.mp4]
+* 吹瓶子为啥会发声？用边棱振荡原理制作风螺报警器 [https://www.163.com/v/video/VQOD0RSD2.html]
 ==演示链接==
+* 在线频谱生成 [https://bvews.jpn.org/materials/online-audio-spectrogram-viewer/]
+* IBM 在线演示系统 [https://www.ibm.com/demos/live/speech-to-text/self-service/home]
+* Google [*][https://www.google.com/intl/en/chrome/demos/speech.html]
+* Picovoice [https://picovoice.ai/demos/]
 ==开发者资源==
+* Kaldi语音识别开发工具 [https://github.com/kaldi-asr/kaldi]
+* SpeechBrain [https://speechbrain.github.io/]
+* SpeechBrain on Huggingface [https://huggingface.co/speechbrain]

“第二十五章语音识别”版本间的差异

2023年8月13日 (日) 02:04的最后版本

目录

教学资料

扩展阅读

视频展示

演示链接

开发者资源

高级读者

导航菜单

个人工具

名字空间

变种

查看

操作

搜索

导航

工具

“第二十五章 语音识别”版本间的差异

2023年8月13日 (日) 02:04的最后版本

目录

教学资料

扩展阅读

视频展示

演示链接

开发者资源

高级读者

导航菜单

搜索

“第二十五章语音识别”版本间的差异