“Xingsong-meeting-minutues-2016-05-12”版本间的差异
来自cslt Wiki
(以“==项目进展== ===语音识别系统=== 1. 数据准备 #麦克风阵列采集完成三轮 #标注与切分方法确定 2. 基线系统 #基线识别系统...”为内容创建页面) |
|||
第14行: | 第14行: | ||
− | 3. 麦克风阵列研究 | + | 3. 麦克风阵列研究[http://192.168.0.51:5555/cgi-bin/cvss/cvss_request.pl?account=wangd&step=view_request&cvssid=529] |
*缺省beamforming | *缺省beamforming |
2016年5月11日 (三) 12:00的版本
项目进展
语音识别系统
1. 数据准备
- 麦克风阵列采集完成三轮
- 标注与切分方法确定
2. 基线系统
- 基线识别系统完成
3. 麦克风阵列研究[1]
- 缺省beamforming
- Beamforming算法研究
- delay & sum (DS)
- super direction (SD)
- MVDR
- DAE算法
- 多信道DAE算法
4. 模型适应
- 字模型+领域相关词模型测试完成,识别结果与大规模词模型相似
语义理解系统
- 数据收集与梳理完成
- 语义理解,对话管理模块完成
- 语音容错对应处理开始
系统实现
- 系统移植完成
- 模型裁剪未验证
- 接口设计完成
5月工作计划
ASR系统性能优化(CSLT)
- beamforming数据采集
- noisy training
- dark knowledge training
- multi-channel DNN training
- similar-pair LM
基于ASR的NLP实验
- example output generation (Sion + CSLT)
- ASR-oriented NLP (CS)
系统集成
- prototype system with NLP (Sino+CS)