“Xingsong-meeting-minutues-2016-04-6”版本间的差异
来自cslt Wiki
(相同用户的3个中间修订版本未显示) | |||
第5行: | 第5行: | ||
1. 数据准备 | 1. 数据准备 | ||
− | # | + | #安静环境下数据采集完成 |
+ | #第一批带噪环境数据采集完成 | ||
#麦克风阵列采集开始准备 | #麦克风阵列采集开始准备 | ||
第11行: | 第12行: | ||
2. 基线系统 | 2. 基线系统 | ||
− | # | + | #安静环境下数据测试完成。识别率92%以上。 |
− | # | + | #第一批带噪环境数据测试完成。识别率极低。 |
+ | #需要麦克风阵列支持 | ||
3. 麦克风阵列研究 | 3. 麦克风阵列研究 | ||
第49行: | 第51行: | ||
*word-based confidence | *word-based confidence | ||
− | === | + | ===麦克风阵列数据录制=== |
#录音方案设计 (捷通)[2016-04-07 完成] | #录音方案设计 (捷通)[2016-04-07 完成] | ||
#录音 (清华,新松)[2016-04-08完成第一批] | #录音 (清华,新松)[2016-04-08完成第一批] |
2016年4月6日 (三) 02:53的最后版本
项目进展
语音识别系统
1. 数据准备
- 安静环境下数据采集完成
- 第一批带噪环境数据采集完成
- 麦克风阵列采集开始准备
2. 基线系统
- 安静环境下数据测试完成。识别率92%以上。
- 第一批带噪环境数据测试完成。识别率极低。
- 需要麦克风阵列支持
3. 麦克风阵列研究
- 等待第一次真实数据录音测试
4. 模型适应
- 第一批LM自适应完成
语义理解系统
- 数据收集与梳理完成
- 语义理解,对话管理模块完成
- 语音容错对应处理开始
系统实现
- 系统移植完成
- 模型裁剪未验证
- 接口设计完成
工作计划
ASR/NLP 接口数据
定义数据结构格式如下:
- n-best word
- n-best phone
- phone-based confidence
- syllable-based confidence
- word-based confidence
麦克风阵列数据录制
- 录音方案设计 (捷通)[2016-04-07 完成]
- 录音 (清华,新松)[2016-04-08完成第一批]