Xingsong-meeting-minutues-2016-04-6
来自cslt Wiki
项目进展
语音识别系统
1. 数据准备
- 安静环境下数据采集完成
- 第一批带噪环境数据采集完成
- 麦克风阵列采集开始准备
2. 基线系统
- clean数据测试完成。识别率92%以上。
- 第一批带噪环境数据测试完成。识别率极低。
- 需要麦克风阵列支持
3. 麦克风阵列研究
- 等待第一次真实数据录音测试
4. 模型适应
- 第一批LM自适应完成
语义理解系统
- 数据收集与梳理完成
- 语义理解,对话管理模块完成
- 语音容错对应处理开始
系统实现
- 系统移植完成
- 模型裁剪未验证
- 接口设计完成
工作计划
ASR/NLP 接口数据
定义数据结构格式如下:
- n-best word
- n-best phone
- phone-based confidence
- syllable-based confidence
- word-based confidence
麦克风阵列数据录制
- 录音方案设计 (捷通)[2016-04-07 完成]
- 录音 (清华,新松)[2016-04-08完成第一批]