“Xingsong-meeting-minutues-2016-04-6”版本间的差异
来自cslt Wiki
(相同用户的7个中间修订版本未显示) | |||
第5行: | 第5行: | ||
1. 数据准备 | 1. 数据准备 | ||
− | # | + | #安静环境下数据采集完成 |
+ | #第一批带噪环境数据采集完成 | ||
#麦克风阵列采集开始准备 | #麦克风阵列采集开始准备 | ||
第11行: | 第12行: | ||
2. 基线系统 | 2. 基线系统 | ||
− | # | + | #安静环境下数据测试完成。识别率92%以上。 |
+ | #第一批带噪环境数据测试完成。识别率极低。 | ||
+ | #需要麦克风阵列支持 | ||
3. 麦克风阵列研究 | 3. 麦克风阵列研究 | ||
第24行: | 第27行: | ||
===语义理解系统=== | ===语义理解系统=== | ||
− | # | + | #数据收集与梳理完成 |
#语义理解,对话管理模块完成 | #语义理解,对话管理模块完成 | ||
#语音容错对应处理开始 | #语音容错对应处理开始 | ||
第34行: | 第37行: | ||
#系统移植完成 | #系统移植完成 | ||
#模型裁剪未验证 | #模型裁剪未验证 | ||
− | + | #接口设计完成 | |
− | + | ||
==工作计划== | ==工作计划== | ||
− | + | ===ASR/NLP 接口数据=== | |
+ | |||
+ | 定义数据结构格式如下: | ||
*n-best word | *n-best word | ||
第47行: | 第51行: | ||
*word-based confidence | *word-based confidence | ||
− | + | ===麦克风阵列数据录制=== | |
− | #录音方案设计 (捷通) | + | #录音方案设计 (捷通)[2016-04-07 完成] |
− | #录音 (清华,新松) | + | #录音 (清华,新松)[2016-04-08完成第一批] |
2016年4月6日 (三) 02:53的最后版本
项目进展
语音识别系统
1. 数据准备
- 安静环境下数据采集完成
- 第一批带噪环境数据采集完成
- 麦克风阵列采集开始准备
2. 基线系统
- 安静环境下数据测试完成。识别率92%以上。
- 第一批带噪环境数据测试完成。识别率极低。
- 需要麦克风阵列支持
3. 麦克风阵列研究
- 等待第一次真实数据录音测试
4. 模型适应
- 第一批LM自适应完成
语义理解系统
- 数据收集与梳理完成
- 语义理解,对话管理模块完成
- 语音容错对应处理开始
系统实现
- 系统移植完成
- 模型裁剪未验证
- 接口设计完成
工作计划
ASR/NLP 接口数据
定义数据结构格式如下:
- n-best word
- n-best phone
- phone-based confidence
- syllable-based confidence
- word-based confidence
麦克风阵列数据录制
- 录音方案设计 (捷通)[2016-04-07 完成]
- 录音 (清华,新松)[2016-04-08完成第一批]