“Xingsong-meeting-minutues-2016-04-6”版本间的差异
来自cslt Wiki
第5行: | 第5行: | ||
1. 数据准备 | 1. 数据准备 | ||
− | #clean 数据采集完成, | + | #clean 数据采集完成, noisy手机数据采集100句完成 |
#麦克风阵列采集开始准备 | #麦克风阵列采集开始准备 | ||
第12行: | 第12行: | ||
#clean数据测试完成, noisy手机数据测试完成。 | #clean数据测试完成, noisy手机数据测试完成。 | ||
+ | #clean数据训别率92%以上,noisy手机数据识别率极低。 | ||
3. 麦克风阵列研究 | 3. 麦克风阵列研究 | ||
第24行: | 第25行: | ||
===语义理解系统=== | ===语义理解系统=== | ||
− | # | + | #数据收集与梳理完成 |
#语义理解,对话管理模块完成 | #语义理解,对话管理模块完成 | ||
#语音容错对应处理开始 | #语音容错对应处理开始 | ||
第38行: | 第39行: | ||
==工作计划== | ==工作计划== | ||
− | + | ===ASR/NLP 接口数据=== | |
+ | |||
+ | 定义数据结构格式如下: | ||
*n-best word | *n-best word | ||
第46行: | 第49行: | ||
*word-based confidence | *word-based confidence | ||
− | + | ===mic-array数据录制=== | |
− | #录音方案设计 (捷通) | + | #录音方案设计 (捷通)[2015-04-07 完成] |
− | #录音 (清华,新松) | + | #录音 (清华,新松)[2015-04-08完成第一批] |
2016年4月6日 (三) 02:50的版本
项目进展
语音识别系统
1. 数据准备
- clean 数据采集完成, noisy手机数据采集100句完成
- 麦克风阵列采集开始准备
2. 基线系统
- clean数据测试完成, noisy手机数据测试完成。
- clean数据训别率92%以上,noisy手机数据识别率极低。
3. 麦克风阵列研究
- 等待第一次真实数据录音测试
4. 模型适应
- 第一批LM自适应完成
语义理解系统
- 数据收集与梳理完成
- 语义理解,对话管理模块完成
- 语音容错对应处理开始
系统实现
- 系统移植完成
- 模型裁剪未验证
- 接口设计完成
工作计划
ASR/NLP 接口数据
定义数据结构格式如下:
- n-best word
- n-best phone
- phone-based confidence
- syllable-based confidence
- word-based confidence
mic-array数据录制
- 录音方案设计 (捷通)[2015-04-07 完成]
- 录音 (清华,新松)[2015-04-08完成第一批]