“Xingsong-meeting-minutues-2016-04-6”版本间的差异
来自cslt Wiki
(以“==项目进展== ===语音识别系统=== 1. 数据准备 2. 基线系统 3. 麦克风阵列研究 4. 模型适应 ===语义理解系统=== 1, 数据收集与梳...”为内容创建页面) |
|||
(2位用户的10个中间修订版本未显示) | |||
第2行: | 第2行: | ||
===语音识别系统=== | ===语音识别系统=== | ||
+ | |||
1. 数据准备 | 1. 数据准备 | ||
+ | |||
+ | #安静环境下数据采集完成 | ||
+ | #第一批带噪环境数据采集完成 | ||
+ | #麦克风阵列采集开始准备 | ||
+ | |||
+ | |||
2. 基线系统 | 2. 基线系统 | ||
+ | |||
+ | #安静环境下数据测试完成。识别率92%以上。 | ||
+ | #第一批带噪环境数据测试完成。识别率极低。 | ||
+ | #需要麦克风阵列支持 | ||
+ | |||
3. 麦克风阵列研究 | 3. 麦克风阵列研究 | ||
+ | |||
+ | #等待第一次真实数据录音测试 | ||
+ | |||
4. 模型适应 | 4. 模型适应 | ||
+ | |||
+ | #第一批LM自适应完成 | ||
===语义理解系统=== | ===语义理解系统=== | ||
− | + | ||
− | + | #数据收集与梳理完成 | |
− | + | #语义理解,对话管理模块完成 | |
+ | #语音容错对应处理开始 | ||
+ | |||
===系统实现=== | ===系统实现=== | ||
− | |||
− | |||
− | |||
− | |||
+ | #系统移植完成 | ||
+ | #模型裁剪未验证 | ||
+ | #接口设计完成 | ||
+ | |||
==工作计划== | ==工作计划== | ||
+ | |||
+ | ===ASR/NLP 接口数据=== | ||
+ | |||
+ | 定义数据结构格式如下: | ||
+ | |||
+ | *n-best word | ||
+ | *n-best phone | ||
+ | *phone-based confidence | ||
+ | *syllable-based confidence | ||
+ | *word-based confidence | ||
+ | |||
+ | ===麦克风阵列数据录制=== | ||
+ | |||
+ | #录音方案设计 (捷通)[2016-04-07 完成] | ||
+ | #录音 (清华,新松)[2016-04-08完成第一批] |
2016年4月6日 (三) 02:53的最后版本
项目进展
语音识别系统
1. 数据准备
- 安静环境下数据采集完成
- 第一批带噪环境数据采集完成
- 麦克风阵列采集开始准备
2. 基线系统
- 安静环境下数据测试完成。识别率92%以上。
- 第一批带噪环境数据测试完成。识别率极低。
- 需要麦克风阵列支持
3. 麦克风阵列研究
- 等待第一次真实数据录音测试
4. 模型适应
- 第一批LM自适应完成
语义理解系统
- 数据收集与梳理完成
- 语义理解,对话管理模块完成
- 语音容错对应处理开始
系统实现
- 系统移植完成
- 模型裁剪未验证
- 接口设计完成
工作计划
ASR/NLP 接口数据
定义数据结构格式如下:
- n-best word
- n-best phone
- phone-based confidence
- syllable-based confidence
- word-based confidence
麦克风阵列数据录制
- 录音方案设计 (捷通)[2016-04-07 完成]
- 录音 (清华,新松)[2016-04-08完成第一批]