“Xingsong-meeting-minutues-2016-04-6”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
(以“==项目进展== ===语音识别系统=== 1. 数据准备 2. 基线系统 3. 麦克风阵列研究 4. 模型适应 ===语义理解系统=== 1, 数据收集与梳...”为内容创建页面)
 
 
(2位用户的10个中间修订版本未显示)
第2行: 第2行:
  
 
===语音识别系统===
 
===语音识别系统===
 +
 
1. 数据准备
 
1. 数据准备
 +
 +
#安静环境下数据采集完成
 +
#第一批带噪环境数据采集完成
 +
#麦克风阵列采集开始准备
 +
 +
 
2. 基线系统
 
2. 基线系统
 +
 +
#安静环境下数据测试完成。识别率92%以上。
 +
#第一批带噪环境数据测试完成。识别率极低。
 +
#需要麦克风阵列支持
 +
 
3. 麦克风阵列研究
 
3. 麦克风阵列研究
 +
 +
#等待第一次真实数据录音测试
 +
 
4. 模型适应
 
4. 模型适应
 +
 +
#第一批LM自适应完成
  
  
 
===语义理解系统===
 
===语义理解系统===
1, 数据收集与梳理
+
 
2. 模型训练
+
#数据收集与梳理完成
3.
+
#语义理解,对话管理模块完成
 +
#语音容错对应处理开始
 +
 
  
  
 
===系统实现===
 
===系统实现===
1. 系统移植
 
2. 模型裁剪
 
3. 接口设计
 
 
  
 +
#系统移植完成
 +
#模型裁剪未验证
 +
#接口设计完成
 +
 
==工作计划==
 
==工作计划==
 +
 +
===ASR/NLP 接口数据===
 +
 +
定义数据结构格式如下:
 +
 +
*n-best word
 +
*n-best phone
 +
*phone-based confidence
 +
*syllable-based confidence
 +
*word-based confidence
 +
 +
===麦克风阵列数据录制===
 +
 +
#录音方案设计 (捷通)[2016-04-07 完成]
 +
#录音 (清华,新松)[2016-04-08完成第一批]

2016年4月6日 (三) 02:53的最后版本

项目进展

语音识别系统

1. 数据准备

  1. 安静环境下数据采集完成
  2. 第一批带噪环境数据采集完成
  3. 麦克风阵列采集开始准备


2. 基线系统

  1. 安静环境下数据测试完成。识别率92%以上。
  2. 第一批带噪环境数据测试完成。识别率极低。
  3. 需要麦克风阵列支持

3. 麦克风阵列研究

  1. 等待第一次真实数据录音测试

4. 模型适应

  1. 第一批LM自适应完成


语义理解系统

  1. 数据收集与梳理完成
  2. 语义理解,对话管理模块完成
  3. 语音容错对应处理开始


系统实现

  1. 系统移植完成
  2. 模型裁剪未验证
  3. 接口设计完成

工作计划

ASR/NLP 接口数据

定义数据结构格式如下:

  • n-best word
  • n-best phone
  • phone-based confidence
  • syllable-based confidence
  • word-based confidence

麦克风阵列数据录制

  1. 录音方案设计 (捷通)[2016-04-07 完成]
  2. 录音 (清华,新松)[2016-04-08完成第一批]