“Xingsong-meeting-minutues-2016-04-6”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
 
(相同用户的8个中间修订版本未显示)
第5行: 第5行:
 
1. 数据准备
 
1. 数据准备
  
#clean 数据采集完成, noisy手机数据采集100句
+
#安静环境下数据采集完成
 +
#第一批带噪环境数据采集完成
 
#麦克风阵列采集开始准备
 
#麦克风阵列采集开始准备
  
第11行: 第12行:
 
2. 基线系统
 
2. 基线系统
  
#clean数据测试完成, noisy手机数据测试完成。
+
#安静环境下数据测试完成。识别率92%以上。
 +
#第一批带噪环境数据测试完成。识别率极低。
 +
#需要麦克风阵列支持
  
 
3. 麦克风阵列研究
 
3. 麦克风阵列研究
第24行: 第27行:
 
===语义理解系统===
 
===语义理解系统===
  
#数据收集与梳理
+
#数据收集与梳理完成
 
#语义理解,对话管理模块完成
 
#语义理解,对话管理模块完成
 
#语音容错对应处理开始
 
#语音容错对应处理开始
第34行: 第37行:
 
#系统移植完成
 
#系统移植完成
 
#模型裁剪未验证
 
#模型裁剪未验证
 
+
#接口设计完成
3. 接口设计完成
+
 
   
 
   
 
==工作计划==
 
==工作计划==
  
#ASR/NLP 接口数据
+
===ASR/NLP 接口数据===
 +
 
 +
定义数据结构格式如下:
  
(1) n-best word (2) n-best phone (3) phone-based confidence (4) syllable-based confidence (5) word-based confidence
+
*n-best word  
 +
*n-best phone  
 +
*phone-based confidence  
 +
*syllable-based confidence  
 +
*word-based confidence
  
2. mic-array数据录制
+
===麦克风阵列数据录制===
  
#录音方案设计 (捷通)
+
#录音方案设计 (捷通)[2016-04-07 完成]
#录音 (清华,新松)
+
#录音 (清华,新松)[2016-04-08完成第一批]

2016年4月6日 (三) 02:53的最后版本

项目进展

语音识别系统

1. 数据准备

  1. 安静环境下数据采集完成
  2. 第一批带噪环境数据采集完成
  3. 麦克风阵列采集开始准备


2. 基线系统

  1. 安静环境下数据测试完成。识别率92%以上。
  2. 第一批带噪环境数据测试完成。识别率极低。
  3. 需要麦克风阵列支持

3. 麦克风阵列研究

  1. 等待第一次真实数据录音测试

4. 模型适应

  1. 第一批LM自适应完成


语义理解系统

  1. 数据收集与梳理完成
  2. 语义理解,对话管理模块完成
  3. 语音容错对应处理开始


系统实现

  1. 系统移植完成
  2. 模型裁剪未验证
  3. 接口设计完成

工作计划

ASR/NLP 接口数据

定义数据结构格式如下:

  • n-best word
  • n-best phone
  • phone-based confidence
  • syllable-based confidence
  • word-based confidence

麦克风阵列数据录制

  1. 录音方案设计 (捷通)[2016-04-07 完成]
  2. 录音 (清华,新松)[2016-04-08完成第一批]