“Xingsong-meeting-minutues-2016-04-6”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
第5行: 第5行:
 
1. 数据准备
 
1. 数据准备
  
#clean 数据采集完成, noisy手机数据采集100句
+
#clean 数据采集完成, noisy手机数据采集100句完成
 
#麦克风阵列采集开始准备
 
#麦克风阵列采集开始准备
  
第12行: 第12行:
  
 
#clean数据测试完成, noisy手机数据测试完成。
 
#clean数据测试完成, noisy手机数据测试完成。
 +
#clean数据训别率92%以上,noisy手机数据识别率极低。
  
 
3. 麦克风阵列研究
 
3. 麦克风阵列研究
第24行: 第25行:
 
===语义理解系统===
 
===语义理解系统===
  
#数据收集与梳理
+
#数据收集与梳理完成
 
#语义理解,对话管理模块完成
 
#语义理解,对话管理模块完成
 
#语音容错对应处理开始
 
#语音容错对应处理开始
第38行: 第39行:
 
==工作计划==
 
==工作计划==
  
1.ASR/NLP 接口数据
+
===ASR/NLP 接口数据===
 +
 
 +
定义数据结构格式如下:
  
 
*n-best word  
 
*n-best word  
第46行: 第49行:
 
*word-based confidence
 
*word-based confidence
  
2. mic-array数据录制
+
===mic-array数据录制===
  
#录音方案设计 (捷通)
+
#录音方案设计 (捷通)[2015-04-07 完成]
#录音 (清华,新松)
+
#录音 (清华,新松)[2015-04-08完成第一批]

2016年4月6日 (三) 02:50的版本

项目进展

语音识别系统

1. 数据准备

  1. clean 数据采集完成, noisy手机数据采集100句完成
  2. 麦克风阵列采集开始准备


2. 基线系统

  1. clean数据测试完成, noisy手机数据测试完成。
  2. clean数据训别率92%以上,noisy手机数据识别率极低。

3. 麦克风阵列研究

  1. 等待第一次真实数据录音测试

4. 模型适应

  1. 第一批LM自适应完成


语义理解系统

  1. 数据收集与梳理完成
  2. 语义理解,对话管理模块完成
  3. 语音容错对应处理开始


系统实现

  1. 系统移植完成
  2. 模型裁剪未验证
  3. 接口设计完成

工作计划

ASR/NLP 接口数据

定义数据结构格式如下:

  • n-best word
  • n-best phone
  • phone-based confidence
  • syllable-based confidence
  • word-based confidence

mic-array数据录制

  1. 录音方案设计 (捷通)[2015-04-07 完成]
  2. 录音 (清华,新松)[2015-04-08完成第一批]