“Xingsong-meeting-minutues-2016-05-12”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
第14行: 第14行:
  
  
3. 麦克风阵列研究[http://192.168.0.51:5555/cgi-bin/cvss/cvss_request.pl?account=wangd&step=view_request&cvssid=529]
+
3. 麦克风阵列研究[http://192.168.0.51:5555/cgi-bin/cvss/cvss_request.pl?account=wangd&step=view_request&cvssid=529][http://192.168.0.51:5555/cgi-bin/cvss/cvss_request.pl?account=wangd&step=view_request&cvssid=535]
  
 
*缺省beamforming
 
*缺省beamforming

2016年5月11日 (三) 12:05的版本

项目进展

语音识别系统

1. 数据准备

  1. 麦克风阵列采集完成三轮
  2. 标注与切分方法确定


2. 基线系统

  1. 基线识别系统完成


3. 麦克风阵列研究[1][2]

  • 缺省beamforming
  • Beamforming算法研究
  • delay & sum (DS)
  • super direction (SD)
  • MVDR
  • DAE算法
  • 多信道DAE算法


4. 模型适应

  1. 字模型+领域相关词模型测试完成,识别结果与大规模词模型相似


语义理解系统

  1. 数据收集与梳理完成
  2. 语义理解,对话管理模块完成
  3. 语音容错对应处理开始


系统实现

  1. 系统移植完成
  2. 模型裁剪未验证
  3. 接口设计完成

5月工作计划

ASR系统性能优化(CSLT)

  • beamforming数据采集
  • noisy training
  • dark knowledge training
  • multi-channel DNN training
  • similar-pair LM

基于ASR的NLP实验

  • example output generation (Sion + CSLT)
  • ASR-oriented NLP (CS)

系统集成

  • prototype system with NLP (Sino+CS)