“FreeNeb commercial project”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
In Progress
Lr讨论 | 贡献
 
(3位用户的44个中间修订版本未显示)
第1行: 第1行:
 
==In Progress==
 
==In Progress==
 
{| class="wikitable"
 
{| class="wikitable"
!Project !!Target !! Leader !! Participant !!plan !! status !! Meet Minutes !! Task Tracing(<font color="red">DeadLine</font>)
+
!Project !!Target !! Leader !! Participant !!plan !! status !! risk !! data
 +
 
 
|-
 
|-
|日本同方声纹项目
+
|分音塔项目[语音识别]
 
||   
 
||   
  
 
||
 
||
  
Ying Shi
+
Mengyuan Zhao
  
 
||
 
||
 
--
 
--
 
||
 
||
+
*2018年 4 月前完成中日语在线语音识别基础服务平台搭建;(done)
||
+
*2018年 5 月前完成离线中日语语音识别模块;(done)
 +
*2018年 6 月前完成在线中日语语音识别引擎优化;(待数据提供)
 +
      旅游日常生活用语场景,安静环境下,在线日语语音识别引擎语音识别准确率达到85%。
 +
      在甲方提供上述应用场景300小时在线语音和50M文本数据的情况下,语音识别准确率达到90%。
 +
*2018年 8 月前完成中日语音识别引擎第二阶段优化;
 +
    基于mtk6739 CPU平台的手机实现日语离线语音识别,
 +
    要求语音识别速度在说完话1s内出识别结果,离线识别率不低于在线识别率的80%"
  
 
||
 
||
 
+
*初版在线/离线引擎已提供
 +
**已提供模型: 在线版,中文;在线版,日文;离线版,中文;离线版,日文;
 +
* 日文16k模型训练开始
 +
* 分音塔数据已提供(40G中文+14G日文原始语音)未标注。
 +
||
 +
* 待解决问题:
 +
# 支持自定义热词
 
||
 
||
  
 
|-
 
|-
|日本同方在线语音识别[二期]
+
|国防(航天)合作项目
 
||   
 
||   
 
+
协助航天二院完成流式语音识别演示demo,并提供技术指导。
 
||
 
||
  
Mengyuan Zhao
+
Zhiyong Zhang
  
||
 
--
 
||
 
 
 
||
 
||
  
||
+
Zhenlong Han/ Mengyuan Zhao
  
 
||
 
||
  
 +
*2018年4月1日-2018年6月15日
 +
**完成语音识别国内外研究现状分析报告. [done]
 +
**声学模型训练 @韩振龙
 +
*** 开源CVTE模型测试 2018.5.7-2018.5.12 [done]
 +
*** 开源语音数据整理和模型训练 2018.5.7-2018.5.12 [done]
 +
*** 基于CVTE开源模型的KT网络训练 2018.5.14-2018.5.18 [done]
 +
*** 协助航天完成clean和noise环境录音 2018.5.14-2018.5.18 [待数据提供]
 +
*** 开源语音数据data augmentation训练 2018.5.14-2018.5.25 [done, need check]
  
|-
+
**实时语音识别演示代码
|分音塔项目跟进[语音识别]
+
*** 基于kaldi online代码基线语音识别流式解码代码实现 @Zhiyong Zhang 2018.5.7-2018.5.25 [done - 2018.5.21]
|| 
+
*** 语音识别Server端和client端代码实现 @Mengyuan Zhao 2018.5.7-2018.5.25 [hold]
 +
*** 麦克风语音输入代码实现 @Mengyuan Zhao @Zhiyong Zhang 2018.5.25-2018.6.1 [done]
 +
*** 语音识别引擎优化 @Zhiyong Zhang 2018.6.1-2018.6.10
  
 +
*2018年6月15日-2018年12月1日
 +
**完成智能语音交互代码的开发
 +
**完成智能语音交互技术说明书。
 
||
 
||
  
Mengyuan Zhao
+
* 已提交《语音识别国内外研究现状分析报告》和《语音标注文档》 @Rong Liu/ @Zhenlong Han
 
+
* 代码开发,内部done
||
+
--
+
||
+
+
||
+
 
+
 
||
 
||
  
第58行: 第74行:
  
 
|-
 
|-
|国防(航天)合作项目
+
|Roobo口语评测及儿童英文识别
 
||   
 
||   
  
 
||
 
||
  
Zhiyong Zhang
+
Zhiyuan Tang/Shuai Zhang
  
 
||
 
||
 
--
 
--
 
||
 
||
*2018年4月1日-2018年6月15日
+
2018.06.10 口语评测引擎打分实时率<0.5
**完成语音识别国内外研究现状分析报告. [done]
+
 
**实时语音识别演示代码。
+
*2018年6月15日-2018年12月1日
+
**完成智能语音交互代码的开发
+
**完成智能语音交互技术说明书。
+
 
||
 
||
 
+
* 待启动,预期开发周期2-3天 @志远
 
||
 
||
  
第81行: 第93行:
  
 
|-
 
|-
|Roobo打分项目
+
|Roobo儿童asr
 
||   
 
||   
  
 
||
 
||
  
Zhiyuan Tang/Shuai Zhang
+
Mengyuan Zhao/zhiyong Zhang
  
 
||
 
||
--
+
Zhenglong han/Rong Liu
 
||
 
||
  阶段1:合同签订(具体时间待定)后30日内完成,乙方应协助甲方完成系统相关解决方案文档,主要包括语料标注、设备配置、测试方案、平台设计方案等解决方案。
+
 
  阶段2:在阶段1验收完成后60日内,乙方应协助甲方开发完成系统初级测试版本。
+
* 2018.06.10 第一版asr引擎,demo展示给领导。
  阶段3:在阶段2验收合格后,甲方提供真实语音数据后60日内完成系统优化,要求机器打分与标注打分相关性达0.75以上,满足实际应用需求。
+
 
  阶段4:在阶段3验收合格后60日内,乙方应协助甲方实现系统生产环境上线。标准:要求在相关性指标和反应时间等性能上满足上层应用的要求,机器打分与标注打分相关性达0.8以上,引擎实时率小于0.35,同时完成儿童英文识别初始系统交付。
+
  阶段5:2019年4月30日前完成系统验收且验收合格。验收时乙方需提供系统相关的完整设计方案、测试报告、使用说明、维护文档等相关资料。要求解决系统上线后发现的问题,保证系统稳定运行。
+
  阶段6:项目验收合格后三个月,乙方对系统上线后生产问题解决、语料收集标注及模型增强训练等工作提供技术支持。
+
 
||
 
||
 +
* 声学模型训练 已提供200h语音标注数据,待训练@梦原
 +
* 语言模型,已提供清洗语料,待训练验证@刘荣
  
 
||
 
||
  
 
||
 
||
 +
  
 
|-
 
|-
 
|同花顺咨询收尾
 
|同花顺咨询收尾
 
||   
 
||   
 
+
提供第四期技术咨询
 
||
 
||
  
第112行: 第124行:
  
 
||
 
||
--
+
Zhenlong Han
 
||
 
||
+
待确定日期
 
||
 
||
 
+
汇款中
 
||
 
||
  
第125行: 第137行:
 
==ToDo==
 
==ToDo==
 
{| class="wikitable"
 
{| class="wikitable"
!Project !!Target !! Leader !! Participant !! Last Week !! This Week !! Meet Minutes !! Task Tracing(<font color="red">DeadLine</font>)
+
!Project !!Target !! Leader !! Participant !! plan !! status !! Meet Minutes !! Task Tracing(<font color="red">DeadLine</font>)
 
|-
 
|-
 
|Roobo声纹项目合作
 
|Roobo声纹项目合作
第216行: 第228行:
  
 
||
 
||
 +
 +
 +
|}
 +
 +
==Past Project==
 +
{| class="wikitable"
 +
!Project !!Target !! Leader !! Participant !! plan !! status !! Meet Minutes !! Task Tracing(<font color="red">DeadLine</font>)
 +
|-
 +
|日本同方声纹项目
 +
|| 
 +
 +
||
 +
 +
Ying Shi
 +
 +
||
 +
--
 +
||
 +
 +
||
 +
 +
||
 +
 +
||
 +
 +
|-
 +
|日本同方在线语音识别[二期]
 +
|| 
 +
 +
||
 +
 +
Mengyuan Zhao
 +
 +
||
 +
--
 +
||
 +
 +
||
 +
 +
||
 +
 +
||
 +
 +
  
  
 
|}
 
|}

2018年6月4日 (一) 01:20的最后版本

In Progress

Project Target Leader Participant plan status risk data
分音塔项目[语音识别]

Mengyuan Zhao

--

  • 2018年 4 月前完成中日语在线语音识别基础服务平台搭建;(done)
  • 2018年 5 月前完成离线中日语语音识别模块;(done)
  • 2018年 6 月前完成在线中日语语音识别引擎优化;(待数据提供)
      旅游日常生活用语场景,安静环境下,在线日语语音识别引擎语音识别准确率达到85%。
      在甲方提供上述应用场景300小时在线语音和50M文本数据的情况下,语音识别准确率达到90%。
  • 2018年 8 月前完成中日语音识别引擎第二阶段优化;
   基于mtk6739 CPU平台的手机实现日语离线语音识别,
   要求语音识别速度在说完话1s内出识别结果,离线识别率不低于在线识别率的80%"
  • 初版在线/离线引擎已提供
    • 已提供模型: 在线版,中文;在线版,日文;离线版,中文;离线版,日文;
  • 日文16k模型训练开始
  • 分音塔数据已提供(40G中文+14G日文原始语音)未标注。
  • 待解决问题:
  1. 支持自定义热词
国防(航天)合作项目

协助航天二院完成流式语音识别演示demo,并提供技术指导。

Zhiyong Zhang

Zhenlong Han/ Mengyuan Zhao

  • 2018年4月1日-2018年6月15日
    • 完成语音识别国内外研究现状分析报告. [done]
    • 声学模型训练 @韩振龙
      • 开源CVTE模型测试 2018.5.7-2018.5.12 [done]
      • 开源语音数据整理和模型训练 2018.5.7-2018.5.12 [done]
      • 基于CVTE开源模型的KT网络训练 2018.5.14-2018.5.18 [done]
      • 协助航天完成clean和noise环境录音 2018.5.14-2018.5.18 [待数据提供]
      • 开源语音数据data augmentation训练 2018.5.14-2018.5.25 [done, need check]
    • 实时语音识别演示代码
      • 基于kaldi online代码基线语音识别流式解码代码实现 @Zhiyong Zhang 2018.5.7-2018.5.25 [done - 2018.5.21]
      • 语音识别Server端和client端代码实现 @Mengyuan Zhao 2018.5.7-2018.5.25 [hold]
      • 麦克风语音输入代码实现 @Mengyuan Zhao @Zhiyong Zhang 2018.5.25-2018.6.1 [done]
      • 语音识别引擎优化 @Zhiyong Zhang 2018.6.1-2018.6.10
  • 2018年6月15日-2018年12月1日
    • 完成智能语音交互代码的开发
    • 完成智能语音交互技术说明书。
  • 已提交《语音识别国内外研究现状分析报告》和《语音标注文档》 @Rong Liu/ @Zhenlong Han
  • 代码开发,内部done
Roobo口语评测及儿童英文识别

Zhiyuan Tang/Shuai Zhang

--

2018.06.10 口语评测引擎打分实时率<0.5

  • 待启动,预期开发周期2-3天 @志远
Roobo儿童asr

Mengyuan Zhao/zhiyong Zhang

Zhenglong han/Rong Liu

  • 2018.06.10 第一版asr引擎,demo展示给领导。
  • 声学模型训练 已提供200h语音标注数据,待训练@梦原
  • 语言模型,已提供清洗语料,待训练验证@刘荣


同花顺咨询收尾

提供第四期技术咨询

Zhiyong Zhang

Zhenlong Han

待确定日期

汇款中

ToDo

Project Target Leader Participant plan status Meet Minutes Task Tracing(DeadLine)
Roobo声纹项目合作

A subcompany

Dong Wang/Rong Liu

--

Waiting for new demo version

国网客服项目

Haisheng Dai/Zhiyong Zhang

--


Roobo在线语音识别项目

Mengyuan Zhao

--

美团金融声纹项目

Haisheng Dai

--

驻马店政府项目推进

Dong Wang

--


Past Project

Project Target Leader Participant plan status Meet Minutes Task Tracing(DeadLine)
日本同方声纹项目

Ying Shi

--

日本同方在线语音识别[二期]

Mengyuan Zhao

--