“FreeNeb commercial project”版本间的差异

2018年6月4日 (一) 01:20的最后版本

In Progress

Project	Target	Leader	Participant	plan	status	risk
分音塔项目[语音识别]		Mengyuan Zhao	--	2018年 4 月前完成中日语在线语音识别基础服务平台搭建；(done) 2018年 5 月前完成离线中日语语音识别模块；(done) 2018年 6 月前完成在线中日语语音识别引擎优化；(待数据提供) 旅游日常生活用语场景，安静环境下，在线日语语音识别引擎语音识别准确率达到85%。在甲方提供上述应用场景300小时在线语音和50M文本数据的情况下，语音识别准确率达到90%。 2018年 8 月前完成中日语音识别引擎第二阶段优化；基于mtk6739 CPU平台的手机实现日语离线语音识别，要求语音识别速度在说完话1s内出识别结果，离线识别率不低于在线识别率的80%"	初版在线/离线引擎已提供已提供模型：在线版，中文；在线版，日文；离线版，中文；离线版，日文；日文16k模型训练开始分音塔数据已提供（40G中文+14G日文原始语音）未标注。	待解决问题：支持自定义热词
国防(航天)合作项目	协助航天二院完成流式语音识别演示demo，并提供技术指导。	Zhiyong Zhang	Zhenlong Han/ Mengyuan Zhao	2018年4月1日-2018年6月15日完成语音识别国内外研究现状分析报告. [done] 声学模型训练 @韩振龙开源CVTE模型测试 2018.5.7-2018.5.12 [done] 开源语音数据整理和模型训练 2018.5.7-2018.5.12 [done] 基于CVTE开源模型的KT网络训练 2018.5.14-2018.5.18 [done] 协助航天完成clean和noise环境录音 2018.5.14-2018.5.18 [待数据提供] 开源语音数据data augmentation训练 2018.5.14-2018.5.25 [done, need check] 实时语音识别演示代码基于kaldi online代码基线语音识别流式解码代码实现 @Zhiyong Zhang 2018.5.7-2018.5.25 [done - 2018.5.21] 语音识别Server端和client端代码实现 @Mengyuan Zhao 2018.5.7-2018.5.25 [hold] 麦克风语音输入代码实现 @Mengyuan Zhao @Zhiyong Zhang 2018.5.25-2018.6.1 [done] 语音识别引擎优化 @Zhiyong Zhang 2018.6.1-2018.6.10 2018年6月15日-2018年12月1日完成智能语音交互代码的开发完成智能语音交互技术说明书。	已提交《语音识别国内外研究现状分析报告》和《语音标注文档》 @Rong Liu/ @Zhenlong Han 代码开发，内部done
Roobo口语评测及儿童英文识别		Zhiyuan Tang/Shuai Zhang	--	2018.06.10 口语评测引擎打分实时率<0.5	待启动，预期开发周期2-3天 @志远
Roobo儿童asr		Mengyuan Zhao/zhiyong Zhang	Zhenglong han/Rong Liu	2018.06.10 第一版asr引擎，demo展示给领导。	声学模型训练已提供200h语音标注数据，待训练@梦原语言模型，已提供清洗语料，待训练验证@刘荣
同花顺咨询收尾	提供第四期技术咨询	Zhiyong Zhang	Zhenlong Han	待确定日期	汇款中

ToDo

Project	Target	Leader	Participant	plan
Roobo声纹项目合作	A subcompany	Dong Wang/Rong Liu	--	Waiting for new demo version
国网客服项目		Haisheng Dai/Zhiyong Zhang	--
Roobo在线语音识别项目		Mengyuan Zhao	--
美团金融声纹项目		Haisheng Dai	--
驻马店政府项目推进		Dong Wang	--

Past Project

Project	Target	Leader	Participant	plan	status	Meet Minutes	Task Tracing(DeadLine)
日本同方声纹项目		Ying Shi	--
日本同方在线语音识别[二期]		Mengyuan Zhao	--

@@ 第27行： / 第27行： @@
 **已提供模型： 在线版，中文；在线版，日文；离线版，中文；离线版，日文；
 * 日文16k模型训练开始
+* 分音塔数据已提供（40G中文+14G日文原始语音）未标注。
 ||
 * 待解决问题：
@@ 第45行： / 第46行： @@
 ||
 *2018年4月1日-2018年6月15日
 **完成语音识别国内外研究现状分析报告. [done]
@@ 第52行： / 第54行： @@
 *** 基于CVTE开源模型的KT网络训练 2018.5.14-2018.5.18 [done]
 *** 协助航天完成clean和noise环境录音 2018.5.14-2018.5.18 [待数据提供]
-*** 开源语音数据data augmentation训练 2018.5.14-2018.5.25
+*** 开源语音数据data augmentation训练 2018.5.14-2018.5.25 [done, need check]
 **实时语音识别演示代码
 *** 基于kaldi online代码基线语音识别流式解码代码实现 @Zhiyong Zhang 2018.5.7-2018.5.25 [done - 2018.5.21]
-*** 语音识别Server端和client端代码实现 @Mengyuan Zhao 2018.5.7-2018.5.25
+*** 语音识别Server端和client端代码实现 @Mengyuan Zhao 2018.5.7-2018.5.25 [hold]
-*** 麦克风语音输入代码实现 @Mengyuan Zhao @Zhiyong Zhang 2018.5.25-2018.6.1
+*** 麦克风语音输入代码实现 @Mengyuan Zhao @Zhiyong Zhang 2018.5.25-2018.6.1 [done]
 *** 语音识别引擎优化 @Zhiyong Zhang 2018.6.1-2018.6.10
@@ 第66行： / 第68行： @@
 * 已提交《语音识别国内外研究现状分析报告》和《语音标注文档》 @Rong Liu/ @Zhenlong Han
+* 代码开发，内部done
 ||
@@ 第84行： / 第87行： @@
 ||
+* 待启动，预期开发周期2-3天 @志远
 ||
@@ 第104行： / 第107行： @@
 ||
-* 标准测试集提供，未优化模型基准30%,@梦原
+* 声学模型训练 已提供200h语音标注数据，待训练@梦原
-* 声学模型训练 待数据提供，05.23提供，@梦原
+* 语言模型，已提供清洗语料，待训练验证@刘荣
-* 语言模型
-** 通用词+领域语料，2.7Gquery 20%， 8.1Gquery 19.37% @刘荣
-** 领域词(未check发音)+领域语料，8.1Gquery 19.97% @刘荣
-** 领域词（check发音）+领域语料，待提供 @刘荣
 ||
@@ 第129行： / 第128行： @@
 待确定日期
 ||
-已提交《同花顺技术问题及解决方案》及《补充一》、《补充二》文档
+汇款中
 ||

“FreeNeb commercial project”版本间的差异

2018年6月4日 (一) 01:20的最后版本

In Progress

ToDo

Past Project

导航菜单

个人工具

名字空间

变种

查看

操作

搜索

导航

工具