“FreeNeb status Report 2018-11-26”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
 
(8位用户的11个中间修订版本未显示)
第6行: 第6行:
 
本周:
 
本周:
 
* 工程化
 
* 工程化
 +
# 完善nnet3-to-nnet1转换工具,加入对StatisticalExtraction、StatisticalPooling的支持
 
# local VPR engine:
 
# local VPR engine:
## 实现StatisticalPooling component,以实现对x-vector的支持
+
## 实现了cmvn和PLDA打分,但与kaldi执行结果不同,还需进一步debug。
 +
* 服务器维护
 +
# corpus1创建完成
 +
# 协助之勇修理tiger01
 
||
 
||
 
下周:
 
下周:
 
* 工程化
 
* 工程化
 
# local VPR engine:
 
# local VPR engine:
## 更新nnet3-to-nnet1转换程序,支持statisticsPooling component
+
## 继续debug cmvn和plda打分模块。
## 优化cmvn
+
## 实现PLDA打分模块
+
  
 
||
 
||
第22行: 第24行:
 
|Zhiyong Zhang||
 
|Zhiyong Zhang||
 
本周:
 
本周:
# TTS-化学论文摘要合成
+
# TTS-海峡研究院特定说话人语音合成--Failed , 需做adaptation,重新合成
# release目录model整理
+
# TTS-大规模数据训练--整理数据中
# TTS-前端/模型训练调研
+
  
 
||
 
||
第37行: 第38行:
 
|Yang Wei ||
 
|Yang Wei ||
 
本周:
 
本周:
* 测试vad引擎
+
* 完成vad引擎测试
* 测试使用tdnn-f chain模型的asr引擎rt
+
* 完成本地asr引擎回归测试
 
||
 
||
 
下周:
 
下周:
* 完成vad引擎测试
 
 
* 测试i-vector vpr引擎
 
* 测试i-vector vpr引擎
  
第49行: 第49行:
 
|Zhenlong Han||
 
|Zhenlong Han||
 
本周:
 
本周:
# 汽车之家反馈最新结果
 
 
# 整理项目工具框架
 
# 整理项目工具框架
# 跟进国网标注,分析训练问题
+
# 跟进国网标注
 
# 双猴京华项目支持
 
# 双猴京华项目支持
# 发布分音塔本地中文模型
+
# 测试分音塔日语识别率
  
 
||
 
||
第80行: 第79行:
 
|Yanchi Jin||
 
|Yanchi Jin||
 
本周:
 
本周:
# 支持roobo语音识别项目,更新v3.6模型。
+
* 国家电网
# 评估分音塔标准测试集
+
# 国网数据分发,整理。
# 分析国网训练模型提升效果
+
# 国网测试集筛选,整理。
 +
# 国网识别效果评估。
 +
* 分音塔
 +
# 分音塔中文语言模型重训,与11000h的16k chain模型造graph进行测试。
 +
# 分音塔日语测试集筛选,整理。
 +
* roobo项目交付列表整理。
 +
 
 
||
 
||
 
下周:
 
下周:
# 优化分音塔日语识别模型
+
* 整理项目脚本。
 +
* 支持项目。
 
||
 
||
 
||
 
||
第91行: 第97行:
 
|Rong Liu||
 
|Rong Liu||
 
上周
 
上周
1. 黄淮学院AI实验室沟通,待细节协议确定
+
1. 黄淮学院AI实验室落地沟通,由于内部问题,沟通进度不如预期
2. 国网数据结构化分析,解析出客服(1.6k)、客户(9.7W)、及对应地区(分布)标签,可用于声纹
+
2. 秒针费用结算流程及后续合作方式
3. 配合誉为科技windows离线输入法联调,基本完成
+
3. 协助roobo、分音塔、国网项目状态沟通和推进
 
||
 
||
 
下周:
 
下周:
1. 推动黄淮学院AI实验室协议确定,启动招标流程
+
1. 继续推进黄淮学院AI资源落地
2. 京华电子合同签订
+
2. Roobo、分音塔和国网项目状态推进
3. 嵌入式语音产品调研
+
3. roobo专利
 +
4. 其它前期项目需求沟通
 
||
 
||
  
第119行: 第126行:
 
||
 
||
 
上周:
 
上周:
Attended APSIPA.
+
1. ASR/VPR 前沿技术调研及报告准备;
 +
2. Roobo 口语打分相关专利撰写;
 +
3. 实验室语音识别读物整理与计划;
 +
4. 实习生研究方向讨论与指导。
 
||
 
||
 
本周:
 
本周:
1. Deep compression 调研与实现.
+
1. 技术报告;
2. pair-wise 后端设计.
+
2. Roobo 专利推送;
 +
3. FreeNeb Data Plan。
  
 
||
 
||
第131行: 第142行:
 
|Lantian Li||
 
|Lantian Li||
 
上周:
 
上周:
# 支持秒针声纹项目 @zs
+
# 发布 i/d/x-vector 最新模型
# 完成 i/d/x-vector 的 CMN 验证
+
 
# 支持 @zmy x-vector 工程化
 
# 支持 @zmy x-vector 工程化
# 开展若干声纹产品原型设计
+
# 科技部项目申报
# 组织实习生学习讨论
+
# 声纹产品原型设计
 
||
 
||
 
本周:
 
本周:
# 开启 d-x-vector 模型的 串行训练
+
# 国网 8k 数据整理
 
# 尝试 xi-vector 模型实现
 
# 尝试 xi-vector 模型实现
 
||
 
||
第146行: 第156行:
 
|Yating Peng||
 
|Yating Peng||
 
上周:
 
上周:
*看政府2019年科技计划和基金,可报2019年中关村国家自主创新示范区科技型小微企业研发费用支持资金和国际合作研发项目,在找性价比高的可靠代理中,希望本周能确定下来;
+
*交文津暖气费、自来水费;
*去社区开租房发票;
+
*代开Roobo专票;
*日常财务报销处理。
+
*日常财务付款、报销处理,购买大家交代的所需之物;
 +
*完善员工档案excel表;
  
  
 
||
 
||
 
本周:
 
本周:
*准备政府资金支持材料;
+
*对11月账;
*完善员工档案excel;
+
*写中心志
  
 
||
 
||
第161行: 第172行:
 
|Shiying||
 
|Shiying||
 
上周:
 
上周:
* 参加APSIPA 2018会议,两份口头报告
+
* 4000h 16k 数据转8k 已转交于强哥
 
+
* 整理测试集得到 汽车之家,分音塔,roobo, 并在当前模型上做了综合测试。
 +
* local ASR model 训练
 +
* 14000h noise training
 
||
 
||
 
本周
 
本周
* local ASR model  (context 为3的倍数的ASR model)
+
* release 测试集
* ASR model 综合测试
+
* 完成local ASR model noise training并得到综合测试结果。
 +
* 完成14000h noise training 并得到综合测试结构。
 
||
 
||
 
||
 
||
第174行: 第188行:
 
|Wenqiang Du ||
 
|Wenqiang Du ||
 
上周:
 
上周:
* 完成新一轮中文8K的chain模型训练
+
* roobo口语打分模型训练
* 处理了日语静音测试结果过差问题(text文本中有一部分数据没分词)
+
* 日语NHK新闻数据重新加入训练
* 实习生demo的整理
+
* 用新训练的8k模型对16K转8K数据做自适应
  
 
||
 
||
 
本周:
 
本周:
* roobo口语打分模型更新
+
* 对roobo口语模型进行多组实验
 +
* 16k转8k新模型训练
  
 
||
 
||

2018年11月26日 (一) 01:54的最后版本

This Week:

People Last Week This Week Meet Minutes Task Tracing(DeadLine)
Mengyuan Zhao

本周:

  • 工程化
  1. 完善nnet3-to-nnet1转换工具,加入对StatisticalExtraction、StatisticalPooling的支持
  2. local VPR engine:
    1. 实现了cmvn和PLDA打分,但与kaldi执行结果不同,还需进一步debug。
  • 服务器维护
  1. corpus1创建完成
  2. 协助之勇修理tiger01

下周:

  • 工程化
  1. local VPR engine:
    1. 继续debug cmvn和plda打分模块。
Zhiyong Zhang

本周:

  1. TTS-海峡研究院特定说话人语音合成--Failed , 需做adaptation,重新合成
  2. TTS-大规模数据训练--整理数据中

下周:

  1. ASR-decoder重置
  2. TTS-海峡研究院特定说话人语音合成
  3. TTS-大规模数据训练
Yang Wei

本周:

  • 完成vad引擎测试
  • 完成本地asr引擎回归测试

下周:

  • 测试i-vector vpr引擎
Zhenlong Han

本周:

  1. 整理项目工具框架
  2. 跟进国网标注
  3. 双猴京华项目支持
  4. 测试分音塔日语识别率

下周:

  1. 分音塔项目
  2. 国网项目
Shuai Zhang

本周:

  1. . vad engine 修改功能需求
  2. . vpr打包
  3. . asr服务

下周:

  1. . vad engine
  2. . asr服务压测


Yanchi Jin

本周:

  • 国家电网
  1. 国网数据分发,整理。
  2. 国网测试集筛选,整理。
  3. 国网识别效果评估。
  • 分音塔
  1. 分音塔中文语言模型重训,与11000h的16k chain模型造graph进行测试。
  2. 分音塔日语测试集筛选,整理。
  • roobo项目交付列表整理。

下周:

  • 整理项目脚本。
  • 支持项目。
Rong Liu

上周 1. 黄淮学院AI实验室落地沟通,由于内部问题,沟通进度不如预期 2. 秒针费用结算流程及后续合作方式 3. 协助roobo、分音塔、国网项目状态沟通和推进

下周: 1. 继续推进黄淮学院AI资源落地 2. Roobo、分音塔和国网项目状态推进 3. roobo专利 4. 其它前期项目需求沟通

Dong Wang

本周:

  1. . 实习生课题讨论部分完成
  2. . 入台证办理(失败)
  3. . 日本演示、DataX进展等相关项目讨论

下周:

  1. . 完成实习生课题声纹识别部分讨论
  2. . BP讨论
  3. . 研讨阿汤提出的品牌共享计划
Zhiyuan Tang

上周: 1. ASR/VPR 前沿技术调研及报告准备; 2. Roobo 口语打分相关专利撰写; 3. 实验室语音识别读物整理与计划; 4. 实习生研究方向讨论与指导。

本周: 1. 技术报告; 2. Roobo 专利推送; 3. FreeNeb Data Plan。

Lantian Li

上周:

  1. 发布 i/d/x-vector 最新模型
  2. 支持 @zmy x-vector 工程化
  3. 科技部项目申报
  4. 声纹产品原型设计

本周:

  1. 国网 8k 数据整理
  2. 尝试 xi-vector 模型实现
Yating Peng

上周:

  • 交文津暖气费、自来水费;
  • 代开Roobo专票;
  • 日常财务付款、报销处理,购买大家交代的所需之物;
  • 完善员工档案excel表;


本周:

  • 对11月账;
  • 写中心志
Shiying

上周:

  • 4000h 16k 数据转8k 已转交于强哥
  • 整理测试集得到 汽车之家,分音塔,roobo, 并在当前模型上做了综合测试。
  • local ASR model 训练
  • 14000h noise training

本周

  • release 测试集
  • 完成local ASR model noise training并得到综合测试结果。
  • 完成14000h noise training 并得到综合测试结构。
Wenqiang Du

上周:

  • roobo口语打分模型训练
  • 日语NHK新闻数据重新加入训练
  • 用新训练的8k模型对16K转8K数据做自适应

本周:

  • 对roobo口语模型进行多组实验
  • 16k转8k新模型训练