“FreeNeb status Report 2018-12-24”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
第173行: 第173行:
 
|Wenqiang Du ||
 
|Wenqiang Du ||
 
上周:
 
上周:
* 16K-8K数据处理、数据验证
+
* 8K数据(9400h)chain模型训练(预计最快还要11天)
* aishell-8k与原始8k模式数据融合训练
+
* 日语graph以及大小语言模型解码
 
+
* 日语的chain模型做区分性训练(问题排查中)
 +
* 16k-8k的数据各项测试(结果持续更新到bugdb上)
 
||
 
||
 
本周:
 
本周:
* 继续8k模型数据验证与训练
+
* 继续8K数据大模型训练
 +
* 16k-8k方法验证
 
||
 
||
 
||
 
||
 
|-
 
|-
 
|}
 
|}

2018年12月24日 (一) 01:25的版本

This Week:

People Last Week This Week Meet Minutes Task Tracing(DeadLine)
Mengyuan Zhao

本周:

  • 工程化
  1. 熟悉语音分割流程

下周:

  • 工程化
  1. 继续梳理demo list,并上线。
Zhiyong Zhang

本周:

  1. TTS-海峡研究院特定说话人语音合成--16k-TTS train and adaptation done, 已发送demo语音给海峡
  2. MVS-AP82 EVB板带录音demo已跑通,可烧进板子测试
  3. 自有嵌入式代码已在板子上编译通过,下一步待烧进板子测试

下周:

  1. ASR-decoder重置
  2. 浮点运算ASR 板子性能测试
  3. 嵌入式模型结构探索
Yang Wei

本周:

  • 外包声纹demo分数问题定位

下周:

  • 完成外包声纹demo测试
  • 新版asr socket server部署测试
Zhenlong Han

本周:

  1. 整理项目工具框架
  2. 跟进国网标注
  3. 双猴京华项目支持
  4. 分音塔标注检查

下周:

  1. 训练国网模型
  2. 整理工具脚本
Shuai Zhang

本周:

  1. asr服务端更换模型
  2. release x-vector Demo
  3. vad engine 需求更新修改

下周:

  1. vad engine bug修改
  2. 所有demo更新引擎
  3. 助残项目计划


Yanchi Jin

本周:

  • 持续完成分音塔月度计划
  1. 完成105h数据的声学模型训练,对以往结果进行对比。
  • 完成训练平台语言模型、声学模型、造graph流程

下周:

  • 持续完成分音塔月度计划
  1. 完成最新标注的30h数据的声学模型训练+标注文本的语言模型训练。
  • 完成训练平台前端接口,完善训练平台流程
Rong Liu

上周 1. 京华合同落地 2. 需求沟通,友杰智新离线asr和语种识别;海天瑞声的离线asr匹配 3. 国网项目沟通,结项情况推进;提供维语语音识别相关项目资料 4. 智能助残demo需求确定,开发对接禹为,初步方案确定

下周: 1. 品牌共享+自适应产品推进 2. 友杰智新需求和合作模式沟通 3. 智能助残demo完成

Dong Wang

本周:

  1. . Free宝、债转股、年终奖分配方案基本完成。
  2. .日本中兴、智能管家等项目方案和进展讨论。
  3. .得意音通、中科汇联、深圳硬件公司合作方案讨论。
  4. .《机器学习》合同签署完成,整理bib。

下周:

  1. . 《机器学习》交稿
  2. . 确定Free宝、债转股等方案
Zhiyuan Tang

上周: 1. PyTorch/TensorFlow 工具探索和使用; 2. 歌词生成(古风)进一步落实; 3. ASR 技术报告准备(delayed)。

本周: 1. PyTorch/TensorFlow Speech Recipe 整理上传; 2. 歌词生成进一步推动; 3. 技术报告。

Lantian Li

上周:

  1. 完成 Nnet-vad 和 Energy-vad 的训练与对比测试
  2. 完成九天微联声纹测试(嵌入式)
  3. 调研当前市场声纹 API 发布情况
  4. 开展模型压缩测试

本周:

  1. Nnet-vad 优化
  2. 完成模型压缩测试
Yating Peng

上周:

  • 财务:参加海淀税务组织的新个税法培训;
  • 行政:设计制作公司名片、总结会议纪要、续费、报销、合同盖章处理;

本周:

  • 确定年会地点;
  • 收羽绒服
Shiying

上周:

  • local ASR 结果release(am: clean chain model graph: graph1e-5 graph1e-6 graph1e-7 graph1e-9)
  • 14000h 中文数据clean up(预计还需要超过一周的时间)
  • 与勇哥一起做语音识别小模型探索(目前最小的模型:1.2M 10种命令词识别结果为:8.81%)

本周

  • 继续中文14000h 中文数据clean up
  • 语音识别小模型(尽量将模型控制在1M以内)
Wenqiang Du

上周:

  • 8K数据(9400h)chain模型训练(预计最快还要11天)
  • 日语graph以及大小语言模型解码
  • 日语的chain模型做区分性训练(问题排查中)
  • 16k-8k的数据各项测试(结果持续更新到bugdb上)

本周:

  • 继续8K数据大模型训练
  • 16k-8k方法验证