“Asr-nsfc-weekly-2017-01-03”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
(以“ {| class="wikitable" !Date!!People !! Last Week !! This Week |- | rowspan="5"|2017.01.03 |- |清华 || *哈萨克语TRP完成,生成新的test集 新test集在...”为内容创建页面)
 
 
(2位用户的2个中间修订版本未显示)
第14行: 第14行:
 
|新大
 
|新大
 
||  
 
||  
* 通过两次会议,确定了哈语的音节规则,并根据音节规则检查拼写。发现并更正100多个拼写错误。
+
* syllable based spelling corrections are finished for 4k and 200k corpora.
 +
* Kazak acoustic dictionary program is finished.
 
||  
 
||  
* 20万句子的拼写纠错及发音辞典的建立。
+
* keep work on Kazak ASR corpora problems.
 
|-
 
|-
 
|-
 
|-
 
|民大
 
|民大
 
||  
 
||  
* 完成藏语拉萨话口语翻译800句。
+
藏语拉萨话口语翻译300句。
 +
校对藏语文本语料90000句,蒙语文本语料60000句。
 
||  
 
||  
* 分别准备藏语及蒙语书面语发音文本9万句和6万句。
+
藏语拉萨话口语翻译。
 +
文本正则化处理。
 
|-
 
|-
 
|}
 
|}

2017年1月4日 (三) 08:25的最后版本

Date People Last Week This Week
2017.01.03
清华
  • 哈萨克语TRP完成,生成新的test集 新test集在语音模型上的ppl为192.5较为合理
  • 等新大录好新的test集以后测试
新大
  • syllable based spelling corrections are finished for 4k and 200k corpora.
  • Kazak acoustic dictionary program is finished.
  • keep work on Kazak ASR corpora problems.
民大

藏语拉萨话口语翻译300句。 校对藏语文本语料90000句,蒙语文本语料60000句。

藏语拉萨话口语翻译。 文本正则化处理。


Date People Last Week This Week
2016.12.26
清华
  • 新AM训练完毕,使用网上抓取的数据做了新的LM但是所抓取内容是否有实际意义,有没有抓错无法验证。
  • 写哈萨克语的TRP
新大
  • 通过两次会议,确定了哈语的音节规则,并根据音节规则检查拼写。发现并更正100多个拼写错误。
  • 20万句子的拼写纠错及发音辞典的建立。
民大
  • 完成藏语拉萨话口语翻译800句。
  • 分别准备藏语及蒙语书面语发音文本9万句和6万句。