“Asr-nsfc-weekly-2017-12-28”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
(以“{| class="wikitable" !Date!!People !! Last Week !! This Week |- | rowspan="5"|2017.12.28 |- |清华 || * || * |- |- |新大 || * || * |- |- |民大 || * ||...”为内容创建页面)
 
 
(1位用户的4个中间修订版本未显示)
第1行: 第1行:
 
{| class="wikitable"
 
{| class="wikitable"
!Date!!People !! Last Week !! This Week
+
!Date!!People !! 2017 !! 2018
 
|-
 
|-
 
| rowspan="5"|2017.12.28
 
| rowspan="5"|2017.12.28
第6行: 第6行:
 
|清华
 
|清华
 
||  
 
||  
*  
+
* 哈萨克语语音识别baseline系统构建
 +
* 多语言混合解码实现
 +
** 非相似语种效果较好
 +
** 相似语种识别有待提高
 +
*藏语baseline
 
||  
 
||  
*  
+
* 相似语种LID系统
 +
* 数据库扩展
 +
* 蒙语,柯尔克孜语baseline
 
|-
 
|-
 
|-
 
|-
第20行: 第26行:
 
|民大
 
|民大
 
||  
 
||  
*
+
*藏语拉萨话以音节为单位的发音字典校对(6014个音节)
 +
*新建藏语夏河话以音节为单位的发音字典(6014个音节)
 +
*新建70000词条的藏语词典
 +
*确定蒙语音素集
 +
*建立29000词条的蒙语词典
 +
*选择藏语、蒙语发音文本
 +
*开发手机语料收集系统
 +
*新建15小时左右藏语拉萨话语音语料
 
||
 
||
*
+
*藏语拉萨话100小时
 +
*藏语夏河话100小时
 +
*蒙语50小时
 +
*建立baseline,对藏语夏河话和蒙语词典、语料质量进行验证
 
|-
 
|-
 
|}
 
|}
 
-------------------------------------------------------------------------------
 
-------------------------------------------------------------------------------
{| class="wikitable"
 
!Date!!People !! Last Week !! This Week
 
|-
 
| rowspan="5"|2017.09.25
 
|-
 
|清华
 
||
 
* apply fake Lid into Gsoftmax model(in progress)
 
||
 
* finish fake Lid decoding
 
|-
 
|-
 
|新大
 
||
 
* acoustic normalization tool, and parallel phonemes for 3 languages is prepared, and used for spell checking and acoustic dictionary building.
 
||
 
* correct Kazak speech corpora problems.
 
* improve Kirghiz text corpus quality, especially spelling mistakes .
 
* work on multilingual morpheme segmenter tool for three languages.
 
|-
 
|-
 
|民大
 
||
 
*
 
||
 
*
 
|-
 
|}
 

2017年12月29日 (五) 05:12的最后版本

Date People 2017 2018
2017.12.28
清华
  • 哈萨克语语音识别baseline系统构建
  • 多语言混合解码实现
    • 非相似语种效果较好
    • 相似语种识别有待提高
  • 藏语baseline
  • 相似语种LID系统
  • 数据库扩展
  • 蒙语,柯尔克孜语baseline
新大
民大
  • 藏语拉萨话以音节为单位的发音字典校对(6014个音节)
  • 新建藏语夏河话以音节为单位的发音字典(6014个音节)
  • 新建70000词条的藏语词典
  • 确定蒙语音素集
  • 建立29000词条的蒙语词典
  • 选择藏语、蒙语发音文本
  • 开发手机语料收集系统
  • 新建15小时左右藏语拉萨话语音语料
  • 藏语拉萨话100小时
  • 藏语夏河话100小时
  • 蒙语50小时
  • 建立baseline,对藏语夏河话和蒙语词典、语料质量进行验证