“Asr-nsfc-weekly-2016-12-12”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
(以“ {| class="wikitable" !Date!!People !! Last Week !! This Week |- | rowspan="5"|2016.12.12 |- |清华 || * 主要进行语言模型相关工作,发现当前语料...”为内容创建页面)
 
第7行: 第7行:
 
|清华
 
|清华
 
||  
 
||  
* 主要进行语言模型相关工作,发现当前语料有过多内容不适合做语言模型,寻找了一批新的语料,对新的语料进行处理
+
* 主要进行语言模型相关工作,发现当前语料有过多内容不适合做语言模型,寻找了一批新的语料,并对新的语料进行了处理工作。
 
||  
 
||  
* 完成当前语料的处理工作,统计总数,如果总数不足,再通过网页爬取的方式,对语料做补充
+
* 完成当前语料的处理工作并统计总数,如果总数不足,再通过网页爬取的方式,对语料进行补充。
 
|-
 
|-
 
|-
 
|-

2016年12月12日 (一) 01:57的版本

Date People Last Week This Week
2016.12.12
清华
  • 主要进行语言模型相关工作,发现当前语料有过多内容不适合做语言模型,寻找了一批新的语料,并对新的语料进行了处理工作。
  • 完成当前语料的处理工作并统计总数,如果总数不足,再通过网页爬取的方式,对语料进行补充。
新大
民大

Date People Last Week This Week
2016.12.05
清华
  • 发现CodeMap有一些问题,对语料进行转换时会造成一些错误。
  • 尝试降低test集语料对语言模型的ppl
  • 继续语言模型的相关工作。
新大
  • Recording works on Kazak utterances are finished.
  • Checking and preparing Kazak AM text corpora.
  • Revise Kazak LM corpora and some supporting programs.
民大
  • 挑选6000句左右的正式发音文本
  • 校对拉萨话发音词典1000条左右
  • 藏语拉萨话发音词典的校对
  • 蒙语词典录入