“Asr-nsfc-weekly-2016-12-19”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
(以“ {| class="wikitable" !Date!!People !! Last Week !! This Week |- | rowspan="5"|2016.12.12 |- |清华 || * 通过爬虫爬取了 http://www.elarna.com/tote.php和htt...”为内容创建页面)
 
 
(2位用户的3个中间修订版本未显示)
第3行: 第3行:
 
!Date!!People !! Last Week !! This Week
 
!Date!!People !! Last Week !! This Week
 
|-
 
|-
| rowspan="5"|2016.12.12
+
| rowspan="5"|2016.12.19
 
|-
 
|-
 
|清华
 
|清华
 
||  
 
||  
* 通过爬虫爬取了 http://www.elarna.com/tote.php和http://kazakh.people.com.cn/ 中的一些数据,完成了爬取语料的处理工作
+
* 通过爬虫爬取了 http://www.elarna.com/tote.php 和 http://kazakh.people.com.cn/ 中的一些数据,完成了爬取语料的处理工作
 
||  
 
||  
 
* 针对重新补录的数据集重新训练AM模型,使用网络爬取的语料和处理过的翻译局提供的语料生成LM。
 
* 针对重新补录的数据集重新训练AM模型,使用网络爬取的语料和处理过的翻译局提供的语料生成LM。
第14行: 第14行:
 
|新大
 
|新大
 
||  
 
||  
*  
+
* We collected a Chinese-Russian-Kazak parallel corpus of dialog, which, we think, is free from spelling mistakes.
*
+
 
||  
 
||  
*
+
* Keep working on Kazak acousic dictionary tool, which has not been finished.
*
+
 
|-
 
|-
 
|-
 
|-
 
|民大
 
|民大
 
||  
 
||  
*  
+
* 完成藏语拉萨话发音词典的校对
*  
+
* 藏语口语发音文本翻译完成500句
 
||  
 
||  
*  
+
* 藏语和蒙语书面发音文本的选择
*  
+
* 口语发音文本翻译
 
|-
 
|-
 
|}
 
|}

2016年12月19日 (一) 13:55的最后版本

Date People Last Week This Week
2016.12.19
清华
  • 针对重新补录的数据集重新训练AM模型,使用网络爬取的语料和处理过的翻译局提供的语料生成LM。
新大
  • We collected a Chinese-Russian-Kazak parallel corpus of dialog, which, we think, is free from spelling mistakes.
  • Keep working on Kazak acousic dictionary tool, which has not been finished.
民大
  • 完成藏语拉萨话发音词典的校对
  • 藏语口语发音文本翻译完成500句
  • 藏语和蒙语书面发音文本的选择
  • 口语发音文本翻译

Date People Last Week This Week
2016.12.12
清华
  • 主要进行语言模型相关工作,发现当前语料有过多内容不适合做语言模型,寻找了一批新的语料,并对新的语料进行了处理工作。
  • 完成当前语料的处理工作并统计总数,如果总数不足,再通过网页爬取的方式,对语料进行补充。
新大
  • 1504 Kazak utterance recording work has finished.
  • 4000 Kazak AM text corpora revised again.
  • Revising Kazak acoustic dictionary tool.
  • keep checking Kazak LM corpora.
民大
  • 校对拉萨话发音词典1000条左右
  • 确定6000句藏语书面语发音文本
  • 藏语拉萨话发音词典的校对
  • 口语发音文本翻译