“NLP Status Report 2017-8-7”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
(以“{| class="wikitable" !Date !! People !! Last Week !! This Week |- | rowspan="6"|2017/7/3 |Jiyuan Zhang || *made the poster for ACL [http://cslt.riit.tsinghua.edu.cn/...”为内容创建页面)
第2行: 第2行:
!Date !! People !! Last Week !! This Week
!Date !! People !! Last Week !! This Week
| rowspan="6"|2017/7/3
| rowspan="6"|2017/8/7
|Jiyuan Zhang ||
|Jiyuan Zhang ||
*made the poster for ACL [http://cslt.riit.tsinghua.edu.cn/mediawiki/images/9/95/Acl2017-poster.pdf]
*generated streame according to a couplet
*attempted to fix repeated word, but failed
*almost completed the task of filling in the blanks of a couplet
*done some work of n-gram model of the couplet
*generate streame according to a couplet
*continue to perfect the couplet model
*complete the task of filling in the blanks of a couplet
|Aodong LI ||
|Aodong LI ||
* Got 55,000+ Englsih poems and 260,000+ lines after preprocessing
* Added phase separators as the style indicator, and every line has at least one separator
* Training loss didn't decrease very much, only from 440 to 50
* The translation quality deteriorated when added language model
* Try to use a larger language model to decrease the training loss
* Try to use character-based MT in English-Chinese translation
|Shiyue Zhang ||  
|Shiyue Zhang ||  
第27行: 第20行:
|Shipan Ren ||
|Shipan Ren ||
* looked for the performance(the bleu value) of other models
  on the WMT2014 dataset from the published papers,but not found.
* installed and built Moses on the server 
* train statistical machine translation model and test it  
* train statistical machine translation model and test it  
   toolkit: Moses
   toolkit: Moses
   data sets:WMT2014 en-de、en-fr data sets
   data sets:WMT2014 en-de、en-fr data sets
* collate experimental results.compare our baseline model with Moses  
* collate experimental results.compare our baseline model with Moses  
  en-de dataset
  en-fr datasets
  under training
* read memory-augment NMT code
* think about the next step work
第44行: 第42行:
*read model source code
*read model source code
*run Shiji-based model
*combine Shiji and Zizhitongjian,then run the model
在 秦国 做国 人 的 第二 , 与 张仪 一起 进言 , 于是 派 司马错 率兵 攻打 蜀地 , 于是 攻克 了 , 乘势 攻下 了 。
因 冯直 有 的 言辞 和 他 的 情况 , 往往 得不到 安宁 罢了 。
    到 了 道术 _UNK 的 方法 , 弃 _UNK _UNK , _UNK _UNK , 赦免 天时 , 使人 著 儒家 的 态度 。
    教化 礼制 _UNK 法度 , 一定 要 根据 这 方法 发展 治理 百姓 。
    无 德行 的 人 , 无不 分明 , 所以 能够 忍受 八万余 人 。
    _UNK _UNK 就 完备 了 , 那么 国家 的 强盛 就 会 疲惫 , _UNK 鬼神 就 会
    当今 天子 到 各 封地 , 建立 到 长安 , 而 国内 没有 得到 右翼 , 就 当上 了 出使 最下 等 的 事 。 我 死 了 , 你 必然 当上 了 大官 ; 不 为 我 要死 呢 。
    孔子 说 : ‘ 我 想 把 她 作 俸禄 的 恶名 , 不 在于 见到 他 的 行事 , 就 感动 得 很 容易 考虑 。
    他 的 部属 都 认为 好人 很 好 , 认为 他 不 了解 他 的 大义 , 被 处以 死刑 的 刑罚 , 不敢 再 推辞 。
汉 王朝 兴起 , 到达 天子 , 平定 华夏 _UNK , 消除 _UNK , 消除 _UNK , 整治 _UNK , 统一 度量衡 , 整治 满足 本人 的 需要 , 准备 调节 _UNK , 请 举行 _UNK 。
    韩厥 慈爱 孝顺 的 功绩 , _UNK _UNK 为 他 。
作 《 项羽 本纪 》 第二十七 。
    《 春秋 》 以后 , 诸侯 独断专行 , 安抚 四方 国家 ; _UNK 到 秦国 , 最终 并吞 夏朝 的 土地 , 消灭 了 周室 , 他 的 封号 。
    作 《 魏公子 _UNK 列传 》 _UNK 。
太公 、 孙子 、 吴 、 王子 继位 则 有 明智 而 有 明智 之心 , 违背 天道 , 无不 分明 。
    运筹帷幄之中 , 安抚 耕种 ; 他 的 运行 则 驰骋 弋猎 的 声音 , 招来 了 一套 _UNK 的 利益 , 违背 风俗 , 补救 积弊 , 去掉 节俭 的 性能 。
    成王 年龄 尚幼 , 公室 非常 怀疑 他 , 淮夷 背叛 他 , 于是 召公 振兴 了 成王 , 占有 了 天下 的 政权 。

2017年8月21日 (一) 00:48的最后版本

Date People Last Week This Week
2017/8/7 Jiyuan Zhang
  • generated streame according to a couplet
  • almost completed the task of filling in the blanks of a couplet
  • continue to perfect the couplet model
Aodong LI
Shiyue Zhang
Shipan Ren
  • train statistical machine translation model and test it
 toolkit: Moses
 data sets:WMT2014 en-de、en-fr data sets
  • collate experimental results.compare our baseline model with Moses
 en-de dataset
 en-fr datasets
 under training
  • read memory-augment NMT code
  • think about the next step work
Jiayu Guo
  • process document.Until now, Shiji has been split up to 2,4000 pairs of sentence.
  • Zizhitongjian has been split up to 1,6000 pairs.
  • adjust jieba source code, in order to make jieba more accurate for ancient language wordpiece
  • read model source code
  • run Shiji-based model
  • combine Shiji and Zizhitongjian,then run the model

在 秦国 做国 人 的 第二 , 与 张仪 一起 进言 , 于是 派 司马错 率兵 攻打 蜀地 , 于是 攻克 了 , 乘势 攻下 了 。 因 冯直 有 的 言辞 和 他 的 情况 , 往往 得不到 安宁 罢了 。     到 了 道术 _UNK 的 方法 , 弃 _UNK _UNK , _UNK _UNK , 赦免 天时 , 使人 著 儒家 的 态度 。     教化 礼制 _UNK 法度 , 一定 要 根据 这 方法 发展 治理 百姓 。     无 德行 的 人 , 无不 分明 , 所以 能够 忍受 八万余 人 。     _UNK _UNK 就 完备 了 , 那么 国家 的 强盛 就 会 疲惫 , _UNK 鬼神 就 会     当今 天子 到 各 封地 , 建立 到 长安 , 而 国内 没有 得到 右翼 , 就 当上 了 出使 最下 等 的 事 。 我 死 了 , 你 必然 当上 了 大官 ; 不 为 我 要死 呢 。     孔子 说 : ‘ 我 想 把 她 作 俸禄 的 恶名 , 不 在于 见到 他 的 行事 , 就 感动 得 很 容易 考虑 。     他 的 部属 都 认为 好人 很 好 , 认为 他 不 了解 他 的 大义 , 被 处以 死刑 的 刑罚 , 不敢 再 推辞 。 汉 王朝 兴起 , 到达 天子 , 平定 华夏 _UNK , 消除 _UNK , 消除 _UNK , 整治 _UNK , 统一 度量衡 , 整治 满足 本人 的 需要 , 准备 调节 _UNK , 请 举行 _UNK 。     韩厥 慈爱 孝顺 的 功绩 , _UNK _UNK 为 他 。 作 《 项羽 本纪 》 第二十七 。     《 春秋 》 以后 , 诸侯 独断专行 , 安抚 四方 国家 ; _UNK 到 秦国 , 最终 并吞 夏朝 的 土地 , 消灭 了 周室 , 他 的 封号 。     作 《 魏公子 _UNK 列传 》 _UNK 。 太公 、 孙子 、 吴 、 王子 继位 则 有 明智 而 有 明智 之心 , 违背 天道 , 无不 分明 。     运筹帷幄之中 , 安抚 耕种 ; 他 的 运行 则 驰骋 弋猎 的 声音 , 招来 了 一套 _UNK 的 利益 , 违背 风俗 , 补救 积弊 , 去掉 节俭 的 性能 。     成王 年龄 尚幼 , 公室 非常 怀疑 他 , 淮夷 背叛 他 , 于是 召公 振兴 了 成王 , 占有 了 天下 的 政权 。 }