Text-2014-08-28

来自cslt Wiki

跳转至：导航、搜索

一 Bilingual word embedding for phrase-based machine translation:

   1.获得思路：
       以前是先分别训练词向量，再做transform.这篇文文章在训练词向量的同时，还利用了语料中的对齐信息.
        1.1 学习对齐信息,即学习A（对齐矩阵）
        1.2 先学习transform,在学习词向量，进行迭代学习。
        1.3 将论文中的公式（5）和公式（6）同时考虑放在学习中。

二 Continuous space translation models with NN

  1. 利用标准的wsj语料训练RNNLM，看测试结果是否变好.
      1.1 训练语料：/nfs/disk/perm/data/corpora/wsj/data/wsj0/doc/lng_modl/lm_train
  2. 标准化测试集和训练集
  3. 查看邢超推荐的NNLM的训练流程

Recorded by Rong Liu

取自“http://index.cslt.org/mediawiki/index.php?title=Text-2014-08-28&oldid=10820”