“Text-2014-08-28”版本间的差异
来自cslt Wiki
(以内容“一 Bilingual word embedding for phrase-based machine translation: 1.获得思路: 以前是先分别训练词向量,再做transform.这篇文文章在...”创建新页面) |
(没有差异)
|
2014年8月29日 (五) 01:00的最后版本
一 Bilingual word embedding for phrase-based machine translation:
1.获得思路:
以前是先分别训练词向量,再做transform.这篇文文章在训练词向量的同时,还利用了语料中的对齐信息.
1.1 学习对齐信息,即学习A(对齐矩阵)
1.2 先学习transform,在学习词向量,进行迭代学习。
1.3 将论文中的公式(5)和公式(6)同时考虑放在学习中。
二 Continuous space translation models with NN
1. 利用标准的wsj语料训练RNNLM,看测试结果是否变好.
1.1 训练语料:/nfs/disk/perm/data/corpora/wsj/data/wsj0/doc/lng_modl/lm_train
2. 标准化测试集和训练集
3. 查看邢超推荐的NNLM的训练流程
Recorded by Rong Liu