“ASR:2015-07-13”版本间的差异

2015年7月16日 (四) 05:40的最后版本

Speech Processing

AM development

Environment

the GPU of grid-14 does not work

RNN AM

hold
morpheme RNN --zhiyuan
train using large dataset--mengyuan

Mic-Array

hold
compute EER with kaldi

====Data selection unsupervised learning

acoustic feature based submodular using Pinan dataset --zhiyong
write code to speed up --zhiyong

RNN-DAE(Deep based Auto-Encode-RNN)

hold
deliver to mengyuan

http://cslt.riit.tsinghua.edu.cn/cgi-bin/cvss/cvss_request.pl?account=zhangzy&step=view_request&cvssid=261

Speaker ID

DNN-based sid --Lantian

http://cslt.riit.tsinghua.edu.cn/cgi-bin/cvss/cvss_request.pl?account=zhangzy&step=view_request&cvssid=327

Ivector&Dvector based ASR

hold --Tian Lan
Cluster the speakers to speaker-classes, then using the distance or the posterior-probability as the metric
dark-konowlege using i-vector
train on wsj(testbase dev93+evl92)

--hold

Dark knowledge

test random last output layer when train MPE --zhiyuan,mengyuan

language vector

train using language vector with the dataset of 1400h_CN + 100h_EN--mengyuan
write a paper--zhiyuan

rectifier

hold
WER performs worse using auraro4 --zhiyuan
train using other dataset
rectifier RNN

audio embedding=

audio ebedding --Wei Xu

Text Processing

RNN LM

character-lm rnn(hold)
lstm+rnn

check the lstm-rnnlm code about how to Initialize and update learning rate.(hold)

Neural Based Document Classification

(hold)

Order representation

Nested Dropout

semi-linear --> neural based auto-encoder.

modify the objective function(hold)

Balance Representation

Find error signal

Recommendation

Reproduce baseline.

LDA matrix dissovle.
LDA (Text classification & Recommendation System) --> AAAI

DSSM based QA

Demo Release.

Seq to Seq(09-15)

Review papers.(Reported in 07-08)

Reproduce baseline.

Text Group Intern Project

====Buddhist Process====

(hold)

RNN Poem Process

(hold)

RNN Document Vector

(hold)

Image Baseline

Demo Release.
Paper Report.

@@ 第2行： / 第2行： @@
 === AM development ===
-==== Environment ====*
+==== Environment ====
 * the GPU of grid-14 does not work
@@ 第16行： / 第16行： @@
 ====Data selection unsupervised learning
 * acoustic feature based submodular using Pinan dataset --zhiyong
+* write code to speed up --zhiyong
@@ 第36行： / 第37行： @@
 ===Dark knowledge===
-* test random last output layer when train MPE --zhiyuan
+* test random last output layer when train MPE --zhiyuan,mengyuan
@@ 第44行： / 第45行： @@
 ===rectifier===
+* hold
 * WER performs worse using auraro4 --zhiyuan
 * train using other dataset
@@ 第62行： / 第64行： @@
 ====Order representation ====
 * Nested Dropout
+:*semi-linear --> neural based auto-encoder.
 * modify the objective function(hold)
 ====Balance Representation====
@@ 第68行： / 第71行： @@
 ====Recommendation====
 * Reproduce baseline.
+:*LDA matrix dissovle.
+:* LDA (Text classification & Recommendation System) --> AAAI
 ====DSSM based QA====
-:*Pre-processing java class.
+* Demo Release.
-* Reproduce baseline.
 ====Seq to Seq(09-15)====
-:* Review papers
+:* Review papers.(Reported in 07-08)
 * Reproduce baseline.
@@ 第84行： / 第88行： @@
 (hold)
 ====Image Baseline====
-(hold)
+:*Demo Release.
+:*Paper Report.

“ASR:2015-07-13”版本间的差异

2015年7月16日 (四) 05:40的最后版本

目录

Speech Processing

AM development

Environment

RNN AM

Mic-Array

RNN-DAE(Deep based Auto-Encode-RNN)

Speaker ID

Ivector&Dvector based ASR

Dark knowledge

language vector

rectifier

audio embedding=

Text Processing

RNN LM

Neural Based Document Classification

Order representation

Balance Representation

Recommendation

DSSM based QA

Seq to Seq(09-15)

Text Group Intern Project

RNN Poem Process

RNN Document Vector

Image Baseline

导航菜单

个人工具

名字空间

变种

查看

操作

搜索

导航

工具