<?xml version="1.0"?>
<?xml-stylesheet type="text/css" href="http://index.cslt.org/mediawiki/skins/common/feed.css?303"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-cn">
		<id>http://index.cslt.org/mediawiki/index.php?action=history&amp;feed=atom&amp;title=Sinovoice-2015-09-22</id>
		<title>Sinovoice-2015-09-22 - 版本历史</title>
		<link rel="self" type="application/atom+xml" href="http://index.cslt.org/mediawiki/index.php?action=history&amp;feed=atom&amp;title=Sinovoice-2015-09-22"/>
		<link rel="alternate" type="text/html" href="http://index.cslt.org/mediawiki/index.php?title=Sinovoice-2015-09-22&amp;action=history"/>
		<updated>2026-04-10T07:50:45Z</updated>
		<subtitle>本wiki的该页面的版本历史</subtitle>
		<generator>MediaWiki 1.23.3</generator>

	<entry>
		<id>http://index.cslt.org/mediawiki/index.php?title=Sinovoice-2015-09-22&amp;diff=16879&amp;oldid=prev</id>
		<title>2015年9月22日 (二) 07:24 Yanglibo</title>
		<link rel="alternate" type="text/html" href="http://index.cslt.org/mediawiki/index.php?title=Sinovoice-2015-09-22&amp;diff=16879&amp;oldid=prev"/>
				<updated>2015-09-22T07:24:13Z</updated>
		
		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class='diff diff-contentalign-left'&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;tr style='vertical-align: top;'&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;←上一版本&lt;/td&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;2015年9月22日 (二) 07:24的版本&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第59行：&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第59行：&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;MPE慢，1小时处理4小时语音；更瘦的&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;MPE慢，1小时处理4小时语音；更瘦的&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;快速MPE？800sil&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;快速MPE？800sil&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;平安的出来3个MPE&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;平安的出来3个MPE，但是需要调整参数，进行训练，不是很容易训练好；&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;查中英混的MPE&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;查中英混的MPE&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第241行：&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第241行：&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;train_phn_ly4_c320_lr0.00004(iter5)&amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160;  21.30&amp;#160; &amp;#160; &amp;#160; &amp;#160; 20.79&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;train_phn_ly4_c320_lr0.00004(iter5)&amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160;  21.30&amp;#160; &amp;#160; &amp;#160; &amp;#160; 20.79&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;train_phn_ly4_c320_lr0.00004(iter6)&amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160;  20.84&amp;#160; &amp;#160; &amp;#160; &amp;#160; 20.30&amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160; 2.5day/iter&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;train_phn_ly4_c320_lr0.00004(iter6)&amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160;  20.84&amp;#160; &amp;#160; &amp;#160; &amp;#160; 20.30&amp;#160; &amp;#160; &amp;#160; &amp;#160; &amp;#160; 2.5day/iter&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;还没有找到进行类似MPE的训练方法；&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==中英混识==	&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==中英混识==	&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第296行：&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第296行：&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;用实际语料标注的8K测试，CER：88%；&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;用实际语料标注的8K测试，CER：88%；&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;声学和语言模型，均不匹配；&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;声学和语言模型，均不匹配；&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;文本语料：普通话翻译成粤语&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==维语16K==&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==维语16K==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第360行：&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第362行：&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;重新聚类的切分：开源工具（有话者分离功能）&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;重新聚类的切分：开源工具（有话者分离功能）&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;彩铃的识别：&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;彩铃的识别：REPET的相关信息，有源码，不过是matlab的，需要转成C；&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==声纹识别==&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==声纹识别==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Yanglibo</name></author>	</entry>

	<entry>
		<id>http://index.cslt.org/mediawiki/index.php?title=Sinovoice-2015-09-22&amp;diff=16878&amp;oldid=prev</id>
		<title>2015年9月22日 (二) 05:23 Yanglibo</title>
		<link rel="alternate" type="text/html" href="http://index.cslt.org/mediawiki/index.php?title=Sinovoice-2015-09-22&amp;diff=16878&amp;oldid=prev"/>
				<updated>2015-09-22T05:23:59Z</updated>
		
		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class='diff diff-contentalign-left'&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;tr style='vertical-align: top;'&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;←上一版本&lt;/td&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;2015年9月22日 (二) 05:23的版本&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第155行：&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第155行：&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==中文8K==&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==中文8K==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;*第三季度目标	当前WER:75%；目标WER:&amp;gt;78% (相对下降10%) &amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;*第三季度目标	当前WER:75%；目标WER:&amp;gt;78% (相对下降10%) &amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;===并行训练===&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;===并行训练===&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;训练机更换第四块GPU卡？&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;训练机更换第四块GPU卡？&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第203行：&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第204行：&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;PPL：64 CER：0.14&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;PPL：64 CER：0.14&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;准备：增加标注数据，整理数据，在迭代训训练；&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;使用500+的语料，进行独立训练，明天MPE可能有结果；&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;===平安项目===&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;===平安项目===&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第214行：&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第215行：&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;文本的自动分类：&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;文本的自动分类：&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;声学模型895H，开始训练；从头开始训练，已训练完成DNN的MPE，准备再迭代一次MPE；&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;声学模型895H，已训练完成；&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;语言模型，需要话者分离，进行分类模型训练：正在做工具；&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;语言模型，需要话者分离，进行分类模型训练：正在做工具；&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;将文本语料按照话者分离的结果，分开训练：客户的PPL 160提高到143；&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;混50G自由说模型；之前测试是75%&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;===RNN===&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;===RNN===&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第322行：&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第325行：&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;发布了一个维语模型，需要识别标注语料，发布的是word模型：&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;发布了一个维语模型，需要识别标注语料，发布的是word模型：&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;model_35h_20150828 CER:0.419693683925&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;model_35h_20150828 CER:0.419693683925&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;导出64小时，声学和语言模型进行优化。&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==其他语种==&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==其他语种==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第351行：&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第356行：&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;*聚类存在BUG，确认是不同数据库的精度造成的，是算法不太鲁棒；&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;*聚类存在BUG，确认是不同数据库的精度造成的，是算法不太鲁棒；&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;*英达财险角色判定错误，需要定位问题；&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;*英达财险角色判定错误，需要定位问题；&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;角色判断：&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;重新聚类的切分：开源工具（有话者分离功能）&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;#160;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;彩铃的识别：&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==声纹识别==&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;==声纹识别==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Yanglibo</name></author>	</entry>

	<entry>
		<id>http://index.cslt.org/mediawiki/index.php?title=Sinovoice-2015-09-22&amp;diff=16877&amp;oldid=prev</id>
		<title>Yanglibo：以“==数据== *第三季度目标 ===语音数据=== *数字字母串 电话录音,已录音完毕，已完成1500句校对，还有5500句尚未校对完毕；  *16K...”为内容创建页面</title>
		<link rel="alternate" type="text/html" href="http://index.cslt.org/mediawiki/index.php?title=Sinovoice-2015-09-22&amp;diff=16877&amp;oldid=prev"/>
				<updated>2015-09-22T05:02:20Z</updated>
		
		<summary type="html">&lt;p&gt;以“==数据== *第三季度目标 ===语音数据=== *数字字母串 电话录音,已录音完毕，已完成1500句校对，还有5500句尚未校对完毕；  *16K...”为内容创建页面&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新页面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;==数据==&lt;br /&gt;
*第三季度目标&lt;br /&gt;
===语音数据===&lt;br /&gt;
*数字字母串&lt;br /&gt;
电话录音,已录音完毕，已完成1500句校对，还有5500句尚未校对完毕；&lt;br /&gt;
&lt;br /&gt;
*16K 灵云数据 &lt;br /&gt;
正在标注输入法数据，除了地点的都标注；&lt;br /&gt;
每周能够标注50H；8月250小时；&lt;br /&gt;
&lt;br /&gt;
*8K &lt;br /&gt;
平安：已标注895小时，继续完成200小时；语言模型极少；&lt;br /&gt;
英大：已标注110小时，还有几个小时，在继续；；&lt;br /&gt;
无锡地税：标注50小时，已标注完成；&lt;br /&gt;
滴滴：已提供625，目标标到700小时；&lt;br /&gt;
山东移动：立项100小时，到25日；&lt;br /&gt;
&lt;br /&gt;
*粤语标注了一个测试集，测试CER:88%；模型:16K降8K；&lt;br /&gt;
兼职有一些，验收一人；&lt;br /&gt;
在开展培训，计划10月18日标注100小时；&lt;br /&gt;
合格1.26小时；提交了10多个小时；30人标注；&lt;br /&gt;
香港业务，下载的语料；&lt;br /&gt;
&lt;br /&gt;
汉语1400的基础，自适应粤语；&lt;br /&gt;
&lt;br /&gt;
*维语&lt;br /&gt;
已标注完成54.05小时，提供训练;&lt;br /&gt;
还有10小时成品，尚未导出，等下次训练时导出；&lt;br /&gt;
又传上了一批开始标注；&lt;br /&gt;
&lt;br /&gt;
===文本数据===&lt;br /&gt;
*香港文本&lt;br /&gt;
在继续下载；&lt;br /&gt;
需要主要下载新闻网站，之前理发店的就下了40G,没有用；共10G清理出400M；&lt;br /&gt;
&lt;br /&gt;
微博数据？&lt;br /&gt;
借助汉语语料？&lt;br /&gt;
汉语翻译成粤语？&lt;br /&gt;
&lt;br /&gt;
*台湾文本&lt;br /&gt;
在继续下载；&lt;br /&gt;
		&lt;br /&gt;
==2 中文16K==&lt;br /&gt;
*第三季度目标	当前WER:93.5%  目标WER:&amp;gt;94.5%&lt;br /&gt;
===DNN===&lt;br /&gt;
		&lt;br /&gt;
===RNN===&lt;br /&gt;
*1700+776H &lt;br /&gt;
baseline 6776 dnn mpe 27.89&lt;br /&gt;
LSTM_xent_iter03_910h 27.99  模型训练中&lt;br /&gt;
七轮结束：25.96  slm解码（blm 19.x,解码变差，可选路径比较多？sil_scale没有调优？）相对与baseline:18.x &lt;br /&gt;
八轮进行中：&lt;br /&gt;
测试集从1000句中挑的；&lt;br /&gt;
e-5,e-7的比较；&lt;br /&gt;
&lt;br /&gt;
*newschedule结论：速度快，但是效果会差些；&lt;br /&gt;
&lt;br /&gt;
*MPE的问题：已解决，跑1400已过；&lt;br /&gt;
MPE慢，1小时处理4小时语音；更瘦的&lt;br /&gt;
快速MPE？800sil&lt;br /&gt;
平安的出来3个MPE&lt;br /&gt;
查中英混的MPE&lt;br /&gt;
&lt;br /&gt;
===TagModel===&lt;br /&gt;
*代码有错：fst加tag时串了；修改后，小实验上效果良好；小米的正在进行merge（nest)；通用模型做的。&lt;br /&gt;
加多个Tag时，只有第一个Tag起作用，后面的没有起作用；&lt;br /&gt;
gmerge，小韩测试，可以出多个，梦原需要核对一下脚本；&lt;br /&gt;
只有biglm时存在问题；&lt;br /&gt;
&lt;br /&gt;
Tag方法要解决的问题：&lt;br /&gt;
语言模型没有覆盖到；&lt;br /&gt;
新的电影名称，人名；&lt;br /&gt;
将新的人名或电影名称加进去；&lt;br /&gt;
老的，如巩俐等，使用加重，weight是手工选的，不是统计的；&lt;br /&gt;
&lt;br /&gt;
期望解决语料不足的问题，但是只能缓解，不能指望有太大的提高；&lt;br /&gt;
&lt;br /&gt;
TagModel名词：&lt;br /&gt;
Tag position 词表大小&lt;br /&gt;
Tag：人名 电影名 ...&lt;br /&gt;
Position：借用语言模型中词；&lt;br /&gt;
词表大小：每个Tag中的词汇量；&lt;br /&gt;
&lt;br /&gt;
原则：&lt;br /&gt;
LM能解决的，就不要用Tag；&lt;br /&gt;
Tag的词表尽量小；&lt;br /&gt;
Position的选择：从发音词典中的词，计算PPL，排序，根据Tag的类型，找PPL最小的词，这些词作为Tag的Position；&lt;br /&gt;
&lt;br /&gt;
问题是：都已解决&lt;br /&gt;
添加一个Tag，小词表范围上是可以的；验证是一致的，添加更多词条，100和10万，结果差不多；Tag的weight值，-1到-5；&lt;br /&gt;
添加多个Tag，目前小韩测试可以，梦原这有问题，之前马习应该已解决，需要对以下脚本；也已解决：fst上的标号乱了；&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
先做一个测试集，最新的电影名：&lt;br /&gt;
统计Count；&lt;br /&gt;
几个Tag（尽可能少）：人名？电影名，电视剧？需要调整weight；&lt;br /&gt;
训练Tag模型测试；&lt;br /&gt;
&lt;br /&gt;
LM和句式的Merge的实验？&lt;br /&gt;
&lt;br /&gt;
振龙测试：&lt;br /&gt;
小米1.75模型，random语料；&lt;br /&gt;
在这个上加tag，按照梦原的方法；&lt;br /&gt;
选10个词，和梦原的一样；&lt;br /&gt;
加Tag，10万级；&lt;br /&gt;
但是识别结果比较离谱；&lt;br /&gt;
&lt;br /&gt;
遗留：&lt;br /&gt;
根据句式，fst的compose，找到唯一路径，选择position；&lt;br /&gt;
在句式模型上，直接进行Tag处理；&lt;br /&gt;
&lt;br /&gt;
*如果Tag中的词加入count，是否有效？&lt;br /&gt;
&lt;br /&gt;
需要验证的(pair的方法)：&lt;br /&gt;
添加一个Tag：&lt;br /&gt;
添加多个Tag：38句，从6.x提高到4.x;&lt;br /&gt;
&lt;br /&gt;
LM和Grammar的试验：&lt;br /&gt;
句式模型，试验有问题，需要查；&lt;br /&gt;
识别率还行，但是有奇怪的问题发生。&lt;br /&gt;
识别偏差大：舒淇；黄渤，韩国；&lt;br /&gt;
G_merge，句式模型，有死循环；&lt;br /&gt;
&lt;br /&gt;
Count还有问题？&lt;br /&gt;
&lt;br /&gt;
===月度语言模型更新===&lt;br /&gt;
*2015-9月,语料下载；&lt;br /&gt;
&lt;br /&gt;
===领域语言模型===&lt;br /&gt;
领域相关模型，类似于声学的mpe，如何描述这个领域？关键词？Grammar？&lt;br /&gt;
&lt;br /&gt;
===小米项目===&lt;br /&gt;
*TagModel:&lt;br /&gt;
Tag：&lt;br /&gt;
句式补充：赵涛在做；&lt;br /&gt;
词表整理：电影里面不是电影名的去掉；还没有做；&lt;br /&gt;
&lt;br /&gt;
*小米线上模型：xiaomi_20150814   0.0175&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
*速度慢&lt;br /&gt;
灵云SDK在查；&lt;br /&gt;
&lt;br /&gt;
*识别后处理&lt;br /&gt;
&lt;br /&gt;
===勤威项目===&lt;br /&gt;
*发布了一个模型：数据62H台湾POI，在6776MPE3上增量；尚未得到用户反馈；&lt;br /&gt;
&lt;br /&gt;
===语音自适应===&lt;br /&gt;
针对个人的&lt;br /&gt;
能提高2~3%(基数CER约10%)&lt;br /&gt;
客户端提取ivector，传给服务器；&lt;br /&gt;
&lt;br /&gt;
==中文8K==&lt;br /&gt;
*第三季度目标	当前WER:75%；目标WER:&amp;gt;78% (相对下降10%) &lt;br /&gt;
===并行训练===&lt;br /&gt;
训练机更换第四块GPU卡？&lt;br /&gt;
启动1400H的8K,DNN,大约1.6倍，正确率基本一样，没有下降；&lt;br /&gt;
RNN的还不支持；&lt;br /&gt;
&lt;br /&gt;
===Darkknowledge===&lt;br /&gt;
*三种方法&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
未标注：soft&lt;br /&gt;
已标注：soft + hard label，diff加权和 实验室是：加权比只有hard会好些。&lt;br /&gt;
mix训练：未标注+已标注&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
*辽宁移动: &lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
400h dark knowledge xEnt + MPE， 有标注和无标注的一起训练，&lt;br /&gt;
Mix训练方法：400h迭代优化，加500小时未标注，晓明已训练完，小韩测试效果变差；&lt;br /&gt;
分析：应该没有太大的增长，对100小时以内的数据，比较显著；&lt;br /&gt;
有时间再查具体原因；已基本达标，优先级降低；&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
*Ensemble training 	&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
13 model ensemble training: 30.81%&lt;br /&gt;
解码ensemble decoding，声学部分，对多个模型的声学后验概率合并输出给后面的解码器；&lt;br /&gt;
准备训练：分领域，分省；&lt;br /&gt;
8K24省的数据，一共500+,每省20小时左右；&lt;br /&gt;
列出数据的编码类型；晓明找一下思思给出；&lt;br /&gt;
训练方法：DNN的标准训练方法；&lt;br /&gt;
数据标注抽检合格率85%；&lt;br /&gt;
优先级低，先搁置，等GPU&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===Data selection===&lt;br /&gt;
&amp;lt;pre&amp;gt;	&lt;br /&gt;
Acoustic-based selection: ubm-decoding done. &lt;br /&gt;
Phonetic-based selection: decoding done.&lt;br /&gt;
没有跑。脚本的效率太慢，准备分布式跑，如果还慢，换C++语言重写；&lt;br /&gt;
脚本还没有再修改；&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===滴滴项目===&lt;br /&gt;
引擎修改多选输出；&lt;br /&gt;
HCLG的可以了；CLG的还没有修改；&lt;br /&gt;
&lt;br /&gt;
使用358H语料训练：&lt;br /&gt;
PPL：64 CER：0.14&lt;br /&gt;
&lt;br /&gt;
准备：增加标注数据，整理数据，在迭代训训练；&lt;br /&gt;
&lt;br /&gt;
===平安项目===&lt;br /&gt;
DNN_xent：1400H + 700H 18.16&lt;br /&gt;
DNN_mpe：1400H + 700H 16.87&lt;br /&gt;
CNN：15.37；引擎模型的打包工具已修改完，引擎提交测试；&lt;br /&gt;
&lt;br /&gt;
目标有变化：坐席90%；客户：80%；原来是平均85%；&lt;br /&gt;
一个声学模型，两个语言模型，同时计算；&lt;br /&gt;
文本的自动分类：&lt;br /&gt;
&lt;br /&gt;
声学模型895H，开始训练；从头开始训练，已训练完成DNN的MPE，准备再迭代一次MPE；&lt;br /&gt;
语言模型，需要话者分离，进行分类模型训练：正在做工具；&lt;br /&gt;
&lt;br /&gt;
===RNN===&lt;br /&gt;
700H LSTM_new-sched_4400h 17.39 训练中，平安的数据&lt;br /&gt;
已训练完：17.13；&lt;br /&gt;
MPE的问题已解决，已启动训练；&lt;br /&gt;
平安的数据，如果超过CNN的15.37，则可以商用；CNN MPE有迭代一次，没有明显提升；&lt;br /&gt;
RNN MPE 100H：16.6&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
*phone级识别算法&lt;br /&gt;
On 1400h Chinese data, raid96.&lt;br /&gt;
---------------------------------------------------------  &lt;br /&gt;
model                                                      WER(%)       &lt;br /&gt;
                                                  3-gram LM    5-gram LM      traning time&lt;br /&gt;
---------------------------------------------------------  &lt;br /&gt;
dnn                                               21.00        20.47&lt;br /&gt;
---------------------------------------------------------  &lt;br /&gt;
train_phn_ly4_c320_lr0.00004(iter1)               37.18        36.69&lt;br /&gt;
train_phn_ly4_c320_lr0.00004(iter3)               28.55        25.80&lt;br /&gt;
train_phn_ly4_c320_lr0.00004(iter4)               24.35        23.74&lt;br /&gt;
train_phn_ly4_c320_lr0.00004(iter5)               21.30        20.79&lt;br /&gt;
train_phn_ly4_c320_lr0.00004(iter6)               20.84        20.30          2.5day/iter&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==中英混识==	&lt;br /&gt;
*第三季度目标	支持中英混识，对纯中文影响&amp;lt;1%，混识识别率达到纯中文的95%； &lt;br /&gt;
===8K===&lt;br /&gt;
*RNN 1400+100H	&lt;br /&gt;
DNN_xent                   中文：20.83   英文：57.50&lt;br /&gt;
DNN_xent_ft4200h-hl3       中文：19.52   英文：57.20&lt;br /&gt;
LSTM_xent_iter08_1270h     中文：17.49   英文：48.06&lt;br /&gt;
基本已收敛：17.17% 英文 48.46%&lt;br /&gt;
MPE训练已启动；&lt;br /&gt;
&lt;br /&gt;
*RNN 1400+300H	&lt;br /&gt;
DNN_xent_ft4200h-hl3   中文：20.56   英文：39.75&lt;br /&gt;
LSTM_xent_iter04_1340h 中文：18.93   英文：40.08 训练中&lt;br /&gt;
已跑6轮：中文：17.30；英文：38.16&lt;br /&gt;
第8轮：  中文：17.91；英文：38.69&lt;br /&gt;
第9轮：  中文：17.82；英文：36.38&lt;br /&gt;
Decision Tree Balance;&lt;br /&gt;
&lt;br /&gt;
==中文16K远场==&lt;br /&gt;
*第三季度目标	2米有效角度内，WER:&amp;gt;88%&lt;br /&gt;
===山东共达===&lt;br /&gt;
鲁磊提供了远场声音增强的工具；&lt;br /&gt;
准备用近场声音处理后，进行一个模型的训练；&lt;br /&gt;
&lt;br /&gt;
在使用232小时做实验；在6776H上的增量，已训练完毕，测试集没有没有做增强，测试不好；&lt;br /&gt;
&lt;br /&gt;
录制是单声道还是双声道，增强是对单声道还是双声道的？&lt;br /&gt;
录制，保留原始数据和增强数据；&lt;br /&gt;
6776模型测试，测试集不做增强，11.x;增强后是3.1；&lt;br /&gt;
小米测试集重录，使用小米的模型，从3.1提高到2.8，提高0.3；&lt;br /&gt;
&lt;br /&gt;
===科声讯的方案===&lt;br /&gt;
远场处理方案；Mic芯片；&lt;br /&gt;
芯片已到，先用已有的近场模型测试；&lt;br /&gt;
&lt;br /&gt;
==粤语16K==&lt;br /&gt;
*第三季度目标	目前不支持，目标：支持，WER:&amp;gt;80%&lt;br /&gt;
===声学模型===&lt;br /&gt;
已训练完成 130H&lt;br /&gt;
===语言模型===&lt;br /&gt;
下载语料，训练模型，PPL：1000+&lt;br /&gt;
16K模型：字错误率21.78&lt;br /&gt;
&lt;br /&gt;
==粤语8K==&lt;br /&gt;
*目标	WER:&amp;gt;65%&lt;br /&gt;
===声学模型===&lt;br /&gt;
*需要标注语料，正在招标注员、验收员，进行招聘；&amp;quot;&lt;br /&gt;
*语言模型	&amp;quot;语言模型训练完了，测试结果：&lt;br /&gt;
8k模型：字错误率22.0&lt;br /&gt;
测试集采用的是海天润声给的样本数据，从16k转8k。&amp;quot;&lt;br /&gt;
&lt;br /&gt;
用实际语料标注的8K测试，CER：88%；&lt;br /&gt;
声学和语言模型，均不匹配；&lt;br /&gt;
&lt;br /&gt;
==维语16K==&lt;br /&gt;
WER:85%	&lt;br /&gt;
		&lt;br /&gt;
==维语8K==&lt;br /&gt;
*第三季度目标	目前不支持，目标：支持，WER:&amp;gt;65%&lt;br /&gt;
===声学模型===&lt;br /&gt;
已训练35小时；借用梦原的模型；用16K的lm Model，WER：30%左右；&lt;br /&gt;
===语言模型===&lt;br /&gt;
和新疆大学调试：公司Word；实验室&lt;br /&gt;
35H标注文本数据已提供实验室处理；&lt;br /&gt;
toolkit做完了，维语句子转成monphone串；&lt;br /&gt;
&lt;br /&gt;
word模型：3G+原Word+35H语料 4元&lt;br /&gt;
monphone模型： 4元&lt;br /&gt;
老的模型：word 3元，monphone 4元；&lt;br /&gt;
需要验证元数的影响：将monphone裁剪为3元；&lt;br /&gt;
&lt;br /&gt;
word比monphone好，都是35小时的文本，4元；&lt;br /&gt;
42.5%  44%&lt;br /&gt;
请米吉提老师查一下monphone的分词是否正确？&lt;br /&gt;
&lt;br /&gt;
分词有问题？&lt;br /&gt;
&lt;br /&gt;
实验结论：&lt;br /&gt;
3元的monphone比word好2个点；&lt;br /&gt;
&lt;br /&gt;
发布了一个维语模型，需要识别标注语料，发布的是word模型：&lt;br /&gt;
model_35h_20150828 CER:0.419693683925&lt;br /&gt;
&lt;br /&gt;
==其他语种==&lt;br /&gt;
蒙语&lt;br /&gt;
藏语&lt;br /&gt;
哈语&lt;br /&gt;
朝鲜语&lt;br /&gt;
彝族语&lt;br /&gt;
ASR和TTS，技术方案：客户提供数据，能否和学校合作：需要懂语言的人来处理数据；&lt;br /&gt;
翻译局：朗读&lt;br /&gt;
&lt;br /&gt;
==情感识别==&lt;br /&gt;
*第三季度目标	目前：识别生气，正确率&amp;lt;30%；目标破：识别生气：16K &amp;gt;65%; 8K &amp;gt;60%;&lt;br /&gt;
&lt;br /&gt;
===OpenEar产品化===&lt;br /&gt;
待引擎产品化；&lt;br /&gt;
&lt;br /&gt;
===8K模型训练===&lt;br /&gt;
开发完引擎，选取语料，进行标注；&lt;br /&gt;
&lt;br /&gt;
==话者分离==	&lt;br /&gt;
*第三季度目标	目前：正确率82%；目标：暂无计划，结合项目进行&lt;br /&gt;
===DNN端点检测===&lt;br /&gt;
*端点检测模型：4*400+500，MPE1：&lt;br /&gt;
&lt;br /&gt;
MPE4的模型出来了，但是测试效果没有MPE1好；&lt;br /&gt;
需要测试以下MPE2，MPE3，找到一个最好的；&lt;br /&gt;
&lt;br /&gt;
*聚类存在BUG，确认是不同数据库的精度造成的，是算法不太鲁棒；&lt;br /&gt;
*英达财险角色判定错误，需要定位问题；&lt;br /&gt;
&lt;br /&gt;
==声纹识别==&lt;br /&gt;
*第三季度目标	数字串串长6的EER&amp;lt;1%;支持百万级的实时辨识；&lt;br /&gt;
*数字串模型训练 正在采集数字串语音数据，预期本月内完成；&lt;br /&gt;
*TZNorm算法 TZNorm算法，与预期不符，检查算法的正确性；&lt;br /&gt;
*聚类分类算法 基于Affinity距离的算法研究&lt;br /&gt;
*D-Vector&lt;br /&gt;
*短语音的识别：&lt;/div&gt;</summary>
		<author><name>Yanglibo</name></author>	</entry>

	</feed>