“Document classification test”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
Document classification of Sougou data
Lr讨论 | 贡献
Document classification of Sougou data
第3行: 第3行:
 
:* Data from SougouLab [http://www.sogou.com/labs/dl/c.html],using SogouC.reduced(30M)
 
:* Data from SougouLab [http://www.sogou.com/labs/dl/c.html],using SogouC.reduced(30M)
 
:* 9-Classes:财经,IT,健康,体育,旅游,教育,招聘,文化,军事
 
:* 9-Classes:财经,IT,健康,体育,旅游,教育,招聘,文化,军事
 +
*Text preprocessing
 
===VSM tset===
 
===VSM tset===

2014年9月7日 (日) 13:29的版本

Document classification of Sougou data

  • DATA
  • Data from SougouLab [1],using SogouC.reduced(30M)
  • 9-Classes:财经,IT,健康,体育,旅游,教育,招聘,文化,军事
  • Text preprocessing

VSM tset