“Document classification test”版本间的差异
来自cslt Wiki
(→Document classification of Sougou data) |
(→Document classification of Sougou data) |
||
第3行: | 第3行: | ||
:* Data from SougouLab [http://www.sogou.com/labs/dl/c.html],using SogouC.reduced(30M) | :* Data from SougouLab [http://www.sogou.com/labs/dl/c.html],using SogouC.reduced(30M) | ||
:* 9-Classes:财经,IT,健康,体育,旅游,教育,招聘,文化,军事 | :* 9-Classes:财经,IT,健康,体育,旅游,教育,招聘,文化,军事 | ||
+ | *Text preprocessing | ||
===VSM tset=== | ===VSM tset=== |
2014年9月7日 (日) 13:29的版本
Document classification of Sougou data
- DATA
- Data from SougouLab [1],using SogouC.reduced(30M)
- 9-Classes:财经,IT,健康,体育,旅游,教育,招聘,文化,军事
- Text preprocessing