2014-11-18

来自cslt Wiki
2014年11月18日 (二) 01:29Lr讨论 | 贡献的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索
 拼写检查功能模块的测试报告如下:
 author CaoLi   date:2014 11.17

1)先对测试集进行自动分词后再手动改错业务词,进行测试.条数:200条.详细结果见test-model-RESULT.txt

测试集为:测试集(.\corpus\20141016凉山州\3文本\testJ.txt)前200条,注意是只取每一条对应的问题. 使用的语言模型:使用训练集<凉山州政务知识训练集1016.xls>中的<标准问题 答案>训练的3-gram语言模型 测试结果的评价标准:

  正确率=正确识别出需要修改的个体总数/识别出需要修改的个体总数
  召回率=正确识别出需要修改的个体总数/测试集中存在的需要修改的个体总数
  准确率=修改对的个体总数/个体总数

RESULT: 需要修改:正确率:173/191 = 0.905759 召回率: 173/373 = 0.463806 不要修改:正确率:1010/1210 = 0.834710召回率:1010/1028 = 0.982490 准确率:1134/1401 = 0.809422

2) 先对测试集进行自动分词后再手动改错业务词,进行测试.条数:200条.详细结果见language-model-RESULT.txt

 测试集为:测试集(..\corpus\20141016凉山州\3文本\testJ.txt)前200条,注意是只取每一条对应的问题.
 使用的语言模型:换用language-model语言模型

 测试结果的评价标准:
  正确率=正确识别出需要修改的个体总数/识别出需要修改的个体总数
  召回率=正确识别出需要修改的个体总数/测试集中存在的需要修改的个体
  总数
  准确率=修改对的个体总数/个体总数

RESULT: 需要修改:正确率:193/212 = 0.910377 召回率:193/373 = 0.517426 不要修改:正确率:1009/1189 = 0.848612召回率:1009/1028 = 0.981517 准确率:1185/1401 = 0.845824