2014-11-19

来自cslt Wiki
2014年11月19日 (三) 12:06Caoli讨论 | 贡献的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索
 拼写检查功能模块的测试报告如下:
 author CaoLi   date:2014 11.19

建立测试集

首先对测试集进行手动改错业务词后再自动分词,进行测试.条数:200条. 例如: 手动改错业务词:

  申请班里高领老人紧贴变更和终止的实现

原句自动分词后:

  申请 班里 高领 老人 紧贴 变更 和 终止 的 实现

测试集为:测试集(.\corpus\20141016凉山州\3文本\testJ.txt)前200条,注意是只取每一条对应的问题.

评价

测试结果的评价标准:

  正确率=正确识别出需要修改的个体总数/识别出需要修改的个体总数
  召回率=正确识别出需要修改的个体总数/测试集中存在的需要修改的个体总数
  准确率=修改对的个体总数/个体总数

例如: 正确:

 我 真 想 办理 身份证 呀. 

测试用例:

 我 挣 像 办理 神风证 压. 

结果:

 我 证 想 班里 身份证 压. 

动作:

 我->我(correct) 像->想(correct) 办理->班里(false) 神风证->身份证(correct) 挣->证(false) 压->压(false) 

评价:

 需要修改: 正确率=3/4. 召回率=3/4. 
 不要修改:正确率=1/2. 召回率=1/2. 
 准确率:3/6

测试结果

1.使用的语言模型:使用训练集<凉山州政务知识训练集1016.xls>中的<标准问题 答案>训练的3-gram语言模型.(详细结果见test-model-RESULT.txt)

RESULT:

 需要修改:正确率:498/498 = 1.0          召回率: 498/881 = 0.565266
 不要修改:正确率:2228/2611 = 0.853313   召回率:  2228/2228 = 1.0 
 准确率 :2678/3109 = 0.861370
   

结果分析

根据上面的结果发现召回率较低,

原因

可能的原因为:由于是先手动改错业务词再根据词表自动分词的。故系统有可能将一个业务词分成了好几个词。

例如:

[汝, 河, 进行, 开发商, 新建, 房产, 权, 等级]

过程: [汝, 河, 进行, 开发商, 新建, 房产, 权, 登机]'score is:29.822336867451668 [汝, 河, 进行, 开发商, 新建, 房产, 权, 等级]'score is:29.208215907216072 [汝, 河, 进行, 开发商, 新建, 房产, 权, 登记]'score is:27.493204072117805 [汝, 河, 进行, 开发商, 新建, 房产, 权, 登基]'score is:29.822336867451668 test result:汝 河 进 行 开 发 商 新 建 房 产 权 登 记

分析: 由于上面将“汝河”分成了“汝”,“河”两个词,系统就不会对词“汝河”进行重新组合并打分。

把改错的业务词分开的所占的比重:44/98=0.448979

例如: 架势证 ------架势 证

改进

可能的改进方法:

我们可以用拼音进行分词,但目前还未采取那样做。