“Spell check”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
(以“==评价标准== 拼写检查的评价标准: 正确率=正确识别出需要修改的个体总数 / 识别出需要修改的个体总数. 召回率=正确识别出...”为内容创建页面)
 
Lr讨论 | 贡献
result
 
(2位用户的11个中间修订版本未显示)
第1行: 第1行:
 
==评价标准==
 
==评价标准==
 
拼写检查的评价标准:
 
拼写检查的评价标准:
 +
 
正确率=正确识别出需要修改的个体总数 / 识别出需要修改的个体总数.
 
正确率=正确识别出需要修改的个体总数 / 识别出需要修改的个体总数.
 +
 
召回率=正确识别出需要修改的个体总数 / 测试集中存在的需要修改的个体总数.
 
召回率=正确识别出需要修改的个体总数 / 测试集中存在的需要修改的个体总数.
 +
 
准确率 = 修改对的个体总数/个体总数
 
准确率 = 修改对的个体总数/个体总数
 +
 
注:正确识别的个体为拼写检查正确的个数,识别出的个体总数为所有进行拼写检查动作的总数.
 
注:正确识别的个体为拼写检查正确的个数,识别出的个体总数为所有进行拼写检查动作的总数.
 +
 
举例:
 
举例:
正确:我 真 想 办理 身份证 呀. 测试用例: 我 挣 像 办理 神风证 压. 结果:我 证 想 班里 身份证 压.
+
 
动作:我->我(correct) 像->想(correct) 办理->班里(false) 神风证->身份证(correct) 挣->证(false)  压->(false)
+
正确:我 真 想 办理 身份证 呀. 测试用例: 我 挣 像 办理 神风证 压. 结果:我 证 想 班里 身份证 压.
需要修改: 正确率=3/4. 召回率=3/4.
+
 
不要修改:正确率=1/2. 召回率=1/2.
+
动作:我->我(correct) 像->想(correct) 办理->班里(false) 神风证->身份证(correct) 挣->证(false)  压->(false)
准确率:3/6
+
 
 +
需要修改: 正确率=3/4. 召回率=3/4.
 +
 
 +
不要修改:正确率=1/2. 召回率=1/2.
 +
 
 +
准确率:3/6
 +
==some source==
 +
* some algorithms of spelling correction [http://www.quora.com/What-are-some-algorithms-of-spelling-correction-that-were-used-by-search-engine][https://documentation.devexpress.com/#WindowsForms/CustomDocument2989]
 +
* How to Write a Spelling Corrector [http://norvig.com/spell-correct.html]
 +
*
 +
==result==
 +
[[2014-11-18]]
 +
 
 +
[[2014-11-19]]

2014年12月9日 (二) 02:20的最后版本

评价标准

拼写检查的评价标准:

正确率=正确识别出需要修改的个体总数 / 识别出需要修改的个体总数.

召回率=正确识别出需要修改的个体总数 / 测试集中存在的需要修改的个体总数.

准确率 = 修改对的个体总数/个体总数

注:正确识别的个体为拼写检查正确的个数,识别出的个体总数为所有进行拼写检查动作的总数.

举例:

正确:我 真 想 办理 身份证 呀. 测试用例: 我 挣 像 办理 神风证 压. 结果:我 证 想 班里 身份证 压.

动作:我->我(correct) 像->想(correct) 办理->班里(false) 神风证->身份证(correct) 挣->证(false) 压->压(false)

需要修改: 正确率=3/4. 召回率=3/4.

不要修改:正确率=1/2. 召回率=1/2.

准确率:3/6

some source

  • some algorithms of spelling correction [1][2]
  • How to Write a Spelling Corrector [3]

result

2014-11-18

2014-11-19