“Search method”版本间的差异
来自cslt Wiki
(→find) |
|||
第25行: | 第25行: | ||
|} | |} | ||
==find== | ==find== | ||
− | *采用最细粒度分词,可以提高正确率。61=>66.对于标准问题建索引时. | + | * 采用最细粒度分词(对于标准问题在建立索引时,模板不用),可以提高正确率。61=>66.对于标准问题建索引时. |
+ | * 对输入的问题不应用细粒度分词(细粒度的59%,不用66%)。 |
2014年11月5日 (三) 12:04的版本
lucene method
- data set
- jiangkaipeng:
- result
method | Default | BM25 | LMDirichlet | DFR | LMJelinekMercer | IB |
---|---|---|---|---|---|---|
Accary | 0.66228 | 0.66228 | 0.4091 | 0.65476 | 0.65476 | 0.6666 |
our method
method | lucene | BM25 | VSM |
---|---|---|---|
Accary | 0.6184 | 0.614 | 0.377 |
find
- 采用最细粒度分词(对于标准问题在建立索引时,模板不用),可以提高正确率。61=>66.对于标准问题建索引时.
- 对输入的问题不应用细粒度分词(细粒度的59%,不用66%)。