“Search method”版本间的差异
来自cslt Wiki
(→find) |
|||
| 第2行: | 第2行: | ||
*data set | *data set | ||
:* jiangkaipeng: | :* jiangkaipeng: | ||
| − | * result | + | * different method result |
{| border="2px" | {| border="2px" | ||
| 第11行: | 第11行: | ||
! Accary | ! Accary | ||
| 0.66228 || 0.66228 || 0.4091 || 0.65476 || 0.65476 || 0.6666 | | 0.66228 || 0.66228 || 0.4091 || 0.65476 || 0.65476 || 0.6666 | ||
| + | |- | ||
| + | |} | ||
| + | * add boost keyword | ||
| + | {| border="2px" | ||
| + | |+ boost keyword in lucene | ||
| + | |- | ||
| + | ! method !!Default !! idf_train !! idf_train_norm!! idf_baidu !! idf_baidu_norm | ||
| + | |- | ||
| + | ! Accary | ||
| + | | 0.66228 || 0.66228 || 0.651629 ||0.57644|| 0.647869|| 0.65288 || 0.6666 | ||
|- | |- | ||
|} | |} | ||
2014年11月5日 (三) 12:13的版本
lucene method
- data set
- jiangkaipeng:
- different method result
| method | Default | BM25 | LMDirichlet | DFR | LMJelinekMercer | IB |
|---|---|---|---|---|---|---|
| Accary | 0.66228 | 0.66228 | 0.4091 | 0.65476 | 0.65476 | 0.6666 |
- add boost keyword
| method | Default | idf_train | idf_train_norm | idf_baidu | idf_baidu_norm | ||
|---|---|---|---|---|---|---|---|
| Accary | 0.66228 | 0.66228 | 0.651629 | 0.57644 | 0.647869 | 0.65288 | 0.6666 |
our method
| method | lucene | BM25 | VSM |
|---|---|---|---|
| Accary | 0.6184 | 0.614 | 0.377 |
find
- 采用最细粒度分词(对于标准问题在建立索引时,模板不用),可以提高正确率。61=>66.对于标准问题建索引时.
- 对输入的问题不应用细粒度分词(细粒度的59%,不用66%)。