“Search method”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
find
Lr讨论 | 贡献
第2行: 第2行:
 
*data set
 
*data set
 
:* jiangkaipeng:
 
:* jiangkaipeng:
* result
+
* different method result
  
 
{| border="2px"
 
{| border="2px"
第11行: 第11行:
 
! Accary
 
! Accary
 
| 0.66228 || 0.66228 || 0.4091 || 0.65476 || 0.65476 || 0.6666
 
| 0.66228 || 0.66228 || 0.4091 || 0.65476 || 0.65476 || 0.6666
 +
|-
 +
|}
 +
* add boost keyword
 +
{| border="2px"
 +
|+ boost keyword  in lucene
 +
|-
 +
! method !!Default  !! idf_train !! idf_train_norm!! idf_baidu !! idf_baidu_norm
 +
|-
 +
! Accary
 +
| 0.66228 || 0.66228 || 0.651629 ||0.57644|| 0.647869|| 0.65288 || 0.6666
 
|-
 
|-
 
|}
 
|}

2014年11月5日 (三) 12:13的版本

lucene method

  • data set
  • jiangkaipeng:
  • different method result
different result in lucene
method Default BM25 LMDirichlet DFR LMJelinekMercer IB
Accary 0.66228 0.66228 0.4091 0.65476 0.65476 0.6666
  • add boost keyword
boost keyword in lucene
method Default idf_train idf_train_norm idf_baidu idf_baidu_norm
Accary 0.66228 0.66228 0.651629 0.57644 0.647869 0.65288 0.6666

our method

different result in lucene
method lucene BM25 VSM
Accary 0.6184 0.614 0.377

find

  • 采用最细粒度分词(对于标准问题在建立索引时,模板不用),可以提高正确率。61=>66.对于标准问题建索引时.
  • 对输入的问题不应用细粒度分词(细粒度的59%,不用66%)。