2014年11月6日 (四) 08:45的版本

Dialog system

different result in lucene
method	lucene	vsm_idf(haiguan)	VSM_idf(baidu)	vsm_idf(tain)	vsm_idf(calculate)
Accary	0.6628	0.6228	0.6197	0.5827	0.5426

top10(82.95%),top20(86.34),top50(90.23%),top100(94.11%),top200(96.18%),top1000(97.31%),top2000(97.87%),top5000(98.75%),top10000(99.06)

boost keyword in lucene
method	Default	idf_train	idf_train_norm	idf_baidu	idf_baidu_norm
Accary	0.66228	0.651629	0.57644	0.647869	0.65288

using MERT-4 method to get good value of multi-feature.like IDF,NER,baidu_weight,keyword etc.

@@ 第30行： / 第30行： @@
 |-
 |}
-:* TFIDF Formula
+:* using MERT-4 method to get good value of multi-feature.like IDF,NER,baidu_weight,keyword etc.
-::* coord(q,d)*query_boost*query_norm*sum(idf^2 * tf * term_boost * norm(t,d)) [http://lucene.apache.org/core/4_3_0/core/org/apache/lucene/search/similarities/TFIDFSimilarity.html]
-:* add the new keyword value from proMe method
 ===Multi-Scene Recognition===
 * add the triples search to QA engine