Hulan-2015-04-09

来自cslt Wiki
2015年4月9日 (四) 07:52Lr讨论 | 贡献的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索

实验室后续研究方向:


1 长期任务


目标: 每3-5个月, 智能化(性能指标)/自动化(人工依赖)程度有阶段性提高。


检索优化 骆天一/刘荣 在线学习 骆天一 基于百度企业知道数据的关系抽取和模板扩充 东旭+新工程师 sempre工具研究(自然语言->查询表达式) 骆天一


2 近期任务


自然语言问句到语义表达式(模板)的映射及语义变量(提问对象)的提取 (包含:语义表达式中基本符号定义,基于人工标注数据自动实现大规模问答对(2015年会达到百万量级)的自动标注) 责任人: 王老师 计划:下周开会讨论



同义词自动扩展(系统级和租户级, 不同级别不同confidence, 自动发现作为未来长期任务) 

责任人: 邢超 4.17


句法分析树选型和验证(LTP/复旦/HanLP/Stanford etc) 责任人: 刘荣 4.17


多租户场景下租户数据库对接方案(性能测试) 

责任人: 汇联


复旦指代消解功能的集成 

责任人:刘荣 4.17 验证结果


语义归一化 (时间、数字)

责任人:刘荣 4.17 验证结果 


在线学习算法简介 
责任人:天一 4.10