收录:
摘要:
话题句(TC)识别中采用穷举方法生成标点句的候选话题句(CTC)影响系统的执行效率和话题句识别的准确率.提出一种新的候选话题句生成方法,利用标点句在篇章中的位置特征、话题的语法特征以及话题串与说明的邻接性特征,指导候选话题句的生成过程.实验结果表明,该方法减少了候选话题句的个数,提高了系统效率.而且,通过与基于穷举式候选话题句生成策略的话题句识别工作进行对比,该方法使单个标点句话题句识别的准确率提高了0.96个百分点,使标点句序列话题句识别的准确率提高了1.31个百分点.
关键词:
通讯作者信息:
电子邮件地址: