• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

刮俊杰 (刮俊杰.) | 吴树国 (吴树国.) | 伊胜伟 (伊胜伟.)

摘要:

翻译项目中翻译文档的分词效果的好坏直接决定了翻译的质量。目前存在的统计分词方法如互信息、t-测试度、接续指数等对高频词的提取并不理想。论文分析了现有的统计分词的方法,改进了互信息计算的方法,结合t-测试度、接续指数,提出了一个综合统计量-词效应。以词效应为基础,提出了一种中文术语提取方法。实验分析表明,基于词效应的中文术语提取方法能够提取出待翻译文档中的术语,并且不需要对文档进行任何预先处理。

关键词:

互信息 t测试度 词效应 正向最大效应分词 统计分词

作者机构:

  • [ 1 ] 北京工业大学计算机学院
  • [ 2 ] 北京航空航天大学软件开发环境国家重点实验室

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

相关文章:

来源 :

年份: 2009

语种: 中文

被引次数:

WoS核心集被引频次: 0

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次:

中文被引频次:

近30日浏览量: 0

在线人数/总访问数:294/5051457
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司