• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

贾熹滨 (贾熹滨.) | 靳亚 (靳亚.) | 陈军成 (陈军成.)

收录:

EI Scopus PKU CSCD

摘要:

大量有效样本标注是有监督学习性能的重要保证,但又存在耗时且人力成本高的问题,加之,在实际应用环境,很难在每个应用领域都有足够的标定样本数据支持分类器的训练.而将源领域所获的训练模型直接用于目标领域,又由于目标领域和源领域信息分布差异,会导致跨领域分类器应用准确率降低的问题.针对以上问题,提出一种基于多视角共享特征的领域空间对齐的跨领域情感分类(domain alignment based on multi-viewpoint domain-shared feature for cross-domain sentiment classification,DAMF)算法.该算法首先通过融合多个情感词典,消除通过互信息值所选择的领域共享特征中情感词的极性分歧问题.在此基础上,以领域间无歧义共享特征为桥梁,结合通过语法规则提取的各领域中有相同极性的情感词对和通过关联规则学习的各领域中有强关联关系的特征词对,进行领域间相同极性的专有情感词对和强关联关系的特征词对的提取,构建目标领域和源领域数据的统一特征表示空间,减小了领域间因极性分歧和特征分布不同造成的差异,实现不同领域空间对齐.同时在公共数据集上的跨领域实验表明,基于多视角共享特征的领域空间对齐跨领域倾向性分析算法一定程度上提高了跨领域情感分类的准确率.

关键词:

极性分歧 关联规则 统一特征表示空间 跨领域 领域空间对齐 情感分类

作者机构:

  • [ 1 ] [贾熹滨]北京工业大学信息学部 北京 100124;多媒体与智能软件技术北京市重点实验室(北京工业大学) 北京 100124
  • [ 2 ] [靳亚]北京工业大学信息学部 北京 100124;多媒体与智能软件技术北京市重点实验室(北京工业大学) 北京 100124
  • [ 3 ] [陈军成]北京工业大学

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

计算机研究与发展

ISSN: 1000-1239

年份: 2018

期: 11

卷: 55

页码: 2439-2451

被引次数:

WoS核心集被引频次:

SCOPUS被引频次: 2

ESI高被引论文在榜: 0 展开所有

万方被引频次: -1

中文被引频次:

近30日浏览量: 0

在线人数/总访问数:280/5065338
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司