收录:
摘要:
本发明公开一种建立大规模跨领域文本情感倾向性分析框架方法,包括:对源领域和目标领域的样本文件进行精确分词,形成两个词向量表;对词向量进行聚类和领域间的对齐;用词向量对源领域的标定样本进行初步的句子建模并作为DCELM的输入,利用卷积运算提取文本向量的中间层抽象特征;记录验证集分类效果最好时的卷积层参数作为DCELM网络卷积层的参数;最后用DCNN提取的少量目标领域的标定样本的中间层抽象特征来训练分类器ELM的隐层参数,建立大规模跨领域文本情感倾向性分析框架。采用本发明的技术方案,在样本层消除领域间表达情感极性的词语的差距,而且有效解决全连接层容易陷入局部最优和泛化能力弱的缺点,增加模型的抗干扰性。
关键词:
通讯作者信息:
电子邮件地址: