基于特征映射的半监督文本分类算法 - Details

Author：

杜芳华 (杜芳华.) | 冀俊忠 (冀俊忠.) (Scholars：冀俊忠) | 赵学武 (赵学武.) | 吴晨生 (吴晨生.)

Indexed by：

CQVIP PKU CSCD

Abstract：

针对已标记数据与未标记数据分布不一致可能导致半监督分类器性能降低的不足,提出了一种基于特征映射的半监督文本分类算法.首先通过不同的特征选择方法,分别在训练集的已标记数据、未标记数据以及测试集数据中选取各自的特征集,并初始化特征的权值;在此基础之上,分别建立已标记数据与未标记数据、已标记数据与测试集数据、未标记数据与测试集数据之间的映射函数,并利用这3个特征映射函数重新计算特征的权重;最后利用期望最大比(expectation　maximization,EM)算法进行半监督文本分类.在标准数据集上的实验结果表明:提出的算法是有效的.

Keyword：

文本分类迁移学习特征映射半监督学习

Author Community：

[ 1 ] 北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室
[ 2 ] 南阳师范学院软件学院
[ 3 ] 北京市科学技术情报研究所

Reprint Author's Address：

Email：

Show more details

Related Keywords：

Source ：

北京工业大学学报

Year： 2016

Issue： 02

Volume： 42

Page： 230-235

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 2

Affiliated Colleges：

信息学部

信息学部计算机学院

Get Fulltext

Library Discovery Baidu Scholar Search CNKI

Type
Departments

All Years Choose Year From to