• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

刘泽锦 (刘泽锦.) | 王洁 (王洁.)

Indexed by:

CQVIP

Abstract:

为解决大规模短文本语料库主题模型参数K较大导致求解慢的问题,本文提出FBTM模型,将BTM中单个词对采样复杂度由O(K)降低O(1).针对短文本词语稀疏、描述能力弱的特点,提出一种结合同主题词对与FBTM的短文本分类算法,首先使用FBTM进行主题建模,将一段滑动窗口内的同主题词对作为特征扩充到原文本中,然后使用FBTM主题分布作为另一部分文本特征.对特征扩展后的Weibo语料库进行分类实验,结果显示该方法显著提高了分类性能.

Keyword:

快速双词主题模型(FBTM) 采样 滑动窗口词对 特征扩展 短文本分类

Author Community:

  • [ 1 ] [刘泽锦]北京工业大学信息学部多媒体与智能软件技术北京市重点实验室,北京,100124
  • [ 2 ] [王洁]北京工业大学信息学部多媒体与智能软件技术北京市重点实验室,北京,100124

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

计算机系统应用

ISSN: 1003-3254

Year: 2017

Issue: 11

Volume: 26

Page: 213-219

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: 5

Chinese Cited Count:

30 Days PV: 1

Affiliated Colleges:

Online/Total:349/5276850
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.