Indexed by:
Abstract:
本发明提供一种加权的暗网资源危险评估分类方法及系统,涉及互联网领域,包括:爬取暗网网址获取html文件;按照html文件中的标签提取网站内容;计算网站内容中每个词的TF‑IDF值;预设html文件中各标签的重要程度值;将每个词的TF‑IDF值与该词所属标签的重要程度值相乘作为网站的文本特征;根据网站的文本特征构建网站空间向量;将网站空间向量输入空间向量评估分类模型评估输出网站危险等级。本发明通过计算暗网中词汇的TF‑IDF值,精确获取暗网中的中心词汇,同时采用一种加权的手段,通过暗网html文件不同标签下的词汇重要程度不同,再次进行重要程度加权,准确获取暗网中重要的词汇进行评估和分类。
Keyword:
Reprint Author's Address:
Email:
Patent Info :
Type: 发明申请
Patent No.: CN202110042695.X
Filing Date: 2021-01-13
Publication Date: 2021-04-09
Pub. No.: CN112632974A
Applicants: 北京工业大学
Legal Status: 实质审查
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: