摘要:
为进一步研究纵向数据相似性比较问题,对基于扩展范式(Eros)距离的纵向数据相似性度量方法进行了探讨。使用基于粗糙集理论的核约简对属性变量进行选择,去掉数据集中的冗余属性;用扩展范式距离进行数据项之间的相似性比较。为计算两条数据项之间的相似度,将相关特征值作为权重,通过扩展范数距离比较项与项相应主元之间的相似度。与其它三种度量方法的对比实验表明,所提出的纵向数据相似度测量方法是可行的和有效的,且用于信息检索时的查全率与查准率优于其它度量方法。
关键词:
通讯作者信息:
电子邮件地址: