收录:
摘要:
最大频繁项目序列集的生成是影响关联规则挖掘的关键问题,传统的算法是通过对事务数据库的多次扫描实现的.最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的I/O代价来获得更高的效率.随着计算机性能的提高,探索合适的数据结构来支持基于一次事务数据库扫描的高效算法成为可能.该文首先给出项目序列集和它的基本操作的严格定义,然后在此基础上提出一个称为ISS-DM的最大频繁项目序列集生成算法.ISS-DM算法是通过对事务数据库的一次扫描而逐步演化成最大频繁项目序列集的.最后作者对这一算法的时间和空间效率进行了理论分析和实验验证.
关键词:
通讯作者信息:
电子邮件地址: