收录:
摘要:
本发明设计了一种自动确定聚类中心的混合属性数据集聚类方法,针对K‑Prototypes聚类算法中需人为指定初始聚类中心和聚类数目导致算法准确度和稳定性低下的问题,该方法分为初始化、聚类中心点预选取、确定聚类中心点、迭代聚类划分过程这四个步骤。该方法根据数据对象的密度分布,实现类簇个数的自动识别,并选择出初始聚类中心,优化初始选点造成的局部最优问题,另外通过区分每个属性对聚类结果的不同影响权重,改进相异度计算公式,提升了聚类的准确度,达到了更好的聚类效果。
关键词:
通讯作者信息:
电子邮件地址: