收录:
摘要:
κ-平均问题是计算机科学和组合优化领域的经典问题之一.κ-平均聚类作为最受重视而且最简单易懂的一种聚类分析方法流行于数据挖掘领域.κ-平均问题可描述为:给定n个元素的观测集,其中每个观测点都是d维实向量,目标是把这n个观测点划分到κ(≤n)个集合中,使得所有集合中的点到对应的聚类中心的距离的平方和最小,其中一个集合的聚类中心指的是该集合中所有观测点的均值.κ-平均问题在理论上是NP-难的,但有高效的启发式算法,广泛应用在市场划分、机器视觉、地质统计学、天文学和农业等实际背景中.随着实际问题中遇到的κ-平均问题更加复杂,数据量更加庞大,还需学者进行更深一步的研究.罗列出k-平均问题及其诸多变形及推广问题的经典算法,并总结κ-平均中尚待研究的若干问题.
关键词:
通讯作者信息:
电子邮件地址: