AP简介

亲和力传播算法无需指定聚类的结果,使用的是AffinityPropagation,详情请参考:https://www.cnblogs.com/lc1217/p/6908031.html

算法优缺点

AP算法的优点:

  1. 不需要制定最终聚类族的个数
  2. 族中心点是已有的数据点,并不会额外出现新的数据点
  3. 其结果的平方差误差较小。

AP算法的不足:

  1. AP算法的时间复杂度较高,一次迭代大概O(N3)
  2. 调参的结果(阻尼系数)对结果影响巨大

AP算例

from numpy import unique
from sklearn.cluster import AffinityPropagation
import numpy as np
from sklearn.preprocessing import StandardScaler

# 定义数据集
X = np.random.random((500, 4))
X = StandardScaler().fit_transform(X)
# 定义模型
model = AffinityPropagation(damping=0.5) # 设置damping : 阻尼系数,取值[0.5,1)
# 匹配模型
model.fit(X)
yhat = model.predict(X)  # yhat为集群结果
clusters = len(unique(yhat))  # 类别
Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐