python 代码实现k-means聚类分析的思路(不使用现成聚类库)

一、实验目标

　　1、使用 K-means 模型进行聚类，尝试使用不同的类别个数 K，并分析聚类结果。

　　　　2、按照 8:2 的比例随机将数据划分为训练集和测试集，至少尝试 3 个不同的 K 值，并画出不同 K 下的聚类结果，及不同模型在训练集和测试集上的损失。对结果进行讨论，发现能解释数据的最好的 K 值。二、算法原理

　　首先确定k，随机选择k个初始点之后所有点根据距离质点的距离进行聚类分析，离某一个质点a相较于其他质点最近的点分配到a的类中，根据每一类mean值更新迭代聚类中心，在迭代完成后分别计算训练集和测试集的损失函数SSE

本文来源gao!%daima.com搞$代*!码$网9

_train、SSE_test，画图进行分析。

伪代码如下：

num=10 #k的种类
for k in range(1,num):
 随机选择k个质点
 for i in range(n): #迭代n次
  根据点与质点间的距离对于X_train进行聚类
  根据mean值迭代更新质点
  计算SSE_train
  计算SSE_test
画图

　算法流程图：

搞代码网（gaodaima.com）提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected]‍，我们会在看到邮件的第一时间内为您处理，或直接联系QQ：872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接：python 代码实现k-means聚类分析的思路(不使用现成聚类库)