R语言聚类分析

基本过程-读数据-数据标准化-计算距离-分类library('flexclust') # 导入数据集data(nutrient)# 加载数据row.names(nutrient) <- tolower(row.names(nutrient)) # 把行索引小写head(nutrient)#由于能量变化范围比其他变量更大，缩放数据有利于均衡各变量的影响。nutrient_scaled <

沈帅杰

7908人浏览 · 2021-12-28 14:35:16

沈帅杰 · 2021-12-28 14:35:16 发布

基本过程

读数据
数据标准化
计算距离
分类

library('flexclust') # 导入数据集
data(nutrient)  # 加载数据
row.names(nutrient) <- tolower(row.names(nutrient)) # 把行索引小写
head(nutrient)
#由于能量变化范围比其他变量更大，缩放数据有利于均衡各变量的影响。
nutrient_scaled <- scale(nutrient)  # 数据标准化
head(nutrient_scaled)
d <- dist(nutrient_scaled)  # 计算距离 默认欧式距离
fit_average <- hclust(d, method="average") # 聚类
plot(fit_average, hang = -1,  main = "Average Linkage Clustering")

在这里插入图片描述

K-means聚类与PAM聚类

# K-means聚类，做之前用outlet去除异常值
library('flexclust') # 导入数据集
data(nutrient)
row.names(nutrient) <- tolower(row.names(nutrient)) # 把行索引小写
library(factoextra)
nutrient_scaled <- scale(nutrient)  # 数据标准化
d <- dist(nutrient_scaled)
fviz_cluster(kmeans(d, 3), nutrient)

# 围绕中心点的划分（PAM）
library('flexclust') # 导入数据集
library(cluster)
data(nutrient)
row.names(nutrient) <- tolower(row.names(nutrient)) # 把行索引小写
nu_pam <- pam(nutrient, 3, metric="euclidean")
fviz_cluster(nu_pam, nutrient)

在这里插入图片描述

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。