• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    同等学历教学

    同等学历教学

    免费
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      同等学历教学

      同等学历教学

      免费
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      未分类

      • 首页
      • 博客
      • 未分类
      • 聚类分析中的可视化

      聚类分析中的可视化

      • 发布者 weinfoadmin
      • 分类 未分类
      • 日期 2021年9月9日
      • 评论 0评论

      专题介绍:R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科学社区和用户对R包的慷慨贡献,让R语言在全球范围内越来越流行。其中一些R包,例如MASS,SparkR, ggplot2,使数据操作,可视化和计算功能越来越强大。R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R的学术性开发比较早,适合生物学和医学等学术学科的科研人员使用。

      问题提出

      当数据没有标签或者有少量标签的时候,我们需要使用聚类分析来发现数据的模式。便于理解聚类分析的结果或者效果,如何对聚类分析做可视化呢?

      解决方法

      • 第一步:安装和加载聚类分析R包-factoextra

      library(pacman)
      p_load(factoextra)
      • 第二步:导入数据集,采用R语言自带的USArrests

      # 导入数据集
      data("USArrests")
      # 数据集理解
      ?USArrests
      # 数据集检视
      head(USArrests)
      • 第三步:数据集准备与处理,对数据集做标准化处理,每列转换为均值为0,标准差为1

      df <- scale(USArrests)
      head(df, 10)
      • 第四步:聚类分析及可视化。

      不管是层次聚类还是划分聚类,都要寻找一个距离度量。然后根据计算后的距离,采用不同的策略进行数据集的汇聚。

      4.1 基于相关系数的距离度量和可视化

      res.dist <- get_dist(df, method = "pearson")
      head(round(as.matrix(res.dist), 2))[, 1:6]
      # 可视化相关系数矩阵
      fviz_dist(res.dist, lab_size = 8)

      4.2 增强型分层聚类和可视化

      res.hc <- eclust(df, "hclust")
      fviz_dend(res.hc, rect = TRUE) # 树图
      fviz_cluster(res.hc) # 散点图
      fviz_silhouette(res.hc) # 轮廓图

      分层树图

      聚类散点图

      轮廓图

      4.3 增强型K均值聚类和可视化

      res.km <- eclust(df, "kmeans", nstart = 25) #聚类的散点图
      fviz_gap_stat(res.km$gap_stat) # 不同K值下Gap 统计图,指导选择最佳K值
      fviz_silhouette(res.km) # 轮廓图,每种聚类下面的分布情况

      聚类散点图

      不同K值Gap统计图

      轮廓图

      k均值结果可视化的其他表示方式

      p_load(cluster, fpc)
      plotcluster(USArrests, res.km$cluster)
      clusplot(USArrests, res.km$cluster, color=TRUE, shade=TRUE, 
               labels=2, lines=0)

      思考题

      • 如何查看聚类结果的详细信息

      • 如何对K均值聚类的中心点做可视化分析

      想找数据工作或者要招数据人才的朋友,或者想了解数据人有趣事情的朋友,可以关注公众号【数据人才】。


      想了解数据科学和人工智能的朋友,可以关注公众号【数据科学与人工智能】。

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoadmin

      上一篇文章

      绘制多种算法的Accuracy的对比分析可视化
      2021年9月9日

      下一篇文章

      使用R语言为学术出版制作高分辨率的图像
      2021年9月9日

      你可能也喜欢

      2-1675088548
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      30 1月, 2023
      9-1675131201
      如何快速批量修改 Git 提交记录中的用户信息
      26 1月, 2023
      8-1678501786
      肿瘤细胞通过改变CD8+ T细胞中的丙酮酸利用和琥珀酸信号来调控抗肿瘤免疫应答。
      7 12月, 2022

      留言 取消回复

      要发表评论,您必须先登录。

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      301月2023
      如何快速批量修改 Git 提交记录中的用户信息
      261月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?