• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    教学以及管理操作教程

    教学以及管理操作教程

    ¥1,000.00 ¥100.00
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      教学以及管理操作教程

      教学以及管理操作教程

      ¥1,000.00 ¥100.00
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      未分类

      • 首页
      • 博客
      • 未分类
      • mde包,超赞的数据缺失值探索与处理R包

      mde包,超赞的数据缺失值探索与处理R包

      • 发布者 Sam 蔡
      • 分类 未分类
      • 日期 2022年5月21日
      测试开头

      mde包,超赞的数据缺失值探索与处理R包

      缺失值是临床数据中最常遇到的问题之一,缺失值的处理有很多种方法,在处理缺失值前常需要了解缺失值的缺失情况,今天来学习一个新的R包——mde,意思是Missing Data Explorer,这个包专门用于缺失值的探索与处理。

      1. 安装R包

      安装包可以直接从CRAN上安装。

      install.packages("mde")
      library(mde)

      2. R包介绍

      这个包的函数不是特别多,如下图所示,每个函数的作用不同,函数很简单,有兴趣的可以看看每个函数的示例代码。

      mde包,超赞的数据缺失值探索与处理R包

      3. 函数演示

      下面介绍几个常用的函数。

      3.1 na_summary()函数

      这个函数用来输出数据集中各种变量的数据缺失摘要,可以简单看下数据集的缺失情况。

      # 查看airquality数据集的缺失情况
      library(tidyverse)
      airquality %>% na_summary()
      mde包,超赞的数据缺失值探索与处理R包

      如上图所示,输出了各变量的缺失数量、完整例数、缺失百分比等;

      也可以使用代码可视化缺失值数据。

      airquality %>% 
        na_summary() %>% 
        ggplot(aes(x=variable,y = percent_complete, fill = variable)) + 
        geom_col() + 
        theme_bw(base_size = 18)
      mde包,超赞的数据缺失值探索与处理R包

      3.2 recode_as_na()函数

      这个函数的目的就是将数据集中某个值或者某些值转化为缺失值。

      test2 <- data.frame(ID= c(1:5), Vals = c(2,3,4,5,5))
      # 将数据集中所有的数字2转化为NA
      recode_as_na(test2,value=c(2))
      # 将数据集中所有的数字5转化为NA
      recode_as_na(test2,value=c(5))
      mde包,超赞的数据缺失值探索与处理R包

      这种情况常可以用于当数据集中某些字符的批量替换。

      上面是将所有的某些数字或字符转化NA,还可以使用参数来进一步提高替换功能。

      可以使用subset_cols、pattern_type参数来限制指定某些列别的数字替换。

      # 指定I开头的列
      recode_as_na(test2,value=c(2),
                   pattern_type="starts_with",
                   pattern="I")

        ID Vals
      1  1    2
      2 NA    3
      3  3    4
      4  4    5
      5  5    5

      这个函数的其他用法见帮助文档。

      3.3 recode_as_na_for()

      这个函数的作用是将数据集中符合某些条件或标准的列中的数值转换为NA。

      # 将数据集中所有大于3的数字转化为NA
      recode_as_na_for(test2,criteria = "gt", value = 3)

        ID Vals
      1  1    2
      2  2    3
      3  3   NA
      4 NA   NA
      5 NA   NA

      criteria参数中gt是大于的意思,gteq是大于等于,lt是小于,lteq是小于等于,同样可以使用subset_cols来选择某些列。

      好的,就学习到这里,有兴趣的朋友可以查看这个包的帮助文档,里面还有一些不错的函数。

      参考资料

      1.mde帮助文件


      关注下方公众号,分享更多更好玩的R语言知识。
      如果需要进群,请在菜单栏处添加作者微信,添加入群。

      觉得有帮助的请点赞、分享、在看走起!

      点个在看,SCI马上发表。

      测试结尾

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      Sam 蔡
      Sam 蔡

      上一篇文章

      经典铁死亡,再出新思路
      2022年5月21日

      下一篇文章

      单细胞多样本整合分析
      2022年5月24日

      你可能也喜欢

      2-1675088548
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      30 1月, 2023
      9-1675131201
      如何快速批量修改 Git 提交记录中的用户信息
      26 1月, 2023
      5-1660909989
      scanpy官方教程2022|03-scanpy包核心绘图功能
      19 8月, 2022

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      301月2023
      如何快速批量修改 Git 提交记录中的用户信息
      261月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?