R中的数据去重与缺失值处理

Liang / 2018-11-24

在R语言中，涉及到数据去重与缺失值处理的函数一共有下面这么几个：

unique函数通常用于去重：

unique(mydata$B)                  #对含有重复值得向量进行去重
dplyr::distinct(mydata,B)         #对含有重复值字段的数据框去重

dplyr中提供了两个函数可以执行交集与补集操作:

duplicated(mydata$B)              #返回重复对象的布尔值
mydata[!duplicated(mydata$B),]    #剔除重复值，仅保留唯一值

最后一次修改于 2018-11-24