dplyr中有非常多非常有用的功能,例如filter(),arrange(),select(),mutate(),group_by()。但是这篇教程是谈join函数。
join函数在dplyr包中是个系列函数。 join函数:
join(x, y, by = NULL, copy = FALSE, ...)
- x,y 为合并的数据框,不要求x,y中排序列唯一
- by 为排序依据,默认值Null时按名字相同的量匹配,此时,要求必须有相同列名的列
- join为系列函数,包括inner_join、left_join、semi_join和anti_join函数
full_join() #
full_join连接后的记录数等于”共有的记录数+a独有的记录数+b独有的记录数“,结果可以理解为a、b的并集。
inner_join #
inner_join连接后的记录数等于”共有的记录数“, 也就是5,结果可以理解为a、b的交集,R语言中的merge函数也可以实现。
left_join #
left_join连接后的记录数等于”a的记录数“,当然,a是需要放在第一个参数。
right_join #
right_join连接后的记录数等于”b的记录数“。
最后一次修改于 2018-11-24