inner_join:保留交集-两个数据集都存在的列
outer joins:保留至少一个数据框存在的列
left_join():保留两个数据框都存在的列
right_join():保留x中的所有列以及y中匹配上的列
full_join():保留y中的所有列以及x中匹配上的列
如果没有指定key变量,默认使用两个数据集里面出现的所有变量
语法:df <- xxx_join(x = TableA, y = TableB, by = "ID")
示例:
TableA, TableB 如下
inner_join最终结果为ID匹配上的’01‘,’04‘, ’05‘
full_join最终结果为所有ID数据,缺失值展示为NA
left_join以左边数据为基础,将右边数据匹配上的展示
right_join以右边数据为基础,将左边数据匹配上的展示
----------------------------------
使用以上函数的过程中需要注意key变量是否有重复,如果有会出现重复数据,如下ID = ’01‘ 时的数据在join之后的结果出现行1,3;行2,4重复
增加VISIT为key变量可以避免这种情况: