【R语言基础】06. 数据整合Ⅱ
五、数据合并
1. 使用函数
rbind(),增加行(样本数据),要求宽度(列数)相同;
cbind(),增加列(属性变量),要求高度(行数)相同
2. 使用函数merge()
用来合并两个数据框,按行名或变量名匹配。基本格式为:
merge(x, y, by=…, by.x=…, by.y =…, all=…,
all.x=…, all.y=…, ...)
其中,
x, y为要合并的数据集;
by指定合并的依据(相同的行或列),默认按相同的列连接;
by.x, by.y分别为、二个数据框指定连接的列;
all, all.x, all.y默认为FALSE,仅输出x和y中都包含的行(内连接);all.x为TURE,则为左外连接;all.y为TURE,则为右外连接;all=TRUE,则为全连接。
仅返回两个表匹配的数据
左外连接:返回左表的数据,以及匹配的数据
右外连接:返回右表的数据,以及匹配的数据
全连接:返回左右表的数据,以及匹配的数据
例1
setwd("E:/办公资料/R语言/R语言学习系列/codes")
load("salary.Rdata")
index<-list("City"=data$City,"Index"=1:15)
data1<-merge(data, index, by="City")
head(data1)
City Work Price Salary Index
1 Amsterdam 1714 65.6 49.0 1
2 Bombay 2052 30.3 5.3 2
3 Chicago 1924 73.9 61.9 3
4 Dublin 1759 76.0 41.4 4
5 Frankfurt 1650 74.5 60.4 5
6 London 1737 84.2 46.2 6
相关文章