【R语言基础】06. 数据整合Ⅱ

2020-06-17 00:00:00 数据连接样本随机抽样

五、数据合并

1. 使用函数

rbind()，增加行（样本数据），要求宽度（列数）相同；

cbind()，增加列（属性变量），要求高度（行数）相同

2. 使用函数merge()

用来合并两个数据框，按行名或变量名匹配。基本格式为：

merge(x, y, by=…, by.x=…, by.y =…, all=…,

all.x=…, all.y=…, ...)

其中，

x, y为要合并的数据集；

by指定合并的依据（相同的行或列），默认按相同的列连接；

by.x, by.y分别为、二个数据框指定连接的列；

all, all.x, all.y默认为FALSE，仅输出x和y中都包含的行（内连接）；all.x为TURE，则为左外连接；all.y为TURE，则为右外连接；all=TRUE，则为全连接。

仅返回两个表匹配的数据

左外连接：返回左表的数据，以及匹配的数据

右外连接：返回右表的数据，以及匹配的数据

全连接：返回左右表的数据，以及匹配的数据

例1

setwd("E:/办公资料/R语言/R语言学习系列/codes")
load("salary.Rdata")
index<-list("City"=data$City,"Index"=1:15)
data1<-merge(data, index, by="City")
head(data1)
       City Work Price Salary Index
1 Amsterdam 1714  65.6   49.0     1
2    Bombay 2052  30.3    5.3     2
3   Chicago 1924  73.9   61.9     3
4    Dublin 1759  76.0   41.4     4
5 Frankfurt 1650  74.5   60.4     5
6    London 1737  84.2   46.2     6

相关文章