【R语言基础】06. 数据整合Ⅱ

2020-06-17 00:00:00 数据 连接 样本 随机 抽样

五、数据合并

1. 使用函数

rbind(),增加行(样本数据),要求宽度(列数)相同;

cbind(),增加列(属性变量),要求高度(行数)相同


2. 使用函数merge()

用来合并两个数据框,按行名或变量名匹配。基本格式为:

merge(x, y, by=…, by.x=…, by.y =…, all=…,

all.x=…, all.y=…, ...)

其中,

x, y为要合并的数据集;

by指定合并的依据(相同的行或列),默认按相同的列连接;

by.x, by.y分别为、二个数据框指定连接的列;

all, all.x, all.y默认为FALSE,仅输出x和y中都包含的行(内连接);all.x为TURE,则为左外连接;all.y为TURE,则为右外连接;all=TRUE,则为全连接。

仅返回两个表匹配的数据

左外连接:返回左表的数据,以及匹配的数据


右外连接:返回右表的数据,以及匹配的数据

全连接:返回左右表的数据,以及匹配的数据

例1


setwd("E:/办公资料/R语言/R语言学习系列/codes")
load("salary.Rdata")
index<-list("City"=data$City,"Index"=1:15)
data1<-merge(data, index, by="City")
head(data1)
       City Work Price Salary Index
1 Amsterdam 1714  65.6   49.0     1
2    Bombay 2052  30.3    5.3     2
3   Chicago 1924  73.9   61.9     3
4    Dublin 1759  76.0   41.4     4
5 Frankfurt 1650  74.5   60.4     5
6    London 1737  84.2   46.2     6

相关文章