【R语言】tidyverse之三:数据连接

2020-06-17 00:00:00 数据 连接 合并 匹配 数据表

一. 数据连接简介

数据分析经常会涉及多个数据表,也称为关系数据库。关系是指两个数据表之间的关系,更多数据表之间的关系总可以表示为两两之间的关系。

一个项目的数据,通常都是用若干数据表分别存放,它们之间通过"键"连接在一起,根据数据分析的需要,通过键匹配进行数据连接。

例如,机场航班数据的连接结构:

键列(可以不止 1 列),能够识别自己或别人数据表的每一个观测。要判断某(些)列是否是键,可以先用 count() 计数,再看是否没有 n > 1 出现:

library(nycflights13)
planes %>%
  count(tailnum) %>%
  filter(n > 1)

相关文章