【R语言】tidyverse之三:数据连接
一. 数据连接简介
数据分析经常会涉及多个数据表,也称为关系数据库。关系是指两个数据表之间的关系,更多数据表之间的关系总可以表示为两两之间的关系。
一个项目的数据,通常都是用若干数据表分别存放,它们之间通过"键"连接在一起,根据数据分析的需要,通过键匹配进行数据连接。
例如,机场航班数据的连接结构:
键列(可以不止 1 列),能够识别自己或别人数据表的每一个观测。要判断某(些)列是否是键,可以先用 count() 计数,再看是否没有 n > 1 出现:
library(nycflights13)
planes %>%
count(tailnum) %>%
filter(n > 1)
相关文章