R语言dplyr的技巧
近独立完成了一个用R语言实现的离线报表,想和大家分享一下实现过程中dplyr的一些技巧。
什么是dplyr?
dplyr是一个利用pipline语法快速处理数据的R语言包。
1.抽象公共过程单独调用
标题大家可能比较难懂,下面我来举个例子:
在做数据处理的时候大家都应该这样写过吧:
result <- data %>%
mutate(
var1 = fun(var)
...
) %>%
group_by(var2, var3) %>%
summarise(
...
) %>%
arrange(var2, var3, var4)
相关文章