R语言中财务数据整形:wide <--> long

2020-06-16 00:00:00 数据 专区 变量 方法 变换

在R语言中,tidyr包和data.table分别提供了相应的长宽数据变换的函数。在做资本市场微观企业数据分析时,尤其财务数据指标(如Wind的数据格式是宽数据),这个两个包提供的函数友好程度还可以提升。

======================================================================


Stata中直接提供一个reshape就搞定了,并且可以自动分割和命名变量。这个太赞了。

具体的数据结构如下。

哈哈,恼火的是你这样要变换的变量命名需要有连贯性,不然Stata就识别不出来。(这个时候需要用renvars来批量转换变量名称)

======================================================================

下面分享data.table包提供的函数功能。

这里直接举例,不一一交代具体参数了。

1.生成模拟数据

library(data.table)
set.seed(123)

market <- data.table(
  stkcd=1:100,
  type =sample(c(0,1),100,replace = TRUE),
  industry=sample(letters,100,replace = TRUE),
  roa2013=runif(100, min = 0, max = 1),
  roa2014=runif(100, min = 0, max = 1),
  roa2015=runif(100, min = 0, max = 1),
  lev2013=runif(100, min = 0, max = 1),
  lev2014=runif(100, min = 0, max = 1),
  lev2015=runif(100, min = 0, max = 1)
)
head(market)

相关文章