将 pandas 的年值扩展为月

2022-04-18 00:00:00 pandas reshape

问题描述

我有按年统计的销售额:

pd.DataFrame({'year':[2015,2016,2017],'value':['12','24','30']})
    year    value
0   2015    12
1   2016    24
2   2017    36

我要外推到月份:

yyyymm value
201501 1 (ie 12/12, etc)
201502 1
...
201512 1
201601 2
...
201712 3

有什么建议吗?


解决方案

一个想法是将交叉联接与帮助器DataFrame一起使用,将列转换为字符串并添加0Series.str.zfill

df1 = pd.DataFrame({'m': range(1, 13), 'a' : 1})

df = df.assign(a = 1).merge(df1).drop('a', 1)
df['year'] = df['year'].astype(str) + df.pop('m').astype(str).str.zfill(2)
df = df.rename(columns={'year':'yyyymm'})

另一个解决方案是创建MultiIndex并使用DataFrame.reindex

mux = pd.MultiIndex.from_product([df['year'], range(1, 13)], names=['yyyymm','m'])
df = df.set_index('year').reindex(mux, level=0).reset_index()
df['yyyymm'] = df['yyyymm'].astype(str) + df.pop('m').astype(str).str.zfill(2)

print (df.head(15))
    yyyymm value
0   201501    12
1   201502    12
2   201503    12
3   201504    12
4   201505    12
5   201506    12
6   201507    12
7   201508    12
8   201509    12
9   201510    12
10  201511    12
11  201512    12
12  201601    24
13  201602    24
14  201603    24

相关文章