pandas 有从特定日期开始的按月分组的方式吗?
问题描述
我正在尝试用python按月分组一些数据,但是我需要每个月的25号开始,有没有办法在Pandas中做到这一点?
几个星期以来,有一种方法可以从周一、周二开始……但有几个月总是满月。
pd.Grouper(key='date', freq='M')
解决方案
我准备了以下测试数据帧:
Dat Val
0 2017-03-24 0
1 2017-03-25 0
2 2017-03-26 1
3 2017-03-27 0
4 2017-04-24 0
5 2017-04-25 0
6 2017-05-24 0
7 2017-05-25 2
8 2017-05-26 0
第一步是计算"Shift Date"列:
df['Dat2'] = df.Dat + pd.DateOffset(days=-24)
结果为:
Dat Val Dat2
0 2017-03-24 0 2017-02-28
1 2017-03-25 0 2017-03-01
2 2017-03-26 1 2017-03-02
3 2017-03-27 0 2017-03-03
4 2017-04-24 0 2017-03-31
5 2017-04-25 0 2017-04-01
6 2017-05-24 0 2017-04-30
7 2017-05-25 2 2017-05-01
8 2017-05-26 0 2017-05-02
如您所见,Dat2中的3月日期正好从原日期2017-03-25开始, 以此类推。
%1的值在三月(Dat2),%2的值在五月(也就是Dat2)。
然后,要计算例如按月求和,我们可以运行:
df.groupby(pd.Grouper(key='Dat2', freq='MS')).sum()
获取:
Val
Dat2
2017-02-01 0
2017-03-01 1
2017-04-01 0
2017-05-01 2
这样我们就有了正确的分组:
- %1在三月,
- %2在5月。
相关文章