pandas 有从特定日期开始的按月分组的方式吗?

2022-02-26 00:00:00 pandas pandas-groupby

问题描述

我正在尝试用python按月分组一些数据,但是我需要每个月的25号开始,有没有办法在Pandas中做到这一点?

几个星期以来,有一种方法可以从周一、周二开始……但有几个月总是满月。

pd.Grouper(key='date', freq='M')

解决方案

我准备了以下测试数据帧:

         Dat  Val
0 2017-03-24    0
1 2017-03-25    0
2 2017-03-26    1
3 2017-03-27    0
4 2017-04-24    0
5 2017-04-25    0
6 2017-05-24    0
7 2017-05-25    2
8 2017-05-26    0

第一步是计算"Shift Date"列:

df['Dat2'] = df.Dat + pd.DateOffset(days=-24)

结果为:

         Dat  Val       Dat2
0 2017-03-24    0 2017-02-28
1 2017-03-25    0 2017-03-01
2 2017-03-26    1 2017-03-02
3 2017-03-27    0 2017-03-03
4 2017-04-24    0 2017-03-31
5 2017-04-25    0 2017-04-01
6 2017-05-24    0 2017-04-30
7 2017-05-25    2 2017-05-01
8 2017-05-26    0 2017-05-02

如您所见,Dat2中的3月日期正好从原日期2017-03-25开始, 以此类推。

%1的值在三月(Dat2),%2的值在五月(也就是Dat2)。

然后,要计算例如按月求和,我们可以运行:

df.groupby(pd.Grouper(key='Dat2', freq='MS')).sum()

获取:

            Val
Dat2           
2017-02-01    0
2017-03-01    1
2017-04-01    0
2017-05-01    2

这样我们就有了正确的分组:

  • %1在三月,
  • %2在5月。
与其他答案相比,优势在于您的所有日期都在第一个答案上 当然要记住,例如2017-03-01 结果表示2017-03-25到2017-04-24(含)的时间段。

相关文章