pandas -按两种功能分组

2022-02-26 00:00:00 python pandas pandas-groupby

问题描述

我一直在试着从大 pandas 的Groupby物体上得到一个累加。我需要将累加移位1,这是通过Shift()实现的。但是,在单个GROUPBY对象上同时执行这两个函数会产生一些不需要的结果:

df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2],
                   'B': [2, 3, 5, 2, 3, 5]})

df.groupby('A').cumsum().shift()

这提供了:

      B
0   NaN
1   2.0
2   5.0
3  10.0
4   2.0
5   5.0

即,组1上的Cumsum()的最后一个值被移位到组2的第一个值。我想要的是这些组保持分离,并获得:

      B
0   NaN
1   2.0
2   5.0
3   NaN
4   2.0
5   5.0

但我不确定如何让这两个函数结合使用GROUPBY对象。在其他地方找不到这个问题。一直在玩弄阿格,但似乎解决不了问题。如有任何帮助,我们将不胜感激。


解决方案

使用lambda functionWITHGroupBy.apply,还需要在groupby之后定义列表中的列进行处理:

df['B'] = df.groupby('A')['B'].apply(lambda x: x.cumsum().shift())
print (df)
   A    B
0  1  NaN
1  1  2.0
2  1  5.0
3  2  NaN
4  2  2.0
5  2  5.0

相关文章