pandas -按两种功能分组
问题描述
我一直在试着从大 pandas 的Groupby物体上得到一个累加。我需要将累加移位1,这是通过Shift()实现的。但是,在单个GROUPBY对象上同时执行这两个函数会产生一些不需要的结果:
df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2],
'B': [2, 3, 5, 2, 3, 5]})
df.groupby('A').cumsum().shift()
这提供了:
B
0 NaN
1 2.0
2 5.0
3 10.0
4 2.0
5 5.0
即,组1上的Cumsum()的最后一个值被移位到组2的第一个值。我想要的是这些组保持分离,并获得:
B
0 NaN
1 2.0
2 5.0
3 NaN
4 2.0
5 5.0
但我不确定如何让这两个函数结合使用GROUPBY对象。在其他地方找不到这个问题。一直在玩弄阿格,但似乎解决不了问题。如有任何帮助,我们将不胜感激。
解决方案
使用lambda function
WITHGroupBy.apply
,还需要在groupby
之后定义列表中的列进行处理:
df['B'] = df.groupby('A')['B'].apply(lambda x: x.cumsum().shift())
print (df)
A B
0 1 NaN
1 1 2.0
2 1 5.0
3 2 NaN
4 2 2.0
5 2 5.0
相关文章