根据列之间的差异过滤数据帧[不是下一列]
问题描述
我有一个唯一的数据帧df
:
name val_1 val_2 val_3 val_4
AAA 1 2 3 11
BBB 2 3 5 9
CCC 6 4 15 10
我只需要保留其中任何右侧val
列从前面的任何val
列增加10的名称,否则删除它们。
我知道diff()
和ge()
在这里会有帮助,但不确定如果不是关于下一列之间的差异,它们将如何工作。
所需输出:
name
AAA #val_4 increases by 10 from val_1
CCC #val_3 increases by 11 from val_2
做这件事最聪明的方式是什么?如有任何建议,我们将不胜感激。谢谢!
解决方案
我认为它正在做所需的工作。请注意,我将val_1的第二个值更改为20,这样我们就可以确保我们不会得到从左到右的差异,而不仅仅是从右到左的差异。
import pandas as pd
df = pd.DataFrame(
{
'name': ['AAA', 'BBB', 'CCC'],
'val_1': [1, 20, 6],
'val_2': [2, 3, 4],
'val_3': [3, 5, 15],
'val_4': [11, 9, 10]
}
)
df = df.set_index("name")
f = lambda x: max( [ x[:i][-1] - min(x[:i][:-1]) for i in range(2,len(x)+1)] )
df = df[df.apply(f, axis=1) >= 10]
print(df.index.to_list())
相关文章