根据列之间的差异过滤数据帧[不是下一列]

问题描述

我有一个唯一的数据帧df

name         val_1       val_2      val_3     val_4

AAA            1          2           3         11       
BBB            2          3           5         9
CCC            6          4           15        10

我只需要保留其中任何右侧val列从前面的任何val列增加10的名称,否则删除它们。

我知道diff()ge()在这里会有帮助,但不确定如果不是关于下一列之间的差异,它们将如何工作。

所需输出:

name

AAA #val_4 increases by 10 from val_1  
CCC #val_3 increases by 11 from val_2 

做这件事最聪明的方式是什么?如有任何建议,我们将不胜感激。谢谢!


解决方案

我认为它正在做所需的工作。请注意,我将val_1的第二个值更改为20,这样我们就可以确保我们不会得到从左到右的差异,而不仅仅是从右到左的差异。

import pandas as pd

df = pd.DataFrame(
    {
        'name': ['AAA', 'BBB', 'CCC'],
        'val_1': [1, 20, 6],
        'val_2': [2, 3, 4],
        'val_3': [3, 5, 15],
        'val_4': [11, 9, 10]
    }
)

df = df.set_index("name")

f = lambda x: max( [ x[:i][-1] - min(x[:i][:-1]) for i in range(2,len(x)+1)] )

df = df[df.apply(f, axis=1) >= 10]

print(df.index.to_list())

相关文章