删除特定列中第一次出现NaN后的所有行( pandas )

2022-04-14 00:00:00 python pandas nan

问题描述

我正在尝试使用 pandas 的Dropna功能。我想将其用于特定的列。

只有在所有行都具有所有NaN值时，我才能弄清楚如何使用它删除NaN。

我有一个数据帧(见下文)，我希望在第一次出现NAN之后删除特定列"A"列中的所有行

当前代码，仅当所有行值都为NaN时才起作用。

data.dropna(axis = 0, how = 'all')
data

原始数据帧

    data = pd.DataFrame({"A": (1,2,3,4,5,6,7,"NaN","NaN","NaN"),"B": (1,2,3,4,5,6,7,"NaN","9","10"),"C": range(10)})
    data


    A   B   C
0   1   1   0
1   2   2   1
2   3   3   2
3   4   4   3
4   5   5   4
5   6   6   5
6   7   7   6
7   NaN NaN 7
8   NaN 9   8
9   NaN 10  9

我希望输出是什么样子：

    A   B   C
0   1   1   0
1   2   2   1
2   3   3   2
3   4   4   3
4   5   5   4
5   6   6   5
6   7   7   6

这方面的任何帮助我们都很感激。显然，我想以最干净、最有效的方式来做这件事。

谢谢！

解决方案

使用iloc+argmax

data.iloc[:data.A.isnull().values.argmax()]

     A  B  C
0  1.0  1  0
1  2.0  2  1
2  3.0  3  2
3  4.0  4  3
4  5.0  5  4
5  6.0  6  5
6  7.0  7  6

或使用不同的语法

top_data = data[:data['A'].isnull().argmax()]

相关文章