删除特定列中第一次出现NaN后的所有行( pandas )
问题描述
我正在尝试使用 pandas 的Dropna功能。我想将其用于特定的列。
只有在所有行都具有所有NaN值时,我才能弄清楚如何使用它删除NaN。
我有一个数据帧(见下文),我希望在第一次出现NAN之后删除特定列"A"列中的所有行
当前代码,仅当所有行值都为NaN时才起作用。
data.dropna(axis = 0, how = 'all')
data
原始数据帧
data = pd.DataFrame({"A": (1,2,3,4,5,6,7,"NaN","NaN","NaN"),"B": (1,2,3,4,5,6,7,"NaN","9","10"),"C": range(10)})
data
A B C
0 1 1 0
1 2 2 1
2 3 3 2
3 4 4 3
4 5 5 4
5 6 6 5
6 7 7 6
7 NaN NaN 7
8 NaN 9 8
9 NaN 10 9
我希望输出是什么样子:
A B C
0 1 1 0
1 2 2 1
2 3 3 2
3 4 4 3
4 5 5 4
5 6 6 5
6 7 7 6
这方面的任何帮助我们都很感激。 显然,我想以最干净、最有效的方式来做这件事。
谢谢!
解决方案
使用iloc
+argmax
data.iloc[:data.A.isnull().values.argmax()]
A B C
0 1.0 1 0
1 2.0 2 1
2 3.0 3 2
3 4.0 4 3
4 5.0 5 4
5 6.0 6 5
6 7.0 7 6
或使用不同的语法
top_data = data[:data['A'].isnull().argmax()]
相关文章